Articolo completo (open access): https://rdcu.be/b7W6t
Nell’essere umano, oltre il 60% dell’attività cerebrale è connessa con l’elaborazione del
segnale visivo. Circa il 90% del tempo impiegato nella visione è dedicato alla fissazione il
rimanente 10% è usato per spostare gli occhi dall’attuale punto di fissazione ad un punto
successivo. In media avvengono circa tre fissazioni al secondo durante la visione attiva in
questi casi ogni fissazione ha una durata variabile (300-500 ms). Le fissazioni sono
intercalate da movimenti rapidi di spostamento chiamati saccadi, che sono i movimenti più
veloci che il corpo umano possa eseguire. Il sistema visivo umano per sua natura presenta
una limitata capacità di processazione dell’enorme quantità di dettagli che provengono
dall’ambiente esterno. Ciò comporta la necessità di selezionare gli stimoli percettivi più
salienti. Uno dei settori più prolifici della ricerca nelle neuroscienze della visione, riguarda
proprio lo studio dei meccanismi che guidano la selezione degli stimoli e la direzione dello
sguardo durante l’esplorazione visuo-spaziale. Tali meccanismi possono dipendere dalla
salienza dell’immagine (esplorazione visiva bottom-up), ovvero dalle sue caratteristiche
fisiche: colore, forma, contrasto; oppure dalle attuali richieste cognitive, esecuzione di un
compito (esplorazione top-down). Sulla base di queste teorie, sono stati costruiti numerosi
modelli matematici per riprodurre la direzione di sguardo e prevedere la cattura attentiva
durante l’esplorazione visiva di un’immagine.
Nello studio apparso in questi giorni su Nature
Scientific Reports i ricercatori di UNISI presentano un nuovo modello matematico
“gravitazionale”, che descrive in modo originale l’attenzione visiva e che permette di
prevedere i movimenti oculari. All’interno dell’articolo viene proposta una descrizione delle
aree cerebrali coinvolte in questo processo. L’implementazione del modello consente di
simulare in real-time i movimenti oculari su un qualsiasi video. Il confronto con i dati umani
mostra un notevole aumento di precisione della stima rispetto alle precedenti proposte.
Questi risultati hanno un forte impatto applicativo. In virtual reality (VR) è possibile
ottimizzare lo streaming in base ad una stima dei movimenti oculari. Si può migliorare una
campagna di marketing valutando in anticipo l’efficacia dei contenuti visivi e prevedendo
quali caratteristiche attrarranno maggiormente l’attenzione degli utenti. Infine, simulando i
movimenti oculari umani, è possibile dotare intelligenze artificiali di capacità simili all’uomo
e renderli capaci di svolgere compiti sempre più complessi e di interagire con gli umani
stessi in maniera più naturale.