Credito:CC0 di pubblico dominio
I ricercatori dell'Università HSE e del Politecnico di Mosca hanno scoperto che i modelli di intelligenza artificiale non sono in grado di rappresentare le caratteristiche della visione umana a causa della mancanza di uno stretto accoppiamento con la rispettiva fisiologia, quindi sono peggiori nel riconoscere le immagini. I risultati dello studio sono stati pubblicati negli Proceedings of the Seventh International Congress on Information and Communication Technology .
Per capire in che modo la percezione della macchina delle immagini differisce dalla percezione umana, gli scienziati hanno caricato immagini di illusioni visive classiche sul servizio online IBM Watson Visual Recognition. La maggior parte di loro erano sagome geometriche, parzialmente nascoste da forme geometriche del colore di sfondo. Il sistema ha cercato di determinare la natura dell'immagine e ha indicato il grado di certezza nella sua risposta.
Si è scoperto che l'intelligenza artificiale non è in grado di riconoscere alcuna figura immaginaria, ad eccezione di un triangolo immaginario colorato. A causa dell'elevato contrasto con lo sfondo, è stato riconosciuto correttamente.
"Oggetti simili a quelli che abbiamo usato durante l'esperimento possono essere trovati nella vita reale", afferma Vladimir Vinnikov, analista del Laboratory of Methods for Big Data Analysis della Facoltà di Informatica dell'HSE e autore dello studio. "Ad esempio, l'autopilota di un'auto o di un aereo percepisce un rimorchio o una torre radio, che di notte sono indicati solo da luci di posizione, allo stesso modo in cui percepiamo forme geometriche immaginarie."
L'occhio umano si muove costantemente involontariamente e la superficie fotosensibile della sua retina ha la forma di un emisfero. Una persona può vedere un'illusione se l'immagine è un vettore, cioè se include punti di riferimento e curve che li collegano. L'immaginazione umana completerà il quadro grazie al costante movimento degli occhi, una caratteristica fisiologica della nostra vista.
Nei sistemi optoelettronici tutto è organizzato in modo diverso. La loro matrice fotosensibile ha una forma piatta, solitamente rettangolare, e il sistema di lenti in sé non è così libero di movimento come l'occhio umano. Pertanto, l'intelligenza artificiale non può completare linee immaginarie che collegano frammenti di un'illusione geometrica. La visione artificiale vede solo ciò che è effettivamente rappresentato, mentre le persone completano l'immagine nella loro immaginazione in base ai suoi contorni.
Oggi, i sistemi di riconoscimento delle immagini della rete neurale si stanno diffondendo attivamente nel settore commerciale. Tuttavia, la questione di quanto accuratamente le macchine riconoscano le immagini è ancora aperta. Le vite umane possono dipendere dall'accuratezza del riconoscimento. Ad esempio, può verificarsi un incidente se l'autopilota di un'auto o di un aereo non riconosce un oggetto a basso contrasto rispetto allo sfondo e non è in grado di schivare un ostacolo in tempo.
Gli scienziati ritengono che l'imprecisione del riconoscimento dell'immagine della macchina possa essere corretta. Ad esempio, possono integrare il riconoscimento di immagini raster, che rappresentano una griglia di pixel, simulando caratteristiche fisiologiche del movimento oculare che consentono all'occhio di vedere scene bidimensionali e tridimensionali. Un modo alternativo consiste nell'aggiungere una descrizione vettoriale delle immagini, che aiuterà a programmare la macchina per bypassare l'immagine lungo le traiettorie specificate dai vettori.
"Gli oggetti immaginari dovrebbero assolutamente essere utilizzati come test nei sistemi che dipendono dal riconoscimento di flussi di foto e video, ad esempio negli autopiloti di automobili o droni. Ciò contribuirà a evitare i rischi associati all'uso di sistemi di intelligenza artificiale nell'industria e sistemi di trasporto", afferma Vinnikov. + Esplora ulteriormente