Credito:Mohamed Elhoseiny
Imparando a deviare dalle informazioni conosciute nello stesso modo in cui lo fanno gli umani, un algoritmo di "immaginazione" per l'intelligenza artificiale (AI) è in grado di identificare oggetti inediti da descrizioni scritte.
L'algoritmo, sviluppato dal ricercatore KAUST Mohamed Elhoseiny in collaborazione con Mohamed Elfeki dell'Università della Florida centrale, apre la strada all'immaginazione artificiale e alla classificazione automatizzata di nuove specie vegetali e animali.
"L'immaginazione è una delle proprietà chiave dell'intelligenza umana che ci consente non solo di generare prodotti creativi come l'arte e la musica, ma anche per capire il mondo visivo, " spiega Elhoseiny.
L'intelligenza artificiale si basa sui dati di addestramento per sviluppare la sua capacità di riconoscere gli oggetti e rispondere al suo ambiente. Gli umani sviluppano questa capacità anche attraverso l'esperienza accumulata, ma gli umani possono fare qualcosa che l'IA non può. Possono dedurre intuitivamente una probabile classificazione per un oggetto precedentemente sconosciuto immaginando come deve apparire qualcosa da una descrizione scritta o per deduzione da qualcosa di simile. Nell'IA, questa capacità di immaginare l'ignoto sta diventando sempre più importante man mano che la tecnologia viene implementata in complesse applicazioni del mondo reale in cui l'errata classificazione o il mancato riconoscimento di nuovi oggetti può rivelarsi disastrosa.
Altrettanto importante è l'enorme volume di dati necessari per addestrare in modo affidabile l'IA per il mondo reale. Non è fattibile addestrare l'intelligenza artificiale con immagini anche di una frazione delle specie conosciute di piante e animali nel mondo in tutte le loro permutazioni, per non parlare delle innumerevoli specie sconosciute o non classificate.
La ricerca di Elhoseiny ed Elfeki mirava a sviluppare quello che viene chiamato un algoritmo di apprendimento zero-shot (ZSL) per aiutare con il riconoscimento di categorie inedite basate su descrizioni a livello di classe senza esempi di addestramento.
"Abbiamo modellato il processo di apprendimento visivo per le categorie "invisibili" mettendo in relazione ZSL con la creatività umana, osservando che ZSL riguarda il riconoscimento dell'invisibile mentre la creatività riguarda la creazione di un "invisibile simpatico, '", dice Elhoseiny.
Nella creatività, qualcosa di nuovo ma piacevole o "simpatico" deve essere diverso dall'arte precedente, ma non così diverso da essere irriconoscibile. Nello stesso modo, Elhoseiny ed Elfeki hanno accuratamente modellato un segnale di apprendimento che incoraggia induttivamente la deviazione dalle classi viste, ma non spinto così lontano che la classe immaginata diventa irrealistica e perde il trasferimento di conoscenza dalle classi viste. L'algoritmo risultante ha mostrato un miglioramento costante rispetto ai benchmark all'avanguardia per ZSL.
"Una delle possibili applicazioni del nostro approccio è identificare specie sconosciute, " dice Elhoseiny. "L'intelligenza artificiale che è alimentata con questa tecnologia potrebbe aiutare a segnalare avvistamenti di specie senza immagini, solo con le descrizioni della lingua."