Una rappresentazione della proiezione semantica, che può determinare la somiglianza tra due parole in un contesto specifico. Questa griglia mostra quanto alcuni animali siano simili in base alle loro dimensioni. Credito:Idan Blank/UCLA
In "Attraverso lo specchio", Humpty Dumpty dice con disprezzo:"Quando uso una parola, significa proprio quello che scelgo che significhi, né più né meno". Alice risponde:"La domanda è se puoi far sì che le parole significhino così tante cose diverse".
Lo studio di ciò che le parole significano veramente è vecchio di secoli. La mente umana deve analizzare una rete di informazioni dettagliate e flessibili e utilizzare un sofisticato buon senso per percepirne il significato.
Ora è emerso un nuovo problema relativo al significato delle parole:gli scienziati stanno studiando se l'intelligenza artificiale può imitare la mente umana per capire le parole come fanno le persone. Un nuovo studio condotto da ricercatori dell'UCLA, del MIT e del National Institutes of Health affronta questa domanda.
L'articolo, pubblicato sulla rivista Nature Human Behaviour , riporta che i sistemi di intelligenza artificiale possono effettivamente apprendere significati di parole molto complicati e gli scienziati hanno scoperto un semplice trucco per estrarre quella conoscenza complessa. Hanno scoperto che il sistema di intelligenza artificiale che hanno studiato rappresenta i significati delle parole in un modo fortemente correlato al giudizio umano.
Il sistema di intelligenza artificiale studiato dagli autori è stato utilizzato frequentemente negli ultimi dieci anni per studiare il significato delle parole. Impara a capire i significati delle parole "leggendo" quantità astronomiche di contenuti su Internet, che comprendono decine di miliardi di parole.
Quando le parole ricorrono spesso insieme, ad esempio "tavolo" e "sedia", il sistema apprende che i loro significati sono correlati. E se le coppie di parole si trovano insieme molto raramente, come "tavola" e "pianeta", viene a sapere che hanno significati molto diversi.
Questo approccio sembra un punto di partenza logico, ma considera quanto bene gli esseri umani comprenderebbero il mondo se l'unico modo per comprenderne il significato fosse contare la frequenza con cui le parole ricorrono l'una vicino all'altra, senza alcuna capacità di interagire con le altre persone e il nostro ambiente.
Idan Blank, un assistente professore di psicologia e linguistica all'UCLA e co-autore principale dello studio, ha affermato che i ricercatori si sono proposti di imparare ciò che il sistema sa delle parole che apprende e che tipo di "buon senso" ha.
Prima dell'inizio della ricerca, ha affermato Blank, il sistema sembrava avere un grosso limite:"Per quanto riguarda il sistema, ogni due parole hanno un solo valore numerico che rappresenta quanto sono simili".
Al contrario, la conoscenza umana è molto più dettagliata e complessa.
Una griglia raffigurante alcune delle categorie di parole analizzate dai ricercatori. Gli accoppiamenti statisticamente significativi (come "animali" e "pericolo" e "animali" e "genere" nella prima riga) sono indicati da quadrati con un bordo più spesso. Credito:Idan Blank/UCLA
"Considera la nostra conoscenza di delfini e alligatori", ha detto Blank. "Quando confrontiamo i due su una scala di dimensioni, da 'piccolo' a 'grande', sono relativamente simili. In termini di intelligenza, sono in qualche modo diversi. In termini di pericolo che rappresentano per noi, su una scala da "sicuro" a "pericoloso", differiscono notevolmente. Quindi il significato di una parola dipende dal contesto.
"Volevamo chiederci se questo sistema conosce effettivamente queste sottili differenze, se la sua idea di somiglianza è flessibile come lo è per gli esseri umani".
Per scoprirlo, gli autori hanno sviluppato una tecnica che chiamano "proiezione semantica". Si può tracciare una linea tra le rappresentazioni del modello delle parole "grande" e "piccolo", ad esempio, e vedere dove cadono le rappresentazioni di diversi animali su quella linea.
Usando questo metodo, gli scienziati hanno studiato 52 gruppi di parole per vedere se il sistema potrebbe imparare a ordinare i significati, come giudicare gli animali in base alle loro dimensioni o quanto siano pericolosi per l'uomo, o classificare gli stati degli Stati Uniti in base al tempo o alla ricchezza complessiva.
Tra gli altri raggruppamenti di parole c'erano termini relativi a vestiti, professioni, sport, creature mitologiche e nomi. A ciascuna categoria sono stati assegnati più contesti o dimensioni, ad esempio dimensioni, pericolo, intelligenza, età e velocità.
I ricercatori hanno scoperto che, attraverso quei tanti oggetti e contesti, il loro metodo si è rivelato molto simile all'intuizione umana. (Per fare questo confronto, i ricercatori hanno anche chiesto a coorti di 25 persone ciascuna di fare valutazioni simili su ciascuno dei 52 gruppi di parole.)
Sorprendentemente, il sistema ha imparato a percepire che i nomi "Betty" e "George" sono simili in termini di essere relativamente "vecchi", ma che rappresentavano generi diversi. E che "sollevamento pesi" e "scherma" sono simili in quanto entrambi si svolgono in genere al chiuso, ma diversi in termini di quanta intelligenza richiedono.
"È un metodo così meravigliosamente semplice e completamente intuitivo", ha detto Blank. "Il confine tra 'grande' e 'piccolo' è come una scala mentale e noi mettiamo gli animali su quella scala."
Blank ha detto che in realtà non si aspettava che la tecnica funzionasse, ma è stato felice quando ha funzionato.
"Si scopre che questo sistema di apprendimento automatico è molto più intelligente di quanto pensassimo; contiene forme di conoscenza molto complesse e questa conoscenza è organizzata in una struttura molto intuitiva", ha affermato. "Solo tenendo traccia di quali parole coesistono l'una con l'altra nella lingua, puoi imparare molto sul mondo."
I coautori dello studio sono la neuroscienziata cognitiva del MIT Evelina Fedorenko, lo studente laureato del MIT Gabriel Grand e Francisco Pereira, che guida il team di apprendimento automatico presso il National Institute of Mental Health del National Institutes of Health.