Credito:Geralt/Pixabay
Neuroni artificiali per macchine profondamente intelligenti:questa è la nuova rivoluzione dell'intelligenza artificiale (AI), guidato da Geoffrey Hinton e dal suo team dal 2012. Quell'anno, Hinton, un esperto di scienze cognitive presso l'Università di Toronto e ricercatore presso Google Brain, hanno dimostrato la sorprendente efficacia di una rete neurale profonda (DNN) in un'attività di categorizzazione delle immagini.
Sulla scia di questi straordinari risultati, le università – e le società internazionali – hanno investito massicciamente nel promettente e affascinante campo dell'IA. Eppure, nonostante le impressionanti prestazioni dei DNN in una varietà di campi (riconoscimento visivo e vocale, traduzione, immagini mediche, eccetera.), restano interrogativi sui limiti dell'apprendimento profondo per altri usi, come veicoli anonimi.
Per comprendere i limiti dell'IA nel suo stato attuale, dobbiamo capire da dove vengono i DNN e, soprattutto, su quali aree del cervello umano sono modellati - poco si sa su questo in ingegneria industriale, e anche in alcuni centri di ricerca. Dall'alba di questa nuova rivoluzione, l'apprendimento profondo è talvolta usato come una sorta di "bacchetta magica", con scarsa attenzione al suo background o ai suoi limiti. "Per un'intelligenza artificiale significativa", il titolo di un recente rapporto del matematico francese Cédric Villani, è la prova della profonda ambivalenza che circonda questo argomento.
Da dove viene l'apprendimento profondo?
Gli inizi delle reti neurali artificiali risalgono agli anni '40, con le scoperte pionieristiche in neuroscienze e psicologia di Warren McCulloch e Walter H. Pitts (che fornì il primo modello matematico di un neurone) e Donald Hebb (che descrisse i meccanismi dell'apprendimento sinaptico). Questi ricercatori volevano capire come i neuroni, i mattoni di base del cervello, potrebbe generare la psiche.
Il loro lavoro fondamentale ha portato alla creazione della prima rete neuronale artificiale, il percettrone, progettato nel 1958 dallo psicologo americano Frank Rosenblatt. Naturalmente, ricerca iniziale è stata seguita da sviluppi significativi basati, ad esempio, sugli studi neuroscientifici di Alan L. Hodgkin e Andrew F. Huxley che descrivono le dinamiche temporali dell'integrazione neurale, e sulla ricerca in informatica e matematica di Bernard Widrow e Ted Hoff, che ha suggerito l'uso di algoritmi di discesa del gradiente stocastico come un modo più efficace per modificare le connessioni sinaptiche nelle reti neurali.
Queste ottimizzazioni matematiche sono state ulteriormente sviluppate negli anni '80 con la ricerca nelle scienze cognitive di David Rumelhart, Geoffrey Hinton e James McClelland, membri del gruppo di ricerca sull'elaborazione distribuita parallela. Il loro lavoro ha aiutato a ottimizzare la modifica delle connessioni sinaptiche negli strati neuronali profondi e ha portato alla creazione del Multilayer Perceptron (MLP). DNN, sviluppato da ricercatori come Geoffrey Hinton, Yann LeCun e Yoshua Bengio, sono i suoi diretti discendenti.
C'è un legame tra il deep learning e il cervello?
Sebbene i DNN siano stati originariamente sviluppati attraverso un lavoro interdisciplinare e ispirati alla funzione cerebrale, ci si potrebbe chiedere fino a che punto questi algoritmi costituiscono ancora una simulazione del cervello umano. Sono stati progettati per svolgere compiti come il riconoscimento e la categorizzazione delle immagini. Per fare ciò, I DNN utilizzano vari livelli convoluzionali e di raggruppamento prima del riconoscimento delle immagini.
Per quanto riguarda gli strati convoluzionali, il lavoro di David Hubel e Torsten Wiesel negli anni '60, e Leonie Jones e Derecke Palmer negli anni '80, dimostrare l'utilità di questo metodo nel simulare la probabile risposta dei neuroni nella corteccia visiva primaria. Diversi studi in scienze cognitive, compreso il nostro lavoro, utilizzare questo processo come un sistema neuro-ispirato per simulare la risposta dei neuroni percettivi nella corteccia visiva primaria, ad esempio.
Un esempio della ricerca che dimostra le somiglianze nel modo in cui operano le reti neurali profonde e il flusso ventrale della corteccia visiva. Attestazione:Kuzovkin, Vicente, Petton, Lachaux, Bacio, Kahane e Aru, 2018., Autore fornito
Per quanto riguarda il raggruppamento, vari studi nel campo delle neuroscienze e della psicologia cognitiva negli ultimi trent'anni hanno dimostrato come il cervello esegua questo processo di astrazione nel flusso visivo ventrale. Il lavoro di Rufin Vogels e Keiji Tanaka mostra come questo flusso consenta l'identificazione visiva e la categorizzazione, indipendentemente dalle proprietà della superficie di un'immagine, come la consistenza, colore, distanza, o la posizione degli oggetti all'interno dell'immagine. Queste aree del cervello sono quindi sensibili alle stesse informazioni degli strati percettivi appresi da un DNN durante il processo di pooling.
Ancora più sorprendente, la ricerca di Rodrigo Quian Quiroga e dei suoi colleghi dimostra l'esistenza di neuroni specifici per concetti o identità (ad esempio, un neurone "Jennifer Aniston", o un neurone "Torre di Pisa"). Questi sparano in risposta all'esposizione diretta a un concetto, come vedere il nome "Jennifer Aniston" stampato. Ciò che è più eccitante per il futuro dell'IA è che il lavoro di Mr. Quiroga dimostra che questa attività neuronale è correlata con la cosciente percezione di uno stimolo nell'ambiente.
Riassumere, sebbene siano semplificati e ottimizzati matematicamente rispetto a un cervello biologico, I DNN riproducono processi molto simili come un'area molto specifica nella corteccia (vale a dire, corteccia occipito-temporale). Usando la risonanza magnetica o gli elettrodi impiantati nel cervello, recenti studi nelle neuroscienze cognitive dimostrano somiglianze nel funzionamento dei DNN e di queste specifiche aree cerebrali.
L'intelligenza artificiale è più affidabile se ispirata dal cervello?
La ricerca interdisciplinare di base sui DNN ha prodotto risultati tangibili impressionanti in una vasta gamma di aree:riconoscimento visivo e categorizzazione, riconoscimento vocale, traduzione, il gioco di andare, composizione musicale, per citarne solo alcuni. Sfortunatamente, attraverso una mancanza di comprensione della scienza cognitiva che li sostiene, I DNN sono ancora troppo spesso usati come una sorta di bacchetta magica per risolvere qualsiasi problema.
È possibile migliorare la capacità di anticipazione di un sistema neuromorfo simulando i cicli ricorrenti dalle aree associative alle aree percettive al lavoro nel cervello umano. Attestazione:Mermillod, Bourrier, Davide, Kauffmann, Chauvin, Guyader, Dutheil e Peyrin, 2018., Autore fornito
Per fare l'esempio delle auto senza conducente, accoppiare sconsideratamente i DNN ai sistemi di controllo del veicolo sarebbe altamente rischioso:equivarrebbe a chiedere a un tassista che ha perso oltre l'80% delle sue funzioni cerebrali in un incidente (lasciando solo il flusso visivo ventrale) di guidare un'auto. Richiedere a questi sistemi di fare più di quello per cui sono stati originariamente progettati può portare a incidenti catastrofici.
Le aree del cervello umano coinvolte nell'anticipazione (vedi sotto), l'orientamento spaziale e le funzioni sensomotorie richieste per guidare in un ambiente complesso sono molto diverse dai processi neurali in atto all'interno del flusso visivo ventrale. Situato nella corteccia occipito-parietale, i processi neuronali coinvolti nella comprensione e nella pianificazione sono molto diversi da quelli che avvengono nel flusso visivo ventrale! Sono neuroni molto diversi, sensibile alla distanza, posizione e velocità, tutti parametri fondamentali per determinare come ci comportiamo nell'ambiente.
L'uso indiscriminato di DNN (o altri sistemi artificiali) senza riferimento o confronto con la neuro-ispirazione dietro le varie funzioni cognitive non è solo inefficace ma addirittura pericoloso. Non affermiamo che la neuroispirazione sia l'unico modo efficace verso un'IA più sicura. Però, dato il tumultuoso passato di AI, e tenendo conto dell'efficacia ormai comprovata di sistemi di ispirazione neurologica come i DNN rispetto ai precedenti metodi di ingegneria (per il riconoscimento visivo, Per esempio), crediamo sia fondamentale capire come il cervello svolga altre funzioni cognitive (controllo motorio, integrazione multisensoriale, ecc.) al fine di confrontarlo con le attuali tecniche ingegneristiche per lo svolgimento di tali funzioni, e produrre un più sicuro, IA più efficiente.
La ricerca sull'IA condotta in più stretta collaborazione con le scienze cognitive ci consentirebbe di:
Questa sfida richiede una ricerca interdisciplinare che coinvolga non solo la matematica e l'informatica, ma anche neuroscienze e psicologia cognitiva, così come la ricerca in elettronica e fisica per sviluppare le unità di elaborazione neurale (NPU) attualmente in fase di progettazione. Abbiamo l'opportunità di superare finalmente i limiti delle macchine Turing-Von Neumann che hanno dominato l'elettronica e l'informatica dalla seconda guerra mondiale.
Questo articolo è stato ripubblicato da The Conversation con una licenza Creative Commons. Leggi l'articolo originale.