• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Fisica
    Imparare con la luce:il nuovo sistema consente l'apprendimento profondo ottico

    Credito:Massachusetts Institute of Technology

    Sistemi informatici "Deep Learning", basato su reti neurali artificiali che imitano il modo in cui il cervello apprende da un accumulo di esempi, sono diventati un argomento scottante in informatica. Oltre alle tecnologie abilitanti come il software di riconoscimento facciale e vocale, questi sistemi potrebbero setacciare grandi quantità di dati medici per trovare modelli che potrebbero essere utili a livello diagnostico, o scansionare formule chimiche per possibili nuovi prodotti farmaceutici.

    Ma i calcoli che questi sistemi devono eseguire sono molto complessi e impegnativi, anche per i computer più potenti.

    Ora, un team di ricercatori al MIT e altrove ha sviluppato un nuovo approccio a tali calcoli, usando la luce al posto dell'elettricità, che secondo loro potrebbe migliorare notevolmente la velocità e l'efficienza di alcuni calcoli di deep learning. I loro risultati appaiono oggi sulla rivista Fotonica della natura in un articolo del postdoc del MIT Yichen Shen, studente laureato Nicholas Harris, i professori Marin Soljacic e Dirk Englund, e altri otto.

    Soljacic afferma che molti ricercatori nel corso degli anni hanno avanzato affermazioni sui computer basati sull'ottica, ma che "la gente ha drammaticamente promesso troppo, e si è ritorto contro." Mentre molti usi proposti di tali computer fotonici si sono rivelati non pratici, un sistema di rete neurale basato sulla luce sviluppato da questo team "potrebbe essere applicabile per l'apprendimento profondo per alcune applicazioni, " lui dice.

    Le architetture di computer tradizionali non sono molto efficienti quando si tratta dei tipi di calcoli necessari per alcune importanti attività di rete neurale. Tali compiti comportano tipicamente moltiplicazioni ripetute di matrici, che può essere molto impegnativo dal punto di vista computazionale nei chip CPU o GPU convenzionali.

    Dopo anni di ricerche, il team del MIT ha invece escogitato un modo per eseguire queste operazioni otticamente. "Questo chip, una volta che lo metti a punto, può eseguire la moltiplicazione matriciale con, in linea di principio, energia zero, quasi istantaneamente, " Dice Soljacic. "Abbiamo dimostrato i mattoni cruciali, ma non ancora il sistema completo".

    Per analogia, Soljacic fa notare che anche una normale lente per occhiali effettua un calcolo complesso (la cosiddetta trasformata di Fourier) sulle onde luminose che la attraversano. Il modo in cui i raggi di luce eseguono i calcoli nei nuovi chip fotonici è molto più generale, ma ha un principio di base simile. Il nuovo approccio utilizza più fasci di luce diretti in modo tale che le loro onde interagiscano tra loro, producendo schemi di interferenza che trasmettono il risultato dell'operazione prevista. Il dispositivo risultante è qualcosa che i ricercatori chiamano processore nanofotonico programmabile.

    Il risultato, Shen dice, è che i chip ottici che utilizzano questa architettura potrebbero, in linea di principio, eseguire calcoli eseguiti nei tipici algoritmi di intelligenza artificiale molto più velocemente e utilizzando meno di un millesimo di energia per operazione rispetto ai chip elettronici convenzionali. "Il vantaggio naturale di usare la luce per fare la moltiplicazione matriciale gioca un ruolo importante nell'accelerazione e nel risparmio energetico, perché le moltiplicazioni di matrici dense sono la parte più affamata di energia e dispendiosa in termini di tempo negli algoritmi di intelligenza artificiale", afferma.

    Il nuovo processore nanofotonico programmabile, che è stato sviluppato nel laboratorio Englund da Harris e collaboratori, utilizza una serie di guide d'onda che sono interconnesse in un modo che può essere modificato secondo necessità, programmare quell'insieme di travi per un calcolo specifico. "Puoi programmare in qualsiasi operazione di matrice, " dice Harris. Il processore guida la luce attraverso una serie di guide d'onda fotoniche accoppiate. La proposta completa del team prevede strati intercalati di dispositivi che applicano un'operazione chiamata funzione di attivazione non lineare, in analogia con il funzionamento dei neuroni nel cervello.

    Per dimostrare il concetto, il team ha impostato il processore nanofotonico programmabile per implementare una rete neurale che riconosce quattro suoni vocalici di base. Anche con questo sistema rudimentale, sono stati in grado di raggiungere un livello di precisione del 77%, rispetto a circa il 90% per i sistemi convenzionali. Non ci sono "ostacoli sostanziali" per ampliare il sistema per una maggiore precisione, dice Soljacic.

    Englund aggiunge che il processore nanofotonico programmabile potrebbe avere anche altre applicazioni, compresa l'elaborazione del segnale per la trasmissione dei dati. "L'elaborazione del segnale analogico ad alta velocità è qualcosa che questo potrebbe gestire" più velocemente di altri approcci che prima convertono il segnale in forma digitale, poiché la luce è un mezzo intrinsecamente analogico. "Questo approccio potrebbe eseguire l'elaborazione direttamente nel dominio analogico, " lui dice.

    Il team afferma che ci vorrà ancora molto più impegno e tempo per rendere utile questo sistema; però, una volta che il sistema è scalato e completamente funzionante, può trovare molti casi utente, come data center o sistemi di sicurezza. Il sistema potrebbe anche essere un vantaggio per auto o droni a guida autonoma, dice Harris, o "ogni volta che hai bisogno di fare molti calcoli ma non hai molto potere o tempo".

    Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.

    © Scienza https://it.scienceaq.com