I ricercatori hanno dimostrato che una rete neurale può essere addestrata utilizzando un circuito ottico (rettangolo blu nell'illustrazione). Nella rete completa ce ne sarebbero diversi collegati tra loro. Gli ingressi laser (verde) codificano le informazioni che vengono trasportate attraverso il chip da guide d'onda ottiche (nere). Il chip esegue operazioni cruciali per la rete neurale artificiale utilizzando divisori di fascio sintonizzabili, che sono rappresentati dalle sezioni curve nelle guide d'onda. Queste sezioni accoppiano due guide d'onda adiacenti e vengono sintonizzate regolando le impostazioni degli sfasatori ottici (oggetti luminosi rossi e blu), che agiscono come "manopole" che possono essere regolate durante l'allenamento per eseguire un determinato compito. Credito:Tyler W. Hughes, Università di Stanford
I ricercatori hanno dimostrato che è possibile addestrare reti neurali artificiali direttamente su un chip ottico. L'importante svolta dimostra che un circuito ottico può svolgere una funzione critica di una rete neurale artificiale basata sull'elettronica e potrebbe portare a meno costosi, modi più veloci ed efficienti dal punto di vista energetico per eseguire attività complesse come il riconoscimento vocale o di immagini.
"L'utilizzo di un chip ottico per eseguire i calcoli della rete neurale in modo più efficiente di quanto sia possibile con i computer digitali potrebbe consentire di risolvere problemi più complessi, ", ha affermato il leader del gruppo di ricerca Shanhui Fan della Stanford University. "Ciò migliorerebbe la capacità delle reti neurali artificiali di eseguire le attività richieste per le auto a guida autonoma o di formulare una risposta appropriata a una domanda parlata, Per esempio. Potrebbe anche migliorare le nostre vite in modi che non possiamo immaginare ora".
Una rete neurale artificiale è un tipo di intelligenza artificiale che utilizza unità connesse per elaborare le informazioni in modo simile al modo in cui il cervello elabora le informazioni. Utilizzando queste reti per eseguire un compito complesso, ad esempio il riconoscimento vocale, richiede il passaggio critico di addestramento degli algoritmi per categorizzare gli input, come parole diverse.
Sebbene le reti neurali artificiali ottiche siano state recentemente dimostrate sperimentalmente, la fase di addestramento è stata eseguita utilizzando un modello su un computer digitale tradizionale e le impostazioni finali sono state quindi importate nel circuito ottico. In ottica , La rivista della Optical Society per la ricerca ad alto impatto, I ricercatori della Stanford University segnalano un metodo per addestrare queste reti direttamente nel dispositivo implementando un analogo ottico dell'algoritmo di "backpropagation", che è il modo standard per addestrare le reti neurali convenzionali.
"L'utilizzo di un dispositivo fisico anziché di un modello computerizzato per l'allenamento rende il processo più accurato, " ha detto Tyler W. Hughes, primo autore del saggio. "Anche, poiché la fase di addestramento è una parte molto costosa dal punto di vista computazionale dell'implementazione della rete neurale, eseguire questo passaggio otticamente è la chiave per migliorare l'efficienza computazionale, velocità e consumo energetico delle reti artificiali."
Una rete basata sulla luce
Sebbene l'elaborazione della rete neurale venga in genere eseguita utilizzando un computer tradizionale, ci sono sforzi significativi per progettare hardware ottimizzato specificamente per l'elaborazione di reti neurali. I dispositivi basati sull'ottica sono di grande interesse perché possono eseguire calcoli in parallelo utilizzando meno energia rispetto ai dispositivi elettronici.
Nel nuovo lavoro, i ricercatori hanno superato una sfida significativa nell'implementazione di una rete neurale completamente ottica progettando un chip ottico che replica il modo in cui i computer convenzionali addestrano le reti neurali.
Una rete neurale artificiale può essere pensata come una scatola nera con un numero di manopole. Durante la fase di formazione, queste manopole vengono ruotate un po' ciascuna e quindi il sistema viene testato per vedere se le prestazioni degli algoritmi sono migliorate.
"Il nostro metodo non solo aiuta a prevedere in quale direzione girare le manopole, ma anche quanto dovresti girare ciascuna manopola per avvicinarti alla performance desiderata, " ha detto Hughes. "Il nostro approccio accelera significativamente la formazione, soprattutto per le grandi reti, perché otteniamo informazioni su ogni manopola in parallelo."
Formazione sul chip
Il nuovo protocollo di allenamento opera su circuiti ottici con divisori di fascio sintonizzabili che vengono regolati modificando le impostazioni degli sfasatori ottici. I raggi laser che codificano le informazioni da elaborare vengono sparati nel circuito ottico e trasportati da guide d'onda ottiche attraverso i divisori di raggio, che sono regolati come manopole per addestrare gli algoritmi della rete neurale.
Nel nuovo protocollo di allenamento, il laser viene prima alimentato attraverso il circuito ottico. All'uscita dal dispositivo, viene calcolata la differenza rispetto al risultato atteso. Queste informazioni vengono poi utilizzate per generare un nuovo segnale luminoso, che viene rimandato indietro attraverso la rete ottica nella direzione opposta. Misurando l'intensità ottica attorno a ciascun divisore di raggio durante questo processo, i ricercatori hanno mostrato come rilevare, in parallelo, come cambieranno le prestazioni della rete neurale rispetto all'impostazione di ciascun divisore di fascio. Le impostazioni dello sfasatore possono essere modificate in base a queste informazioni, e il processo può essere ripetuto finché la rete neurale non produce il risultato desiderato.
I ricercatori hanno testato la loro tecnica di allenamento con simulazioni ottiche insegnando a un algoritmo a svolgere funzioni complicate, come l'individuazione di elementi complessi all'interno di un insieme di punti. Hanno scoperto che l'implementazione ottica ha funzionato in modo simile a un computer convenzionale.
"Il nostro lavoro dimostra che è possibile utilizzare le leggi della fisica per implementare algoritmi informatici, " ha detto Fan. "Formando queste reti nel dominio ottico, mostra che i sistemi di rete neurale ottica potrebbero essere costruiti per svolgere determinate funzionalità utilizzando solo l'ottica".
I ricercatori intendono ottimizzare ulteriormente il sistema e desiderano utilizzarlo per implementare un'applicazione pratica di un'attività di rete neurale. L'approccio generale che hanno progettato potrebbe essere utilizzato con varie architetture di reti neurali e per altre applicazioni come l'ottica riconfigurabile.