Negli ultimi anni le tecnologie di intelligenza artificiale, in particolare gli algoritmi di machine learning, hanno fatto passi da gigante. Queste tecnologie hanno consentito un'efficienza senza precedenti in attività quali il riconoscimento di immagini, la generazione e l'elaborazione del linguaggio naturale e il rilevamento di oggetti, ma funzionalità così eccezionali richiedono una notevole potenza di calcolo come base.
Le attuali risorse computazionali si stanno avvicinando al limite, quindi ridurre efficacemente i costi di formazione dei modelli di apprendimento automatico e migliorarne l'efficienza di formazione è una questione importante nel campo della ricerca.
Per affrontare il problema, grandi sforzi sono stati fatti in due direzioni di ricerca:le reti neurali ottiche e le reti neurali quantistiche. Le reti neurali ottiche utilizzano metodi avanzati di manipolazione ottica per eseguire algoritmi di apprendimento automatico nell'elaborazione classica delle informazioni ottiche. Presentano vantaggi unici come basso consumo energetico, bassa diafonia e bassa latenza di trasmissione. Tuttavia, le attuali reti neurali ottiche non mostrano un'accelerazione algoritmica, come una maggiore velocità di convergenza del modello.
Le reti neurali quantistiche sono algoritmi di reti neurali basati sulla teoria dell'informatica quantistica. Ricerche recenti hanno dimostrato che le reti neurali quantistiche possono dimostrare un’accelerazione algoritmica a causa delle correlazioni quantistiche. Tuttavia, a causa di limitazioni tecniche, attualmente è difficile eseguire tali algoritmi di rete neurale su hardware su larga scala, il che rende difficile la loro applicazione nei problemi pratici affrontati dalle persone attualmente.
In un nuovo articolo pubblicato su Light:Science &Applications , un team di scienziati, guidato dal professor Xiangdong Zhang, del Key Laboratory di architettura quantistica optoelettronica avanzata e misurazioni del Ministero dell'Istruzione; Il Beijing Key Laboratory of Nanophotonics &Ultrafine Optoelectronic Systems, School of Physics, Beijing Institute of Technology, Cina, e colleghi hanno sviluppato un nuovo tipo di rete neurale ottica in grado di mostrare un'accelerazione analoga a quella di una rete neurale quantistica.
Questa interessante proprietà emerge grazie all'introduzione delle correlazioni ottiche classiche come portatore di informazioni. Infatti, utilizzando questo tipo di vettore, è possibile imitare il modo di elaborazione delle informazioni consentito dall'informatica quantistica, come dimostrato dal lavoro precedente dei ricercatori.
Sulla base di questa proprietà, i ricercatori hanno sviluppato l'operazione convoluzionale e di pooling sullo stato ottico correlato e hanno creato una rete neurale convoluzionale ottica correlata. Questa rete neurale ottica ha una corrispondenza biunivoca con la rete neurale convoluzionale quantistica. Mostra l'accelerazione nel processo di addestramento nell'apprendimento di determinati set di dati e può essere applicato per identificare il carattere degli stati quantistici secondo un particolare principio di codifica.
Il metodo e la tecnica descritti apriranno nuove strade per la realizzazione di reti neurali ottiche potenziate algoritmicamente, che andranno a beneficio dell'elaborazione delle informazioni nell'era dei big data.
La struttura di base di una rete neurale convoluzionale ottica correlata comprende quattro parti:la sorgente luminosa correlata, la convoluzione, il pooling e i rilevamenti. L'elaborazione principale dello stato ottico correlato viene eseguita dalla convoluzione e dalla parte di pooling. A differenza delle reti neurali convoluzionali classiche, queste due parti nella rete neurale ottica convoluzionale correlata manipolano la correlazione degli stati ottici e generano stati correlati più semplici unendo i raggi.
"Queste due parti eseguono effettivamente operazioni analoghe alle porte quantistiche nelle reti neurali convoluzionali quantistiche", hanno affermato gli scienziati. "La parte di convoluzione nella nostra rete è composta da operazioni unitarie sullo stato ottico correlato.
"È come le operazioni unitarie sullo spazio di Hilbert dei qubit. La parte di pooling che consideriamo equivale a misurare i qubit parziali per ottenere uno spazio sub-Hilbert. Tale parte porta ad una diminuzione esponenziale della dimensione dei dati. Quindi, la la funzione delle due parti contribuisce a una convergenza più rapida della funzione di perdita durante l'apprendimento di determinati set di dati.
"Inoltre, certifichiamo anche la somiglianza della nostra rete neurale convoluzionale ottica correlata con la rete neurale convoluzionale quantistica eseguendo l'identificazione della fase topologica degli stati quantistici. La certificazione è supportata da risultati sia teorici che sperimentali.
"I risultati indicano anche che le proprietà della rete neurale quantistica possono essere realizzate in un modo più conveniente", hanno aggiunto.
"Nonostante i potenziali vantaggi delle reti neurali quantistiche, la loro implementazione richiede praticamente circuiti quantistici profondi con molte porte multi-qubit e misurazioni complicate. Ciò richiede risorse significative per stabilizzare i circuiti e correggere gli errori, il che è tecnicamente impegnativo a causa degli inevitabili disturbi ambientali.
"Un'alternativa potenzialmente migliore è trovare un sistema descritto dagli stessi calcoli della teoria quantistica e interrotto meno dall'ambiente. Le reti neurali ottiche correlate proposte servono come esempio di un tale sistema, come evidenziato dalla facilità della disposizione degli elementi e dal basso requisiti sulle circostanze dei nostri esperimenti.
"Data la crescita esponenziale dei dati e la scarsità di risorse per calcoli di alta qualità, il nostro approccio presenta una soluzione economicamente vantaggiosa e ad alte prestazioni che potrebbe avere applicazioni diffuse in vari campi di ricerca sulla scienza dei dati."