Un plateau sterile è un problema di addestrabilità che si verifica negli algoritmi di ottimizzazione dell'apprendimento automatico quando lo spazio di risoluzione dei problemi diventa piatto durante l'esecuzione dell'algoritmo. I ricercatori del Los Alamos National Laboratory hanno sviluppato teoremi per dimostrare che qualsiasi algoritmo eviterà un altopiano sterile mentre si ridimensiona per funzionare su un computer quantistico. Credito:Los Alamos National Laboratory 19 marzo 2021
Molti algoritmi di apprendimento automatico sui computer quantistici soffrono del temuto "altopiano sterile" dell'irrisolvibilità, dove si imbattono in vicoli ciechi su problemi di ottimizzazione. Questa sfida era stata relativamente poco studiata, fino ad ora. Un rigoroso lavoro teorico ha stabilito teoremi che garantiscono se un determinato algoritmo di apprendimento automatico funzionerà man mano che si espande su computer più grandi.
"Il lavoro risolve un problema chiave di usabilità per l'apprendimento automatico quantistico. Abbiamo rigorosamente dimostrato le condizioni in base alle quali determinate architetture di algoritmi quantistici variazionali avranno o meno altipiani sterili man mano che vengono scalate, " ha detto Marco Cerezo, autore principale dell'articolo pubblicato su Comunicazioni sulla natura oggi da un team del Los Alamos National Laboratory. Cerezo è un post-doc che ricerca la teoria dell'informazione quantistica a Los Alamos. "Con i nostri teoremi, puoi garantire che l'architettura sarà scalabile per computer quantistici con un gran numero di qubit."
"Di solito l'approccio è stato quello di eseguire un'ottimizzazione e vedere se funziona, e questo stava portando alla fatica i ricercatori del settore, " ha detto Patrick Coles, un coautore dello studio. Stabilire teoremi matematici e derivare principi primi elimina le congetture dallo sviluppo di algoritmi.
Il team di Los Alamos ha utilizzato l'approccio ibrido comune per algoritmi quantistici variazionali, formazione e ottimizzazione dei parametri su un computer classico e valutazione della funzione di costo dell'algoritmo, o la misura del successo dell'algoritmo, su un computer quantistico.
Gli algoritmi di apprendimento automatico traducono un'attività di ottimizzazione, ad esempio trovare il percorso più breve per un venditore ambulante attraverso diverse città, in una funzione di costo, ha detto il coautore Lukasz Cincio. Questa è una descrizione matematica di una funzione che verrà ridotta a icona. La funzione raggiunge il suo valore minimo solo se si risolve il problema.
La maggior parte degli algoritmi variazionali quantistici avvia la ricerca in modo casuale e valuta la funzione di costo a livello globale su ogni qubit, che spesso conduce a un altopiano arido.
"Siamo stati in grado di dimostrarlo, se scegli una funzione di costo che guarda localmente ogni singolo qubit, quindi garantiamo che il ridimensionamento non si tradurrà in una curva di tempo incredibilmente ripida rispetto alle dimensioni del sistema, e quindi può essere addestrato, " ha detto Coles.
Un algoritmo variazionale quantistico crea un panorama di risoluzione dei problemi in cui i picchi rappresentano i punti ad alta energia del sistema, o problema, e le valli sono i valori energetici bassi. La risposta si trova nella valle più profonda. Questo è lo stato fondamentale, rappresentato dalla funzione di costo minimo. Per trovare la soluzione, l'algoritmo si allena sul paesaggio, navigando così verso il punto più basso.
"Le persone hanno proposto reti neurali quantistiche e le hanno confrontate facendo simulazioni su piccola scala di 10 secondi (o meno) pochi qubit, "Cerezo ha detto. "Il guaio è, non vedrai l'altopiano arido con un piccolo numero di qubit, ma quando provi a scalare fino a più qubit, sembra. Quindi l'algoritmo deve essere rielaborato per un computer quantistico più grande".
Un plateau sterile è un problema di addestrabilità che si verifica negli algoritmi di ottimizzazione dell'apprendimento automatico quando lo spazio di risoluzione dei problemi diventa piatto durante l'esecuzione dell'algoritmo. In quella situazione, l'algoritmo non riesce a trovare la pendenza verso il basso in quello che sembra essere un paesaggio senza caratteristiche e non c'è un percorso chiaro verso il minimo di energia. Mancano le caratteristiche del paesaggio, il machine learning non può allenarsi per trovare la soluzione.
"Se hai un altopiano arido, ogni speranza di accelerazione quantistica o vantaggio quantistico è persa, " Disse Cerezo.
La svolta del team di Los Alamos compie un passo importante verso il vantaggio quantico, quando un computer quantistico esegue un'attività che richiederebbe un tempo infinito su un computer classico. Il raggiungimento del vantaggio quantistico dipende a breve termine dall'ampliamento degli algoritmi quantistici variazionali. Questi algoritmi hanno il potenziale per risolvere problemi pratici quando saranno disponibili computer quantistici di 100 qubit o più, si spera presto. I computer quantistici attualmente raggiungono il massimo a 65 qubit. Un qubit è l'unità di base delle informazioni in un computer quantistico, come i bit in un classico computer digitale.
"L'argomento più scottante nei rumorosi computer quantistici di scala intermedia sono gli algoritmi quantistici variazionali, o apprendimento automatico quantistico e reti neurali quantistiche, " Coles ha detto. "Sono stati proposti per applicazioni dalla risoluzione della struttura di una molecola in chimica alla simulazione della dinamica di atomi e molecole e numeri di fattorizzazione".