Rappresentazione artistica dell'architettura di apprendimento automatico che codifica esplicitamente la simmetria di gauge per una teoria del campo reticolare 2D. Credito:collaborazione MIT-DeepMind.
Il Modello Standard della fisica delle particelle descrive tutte le particelle elementari conosciute e tre delle quattro forze fondamentali che governano l'universo; tutto tranne la gravità. Queste tre forze:elettromagnetica, forte, e debole:regolano il modo in cui si formano le particelle, come interagiscono, e come decadono le particelle.
Studiare la fisica delle particelle e nucleare in questo quadro, però, è difficile, e si basa su studi numerici su larga scala. Per esempio, molti aspetti della forza forte richiedono la simulazione numerica della dinamica alla scala da 1/10 a 1/100 della dimensione di un protone per rispondere a domande fondamentali sulle proprietà dei protoni, neutroni, e nuclei.
"In definitiva, siamo computazionalmente limitati nello studio del protone e della struttura nucleare usando la teoria del campo reticolare, " dice l'assistente professore di fisica Phiala Shanahan. "Ci sono molti problemi interessanti che sappiamo come affrontare in linea di principio, ma non abbiamo abbastanza risorse di calcolo, anche se utilizziamo i più grandi supercomputer del mondo."
Per superare questi limiti, Shanahan guida un gruppo che combina la fisica teorica con modelli di apprendimento automatico. Nel loro articolo "Campionamento basato sul flusso equivalente per la teoria del gauge reticolare, " pubblicato questo mese in Lettere di revisione fisica , mostrano come l'incorporazione delle simmetrie delle teorie fisiche nell'apprendimento automatico e nelle architetture di intelligenza artificiale possa fornire algoritmi molto più veloci per la fisica teorica.
"Stiamo utilizzando l'apprendimento automatico per non analizzare grandi quantità di dati, ma per accelerare la teoria dei primi principi in un modo che non comprometta il rigore dell'approccio, " dice Shanahan. "Questo particolare lavoro ha dimostrato che possiamo costruire architetture di apprendimento automatico con alcune delle simmetrie del modello standard della fisica delle particelle e nucleare integrate, e accelerare il problema del campionamento che stiamo prendendo di mira per ordini di grandezza."
Shanahan ha lanciato il progetto con lo studente laureato del MIT Gurtej Kanwar e con Michael Albergo, che ora è alla New York University. Il progetto si è ampliato per includere i postdoc del Center for Theoretical Physics Daniel Hackett e Denis Boyda, Professore della NYU Kyle Cranmer, e scienziati esperti di machine learning di Google Deep Mind, Sébastien Racanière e Danilo Jimenez Rezende.
L'articolo di questo mese fa parte di una serie volta a consentire studi di fisica teorica che sono attualmente intrattabili dal punto di vista computazionale. "Il nostro obiettivo è sviluppare nuovi algoritmi per una componente chiave dei calcoli numerici in fisica teorica, " dice Kanwar. "Questi calcoli ci informano sul funzionamento interno del Modello Standard della fisica delle particelle, la nostra teoria fondamentale della materia. Tali calcoli sono di vitale importanza per confrontare i risultati degli esperimenti di fisica delle particelle, come il Large Hadron Collider del CERN, sia per vincolare il modello in modo più preciso sia per scoprire dove il modello si rompe e deve essere esteso a qualcosa di ancora più fondamentale."
L'unico metodo noto e sistematicamente controllabile per studiare il Modello Standard della fisica delle particelle nel regime non perturbativo si basa su un campionamento di istantanee delle fluttuazioni quantistiche nel vuoto. Misurando le proprietà di queste fluttuazioni, una volta può inferire le proprietà delle particelle e le collisioni di interesse.
Questa tecnica presenta delle sfide, Kanwar spiega. "Questo campionamento è costoso, e stiamo cercando di utilizzare tecniche di apprendimento automatico ispirate alla fisica per disegnare campioni in modo molto più efficiente, " dice. "Il machine learning ha già fatto grandi passi avanti nella generazione di immagini, Compreso, Per esempio, recente lavoro di NVIDIA per generare immagini di volti 'sognati' dalle reti neurali. Pensando a queste istantanee del vuoto come immagini, pensiamo che sia abbastanza naturale ricorrere a metodi simili per il nostro problema".
Aggiunge Shanahan, "Nel nostro approccio al campionamento di queste istantanee quantistiche, ottimizziamo un modello che ci porta da uno spazio facile da campionare allo spazio di destinazione:dato un modello addestrato, il campionamento è quindi efficiente poiché è sufficiente prelevare campioni indipendenti nello spazio facile da campionare, e trasformarli attraverso il modello appreso."
In particolare, il gruppo ha introdotto un framework per la costruzione di modelli di machine learning che rispettano esattamente una classe di simmetrie, chiamate "simmetrie di calibro, " cruciale per lo studio della fisica delle alte energie.
Come prova di principio, Shanahan e colleghi hanno utilizzato il loro framework per addestrare modelli di apprendimento automatico per simulare una teoria in due dimensioni, con conseguente aumento dell'efficienza di ordini di grandezza rispetto alle tecniche all'avanguardia e previsioni più precise dalla teoria. Ciò apre la strada a una ricerca significativamente accelerata sulle forze fondamentali della natura utilizzando l'apprendimento automatico basato sulla fisica.
I primi articoli del gruppo come collaborazione hanno discusso dell'applicazione della tecnica di apprendimento automatico a una semplice teoria del campo reticolare, e sviluppato questa classe di approcci su compact, varietà connesse che descrivono le più complesse teorie di campo del Modello Standard. Ora stanno lavorando per adattare le tecniche a calcoli all'avanguardia.
"Penso che abbiamo dimostrato nell'ultimo anno che ci sono molte promesse nel combinare la conoscenza della fisica con le tecniche di apprendimento automatico, " dice Kanwar. "Stiamo pensando attivamente a come affrontare gli ostacoli rimanenti nel modo di eseguire simulazioni su vasta scala utilizzando il nostro approccio. Spero di vedere la prima applicazione di questi metodi ai calcoli su larga scala nei prossimi due anni. Se riusciamo a superare gli ultimi ostacoli, questo promette di estendere ciò che possiamo fare con risorse limitate, e sogno di eseguire presto calcoli che ci forniscano nuove intuizioni su ciò che oggi va oltre la nostra migliore comprensione della fisica".
Questa idea di apprendimento automatico basato sulla fisica è anche conosciuta dal team come "AI ab-initio, " un tema chiave del National Science Foundation Institute for Artificial Intelligence and Fundamental Interactions (IAIFI) con sede al MIT, lanciato di recente, dove Shanahan è coordinatore della ricerca per la teoria della fisica.