Raffigurazione della ricerca sulla fusione su un tokamak a forma di ciambella potenziato dall'intelligenza artificiale. Credito:Eliot Feibush/PPPL e Julian Kates-Harbeck/Harvard University
Intelligenza artificiale (AI), una branca dell'informatica che sta trasformando l'indagine scientifica e l'industria, potrebbe ora accelerare lo sviluppo di sicurezza, energia di fusione pulita e virtualmente illimitata per la produzione di elettricità. Un passo importante in questa direzione è in corso presso il Princeton Plasma Physics Laboratory (PPPL) e la Princeton University del Dipartimento dell'Energia degli Stati Uniti (DOE). dove un team di scienziati che lavora con uno studente laureato di Harvard applica per la prima volta il deep learning, una nuova potente versione della forma di intelligenza artificiale con apprendimento automatico, per prevedere interruzioni improvvise che possono fermare le reazioni di fusione e danneggiare i tokamak a forma di ciambella che ospitano le reazioni.
Un nuovo capitolo promettente nella ricerca sulla fusione
"Questa ricerca apre un nuovo capitolo promettente nello sforzo di portare energia illimitata sulla Terra, "Steve Cowley, direttore del PPPL, detto dei risultati, che sono riportati nell'attuale numero di Natura rivista. "L'intelligenza artificiale sta esplodendo nelle scienze e ora sta iniziando a contribuire alla ricerca mondiale dell'energia da fusione".
Fusione, che guida il sole e le stelle, è la fusione di elementi leggeri sotto forma di plasma, il caldo, stato carico della materia composto da elettroni liberi e nuclei atomici, che genera energia. Gli scienziati stanno cercando di replicare la fusione sulla Terra per un'abbondante fornitura di energia per la produzione di elettricità.
Fondamentale per dimostrare la capacità dell'apprendimento profondo di prevedere le interruzioni - l'improvvisa perdita di confinamento di particelle di plasma ed energia - è stato l'accesso a enormi database forniti da due importanti strutture di fusione:il DIII-D National Fusion Facility che General Atomics gestisce per il DOE in California, la più grande struttura negli Stati Uniti, e il Joint European Torus (JET) nel Regno Unito, la struttura più grande del mondo, che è gestito da EUROfusion, il Consorzio Europeo per lo Sviluppo dell'Energia da Fusione. Il supporto degli scienziati del JET e del DIII-D è stato essenziale per questo lavoro.
I vasti database hanno consentito previsioni affidabili di interruzioni sui tokamak diversi da quelli su cui è stato addestrato il sistema, in questo caso dal più piccolo DIII-D al più grande JET. Il risultato è di buon auspicio per la previsione di interruzioni su ITER, un tokamak molto più grande e potente che dovrà applicare le capacità apprese negli odierni impianti di fusione.
Il codice dell'apprendimento profondo, chiamata rete neurale ricorrente di fusione (FRNN), apre anche possibili percorsi per il controllo e la previsione delle interruzioni.
L'area più intrigante di crescita scientifica
"L'intelligenza artificiale è l'area più intrigante della crescita scientifica in questo momento, e sposarlo con la scienza della fusione è molto eccitante, "ha detto Bill Tang, un fisico ricercatore principale presso PPPL, coautore dell'articolo e docente con il grado e il titolo di professore presso il Dipartimento di Scienze Astrofisiche dell'Università di Princeton che supervisiona il progetto AI. "Abbiamo accelerato la capacità di prevedere con elevata precisione la sfida più pericolosa per l'energia da fusione pulita".
A differenza dei software tradizionali, che esegue le istruzioni prescritte, l'apprendimento profondo impara dai propri errori. A realizzare questa apparente magia ci sono le reti neurali, strati di nodi interconnessi - algoritmi matematici - che sono "parametrizzati, " o pesato dal programma per modellare l'output desiderato. Per ogni dato input i nodi cercano di produrre un output specificato, come la corretta identificazione di un volto o previsioni accurate di un'interruzione. L'addestramento inizia quando un nodo non riesce a raggiungere questo compito:i pesi si adattano automaticamente per i nuovi dati fino a quando non si ottiene l'output corretto.
Una caratteristica chiave del deep learning è la sua capacità di acquisire dati ad alta dimensione piuttosto che dati unidimensionali. Per esempio, mentre il software di apprendimento non approfondito potrebbe considerare la temperatura di un plasma in un singolo punto nel tempo, il FRNN considera i profili della temperatura che si sviluppano nel tempo e nello spazio. "La capacità dei metodi di deep learning di apprendere da dati così complessi li rende un candidato ideale per il compito di previsione delle interruzioni, " ha detto il collaboratore Julian Kates-Harbeck, uno studente laureato in fisica all'Università di Harvard e un borsista DOE-Office of Science Computational Science Graduate che è stato autore principale dell'articolo su Nature e capo architetto del codice.
L'addestramento e l'esecuzione di reti neurali si basa su unità di elaborazione grafica (GPU), chip per computer progettati inizialmente per il rendering di immagini 3D. Tali chip sono ideali per l'esecuzione di applicazioni di deep learning e sono ampiamente utilizzati dalle aziende per produrre funzionalità di intelligenza artificiale come la comprensione del linguaggio parlato e l'osservazione delle condizioni stradali con le auto a guida autonoma.
Kates-Harbeck ha addestrato il codice FRNN su più di due terabyte (1012) di dati raccolti da JET e DIII-D. Dopo aver eseguito il software sul cluster Tiger di GPU moderne della Princeton University, la squadra lo ha posizionato su Titano, un supercomputer presso l'Oak Ridge Leadership Computing Facility, una struttura per gli utenti dell'Office of Science del DOE, e altre macchine ad alte prestazioni.
Un compito impegnativo
La distribuzione della rete su molti computer era un compito impegnativo. "La formazione di reti neurali profonde è un problema ad alta intensità di calcolo che richiede l'impegno di cluster di calcolo ad alte prestazioni, " ha detto Alexey Svyatkovskiy, un coautore del documento su Nature che ha contribuito a convertire gli algoritmi in un codice di produzione e ora è in Microsoft. "Abbiamo messo una copia della nostra intera rete neurale su molti processori per ottenere un'elaborazione parallela altamente efficiente, " Egli ha detto.
Il software ha ulteriormente dimostrato la sua capacità di prevedere le vere interruzioni entro il lasso di tempo di 30 millisecondi che ITER richiederà, riducendo il numero di falsi allarmi. Il codice ora si sta avvicinando al requisito ITER del 95% di previsioni corrette con meno del 3% di falsi allarmi. Mentre i ricercatori affermano che solo un'operazione sperimentale dal vivo può dimostrare i meriti di qualsiasi metodo predittivo, il loro articolo rileva che i grandi database di archivio utilizzati nelle previsioni, "coprono un'ampia gamma di scenari operativi e forniscono quindi prove significative dei punti di forza relativi dei metodi considerati in questo documento".
Dalla previsione al controllo
Il prossimo passo sarà passare dalla previsione al controllo delle interruzioni. "Piuttosto che prevedere le interruzioni all'ultimo momento e poi mitigarle, idealmente utilizzeremmo futuri modelli di apprendimento profondo per guidare delicatamente il plasma lontano dalle regioni di instabilità con l'obiettivo di evitare la maggior parte delle interruzioni in primo luogo, " ha detto Kates-Harbeck. Ad evidenziare questo prossimo passo c'è Michael Zarnstorff, che di recente è passato da vicedirettore per la ricerca al PPPL a direttore scientifico del laboratorio. "Il controllo sarà essenziale per i tokamak post-ITER, in cui la prevenzione delle interruzioni sarà un requisito essenziale, " ha osservato Zarnstorff.
Passare da previsioni accurate abilitate all'intelligenza artificiale a un controllo realistico del plasma richiederà più di una disciplina. "Combineremo l'apprendimento profondo con quello di base, fisica di primo principio su computer ad alte prestazioni per concentrarsi sui meccanismi di controllo realistici nella combustione di plasmi, " disse Tang. "Per controllo, uno significa sapere quali "manopole attivare" su un tokamak per modificare le condizioni per evitare interruzioni. Questo è nel nostro mirino ed è lì che stiamo andando".