Ian Char lavora nella sala di controllo della DIII-D National Fusion Facility. Credito:Jeff Schneider
Uno studente della School of Computer Science (SCS) della Carnegie Mellon University ha utilizzato l'apprendimento per rinforzo per controllare le reazioni di fusione nucleare, un passo significativo verso lo sfruttamento dell'immensa potenza prodotta dalla fusione nucleare come fonte di energia pulita e abbondante.
Ian Char, un dottorando nel Dipartimento di Machine Learning, ha utilizzato l'apprendimento per rinforzo per controllare il plasma di idrogeno della macchina tokamak presso la DIII-D National Fusion Facility di San Diego. È stato il primo ricercatore della CMU a condurre un esperimento sulle macchine ricercate, il primo a utilizzare l'apprendimento per rinforzo per influenzare la rotazione di un plasma tokamak e la prima persona a provare l'apprendimento per rinforzo sulla macchina tokamak più grande negli Stati Uniti. . Char ha collaborato al lavoro con il Princeton Plasma Physics Laboratory (PPPL).
"L'apprendimento del rinforzo ha influenzato la pressione del plasma e la sua rotazione", ha detto Char. "E questo è davvero il nostro grande primo qui."
La fusione nucleare avviene quando i nuclei di idrogeno si rompono o si fondono insieme. Questo processo rilascia un'enorme quantità di energia, ma rimane difficile da mantenere ai livelli necessari per immettere l'elettricità nella rete. I nuclei di idrogeno si fonderanno solo a temperature e pressioni estremamente elevate come quelle che si trovano al centro del sole, dove la fusione nucleare avviene naturalmente. I fisici hanno anche ottenuto la fusione nucleare nelle armi termonucleari, ma queste non sono utili come fonti di energia.
Un altro metodo per produrre la fusione nucleare utilizza i campi magnetici per contenere un plasma di idrogeno alla temperatura e alla pressione richieste per fondere i nuclei. Questo processo avviene all'interno di un tokamak, un'enorme macchina che utilizza i campi magnetici per confinare il plasma di idrogeno in una forma a ciambella chiamata toro. Il contenimento del plasma e il mantenimento della sua forma richiedono centinaia di micromanipolazioni ai campi magnetici e esplosioni di particelle di idrogeno aggiuntive.
Ci sono pochi tokamak su larga scala che operano nel mondo che possono facilitare questo tipo di ricerca e il tempo per eseguire esperimenti su di essi è ambito. Il DIII-D National Fusion Facility è l'unico operativo negli Stati Uniti.
DeepMind, una sussidiaria di intelligenza artificiale di Alphabet, la società madre di Google, è stata la prima a utilizzare l'apprendimento per rinforzo per controllare il campo magnetico contenente la reazione di fusione. Il laboratorio ha mantenuto con successo il plasma stabile e lo ha scolpito in forme diverse. DeepMind ha condotto il suo esperimento sul Tokamak a configurazione variabile (TCV) a Losanna, in Svizzera, e ha pubblicato i suoi risultati a febbraio su Nature .
Char è stato il primo a condurre un simile esperimento di apprendimento per rinforzo al DIII-D. L'apprendimento per rinforzo utilizza i dati dei tentativi passati per ottenere un risultato ottimale. Durante l'esperimento di Char, algoritmi di apprendimento per rinforzo hanno esaminato i dati storici e in tempo reale per variare e controllare la velocità di rotazione del plasma alla ricerca della stabilità ottimale.
La ciambella al plasma ruota quando vengono iniettate particelle di idrogeno aggiuntive. Variare la velocità di queste particelle può potenzialmente stabilizzare il plasma e renderlo più facile da contenere. Char ha utilizzato due algoritmi di apprendimento per il suo esperimento. In uno, ha utilizzato i dati del tokamak raccolti nel corso di diversi anni per addestrarlo su come reagisce il plasma. Il secondo algoritmo osserva le condizioni del plasma e quindi decide a quale velocità e direzione sparare alle particelle aggiuntive per influenzarne la velocità.
"L'obiettivo a breve termine è fornire ai fisici gli strumenti per causare questa rotazione differenziale in modo che possano fare gli esperimenti per rendere questo plasma più stabile", ha affermato Jeff Schneider, professore di ricerca presso il Robotics Institute e Ph.D di Char. consigliere. "A lungo termine, questo lavoro mostra un percorso per utilizzare l'apprendimento per rinforzo per controllare altre parti dello stato plasmatico e, infine, raggiungere le temperature e le pressioni abbastanza a lungo per avere una centrale elettrica. Ciò significherebbe energia pulita e illimitata per tutti."
Char ha presentato il progetto a DIII-D, che è una struttura per utenti dell'Ufficio per la scienza del Dipartimento dell'energia degli Stati Uniti gestito da General Atomics, l'anno scorso e il 28 giugno ha ottenuto uno slot di tre ore per eseguire i suoi algoritmi. Seduto nella sala di controllo di nell'enorme struttura DIII-D e circondato da operatori, Char ha caricato i suoi algoritmi.
Char ha dimostrato che i suoi algoritmi possono controllare la velocità di rotazione del plasma. Questa è stata la prima volta che l'apprendimento per rinforzo è stato utilizzato per controllare la rotazione. Alcuni problemi si sono verificati durante la sessione di controllo e sono necessari ulteriori test. Char è tornato in DIII-D alla fine di agosto per continuare il suo lavoro.
"Ian ha mostrato un'incredibile capacità di digerire i problemi di controllo specifici del dispositivo di fusione e la fisica del plasma che lo sottolinea", ha affermato Egemen Kolemen, professore associato presso il dipartimento di ingegneria meccanica e aerospaziale dell'Università di Princeton e uno dei collaboratori di Char al PPPL. "È un grande risultato applicare la teoria che ha appreso alla CMU a un problema reale di fusione e condurre un esperimento su un impianto di fusione nazionale. Quel lavoro normalmente richiede anni di fisica del plasma e formazione ingegneristica". + Esplora ulteriormente