L'apprendimento automatico fornisce una mappa codificata a colori dei dati dei raggi X in base alla dipendenza dalla temperatura di ciascuna regione. X-TEC ha identificato le posizioni di due serie di picchi acuti (quadrati gialli e verdi) nei dati, nonché aloni diffusi intorno ad essi (rosso e blu). Credito:Laboratorio Nazionale Argonne
La codifica a colori rende le mappe aeree molto più facilmente comprensibili. Attraverso il colore, possiamo dire a colpo d'occhio dove c'è una strada, una foresta, un deserto, una città, un fiume o un lago.
In collaborazione con diverse università, l'Argonne National Laboratory del Dipartimento dell'Energia degli Stati Uniti (DOE) ha ideato un metodo per creare grafici codificati a colori di grandi volumi di dati dall'analisi a raggi X. Questo nuovo strumento utilizza l'ordinamento dei dati computazionali per trovare cluster correlati a proprietà fisiche, come una distorsione atomica in una struttura cristallina. Dovrebbe accelerare notevolmente la ricerca futura sui cambiamenti strutturali su scala atomica indotti dalla variazione della temperatura.
Il team di ricerca ha pubblicato i propri risultati negli Proceedings of the National Academy of Sciences in un articolo intitolato "Sfruttare l'apprendimento automatico interpretabile e non supervisionato per affrontare i big data dalla moderna diffrazione dei raggi X".
"Il nostro metodo utilizza l'apprendimento automatico per analizzare rapidamente enormi quantità di dati dalla diffrazione dei raggi X", ha affermato Raymond Osborn, fisico senior nella divisione Scienza dei materiali di Argonne. "Ciò che avrebbe potuto richiedere mesi in passato ora richiede circa un quarto d'ora, con risultati molto più precisi."
Per oltre un secolo, la diffrazione dei raggi X (o XRD) è stata uno dei metodi scientifici più fruttuosi per l'analisi dei materiali. Ha fornito informazioni chiave sulla struttura atomica 3D di innumerevoli materiali tecnologicamente importanti.
Negli ultimi decenni, la quantità di dati prodotti negli esperimenti XRD è aumentata notevolmente in strutture di grandi dimensioni come l'Advanced Photon Source (APS), una struttura utente del DOE Office of Science ad Argonne. Decisamente carenti, tuttavia, sono i metodi di analisi in grado di far fronte a questi immensi set di dati.
Il team chiama il loro nuovo metodo X-ray Temperature Clustering, o XTEC in breve. Accelera le scoperte di materiali attraverso il raggruppamento rapido e la codifica a colori di grandi set di dati di raggi X per rivelare i cambiamenti strutturali precedentemente nascosti che si verificano quando la temperatura aumenta o diminuisce. Un tipico set di dati di grandi dimensioni sarebbe 10.000 gigabyte, equivalenti a circa 3 milioni di brani musicali in streaming.
XTEC si avvale della potenza dell'apprendimento automatico non supervisionato, utilizzando i metodi sviluppati per questo progetto presso la Cornell University. Questo apprendimento automatico non dipende dalla formazione iniziale e dall'apprendimento con dati già ben studiati. Invece, impara trovando modelli e cluster in grandi set di dati senza tale formazione. Questi modelli sono quindi rappresentati da una codifica a colori.
"Ad esempio, XTEC potrebbe assegnare il rosso al cluster di dati uno, che è associato a una determinata proprietà che cambia con la temperatura in un modo particolare", ha affermato Osborn. "Quindi, il cluster due sarebbe blu e associato a un'altra proprietà con una diversa dipendenza dalla temperatura, e così via. I colori indicano se ogni cluster rappresenta l'equivalente di una strada, di una foresta o di un lago in una mappa aerea."
Come banco di prova, XTEC ha analizzato i dati della linea di luce 6-ID-D all'APS, presi da due materiali cristallini che sono superconduttori a temperature vicine allo zero assoluto. A questa temperatura ultrabassa, questi materiali passano a uno stato superconduttore, senza offrire resistenza alla corrente elettrica. Più importante per questo studio, altre caratteristiche insolite emergono a temperature più elevate legate ai cambiamenti nella struttura del materiale.
Applicando XTEC, il team ha estratto una quantità senza precedenti di informazioni sui cambiamenti nella struttura atomica a diverse temperature. Questi includono non solo le distorsioni nella disposizione ordinata degli atomi nel materiale, ma anche le fluttuazioni che si verificano quando si verificano tali cambiamenti.
"Grazie all'apprendimento automatico, siamo in grado di vedere il comportamento dei materiali non visibile dall'XRD convenzionale", ha affermato Osborn. "E il nostro metodo è applicabile a molti problemi di big data non solo nei superconduttori, ma anche nelle batterie, nelle celle solari e in qualsiasi dispositivo sensibile alla temperatura."
L'APS sta subendo un massiccio aggiornamento che aumenterà la luminosità dei suoi raggi X fino a 500 volte. Insieme all'aggiornamento arriverà un aumento significativo dei dati raccolti presso l'APS e le tecniche di apprendimento automatico saranno essenziali per analizzare tali dati in modo tempestivo. + Esplora ulteriormente