Credito:Pixabay/CC0 Dominio pubblico
Da tempo i computer sono in grado di elaborare rapidamente le immagini 2D. Il tuo cellulare può scattare fotografie digitali e manipolarle in diversi modi. Molto più difficile, però, sta elaborando un'immagine in tre dimensioni, e farlo in modo tempestivo. La matematica è più complessa, e sgranocchiando quei numeri, anche su un supercomputer, Ci vuole tempo.
Questa è la sfida che un gruppo di scienziati del Dipartimento dell'Energia degli Stati Uniti (DOE) Argonne National Laboratory sta cercando di superare. L'intelligenza artificiale è emersa come una soluzione versatile ai problemi posti dall'elaborazione dei big data. Per gli scienziati che utilizzano l'Advanced Photon Source (APS), un DOE Office of Science User Facility ad Argonne, per elaborare immagini 3D, potrebbe essere la chiave per trasformare i dati dei raggi X in visibili, forme comprensibili a un ritmo molto più veloce. Una svolta in questo settore potrebbe avere implicazioni per l'astronomia, microscopia elettronica e altre aree della scienza dipendenti da grandi quantità di dati 3D.
"Per sfruttare appieno ciò di cui sarà in grado l'APS aggiornato, dobbiamo reinventare l'analisi dei dati. I nostri metodi attuali non sono sufficienti per tenere il passo. L'apprendimento automatico può sfruttare appieno e andare oltre ciò che è attualmente possibile, " dice Mathew Cherukara dell'Argonne National Laboratory
Il gruppo di ricerca, che comprende scienziati di tre divisioni Argonne, ha sviluppato un nuovo framework computazionale chiamato 3D-CDI-NN, e ha dimostrato che può creare visualizzazioni 3D dai dati raccolti presso l'APS centinaia di volte più velocemente rispetto ai metodi tradizionali. La ricerca del team è stata pubblicata in Recensioni di fisica applicata , una pubblicazione dell'American Institute of Physics.
CDI sta per imaging di diffrazione coerente, una tecnica a raggi X che prevede il rimbalzo di fasci di raggi X ultra luminosi sui campioni. Quei fasci di luce saranno poi raccolti dai rilevatori come dati, e ci vuole uno sforzo computazionale per trasformare quei dati in immagini. Parte della sfida, spiega Mathew Cherukara, capo del gruppo Computational X-ray Science nella divisione X-ray Science di Argonne (XSD), è che i rilevatori catturano solo alcune delle informazioni dai raggi.
Ma ci sono informazioni importanti contenute nei dati mancanti, e gli scienziati si affidano ai computer per inserire tali informazioni. Come osserva Cherukara, anche se questo richiede un po' di tempo in 2D, ci vuole ancora più tempo a che fare con le immagini 3D. La soluzione, poi, è addestrare un'intelligenza artificiale a riconoscere gli oggetti e i cambiamenti microscopici che subiscono direttamente dai dati grezzi, senza dover inserire le informazioni mancanti.
Per fare questo, il team ha iniziato con dati a raggi X simulati per addestrare la rete neurale. La NN nel titolo del framework, una rete neurale è una serie di algoritmi che possono insegnare a un computer a prevedere i risultati in base ai dati che riceve. Henry Chan, l'autore principale dell'articolo e un ricercatore post-dottorato presso il Center for Nanoscale Materials (CNM), un DOE Office of Science User Facility ad Argonne, ha condotto questa parte del lavoro.
"Abbiamo usato simulazioni al computer per creare cristalli di diverse forme e dimensioni, e li abbiamo convertiti in immagini e schemi di diffrazione per l'apprendimento della rete neurale, " Chan ha detto. "La facilità di generare rapidamente molti cristalli realistici per l'addestramento è il vantaggio delle simulazioni".
Questo lavoro è stato svolto utilizzando le risorse dell'unità di elaborazione grafica presso il Joint Laboratory for System Evaluation di Argonne, che implementa banchi di prova all'avanguardia per consentire la ricerca su piattaforme e capacità di elaborazione ad alte prestazioni emergenti.
Una volta che la rete è stata addestrata, dice Stephan Hruszkewycz, fisico e leader del gruppo con la Divisione Scienza dei Materiali di Argonne, può avvicinarsi molto alla risposta giusta, abbastanza rapidamente. Però, c'è ancora spazio per la raffinatezza, quindi il framework 3D-CDI-NN include un processo per ottenere il resto della rete. Hruszkewycz, insieme allo studente laureato della Northwestern University Saugat Kandel, ha lavorato su questo aspetto del progetto, che riduce la necessità di passaggi iterativi dispendiosi in termini di tempo.
"La Divisione Scienza dei Materiali si occupa della diffrazione coerente perché è possibile vedere i materiali su scale di lunghezza di pochi nanometri, circa 100, 000 volte più piccolo della larghezza di un capello umano, con raggi X che penetrano negli ambienti, " Hruszkewycz ha detto. "Questo documento è una dimostrazione di questi metodi avanzati, e facilita notevolmente il processo di imaging. Vogliamo sapere cos'è un materiale, e come cambia nel tempo, e questo ci aiuterà a fare foto migliori mentre effettuiamo le misurazioni."
Come passo finale, La capacità di 3D-CDI-NN di inserire le informazioni mancanti e di ottenere una visualizzazione 3D è stata testata su dati a raggi X reali di minuscole particelle d'oro, raccolti alla linea di luce 34-ID-C presso l'APS. Il risultato è un metodo di calcolo centinaia di volte più veloce sui dati simulati, e quasi così velocemente su dati APS reali. I test hanno anche mostrato che la rete è in grado di ricostruire le immagini con meno dati di quelli normalmente necessari per compensare le informazioni non catturate dai rilevatori.
Il prossimo passo per questa ricerca, secondo Chan, è integrare la rete nel flusso di lavoro dell'APS, in modo che apprenda dai dati man mano che vengono acquisiti. Se la rete apprende dai dati sulla linea di luce, Egli ha detto, migliorerà continuamente.
Per questa squadra, c'è anche un elemento temporale in questa ricerca. Come sottolinea Cherukara, è in corso un massiccio aggiornamento dell'APS, e la quantità di dati generati ora aumenterà in modo esponenziale una volta completato il progetto. L'APS aggiornato genererà fasci di raggi X fino a 500 volte più luminosi, e la coerenza del raggio, la caratteristica della luce che gli consente di diffrangere in modo da codificare più informazioni sul campione, sarà notevolmente aumentata.
Ciò significa che, mentre ora occorrono dai due ai tre minuti per raccogliere dati di imaging di diffrazione coerenti da un campione e ottenere un'immagine, la parte di raccolta dati di tale processo sarà presto fino a 500 volte più veloce. Anche il processo di conversione di tali dati in un'immagine utilizzabile deve essere centinaia di volte più veloce di quanto lo sia ora per tenere il passo.
"Per sfruttare appieno ciò di cui sarà in grado l'APS aggiornato, dobbiamo reinventare l'analisi dei dati, " Ha detto Cherukara. "I nostri metodi attuali non sono sufficienti per tenere il passo. L'apprendimento automatico può sfruttare appieno e andare oltre ciò che è attualmente possibile."
Oltre a Chan, Cherukara e Hruszkewycz, autori sulla carta includono Subramanian Sankaranarayanan e Ross Harder, entrambi di Argonne; Youssef Nashed dello SLAC National Accelerator Laboratory; e Saugat Kandel della Northwestern University.