La generazione automatizzata di set di dati fornisce un campionamento estremamente diversificato di posizioni atomiche per l'addestramento di un modello di apprendimento automatico accurato e generale. Credito:Los Alamos National Laboratory
Un approccio rivoluzionario all'apprendimento automatico (ML) per simulare i movimenti degli atomi in materiali come l'alluminio è descritto nell'articolo di questa settimana Comunicazioni sulla natura rivista. Questo approccio automatizzato allo "sviluppo potenziale interatomico" potrebbe trasformare il campo della scoperta di materiali computazionali.
"Questo approccio promette di essere un importante elemento costitutivo per lo studio dei danni ai materiali e dell'invecchiamento dai primi principi, " ha affermato il capo progetto Justin Smith del Los Alamos National Laboratory. "La simulazione della dinamica degli atomi interagenti è una pietra angolare della comprensione e dello sviluppo di nuovi materiali. I metodi di apprendimento automatico stanno fornendo agli scienziati computazionali nuovi strumenti per condurre in modo accurato ed efficiente queste simulazioni atomistiche. I modelli di apprendimento automatico come questo sono progettati per emulare i risultati di simulazioni quantistiche altamente accurate, ad una piccola frazione del costo computazionale."
Per massimizzare l'accuratezza generale di questi modelli di apprendimento automatico, Egli ha detto, è essenziale progettare un set di dati altamente diversificato da cui addestrare il modello. Una sfida è che non è ovvio, a priori, quali dati di training saranno maggiormente necessari per il modello ML. Il recente lavoro del team presenta una metodologia di "apprendimento attivo" automatizzato per la creazione iterativa di un set di dati di formazione.
Ad ogni iterazione, il metodo utilizza il modello di machine learning attualmente migliore per eseguire simulazioni atomistiche; quando si incontrano nuove situazioni fisiche che esulano dalla conoscenza del modello ML, nuovi dati di riferimento vengono raccolti tramite costose simulazioni quantistiche, e il modello ML viene riaddestrato. Attraverso questo processo, la procedura di apprendimento attivo raccoglie dati relativi a molti diversi tipi di configurazioni atomiche, tra cui una varietà di strutture cristalline, e una varietà di modelli di difetti che appaiono all'interno dei cristalli.