Un team di ricercatori del MIT, l'Università del Massachusetts ad Amherst, e l'Università della California a Berkeley sperano di colmare il divario tra automazione e scienza dei materiali, con un nuovo sistema di intelligenza artificiale che avrebbe analizzato documenti di ricerca per dedurre "ricette" per la produzione di materiali particolari. Credito:Chelsea Turner/MIT
Negli ultimi anni, sforzi di ricerca come la Materials Genome Initiative e il Materials Project hanno prodotto una vasta gamma di strumenti computazionali per la progettazione di nuovi materiali utili per una vasta gamma di applicazioni, dall'energia e dall'elettronica all'aeronautica e all'ingegneria civile.
Ma lo sviluppo dei processi per la produzione di quei materiali ha continuato a dipendere da una combinazione di esperienza, intuizione, e revisioni della letteratura manuale.
Un team di ricercatori del MIT, l'Università del Massachusetts ad Amherst, e l'Università della California a Berkeley sperano di colmare il divario tra automazione e scienza dei materiali, con un nuovo sistema di intelligenza artificiale che avrebbe analizzato documenti di ricerca per dedurre "ricette" per la produzione di materiali particolari.
"Gli scienziati dei materiali computazionali hanno fatto molti progressi nel 'cosa' fare, quale materiale progettare in base alle proprietà desiderate, "dice Elsa Olivetti, l'Atlantic Richfield Assistant Professor di Energy Studies nel Dipartimento di Scienza e Ingegneria dei Materiali (DMSE) del MIT. "Ma a causa di quel successo, il collo di bottiglia si è spostato a, 'Va bene, ora come faccio?'"
I ricercatori immaginano un database che contiene ricette di materiali estratte da milioni di documenti. Scienziati e ingegneri potrebbero inserire il nome di un materiale target e qualsiasi altro criterio:materiali precursori, condizioni di reazione, processi di fabbricazione e richiamare le ricette suggerite.
Come passo verso la realizzazione di quella visione, Olivetti e i suoi colleghi hanno sviluppato un sistema di apprendimento automatico in grado di analizzare un documento di ricerca, dedurre quale dei suoi paragrafi contiene ricette di materiali, e classificare le parole in quei paragrafi in base ai loro ruoli all'interno delle ricette:nomi dei materiali di destinazione, quantità numeriche, nomi di apparecchiature, condizioni operative, aggettivi descrittivi, e simili.
In un articolo apparso sull'ultimo numero della rivista Chimica dei materiali , dimostrano inoltre che un sistema di apprendimento automatico può analizzare i dati estratti per dedurre caratteristiche generali di classi di materiali, come i diversi intervalli di temperatura richiesti dalla loro sintesi, o caratteristiche particolari dei singoli materiali, come le diverse forme fisiche che assumeranno quando le loro condizioni di fabbricazione variano.
Olivetti è l'autore senior della carta, ed è affiancata da Edward Kim, uno studente laureato del MIT in DMSE; Kevin Huang, un postdottorato DMSE; Adam Saunders e Andrew McCallum, scienziati informatici presso UMass Amherst; e Gerbrand Ceder, un Professore di Cancelliere nel Dipartimento di Scienza e Ingegneria dei Materiali a Berkeley.
Riempire le lacune
I ricercatori hanno addestrato il loro sistema utilizzando una combinazione di tecniche di apprendimento automatico supervisionate e non supervisionate. "Supervisionato" significa che i dati di addestramento forniti al sistema vengono prima annotati dagli esseri umani; il sistema cerca di trovare correlazioni tra i dati grezzi e le annotazioni. "Non supervisionato" significa che i dati di allenamento non sono annotati, e il sistema impara invece a raggruppare i dati secondo somiglianze strutturali.
Poiché l'estrazione dei materiali-ricetta è una nuova area di ricerca, Olivetti e i suoi colleghi non si sono concessi il lusso di grandi, set di dati annotati accumulati negli anni da diversi team di ricercatori. Anziché, dovevano annotare i propri dati da soli, alla fine, circa 100 fogli.
Secondo gli standard di apprendimento automatico, questo è un set di dati piuttosto piccolo. Per migliorarlo, hanno usato un algoritmo sviluppato da Google chiamato Word2vec. Word2vec esamina i contesti in cui si verificano le parole - i ruoli sintattici delle parole all'interno delle frasi e le altre parole intorno a loro - e raggruppa le parole che tendono ad avere contesti simili. Così, ad esempio, se un documento conteneva la frase "Abbiamo riscaldato il tetracloruro di titanio a 500 C, " e un altro conteneva la frase "L'idrossido di sodio è stato riscaldato a 500 C, " Word2vec raggrupperebbe "tetracloruro di titanio" e "idrossido di sodio" insieme.
Con Word2vec, i ricercatori sono stati in grado di ampliare notevolmente il loro set di formazione, poiché il sistema di apprendimento automatico potrebbe dedurre che un'etichetta attaccata a una data parola potrebbe essere applicata ad altre parole raggruppate con essa. Invece di 100 fogli, i ricercatori potrebbero così addestrare il loro sistema su circa 640, 000 documenti.
Punta dell'iceberg
Per testare la precisione del sistema, però, hanno dovuto fare affidamento sui dati etichettati, poiché non avevano alcun criterio per valutarne le prestazioni sui dati non etichettati. In quei test, il sistema è stato in grado di identificare con un'accuratezza del 99% i paragrafi che contenevano ricette e di etichettare con un'accuratezza dell'86% le parole all'interno di quei paragrafi.
I ricercatori sperano che ulteriori lavori miglioreranno la precisione del sistema, e nel lavoro in corso stanno esplorando una batteria di tecniche di deep learning che possono fare ulteriori generalizzazioni sulla struttura delle ricette dei materiali, con l'obiettivo di elaborare automaticamente ricette per materiali non considerati nella letteratura esistente.
Gran parte della ricerca precedente di Olivetti si è concentrata sulla ricerca di modi più economici e rispettosi dell'ambiente per produrre materiali utili, e spera che un database di ricette di materiali possa favorire quel progetto.
"Questo è un lavoro fondamentale, "dice Ram Seshadri, il Fred e Linda R. Wudl Professore di Scienza dei Materiali presso l'Università della California a Santa Barbara. "Gli autori hanno accettato la difficile e ambiziosa sfida di catturare, attraverso metodi di intelligenza artificiale, strategie impiegate per la preparazione di nuovi materiali. Il lavoro dimostra la potenza dell'apprendimento automatico, ma sarebbe esatto dire che l'eventuale giudice del successo o del fallimento richiederebbe ai professionisti di convincere che l'utilità di tali metodi può consentire loro di abbandonare i loro approcci più istintivi.
Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.