Negli ultimi dieci anni, i modelli di deep learning generativo sono stati applicati con successo alla progettazione di nuove molecole farmaceutiche, percorsi di sintesi organica e molecole funzionali su misura per dispositivi elettronici/optoelettronici. Ciò è in gran parte reso possibile dalla disponibilità della rappresentazione SMILES per le molecole, una rappresentazione invertibile e invariante particolarmente adatta per modelli di elaborazione del linguaggio naturale come reti neurali ricorrenti, trasformatori, ecc.
Tuttavia, la progettazione di solidi inorganici cristallini con le proprietà desiderate rimane una sfida ardua. Ciò è dovuto principalmente alla mancanza di una rappresentazione cristallina "equivalente a SMILES" per collegare materiali periodici a stato solido e architetture di deep learning all'avanguardia.
I metodi precedenti per la progettazione dei cristalli inversi si basavano principalmente su griglie di voxel 3D o coordinate spaziali assolute per rappresentare le strutture. Ma questi approcci sono intrinsecamente privi di invarianza rotazionale. Esistono anche tentativi di utilizzare grafi cristallini, che sono invarianti ma non invertibili a causa dell'assenza di informazioni esplicite sulla periodicità o sulla composizione. Per affrontare questa sfida, abbiamo proposto una nuova rappresentazione cristallina chiamata SLICES. Lo studio è pubblicato sulla rivista Nature Communications .
La motivazione principale alla base dello sviluppo di SLICES è creare una rappresentazione cristallina che sia invertibile e invariante, analoga alla rappresentazione SMILES ampiamente utilizzata per la progettazione inversa molecolare (Figura 1). Invertibilità significa che la rappresentazione può essere riconvertita in modo inequivocabile alla struttura cristallina originale. Ciò è essenziale affinché i modelli generativi conducano la progettazione inversa, in cui i modelli creano nuove strutture cristalline che vengono decodificate dalla rappresentazione.
L'invarianza indica che la rappresentazione rimane invariata sotto traslazioni, rotazioni e permutazioni della struttura cristallina. Soddisfare le invarianze consente alla rappresentazione di concentrarsi esclusivamente sulla codifica delle informazioni topologiche e compositive essenziali di un sistema piuttosto che sulle caratteristiche superficiali che cambiano durante le trasformazioni. Ciò riduce la ridondanza e migliora l'efficienza dell'apprendimento.
Soddisfacendo l'invertibilità e le invarianze, SLICES consente l'esplorazione efficiente del vasto spazio dei composti chimici per i materiali cristallini utilizzando modelli generativi profondi.
Concettualmente, SLICES codifica la topologia e la composizione delle strutture cristalline in stringhe, proprio come SMILES converte i grafici molecolari in notazioni di linea. Più specificamente, SLICES sfrutta il concetto matematico di "grafici quoziente etichettati" per rappresentare strutture cristalline periodiche. Gli atomi e i legami all'interno di una cella unitaria sono mappati sui nodi e sui bordi del grafico del quoziente. Etichette aggiuntive vengono assegnate ai bordi che indicano i vettori di spostamento periodico richiesti per connettere atomi equivalenti nelle celle unitarie vicine.
Un esempio è la struttura cristallina del diamante (Figura 1), che contiene due atomi di carbonio legati insieme nella cella unitaria primitiva. La stringa SLICES codifica esplicitamente i simboli atomici "C" e l'etichetta del bordo "001" che denota il legame periodico che si propaga lungo la direzione [001]. Analizzando la stringa SLICES, è possibile ottenere sia la composizione che la connettività della struttura a diamante.
In particolare, SLICES codifica solo le informazioni sulla topologia e sulla composizione. Attributi come le coordinate atomiche e i parametri del reticolo non sono incorporati esplicitamente. Ciò rende SLICES invariante rispetto a traslazioni, rotazioni e permutazioni dell'indice atomico in base alla progettazione.
Ricostruzione di strutture cristalline da SLICES
Sebbene codificare i cristalli in SLICES sia relativamente semplice, la sfida sta nel garantire l’invertibilità, ovvero la capacità di ricostruire accuratamente le strutture cristalline dalle stringhe SLICES. Per ottenere l'invertibilità, abbiamo sviluppato una pipeline di ricostruzione (Figura 2) per SLICES che contiene tre passaggi chiave:
Le prestazioni di ricostruzione sono state valutate su un database contenente più di 40.000 materiali conosciuti sperimentalmente con un massimo di 20 atomi per cella unitaria. Il processo di ricostruzione per SLICES è stato in grado di ricostruire il 94,95% delle strutture originali, superando sostanzialmente i metodi precedenti. Questa invertibilità di SLICES consente la generazione di nuove strutture da rappresentazioni apprese, che è la chiave per la progettazione di materiali inversi.
Applicazione nella progettazione inversa di materiali funzionali
A titolo dimostrativo, abbiamo applicato SLICES nella progettazione inversa di semiconduttori diretti a banda proibita stretta per dispositivi optoelettronici che utilizzano reti neurali ricorrenti (RNN). Il flusso di lavoro è costituito da (Figura 3):
Attraverso questo flusso di lavoro che combina SLICES, RNN e calcoli ad alto rendimento, sono stati scoperti 14 nuovi semiconduttori con bande proibite dirette nell'intervallo ottimale (Figura 4). Ciò dimostra la promessa di SLICES come strumento per accelerare la scoperta di materiali funzionali utilizzando l'intelligenza artificiale generativa.
Generazione diretta di nuovi materiali con energie di formazione specificate
Inoltre, utilizziamo un'architettura di rete neurale ricorrente condizionale (cRNN), come illustrato nella Figura 5, per generare stringhe SLICES corrispondenti a cristalli con un'energia di formazione desiderata specificata dall'utente. La distribuzione delle energie di formazione delle strutture generate si avvicina al valore target specificato rispetto alla distribuzione del set di dati. I cRNN basati su SLICES superano significativamente le prestazioni dei precedenti modelli all’avanguardia. Questo approccio segna un progresso significativo nella capacità di progettare e scoprire nuovi materiali in modo controllato e preciso.
Essendo la prima rappresentazione cristallina invertibile e invariante basata su stringhe, SLICES apre molte interessanti opportunità nella progettazione inversa di solidi cristallini, proprio come SMILES ha fatto per le molecole negli ultimi dieci anni. Proprio negli ultimi anni abbiamo assistito a enormi progressi nei modelli generativi che vanno dalle immagini, ai video, al parlato, alle proteine e alle molecole. Immaginiamo che i materiali solidi diventino la prossima frontiera, grazie a questa nuova capacità di esplorazione efficiente in termini di dati e integrata nella chimica, potenziata da rappresentazioni come SLICES.
Questa storia fa parte di Science X Dialog, dove i ricercatori possono riportare i risultati dei loro articoli di ricerca pubblicati. Visita questa pagina per informazioni su ScienceX Dialog e su come partecipare.
Ulteriori informazioni: Hang Xiao et al, Una rappresentazione cristallina invertibile e invariante per la progettazione inversa di materiali a stato solido utilizzando l'apprendimento profondo generativo, Nature Communications (2023). DOI:10.1038/s41467-023-42870-7
Informazioni sul giornale: Comunicazioni sulla natura
Hang Xiao è affiliato alla Scuola di Studi Interdisciplinari dell'Università di Lingnan; ha conseguito il dottorato di ricerca presso la Columbia University. Yan Chen è affiliato al Laboratorio di Meccanica Multiscala e Scienze Mediche, SV LAB, Scuola di Aerospazio, Università di Xi’an Jiaotong, dove ha anche conseguito il dottorato di ricerca.