Il modello di apprendimento automatico Graph2Structure utilizza grafici di composti chimici (a sinistra) per prevedere le loro coordinate 3D (a destra). Credito:Dominik Lemm, Università di Vienna
Le configurazioni 3D degli atomi determinano tutte le proprietà dei materiali. Previsioni quantitative di accurate strutture di equilibrio, coordinate 3D di tutti gli atomi, da un grafico chimico, una rappresentazione della formula di struttura, è un compito impegnativo e computazionalmente costoso che è all'inizio di praticamente ogni flusso di lavoro di chimica computazionale. I ricercatori dell'Università di Vienna hanno ora sviluppato un nuovo modello basato sull'apprendimento automatico per abbreviare calcoli costosi per prevedere direttamente le strutture dai grafici. Il nuovo metodo per "Previsioni di strutture prive di energia basate sull'apprendimento automatico delle molecole, stati di transizione, e solidi" è presentato nell'ultimo numero di Comunicazioni sulla natura .
Sebbene comunemente descritto come rigido, i composti chimici sono oggetti tridimensionali flessibili costituiti da atomi che si muovono e oscillano continuamente. Cyrus Levinthal notava già nel 1969 che la grande quantità di gradi di libertà dei composti chimici porta formalmente ad un numero catastroficamente elevato di possibili conformazioni ben fino a 10, 300 (Paradosso di Levinthal). All'interno delle osservazioni sperimentali, però, Le configurazioni 3D degli atomi corrispondono a minimi di energia libera ben definiti e quindi dettano tutte le proprietà dei materiali. Il paradigma che la struttura determina la funzione è la chiave per determinare le interazioni farmacologiche, ottimizzazione di catalizzatori o reazioni, e scoperta dei materiali. Come conseguenza, nella maggior parte delle campagne di screening ad alto rendimento computazionale (un metodo per una rapida sperimentazione scientifica), si cercano solo le configurazioni più stabili. A seconda del livello di sofisticatezza all'interno delle approssimazioni fatte quando si stimano le stabilità dei materiali, il costo computazionale può variare da minuti a ore o addirittura giorni per il computo di una singola struttura. Data la vastità dello spazio dei composti chimici, lo spazio popolato da tutti i composti immaginabili (stimato per superare 1, 060) questo compromesso qualità-prezzo rappresenta un importante collo di bottiglia nel settore.
I ricercatori dell'Università di Vienna guidati da Anatole von Lilienfeld hanno affrontato questo problema da una prospettiva diversa, sviluppando un nuovo metodo che sfrutta i dati ed è universalmente applicabile a qualsiasi tipo di chimica. Il loro nuovo metodo, Grafico2Struttura, utilizza dati di chimica quantistica di alta qualità per addestrare modelli di apprendimento automatico in grado di prevedere nuove strutture 3D per grafici molecolari di composti invisibili. Questa mappatura diretta di un grafico molecolare su una configurazione 3D specifica consente al modello di bypassare efficacemente qualsiasi forma di minimizzazione dell'energia, portando a un'accelerazione di oltre un milione rispetto ai metodi convenzionali. "La possibilità di generare strutture di alta qualità non solo accelera la progettazione molecolare ad alto rendimento, ma accelera anche il flusso di lavoro quotidiano, " dice l'autore principale dello studio in Comunicazioni sulla natura Dominik Lemm. "Generazione affidabile di strutture 3D anche per chimiche esotiche, come sistemi a guscio aperto o stati di transizione, è uno dei compiti più difficili nella simulazione atomistica."
Ulteriori risultati suggeriscono che le strutture generate possono essere utilizzate direttamente come input per la successiva valutazione dei modelli di previsione delle proprietà basati sull'apprendimento automatico, collegando così un grafo molecolare a una proprietà dipendente dalla struttura in modo rigoroso e più efficace.