Autopack ruota le strutture cristalline nello spazio 3D per ridurre al minimo l'area proiettata delle loro molecole. Dopo la convergenza, è possibile estrarre il motivo di impaccamento associato al cristallo in base agli angoli interplanari relativi. In questo esempio, gli stack trovati dopo la procedura di ottimizzazione indicano il motivo di impacchettamento beta della struttura. Credito:Lawrence Livermore National Laboratory
Sia che i chimici organici stiano lavorando allo sviluppo di nuove energie molecolari o alla creazione di nuovi farmaci di successo nell'industria farmaceutica, ognuno sta cercando come ottimizzare la struttura chimica di una molecola per raggiungere le proprietà target desiderate.
Parte di tale ottimizzazione include il motivo di impacchettamento di un cristallo molecolare, un modello percepito nel modo in cui le molecole si orientano l'una rispetto all'altra all'interno di una struttura cristallina. Gli attuali set di dati sui motivi di imballaggio sono rimasti piccoli a causa di processi di etichettatura manuali intensivi e schemi di etichettatura insufficienti.
Per aiutare a risolvere questo problema, un team di scienziati informatici e materiali del Lawrence Livermore National Laboratory (LLNL) ha sviluppato un pacchetto disponibile gratuitamente, Confezione automatica, che formalizza il processo di etichettatura del motivo di imballaggio e può elaborare ed etichettare automaticamente i motivi di imballaggio di migliaia di strutture cristalline molecolari. La ricerca appare in Journal of Chemical Information and Modeling .
Studi di ingegneria del cristallo su piccola scala negli ultimi 30 anni suggeriscono che, mentre la previsione di strutture cristalline sperimentali da una sola struttura chimica rimane fuori portata, ci possono essere relazioni tra le strutture chimiche delle molecole e un attributo specifico della struttura cristallina che adottano chiamato motivo di impacchettamento.
Il motivo di impacchettamento di un cristallo molecolare è un concetto importante per l'energia e le applicazioni di elettronica organica a causa delle correlazioni osservate tra i motivi di impacchettamento dei cristalli molecolari e le proprietà prestazionali di interesse, che includono l'insensibilità per gli esplosivi molecolari e il trasporto di carica per i semiconduttori molecolari.
Finora non è mai stato creato alcun metodo formalizzato e open-source per assegnare i motivi di imballaggio. Anziché, i motivi di imballaggio sono attribuiti ai cristalli molecolari semplicemente dalla valutazione umana di una struttura cristallina e dal giudizio, con conseguente set di dati piccoli e rumorosi.
"Nell'era del machine learning, la capacità di creare grandi, set di dati etichettati di motivi di impacchettamento di cristalli molecolari è ora particolarmente importante, " ha affermato il data scientist della LLNL Donald Loveland, autore principale del paper. "Tali sforzi possono generare modelli in grado di prevedere i motivi di imballaggio dalla sola struttura chimica delle molecole, che aiuterebbe i chimici organici a dare la priorità alla sintesi di nuove molecole in base al motivo e alle proprietà di imballaggio desiderati".
Il nuovo lavoro LLNL utilizza un efficiente algoritmo di ottimizzazione che aggira molti problemi riscontrati nei metodi di etichettatura del motivo di imballaggio precedentemente proposti, portando a nuovi risultati all'avanguardia quando testati su un set di dati curato da LLNL.
Attraverso Autopack, i ricercatori sono stati in grado di generare un set di dati di quasi 10, 000 motivi di imballaggio per un insieme di molecole energetiche e di tipo energetico di interesse per il laboratorio, un compito che prima sarebbe stato impossibile. Per contesto, la letteratura precedente è rimasta limitata all'ordine di 100 molecole a causa della natura noiosa e dispendiosa in termini di tempo dell'etichettatura manuale. Le prime analisi di questo nuovo set di dati suggeriscono tendenze complesse tra interazioni intermolecolari, conformazioni molecolari 3-D e motivi di imballaggio adottati attualmente inesplorati nel campo, fornendo indicazioni sui prossimi passi per le condutture di ingegneria del cristallo.
Il codice è disponibile gratuitamente presso l'Ufficio Innovazioni e Partnership del Lab.