Credito:CC0 Dominio Pubblico
Negli ultimi anni, i ricercatori si sono rivolti sempre più alle tecniche di scienza dei dati per aiutare la risoluzione dei problemi nella sintesi organica.
Ricercatori nel laboratorio di Abigail Doyle, A. Barton Hepburn Professore di Chimica di Princeton, ha collaborato con il professore di informatica Ryan Adams per sviluppare software open source che fornisce loro un algoritmo di ottimizzazione all'avanguardia da utilizzare nel lavoro quotidiano, piegare ciò che è stato appreso nel campo dell'apprendimento automatico in chimica sintetica.
Il software adatta i principi chiave dell'ottimizzazione bayesiana per consentire sintesi più rapide ed efficienti di sostanze chimiche.
In base al teorema di Bayes, una formula matematica per determinare la probabilità condizionata, L'ottimizzazione bayesiana è una strategia ampiamente utilizzata nelle scienze. Ampiamente definito, consente alle persone e ai computer di utilizzare le conoscenze pregresse per informare e ottimizzare le decisioni future.
I chimici nel laboratorio di Doyle, in collaborazione con Adams, un professore di informatica, e colleghi di Bristol-Myers Squibb, confrontato le capacità decisionali umane con il pacchetto software. Hanno scoperto che lo strumento di ottimizzazione produce sia una maggiore efficienza sui partecipanti umani che meno pregiudizi su una reazione di test. Il loro lavoro appare nell'attuale numero della rivista Natura .
"L'ottimizzazione della reazione è onnipresente nella sintesi chimica, sia nel mondo accademico che nell'industria chimica, " disse Doyle. "Dato che lo spazio chimico è così grande, è impossibile per i chimici valutare sperimentalmente la totalità di uno spazio di reazione. Volevamo sviluppare e valutare l'ottimizzazione bayesiana come strumento per la chimica sintetica, dato il suo successo per i relativi problemi di ottimizzazione nelle scienze".
Benjamin Scudi, un ex borsista post-dottorato nel laboratorio di Doyle e autore principale del giornale, ha creato il pacchetto Python.
"Vengo da un background di chimica sintetica, quindi apprezzo decisamente che i chimici sintetici siano piuttosto bravi ad affrontare questi problemi da soli, " ha detto Shields. "Dove penso che la vera forza dell'ottimizzazione bayesiana sia che ci permette di modellare questi problemi ad alta dimensione e catturare tendenze che potremmo non vedere nei dati noi stessi, quindi può elaborare i dati molto meglio.
"E due, dentro uno spazio, non sarà trattenuto dai pregiudizi di un chimico umano, " Ha aggiunto.
Come funziona
Il software è iniziato come un progetto fuori campo per soddisfare i requisiti di dottorato di Shields. Doyle e Shield hanno quindi formato una squadra sotto il Center for Computer Assisted Synthesis (C-CAS), un'iniziativa della National Science Foundation lanciata in cinque università per trasformare il modo in cui viene pianificata ed eseguita la sintesi di complesse molecole organiche. Doyle è un investigatore principale con C-CAS dal 2019.
"L'ottimizzazione della reazione può essere un processo costoso e dispendioso in termini di tempo, " ha detto Adams, che è anche il direttore del Programma in Statistica e Machine Learning. "Questo approccio non solo lo accelera utilizzando tecniche all'avanguardia, ma trova anche soluzioni migliori di quelle che normalmente gli umani identificherebbero. Penso che questo sia solo l'inizio di ciò che è possibile ottenere con l'ottimizzazione bayesiana in questo ambito".
Gli utenti iniziano definendo uno spazio di ricerca, esperimenti plausibili da considerare, come un elenco di catalizzatori, reagenti, ligandi, solventi, temperature, e concentrazioni. Una volta che lo spazio è preparato e l'utente definisce quanti esperimenti eseguire, il software sceglie le condizioni sperimentali iniziali da valutare. Quindi suggerisce nuovi esperimenti da eseguire, iterando attraverso un cast di scelte sempre più piccolo fino a quando la reazione non è ottimizzata.
"Nella progettazione del software, Ho cercato di includere modi per le persone di iniettare ciò che sanno su una reazione, " ha detto Shields. "Non importa come usi questo o l'apprendimento automatico in generale, ci sarà sempre un caso in cui l'esperienza umana è preziosa".
Il software e gli esempi per il suo utilizzo sono accessibili in questo repository. I collegamenti GitHub sono disponibili per quanto segue:software che rappresenta le sostanze chimiche in esame in un formato leggibile dalla macchina tramite la teoria del funzionale della densità; software per l'ottimizzazione della reazione; e il gioco che raccoglie le decisioni dei chimici sull'ottimizzazione della reazione del test.
"Ottimizzazione della reazione bayesiana come strumento per la sintesi chimica, " di Benjamin J. Shields, Jason Stevens, giugno Li, Marvin Parasram, Farhan Damani, Gesù I. Martinez Alvarado, Jacob M. Janey, Ryan P. Adams e Abigail G. Doyle, appare nel numero del 3 febbraio della rivista Natura .