• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Chimica
    I chimici sfruttano l'intelligenza artificiale per prevedere il futuro (delle reazioni chimiche)

    Credito:CC0 Dominio Pubblico

    Per fabbricare medicinali, i chimici devono trovare le giuste combinazioni di sostanze chimiche per creare le strutture chimiche necessarie. Questo è più complicato di quanto sembri, poiché le reazioni chimiche tipiche impiegano diversi componenti, e ogni sostanza chimica coinvolta in una reazione aggiunge un'altra dimensione ai calcoli.

    In un mondo ideale, i chimici vorrebbero prevedere quale combinazione di sostanze chimiche fornirebbe la massima resa di prodotto ed eviterebbe sottoprodotti indesiderati o altre perdite, ma la previsione dell'esito di queste reazioni multidimensionali si è rivelata una sfida.

    Un gruppo di ricercatori guidati da Abigail Doyle, l'A. Barton Hepburn Professore di Chimica all'Università di Princeton, e il dottor Spencer Dreher dei Merck Research Laboratories, ha trovato un modo per prevedere con precisione i rendimenti di reazione variando fino a quattro componenti di reazione, utilizzando un'applicazione di intelligenza artificiale nota come apprendimento automatico. Hanno trasformato il loro metodo in un software che hanno messo a disposizione di altri chimici. Hanno pubblicato la loro ricerca il 15 febbraio sulla rivista Scienza .

    "Il software che abbiamo sviluppato può funzionare per qualsiasi reazione, qualsiasi substrato, " ha detto Doyle. "L'idea era quella di lasciare che qualcuno applicasse questo strumento e, si spera, costruisse su di esso con altre reazioni".

    Grandi risorse e tempo vengono spesi per produrre molecole sintetiche, spesso in maniera largamente ad hoc, lei disse. Utilizzando questo nuovo software, i chimici possono identificare combinazioni ad alto rendimento di sostanze chimiche e substrati in modo più economico ed efficiente.

    "Ci auguriamo che questo sia uno strumento prezioso per accelerare la sintesi di nuovi farmaci, " ha detto Derek Ahneman, che ha completato il suo dottorato di ricerca in chimica. nel laboratorio di Doyle nel 2017 e ora lavora per IBM.

    "Molti di questi algoritmi di apprendimento automatico sono in circolazione da un po' di tempo, " disse Jesús Estrada, uno studente laureato nel laboratorio di Doyle che ha contribuito alla ricerca e al documento. "Però, all'interno della comunità della chimica organica sintetica, non abbiamo davvero sfruttato le entusiasmanti opportunità offerte dal machine learning."

    "Come chimici, tradizionalmente ci siamo allontanati dall'analisi multidimensionale, " ha detto Doyle. "Noi esaminiamo solo una variabile alla volta, o un singolo insieme di condizioni per una gamma di substrati."

    Quando Ahneman ha detto a Doyle che voleva usare l'apprendimento automatico per affrontare il problema multidimensionale, lei lo ha incoraggiato. "Ho sempre, specialmente per i miei studenti più talentuosi, cerco di dare loro carta bianca nell'ultimo anno del loro dottorato di ricerca, " ha detto. "Questo è il progetto che mi ha proposto."

    Doyle e Ahneman hanno deciso di modellare la resa della reazione modificando quattro diversi componenti di reazione, uno sforzo esponenzialmente più difficile che modificare una variabile alla volta.

    "All'inizio, sapevamo che ci sarebbero state molte sfide da superare, " Ha detto Ahneman. "Non eravamo nemmeno sicuri che fosse possibile."

    Storicamente, un ostacolo allo sviluppo di modelli multidimensionali è stato la raccolta di dati sufficienti sui rendimenti delle reazioni per costruire un efficace "set di allenamento, " ha detto. Ma di recente, Merck ha inventato sistemi robotici in grado di eseguire migliaia di reazioni nell'ordine dei giorni.

    Un'altra sfida è stata il calcolo di descrittori quantitativi per ciascuna sostanza chimica, da utilizzare come input per il modello. Questi descrittori sono stati generalmente calcolati uno per uno, che sarebbe stato poco pratico per il gran numero di combinazioni chimiche che volevano usare.

    Hanno superato questa limitazione scrivendo codice che utilizzava un programma esistente, Spartano, per calcolare e quindi estrarre descrittori per ciascuna sostanza chimica utilizzata nel modello.

    Una volta che avevano i loro descrittori quantitativi, hanno provato diversi approcci statistici. Primo, usano la regressione lineare, lo standard del settore, ma ha scoperto che non è riuscito a prevedere con precisione la resa della reazione. Hanno quindi esplorato più modelli comuni di apprendimento automatico e hanno scoperto che uno chiamato "foresta casuale" ha fornito previsioni di rendimento sorprendentemente accurate.

    Un modello di foresta casuale funziona selezionando casualmente piccoli campioni dal set di dati di addestramento e utilizzando tale campione per creare un albero decisionale. Ogni singolo albero decisionale prevede quindi il rendimento per una data reazione, e quindi il risultato viene mediato tra gli alberi per generare una previsione di resa complessiva.

    Un'altra svolta è arrivata quando i ricercatori hanno scoperto che con foreste casuali, "i rendimenti delle reazioni possono essere previsti con precisione utilizzando i risultati di "solo" centinaia di reazioni (invece di migliaia), un numero che i chimici senza robot possono eseguire da soli, " ha detto Ahneman.

    Hanno inoltre scoperto che i modelli forestali casuali possono prevedere i rendimenti per i composti chimici non inclusi nel set di formazione.

    "Le tecniche utilizzate sono assolutamente all'avanguardia, " ha detto Chloé-Agathe Azencott, un ricercatore di machine learning presso il Centro di Biologia Computazionale dell'Università di Scienze e Lettere di Parigi, che non è stato coinvolto nella ricerca. "I grafici di correlazione nel documento sono abbastanza buoni che penso che possiamo immaginare basandoci su queste previsioni in futuro, che limiterà la necessità di costosi esperimenti di laboratorio."

    "Questi risultati sono entusiasmanti, perché suggeriscono che questo metodo può essere utilizzato per prevedere la resa per reazioni in cui il materiale di partenza non è mai stato prodotto, che aiuterebbe a ridurre al minimo il consumo di sostanze chimiche che richiedono molto tempo per essere prodotte, " Ahneman ha detto. "Nel complesso, questa metodologia è promettente per (1) prevedere la resa per reazioni utilizzando materiali di partenza non ancora prodotti e (2) prevedere le condizioni ottimali per una reazione con un materiale e un prodotto di partenza noti."

    Dopo che Ahneman finì la sua laurea, Estrada ha continuato la ricerca. L'obiettivo era creare un software accessibile non solo agli esperti di computer come Ahneman ed Estrada, ma alla più ampia comunità di chimica sintetica, disse Doyle.

    Ha spiegato come funziona il software:"Si disegnano le strutture, i materiali di partenza, catalizzatori, basi e il software individuerà i descrittori condivisi tra tutti loro. Questo è il tuo contributo. Il risultato sono i rendimenti delle reazioni. The machine learning matches all those descriptors to the yields, with the goal that you can put in any structure and it will tell you the outcome of the reaction.

    "The idea is to help people navigate the multi-dimensional space where you can't intuit the outcomes, " said Doyle.


    © Scienza https://it.scienceaq.com