L’intelligenza artificiale sta diventando uno strumento fondamentale nella ricerca chimica, offrendo nuovi metodi per affrontare sfide complesse con cui si confrontano gli approcci tradizionali. Un sottotipo di intelligenza artificiale che ha visto un utilizzo crescente in chimica è l'apprendimento automatico, che utilizza algoritmi e modelli statistici per prendere decisioni basate sui dati ed eseguire compiti per i quali non è stato esplicitamente programmato.
Tuttavia, per fare previsioni affidabili, l’apprendimento automatico richiede anche grandi quantità di dati, che non sono sempre disponibili nella ricerca chimica. I piccoli set di dati chimici semplicemente non forniscono informazioni sufficienti per l'addestramento di questi algoritmi, il che ne limita l'efficacia.
Gli scienziati del team di Berend Smit dell'EPFL hanno trovato una soluzione in modelli linguistici di grandi dimensioni come GPT-3. Questi modelli sono pre-addestrati su enormi quantità di testi e sono noti per le loro ampie capacità di comprendere e generare testi simili a quelli umani. GPT-3 costituisce la base del più popolare ChatGPT di intelligenza artificiale.
Lo studio, pubblicato su Nature Machine Intelligence , svela un nuovo approccio che semplifica notevolmente l'analisi chimica utilizzando l'intelligenza artificiale. Contrariamente allo scetticismo iniziale, il metodo non pone direttamente domande chimiche GPT-3.
"GPT-3 non ha letto la maggior parte della letteratura chimica, quindi se poniamo una domanda chimica a ChatGPT, le risposte sono generalmente limitate a ciò che si può trovare su Wikipedia", afferma Kevin Jablonka, il ricercatore principale dello studio.
"Perfezioniamo invece GPT-3 con un piccolo set di dati convertito in domande e risposte, creando un nuovo modello in grado di fornire approfondimenti chimici accurati."
Questo processo prevede di fornire a GPT-3 un elenco curato di domande e risposte. "Ad esempio, per le leghe ad alta entropia, è importante sapere se una lega si presenta in una singola fase o ha più fasi", afferma Smit. "L'elenco curato di domande e risposte è del tipo:Q ='(nome della lega ad alta entropia) è monofase?' A='Sì/No.'"
E continua:"In letteratura abbiamo trovato molte leghe di cui è nota la risposta e abbiamo utilizzato questi dati per mettere a punto GPT-3. Ciò che otteniamo è un modello AI raffinato addestrato a rispondere solo a questa domanda con un sì o un no."
Nei test, il modello, addestrato con relativamente poche domande e risposte, ha risposto correttamente a oltre il 95% di problemi chimici molto diversi, spesso superando la precisione dei modelli di apprendimento automatico all’avanguardia. "Il punto è che è facile come fare una ricerca bibliografica, che funziona per molti problemi chimici", afferma Smit.
Uno degli aspetti più sorprendenti di questo studio è la sua semplicità e velocità. I modelli tradizionali di machine learning richiedono mesi per svilupparsi e richiedono una conoscenza approfondita. Al contrario, l'approccio sviluppato da Jablonka richiede cinque minuti e non richiede alcuna conoscenza.
Le implicazioni dello studio sono profonde. Introduce un metodo semplice come condurre una ricerca bibliografica, applicabile a vari problemi chimici. La capacità di formulare domande come "La resa di un [prodotto chimico] preparato con questa (ricetta) è elevata?" e ricevere risposte precise può rivoluzionare il modo in cui la ricerca chimica viene pianificata e condotta.
Nel documento, gli autori affermano:"Oltre a una ricerca bibliografica, interrogare un modello fondamentale (ad esempio, GPT-3,4) potrebbe diventare un modo di routine per avviare un progetto sfruttando la conoscenza collettiva codificata in questi modelli fondamentali". Oppure, come afferma succintamente Smit, "Questo cambierà il modo in cui facciamo chimica".
Ulteriori informazioni: Kevin Maik Jablonka, GPT è tutto ciò di cui hai bisogno per la scoperta di pochi dati in chimica?, Nature Machine Intelligence (2024). DOI:10.1038/s42256-023-00788-1
Informazioni sul giornale: Intelligenza artificiale della natura
Fornito da Ecole Polytechnique Federale de Lausanne