Campo di sorgo, un'importante coltura utilizzata come cibo e nella produzione di biocarburanti. Credito:Pixabay
In che modo l'intelligenza artificiale (AI) può influire sull'agricoltura, l'industria alimentare, e il campo della bioingegneria? Dan Jacobson, un membro dello staff di ricerca e sviluppo nella Divisione di Bioscienze presso l'Oak Ridge National Laboratory (ORNL) del Dipartimento dell'Energia degli Stati Uniti (DOE), ha alcune idee.
Negli ultimi 5 anni, Jacobson e il suo team hanno studiato le piante per comprendere le variabili genetiche e i modelli che le rendono adattabili ai mutevoli ambienti e climi. Come biologo computazionale, Jacobson utilizza alcuni dei supercomputer più potenti del mondo per il suo lavoro, tra cui il Cray XK7 Titan recentemente dismesso e il supercomputer più potente e intelligente al mondo per la scienza aperta, il supercomputer IBM AC922 Summit, entrambi situati presso l'Oak Ridge Leadership Computing Facility (OLCF), un DOE Office of Science User Facility presso l'ORNL.
L'anno scorso, Jacobson e il suo team hanno vinto l'Association for Computing Machinery Gordon Bell Prize dopo aver utilizzato una speciale tecnica di calcolo nota come "precisione mista" su Summit per diventare il primo gruppo a raggiungere la velocità di esascala, circa un quintilione di calcoli al secondo.
Il team di Jacobson sta attualmente lavorando a numerosi progetti che formano una roadmap integrata per il futuro dell'IA nella selezione vegetale e nella bioenergia. Il lavoro del team è stato presentato in Tendenze nelle biotecnologie in ottobre.
In questo Q&A, Jacobson parla del lavoro del suo team su un algoritmo di selezione genomica, la sua visione per il futuro della genomica ambientale, e lo spazio in cui la simulazione incontra l'intelligenza artificiale.
Su cosa ha lavorato il tuo team nell'ultimo anno?
Jacobson:Abbiamo lavorato su un paio di cose. Recentemente, abbiamo sviluppato nuovi modi per fare quella che viene chiamata "selezione genomica, " o progettare un organismo per scopi di riproduzione. Abbiamo sviluppato un nuovo algoritmo di selezione genomica che è guidato da metodi di apprendimento automatico emergenti chiamati collettivamente "IA spiegabile, " che è un campo che migliora i metodi di intelligenza artificiale del classificatore scatola nera cercando di capire come questi algoritmi prendono decisioni.
Questo algoritmo ci aiuta a determinare quali variazioni in un genoma dobbiamo combinare per produrre piante in grado di adattarsi ai loro ambienti. Questo informa gli sforzi di allevamento, sforzi di editing genetico, o combinazioni di quelli, a seconda del tipo di strategia di bioingegneria che si desidera adottare.
L'anno scorso hai vinto un Gordon Bell Prize dopo aver infranto la barriera dell'esascala con un codice che ti permette di studiare le interazioni combinatorie tra gli organismi ei loro ambienti. Come si inserisce questo algoritmo in quella ricerca?
Jacobson:Stiamo ancora usando il modello che abbiamo usato l'anno scorso, ma ora, abbiamo introdotto questo algoritmo di selezione genomica basato sull'intelligenza artificiale nel nostro codice Combinatorial Metrics [CoMet] e gli stiamo fornendo informazioni ambientali ogni giorno dell'anno, così possiamo fare studi di associazione sull'intero genoma nel tempo climatico.
Inoltre, abbiamo ampliato su scala globale i nostri sforzi in quelli che chiamiamo "climatipi", il clima e le informazioni ambientali a cui le piante si stanno adattando. Con l'aiuto di Peter Thornton dell'ORNL e l'esperienza del suo gruppo in biogeografia e clima, abbiamo costruito modelli di ogni chilometro quadrato di terra del pianeta e codificato 50 anni di dati ambientali e climatici in questi modelli, che vanno dal suolo, attraverso la qualità spettrale della luce, e tutto il resto.
Per comprendere tutte le relazioni tra i diversi ambienti, abbiamo confrontato questi ambienti tra loro su Summit utilizzando un nuovo algoritmo chiamato Duo che abbiamo aggiunto alla nostra base di codice CoMet. Per quello che ci risulta, questo è il più grande calcolo scientifico mai fatto.
Sembra un risultato piuttosto pesante. Che tipo di informazioni possono darti questi confronti?
Jacobson:Questi confronti possono aiutarci a determinare esattamente dove possiamo mirare a determinati ambienti e quali mutazioni genetiche e alleli dobbiamo includere per aiutare queste piante ad adattarsi ad ambienti diversi. Possiamo guardare un ambiente e dire, "Per questo ambiente, questo è ciò di cui avremo bisogno nel genoma di questa pianta per farla prosperare nel miglior modo possibile".
È questo il futuro della genomica ambientale?
Jacobson:La visione integrata che vediamo è la connessione di tutti gli strati "-omici", dalla genomica (espressione genica), proteomica (espressione proteica), e la metabolomica (espressione dei metaboliti) fino ai fenotipi, tratti osservabili; così, dal genoma al fenomeno e tutto il resto.
Idealmente, vorremmo avere una combinazione di dati genotipici con dati climatici e ambientali in un modello integrato, dai singoli nucleotidi, le strutture molecolari che costituiscono il DNA, fino all'ambiente e al clima su scala planetaria. Tali modelli integrati completi sono ora possibili perché abbiamo effettivamente calcolato la scala spettrale della luce di ogni punto del pianeta:è un fenotipo astrofisico che proviene dalla nostra stella più vicina, il Sole.
Primo, dobbiamo esaminare le interazioni combinatorie in tali modelli per vedere come portano alle proprietà emergenti che stiamo cercando di ottimizzare negli impianti per la produttività e la sostenibilità future. Quindi, possiamo collegarlo al modo in cui le piante si sono storicamente adattate agli ambienti al fine di progettare nuovi genotipi ideali per la bioenergia o la produzione di cibo che sono ottimizzati per prosperare in ambienti specifici.
È qualcosa che sarà richiesto in agricoltura in futuro?
Jacobson:Mentre il mondo cambia, c'è una crescente pressione per utilizzare "terreni marginali, " si tratta di terreni che spesso non sono attualmente utilizzati per l'agricoltura o non sono utilizzati in modo efficiente per l'agricoltura. Quindi, se progettiamo genotipi che prosperano in questi ambienti marginali, saremo in grado di aumentare la nostra produzione di cibo oltre alla nostra produzione di energia. Questa è una tecnologia a doppio uso.
Siamo anche molto preoccupati per l'eccessiva fertilizzazione del terreno perché può portare a un deflusso che ha grandi conseguenze ecologiche. Se siamo in grado di ottimizzare le piante per utilizzare i nutrienti presenti con poco fertilizzante aggiuntivo, questo è un grande vantaggio anche per la sostenibilità. Così, stiamo davvero cercando di guardare a questo in modo olistico e costruire il maggior numero possibile di questi adattamenti nel modello in modo da conoscere gli effetti in determinati ambienti.
A cosa stai lavorando dopo?
Jacobson:Il prossimo passo è guardare i dati storici e tutte queste relazioni e poi proiettarsi in avanti in modo da poter effettivamente progettare genotipi che non solo prospereranno nelle attuali zone ambientali, ma continueranno a prosperare in futuro mentre la rete globale cambia. La capacità di proiettarsi in avanti, sia per le colture annuali che per le colture perenni a lungo termine, è davvero importante.
Quali sono alcune sfide rimaste?
Jacobson:Tutto quello che stiamo facendo è un lavoro pesante, ma stiamo esaminando come possiamo progettare questo nuovo approccio al Summit e al futuro sistema exascale dell'OLCF, Frontiera, in modo che possiamo davvero comprendere tutte queste relazioni. Anche, ora che abbiamo questi dati in tutti questi livelli "-omics", dobbiamo eseguire queste combinazioni di strati, chiamate politopi, migliaia o decine di migliaia o centinaia di migliaia di volte. La prossima serie di algoritmi che stiamo costruendo è trovare tutte le possibili relazioni e associazioni all'interno e attraverso tutti i politopi. Questa è la prossima frontiera.
Il tuo lavoro si intersecherà con i modelli di simulazione climatica tradizionali?
Jacobson:Questa è una visione delle informazioni sul clima basata su dati e intelligenza artificiale, che è diverso da un approccio di simulazione. Col tempo, sarà interessante vedere dove si intersecano, e potrebbero esserci cose che apprendiamo qui che sono molto istruttive per i modelli climatici e viceversa. Sappiamo anche che questo stesso tipo di tecnologia AI spiegabile può aiutare molto con gli studi di simulazione. Idealmente, potremmo sviluppare modelli spiegabili basati sull'intelligenza artificiale che possono aiutare i modelli di simulazione con alcuni dei loro colli di bottiglia. Se possiamo apprendere i modelli di simulazione utilizzati dai modelli e sostituire alcuni dei loro colli di bottiglia con un risultato appreso, allora quei modelli possono fare cose più creative. È davvero lì che potremmo vedere parte di questo spazio intersecarsi in futuro.