• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Il ricercatore sviluppa un chatbot con esperienza nei nanomateriali
    Kevin Yager. Crediti:Jospeh Rubino/Brookhaven National Laboratory

    Un ricercatore ha appena finito di scrivere un articolo scientifico. Sa che il suo lavoro potrebbe trarre beneficio da un'altra prospettiva. Ha trascurato qualcosa? O forse c'è un'applicazione della sua ricerca a cui non aveva pensato. Un secondo paio di occhi sarebbe fantastico, ma anche il più amichevole dei collaboratori potrebbe non essere in grado di dedicare il tempo a leggere tutte le pubblicazioni di base necessarie per mettersi al passo.



    Kevin Yager, leader del gruppo sui nanomateriali elettronici presso il Center for Functional Nanomaterials (CFN), una struttura per utenti scientifici del Dipartimento dell'Energia degli Stati Uniti (DOE) presso il Brookhaven National Laboratory del DOE, ha immaginato come i recenti progressi nell'intelligenza artificiale (AI) e l'apprendimento automatico (ML) potrebbe aiutare il brainstorming e l'ideazione scientifica. Per raggiungere questo obiettivo, ha sviluppato un chatbot con conoscenze nei tipi di scienza in cui è impegnato.

    I rapidi progressi nell’intelligenza artificiale e nel machine learning hanno lasciato il posto a programmi in grado di generare testo creativo e codice software utile. Questi chatbot generici hanno recentemente catturato l’immaginazione del pubblico. I chatbot esistenti, basati su modelli linguistici ampi e diversificati, mancano di una conoscenza dettagliata dei sottodomini scientifici.

    Sfruttando un metodo di recupero dei documenti, il bot di Yager è esperto in aree della scienza dei nanomateriali che altri robot non lo sono. I dettagli di questo progetto e il modo in cui altri scienziati possono sfruttare questo collega AI per il proprio lavoro sono stati recentemente pubblicati su Digital Discovery .

    L'ascesa dei robot

    "CFN è da molto tempo alla ricerca di nuovi modi per sfruttare l'intelligenza artificiale/ML per accelerare la scoperta dei nanomateriali. Attualmente, ci aiuta a identificare, catalogare e scegliere rapidamente campioni, automatizzare esperimenti, controllare apparecchiature e scoprire nuovi materiali. Esther Tsai, uno scienziato del gruppo di nanomateriali elettronici del CFN, sta sviluppando un compagno di intelligenza artificiale per aiutare ad accelerare gli esperimenti di ricerca sui materiali presso la National Synchrotron Light Source II (NSLS-II)." NSLS-II è un'altra struttura per utenti del DOE Office of Science presso il Brookhaven Lab.

    Al CFN si è lavorato molto sull'intelligenza artificiale/ML che può aiutare a condurre esperimenti attraverso l'uso di automazione, controlli, robotica e analisi, ma avere un programma in grado di gestire testi scientifici era qualcosa che i ricercatori non avevano esplorato altrettanto profondamente. Essere in grado di documentare, comprendere e trasmettere rapidamente informazioni su un esperimento può essere utile in diversi modi, dall'abbattimento delle barriere linguistiche al risparmio di tempo riassumendo parti di lavoro più ampie.

    Una demo del chatbot di Yager che risponde a una domanda relativa alla ricerca di CFN. Credito:Laboratorio nazionale Brookhaven

    Attento alla tua lingua

    Per costruire un chatbot specializzato, il programma richiedeva testo specifico per il dominio, ovvero un linguaggio tratto dalle aree su cui il bot intende concentrarsi. In questo caso il testo è pubblicazioni scientifiche. Il testo specifico del dominio aiuta il modello di intelligenza artificiale a comprendere nuova terminologia e definizioni e lo introduce ai concetti scientifici di frontiera. Ancora più importante, questa serie curata di documenti consente al modello di intelligenza artificiale di fondare il proprio ragionamento utilizzando fatti attendibili.

    Per emulare il linguaggio umano naturale, i modelli di intelligenza artificiale vengono addestrati sul testo esistente, consentendo loro di apprendere la struttura del linguaggio, memorizzare vari fatti e sviluppare una sorta di ragionamento primitivo. Invece di riqualificare faticosamente il modello di intelligenza artificiale sul testo di nanoscienza, Yager gli ha dato la possibilità di cercare informazioni rilevanti in una serie curata di pubblicazioni. Fornirgli una libreria di dati rilevanti è stata solo metà della battaglia. Per utilizzare questo testo in modo accurato ed efficace, il bot avrebbe bisogno di un modo per decifrare il contesto corretto.

    "Una sfida comune con i modelli linguistici è che a volte 'allucinano' suoni plausibili ma cose false", ha spiegato Yager. "Questo è stato un problema fondamentale da risolvere per un chatbot utilizzato nella ricerca invece che per uno che fa qualcosa come scrivere poesie. Non vogliamo che falsifichi fatti o citazioni. Questo doveva essere affrontato. La soluzione a questo era qualcosa che abbiamo trovato." chiamiamo "incorporamento" un modo per classificare e collegare rapidamente le informazioni dietro le quinte."

    L'incorporamento è un processo che trasforma parole e frasi in valori numerici. Il "vettore di incorporamento" risultante quantifica il significato del testo. Quando un utente pone una domanda al chatbot, questa viene inviata anche al modello di incorporamento ML per calcolarne il valore vettoriale. Questo vettore viene utilizzato per effettuare ricerche in un database precalcolato di blocchi di testo di articoli scientifici incorporati in modo simile. Il bot utilizza quindi i frammenti di testo che trova semanticamente correlati alla domanda per ottenere una comprensione più completa del contesto.

    La query dell'utente e i frammenti di testo vengono combinati in un "prompt" che viene inviato a un modello linguistico di grandi dimensioni, un programma espansivo che crea testo modellato sul linguaggio umano naturale, che genera la risposta finale. L'incorporamento garantisce che il testo estratto sia rilevante nel contesto della domanda dell'utente. Fornendo porzioni di testo provenienti dal corpo di documenti attendibili, il chatbot genera risposte basate sui fatti e basate su fonti attendibili.

    "Il programma deve essere come un bibliotecario di riferimento", ha detto Yager. "Deve fare molto affidamento sui documenti per fornire risposte attendibili. Deve essere in grado di interpretare accuratamente ciò che le persone chiedono ed essere in grado di ricostruire in modo efficace il contesto di tali domande per recuperare le informazioni più rilevanti. Anche se le risposte potrebbero non essere essere ancora perfetto, è già in grado di rispondere a domande stimolanti e innescare alcune riflessioni interessanti durante la pianificazione di nuovi progetti e ricerche."

    Credito:Laboratorio nazionale di Brookhaven

    Bot che danno potere agli esseri umani

    CFN sta sviluppando sistemi AI/ML come strumenti che possono consentire ai ricercatori umani di lavorare su problemi più stimolanti e interessanti e di ottenere di più dal loro tempo limitato mentre i computer automatizzano attività ripetitive in background. Ci sono ancora molte incognite su questo nuovo modo di lavorare, ma queste domande sono l'inizio di importanti discussioni che gli scienziati stanno portando avanti proprio adesso per garantire che l'uso dell'IA/ML sia sicuro ed etico.

    "Ci sono una serie di compiti che un chatbot specifico per un dominio come questo potrebbe eliminare dal carico di lavoro di uno scienziato. Classificare e organizzare documenti, riassumere pubblicazioni, evidenziare informazioni rilevanti e aggiornarsi su una nuova area di attualità sono solo alcune delle potenzialità applicazioni", ha osservato Yager. "Tuttavia, sono entusiasta di vedere dove andrà a finire tutto questo. Non avremmo mai potuto immaginare dove siamo ora tre anni fa, e non vedo l'ora di sapere dove saremo tra tre anni."

    Per i ricercatori interessati a provare personalmente questo software, il codice sorgente del chatbot di CFN e gli strumenti associati possono essere trovati in questo repository GitHub.

    Ulteriori informazioni: Kevin G. Yager, Chatbot specifici per dominio per la scienza che utilizzano incorporamenti, Digital Discovery (2023). DOI:10.1039/D3DD00112A

    Fornito dal Brookhaven National Laboratory




    © Scienza https://it.scienceaq.com