• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  Science >> Scienza >  >> Fisica
    Domande e risposte:l'esperto spiega la fisica dell'intelligenza artificiale
    Azioni di apprendimento dai dati. Osserviamo un sistema fisico di gradi di libertà interagenti (punti grigi), le cui precise interazioni sono sconosciute (aree ombreggiate). Addestriamo una rete neurale sulle misurazioni del sistema. La rete apprende in modo non supervisionato una stima della distribuzione dei dati di addestramento. Estraiamo l'azione dai parametri di rete strato per strato, utilizzando un linguaggio diagrammatico. I coefficienti dell'azione finale A (k) rappresentano le interazioni apprese (nodi rosa). Credito:Revisione fisica X (2023). DOI:10.1103/PhysRevX.13.041033

    Lo sviluppo di una nuova teoria è tipicamente associato ai grandi della fisica. Potresti pensare ad Isaac Newton o Albert Einstein, per esempio. Molti premi Nobel sono già stati assegnati per nuove teorie.



    I ricercatori del Forschungszentrum Jülich hanno ora programmato un'intelligenza artificiale che ha superato anche questa impresa. La loro intelligenza artificiale è in grado di riconoscere modelli in set di dati complessi e di formularli in una teoria fisica. I risultati sono pubblicati sulla rivista Physical Review X .

    Nella seguente intervista, il Prof. Moritz Helias dell'Istituto per la simulazione avanzata (IAS-6) del Forschungszentrum Jülich spiega in cosa consiste la "Fisica dell'intelligenza artificiale" e in che misura differisce dagli approcci convenzionali.

    Come fanno i fisici a elaborare una nuova teoria?

    Di solito si inizia con l'osservazione del sistema prima di tentare di proporre come i diversi componenti del sistema interagiscono tra loro per spiegare il comportamento osservato. Da ciò vengono poi derivate nuove previsioni e messe alla prova.

    Un esempio ben noto è la legge di gravitazione di Isaac Newton. Non solo descrive la forza gravitazionale sulla Terra, ma può anche essere utilizzato per prevedere i movimenti di pianeti, lune e comete, nonché le orbite dei moderni satelliti, in modo abbastanza accurato.

    Tuttavia, il modo in cui tali ipotesi vengono raggiunte è sempre diverso. Puoi iniziare con i principi generali e le equazioni fondamentali della fisica e da essi derivare l'ipotesi, oppure puoi scegliere un approccio fenomenologico, limitandoti a descrivere le osservazioni nel modo più accurato possibile senza spiegarne le cause. La difficoltà sta nel selezionare un buon approccio tra i numerosi approcci possibili, adattandolo se necessario e semplificandolo.

    Che approccio stai adottando con l'intelligenza artificiale?

    In generale, si tratta di un approccio noto come "fisica per l'apprendimento automatico". Nel nostro gruppo di lavoro utilizziamo metodi fisici per analizzare e comprendere il complesso funzionamento di un'intelligenza artificiale.

    La nuova idea cruciale sviluppata da Claudia Merger del nostro gruppo di ricerca è stata quella di utilizzare innanzitutto una rete neurale che impara a mappare accuratamente il comportamento complesso osservato in un sistema più semplice. In altre parole, l’intelligenza artificiale mira a semplificare tutte le complesse interazioni che osserviamo tra i componenti del sistema. Utilizziamo quindi il sistema semplificato e creiamo una mappatura inversa con l'intelligenza artificiale addestrata. Ritornando dal sistema semplificato a quello complesso, svilupperemo poi la nuova teoria.

    Sulla via del ritorno, le interazioni complesse vengono costruite pezzo per pezzo da quelle semplificate. In definitiva, l’approccio non è quindi così diverso da quello di un fisico, con la differenza che il modo in cui vengono assemblate le interazioni viene ora letto dai parametri dell’IA. Questa prospettiva sul mondo, che lo spiega attraverso le interazioni tra le sue varie parti che seguono determinate leggi, è la base della fisica, da qui il termine "fisica dell'intelligenza artificiale".

    In quali applicazioni è stata utilizzata l'intelligenza artificiale?

    Ad esempio, abbiamo utilizzato un set di dati di immagini in bianco e nero con numeri scritti a mano, che viene spesso utilizzato nella ricerca quando si lavora con le reti neurali. Nell'ambito della sua tesi di dottorato, Claudia Merger ha studiato come le piccole sottostrutture nelle immagini, come i bordi dei numeri, siano costituite dalle interazioni tra i pixel. Si trovano gruppi di pixel che tendono ad essere più luminosi insieme e quindi contribuiscono alla forma del bordo del numero.

    Quanto è elevato lo sforzo computazionale?

    L’uso dell’intelligenza artificiale è un trucco che rende possibili i calcoli in primo luogo. Raggiungi molto rapidamente un numero molto elevato di possibili interazioni. Senza usare questo trucco, potresti guardare solo sistemi molto piccoli. Tuttavia, lo sforzo computazionale è ancora elevato, poiché ci sono molte interazioni possibili anche in sistemi con molti componenti.

    Tuttavia, possiamo parametrizzare in modo efficiente queste interazioni in modo da poter ora visualizzare sistemi con circa 1.000 componenti interagenti, ovvero aree di immagine con un massimo di 1.000 pixel. In futuro, attraverso un'ulteriore ottimizzazione, dovrebbero essere possibili anche sistemi molto più grandi.

    In cosa differisce questo approccio da altri IA come ChatGPT?

    Molte IA mirano ad apprendere una teoria dei dati utilizzati per addestrare l'IA. Tuttavia, le teorie apprese dalle IA di solito non possono essere interpretate. Invece, sono implicitamente nascosti nei parametri dell’IA addestrata. Al contrario, il nostro approccio estrae la teoria appresa e la formula nel linguaggio delle interazioni tra i componenti del sistema, che è alla base della fisica.

    Appartiene quindi al campo dell'IA spiegabile, in particolare alla "fisica dell'IA", poiché utilizziamo il linguaggio della fisica per spiegare ciò che l'IA ha imparato. Possiamo utilizzare il linguaggio delle interazioni per costruire un ponte tra il complesso funzionamento interno dell'IA e le teorie comprensibili agli esseri umani.

    Ulteriori informazioni: Claudia Merger et al, Apprendimento di teorie interagenti dai dati, Revisione fisica X (2023). DOI:10.1103/PhysRevX.13.041033

    Fornito da Forschungszentrum Juelich




    © Scienza https://it.scienceaq.com