• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Fisica
    Il nuovo modello di rete neurale artificiale supera MaxEnt nell'esempio del problema inverso

    Confronto delle funzioni spettrali di partenza A(ω) (linee continue) con il previsto Aˆ(ω) calcolato utilizzando l'approccio MaxEnt (linee tratteggiate punto arancione) e il modello ANN proposto (linee tratteggiate blu) a diversi livelli di rumore η per tre esempi di funzioni di densità spettrale non presenti nel set di dati di addestramento. I comportamenti di ANN sono buoni come MaxEnt a basso livello di rumore, ma si comportano molto meglio di MaxEnt ad alto livello di rumore. Credito:EPFL

    Simulazioni numeriche, generalmente basata su equazioni che descrivono un dato modello e su dati iniziali, vengono applicati in una gamma in continua espansione di discipline scientifiche per approssimare i processi in determinati punti nel tempo e nello spazio. Con i cosiddetti problemi inversi, mancano questi dati critici:i ricercatori devono ricostruire approssimazioni dei dati di input o del modello sottostante i dati osservabili per generare le previsioni desiderate.

    Sebbene le tecniche per farlo esistano già, sono mal definiti, incapace di assegnare interpretazioni o valori univoci a un dato punto. Come esempio, nel metodo più comunemente usato per risolvere tali problemi, il cosiddetto approccio di massima entropia (MaxEnt), la conoscenza pregressa viene aggiunta specificando una distribuzione predefinita che corrisponda ai risultati attesi in assenza di dati. L'algoritmo cerca in modo iterativo una distribuzione che massimizzi l'entropia rispetto a questa distribuzione predefinita, generando anche una funzione vicina ai dati esistenti. L'approccio include un parametro utilizzato per valutare l'importanza relativa tra l'entropia ei termini di errore. Esistono diversi metodi per risolverlo che spesso producono risultati diversi quando applicati nella pratica.

    Nel documento Artificial Neural Network Approach to the Analytic Continuation Problem, QuanSheng Wu, uno scienziato e Romain Fournier, uno studente di master al C3MP dell'EPFL, guidato dal professor Oleg Yazyev, e il collega Professor Lei Wang presso l'Istituto di Fisica dell'Accademia Cinese delle Scienze presentano un approccio di apprendimento supervisionato al problema. Basato su una rete neurale artificiale (ANN), altamente versatile grazie alla capacità di approssimare funzioni continue sotto ipotesi blande e grazie a potenti librerie che consentono l'implementazione efficiente di diverse architetture ANN che possono essere personalizzate per sfruttare le strutture dati, il nuovo sembra essere accurato quanto MaxEnt e notevolmente più economico dal punto di vista computazionale.

    In un primo test del framework ANN, i ricercatori hanno scelto di esaminare un sistema che ha una soluzione analitica, ma è difficile da risolvere usando MaxEnt, vale a dire, la funzione di correlazione temporale dell'operatore di posizione per un oscillatore armonico accoppiato linearmente ad un ambiente ideale. L'Hamiltoniano, o operatore generalmente corrispondente all'energia totale del sistema, è noto in questo caso, e i dati di interesse, la funzione di correlazione del tempo immaginario, possono essere generati da simulazioni di Monte Carlo quantistico (QMC).

    La soluzione analitica fornisce la relazione dello spettro di potenza con una funzione di correlazione tempo-immaginario e come tale fornisce dati di addestramento fisicamente rilevanti per il modello ANN. I ricercatori hanno addestrato la ANN con i dati generati e poi l'hanno testata ottenendo la funzione di correlazione del tempo immaginario calcolata nella fase precedente da QMC. Il modello addestrato sull'intero set di dati ha mostrato un accordo quasi perfetto con la soluzione analitica. MaxEnt non è riuscito a fornire risultati accurati, anche se i ricercatori hanno notato che probabilmente si sarebbero ottenuti risultati migliori calcolando la funzione di correlazione su un numero maggiore di punti.

    Per testare ulteriormente il modello in modo pratico, i ricercatori hanno cercato di recuperare la densità spettrale di una singola particella dell'elettrone nel dominio della frequenza reale dalla funzione di Green nel dominio del tempo immaginario. Mentre entrambi i modelli ANN e MaxEnt sono stati in grado di prevedere con precisione le funzioni spettrali iniziali per il livello di rumore più basso, MaxEnt tendeva a sopprimere i picchi nella funzione spettrale prevista con l'aumento del rumore nel sistema. Questi risultati mostrano che il modello ANN è versatile e robusto contro i dati rumorosi.

    Il nuovo metodo è anche computazionalmente più efficiente. La ANN ha consentito la mappatura diretta tra le funzioni di Green e le densità spettrali e può in questo senso risolvere direttamente il problema. MaxEnt invece è iterativo e genera funzioni di prova fino al raggiungimento della convergenza. Con l'impostazione computazionale utilizzata nel documento, il tempo necessario per convertire un dato numero di coppie a un dato livello di rumore è stato di 5 secondi nel caso di ANN rispetto ai 51 minuti che MaxEnt avrebbe avuto bisogno con la stessa configurazione.

    I ricercatori hanno affermato che è probabile che tali RNA siano in grado di risolvere altri problemi inversi, a condizione che i set di dati pertinenti, derivati, ad esempio, utilizzando i risultati sperimentali disponibili combinati con tecniche di aumento dei dati, possono essere costruiti. I modelli addestrati risultanti dal lavoro possono essere ottenuti da un repository pubblico su GitHub qui:github.com/rmnfournier/ACANN.


    © Scienza https://it.scienceaq.com