Credito:International School of Advanced Studies (SISSA)
Le informazioni sono codificate nei dati. Questo è vero per la maggior parte degli aspetti della vita moderna, ma è vero anche nella maggior parte dei rami della fisica contemporanea, e l'estrazione di informazioni utili e significative da insiemi di dati molto grandi è una missione chiave per molti fisici.
Nella meccanica statistica, grandi set di dati sono affari quotidiani. Un classico esempio è la funzione di partizione, un oggetto matematico complesso che descrive sistemi fisici all'equilibrio. Questo oggetto matematico può essere visto come composto da molti punti, ognuno descrive un grado di libertà di un sistema fisico, cioè il numero minimo di dati che possono descrivere tutte le sue proprietà.
Un team interdisciplinare di scienziati dell'Abdus Salam International Center for Theoretical Physics (ICTP) e della Scuola Internazionale Superiore di Studi Avanzati (SISSA) ha dimostrato che una raccolta così massiccia di dati può essere analizzata, far emergere le proprietà fisiche fondamentali di un sistema sconosciuto.
Questi risultati sono stati evidenziati in un articolo appena pubblicato in Revisione fisica X , introducendo un nuovo punto di vista basato sui dati sulle transizioni di fase. Il team ha mostrato che una proprietà statistica generica di grandi insiemi di dati che descrivono un'ampia gamma di sistemi fisici all'equilibrio, nota come dimensione intrinseca, può infatti rivelare il verificarsi di una transizione di fase.
Gli autori del documento, coordinato da Marcello Dalmonte, ricercatore della Sezione Condensed Matter and Statistical Physics dell'ICTP e collaboratore della SISSA, provengono da contesti diversi. Tiago Mendes, un ex borsista post-dottorato all'ICTP e ora al Max Planck Institute for the Physics of Complex Systems, a Dresda, Germania, lavora principalmente in metodi numerici applicati alla meccanica statistica. Alex Rodriguez è un chimico, prima alla SISSA e ora all'ICTP, che lavora nell'implementazione di algoritmi di sistema complessi e nello sviluppo di metodi di machine learning. Xhek Turkeshi, un dottorato di ricerca studente alla SISSA, lavora principalmente in fisica statistica.
I ricercatori si sono concentrati su una proprietà statistica generica dei set di dati, chiamata dimensione intrinseca. Il modo più semplice per descrivere questa proprietà è come il numero minimo di variabili necessarie per rappresentare un dato set di dati, senza alcuna perdita di informazioni. "Prendere, Per esempio, tutte le persone del mondo, " spiega Rodriguez. "Questo è un insieme di dati da solo. Ora, se vuoi specificare la posizione delle persone nel mondo, in teoria, avresti bisogno delle coordinate di tutte le loro posizioni nello spazio, questo è, tre dati per ogni persona. Ma poiché possiamo approssimare la Terra come superficie bidimensionale, avremo solo bisogno di due parametri, questo è, la latitudine e la longitudine. Questa è la dimensione intrinseca:se il set di dati fosse l'umanità, la dimensione intrinseca sarebbe 2, non 3."
Nel contesto più teorico dei sistemi statistici, il lavoro mostra che questa proprietà di dimensione intrinseca può rivelare proprietà collettive delle funzioni di partizione alle transizioni di fase termiche. Ciò significa che, indipendentemente dal sistema in esame, i dati possono mostrare se e quando quel sistema sta attraversando una fase di transizione. Il team ha sviluppato un quadro teorico per spiegare perché i dati generici mostrano un comportamento così "universale", comune a un'ampia gamma di diverse transizioni di fase, dallo scioglimento del ghiaccio ai ferromagneti.
"Il lavoro introduce un nuovo punto di vista sulle transizioni di fase mostrando come la dimensione intrinseca rivela le corrispondenti transizioni strutturali nello spazio dei dati, "dicono gli scienziati, "quando il ghiaccio si scioglie, anche la sua struttura dei dati."
Ciò che è veramente nuovo in questo lavoro è che i dati grezzi rispecchiano il comportamento fisico dei sistemi in esame, e questo è importante per i fisici, in quanto consente loro di analizzare un sistema senza conoscere la fisica sottostante. Basta guardare i dati per vedere se c'è una transizione in corso nel sistema o meno, senza nemmeno sapere che tipo di transizione sia. "Potremmo dire che questo metodo è completamente agnostico, " dice Mendes. "Non è necessario conoscere a priori tutti i parametri del sistema; lavori solo con dati grezzi e vedi cosa ne viene fuori."
Dopo gli interessanti risultati ottenuti in questa ricerca, il team intende continuare a lavorare insieme nella stessa direzione, ampliando il proprio campo di analisi. Stanno già lavorando a un secondo documento, concentrandosi sulle cosiddette "transizioni di fase quantistiche", questo è, sistemi quantistici in cui le transizioni di fase avvengono a una temperatura uguale a zero e sono indotte da parametri esterni, come il campo magnetico.
In termini di applicazioni di questi risultati, le possibilità sono molte:da esperimenti con simulazioni al computer di sistemi quantistici a rami più fondamentali della fisica, come la cromodinamica quantistica, che potrebbe avere un impatto anche sulla fisica nucleare. "Un'interessante possibilità di applicazione è nell'uso di tecniche di fisica statistica per comprendere l'apprendimento automatico, " dice Rodriguez. "In questo tipo di ricerca, che va dall'informatica quantistica allo studio delle reti neurali per esempio, le transizioni di fase sono molto spesso coinvolte e potremmo provare a usare il nostro metodo per affrontare tutti questi tipi di problemi diversi".