Il nuovo modello offre una valutazione delle classifiche ispirata alla fisica

In (a) mostriamo una rete cresciuta in modo casuale con il grado di Poisson. In (b) mostriamo i margini posteriori per quattro nodi rappresentativi, colorati per abbinare (a), confrontando quelli ottenuti con il nostro metodo con i risultati esatti di un'enumerazione esaustiva. Nonostante la presenza di cicli brevi, il nostro approccio alla propagazione delle credenze si avvicina abbastanza ai margini, abbinando non solo i mezzi ma le forme di queste distribuzioni. Credito:Revisione fisica E (2022). DOI:10.1103/PhysRevE.105.L052303

Il mondo è pieno di classifiche e ordini. Si fanno vedere nel tennis, come negli Open di Francia, che terminano con la classifica finale dei campioni. Si manifestano nelle pandemie, come quando i funzionari della sanità pubblica possono registrare nuove infezioni e utilizzare il tracciamento dei contatti per tracciare reti di diffusione del COVID-19. Sistemi di concorrenza, conflitto e contagio possono dare origine a gerarchie.

Tuttavia, queste gerarchie vengono osservate a posteriori. Ciò rende difficile conoscere la vera classifica del sistema:chi era effettivamente il miglior giocatore? Chi ha contagiato chi? "Non puoi tornare indietro nel tempo e scoprire esattamente come è successo", afferma George Cantwell, borsista post-dottorato della SFI. Si potrebbe costruire un modello della rete e confrontare tutti i possibili risultati, ma un simile approccio di forza bruta diventa rapidamente insostenibile. Ad esempio, se stavi cercando di classificare un gruppo con solo 60 partecipanti, il numero di possibili permutazioni raggiunge il numero di particelle nell'universo conosciuto.

Per un recente articolo pubblicato su Physical Review E , Cantwell ha collaborato con il professor Cris Moore, informatico e matematico dell'SFI, per descrivere un nuovo modo di valutare le classifiche. Il loro obiettivo non era trovare una vera gerarchia, ma calcolare la diffusione di tutte le possibili gerarchie, ognuna ponderata per la sua probabilità.

"Eravamo disposti a non essere esattamente nel giusto, ma volevamo ottenere buone risposte con un certo senso di quanto fossero bravi", afferma Cantwell. Il nuovo algoritmo si ispira alla fisica:i ranghi sono modellati come entità interagenti che possono salire o scendere. Attraverso quella lente, il sistema si comporta quindi come un sistema fisico che può essere analizzato utilizzando i metodi della teoria dello spin glass.

Subito dopo l'inizio della pandemia di COVID-19, Cantwell e Moore hanno iniziato a pensare a modelli di come la malattia si diffonde attraverso una rete. Hanno subito riconosciuto la situazione come un problema di ordine che emerge nel tempo, non diversamente dalla diffusione di un meme sui social media o dall'emergere delle classifiche di campionato negli sport professionistici. "Come ordini le cose quando hai informazioni incomplete?" chiede Cantwell.

Hanno iniziato immaginando una funzione in grado di segnare una classifica sulla precisione. Ad esempio:una buona classifica sarebbe quella che concorda con i risultati degli incontri il 98% delle volte. Una classifica che concorda con i risultati solo il 10% delle volte sarebbe pessima, peggio di un lancio di monete senza alcuna conoscenza preliminare.

Un problema con le classifiche è che in genere sono discrete, il che significa che seguono i numeri interi:1, 2, 3 e così via. Tale ordinamento suggerisce che la "distanza" tra il primo e il secondo classificato è la stessa di quella tra il secondo e il terzo. Ma non è così, dice Cantwell. I migliori giocatori di un gioco, in tutto il mondo, saranno vicini in termini di abilità, quindi la differenza tra i migliori giocatori potrebbe essere più stretta di quanto sembri.

"Spesso vedi che i giocatori di rango inferiore possono battere quelli di rango più alto e l'unico modo in cui il modello può avere un senso e adattare i dati è schiacciare tutti i ranghi insieme", afferma Cantwell.

Cantwell e Moore hanno descritto un sistema che valuta le classifiche in base a un sistema di numerazione continuo. Una classifica potrebbe assegnare qualsiasi numero reale - numero intero, frazione, decimale ripetuto all'infinito - a un giocatore nella rete. "È più facile lavorare con i numeri continui", afferma Cantwell, e quei numeri continui possono ancora essere ricondotti a classifiche discrete.

Inoltre, questo nuovo approccio può essere utilizzato per prevedere qualcosa sul futuro, come l'esito di un torneo di tennis, e anche dedurre qualcosa sul passato, come la diffusione di una malattia. "Queste classifiche potrebbero dirci l'ordine delle squadre sportive dal migliore al peggiore. Ma potrebbero anche dirci l'ordine in cui le persone in una comunità sono state infettate da una malattia", afferma Moore. "Anche prima del suo post-dottorato, George stava lavorando su questo problema come un modo per migliorare il tracciamento dei contatti in un'epidemia. Proprio come possiamo prevedere quale squadra vincerà una partita, possiamo dedurre quale delle due persone ha infettato l'altra quando sono entrate in contatto tra di loro."

In un lavoro futuro, i ricercatori affermano che intendono indagare su alcune delle domande più profonde che sono emerse. Più di una classifica potrebbe essere d'accordo con i dati ma non essere d'accordo radicalmente con altre classifiche, ad esempio. Oppure una classifica che sembra errata può avere un'elevata incertezza ma non essere imprecisa. Cantwell afferma di voler anche confrontare le previsioni del modello con i risultati delle competizioni nel mondo reale. In definitiva, afferma, il modello potrebbe essere utilizzato per migliorare le previsioni in un'ampia gamma di sistemi che portano alle classifiche, dai modelli di malattie infettive alle scommesse sportive.

Cantwell dice che manterrà i suoi soldi, per ora. "Non sono ancora pronto per iniziare a scommettere su di esso", dice. + Esplora ulteriormente