Il logo delle Olimpiadi LHC 2020. Credito:Gregor Kasieczka, Benjamin Nachman, David Shih
Nella ricerca di nuove particelle, i fisici possono basarsi su previsioni teoriche che suggeriscono alcuni buoni posti dove cercare e alcuni buoni modi per trovarli:è come ricevere uno schizzo approssimativo di un ago nascosto in un pagliaio.
Ma le ricerche alla cieca sono molto più complicate, come cacciare in un pagliaio senza sapere cosa stai cercando.
Per scoprire cosa gli algoritmi informatici convenzionali e gli scienziati possono trascurare nell'enorme volume di dati raccolti negli esperimenti di collisione di particelle, la comunità della fisica delle particelle si sta rivolgendo all'apprendimento automatico, un'applicazione dell'intelligenza artificiale che può insegnare a se stessa a migliorare le sue capacità di ricerca mentre setaccia un pagliaio di dati.
In una sfida di apprendimento automatico soprannominata le Olimpiadi del Large Hadron Collider (LHC) del 2020, un team di cosmologi del Lawrence Berkeley National Laboratory (Berkeley Lab) del Dipartimento dell'Energia degli Stati Uniti ha sviluppato un codice che identificava al meglio un segnale simulato nascosto nei dati simulati di collisione di particelle.
Cosmologi? Giusto.
"Era del tutto inaspettato per noi esibirci così bene, " ha detto George Stein, un ricercatore postdottorato Berkeley Lab e UC Berkeley che ha partecipato alla sfida con Uros Seljak, un cosmologo del Berkeley Lab, Professore dell'Università di Berkeley, e condirettore del Berkeley Center for Cosmological Physics, di cui Stein è membro.
Dieci squadre, composto principalmente da fisici delle particelle, partecipato alla gara, che si è svolto dal 19 novembre, 2019, al 12 gennaio, 2020.
Stein guidò l'adattamento di un codice che altri due studenti ricercatori avevano sviluppato sotto la direzione di Seljak. Il concorso è stato lanciato dagli organizzatori della conferenza Machine Learning for Jets 2020 (ML4Jets2020). I getti sono coni stretti di particelle prodotti in esperimenti di collisione di particelle che i fisici delle particelle possono risalire per misurare le proprietà delle loro sorgenti di particelle.
I risultati del concorso sono stati annunciati durante la conferenza, che si è tenuto alla New York University dal 15 al 17 gennaio.
Ben Nachman, un ricercatore post-dottorato del Berkeley Lab che fa parte di un gruppo che lavora su ATLAS, un grande rivelatore dell'LHC del CERN, è stato uno degli organizzatori di eventi e concorsi. David Shih, un professore di fisica e astronomia alla Rutgers University ora in un anno sabbatico al Berkeley Lab, e Gregor Kasieczka, professore all'Università di Amburgo in Germania, erano co-organizzatori.
Mentre alcune competizioni informatiche consentono ai partecipanti di inviare e testare i propri codici più volte per valutare se si stanno avvicinando ai risultati corretti, la competizione delle Olimpiadi LHC del 2020 ha dato alle squadre solo una possibilità per presentare una soluzione.
"La cosa bella è che non abbiamo usato uno strumento standard, " ha detto Seljak. "Abbiamo usato uno strumento che avevamo sviluppato per la nostra ricerca."
ha notato, "Nel mio gruppo abbiamo lavorato sull'apprendimento automatico senza supervisione. L'idea è che si desideri descrivere i dati in cui i dati non hanno etichette".
Lo strumento utilizzato dal team è chiamato trasporto ottimale iterativo affettato. "È una forma di apprendimento profondo, ma un modulo in cui non ottimizziamo tutto in una volta, " disse Seljak. "Invece, lo facciamo in modo iterativo, " per gradi.
Il codice è così efficiente che può essere eseguito su un semplice computer desktop o laptop. È stato sviluppato per un approccio statistico noto come prova bayesiana.
Seljak ha detto, "Supponiamo che tu stia osservando le anomalie nel tempo di transito di un pianeta, " il tempo necessario al pianeta per passare davanti a un oggetto più grande dal tuo punto di vista, come guardare dalla Terra mentre Mercurio si muove davanti al sole.
"Una soluzione richiede che ci sia un pianeta in più, " Egli ha detto, "e l'altra soluzione richiede una luna in più, e si adattano bene ai dati, ma hanno parametri molto diversi. Come posso confrontare queste due soluzioni?"
L'approccio bayesiano consiste nel calcolare le prove per entrambe le soluzioni e vedere quale soluzione ha una probabilità maggiore di essere vera.
"Questo tipo di esempio viene sempre, "Seljak ha detto, e il codice del suo team è progettato per velocizzare i calcoli complessi richiesti dai metodi convenzionali. "Stavamo cercando di migliorare qualcosa non correlato alla fisica delle particelle, e ci siamo resi conto che questo poteva essere utilizzato come strumento generale di apprendimento automatico".
Ha aggiunto, "La nostra soluzione è particolarmente utile per il cosiddetto rilevamento di anomalie:cercare segnali molto piccoli nei dati che sono in qualche modo diversi dagli altri dati".
Nella competizione delle Olimpiadi LHC 2020, i partecipanti hanno prima ricevuto una serie di dati campione che richiamava i dati del segnale delle particelle da alcuni dati di fondo, sia l'ago che il pagliaio, che consentivano ai partecipanti di testare i propri codici.
Poi hanno ricevuto i dati reali del concorso "scatola nera":solo il pagliaio. Avevano il compito di trovare un tipo diverso e completamente sconosciuto di segnale particellare nascosto nei dati di fondo, e per descrivere in modo specifico gli eventi segnale che i loro metodi hanno rilevato.
I co-organizzatori della competizione Shih e Nachman hanno notato che stavano lavorando personalmente su un metodo di rilevamento delle anomalie che utilizza un approccio molto simile (chiamato "stima della densità condizionata") alla tecnica sviluppata da Seljak e Stein che è stata inserita nella competizione.
Seljak e Stein si consultarono con un certo numero di fisici delle particelle del laboratorio, compreso Nachman, Shih, e lo studente laureato Patrick McCormack. hanno discusso, tra gli altri argomenti, come la comunità della fisica delle alte energie analizza in genere set di dati come quelli utilizzati nella competizione, ma per la vera sfida della "scatola nera" Seljak e Stein erano da soli.
Mentre la competizione volgeva al termine, Stein ha detto, "Pensavamo di aver trovato qualcosa circa una settimana prima della scadenza".
Stein e Seljak hanno presentato i loro risultati pochi giorni prima della conferenza, "ma poiché non siamo fisici delle particelle, non avevamo intenzione di partecipare alla conferenza, " disse Seljak.
Quindi, Stein ha ricevuto un'e-mail dagli organizzatori della conferenza, che gli ha chiesto di volare e presentare un discorso sulla soluzione del team più tardi quella settimana. Gli organizzatori non hanno condiviso i risultati della competizione fino a quando tutti i relatori non hanno presentato i loro risultati.
"Il mio discorso era originariamente il primo, e poi poco prima dell'inizio della seduta mi hanno spostato per ultimo. Non sapevo se fosse una buona cosa, " disse Stein.
Il codice inserito dal team di Berkeley Lab ha rilevato circa 1, 000 eventi, con un margine di errore di più o meno 200, e la risposta corretta è stata di 843 eventi. Il loro codice era il chiaro vincitore in quella categoria.
Diverse squadre sono state vicine nella stima del livello di energia, o "massa di risonanza, "del segnale, e il team del Berkeley Lab era il più vicino nella stima della massa di risonanza per un segnale secondario proveniente dal segnale principale.
Alla conferenza, Stein ha osservato, "C'era un enorme interesse per l'approccio generale che abbiamo adottato. Ha fatto scalpore".
Oz Amram, un altro concorrente in gara, scherzato in un post su Twitter, "Il risultato delle Olimpiadi di LHC... è che i cosmologi sono più bravi di noi nel nostro lavoro". Ma gli organizzatori del concorso non hanno annunciato formalmente un vincitore.
Nachman, uno degli organizzatori dell'evento, disse, "Anche se George e Uros hanno nettamente superato gli altri concorrenti, alla fine è probabile che nessun algoritmo copra tutte le possibilità, quindi avremo bisogno di un insieme diversificato di approcci per ottenere un'ampia sensibilità".
Ha aggiunto, "La fisica delle particelle è entrata in un momento interessante in cui ogni previsione per nuove particelle che abbiamo testato al Large Hadron Collider si è finora rivelata non realizzata in natura, tranne il modello standard della fisica delle particelle. Sebbene sia essenziale continuare il programma di ricerche basate su modelli, dobbiamo anche sviluppare un programma parallelo per essere indipendenti dal modello. Questa è la motivazione per questa sfida".
Seljak ha affermato che il suo team sta pianificando di pubblicare un documento che dettaglia il suo codice di apprendimento automatico.
"Stiamo sicuramente progettando di applicare questo a molti problemi di astrofisica, " ha detto. "Cercheremo applicazioni interessanti, qualsiasi cosa con glitch o transitori, qualcosa di anomalo. Lavoreremo per velocizzare il codice e renderlo più potente. Questi tipi di approcci possono davvero aiutare".