L'apprendimento automatico cambia qualitativamente la ricerca di nuove particelle

Figura 1:Diagramma che illustra la costruzione di campioni misti per l'addestramento di un classificatore CWoLa debolmente supervisionato nella caccia all'urto. Nella ricerca ATLAS, la caratteristica risonante (mres) è la massa del dijet e le altre caratteristiche (y) sono le masse dei due getti. Credito:Collaborazione ATLAS/CERN

La collaborazione ATLAS al CERN sta esplorando nuovi modi per cercare nuovi fenomeni. Accanto a un vasto programma di ricerca spesso ispirato da modelli teorici specifici, che vanno dai buchi neri quantistici alla supersimmetria, i fisici stanno applicando nuovi metodi indipendenti dal modello per ampliare le loro ricerche. ATLAS ha appena rilasciato la prima ricerca indipendente dal modello di nuove particelle utilizzando una nuova tecnica chiamata "supervisione debole".

Le ricerche di nuove particelle iniziano in genere con un modello teorico specifico. Data la fenomenologia e i parametri del modello, i fisici simuleranno come nuove particelle verrebbero prodotte e decadono nel rivelatore ATLAS. Quindi simulano i processi in background del modello standard per sviluppare classificatori (con o senza machine learning) che separano i segnali dal background. Questi classificatori determinano la migliore regione dello spazio delle fasi dei dati da studiare, dove un segnale ipotetico dovrebbe essere arricchito. Finalmente, i fisici confronteranno i dati e la previsione di fondo alla ricerca di anomalie.

La nuova ricerca di ATLAS utilizza classificatori di apprendimento automatico (reti neurali) sviluppati direttamente sui dati al fine di ridurre la loro dipendenza da un modello specifico. Questo è un allontanamento significativo dai metodi standard perché i dati non sono etichettati:non è noto se un particolare evento di collisione protone-protone sia di fondo o di segnale. Questo metodo, noto come "supervisione debole", sfrutta le strutture nei dati senza bisogno di etichette per evento.

Accanto a questo metodo, la nuova ricerca ATLAS utilizza una delle più tradizionali strategie di rilevamento delle anomalie indipendenti dalla simulazione:la "caccia all'urto". L'obiettivo di una caccia all'urto è cercare un "urto" localizzato su uno sfondo liscio. Tali rigonfiamenti sono una caratteristica generica di molti modelli di nuove particelle, dove avviene l'urto sulla massa della nuova particella. La nuova ricerca si basa su queste solide basi per migliorare la sensibilità a un'ampia varietà di particelle ipotetiche senza specificarne le proprietà in anticipo.

La combinazione di bump hunting e supervisione debole si traduce in un'analisi che è per lo più priva di dipendenza dal modello di segnale e dal modello di fondo.

Figura 2:L'output della rete neurale in un contenitore di massa dijet. Come funzione bidimensionale, l'output può essere facilmente visualizzato come un'immagine, dove l'intensità corrisponde all'efficienza dell'uscita di rete nel contenitore di massa dijet. Il grafico di sinistra non ha alcun segnale iniettato e il grafico di destra mostra l'output quando ai dati viene aggiunta un'ipotetica particella a 3 TeV che decade in altre due particelle a 200 GeV. Credito:Collaborazione ATLAS/CERN

Rilevamento di anomalie con supervisione debole

I fisici di ATLAS hanno addestrato le reti neurali sui dati utilizzando una tecnica chiamata "Classificazione senza etichette" (CWoLa, pronunciato "Koala"). In questo approccio, i fisici costruiscono due set di dati misti composti da background e potenzialmente anche da segnale. Questi sono identici tranne che per le proporzioni relative del segnale potenziale. Mentre le etichette segnale-sfondo sono sconosciute per ogni evento, le reti neurali possono essere addestrate per differenziare i due set di dati. Con dati sufficienti e un classificatore abbastanza potente, questo è in realtà ottimale per distinguere il segnale dallo sfondo.

Il metodo CWoLa è combinato con una caccia agli urti durante la creazione dei set di dati misti sopra, come mostrato in Figura 1. Gli eventi di segnale sarebbero caratterizzati da una regione di risonanza localizzata e da una regione in banda laterale. Queste regioni avrebbero altre caratteristiche (y) che possono essere utilizzate anche per addestrare le reti neurali. Se non c'è segnale, una rete neurale non apprenderebbe nulla e se c'è un segnale, potrebbe imparare a distinguerlo sullo sfondo.

La nuova ricerca ATLAS è la prima applicazione del rilevamento delle anomalie potenziato dall'apprendimento automatico completamente guidato dai dati. La ricerca ha esaminato eventi con stati finali adronici, utilizzando la massa invariante di coppie di "getti" di particelle come caratteristica risonante e le masse dei singoli getti come caratteristiche per addestrare il classificatore CWoLa. Utilizzando questo insieme limitato di funzionalità, i fisici hanno stabilito con successo la procedura e hanno scoperto che è già sensibile a un'ampia gamma di nuove particelle.

I fisici sono stati in grado di addestrare le reti neurali evitando un fattore di prove statistiche che ridurrebbe la sensibilità della ricerca dall'addestramento e dai test sugli stessi dati. La rete neurale (Figura 2) è mappata a un'efficienza. Per esempio, 10% significa che il 90% degli eventi ha un output di rete inferiore a questo valore. In assenza di segnale, la rete non dovrebbe apprendere nulla (poiché i due set di dati misti dovrebbero essere uguali), ma ci deve essere una regione di bassa efficienza in base alla progettazione. Il grafico di destra della Figura 2 mostra che la rete è in grado di identificare il segnale iniettato, anche se non è stato detto dove cercare in anticipo!

Figura 3:Segnali particolari vengono simulati e poi aggiunti ai dati per impostare dei limiti. I modelli qui scelti rappresentano una particella pesante A (con una massa di 3 TeV) che decade in altre due nuove particelle B e C con masse scritte sull'asse orizzontale. L'asse verticale è il limite - i numeri più bassi indicano limiti più forti. La nuova ricerca viene confrontata con due risultati esistenti di ATLAS:la ricerca inclusiva dijet (triangoli rossi) e una ricerca dedicata per i getti prodotti dai bosoni W e Z (croce grigia). Credito:Collaborazione ATLAS/CERN

Fornire nuova precisione

La nuova ricerca non ha portato a prove significative per nuove particelle e quantificare ciò che non è stato trovato è stata una vera sfida. Generalmente, i fisici possono semplicemente chiedere quanto segnale dovrebbe essere aggiunto per registrare un eccesso significativo, e quindi quella quantità di segnale viene dichiarata esclusa in quanto non si è riscontrata alcuna eccedenza. Il raggiungimento di esclusioni simili per questa analisi ha richiesto il riaddestramento di tutte le reti neurali per ogni tipo di segnale modellato e quantità di segnale.

I limiti risultanti sono presentati nella Figura 3. La produzione di questo grafico ha richiesto una formazione di circa 20, 000 reti neurali! Alcuni segnali erano più difficili da trovare per le reti neurali rispetto ad altri, con quelli in regioni con molto background che si rivelano particolarmente impegnativi. Per altri segnali, i nuovi limiti sono più forti dei limiti precedenti e migliorano le ricerche precedenti in uno spazio delle fasi simile.

Guardando al futuro

Questo nuovo approccio adottato da ATLAS ha molte possibilità di estensione. La caccia agli urti debolmente supervisionata potrebbe essere applicata a ulteriori topologie di eventi e potrebbero essere aggiunte ulteriori funzionalità per ampliare la sensibilità a nuove particelle. Potrebbero essere necessarie reti neurali più complesse per ospitare spazi di funzionalità di dimensioni più elevate e ciò richiederà risorse computazionali impegnative. I fisici di ATLAS stanno anche prendendo in considerazione una varietà di tecniche alternative di rilevamento delle anomalie, che potrebbe essere in grado di completare la ricerca basata su CWoLa. È probabile che nessun metodo copra tutto:saranno necessari più approcci per garantire un'ampia robusto, e forte sensibilità alle nuove particelle.

Utilizzo della turbolenza della luce per generare pettini di frequenza da piccoli laser ad anello

Un nuovo modo per studiare come gli elementi si mescolano nelle profondità dei pianeti giganti

Fisica