Il calorimetro ad alta granularità aggiornato, un componente del rivelatore CMS del Large Hadron Collider, produce immagini complicate di particelle generate da collisioni. I ricercatori stanno lavorando per implementare reti neurali a grafo per ottimizzare l'analisi di questi dati per identificare e caratterizzare meglio le interazioni delle particelle di interesse. Credito:Ziheng Chen, Northwestern University
Gli algoritmi di apprendimento automatico possono battere i videogiochi più difficili del mondo in pochi minuti e risolvere equazioni complesse più velocemente degli sforzi collettivi di generazioni di fisici. Ma gli algoritmi convenzionali faticano ancora a individuare i segnali di stop in una strada trafficata.
L'identificazione degli oggetti continua a ostacolare il campo dell'apprendimento automatico, specialmente quando le immagini sono multidimensionali e complicate, come quelli che i rivelatori di particelle prendono per le collisioni negli esperimenti di fisica delle alte energie. Però, una nuova classe di reti neurali sta aiutando questi modelli a potenziare le loro capacità di riconoscimento dei modelli, e la tecnologia potrebbe presto essere implementata in esperimenti di fisica delle particelle per ottimizzare l'analisi dei dati.
Quest'estate, I fisici del Fermilab hanno compiuto un progresso nel loro sforzo di incorporare reti neurali a grafo nei sistemi sperimentali. La scienziata Lindsey Gray ha aggiornato il software che consente di implementare questi algoritmi all'avanguardia sui dati del Large Hadron Collider del CERN. Per la prima volta, queste reti saranno integrate negli esperimenti di fisica delle particelle per elaborare direttamente i dati del rivelatore, aprendo le porte per un importante salto di efficienza che fornirà informazioni più precise dai rivelatori attuali e futuri.
"Quello che una settimana fa era solo un oggetto di ricerca è ora uno strumento ampiamente utilizzabile che potrebbe trasformare la nostra capacità di analizzare i dati da esperimenti di fisica delle particelle, " ha detto il grigio.
Il suo lavoro si concentra inizialmente sull'utilizzo di reti neurali a grafo per analizzare i dati dell'esperimento CMS all'LHC, uno dei quattro principali esperimenti di fisica delle particelle del collisore.
I programmatori sviluppano reti neurali per setacciare montagne di dati alla ricerca di una categoria o quantità specifica, ad esempio un segnale di stop in una foto di una strada affollata.
Le normali fotografie digitali sono essenzialmente una gigantesca griglia di rosso, pixel quadrati verdi e blu. Dopo essere stato addestrato a riconoscere l'aspetto di un segnale di stop, le reti neurali classiche ispezionano l'intero blocco di pixel per vedere se il target è presente o meno. Questo metodo è inefficiente, però, poiché i modelli devono elaborare molte cose irrilevanti, dati offuscati.
Gli scienziati informatici hanno sviluppato nuove classi di reti neurali per migliorare questo processo, ma gli algoritmi faticano ancora a identificare gli oggetti nelle immagini che sono più complesse di una semplice griglia bidimensionale di pixel quadrati.
Prendi molecole, Per esempio. Per determinare se una sostanza chimica è tossica o meno, i chimici devono individuare determinate caratteristiche come anelli di carbonio e gruppi carbossilici all'interno di una molecola. Le fotografie delle sostanze chimiche scattate con le macchine per la cromatografia a raggi X producono immagini 3D di atomi legati, che appaiono leggermente diversi ogni volta che vengono visualizzati.
Poiché i dati non sono memorizzati in una griglia quadrata, è difficile per le reti neurali tipiche imparare a identificare i composti tossici. Per aggirare questo, i chimici hanno iniziato a utilizzare una nuova serie di reti neurali:reti neurali a grafo, o GNN.
A differenza di queste tipiche reti neurali, Le GNN sono in grado di dire quali pixel sono collegati tra loro anche se non si trovano in una griglia 2D. Sfruttando i "bordi" tra i "nodi" di dati (in questo caso, i legami tra gli atomi), questi modelli di apprendimento automatico possono identificare i soggetti desiderati in modo molto più efficiente.
La visione di Gray è portare questi modelli e la loro identificazione avanzata del bersaglio per semplificare l'elaborazione dei dati per le collisioni di particelle.
"Con una rete neurale a grafo, puoi scrivere un algoritmo di riconoscimento dei modelli significativamente migliore da utilizzare per qualcosa di complesso come i dati dell'acceleratore di particelle perché ha la capacità di esaminare le relazioni tra tutti i dati in arrivo per trovare le parti più pertinenti di tali informazioni, " Egli ha detto.
Il rivelatore CMS del Large Hadron Collider prende miliardi di immagini di collisioni ad alta energia ogni secondo per cercare prove di nuove particelle. Le reti neurali dei grafici decidono rapidamente quali di questi dati conservare per ulteriori analisi. Credito:CERN
La ricerca di Gray si concentra sull'implementazione di GNN nel calorimetro ad alta granularità del rivelatore CMS, o HGCal. Il CMS prende miliardi di immagini di collisioni ad alta energia ogni secondo per cercare prove di nuove particelle.
Una sfida del calorimetro è che raccoglie così tanti dati - abbastanza immagini da riempire 20 milioni di iPhone al secondo - che la grande maggioranza deve essere gettata via a causa delle limitazioni nello spazio di archiviazione. I sistemi di trigger di HGCal devono decidere in pochi milionesimi di secondo quali parti dei dati sono interessanti e devono essere salvate. Il resto viene cancellato.
"Se disponi di una rete neurale che puoi ottimizzare per essere eseguita in un determinato periodo di tempo, allora puoi prendere queste decisioni in modo più affidabile. non ti mancano le cose, e non tieni cose di cui non hai veramente bisogno, " ha detto Kevin Pedro, un altro scienziato del Fermilab che lavora con Gray.
I rivelatori HGCal raccolgono molte informazioni diverse contemporaneamente sulle interazioni delle particelle, che produce alcune immagini molto complicate.
"Questi dati hanno una forma strana, hanno spazi vuoti casuali in loro, e non sono nemmeno lontanamente vicini a una griglia contigua di quadrati, "Ha detto Gray. "Ecco dove entrano in gioco i grafici, perché ti permettono di saltare tutte le cose senza senso."
In teoria, i GNN verrebbero addestrati ad analizzare le connessioni tra i pixel di interesse ed essere in grado di prevedere quali immagini dovrebbero essere salvate e quali possono essere cancellate in modo molto più efficiente e preciso. Però, perché questa classe di reti neurali è così nuova per la fisica delle particelle, non è ancora possibile implementarli direttamente nell'hardware del trigger.
La rete neurale del grafo si adatta bene all'HGCal in un altro modo:i moduli dell'HGCal sono esagonali, una geometria che, pur non essendo compatibile con altri tipi di reti neurali, funziona bene con le GNN.
"Questo è ciò che rende questo particolare progetto una svolta, " ha affermato Liz Sexton-Kennedy, Chief Information Officer di Fermilab. "Dimostra l'ingegnosità di Kevin e Lindsey:hanno lavorato a stretto contatto con i colleghi che hanno progettato il calorimetro, e hanno messo a frutto la loro esperienza unica nel software per estendere ulteriormente le capacità dell'esperimento".
Gray è anche riuscito a scrivere un codice che estende le capacità di PyTorch, un framework di machine learning open source ampiamente utilizzato, per consentire l'esecuzione in remoto di modelli di reti neurali a grafo su dispositivi in tutto il mondo.
"Prima di questo, è stato estremamente goffo e tortuoso costruire un modello e poi distribuirlo, " disse Gray. "Ora che è funzionante, invii semplicemente i dati al servizio, capisce come eseguirlo al meglio, e poi l'output ti viene rispedito."
Gray e Pedro hanno detto che sperano di avere le reti neurali grafiche funzionanti per il momento in cui la Run 3 di LHC riprenderà nel 2021. In questo modo, i modelli possono essere addestrati e testati prima dell'aggiornamento ad alta luminosità del collisore, le cui maggiori capacità di raccolta dati renderanno le GNN ancora più preziose.
Una volta che le reti sono attive e funzionanti in un unico posto, dovrebbe essere molto più facile farli funzionare in altri esperimenti in laboratorio.
"Puoi ancora applicare tutte le stesse cose che stiamo imparando sulle reti neurali a grafo nell'HGCal ad altri rivelatori in altri esperimenti, "Ha detto Gray. "La velocità con cui stiamo adottando l'apprendimento automatico nella fisica delle alte energie non è ancora nemmeno vicina alla saturazione. Le persone continueranno a trovare sempre più modi per applicarlo".