Un evento di collisione registrato da CMS nel 2012 che mostra un "candidato Higgs", disponibile sul portale CERN Open Data con l'ultima versione di CMS Open Data. Credito:Tom McCauley/CMS/CERN
La CMS Collaboration al CERN ha appena reso pubblico circa la metà dei dati raccolti nel 2012 dal rivelatore CMS del Large Hadron Collider. Questa versione include i set utilizzati per scoprire il bosone di Higgs, ed è condiviso attraverso il portale Open Data del CERN.
Questa è la terza versione di CMS Open Data di alto livello, a seguito della pubblicazione dei dati 2010 nel 2014, e dati del 2012 nel 2016. Questo batch contiene più di 550 terabyte di dati di collisione protone-protone registrati a un'energia del centro di massa di 8 TeV e circa 510 terabyte di dati di simulazione Monte Carlo.
I dati di LHC sono complicati e grandi. I ricercatori CMS hanno registrato petabyte di dati dalle collisioni all'LHC e finora hanno pubblicato centinaia di articoli scientifici con loro. Rilasciando i dati nel pubblico dominio, i ricercatori al di fuori della CMS Collaboration hanno l'opportunità di condurre nuove ricerche con loro.
"I nostri dati sono un elemento importante della ricca eredità scientifica della CMS Collaboration, " afferma il portavoce di CMS, Joel Butler. "Vorremmo assicurarci che non solo siano conservati a lungo termine, ma siano anche disponibili al pubblico, in modo che sia i membri del CMS che i ricercatori esterni possano riesaminarli in futuro. Questo fa parte del nostro impegno per l'apertura e la conservazione dei dati a lungo termine".
Animazione che mostra un evento "candidato Higgs", registrato da CMS nel 2012 e disponibile sul portale CERN Open Data con l'ultima versione di CMS Open Data. Credito:Tom McCauley e Achintya Rao CMS/CERN
Recentemente, i primi due di questi documenti di ricerca sono stati pubblicati da un team di teorici del MIT interessati a eseguire una misurazione che gli stessi scienziati CMS non avevano fatto:nello specifico volevano misurare particolari sottostrutture in gruppi di particelle note come "getti" prodotte in collisioni protone-protone.
L'ultima versione di CMS Open Data offre anche l'affascinante possibilità di consentire alle persone di ripetere l'analisi che ha portato alla scoperta di Higgs studiando gli stessi dati utilizzati dagli scienziati CMS per annunciare l'esistenza della particella nel 2012. Come prova del concetto, Il dottorando CMS Nur Zulaiha Jomhari ha analizzato CMS Open Data e ha prodotto grafici simili ad alcuni di quelli mostrati quando è stata annunciata la scoperta di Higgs. Questa analisi è molto meno sofisticata di quella ufficiale del CMS e non viene esaminata dalla più ampia comunità di esperti CMS, ma dimostra il potenziale di CMS Open Data.
A sinistra:la trama ufficiale del CMS per il canale "Higgs a quattro leptoni", mostrato il giorno dell'annuncio della scoperta di Higgs. A destra:una trama simile prodotta da Nur Zulaiha Jomhari et al. utilizzando CMS Open Data dal 2011 e 2012. Sebbene i grafici appaiano simili, l'analisi con CMS Open Data utilizza più dati (a 8 TeV e complessivi) rispetto a quella ufficiale CMS dalla scoperta originale, ma è molto meno sofisticata e non viene esaminata dalla più ampia comunità di esperti CMS. Credito:CMS/CERN
Oltre ai set di dati stessi, il team CMS Data Preservation and Open Data ha anche raccolto una raccolta completa di materiali supplementari, incluso codice di esempio per eseguire analisi relativamente semplici, così come metadati come informazioni su come sono stati selezionati i dati e quali erano le condizioni di funzionamento dell'LHC durante il periodo di raccolta dei dati.
Al momento, CMS si è impegnata a rilasciare fino al 50% dei dati registrati di ogni anno pochi anni dopo la loro raccolta, una volta che gli scienziati CMS hanno terminato la maggior parte della loro analisi di questi set di dati. "Vedere i nostri dati aperti in uso al di fuori del CMS è stato molto gratificante, "dice Kati Lassila-Perini, il coordinatore del CMS per la conservazione dei dati e l'accesso aperto. "È stata una grande motivazione per noi e non vediamo l'ora di continuare i nostri sforzi pionieristici per rilasciare dati aperti di qualità per la ricerca dall'LHC negli anni a venire".