• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Fisica
    Tecnologia a stato solido per big data nella fisica delle particelle

    Quando gli scienziati devono accedere ai file archiviati per eseguire analisi, un lungo braccio robotico scende dal soffitto, seleziona un nastro, e trasferisce i dati che memorizza su un disco rigido. Credito:Reidar Hahn, Fermilab

    Al Large Hadron Collider del CERN, fino a 40 milioni di collisioni di particelle si verificano nell'arco di un singolo secondo all'interno degli oltre 80 milioni di canali di rilevamento del rivelatore di particelle CMS. Queste collisioni creano un'enorme impronta digitale, anche dopo che i computer lo hanno selezionato per i dati più significativi. Il semplice atto di recuperare le informazioni può significare combattere i colli di bottiglia.

    Fisici CMS presso il Fermi National Accelerator Laboratory del Dipartimento dell'Energia degli Stati Uniti, che memorizza gran parte dei dati di LHC, stanno ora sperimentando l'uso di NVMe, o memoria non volatile express, tecnologia a stato solido per determinare il modo migliore per accedere ai file archiviati quando gli scienziati devono recuperarli per l'analisi.

    Il problema con i terabyte

    I risultati dell'esperimento CMS al CERN hanno il potenziale per aiutare a rispondere ad alcune delle più grandi domande aperte in fisica, ad esempio perché c'è più materia che antimateria nell'universo e se ci sono più di tre dimensioni fisiche.

    Prima che gli scienziati possano rispondere a tali domande, però, hanno bisogno di accedere ai dati di collisione registrati dal rilevatore CMS, gran parte del quale è stato costruito al Fermilab. L'accesso ai dati non è affatto un compito banale. Senza la potatura dei dati online, LHC genererebbe 40 terabyte di dati al secondo, abbastanza per riempire i dischi rigidi di 80 normali computer portatili. Un processo di selezione automatizzato mantiene solo gli elementi importanti, collisioni interessanti, tagliando il numero di eventi salvati da 40 milioni al secondo a solo 1, 000.

    "Ci interessa solo una frazione di quelle collisioni, quindi abbiamo una sequenza di criteri di selezione che decidono quali tenere e quali buttare via in tempo reale, ", ha affermato lo scienziato del Fermilab Bo Jayatilaka, chi sta guidando il progetto NVMe.

    Ancora, anche con potature selettive, decine di migliaia di terabyte di dati dal solo rilevatore CMS devono essere archiviati ogni anno. Non solo quello, ma per garantire che nessuna informazione vada mai persa o distrutta, devono essere salvate due copie di ogni file. Una copia è conservata nella sua interezza al CERN, mentre l'altra copia è divisa tra istituzioni partner in tutto il mondo. Fermilab è il principale impianto di stoccaggio designato negli Stati Uniti per l'esperimento CMS, con circa il 40% dei file di dati dell'esperimento archiviati su nastro.

    Una soluzione allo stato solido

    Il Feynman Computing Center del Fermilab ospita tre grandi librerie di dati piene di file e file di nastri magnetici che memorizzano i dati degli esperimenti del Fermilab, così come da CMS. Se dovessi unire tutta la capacità di archiviazione su nastro del Fermilab, avresti all'incirca la capacità di memorizzare l'equivalente di 13, 000 anni di filmati HD TV.

    "Abbiamo rack pieni di server che dispongono di dischi rigidi, e sono il supporto di memorizzazione principale su cui gli scienziati stanno effettivamente leggendo e scrivendo dati da e verso, "ha detto Jayatilaka.

    Ma i dischi rigidi, che sono stati utilizzati come dispositivi di archiviazione nei computer negli ultimi 60 anni, sono limitati nella quantità di dati che possono caricare nelle applicazioni in un determinato momento. Questo perché caricano i dati recuperandoli dai dischi rotanti, che è l'unico punto di accesso per tali informazioni. Gli scienziati stanno studiando modi per implementare nuovi tipi di tecnologia per accelerare il processo.

    A quello scopo, Fermilab ha recentemente installato un singolo rack di server pieno di unità NVMe a stato solido presso il suo Feynman Computing Center per accelerare le analisi della fisica delle particelle.

    Nel tentativo di accelerare le analisi nella ricerca in fisica delle alte energie, Fermilab ha recentemente installato un singolo rack di server pieno di unità a stato solido chiamato NVMe. Credito:Bo Jayatilaka, Fermilab

    In genere, le unità a stato solido utilizzano circuiti elettrici compatti per trasferire rapidamente i dati. NVMe è un tipo avanzato di unità a stato solido in grado di gestire fino a 4, 000 megabyte al secondo. Per metterlo in prospettiva, il disco rigido medio si limita a circa 150 megabyte al secondo, rendendo lo stato solido la scelta più ovvia se la velocità è il tuo obiettivo principale.

    Ma i dischi rigidi non sono ancora stati relegati all'antichità. Quello che gli manca in velocità, compensano in capacità di stoccaggio. Attualmente, il limite di archiviazione medio nelle unità a stato solido è di 500 gigabyte, che è la quantità minima di spazio di archiviazione che troverai comunemente disponibile sui moderni dischi rigidi. Determinare se il Fermilab debba o meno sostituire una maggiore quantità di memoria del proprio disco rigido con unità a stato solido richiederà quindi un'attenta analisi dei costi e dei benefici.

    Intraprendere un'analisi

    Quando i ricercatori analizzano i loro dati utilizzando server di computer di grandi dimensioni o supercomputer, in genere lo fanno recuperando in sequenza porzioni di tali dati dall'archiviazione, un'attività adatta per i dischi rigidi.

    "Fino ad ora, siamo riusciti a farla franca utilizzando i dischi rigidi nella fisica delle alte energie perché tendiamo a gestire milioni di eventi analizzando ogni evento uno alla volta, " ha detto Jayatilaka. "Così in un dato momento, stai chiedendo solo pochi dati da ogni singolo disco rigido."

    Ma le nuove tecniche stanno cambiando il modo in cui gli scienziati analizzano i loro dati. Apprendimento automatico, Per esempio, sta diventando sempre più comune nella fisica delle particelle, soprattutto per l'esperimento CMS, dove questa tecnologia è responsabile del processo di selezione automatizzato che mantiene solo la piccola frazione di data scientist interessati a studiare.

    Ma invece di accedere a piccole porzioni di dati, gli algoritmi di apprendimento automatico devono accedere ripetutamente allo stesso pezzo di dati, indipendentemente dal fatto che sia archiviato su un disco rigido o su un'unità a stato solido. Questo non sarebbe un grosso problema se ci fossero solo pochi processori che tentano di accedere a quel punto dati, ma nei calcoli di fisica delle alte energie, ci sono migliaia di processori che fanno a gara per accedere a quel punto dati contemporaneamente.

    Ciò può causare rapidamente colli di bottiglia e rallentare la velocità quando si utilizzano dischi rigidi tradizionali. Il risultato finale è tempi di calcolo più lenti.

    I ricercatori del Fermilab stanno attualmente testando la tecnologia NVMe per la sua capacità di ridurre il numero di questi colli di bottiglia dei dati.

    Il futuro dell'informatica al Fermilab

    L'archiviazione e la potenza di calcolo del Fermilab sono molto più di una semplice centrale elettrica per l'esperimento CMS. Lo sforzo di ricerca e sviluppo di CMS computing sta anche ponendo le basi per il successo del prossimo programma LHC ad alta luminosità e consente al mondo internazionale, Esperimento sui neutrini sotterranei profondi ospitato dal Fermilab, entrambi inizieranno a prendere dati alla fine degli anni '20.

    Jayatilaka e il lavoro del suo team consentiranno inoltre ai fisici di stabilire la priorità in cui devono essere principalmente posizionate le unità NVMe, sia presso il Fermilab che presso le strutture di stoccaggio di altre istituzioni partner di LHC.

    Con i nuovi server in mano, il team sta esplorando come implementare la nuova tecnologia a stato solido nell'infrastruttura informatica esistente al Fermilab.


    © Scienza https://it.scienceaq.com