nastri magnetici, recuperato da bracci robotici, vengono utilizzati per la conservazione a lungo termine. Credito:Julian Ordan/CERN
Quest'anno il data center del CERN ha battuto il suo stesso record, quando ha raccolto più dati che mai.
Nel mese di ottobre 2017, il data center ha archiviato la colossale quantità di 12,3 petabyte di dati. Per contestualizzare questo, un petabyte equivale alla capacità di archiviazione di circa 15, 000 smartphone da 64 GB. La maggior parte di questi dati proviene dagli esperimenti del Large Hadron Collider, quindi questo record è un risultato diretto delle eccezionali prestazioni di LHC, il resto è costituito da dati di altri esperimenti e backup.
"Negli ultimi dieci anni, il volume di dati archiviato su nastro al CERN è cresciuto a un ritmo quasi esponenziale. Alla fine di giugno avevamo già superato un traguardo di archiviazione dei dati, con un totale di 200 petabyte di dati archiviati permanentemente su nastro, " spiega German Cancio, chi guida il nastro, sezione archivio e archiviazione backup nel dipartimento IT del CERN.
Il data center del CERN è il cuore dell'infrastruttura dell'Organizzazione. Qui vengono raccolti i dati di ogni esperimento al CERN, viene eseguita la prima fase della ricostruzione dei dati, e le copie di tutti i dati degli esperimenti vengono archiviate su nastro a lungo termine.
La maggior parte dei dati raccolti al CERN sarà archiviata per sempre, i dati fisici sono così preziosi che non verranno mai cancellati e devono essere conservati per le future generazioni di fisici.
"Una caratteristica importante dell'archivio dati del CERN è la sua longevità, " Aggiunge Cancio. "Anche dopo la fine di un esperimento tutti i dati registrati devono rimanere disponibili per almeno 20 anni, ma di solito più a lungo. Alcuni dei file di archivio prodotti dai precedenti esperimenti del CERN sono stati migrati su hardware diverso, generazioni di software e media da oltre 30 anni. Per archivi come il CERN, che non solo preservano i dati esistenti ma continuano anche a crescere, la nostra conservazione dei dati è particolarmente impegnativa."
Sebbene i nastri possano sembrare una modalità di archiviazione obsoleta, sono in realtà la tecnologia più affidabile ed economica per l'archiviazione su larga scala dei dati, e sono sempre stati utilizzati in questo campo. Una copia dei dati su nastro è considerata molto più affidabile della stessa copia su disco.
Il CERN gestisce attualmente il più grande archivio di dati scientifici nel dominio della fisica delle alte energie (HEP) e continua a innovare nell'archiviazione dei dati, " conclude Cancio.