Credito:John Innes Center
un libero, Il team di John Innes Center Informatics ha ideato un kit di strumenti open source per aiutare i ricercatori a gestire il sovraccarico della gestione dei dati.
La cassetta degli attrezzi, chiamato "dtool, " è una suite di software per la gestione dei dati scientifici e per renderli accessibili ai ricercatori in prima linea che lavorano in più aree di progetto.
Funziona impacchettando dati e metadati - informazioni che identificano i dati - in pratiche scatole o set di dati.
Questi pacchetti autonomi di dati e metadati semplificano lo spostamento dei set di dati e la creazione di copie di backup remote.
Gli strumenti funzionano sia con i file system tradizionali che con le opzioni cloud come Amazon S3 e Microsoft Azure, consentendo ai ricercatori di scegliere la soluzione di archiviazione più adatta alle proprie esigenze e budget.
Il sistema consente ai ricercatori di trovare rapidamente set di dati di interesse senza il mal di testa di dover accedere e mantenere un database centrale. I metadati confezionati possono essere utilizzati per verificare l'integrità dei dati nella scatola.
Il team del John Innes Center delinea i vantaggi di dtool in un articolo pubblicato su PeerJ - Journal of Life and Environmental Sciences.
Dicono che il toolkit offra tranquillità perché i ricercatori sanno che i dati alla base dei risultati scientifici sono sicuri, ricercabile e accessibile in un ambiente di ricerca altamente distribuito come il John Innes Centre.
Dott. Tjelvar Olsson, Senior Scientific Data and Infrastructure Manager presso il John Innes Centre, chi è uno dei creatori del sistema, ha dichiarato:"Al John Innes Center abbiamo 40 diversi gruppi di ricerca che si occupano di enormi volumi di tutti i tipi di dati.
"Vogliamo che più persone utilizzino dtool per gestire i propri dati. Lo abbiamo progettato in modo da adattarsi al loro modo di lavorare, un peso leggero, soluzione utilizzata in un modo minimale che si colloca al di sopra di ciò che stanno già facendo."
Uno dei primi ad adottare dtool è il team del Dr. Brande Wulff che lavora sulla resistenza alle malattie nel grano presso il John Innes Centre.
I progressi nelle tecnologie come il sequenziamento genetico e la biologia dei sistemi computazionali hanno contribuito a un'esplosione dei volumi e dei tipi di dati. Sebbene ciò abbia portato a importanti progressi nella scienza delle piante e dei microbi, ha portato a sfide sostanziali nella gestione e nell'elaborazione dei dati per i ricercatori in prima linea.
Dott. Matthew Hartley, Capo del team informatico del JIC, che ha contribuito a ideare dtool, ha detto che l'impatto si stava già facendo sentire.
"La gestione dei dati su larga scala è una delle maggiori sfide nella ricerca biologica computazionale. dtool ha reso la memorizzazione dei nostri dati più economica, ci ha dato tranquillità e ha accelerato la nostra ricerca.".
"Gestione dati leggera con dtool" è pubblicato in PeerJ .