Immagine grafica del riutilizzo dei dati. Credito:Kroon-Batenburg et al.
Il tema sempre più popolare della deposizione di dati di diffrazione grezzi viene esaminato in una Topical Review in IUCrJ . Basandosi sul workshop del 2015 organizzato dal Diffraction Data Deposition Working Group (DDDWG) dell'IUCr, gli autori aggiornano la storia con resoconti di nuovi archivi di dati tematici e istituzionali, e delle crescenti pressioni politiche sulla gestione dei dati di ricerca come l'iniziativa European Open Science.
L'articolo è, però, più di un semplice resoconto del seminario o un'indagine sull'evoluzione della politica. Cerca di informare gli argomenti costi-benefici sulla deposizione dei dati di diffrazione con esempi tratti da una vera ricerca di prima linea. Per esempio, Kroon-Batenburg e Helliwell hanno collaborato a studi sul legame proteico dell'agente chemioterapico cisplatino, e hanno reso disponibili tutti i loro 34 set di dati grezzi attraverso la Data Library dell'Università di Manchester. Alcuni di questi set di dati sono stati rianalizzati e hanno portato a una nuova comprensione dei modelli cisplatino-lisozima.
La prospettiva di estrarre in questo modo ulteriori informazioni da insiemi di dati primari archiviati (o tramite le intuizioni di nuove paia di occhi o attraverso successivi miglioramenti nell'analisi del software) ha implicazioni per i database strutturali, facilitando l'idea del miglioramento continuo degli studi, come per i modelli di struttura macromolecolare (a lungo patrocinati da Terwilliger).
Non è solo nel campo della determinazione della struttura macromolecolare che queste considerazioni sono importanti. Una delle maggiori sfide per riutilizzare i dati grezzi è la necessità di metadati completi associati a qualsiasi set di dati grezzi, per consentirne la successiva interpretazione e piena valutazione.
Diverse commissioni IUCr stanno attivamente pubblicando i loro riassunti dei metadati essenziali che devono essere acquisiti insieme a tutti i set di dati sperimentali. Queste iniziative e la loro relazione con lo standard IUCr per la caratterizzazione dei dati (CIF, the Crystallographic Information Framework) sono esaminati all'interno dell'articolo. Ancora, vengono fornite indicazioni pratiche sui metadati essenziali che devono essere acquisiti insieme ai set di dati di diffrazione.
Sebbene vi siano segnali incoraggianti che la comunità scientifica si sta interessando in modo più informato alla gestione dei dati e al suo potenziale scientifico, nuove sfide vengono lanciate dalla strumentazione di ultima generazione, in grado di generare grandi quantità di dati a una velocità incredibile. Potrebbe non essere possibile archiviare o addirittura analizzare a fondo tutti i dati che vengono prodotti. Però, questo articolo aiuterà a fornire una profonda comprensione delle ragioni per cui la società dovrebbe investire sforzi e risorse per estrarre il maggior valore possibile dal diluvio di dati, in cristallografia come in ogni scienza.