I geochimici utilizzano i dati IEDA nelle loro ricerche e contribuiscono alla crescita dei suoi database. Credito:Osservatorio della Terra di Lamont-Doherty
La maggior parte dei database di ricerca sono strettamente focalizzati. Potrebbero contenere solo dati sismici di terremoti, Per esempio, o dati chimici da rocce vulcaniche. L'Interdisciplinary Earth Data Alliance (IEDA) si proponeva di creare un diverso tipo di esperienza di ricerca, e il risultato sta alimentando scoperte multidisciplinari rivoluzionarie in tutto il mondo.
Creato e gestito dagli scienziati del Lamont-Doherty Earth Observatory, IEDA riunisce diversi set di dati provenienti da tutta la geochimica e la geoscienza marina in un unico sistema. È importante sottolineare che fornisce gli strumenti che consentono agli scienziati di un'ampia gamma di campi di cercare ed esplorare facilmente le relazioni tra molti tipi diversi di dati.
"Questa è una nuova era di data mining, ", ha affermato il direttore dell'IEDA Kerstin Lehnert, un geochimico e Doherty Senior Research Scientist presso Lamont. Lehnert condurrà diverse sessioni per esplorare i progressi nella conservazione e archiviazione dei dati questa settimana al Fall Meeting dell'American Geophysical Union a San Francisco. Due di queste sessioni saranno trasmesse in diretta online.
"Attraverso IEDA, gli scienziati possono trovare i campioni naturali, la composizione, la geochimica dei campioni. Se hai bisogno di conoscere la struttura della crosta sotto quei campioni, puoi arrivare ai dati sismici. Puoi controllare se ci sono risultati sperimentali per la composizione chimica da vicino a queste rocce che possono dirti da dove provengono. Ci sono rocce datate? Dov'è la geocronologia in questa particolare area? I dati iniziano ad essere collegati in rete, e si riunisce in IEDA, " ha detto Lehnert.
Prima dell'IEDA, questi tipi di dati erano in gran parte inaccessibili, spesso memorizzati sui computer locali degli scienziati, nei loro quaderni di laboratorio, o frammentato nelle riviste scientifiche. Riunendo i dati in un formato facilmente ricercabile, IEDA ha creato un modo per consentire ai ricercatori di accedere rapidamente a migliaia di valori per l'analisi e il confronto. Due scienziati sono stati recentemente in grado di documentare un collegamento tra la geochimica della Terra profonda e un aumento dell'ossigeno nell'atmosfera terrestre scaricando 70, 000 campioni di geochimica delle rocce ignee continentali da IEDA. Trovare tutti i dati avrebbe richiesto anni prima che IEDA fosse creato.
"L'integrazione di diversi tipi di osservazioni e osservazioni fatte da molte regioni diverse al fine di ottenere una prospettiva globale è un modo potente per acquisire nuove intuizioni sui problemi della scienza, " ha affermato il Direttore Associato di IEDA Suzanne Carbotte, un geofisico marino e Bruce C. Heezen Lamont Research Professor.
Trasformare la scienza del 21° secolo
IEDA combina EarthChem, il più grande database geochimico del mondo, con il Marine Geoscience Data System, che serve dati per studi sui fondali marini e sui processi più profondi della crosta e del mantello.
Le immagini ad alta risoluzione del Marine Geoscience Data System forniscono viste dettagliate di montagne marine come queste e altre sezioni del fondale marino. Circa l'8% del fondale marino è stato mappato a una risoluzione di 100 metri come questa. Credito:GeoMapApp
EarthChem ha iniziato come database petrologico PetDB a Lamont nel 1996, quando i database relazionali stavano appena iniziando a essere sviluppati. Oggi comprende diversi database di partner e circa 400, 000 campioni e 20 milioni di valori analitici da tutta la geochimica, insieme agli strumenti per estrarre le collezioni. Il portale EarthChem si connette anche con altri grandi database, tra cui il tedesco GeoRock, un database in Giappone, e il database geochimico nazionale dell'indagine geologica degli Stati Uniti, consentendo agli utenti IEDA di eseguire ricerche in tutti questi principali database contemporaneamente.
Il Marine Geoscience Data System fa risalire le sue origini ai primi anni '90, quando l'oceanografo di Lamont Bill Ryan ha lanciato un database di dati di batimetria del fondale marino, il primo del suo genere, accessibile via web. Basandosi su questa prima risorsa, il Marine Geoscience Data System serve una vasta gamma di dati di geoscienza marina raccolti da navi di ricerca e altre piattaforme, compresi i dati fino al 1954. Include i dati di batimetria globale, immagini del fondale marino, dati sismici che forniscono viste in sezione trasversale sotto il fondo marino, così come altri dati multidisciplinari da una serie di programmi di ricerca nazionali.
Il sistema IEDA è anche equipaggiato in modo univoco per incorporare piccoli, set di dati di nicchia, che poi rende aperti e fruibili attraverso modalità interattive, interfacce basate su mappe e altri strumenti.
Uno degli obiettivi è la compilazione dei cosiddetti dati "long-tail":cosa fanno gli scienziati con i dati osservativi nei loro laboratori e come li analizzano.
"Molto di ciò che le persone fanno con diversi set di dati nei loro laboratori può essere molto innovativo, unico e nuovo, "ha detto Vicki Ferrini, un oceanografo che lavora con i dati di geofisica marina dell'IEDA. "Tutto esce attraverso pubblicazioni scientifiche, le interpretazioni ne escono, ma in realtà rendere i dati che supportano quelle pubblicazioni accessibili e riutilizzabili e in qualcosa su cui si può costruire è ciò che aspiriamo davvero a fare".
Comprendere le esigenze di dati degli scienziati
Parte del successo di IEDA deriva dagli stretti legami del suo team con la scienza. Lehnert, Carbotte, e molti dei membri del team di IEDA sono scienziati che conoscono intimamente i flussi di lavoro scientifici e il modo in cui gli scienziati cercano e analizzano i dati. Sanno di cosa hanno bisogno gli scienziati e come personalizzare le soluzioni e incorporare diversi tipi di risultati.
Oltre ai repository e agli strumenti di analisi, IEDA dispone di sistemi di identificazione che collegano i documenti pubblicati ai loro dati e campioni originali. L'apertura dei dati è fondamentale per la capacità degli scienziati di testare teorie e riprodurre i risultati, e i piani di gestione dei dati sono ora richiesti dalla National Science Foundation, che supporta IEDA. L'IEDA rende inoltre disponibili dati e campioni per il riutilizzo in modo che gli scienziati non debbano raccogliere di nuovo gli stessi tipi di dati dalla stessa posizione, risparmiando tempo e denaro.
"IEDA si basa sulla ricca eredità di Lamont di acquisire diversi dati multidisciplinari per affrontare questioni scientifiche che risalgono ai primi giorni di Doc Ewing e alle spedizioni globali delle navi Lamont, " disse Carbotte. Maurice "Doc" Ewing, direttore fondatore di Lamont, ordinò a tutte le spedizioni oceaniche di raccogliere sistematicamente diversi set di dati geoscientifici e oceanografici. Quando sono sorte nuove domande scientifiche, dati e campioni erano spesso lì per l'analisi.
"Stiamo mettendo a disposizione i dati, e le persone possono prendere i dati per tutto ciò di cui hanno bisogno, " ha detto Lehnert.
Questa storia è stata ripubblicata per gentile concessione dell'Earth Institute, Columbia University:blogs.ei.columbia.edu/