Credito:Georgia Institute of Technology
I big data e il data mining hanno fornito diverse scoperte in campi come l'informatica sanitaria, città intelligenti e marketing. Le stesse tecniche, però, non hanno prodotto risultati chiave coerenti per il cambiamento climatico.
Ci sono alcuni motivi per cui. Il principale è che il precedente lavoro di data mining nella scienza del clima, e in particolare nell'analisi delle teleconnessioni climatiche, ha fatto affidamento su metodi che offrono risposte "sì o no" piuttosto semplicistiche.
"Non è così semplice nel clima, "ha detto Annalisa Bracco, un professore alla School of Earth and Atmospheric Sciences della Georgia Tech. "Anche le connessioni deboli tra regioni molto diverse del globo possono derivare da un fenomeno fisico sottostante. L'imposizione di soglie e l'eliminazione di connessioni deboli fermerebbero tutto. Invece, l'esperienza di uno scienziato del clima è il passo chiave per trovare punti in comune tra set di dati o campi molto diversi per esplorare quanto siano robusti".
E con milioni di punti dati sparsi in tutto il mondo, Bracco ha affermato che i modelli attuali si basano troppo sull'esperienza umana per dare un senso all'output. Lei ei suoi colleghi volevano sviluppare una metodologia che dipendesse più dai dati reali piuttosto che dall'interpretazione di un ricercatore.
Ecco perché il team della Georgia Tech ha sviluppato un nuovo modo di estrarre i dati dai set di dati climatici che è più autonomo rispetto agli strumenti tradizionali. La metodologia fa emergere i punti in comune dei set di dati senza la stessa esperienza dell'utente, consentendo agli scienziati di fidarsi dei dati e ottenere risultati più solidi e trasparenti.
La metodologia è open source e attualmente disponibile per gli scienziati di tutto il mondo. I ricercatori della Georgia Tech lo stanno già utilizzando per esplorare la temperatura della superficie del mare e i dati del campo di nubi, due aspetti che incidono profondamente sul clima del pianeta.
"Ci sono così tanti fattori:dati cloud, aerosol e campi eolici, per esempio, che interagiscono per generare il clima e guidare il cambiamento climatico, " disse Atanasio Nenes, un altro professore di clima del College of Sciences sul progetto. "A seconda dell'aspetto del modello su cui ti concentri, possono riprodurre efficacemente le caratteristiche climatiche, o non riprodurle affatto. A volte è molto difficile dire se un modello è davvero migliore di un altro o se prevede il clima per le giuste ragioni".
Nenes afferma che la metodologia Georgia Tech considera tutto in modo più solido, rompere il collo di bottiglia tipico di altri algoritmi di valutazione e analisi del modello. La metodologia, lui dice, può essere utilizzato per osservazioni, e gli scienziati non hanno bisogno di sapere nulla sul codice e sui modelli del computer.
"La metodologia riduce la complessità di milioni di punti dati all'essenziale, a volte fino a 10 regioni che interagiscono tra loro, " ha affermato Nenes. "Abbiamo bisogno di strumenti che riducano la complessità dell'output del modello per comprenderli meglio e valutare se stanno fornendo i risultati corretti per le giuste ragioni".
Per sviluppare la metodologia, gli scienziati del clima hanno collaborato con Constantine Dovrolis e altri data scientist al College of Computing della Georgia Tech. Dovrolis ha affermato che è entusiasmante applicare il pensiero algoritmico e computazionale a problemi che colpiscono tutti in modi importanti, come il riscaldamento globale".
"La scienza del clima è una disciplina 'pesante di dati' con molte domande intellettualmente interessanti che possono trarre vantaggio dalla modellazione e dalla previsione computazionali, " disse Dovrolis, un professore della Scuola di Informatica, "Le collaborazioni interdisciplinari sono inizialmente impegnative:ogni disciplina ha il proprio linguaggio, approccio preferito e cultura della ricerca, ma alla fine possono essere piuttosto gratificanti."
La carta, "Fare progredire la scienza del clima con la scoperta della conoscenza attraverso il data mining, " è pubblicato in Scienze del clima e dell'atmosfera .