Le nuvole sono di tutte le forme e dimensioni, e ora un modello di deep learning può aiutare a rilevare i dettagli più fini nei dati cloud. Credito:Adriel Kloppenburg su Unsplash
I bambini sdraiati sulla schiena in un campo erboso potrebbero scrutare le nuvole alla ricerca di immagini, forse un soffice coniglio qui e un drago infuocato laggiù. Spesso, gli scienziati atmosferici fanno il contrario:cercano immagini di dati per le nuvole come parte della loro ricerca per comprendere i sistemi terrestri.
L'etichettatura manuale delle immagini dei dati pixel per pixel richiede molto tempo, così i ricercatori si affidano a tecniche di elaborazione automatica, come gli algoritmi di rilevamento delle nuvole. Ma l'output degli algoritmi non è esatto come vogliono gli scienziati.
Recentemente, i ricercatori del Pacific Northwest National Laboratory del Department of Energy si sono uniti per scoprire se il deep learning, un sottoinsieme distinto dell'apprendimento automatico, può fare un lavoro migliore nell'identificare le nuvole nei dati lidar rispetto agli attuali algoritmi basati sulla fisica. La risposta:un chiaro "sì". Il nuovo modello è molto più vicino alle risposte a cui arrivano gli scienziati, ma in una frazione del tempo.
Lidar è uno strumento di telerilevamento che emette un laser a impulsi e raccoglie il segnale di ritorno diffuso da goccioline di nuvole o aerosol. Questo segnale di ritorno fornisce informazioni sull'altezza e la struttura verticale delle caratteristiche atmosferiche, come nuvole o strati di fumo. Tali dati provenienti dai lidar terrestri sono una parte importante delle previsioni globali.
La scienziata della Terra Donna Flynn ha notato che, in alcuni casi, ciò che gli algoritmi rilevavano come nuvole nelle immagini lidar non corrispondeva bene a ciò che vedeva il suo occhio esperto. Gli algoritmi tendono a sovrastimare i confini del cloud.
"L'algoritmo attuale identifica le nuvole usando ampie pennellate, "dice Flynn, un co-investigatore principale del progetto. "Dobbiamo determinare in modo più accurato la parte superiore e la base reali del cloud e distinguere più livelli di cloud".
Aggiornamento avviato
Fino a poco tempo fa, reti neurali artificiali con potenza di calcolo limitata, un tipo di modello di apprendimento profondo, a un numero limitato di livelli di calcolo. Ora, con una maggiore potenza di calcolo disponibile tramite cluster di supercalcolo, i ricercatori possono utilizzare più calcoli, ciascuno basato sull'ultimo, in una serie di livelli. Più strati ha una rete neurale artificiale, più potente è la rete di deep learning.
Capire quali sono questi calcoli fa parte dell'addestramento del modello. Iniziare, i ricercatori hanno bisogno di immagini di dati lidar adeguatamente etichettate, o dati di "verità fondamentale", per l'addestramento e il test del modello. Così, Flynn ha passato molte ore a etichettare a mano le immagini pixel per pixel:nuvola o non nuvola. Il suo occhio può distinguere i confini della nuvola e la nuvola rispetto a uno strato di aerosol. Ha impiegato 40 ore, l'equivalente di un'intera settimana lavorativa, per etichettare circa 100 giorni di dati lidar raccolti presso l'osservatorio atmosferico delle Grandi Pianure Meridionali, parte della struttura per gli utenti della misurazione delle radiazioni atmosferiche del DOE, nell'Oklahoma.
Considerato quanto tempo e lavoro siano impegnativi per il processo di etichettatura manuale, Lo scienziato computazionale del PNNL e ricercatore co-principale Erol Cromwell ha utilizzato metodi di apprendimento che richiedevano dati minimi di verità sul terreno.
Il modello apprende attraverso l'auto-feedback. Confronta le proprie prestazioni con i risultati etichettati a mano e regola i propri calcoli di conseguenza, spiega Cromwell. Cicla attraverso questi passaggi, migliorando ogni volta.
Cromwell presenterà i risultati del team all'Institute of Electrical and Electronics Engineers Winter Conference on Applications of Computer Vision a gennaio.
Obiettivo raggiunto
Con la formazione, il modello di deep learning supera gli attuali algoritmi. La precisione del modello è quasi doppia e molto più vicina a quella che troverebbe un esperto umano, ma in una frazione del tempo.
I prossimi passi sono valutare le prestazioni del modello sui dati lidar raccolti in luoghi diversi e in stagioni diverse. I primi test sui dati dell'osservatorio ARM a Oliktok Point in Alaska sono promettenti.
"Un vantaggio del modello di deep learning è il transfer learning, " dice Cromwell. "Possiamo addestrare ulteriormente il modello con i dati di Oliktok per rendere le sue prestazioni più robuste".
"Ridurre le fonti di incertezza nelle previsioni dei modelli globali è particolarmente importante per la comunità scientifica dell'atmosfera, " dice Flynn. "Con la sua precisione migliorata, l'apprendimento profondo aumenta la nostra fiducia."
E aggiunge:"Inoltre, ci dà più tempo per stare fuori a guardare le nuvole vere!"