Jiali Wang e Rao Kotamarthi, insieme a Prasanna Balaprakash, sono stati coautori dello sviluppo del modello geoscientifico incentrato sullo strato limite planetario. Credito:Laboratorio nazionale Argonne
Quando controlli le previsioni del tempo al mattino, i risultati che vedi sono molto probabilmente determinati dal modello Weather Research and Forecasting (WRF), un modello completo che simula l'evoluzione di molti aspetti del mondo fisico che ci circonda.
"Descrive tutto ciò che vedi fuori dalla tua finestra, " ha detto Jiali Wang, uno scienziato ambientale presso l'Argonne National Laboratory del Dipartimento dell'Energia degli Stati Uniti (DOE), "dalle nuvole, alla radiazione del sole, alla neve alla vegetazione, anche il modo in cui i grattacieli disturbano il vento."
La miriade di caratteristiche e cause del tempo e del clima sono accoppiate insieme, comunicando tra loro. Gli scienziati devono ancora descrivere completamente queste complesse relazioni con semplici, equazioni unificate. Anziché, approssimano le equazioni usando un metodo chiamato parametrizzazione in cui modellano le relazioni su una scala maggiore di quella dei fenomeni reali.
Sebbene le parametrizzazioni semplifichino la fisica in modo tale da consentire ai modelli di produrre risultati relativamente accurati in un tempo ragionevole, sono ancora computazionalmente costosi. Scienziati ambientali e scienziati computazionali di Argonne stanno collaborando per utilizzare reti neurali profonde, un tipo di apprendimento automatico, sostituire le parametrizzazioni di alcuni schemi fisici nel modello WRF, riducendo notevolmente i tempi di simulazione.
"Con modelli meno costosi, possiamo ottenere simulazioni a risoluzione più elevata per prevedere come i cambiamenti a breve e lungo termine nei modelli meteorologici influenzino la scala locale, " ha detto Wang, "anche fino a quartieri o infrastrutture critiche specifiche".
In un recente studio, gli scienziati si sono concentrati sullo strato limite planetario (PBL), o la parte più bassa dell'atmosfera. Il PBL è lo strato atmosferico che l'attività umana colpisce maggiormente, e si estende solo poche centinaia di metri sopra la superficie terrestre. La dinamica in questo strato, come la velocità del vento, profili di temperatura e umidità, sono fondamentali nel determinare molti dei processi fisici nel resto dell'atmosfera e sulla Terra.
Il PBL è un componente cruciale nel modello WRF, ma è anche uno dei meno costosi dal punto di vista computazionale. Questo lo rende un eccellente banco di prova per studiare come i componenti più complicati potrebbero essere migliorati allo stesso modo dalle reti neurali di deep learning.
"Abbiamo utilizzato 20 anni di dati generati dal computer dal modello WRF per addestrare le reti neurali e due anni di dati per valutare se potevano fornire un'alternativa accurata alle parametrizzazioni basate sulla fisica, " disse Prasanna Balaprakash, uno scienziato informatico e vincitore del DOE Early Career Award nella divisione Matematica e Informatica di Argonne e nell'Argonne Leadership Computing Facility (ALCF), una struttura per gli utenti dell'Office of Science del DOE.
Balaprakash ha sviluppato la rete neurale e l'ha addestrata ad apprendere una relazione astratta tra gli input e gli output alimentandola con più di 10, 000 punti dati (8 al giorno) da due località, uno in Kansas e uno in Alaska. Il risultato è stato un algoritmo che secondo gli scienziati potrebbe sostituire la parametrizzazione PBL nel modello WRF.
Gli scienziati hanno dimostrato che una rete neurale profonda che considera parte della struttura sottostante della relazione tra le variabili di input e output può simulare con successo le velocità del vento, temperatura e vapore acqueo nel tempo. I risultati mostrano anche che una rete neurale addestrata da una posizione può prevedere il comportamento in posizioni vicine con correlazioni superiori al 90% rispetto ai dati del test.
"La collaborazione tra gli scienziati del clima e gli scienziati informatici è stata cruciale per i risultati che abbiamo ottenuto, " disse Rao Kotamarthi, capo scienziato e capo dipartimento di scienze atmosferiche e ricerca climatica nella divisione Scienze ambientali di Argonne. "Incorporare la nostra conoscenza del dominio rende l'algoritmo molto più predittivo".
Gli algoritmi, chiamati reti neurali sensibili al dominio, che considerano le relazioni note non solo possono prevedere i dati ambientali in modo più accurato, ma richiedono anche l'addestramento di un numero significativamente inferiore di dati rispetto agli algoritmi che non considerano l'esperienza del dominio.
Qualsiasi progetto di machine learning richiede una grande quantità di dati di alta qualità, e non c'era carenza di dati per questo studio. Risorse di supercalcolo presso l'ALCF e il National Energy Research Scientific Computing Center, un DOE Office of Science User Facility presso il Lawrence Berkeley National Laboratory, contribuito alla produzione di oltre 300 anni (700 terabyte) di dati che descrivono il passato, il tempo e il clima presenti e futuri in Nord America.
"Questo database è unico per la scienza del clima ad Argonne, " ha detto Wang, "e lo stiamo usando per condurre ulteriori studi sull'apprendimento profondo e determinare come può essere applicato ai modelli climatici".
L'obiettivo finale degli scienziati è sostituire tutte le costose parametrizzazioni nel modello WRF con reti neurali di deep learning per consentire una simulazione più rapida ea più alta risoluzione.
Attualmente, il team sta lavorando per emulare la parametrizzazione della radiazione solare a onde lunghe e corte, due parti del modello WRF che insieme occupano quasi il 40% del tempo di calcolo della fisica nelle simulazioni.
I risultati dello studio sono stati pubblicati in un articolo intitolato "Fast domain-aware neural network emulation of a planetary boundary layer parameterization in a numeriche weather forecast model" il 10 ottobre in Sviluppo di modelli geoscientifici 12, 4261-4274, 2019.