L'approccio INLA sviluppato da Rue e colleghi è stato utilizzato nel Malaria Atlas Project (MAP), che si diffonde gratuitamente, preciso, informazioni aggiornate sulla malaria, mira a limitare la diffusione della malattia. Credito:MALARIA ATLAS PROJECT
Gli strumenti sviluppati da Håvard Rue hanno trasformato l'analisi dei dati, interpretazione e comunicazione, e sono applicati in modo ampio:dalla modellizzazione della diffusione delle malattie infettive alla mappatura degli stock ittici.
La statistica è la scienza dell'apprendimento dai dati, con gli statistici che forniscono preziose informazioni sui problemi più urgenti che l'umanità deve affrontare, come gli impatti sulla salute dell'inquinamento alla diffusione di malattie infettive.
I ricercatori devono comprendere le statistiche se vogliono prendere decisioni informate.
"Fornire gli strumenti agli scienziati per comprendere meglio i problemi del mondo reale significa che i responsabili delle politiche hanno accesso a dati affidabili per prendere decisioni importanti che influenzano molti aspetti della vita, dalla salute e dall'ambiente all'economia e alle questioni sociali, " spiega il professore di statistica KAUST Håvard Rue.
Rue è un pioniere nel campo della statistica bayesiana computazionale, un metodo che applica le probabilità ai problemi statistici, portando a previsioni più rapide e accurate. Il suo lavoro si concentra sull'applicazione di approssimazioni di Laplace nidificate integrate (INLA), un approccio per intraprendere l'inferenza bayesiana che aggiorna le conclusioni tratte da modelli statistici alla luce di nuovi dati.
"I problemi principali con la modellazione bayesiana sono la velocità e l'accuratezza, " spiega Rue. "Normalmente devi scambiare la velocità con la precisione, ma con INLA ottieni entrambi. È quasi troppo bello per essere vero".
L'approccio INLA rappresenta un modo diverso di analizzare set di dati ad alta dimensionalità contenenti migliaia di misurazioni, come quelli utilizzati per modellare il clima o prevedere modelli meteorologici, e sono troppo complessi per metodi come il campionamento Monte Carlo della catena di Markov, che richiedono molto tempo e poco pratici per modelli molto grandi.
Per aiutare ad applicare il metodo statistico INLA e per analizzare meglio dataset sempre più grandi, Rue e i suoi colleghi hanno sviluppato il pacchetto software statistico R-INLA, che consente l'applicazione di INLA in diversi campi, dalla sanità all'ecologia.
Per esempio, Gavin Shaddick, professore di Data Science and Statistics presso l'Università di Exeter nel Regno Unito, utilizzato R-INLA per analizzare un database contenente i dati di più di 4, 300 città in oltre 100 paesi per modellare gli impatti sulla salute e sull'ambiente dell'inquinamento atmosferico.
"L'inquinamento atmosferico è un importante fattore di rischio per la salute globale con 4,2 milioni di morti ogni anno attribuiti all'inquinamento da particolato fine, " afferma Shaddick. "Senza R-INLA non saremmo stati in grado di eseguire queste analisi su scala globale".
Il lavoro, in collaborazione con l'Organizzazione Mondiale della Sanità (OMS), ha dimostrato che il 92% della popolazione mondiale risiede in aree che superano le linee guida sulla qualità dell'aria dell'OMS.
Il metodo è stato utilizzato anche dal Malaria Atlas Project (MAP), che si diffonde gratuitamente, accurato, informazioni aggiornate sulla malaria, e mira a limitare la diffusione della malattia. Secondo il World Malaria Report 2017 dell'OMS si stima che nel 2016 si siano verificati 216 milioni di casi di malaria in tutto il mondo. un aumento di circa 5 milioni di casi rispetto all'anno precedente.
"Prima di R-INLA se non era possibile effettuare inferenze per più di mille osservazioni, rendendolo uno strumento importante per comprendere la diffusione della malaria, " dice, Samir Bhatt dell'Imperial College Public School of Health di Londra, UK., che ha utilizzato l'R-INLA per modellare la prevalenza di diverse forme di malaria su scala globale.
Anche il Centro per il controllo e la prevenzione delle malattie (CDC) sta utilizzando R-INLA per mappare il crescente numero di suicidi negli Stati Uniti, fornendo un livello di dettaglio senza precedenti consentendo cambiamenti nei tassi di suicidio in oltre 3, 000 contee da monitorare dal 2005 al 2015.
"Comprendere i modelli geografici dei tassi di suicidio ci aiuta a determinare quali contee riportano tassi elevati e hanno bisogno di risorse per la prevenzione del suicidio, " spiega Diba Khan, borsista senior presso i Centers for Disease Control and Prevention (CDC). "Utilizzando INLA, le agenzie sanitarie pubbliche locali sono in grado di stanziare fondi per ottenere risultati sanitari non possibili solo da dati a livello statale".
Il metodo INLA è stato applicato anche dai ricercatori dell'Università Cattolica di Valparaíso per mappare i modelli di distribuzione dei gamberi al largo delle coste cilene. Ha permesso loro di identificare le aree in cui è possibile pescare e di formulare raccomandazioni sulle quote di cattura per aiutare a gestire le risorse ittiche.
"Sono ancora sorpreso quando vedo applicazioni di INLA in aree di cui non ho mai sentito parlare e che sono al di fuori delle statistiche di base. Ciò dimostra che ciò che stiamo facendo è importante e ha un impatto sul modo in cui le persone lavorano con le statistiche, "dice Rue.