Credito:CC0 Dominio Pubblico
Due nuovi algoritmi potrebbero aiutare i sistemi di allerta precoce dei terremoti a farti guadagnare qualche secondo in più per cadere, coperchio, e resisti prima che il terreno inizi a tremare.
Scienziati informatici dell'Università della California, Riverside ha sviluppato due algoritmi che miglioreranno il monitoraggio dei terremoti e aiuteranno gli agricoltori a proteggere i loro raccolti da insetti pericolosi, o monitorare la salute dei polli e di altri animali. Gli algoritmi individuano rapidamente i modelli in enormi set di dati, con meno potenza di calcolo e costi inferiori, rispetto ad altri metodi e sono stati utilizzati per migliorare il rilevamento dei terremoti, monitorare l'insetto vettore psilla agrumata asiatica, e valutare il comportamento alimentare dei polli.
Grandi dati, grossi problemi
Sensori, come sensori sismici, che registrano automaticamente eventi che si verificano ripetutamente in un periodo di tempo, avere un problema. Raccolgono così tanti dati che è difficile individuare i modelli. L'analisi delle serie temporali risolve questo problema cercando altri esempi di una sequenza di campioni all'interno di un set di dati, solitamente utilizzando unità di elaborazione grafica, o GPU. Ma per set di dati molto grandi questo diventa poco pratico perché richiede troppe GPU, che aumenta il costo.
Zachary Zimmermann, uno studente di dottorato in informatica presso il Marlan and Rosemary Bourns College of Engineering, costruito su un algoritmo precedentemente sviluppato dal coautore e professore di informatica Eamonn Keogh per gestire set di dati estremamente grandi e lo ha eseguito su 40 GPU ospitate sul cloud di Amazon Web Services.
L'algoritmo, chiamato SCAMP, ha ordinato quasi due anni di registrazioni sismiche dalla faglia di Parkfield in California, un segmento della faglia di Sant'Andrea situato vicino alla città di Parkfield, in sole 10 ore, ad un costo ragionevole di circa $ 300, e scoprì 16 volte più terremoti di quanto si conoscesse in precedenza.
"È difficile enfatizzare eccessivamente quanto sia scalabile questo algoritmo, " Keogh ha detto. "Per dimostrarlo, abbiamo fatto un quintilione, ovvero 1 seguito da 18 zeri, confronti a coppie di frammenti di dati sui terremoti. Nient'altro nella letteratura arriva entro un decimo di punto percentuale di quella dimensione".
Identificare i terremoti non è sempre facile
"Il problema più fondamentale in sismologia è identificare i terremoti. Ci sono stati numerosi miglioramenti metodologici da parte dei sismologi che applicano strategie dall'informatica per cercare modelli simili, ", ha affermato il coautore Gareth Funning, professore associato di sismologia. "Il grande progresso qui è che il set di dati che puoi gestire è molto, molto più grande. Quando esaminavamo i dati sismici, pensavamo che stavamo andando bene confrontando tutto in una finestra temporale di due mesi".
Altri metodi di rilevamento dei terremoti richiedono che l'algoritmo trovi le sequenze che corrispondono a un terremoto noto. Il metodo UC Riverside invece confronta tutto in un dato tempo e quindi può identificare i terremoti che non corrispondono necessariamente a quello dato come modello.
Per esempio, la loro analisi dei dati di Parkfield ha scoperto sottili, terremoti a bassa frequenza sotto la faglia di Sant'Andrea. Sequenze di questi terremoti, noto anche come tremori non vulcanici, accompagnare in profondità, movimenti lenti delle placche tettoniche.
Raffiche di terremoti a bassa frequenza hanno occasionalmente preceduto terremoti massicci, come quello in Giappone 10 anni fa. Un migliore rilevamento dei terremoti a bassa frequenza potrebbe aiutare a migliorare le previsioni dei terremoti più grandi e anche aiutare gli scienziati a monitorare meglio i movimenti delle placche tettoniche.
Dai terremoti ai polli e agli insetti nocivi
L'algoritmo SCAMP può anche rilevare parassiti agricoli dannosi. Keogh ha collegato dei sensori che registravano i movimenti degli insetti mentre succhiavano i succhi dalle foglie e usavano l'algoritmo per identificare la psilla asiatica degli agrumi, l'insetto responsabile della devastazione delle coltivazioni di agrumi diffondendo il batterio che causa Huanglongbing, o malattia dell'inverdimento degli agrumi. Ha anche usato l'algoritmo per analizzare un set di dati da accelerometri, che misurano vari tipi di movimenti, attaccati ai polli per un periodo di giorni. SCAMP ha quindi identificato modelli specifici relativi all'alimentazione e ad altri comportamenti.
SCAMP ha una limitazione, però.
"SCAMP richiede che tu abbia l'intera serie temporale prima di eseguire la ricerca. In caso di estrazione di dati sismologici storici, abbiamo quello. O in uno studio scientifico, possiamo far girare il pollo per 10 ore e analizzare i dati dopo il fatto, " ha detto il co-autore Philip Brisk, professore associato di informatica e consulente di dottorato di Zimmerman. "Ma con lo streaming dei dati direttamente dal sensore, non vogliamo aspettare 10 ore. Vogliamo essere in grado di dire che qualcosa sta accadendo ora".
Rilevamento dei terremoti in tempo reale più rapido
Zimmerman ha utilizzato i miliardi di punti dati, chiamato profilo di matrice, generato dall'analisi di SCAMP dei dati di guasto di Parkfield per addestrare un algoritmo che ha chiamato LAMP. LAMP confronta i dati di streaming con esempi visti in precedenza per selezionare i dati più rilevanti man mano che escono dal sensore.
"Avere il profilo della matrice a tua disposizione sul sensore significa che puoi sapere immediatamente cosa è importante e cosa no. Puoi fare tutti i tuoi controlli in tempo reale perché stai solo guardando attraverso i bit importanti, " ha detto Zimmermann.
La capacità di interpretare più rapidamente i dati sismici potrebbe migliorare i sistemi di allerta terremoti già esistenti.
"Con l'allerta terremoto, stai cercando di rilevare cose nelle stazioni di monitoraggio e poi inoltrare le informazioni a un sistema centrale che valuta se si tratta o meno di un grande terremoto, " ha detto Funning. "Una configurazione come questa potrebbe potenzialmente fare molto di quel lavoro di discriminazione prima che venga trasmesso al sistema. Potresti ridurre il tempo di calcolo necessario per determinare che un evento dannoso è in corso, comprare alle persone un paio di secondi in più per abbandonare, coperchio, e tieni duro."
"Un paio di secondi sono enormi per l'allerta precoce di un terremoto, " Ha aggiunto.
Il paper su SCAMP, "Matrix Profile XIV:ridimensionamento della scoperta di motivi di serie temporali con GPU per rompere un quintilione di confronti a coppie al giorno e oltre, " è stato presentato all'ACM Symposium on Cloud Computing dal 20 al 23 novembre, 2019 a Santa Cruz. Gli autori sono Zachary Zimmerman, Kaveh Kamgar, Nader Shakibay Senobari, Brian Crites, Gareth Funning, Philip Brisk e Eamonn Keogh.
Il paper su LAMPADA, "Matrix Profile XVIII:Time Series Mining di fronte a flussi in rapido movimento utilizzando un profilo Matrix approssimativo appreso, " è stato presentato alla IEEE International Conference on Data Mining 2019 tenutasi a Pechino all'inizio di novembre. Gli autori sono Zachary Zimmerman, Nader Shakibay Senobari, Gareth Funning, Evangelos Papalexakis, Samet Oymak, Filippo Briscio, e Eamonn Keogh.