Architettura complessiva per la rete neurale convoluzionale (CNN). Credito:Singh e Kumar.
Ricercatori dell'Istituto Nazionale di Tecnologia di Patna, in India, hanno recentemente ideato uno strumento per identificare la localizzazione geografica delle emergenze e dei disastri, così come quello delle persone coinvolte in essi. Il loro approccio, delineato in un documento nel International Journal of Disaster Risk Reduction , estrae le informazioni sulla posizione dai tweet utilizzando un modello basato sulla rete neurale convoluzionale (CNN).
"Durante le emergenze, le informazioni sulla posizione geografica degli eventi, così come quella degli utenti interessati, sono di vitale importanza, "Jyoti Prakash Singh, uno dei ricercatori che ha condotto lo studio, ha detto a TechXplore. "Identificare questa posizione geografica è un compito impegnativo, poiché i campi di posizione disponibili come la posizione dell'utente e il nome del luogo dei tweet non sono affidabili. La posizione GPS precisa degli utenti è rara nei tweet, e talvolta anche scorretto in termini di informazioni spazio-temporali."
Le persone colpite da disastri naturali o altre emergenze spesso condividono la loro posizione sui social media, chiedere aiuto. Queste informazioni potrebbero aiutare le unità di risposta e le autorità locali a rilevare gli eventi in anticipo, localizzare le vittime e assisterle. Però, estrarre i dati relativi alla posizione dai tweet è un compito molto impegnativo, poiché questi sono spesso scritti in un inglese non standard e contengono errori grammaticali, errori di ortografia o abbreviazioni.
"È quasi impossibile per gli operatori umani che seguono i tweet passare attraverso ogni tweet e trovare le informazioni sulla posizione menzionate in essi, " Singh ha detto. "Questo ci ha motivato a sviluppare una soluzione per estrarre automaticamente le informazioni sulla posizione dai tweet che chiedono aiuto. In questo lavoro, abbiamo utilizzato il deep learning per determinare se un tweet contiene nomi di località ed evidenziare queste parole."
Singh e il suo collega Abhivan Kumar hanno sviluppato un modello CNN in grado di identificare la posizione degli utenti analizzando il contenuto dei loro tweet. Hanno scelto questo specifico approccio di deep learning perché può apprendere automaticamente la migliore rappresentazione dei dati di input e utilizzarla per identificare i riferimenti di posizione.
"Abbiamo utilizzato una tecnica di word-embedding per rappresentare i tweet al livello di input della CNN e i riferimenti di posizione presenti nel tweet sono rappresentati nel livello di output sotto forma di un vettore zero-uno, " ha spiegato Singh. "Le parole di localizzazione sono codificate come 1 e le parole non di localizzazione sono codificate come 0. Abbiamo usato diverse combinazioni di 2 grammi, 3 grammi, 4 grammi, e filtri da 5 grammi per estrarre le funzionalità dal tweet. Dopo l'addestramento per il modello per le 100 epoche, è in grado di prevedere i riferimenti alla posizione menzionati nel tweet con una precisione impressionante."
In una prima valutazione, il modello della CNN ideato da Singh e Kumar è stato in grado di estrarre tutte le parole relative alla posizione dai tweet con altissima precisione, anche quando il testo di un tweet era rumoroso. I ricercatori hanno testato il loro modello su tweet che non erano stati pre-elaborati e contenevano errori grammaticali, errori di battitura, abbreviazioni, e altri fattori confondenti.
"La principale implicazione pratica del nostro lavoro è che può essere facilmente convogliato, utilizzando modelli di rilevamento degli eventi, " Ha detto Singh. "I modelli di rilevamento degli eventi possono identificare i tweet correlati al suddetto disastro e il nostro modello può estrarre la posizione delle vittime colpite da quel disastro".
Nel futuro, il modello CNN sviluppato dai ricercatori potrebbe aiutare a localizzare rapidamente eventi di emergenza e persone che necessitano di assistenza urgente. Lo stesso approccio potrebbe essere applicato anche ai disordini civili, pubblicità mirata, osservare il comportamento umano regionale, gestione del traffico stradale in tempo reale e altri servizi basati sulla posizione.
"In questo lavoro abbiamo considerato solo i tweet in lingua inglese, ma durante una crisi gli utenti pubblicano anche tweet nelle loro lingue regionali, " Singh ha detto. "Stiamo quindi lavorando su un modello che affronti questa limitazione multilingue, cercando anche di sviluppare un modello semi-sorvegliato per ridurre il problema dell'etichettatura dei dati".
© 2018 Science X Network