• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Usare l'intelligenza artificiale per arricchire le mappe digitali

    Un modello di intelligenza artificiale sviluppato al MIT e al Qatar Computing Research Institute che utilizza solo immagini satellitari per contrassegnare automaticamente le caratteristiche stradali nelle mappe digitali potrebbe migliorare la navigazione GPS, soprattutto nei paesi con dati cartografici limitati. Credito:Google Maps/MIT News

    Un modello inventato dai ricercatori del MIT e del Qatar Computing Research Institute (QCRI) che utilizza immagini satellitari per contrassegnare le caratteristiche stradali nelle mappe digitali potrebbe aiutare a migliorare la navigazione GPS.

    Mostrare ai conducenti maggiori dettagli sui loro percorsi può spesso aiutarli a navigare in luoghi sconosciuti. La corsia conta, ad esempio, può consentire a un sistema GPS di avvertire i conducenti di corsie divergenti o accorpate. L'inserimento di informazioni sui parcheggi può aiutare i conducenti a pianificare in anticipo, mentre la mappatura delle piste ciclabili può aiutare i ciclisti a negoziare le strade trafficate della città. Fornire informazioni aggiornate sulle condizioni stradali può anche migliorare la pianificazione dei soccorsi in caso di catastrofe.

    Ma creare mappe dettagliate è costoso, processo dispendioso in termini di tempo svolto principalmente da grandi aziende, come Google, che invia veicoli in giro con telecamere attaccate ai cofani per catturare video e immagini delle strade di un'area. La combinazione di questo con altri dati può creare dati accurati, mappe aggiornate. Poiché questo processo è costoso, però, alcune parti del mondo vengono ignorate.

    Una soluzione consiste nello scatenare modelli di apprendimento automatico sulle immagini satellitari, che sono più facili da ottenere e aggiornate abbastanza regolarmente, per etichettare automaticamente le caratteristiche stradali. Ma le strade possono essere occluse da, dire, alberi ed edifici, rendendolo un compito impegnativo. In un documento presentato alla conferenza dell'Associazione per l'avanzamento dell'intelligenza artificiale, i ricercatori del MIT e del QCRI descrivono "RoadTagger, " che utilizza una combinazione di architetture di rete neurale per prevedere automaticamente il numero di corsie e tipi di strade (residenziali o autostradali) dietro gli ostacoli.

    Nel testare RoadTagger su strade occluse da mappe digitali di 20 città degli Stati Uniti, il modello ha contato i numeri di corsia con una precisione del 77% e i tipi di strade dedotti con una precisione del 93%. I ricercatori stanno anche pianificando di consentire a RoadTagger di prevedere altre funzionalità, come parcheggi e piste ciclabili.

    "Le mappe digitali più aggiornate provengono da luoghi a cui le grandi aziende si interessano di più. Se ti trovi in ​​luoghi a cui non interessano molto, sei in svantaggio per quanto riguarda la qualità della mappa, " dice il co-autore Sam Madden, professore presso il Dipartimento di Ingegneria Elettrica e Informatica (EECS) e ricercatore presso il Laboratorio di Informatica e Intelligenza Artificiale (CSAIL). "Il nostro obiettivo è automatizzare il processo di generazione di mappe digitali di alta qualità, in modo che possano essere disponibili in qualsiasi paese."

    I coautori del documento sono gli studenti laureati CSAIL Songtao He, Favyen Bastani, e Edward Park; studente universitario EECS Satvat Jagwani; i professori CSAIL Mohammad Alizadeh e Hari Balakrishnan; e i ricercatori del QCRI Sanjay Chawla, Sofiane Abbar, e Mohammad Amin Sadeghi.

    Combinando CNN e GNN

    Qatar, dove si basa QCRI, non è "una priorità per le grandi aziende che costruiscono mappe digitali, "dice Madden. Eppure, costruisce costantemente nuove strade e migliora quelle vecchie, soprattutto in preparazione per ospitare la Coppa del Mondo FIFA 2022.

    "Durante la visita in Qatar, abbiamo avuto esperienze in cui il nostro autista Uber non riesce a capire come arrivare dove sta andando, perché la mappa è così spenta, " dice Madden. "Se le app di navigazione non hanno le informazioni giuste, per cose come l'unione di corsie, questo potrebbe essere frustrante o peggio."

    RoadTagger si basa su una nuova combinazione di una rete neurale convoluzionale (CNN), comunemente utilizzata per attività di elaborazione delle immagini, e una rete neurale a grafo (GNN). Le GNN modellano le relazioni tra i nodi connessi in un grafico e sono diventate popolari per analizzare cose come i social network e le dinamiche molecolari. Il modello è "end-to-end, " significa che viene alimentato solo con dati grezzi e produce automaticamente output, senza intervento umano.

    La CNN prende come input le immagini satellitari grezze delle strade target. La GNN suddivide la strada in segmenti di circa 20 metri, o "piastrelle". Ogni tile è un nodo grafico separato, collegati da linee lungo la strada. Per ogni nodo, la CNN estrae le caratteristiche stradali e condivide tali informazioni con i suoi immediati vicini. Le informazioni stradali si propagano lungo tutto il grafico, con ogni nodo che riceve alcune informazioni sugli attributi della strada in ogni altro nodo. Se un determinato riquadro è occluso in un'immagine, RoadTagger utilizza le informazioni di tutti i riquadri lungo la strada per prevedere cosa c'è dietro l'occlusione.

    Questa architettura combinata rappresenta un'intuizione più umana, dicono i ricercatori. Diciamo che parte di una strada a quattro corsie è occlusa da alberi, quindi alcune tessere mostrano solo due corsie. Gli umani possono facilmente supporre che un paio di corsie siano nascoste dietro gli alberi. Modelli tradizionali di apprendimento automatico, ad esempio solo una CNN:estrai le caratteristiche solo delle singole tessere e molto probabilmente prevedi che la tessera occlusa sia una strada a due corsie.

    "Gli umani possono utilizzare le informazioni delle tessere adiacenti per indovinare il numero di corsie nelle tessere occluse, ma le reti non possono farlo, " Dice. "Il nostro approccio cerca di imitare il comportamento naturale degli umani, dove acquisiamo informazioni locali dalla CNN e informazioni globali dalla GNN per fare previsioni migliori".

    Imparare i pesi

    Per addestrare e testare RoadTagger, i ricercatori hanno utilizzato un set di dati di mappe del mondo reale, chiamato OpenStreetMap, che consente agli utenti di modificare e curare mappe digitali in tutto il mondo. Da quel set di dati, hanno raccolto attributi stradali confermati da 688 chilometri quadrati di mappe di 20 città degli Stati Uniti, tra cui Boston, Chicago, Washington, e Seattle. Quindi, hanno raccolto le immagini satellitari corrispondenti da un set di dati di Google Maps.

    In allenamento, RoadTagger apprende i pesi, che assegnano vari gradi di importanza alle funzionalità e alle connessioni dei nodi, della CNN e della GNN. La CNN estrae le caratteristiche dai modelli di pixel delle tessere e la GNN propaga le caratteristiche apprese lungo il grafico. Da sottografi della strada scelti a caso, il sistema impara a prevedere le caratteristiche stradali in corrispondenza di ogni piastrella. Così facendo, apprende automaticamente quali caratteristiche dell'immagine sono utili e come propagare tali caratteristiche lungo il grafico. Ad esempio, se una tessera bersaglio ha una segnaletica orizzontale poco chiara, ma la tessera vicina ha quattro corsie con segnaletica orizzontale chiara e condivide la stessa larghezza della strada, allora è probabile che anche la tessera bersaglio abbia quattro corsie. In questo caso, il modello apprende automaticamente che la larghezza della strada è una caratteristica utile dell'immagine, quindi se due tessere adiacenti condividono la stessa larghezza della strada, è probabile che abbiano lo stesso numero di corsie.

    Data una strada non vista in allenamento da OpenStreetMap, il modello suddivide la strada in tessere e utilizza i pesi appresi per fare previsioni. Ha il compito di prevedere un numero di corsie in una tessera occlusa, il modello osserva che le tessere vicine hanno modelli di pixel corrispondenti e, perciò, un'alta probabilità di condividere le informazioni. Così, se quelle tessere hanno quattro corsie, anche la tessera occlusa deve averne quattro.

    In un altro risultato, RoadTagger ha previsto con precisione i numeri di corsia in un set di dati di sintesi, disagi stradali molto impegnativi. Come un esempio, un cavalcavia a due corsie copriva alcune tegole di una strada di destinazione a quattro corsie. Il modello ha rilevato modelli di pixel non corrispondenti del cavalcavia, quindi ignorava le due corsie sopra le tegole coperte, prevedendo accuratamente che ci fossero quattro corsie sottostanti.

    I ricercatori sperano di utilizzare RoadTagger per aiutare gli esseri umani a convalidare e approvare rapidamente modifiche continue all'infrastruttura in set di dati come OpenStreetMap, dove molte mappe non contengono il conteggio delle corsie o altri dettagli. Una specifica area di interesse è la Thailandia, Bastani dice, dove le strade cambiano continuamente, ma ci sono pochi o nessun aggiornamento nel set di dati.

    "Le strade che una volta erano etichettate come sterrate sono state asfaltate, quindi è meglio percorrerle, e alcuni incroci sono stati completamente ricostruiti. Ci sono cambiamenti ogni anno, ma le mappe digitali sono obsolete, ", afferma. "Vogliamo aggiornare costantemente tali attributi stradali in base alle immagini più recenti".

    Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.




    © Scienza https://it.scienceaq.com