• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • I ricercatori fanno progressi con il nuovo algoritmo di guida automatizzata

    a sinistra, I ricercatori della U of T Wenjie Luo, Professore Associato Raquel Urtasun, e Bin Yang dell'Advanced Technologies Group (ATG) di Uber Toronto. Credito:Ryan Perez

    Un veicolo a guida autonoma deve rilevare oggetti, seguirli nel tempo, e prevedere dove saranno in futuro per pianificare una manovra sicura. Questi compiti sono tipicamente formati indipendentemente l'uno dall'altro, che potrebbe provocare disastri se una qualsiasi attività fallisce.

    I ricercatori del dipartimento di informatica dell'Università di Toronto e l'Advanced Technologies Group (ATG) di Uber a Toronto hanno sviluppato un algoritmo che ragiona insieme su tutti questi compiti, il primo a riunirli tutti. È importante sottolineare che la loro soluzione richiede appena 30 millisecondi per frame.

    "Cerchiamo di ottimizzare l'insieme in modo da poter correggere gli errori tra ciascuna delle attività stesse, "dice Wenjie Luo, un dottorato di ricerca studente in informatica. "Quando fatto insieme, l'incertezza può essere propagata e il calcolo condiviso."

    Luo e Bin Yang, un dottorato di ricerca studente in informatica, insieme al loro supervisore laureato, Raquel Urtasun, professore associato di informatica e capo di Uber ATG Toronto, presenteranno il loro paper, Fast and Furious:rilevamento 3D end-to-end in tempo reale, Tracciamento e previsione del movimento con un'unica rete convoluzionale, alla conferenza Computer Vision and Pattern Recognition (CVPR) di questa settimana a Salt Lake City, il principale evento annuale di visione artificiale.

    Iniziare, Uber ha raccolto un set di dati su larga scala di diverse città nordamericane utilizzando scanner Li-DAR montati sul tetto che emettono raggi laser per misurare le distanze. Il set di dati include più di un milione di frame, raccolti da 6, 500 scene diverse.

    Urtasun afferma che l'output del LiDAR è una nuvola di punti nello spazio tridimensionale che deve essere compreso da un sistema di intelligenza artificiale (AI). Questi dati sono di natura non strutturata, ed è quindi considerevolmente diverso dai dati strutturati normalmente inseriti nei sistemi di intelligenza artificiale, come le immagini.

    "Se l'attività sta rilevando oggetti, puoi provare a rilevare oggetti ovunque ma c'è troppo spazio libero, quindi molti calcoli sono fatti per niente. A volo d'uccello, gli oggetti che cerchiamo di riconoscere siedono a terra e quindi è molto efficiente ragionare su dove sono le cose, "dice Urtasun.

    Per gestire grandi quantità di dati non strutturati, dottorato di ricerca lo studente Shenlong Wang e i ricercatori di Uber ATG hanno sviluppato uno speciale strumento di intelligenza artificiale.

    "Un'immagine è una griglia 2-D. Un modello 3-D è un mucchio di mesh 3-D. Ma qui, ciò che catturiamo [con Li-DAR] è solo un mucchio di punti, e sono sparsi in quello spazio, che per l'IA tradizionale è molto difficile da affrontare, " dice Wang (nella foto a sinistra).

    Urtasun spiega che c'è un motivo per cui l'intelligenza artificiale funziona molto bene sulle immagini. Le immagini sono oggetti rettangolari, fatto di minuscoli pixel, anche rettangolare, quindi gli algoritmi funzionano bene sull'analisi di strutture a griglia. Ma i dati LiDAR sono privi di una struttura regolare, rendendo difficile l'apprendimento dei sistemi di intelligenza artificiale.

    I loro risultati per l'elaborazione diretta di punti sparsi non si limitano alla guida autonoma, ma qualsiasi dominio in cui sono presenti dati non strutturati, tra cui chimica e social network.

    Nove articoli saranno presentati al CVPR dal laboratorio di Urtasun. Mengye Ren, un dottorato di ricerca studente in informatica, Andrei Pokrovskij, un ingegnere del software del personale presso Uber ATG, Yang e Urtasun hanno anche cercato un calcolo più veloce e hanno sviluppato SBNet:Sparse Blocks Network for Fast Inference.

    "Vogliamo che la rete sia il più veloce possibile in modo che possa rilevare e prendere decisioni in tempo reale, in base alla situazione attuale, " dice Ren. "Per esempio, gli umani guardano certe regioni che riteniamo importanti da percepire, quindi applichiamo questo alla guida autonoma."

    Per aumentare la velocità dell'intero calcolo, dice Ren, hanno ideato un calcolo sparso basato su quali regioni sono importanti. Di conseguenza, il loro algoritmo si è dimostrato fino a 10 volte più veloce rispetto ai metodi esistenti.

    "La macchina vede tutto, ma concentra la maggior parte dei suoi calcoli su ciò che è importante, risparmio di calcolo, "dice Urtasun.

    "Quindi quando ci sono molte macchine [sulla strada], il calcolo non diventa troppo scarso, quindi non perdiamo nessun veicolo. Ma quando è scarso, cambierà in modo adattivo il calcolo, "dice Ren.

    I ricercatori hanno rilasciato il codice SBNet in quanto è ampiamente utile per migliorare l'elaborazione per piccoli dispositivi, compresi gli smartphone.

    Urtasun afferma che l'impatto complessivo della ricerca del suo gruppo è aumentato in modo significativo quando hanno visto i loro algoritmi implementati nella flotta a guida autonoma di Uber, piuttosto che risiedere esclusivamente in documenti accademici.

    "Stiamo cercando di risolvere la guida autonoma, "dice Urtasun, "che è uno dei problemi fondamentali di questo secolo".


    © Scienza https://it.scienceaq.com