Un sistema di simulazione inventato al MIT per addestrare le auto senza conducente crea un mondo fotorealistico con infinite possibilità di sterzata, aiutando le auto a imparare a navigare in una serie di scenari peggiori prima di percorrere strade reali. Credito:Massachusetts Institute of Technology
Un sistema di simulazione inventato al MIT per addestrare le auto senza conducente crea un mondo fotorealistico con infinite possibilità di sterzata, aiutando le auto a imparare a navigare in una serie di scenari peggiori prima di percorrere strade reali.
Sistemi di controllo, o "controllori, " per i veicoli autonomi si basa in gran parte su set di dati del mondo reale di traiettorie di guida da conducenti umani. Da questi dati, imparano come emulare i comandi di guida sicuri in una varietà di situazioni. Ma i dati del mondo reale da pericolosi "casi limite, "come quasi schiantarsi o essere costretti fuori strada o in altre corsie, sono, fortunatamente, rari.
Alcuni programmi per computer, chiamati "motori di simulazione, " mirano a imitare queste situazioni visualizzando strade virtuali dettagliate per aiutare ad addestrare i controllori a riprendersi. Ma non è mai stato dimostrato che il controllo appreso dalla simulazione si trasferisca alla realtà su un veicolo a grandezza naturale.
I ricercatori del MIT affrontano il problema con il loro simulatore fotorealistico, chiamato Virtual Image Synthesis and Transformation for Autonomy (VISTA). Utilizza solo un piccolo set di dati, catturato da esseri umani che guidano su una strada, sintetizzare un numero praticamente infinito di nuovi punti di vista dalle traiettorie che il veicolo potrebbe intraprendere nel mondo reale. Il controller viene ricompensato per la distanza percorsa senza schiantarsi, quindi deve imparare da solo come raggiungere una destinazione in sicurezza. Così facendo, il veicolo impara a navigare in sicurezza in ogni situazione che incontra, incluso riprendere il controllo dopo aver sterzato tra le corsie o essersi ripreso da quasi incidenti.
Nei test, un controller addestrato all'interno del simulatore VISTA è stato in grado di essere distribuito in sicurezza su un'auto senza conducente su vasta scala e di navigare attraverso strade inedite. Nel posizionare l'auto con orientamenti fuoristrada che imitavano varie situazioni di quasi incidente, il controller è stato anche in grado di recuperare con successo l'auto in una traiettoria di guida sicura in pochi secondi. Un documento che descrive il sistema è stato pubblicato in Lettere IEEE sulla robotica e l'automazione e sarà presentato alla prossima conferenza ICRA di maggio.
"È difficile raccogliere dati in questi casi limite che gli umani non sperimentano sulla strada, " dice il primo autore Alexander Amini, un dottorato di ricerca studente del Laboratorio di Informatica e Intelligenza Artificiale (CSAIL). "Nella nostra simulazione, però, i sistemi di controllo possono sperimentare quelle situazioni, imparare da soli a riprendersi da loro, e rimangono robusti quando vengono utilizzati sui veicoli nel mondo reale."
Il lavoro è stato svolto in collaborazione con il Toyota Research Institute. Insieme ad Amini sul giornale ci sono Igor Gilitschenski, un postdoc in CSAIL; Jacob Phillips, Julia Moseyko, e Rohan Banerjee, tutti i laureandi del CSAIL e del Dipartimento di Ingegneria Elettrica e Informatica; Sertac Karaman, un professore associato di aeronautica e astronautica; e Daniela Rus, direttore del CSAIL e Andrea ed Erna Viterbi Professore di Ingegneria Elettrica e Informatica.
Simulazione basata sui dati
Storicamente, costruire motori di simulazione per addestrare e testare veicoli autonomi è stato in gran parte un compito manuale. Le aziende e le università spesso impiegano team di artisti e ingegneri per disegnare ambienti virtuali, con segnaletica orizzontale precisa, corsie, e persino foglie dettagliate sugli alberi. Alcuni motori possono anche incorporare la fisica dell'interazione di un'auto con il suo ambiente, sulla base di modelli matematici complessi.
Ma poiché ci sono così tante cose diverse da considerare in ambienti complessi del mondo reale, è praticamente impossibile incorporare tutto nel simulatore. Per tale motivo, di solito c'è una discrepanza tra ciò che i controllori imparano nella simulazione e come operano nel mondo reale.
Anziché, i ricercatori del MIT hanno creato quello che chiamano un motore di simulazione "guidato dai dati" che sintetizza, da dati reali, nuove traiettorie coerenti con l'aspetto stradale, così come la distanza e il movimento di tutti gli oggetti nella scena.
Per prima cosa raccolgono dati video da un essere umano che guida lungo alcune strade e li immettono nel motore. Per ogni fotogramma, il motore proietta ogni pixel in una sorta di nuvola di punti 3D. Quindi, mettono un veicolo virtuale all'interno di quel mondo. Quando il veicolo impartisce un comando di sterzata, il motore sintetizza una nuova traiettoria attraverso la nuvola di punti, in base alla curva di sterzata e all'orientamento e alla velocità del veicolo.
Quindi, il motore usa quella nuova traiettoria per rendere una scena fotorealistica. Fare così, utilizza una rete neurale convoluzionale, comunemente utilizzata per attività di elaborazione delle immagini, per stimare una mappa di profondità, che contiene informazioni relative alla distanza degli oggetti dal punto di vista del controllore. Quindi combina la mappa di profondità con una tecnica che stima l'orientamento della fotocamera all'interno di una scena 3D. Tutto ciò aiuta a individuare la posizione del veicolo e la relativa distanza da tutto all'interno del simulatore virtuale.
Sulla base di tali informazioni, riorienta i pixel originali per ricreare una rappresentazione 3D del mondo dal nuovo punto di vista del veicolo. Tiene traccia anche del movimento dei pixel per catturare il movimento delle auto e delle persone, e altri oggetti in movimento, nella scena. "Ciò equivale a fornire al veicolo un numero infinito di possibili traiettorie, " dice Rus. "Perché quando raccogliamo dati fisici, otteniamo i dati dalla traiettoria specifica che l'auto seguirà. Ma possiamo modificare quella traiettoria per coprire tutti i possibili modi e ambienti di guida. È davvero potente".
Rinforzo che impara da zero
Tradizionalmente, i ricercatori hanno addestrato veicoli autonomi seguendo regole di guida definite dall'uomo o cercando di imitare i conducenti umani. Ma i ricercatori fanno in modo che il loro controllore impari completamente da zero in un quadro "end-to-end", il che significa che prende come input solo i dati grezzi del sensore, come le osservazioni visive della strada, e, da quei dati, predice i comandi di sterzata alle uscite.
"In pratica diciamo, 'Ecco un ambiente. Puoi fare ciò che vuoi. Basta non sbattere contro i veicoli, e rimani dentro le corsie, '", dice Amini.
Ciò richiede "apprendimento per rinforzo" (RL), una tecnica di apprendimento automatico per tentativi che fornisce segnali di feedback ogni volta che l'auto commette un errore. Nel motore di simulazione dei ricercatori, il controllore inizia con il non sapere nulla su come guidare, cos'è un indicatore di corsia, o anche altri veicoli sembrano, quindi inizia ad eseguire angoli di sterzata casuali. Riceve un segnale di feedback solo quando va in crash. A quel punto, viene teletrasportato in una nuova posizione simulata e deve eseguire una migliore serie di angoli di sterzata per evitare di schiantarsi di nuovo. Oltre 10-15 ore di formazione, utilizza questi scarsi segnali di feedback per imparare a percorrere distanze sempre maggiori senza schiantarsi.
Dopo aver guidato con successo 10, 000 chilometri in simulazione, gli autori applicano quel controller appreso al loro veicolo autonomo su vasta scala nel mondo reale. I ricercatori affermano che questa è la prima volta che un controller addestrato utilizzando l'apprendimento del rinforzo end-to-end nella simulazione è stato distribuito con successo su un'auto autonoma su vasta scala. "Questo è stato sorprendente per noi. Non solo il controller non è mai stato su una vera macchina prima, ma non ha mai nemmeno visto le strade prima e non ha alcuna conoscenza preliminare su come guidano gli umani, "dice Amini.
Forzare il controller a eseguire tutti i tipi di scenari di guida gli ha permesso di riprendere il controllo da posizioni disorientanti, come trovarsi a metà strada o in un'altra corsia, e tornare nella corsia corretta in pochi secondi. "E altri controller all'avanguardia hanno tutti tragicamente fallito in questo, perché non hanno mai visto dati come questo in allenamento, "dice Amini.
Prossimo, i ricercatori sperano di simulare tutti i tipi di condizioni stradali da un'unica traiettoria di guida, come notte e giorno, e tempo soleggiato e piovoso. Sperano anche di simulare interazioni più complesse con altri veicoli sulla strada. "E se altre auto iniziano a muoversi e saltano davanti al veicolo?" dice Rus. "Sono complessi, interazioni del mondo reale che vogliamo iniziare a testare."