• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Il modello aiuta i robot a navigare più come fanno gli umani

    I ricercatori del MIT hanno escogitato un modo per aiutare i robot a navigare negli ambienti più come fanno gli umani. Credito:Massachusetts Institute of Technology

    Quando ti muovi in ​​mezzo alla folla per raggiungere un obiettivo finale, gli umani di solito possono navigare nello spazio in sicurezza senza pensare troppo. Possono imparare dal comportamento degli altri e notare eventuali ostacoli da evitare. Robot, d'altra parte, lottare con tali concetti di navigazione.

    I ricercatori del MIT hanno ora escogitato un modo per aiutare i robot a navigare negli ambienti più come fanno gli umani. Il loro nuovo modello di pianificazione del movimento consente ai robot di determinare come raggiungere un obiettivo esplorando l'ambiente, osservando altri agenti, e sfruttando ciò che hanno imparato prima in situazioni simili. Un documento che descrive il modello è stato presentato alla conferenza internazionale IEEE/RSJ di questa settimana sui robot e i sistemi intelligenti (IROS).

    I popolari algoritmi di pianificazione del movimento creeranno un albero di possibili decisioni che si diramano fino a trovare buoni percorsi per la navigazione. Un robot che ha bisogno di navigare in una stanza per raggiungere una porta, ad esempio, creerà un albero di ricerca passo passo dei possibili movimenti e quindi eseguirà il percorso migliore per la porta, considerando vari vincoli. Uno svantaggio, però, questi algoritmi imparano raramente:i robot non possono sfruttare le informazioni su come loro o altri agenti hanno agito in precedenza in ambienti simili.

    "Proprio come quando si gioca a scacchi, queste decisioni si ramificano finché [i robot] non trovano un buon modo per navigare. Ma a differenza dei giocatori di scacchi, [i robot] esplorano come sarà il futuro senza imparare molto sul loro ambiente e su altri agenti, " dice il co-autore Andrei Barbu, un ricercatore presso il Computer Science and Artificial Intelligence Laboratory (CSAIL) del MIT e il Center for Brains, menti, and Machines (CBMM) all'interno del McGovern Institute del MIT. "La millesima volta che passano attraverso la stessa folla è complicata come la prima volta. Sono sempre in esplorazione, osservando raramente, e non usare mai ciò che è successo in passato."

    I ricercatori hanno sviluppato un modello che combina un algoritmo di pianificazione con una rete neurale che impara a riconoscere percorsi che potrebbero portare al miglior risultato, e usa quella conoscenza per guidare il movimento del robot in un ambiente.

    Nella loro carta, "Modelli sequenziali profondi per la pianificazione basata sul campionamento, " i ricercatori dimostrano i vantaggi del loro modello in due contesti:navigare attraverso stanze impegnative con trappole e passaggi stretti, e navigare nelle aree evitando collisioni con altri agenti. Un'applicazione promettente nel mondo reale sta aiutando le auto a guida autonoma a navigare negli incroci, dove devono valutare rapidamente cosa faranno gli altri prima di fondersi nel traffico. I ricercatori stanno attualmente perseguendo tali applicazioni attraverso il Centro comune di ricerca Toyota-CSAIL.

    "Quando gli esseri umani interagiscono con il mondo, vediamo un oggetto con cui abbiamo interagito prima, o siamo in qualche luogo in cui siamo stati prima, così sappiamo come agiremo, " dice Yen-Ling Kuo, un dottorato di ricerca in CSAIL e primo autore sulla carta. "L'idea alla base di questo lavoro è aggiungere allo spazio di ricerca un modello di apprendimento automatico che sappia dall'esperienza passata come rendere la pianificazione più efficiente".

    Boris Katz, uno dei principali ricercatori e capo del gruppo InfoLab al CSAIL, è anche coautore del documento.

    Scambiare esplorazione e sfruttamento

    I pianificatori di movimento tradizionali esplorano un ambiente espandendo rapidamente un albero di decisioni che alla fine copre un intero spazio. Il robot quindi guarda l'albero per trovare un modo per raggiungere l'obiettivo, come una porta. Il modello dei ricercatori però, offre "un compromesso tra l'esplorazione del mondo e lo sfruttamento delle conoscenze passate, " dice Kuo.

    Il processo di apprendimento inizia con alcuni esempi. Un robot che utilizza il modello viene addestrato su alcuni modi per navigare in ambienti simili. La rete neurale apprende ciò che rende questi esempi di successo interpretando l'ambiente intorno al robot, come la forma delle pareti, le azioni di altri agenti, e caratteristiche degli obiettivi. In breve, il modello "impara che quando sei bloccato in un ambiente, e vedi una porta, probabilmente è una buona idea passare dalla porta per uscire, "dice Barbù.

    Il modello combina il comportamento di esplorazione dei metodi precedenti con queste informazioni apprese. Il pianificatore sottostante, chiamato RRT*, è stato sviluppato dai professori del MIT Sertac Karaman ed Emilio Frazzoli. (È una variante di un algoritmo di pianificazione del movimento ampiamente utilizzato noto come alberi casuali ad esplorazione rapida, o RRT.) Il pianificatore crea un albero di ricerca mentre la rete neurale rispecchia ogni passaggio e fa previsioni probabilistiche su dove dovrebbe andare il robot. Quando la rete fa una previsione con alta confidenza, sulla base delle informazioni apprese, guida il robot su un nuovo percorso. Se la rete non ha un'elevata confidenza, consente invece al robot di esplorare l'ambiente, come un pianificatore tradizionale.

    Per esempio, i ricercatori hanno dimostrato il modello in una simulazione nota come "trappola per insetti, " dove un robot 2-D deve fuggire da una camera interna attraverso uno stretto canale centrale e raggiungere una posizione in una stanza circostante più grande. Gli alleati ciechi su entrambi i lati del canale possono bloccare i robot. In questa simulazione, il robot è stato addestrato su alcuni esempi su come sfuggire a diverse trappole per insetti. Di fronte a una nuova trappola, riconosce le caratteristiche della trappola, fughe, e continua a cercare il suo obiettivo nella stanza più grande. La rete neurale aiuta il robot a trovare l'uscita dalla trappola, identificare i vicoli ciechi, e dà al robot un senso di ciò che lo circonda in modo che possa trovare rapidamente l'obiettivo.

    I risultati nel documento si basano sulle possibilità che si trovi un percorso dopo un po' di tempo, lunghezza totale del percorso che ha raggiunto un determinato obiettivo, e quanto fossero coerenti i percorsi. In entrambe le simulazioni, il modello dei ricercatori ha tracciato più rapidamente percorsi molto più brevi e coerenti rispetto a un pianificatore tradizionale.

    Lavorare con più agenti

    In un altro esperimento, i ricercatori hanno addestrato e testato il modello in ambienti di navigazione con più agenti in movimento, che è un test utile per le auto autonome, soprattutto la navigazione di incroci e rotonde. Nella simulazione, diversi agenti stanno aggirando un ostacolo. Un agente robot deve navigare con successo intorno agli altri agenti, evitare collisioni, e raggiungere una posizione obiettivo, come un'uscita su una rotonda.

    "Situazioni come le rotonde sono difficili, perché richiedono un ragionamento su come gli altri reagiranno alle tue azioni, come risponderai poi al loro, cosa faranno dopo, e così via, " dice Barbu. " Alla fine scopri che la tua prima azione era sbagliata, perché in seguito porterà a un probabile incidente. Questo problema peggiora in modo esponenziale quanto più auto devi affrontare".

    I risultati indicano che il modello dei ricercatori può acquisire informazioni sufficienti sul comportamento futuro degli altri agenti (automobili) per interrompere il processo in anticipo, pur prendendo buone decisioni nella navigazione. Questo rende la pianificazione più efficiente. Inoltre, avevano solo bisogno di addestrare il modello su alcuni esempi di rotatorie con solo poche auto. "I piani dei robot tengono conto di ciò che faranno le altre auto, come farebbe qualsiasi essere umano, "dice Barbù.

    Attraversare incroci o rotonde è uno degli scenari più impegnativi per le auto a guida autonoma. Questo lavoro potrebbe un giorno consentire alle auto di imparare come si comportano gli esseri umani e come adattarsi ai conducenti in ambienti diversi, secondo i ricercatori. Questo è il fulcro del lavoro del Centro comune di ricerca Toyota-CSAIL.

    "Non tutti si comportano allo stesso modo, ma le persone sono molto stereotipate. Ci sono persone timide, persone aggressive. Il modello lo riconosce rapidamente ed è per questo che può pianificare in modo efficiente, "dice Barbù.

    Più recentemente, i ricercatori hanno applicato questo lavoro a robot con manipolatori che affrontano sfide altrettanto scoraggianti quando raggiungono gli oggetti in ambienti in continua evoluzione.

    Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.




    © Scienza https://it.scienceaq.com