Una descrizione di come funziona il metodo:una telecamera acquisisce un feed video in diretta di una scena, e le posizioni e le relazioni degli oggetti nella scena sono dedotte in tempo reale da una coppia di reti neurali. Le percezioni risultanti vengono inviate a un'altra rete che genera un piano per spiegare come ricreare quelle percezioni. Finalmente, una rete di esecuzione legge il piano e genera azioni per il robot, tenendo conto dello stato attuale del mondo per garantire robustezza ai disturbi esterni. Credito:NVIDIA
I ricercatori NVIDIA hanno iniziato a insegnare a un robot a completare un'attività osservando semplicemente le azioni di un essere umano. Le reti sono state addestrate come descritto in un video. Il sistema è stato testato nel mondo reale su un problema pick-and-place di impilamento di cubi colorati, e hanno usato un robot Baxter.
Un team di sei autori ha discusso questo lavoro, "Reti neurali sinteticamente addestrate per l'apprendimento di piani leggibili dall'uomo da dimostrazioni del mondo reale". Il loro successo ha coinvolto un robot che è stato in grado di apprendere un compito da una singola dimostrazione nel mondo reale.
Perché è importante:i pianificatori esplorano le domande su come gli esseri umani lavoreranno insieme ai robot:quanto è possibile farlo in modo sicuro ed efficiente? Gli autori lo dicono chiaramente. "Affinché i robot possano svolgere compiti utili in ambienti reali, deve essere facile comunicare il compito al robot; questo include sia il risultato finale desiderato che qualsiasi suggerimento sui mezzi migliori per raggiungere quel risultato."
Frederic Lardinois in TechCrunch soppesato:"I robot industriali in genere si limitano a ripetere un compito ben definito più e più volte. Di solito, ciò significa svolgere quei compiti a distanza di sicurezza dai fragili umani che li hanno programmati. Sempre più, però, i ricercatori stanno ora pensando a come i robot e gli esseri umani possono lavorare in stretta vicinanza agli umani e persino imparare da loro".
Lardinois ha detto Dieter Fox, il direttore senior della ricerca robotica presso NVIDIA, gli ha detto che il team voleva abilitare questa prossima generazione di robot in grado di lavorare in sicurezza in stretta vicinanza agli esseri umani. I robot dovranno imparare come possono aiutare le persone, sia in ambienti industriali che nelle case delle persone.
Il team ha mostrato un sistema per dedurre ed eseguire un programma leggibile dall'uomo da una dimostrazione nel mondo reale.
Il sito NVIDIA Developer ha affermato che questo è stato il primo sistema di deep learning nel suo genere in grado di insegnare a un robot a completare un'attività semplicemente osservando le azioni di un essere umano. "Con manifestazioni, un utente può comunicare un'attività al robot e fornire indizi su come eseguire al meglio l'attività."
Il loro sistema prevedeva una serie di reti neurali. Come hanno funzionato:i ricercatori hanno addestrato una sequenza di reti neurali per svolgere compiti associati alla percezione, generazione ed esecuzione del programma.
La loro tecnica:una telecamera ha acquisito un feed video dal vivo di una scena in cui le posizioni e le relazioni degli oggetti sono state dedotte in tempo reale da una coppia di reti neurali. Questi sono stati alimentati a un'altra rete che ha generato un piano per spiegare come ricreare quelle percezioni. Una rete di esecuzione legge il piano e genera azioni per il robot.
Cosa distingue la loro esplorazione dalle ricerche passate? Una differenza sta nell'addestramento delle reti neurali. Gli approcci attuali richiedono grandi quantità di dati di addestramento etichettati, un "grave collo di bottiglia in questi sistemi, ", ha affermato il sito NVIDIA.
In contrasto, "Con la generazione di dati sintetici, una quantità quasi infinita di dati di allenamento etichettati può essere prodotta con pochissimo sforzo."
Lardinois in TechCrunch hanno definito la loro ricerca "un passo importante in questo viaggio complessivo per consentirci di insegnare rapidamente a un robot nuovi compiti".
Dato il forte aspetto visivo di questo processo formativo, scrisse, Il background di Nvidia nell'hardware grafico aiuta sicuramente. TechSpot ha notato come "l'esecuzione di tutte quelle reti neurali richiede alcune serie capacità di calcolo".
I ricercatori hanno utilizzato le GPU NVIDIA TITAN X.
Jonathan Tremblay, Grazie a, Artem Molchanov, Stephen Tyree, Jan Kautz, Stan Birchfield è la squadra dietro il giornale.
© 2018 Tech Xplore