• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Un approccio di imitazione dell'apprendimento per addestrare i robot senza la necessità di vere dimostrazioni umane

    Figura che spiega come funziona l'approccio di apprendimento proposto dai ricercatori. Credito:Bonardi, James &Davison.

    La maggior parte degli umani può imparare a completare un determinato compito osservando un'altra persona che lo esegue solo una volta. Robot programmati per imparare imitando gli umani, però, in genere devono essere addestrati su una serie di dimostrazioni umane prima che possano riprodurre efficacemente il comportamento desiderato.

    I ricercatori sono stati recentemente in grado di insegnare ai robot a eseguire nuovi compiti facendo osservare loro una singola dimostrazione umana, utilizzando approcci di meta-apprendimento. Però, queste tecniche di apprendimento in genere richiedono dati del mondo reale che possono essere costosi e difficili da raccogliere.

    Per vincere questa sfida, un team di ricercatori dell'Imperial College di Londra ha sviluppato un nuovo approccio che consente l'apprendimento dell'imitazione one-shot nei robot senza la necessità di dimostrazioni umane nel mondo reale. Il loro approccio, presentato in un articolo pre-pubblicato su arXiv, utilizza algoritmi noti come reti di controllo integrate nelle attività (TecNets), che consentono agli agenti artificiali di apprendere come completare le attività da una o più dimostrazioni, così come i dati di allenamento generati artificialmente.

    "Mostriamo che con le reti di controllo integrate nelle attività, possiamo dedurre politiche di controllo incorporando dimostrazioni umane che possono condizionare una politica di controllo e ottenere un apprendimento per imitazione one-shot, " scrivono i ricercatori nel loro paper.

    L'approccio presentato dai ricercatori non richiede alcuna interazione con umani reali durante l'addestramento del robot. Il metodo utilizza TechNets per dedurre criteri di controllo, incorporare dimostrazioni umane che possono condizionare una data politica di controllo e, in definitiva, consentire l'apprendimento dell'imitazione in un colpo solo.

    Per eliminare la necessità di dimostrazioni umane nel mondo reale durante l'addestramento, i ricercatori hanno utilizzato un set di dati di video che simulano dimostrazioni umane, che hanno generato utilizzando PyRep, un toolkit rilasciato di recente per la ricerca sull'apprendimento dei robot. Usando PyRep, i ricercatori hanno modellato un braccio 3D simile a quello umano e lo hanno scomposto in forme per riprodurre movimenti che assomigliano a quelli osservati negli esseri umani.

    Hanno quindi creato un set di dati composto da video in cui questo braccio simulato ha eseguito una serie di compiti e lo ha utilizzato per addestrare un sistema robotico. In definitiva, il robot è stato in grado di imparare a completare un'attività semplicemente analizzando questi video di simulazione e una singola dimostrazione umana nel mondo reale.

    "È importante che non usiamo un vero braccio umano per fornire dimostrazioni durante l'addestramento, ma sfrutta invece la randomizzazione del dominio in un'applicazione che non è stata vista prima:trasferimento da sim a reale su esseri umani, " spiegano i ricercatori nel loro articolo.

    Il team ha valutato il nuovo approccio di apprendimento one-shot sia nelle simulazioni che nel mondo reale, usarlo per addestrare un robot a completare compiti che prevedevano il posizionamento e la spinta di oggetti. Sorprendentemente, il loro metodo di apprendimento ha ottenuto risultati paragonabili a quelli ottenuti utilizzando un approccio basato sull'apprendimento basato sull'imitazione più convenzionale, anche se comporta l'addestramento di un robot su video generati artificialmente, piuttosto vere dimostrazioni umane.

    I ricercatori scrivono, "Siamo stati in grado di ottenere prestazioni simili a un metodo alternativo all'avanguardia che si basa su migliaia di dimostrazioni di addestramento raccolte nel mondo reale, pur rimanendo resistente ai cambiamenti del dominio visivo, come sfondi sostanzialmente diversi”.

    L'approccio sviluppato da questo team di ricercatori potrebbe consentire l'apprendimento dell'imitazione one-shot per un certo numero di robot senza la necessità di raccogliere grandi quantità di dimostrazioni umane nel mondo reale. Questo potrebbe risparmiare un sacco di fatica, risorse e tempo per coloro che cercano di addestrare i robot utilizzando l'apprendimento per imitazione. I ricercatori stanno ora pianificando di studiare altre azioni su cui i robot potrebbero essere addestrati utilizzando il loro approccio.

    "Speriamo di indagare ulteriormente sulla varietà di azioni umane che possono essere trasferite dalla simulazione alla realtà, " hanno scritto i ricercatori nel loro articolo. "Ad esempio, in questo lavoro, abbiamo dimostrato che un braccio umano può essere trasferito, ma lo stesso metodo funzionerebbe da dimostrazioni che includessero l'intero torso di un essere umano?"

    © 2019 Science X Network




    © Scienza https://it.scienceaq.com