Jenga! #RoboFail. Credito:Fazeli et al., Sci. Robot. 4, eaav3123 (2019)
Nel seminterrato dell'edificio 3 del MIT, un robot sta contemplando attentamente la sua prossima mossa. Colpisce dolcemente una torre di blocchi, cercando il miglior blocco da estrarre senza far crollare la torre, in solitario, movimento lento, ma sorprendentemente agile gioco di Jenga.
Il robot, sviluppato dagli ingegneri del MIT, è dotato di una pinza morbida, un polsino sensibile alla forza, e una fotocamera esterna, tutto ciò che usa per vedere e sentire la torre e i suoi singoli blocchi.
Mentre il robot spinge con cautela contro un blocco, un computer riceve feedback visivo e tattile dalla fotocamera e dal bracciale, e confronta queste misurazioni con i movimenti effettuati in precedenza dal robot. Considera anche i risultati di tali mosse, in particolare, se un blocco, in una certa configurazione e spinto con una certa forza, è stato estratto con successo o meno. In tempo reale, il robot quindi "impara" se continuare a spingere o passare a un nuovo blocco, per non far cadere la torre.
I dettagli del robot che gioca a Jenga sono pubblicati sulla rivista Robotica scientifica . Alberto Rodriguez, il Walter Henry Gale Career Development Assistant Professor presso il Dipartimento di Ingegneria Meccanica del MIT, afferma che il robot dimostra qualcosa che è stato difficile ottenere nei sistemi precedenti:la capacità di apprendere rapidamente il modo migliore per svolgere un'attività, non solo da segnali visivi, come è comunemente studiato oggi, ma anche tattile, interazioni fisiche.
"A differenza di compiti o giochi più puramente cognitivi come gli scacchi o il Go, il gioco di Jenga richiede anche la padronanza di abilità fisiche come sondare, spingendo, tirando, collocazione, e allineare i pezzi. Richiede percezione e manipolazione interattive, dove devi andare e toccare la torre per imparare come e quando spostare i blocchi, " dice Rodriguez. "Questo è molto difficile da simulare, quindi il robot deve imparare nel mondo reale, interagendo con la vera torre Jenga. La sfida chiave è imparare da un numero relativamente piccolo di esperimenti sfruttando il buon senso sugli oggetti e la fisica".
Dice che il sistema di apprendimento tattile che i ricercatori hanno sviluppato può essere utilizzato in applicazioni oltre Jenga, soprattutto in compiti che richiedono un'attenta interazione fisica, compresa la separazione degli oggetti riciclabili dai rifiuti della discarica e l'assemblaggio dei prodotti di consumo.
"In una catena di montaggio di cellulari, in quasi ogni singolo passaggio, la sensazione di un incastro, o una vite filettata, viene dalla forza e dal tatto piuttosto che dalla visione, " Dice Rodriguez. "L'apprendimento di modelli per quelle azioni è il primo terreno per questo tipo di tecnologia".
L'autore principale del documento è la studentessa laureata del MIT Nima Fazeli. Il team comprende anche Miquel Oller, Jiajun Wu, Zheng Wu, e Giosuè Tenenbaum, professore di cervello e scienze cognitive al MIT.
Spingi e tira
Nel gioco di Jenga—swahili per "costruire"—54 blocchi rettangolari sono impilati in 18 strati di tre blocchi ciascuno, con i blocchi in ogni strato orientati perpendicolarmente ai blocchi sottostanti. Lo scopo del gioco è estrarre con cura un blocco e posizionarlo in cima alla torre, costruendo così un nuovo livello, senza rovesciare l'intera struttura.
Per programmare un robot per giocare a Jenga, i tradizionali schemi di apprendimento automatico potrebbero richiedere l'acquisizione di tutto ciò che potrebbe accadere tra un blocco, Il robot, e la torre, un'attività di calcolo costosa che richiede dati da migliaia se non decine di migliaia di tentativi di estrazione di blocchi.
Anziché, Rodriguez e i suoi colleghi hanno cercato un modo più efficiente in termini di dati per consentire a un robot di imparare a giocare a Jenga, ispirato dalla cognizione umana e dal modo in cui noi stessi potremmo avvicinarci al gioco.
Il team ha personalizzato un braccio robotico ABB IRB 120 standard del settore, quindi installa una torre Jenga alla portata del robot, e ha iniziato un periodo di addestramento in cui il robot ha scelto prima un blocco casuale e una posizione sul blocco contro cui spingere. Quindi esercitò una piccola quantità di forza nel tentativo di spingere il blocco fuori dalla torre.
Per ogni tentativo di blocco, un computer ha registrato le misurazioni visive e di forza associate, ed etichettato se ogni tentativo è stato un successo.
Piuttosto che eseguire decine di migliaia di tali tentativi (che comporterebbe la ricostruzione della torre quasi altrettante volte), il robot si è addestrato su circa 300, con tentativi di misurazioni simili e risultati raggruppati in cluster che rappresentano determinati comportamenti di blocco. Ad esempio, un gruppo di potrebbe rappresentare tentativi su un blocco difficile da spostare, contro uno che era più facile da spostare, o che ha fatto cadere la torre quando è stato spostato. Per ogni cluster di dati, il robot ha sviluppato un modello semplice per prevedere il comportamento di un blocco date le sue attuali misurazioni visive e tattili.
Fazeli afferma che questa tecnica di clustering aumenta notevolmente l'efficienza con cui il robot può imparare a giocare, ed è ispirato al modo naturale in cui gli esseri umani raggruppano comportamenti simili:"Il robot costruisce cluster e quindi apprende modelli per ciascuno di questi cluster, invece di imparare un modello che catturi assolutamente tutto ciò che potrebbe accadere."
Accatastamento
I ricercatori hanno testato il loro approccio rispetto ad altri algoritmi di apprendimento automatico all'avanguardia, in una simulazione al computer del gioco utilizzando il simulatore MuJoCo. Le lezioni apprese nel simulatore hanno informato i ricercatori del modo in cui il robot avrebbe imparato nel mondo reale.
Robot che gioca a Jenga. Credito:Fazeli et al., Sci. Robot. 4, eaav3123 (2019)
"Forniamo a questi algoritmi le stesse informazioni che riceve il nostro sistema, per vedere come imparano a giocare a Jenga a un livello simile, " dice Oller. "Rispetto al nostro approccio, questi algoritmi devono esplorare ordini di grandezza in più di torri per imparare il gioco".
Curioso di sapere come il loro approccio di apprendimento automatico si confronta con i giocatori umani reali, il team ha effettuato alcune prove informali con diversi volontari.
"Abbiamo visto quanti blocchi un essere umano è stato in grado di estrarre prima che la torre cadesse, e la differenza non era così tanta, "dice Ollio.
Ma c'è ancora molta strada da fare se i ricercatori vogliono mettere in competizione il loro robot contro un giocatore umano. Oltre alle interazioni fisiche, Jenga richiede strategia, come estrarre solo il blocco giusto che renderà difficile per un avversario estrarre il blocco successivo senza far cadere la torre.
Per adesso, il team è meno interessato a sviluppare un campione di Jenga robotico, e più focalizzato sull'applicazione delle nuove competenze del robot ad altri domini applicativi.
"Ci sono molti compiti che svolgiamo con le nostre mani in cui la sensazione di farlo 'nel modo giusto' arriva nel linguaggio delle forze e dei segnali tattili, " dice Rodriguez. "Per compiti come questi, un approccio simile al nostro potrebbe capirlo."
Questa ricerca è stata sostenuta, in parte, dalla National Science Foundation attraverso la National Robotics Initiative.