Credito:CC0 Dominio Pubblico
La pratica rende perfetti:è un adagio che ha aiutato gli umani a diventare altamente abili e ora è un approccio che viene applicato ai robot.
Gli scienziati informatici dell'Università di Leeds stanno utilizzando le tecniche di intelligenza artificiale (AI) di pianificazione automatizzata e apprendimento per rinforzo per "addestrare" un robot a trovare un oggetto in uno spazio disordinato, come uno scaffale di un magazzino o in un frigorifero e spostalo.
L'obiettivo è quello di sviluppare l'autonomia robotica, in modo che la macchina possa valutare le circostanze uniche presentate in un'attività e trovare una soluzione, come un robot che trasferisce competenze e conoscenze a un nuovo problema.
I ricercatori di Leeds presentano oggi i loro risultati (lunedì, 4 novembre alla Conferenza internazionale sulla robotica e sui sistemi intelligenti a Macao, Cina.
La grande sfida è che in un'area ristretta, un braccio robotico potrebbe non essere in grado di afferrare un oggetto dall'alto. Invece deve pianificare una sequenza di mosse per raggiungere l'oggetto target, forse manipolando altri oggetti fuori mano. La potenza del computer necessaria per pianificare un'attività del genere è così grande, il robot si fermerà spesso per diversi minuti. E quando esegue la mossa, spesso fallirà.
Sviluppare l'idea della pratica rende perfetti, gli scienziati informatici di Leeds stanno mettendo insieme due idee dall'intelligenza artificiale.
Uno è la pianificazione automatizzata. Il robot è in grado di "vedere" il problema attraverso un sistema di visione, in effetti un'immagine. Il software nel sistema operativo del robot simula la possibile sequenza di movimenti che potrebbe compiere per raggiungere l'oggetto target.
Ma le simulazioni che sono state "provate" dal robot non riescono a catturare la complessità del mondo reale e quando vengono implementate, il robot non riesce a eseguire l'attività. Per esempio, può far cadere oggetti dallo scaffale.
Quindi il team di Leeds ha combinato la pianificazione con un'altra tecnica di intelligenza artificiale chiamata apprendimento per rinforzo.
L'apprendimento per rinforzo coinvolge il computer in una sequenza di tentativi ed errori, circa 10, 000 in totale, per raggiungere e spostare gli oggetti. Attraverso questi tentativi ed errori, il robot "apprende" quali azioni ha pianificato hanno maggiori probabilità di concludersi con successo.
Il computer intraprende l'apprendimento stesso, iniziando selezionando casualmente una mossa pianificata che potrebbe funzionare. Ma mentre il robot impara per tentativi ed errori, diventa più abile nel selezionare quelle mosse pianificate che hanno maggiori possibilità di successo.
Dott. Matteo Leonetti, della Scuola di Informatica, ha dichiarato:"L'intelligenza artificiale è brava a consentire ai robot di ragionare, ad esempio, abbiamo visto robot coinvolti in partite di scacchi con grandi maestri.
"Ma i robot non sono molto bravi in ciò che gli umani fanno molto bene:essere altamente mobili e abili. Queste abilità fisiche sono state cablate nel cervello umano, il risultato dell'evoluzione e del modo in cui pratichiamo, pratichiamo e pratichiamo.
"E questa è un'idea che stiamo applicando alla prossima generazione di robot".
Secondo Wissam Bejjani, un dottorato di ricerca studente che ha scritto il documento di ricerca, il robot sviluppa la capacità di generalizzare, applicare ciò che ha pianificato a un insieme unico di circostanze.
Ha detto:"Il nostro lavoro è significativo perché combina la pianificazione con l'apprendimento per rinforzo. Molte ricerche per provare a sviluppare questa tecnologia si concentrano su uno solo di questi approcci.
"Il nostro approccio è stato convalidato dai risultati che abbiamo visto nel laboratorio di robotica dell'Università.
"Con un problema, dove il robot doveva spostare una grossa mela, è andato prima sul lato sinistro della mela per allontanare il disordine, prima di manipolare la mela.
"Lo ha fatto senza che il disordine cadesse fuori dal confine dello scaffale."
Dottor Mehmet Dogar, Professore Associato presso la Scuola di Informatica, è stato coinvolto anche nello studio. Ha detto che l'approccio aveva accelerato il tempo di "pensiero" del robot di un fattore dieci:le decisioni che richiedevano 50 secondi ora richiedono 5 secondi.