Action Schema Networks (ASNets) potrebbe ipoteticamente consentire a un robot di imparare a navigare in un piano con 10 stanze, e poi poter vagare su un piano con migliaia di stanze. Credito:Università Nazionale Australiana
I ricercatori dell'Australian National University (ANU) hanno progettato un nuovo tipo di sistema intelligente basato sul deep learning che può imparare a risolvere problemi decisionali, inclusi problemi più complessi di quelli per cui è stato addestrato a risolvere.
Il deep learning è una popolare tecnica di intelligenza artificiale per attività come la creazione di didascalie per descrivere immagini, trascrivere il parlato in testo e imparare a riprodurre video o giochi da tavolo solo dalle immagini.
Il ricercatore capo Sam Toyer ha affermato che il sistema, chiamate Action Schema Networks (ASNet), potrebbe ipoteticamente consentire a un robot di imparare a navigare in un piano con 10 stanze, e poi poter vagare su un piano con migliaia di stanze.
"La capacità di ASNets di risolvere problemi molto più grandi è un punto di svolta, " disse il signor Toyer, che ha sviluppato ASNets come parte della sua tesi durante il suo Bachelor of Advanced Computing (Research &Development) presso l'ANU ed è stato premiato con una University Medal.
"Utilizzando il nostro sistema basato su ASNet, potremmo potenzialmente creare nuove applicazioni di sicurezza informatica che trovano le vulnerabilità del sistema, o progettare nuovi software di robotica per eseguire compiti specializzati in magazzini automatizzati o missioni spaziali senza equipaggio".
Toyer ha affermato che i sistemi intelligenti si affidano alla tecnologia di pianificazione automatizzata per prendere decisioni.
"Che si tratti di un rover su Marte che sceglie dove scattare foto, o una rete intelligente che decide come isolare un guasto, hai bisogno di un algoritmo di pianificazione per scegliere la migliore linea d'azione."
Il signor Toyer ha affermato che alcuni sistemi basati sull'apprendimento profondo, compreso AlphaGo, era stato utilizzato per risolvere problemi decisionali.
"AlphaGo, che ha raggiunto abilità sovrumane nel gioco del Go, è un esempio recente e noto, " Egli ha detto.
"Però, sistemi come AlphaGo possono giocare solo su un tabellone di dimensioni fisse.
"In contrasto, Gli ASNet possono imparare a risolvere problemi di dimensione variabile. Ciò consente loro di apprendere rapidamente ciò che devono sapere su piccoli, problemi facili, quindi trasferisci quella conoscenza direttamente a problemi molto più grandi senza riqualificazione."
Il co-ricercatore Dr. Felipe Trevizan di ANU e Data61 di CSIRO ha affermato che ASNet non ha gareggiato contro un avversario come fa AlphaGo.
"Piuttosto, è specializzata nella risoluzione di problemi in ambienti dinamici e incerti, " Egli ha detto.
Professoressa Sylvie Thiebaux, uno degli accademici dell'ANU che supervisiona la tesi del signor Toyer, ha detto che la ricerca è stata una prova di concetto, che potrebbe essere ulteriormente sviluppato con l'industria da utilizzare nella robotica intelligente per eseguire compiti in modo autonomo in un'ampia gamma di contesti.
Ha detto che il sistema ha imparato a giocare a un gioco per organizzare fino a 35 blocchi in una particolare formazione, avendo ricevuto solo 25 problemi utilizzando fino a nove blocchi come parte della sua formazione.
"Abbiamo fornito ad ASNets una descrizione del gioco, alcuni esempi di piani per problemi semplici con un numero ridotto di blocchi, e poi ha imparato a risolvere problemi molto più complessi, ", ha affermato il professor Thiébaux della ANU Research School of Computer Science.
Professore associato Lexing Xie della ANU Research School of Computer Science, che ha co-diretto la tesi del signor Toyer, ha affermato che ASNets è un modo creativo per utilizzare il deep learning.
"Questo lavoro è il primo a prendere in prestito progetti per il riconoscimento visivo per risolvere problemi decisionali che sembrano di natura molto diversa, ma condividono strutture logiche, " lei disse.