Credito:FB
Jason Weston, con dottorato in machine learning presso l'Università di Londra e Douwe Kiela, con dottorato presso l'Università di Cambridge con tesi sulla semantica di base nelle modalità percettive, sono ricercatori di Facebook Research e hanno presentato al mondo il loro formidabile team Talk the Walk.
Talk the Walk apre gli occhi agli scienziati interessati a fare di più per l'IA come agente di conversazione. In questi giorni, non si limitano a gongolare sugli assistenti vocali che dicono alla gente quando inizia il concerto o se pioverà. Gli scienziati stanno esplorando dialoghi mirati.
Quanto suona facile? Non prendetevi in giro. Cercare di arrivarci è difficile.
Azienda veloce si è rivolto a Kiela per le ragioni per cui lo sforzo della guida turistica ha un peso di ricerca. "Questo compito è molto importante per la ricerca sull'intelligenza artificiale perché è molto difficile, "Kela dice, "e poiché combina tutti questi interessanti problemi:la percezione visiva del trecentosessanta, navigazione basata su mappe, ragionamento visivo, e le comunicazioni in linguaggio naturale attraverso il dialogo."
Hanno fatto il punto, prima di tutto, che il linguaggio naturale è comprensibile alla maggior parte delle persone "senza richiedere ulteriori passaggi o conoscenze per decifrarne il significato". Verso quel fine, Il gruppo di ricerca sull'intelligenza artificiale di Facebook, GIUSTO, sono agganciati a una certa strategia per l'intelligenza artificiale per mostrare la comprensione del linguaggio a livello umano.
Quella strategia, scrissero, "è addestrare quei sistemi in modo più naturale, legando il linguaggio ad ambienti specifici. Proprio come i bambini imparano prima a dare un nome a ciò che possono vedere e toccare, questo approccio, a volte indicato come IA incorporata, favorisce l'apprendimento nel contesto dell'ambiente circostante di un sistema, piuttosto che allenarsi attraverso grandi serie di dati di testo (come Wikipedia)."
Entra in Talk the Walk. Stanno insegnando ai sistemi di intelligenza artificiale a navigare per le strade di New York utilizzando scambi linguistici che sembrano naturali tra guida e turista. Due bot hanno compiti. Il bot turistico vuole farsi strada attraverso immagini a 360 gradi dei quartieri di New York City. Il bot guida è quello di aiutare con una mappa del quartiere. Il team ha utilizzato MASC (Masked Attention for Spatial Convolution) in modo che il bot guida potesse concentrarsi sul posto giusto sulla mappa.
Hanno detto che il loro obiettivo è "raggiungere quell'alto grado di prestazioni sintetiche attraverso l'interazione del linguaggio naturale, e per sfidare la comunità a fare lo stesso".
Le informazioni per Talk the Walk sono su GitHub. "La condivisione di questo lavoro fornirà ad altri ricercatori un quadro per testare i propri sistemi di intelligenza artificiale incorporati, soprattutto per quanto riguarda il dialogo».
Una telecamera a 360 gradi ha catturato 5 quartieri, La cucina dell'inferno, villaggio orientale, Distretto finanziario, Upper East Side, e Williamsburg a Brooklyn. Daniel Terdiman in Azienda veloce ha detto che il robot guida utilizzava una mappa 2D standard con waypoint generici:"banca, " "caffetteria, " "deli"—per fornire le sue istruzioni su come navigare.
Il lavoro di intelligenza artificiale coinvolto riguarda la percezione di un determinato ambiente, navigando in esso, e comunicarlo. Lucas Matney in TechCrunch ha scritto che "In "Talk the Walk, " il bot AI guida aveva tutti questi dati cartografici 2D e il bot turistico aveva tutti questi ricchi dati visivi a 360 gradi, ma era solo attraverso la comunicazione tra loro che erano in grado di eseguire le loro direttive."
Turista:Woo ho trovato un Chipotle
Guida:Haha
Turista:"Sono in diagonale da una banca"
Guida:"Fantastico".
Il documento che discute il loro lavoro può essere trovato su arXiv. Si intitola "Talk the Walk:Navigating New York City through Grounded Dialogue, " di Harm de Vries, Kurt Shuster, Dhruv Batra, Devi Parik, Jason Weston e Douwe Kiela.
© 2018 Tech Xplore