Hanabi:l'IA di Facebook passa al gameplay cooperativo

Credito:CC0 Dominio Pubblico

Il gioco di carte Hanabi è stato preso come una sfida dall'IA di Facebook, ed è piuttosto una sfida considerando che stanno entrando in un regno in cui giocare non è solo una questione di un avversario che batte un altro, ma un gioco di carte "cooperativo" in cui una squadra in competizione si aiuta a vicenda.

Jonathan Vanian, Fortuna , ha guidato i lettori attraverso il gioco come mezzo di introduzione:

"...:le squadre da due a cinque giocatori ricevono carte casuali di diversi colori e numeri che rappresentano i punti. L'obiettivo per le squadre è quello di posare le carte su un tavolo, raggruppati per colore, nell'ordine numerico corretto. Il problema, però, è che i giocatori non possono vedere le proprie carte mentre i loro compagni di squadra possono. Un giocatore può dare suggerimenti a un altro, come fare un commento su un certo colore, che farebbe in modo che l'altro faccia qualcosa come giocare o scartare una carta. Il dilemma è che il giocatore deve dedurre cosa significa l'indizio del proprio compagno di squadra".

I leader aziendali hanno mostrato una propensione verso Hanabi come esperienza di apprendimento di team building; ora ha attirato l'attenzione dei ricercatori di intelligenza artificiale che pensavano di costruire sistemi di intelligenza artificiale straordinari.

"Raggiungere punteggi quasi perfetti in un oscuro gioco di carte francese è fantastico e tutto tranne Facebook ha piani più grandi per la sua IA cooperativa, " disse Engadget .

ricercatore di Facebook, Tom Lerer, è stato citato in Engadget :"Quello che stiamo guardando sono agenti artificiali che possono ragionare meglio sulle interazioni cooperative con gli umani e chatbot che possono ragionare sul perché la persona con cui stanno chattando ha detto quello che hanno fatto... Chatbot che possono ragionare meglio sul perché le persone dire le cose che fanno senza dover enumerare ogni dettaglio di ciò che chiedono è un'applicazione molto semplice di questo tipo di tecnica di ricerca."

Quali strategie di intelligenza artificiale hanno messo in atto i ricercatori?

Vanian ha identificato una tecnica di ricerca precedentemente utilizzata da DeepMind; consente a più robot Hanabi di valutare più opzioni di gioco condividendo le informazioni tra loro. In combinazione con l'apprendimento per rinforzo, i bot di Facebook hanno imparato a giocare ad Hanabi l'uno con l'altro.

Gli autori dietro questa indagine hanno scritto un articolo discutendo il loro lavoro e l'articolo è su arXiv (pubblicato su Intelligenza artificiale rivista). "The Hanabi Challenge:A New Frontier for AI Research" è il titolo dell'articolo, e gli autori hanno affermato di aver considerato Hanabi come un "dominio di sfida con nuovi problemi che derivano dalla sua combinazione di gameplay puramente cooperativo e informazioni imperfette in un ambiente da due a cinque giocatori".

Gli autori hanno osservato che è meglio descritto come un tipo di solitario di squadra e le informazioni imperfette del gioco derivano dal fatto che ogni giocatore non è in grado di vedere le proprie carte (quelle che hanno e su cui possono agire), ognuno dei quali ha un colore e un rango.

Per risultati di ricerca riproducibili, gli autori hanno rilasciato un ambiente Hanabi RL open source chiamato Hanabi Learning Environment scritto in Python e C++.

Altrove ma pertinenti ai loro obiettivi nella ricerca riproducibile, Girolamo Pesenti, vicepresidente AI di Facebook, era in una recente sessione di domande e risposte con Will Knight in Cablato .

Knight ha chiesto a Pesenti di ricreare una ricerca innovativa.

"È qualcosa di cui Facebook AI è molto appassionato, ", ha detto Pesenti. "Quando le persone fanno cose che non sono riproducibili, crea molte sfide. Se non riesci a riprodurlo, è un sacco di investimenti persi... La bellezza dell'IA è che alla fine si tratta di sistemi gestiti da computer. Quindi è un ottimo candidato, come sottocampo della scienza, essere riproducibile. Riteniamo che il futuro dell'IA sarà riproducibile quasi per impostazione predefinita. Cerchiamo di rendere open source la maggior parte del codice che stiamo producendo in AI, in modo che altre persone possano costruirci sopra."

Gli autori, nella loro carta, avere una sezione con la traversa "Hanabi:The Benchmark".

Questo sforzo di ricerca riguarda l'utilizzo di Hanabi come problema di riferimento impegnativo per l'IA. Le proprietà uniche lo distinguono dagli altri benchmark. "È un problema di apprendimento multi-agente, a differenza di, Per esempio, l'ambiente di apprendimento arcade. È anche un gioco di informazioni imperfette, dove i giocatori hanno una conoscenza asimmetrica dello stato dell'ambiente, che rende il gioco più simile al poker che agli scacchi, backgammon, o andare."

Andrea Tarantola in Engadget ripreso su questo punto. La vita nel mondo reale non è un gioco a somma zero come il poker o Starcraft, Egli ha detto, "e abbiamo bisogno dell'intelligenza artificiale per lavorare con noi, non contro di noi".

Due Engadget i commenti dei lettori non hanno mostrato soggezione per ciò che è stato raggiunto finora. "Sono abbastanza sicuro che sapere come gli umani di solito giocano a un singolo gioco di carte e una conoscenza generale delle intenzioni umane sono due cose molto diverse, " ha detto uno. Un altro ha detto che "l'identificazione dei modelli di azione è ben lontana dalla teoria della mente... Si potrebbe obiettare se stanno tentando di attribuire la teoria della mente, la loro precisione ha bisogno di lavoro."