Pipeline completa per l'addestramento del modello di valutazione. Attestazione:arXiv:1907.08321 [cs.LG]
Gli scacchi e l'intelligenza artificiale sono di nuovo nelle notizie, questa volta nei rapporti su una squadra che esplora un modello per gli scacchi tramite l'elaborazione del linguaggio naturale (PNL). Il meccanismo di apprendimento era il chiacchiericcio degli scacchi, un chiacchiericcio ben scelto. Si sono pre-addestrati sui sentimenti di commento associati alle mosse degli scacchi. I sentimenti hanno guidato il processo decisionale dell'agente.
Il loro algoritmo di scacchi risultante è stato progettato per valutare la qualità delle mosse di scacchi analizzando la reazione di commentatori esperti.
I tre ricercatori dell'University College di Londra hanno scritto un documento che descrive i loro metodi e risultati. Isaac Kamlish, Isaac Chocron e Nicholas McCarthy hanno scritto "SentiMATE:Imparare a giocare a scacchi attraverso l'elaborazione del linguaggio naturale, " ed è su arXiv. Il documento è stato presentato il mese scorso.
"Vi presentiamo SentiMATE, un nuovo modello di Deep Learning end-to-end per gli scacchi, impiegando l'elaborazione del linguaggio naturale che mira ad apprendere un'efficace funzione di valutazione che valuta la qualità del movimento. Questa funzione è pre-addestrata sul sentimento di commento associato alle mosse di allenamento, ed è utilizzato per guidare e ottimizzare il processo decisionale di gioco dell'agente."
Non invitare AlphaZero e questo modello di PNL alla stessa festa; starebbero ai lati opposti della stanza. I ricercatori hanno scritto che AlphaZero di Deep Mind ha avuto successo "dopo milioni di iterazioni di auto-riproduzione e utilizzando migliaia di Tensor Processing Unit (TPU)". Non era il caso della nuova ricerca.
Anziché, loro hanno detto, miravano a "affrontare la valutazione della qualità dei movimenti individuali attraverso l'uso dell'elaborazione del linguaggio naturale... I dati da diversi siti Web di scacchi sono stati raschiati, che includeva informazioni sulle mosse in corso, e una valutazione qualitativa delle mosse stesse sotto forma di commento, scritto da una vasta gamma di giocatori di scacchi; risultando in un ampio database di mosse con commenti annotati."
"Valuta la qualità delle mosse di scacchi analizzando la reazione di commentatori esperti, " disse Will Knight, Revisione della tecnologia del MIT .
I ricercatori hanno eliminato i commenti che non si riferivano a mosse di alta qualità ed esempi troppo ambigui, Ha aggiunto. "Poi hanno usato un tipo speciale di rete neurale ricorrente e word embedding (una tecnica matematica che collega le parole sulla base del loro significato), addestrato su un altro modello all'avanguardia per l'analisi del linguaggio."
L'algoritmo, chiamato SENTIMATE, ha elaborato da solo le regole di base degli scacchi e diverse strategie chiave, tra cui la biforcazione e l'arrocco.
Il team ha scoperto che SentiMATE era in grado di valutare le mosse degli scacchi "basato su una funzione di valutazione del sentimento pre-addestrata". Hanno concluso che c'erano prove evidenti a sostegno dell'elaborazione del linguaggio naturale utilizzata per addestrare una funzione di valutazione nei motori scacchistici.
Le prestazioni della loro soluzione sono state tutt'altro che spettacolari. Cavaliere ha detto, "non è riuscito a battere in modo coerente alcuni robot di scacchi convenzionali." Quella, però, non dovrebbe distrarre dal fatto che SentiMATE ha funzionato, e il modo in cui ha funzionato:
"SentiMATE ha sorpreso i ricercatori con la sua capacità di elaborare alcuni dei principi di base degli scacchi e diverse strategie chiave, come il fork (quando due o più pezzi sono minacciati contemporaneamente) e l'arrocco (quando il re e il castello si spostano entrambi in una posizione più difensiva sul retro della scacchiera, " hanno detto gli autori.
L'importante da prendere è negli sforzi per progettare un tale programma:la lingua può servire a insegnare a giocare a scacchi con meno dati di pratica richiesti rispetto agli approcci convenzionali?
Tibi Puiu in Scienza ZME pensato a questo:
"Solo questa volta, il loro programma di apprendimento automatico non ha praticato milioni di giochi per padroneggiare gli scacchi, ma ha piuttosto analizzato il linguaggio di commentatori esperti. un giorno, i ricercatori affermano che un approccio simile potrebbe consentire alle macchine di decifrare il linguaggio emotivo e acquisire abilità che altrimenti sarebbero state inaccessibili attraverso la "forza bruta".
Per quanto riguarda il modello che non è un super campione di scacchi, Egli ha detto, "Le prestazioni di alto livello non erano il suo obiettivo, anche se. Dove SentiMATE brilla è nella sua capacità di usare il linguaggio per acquisire un'abilità invece di esercitarla."
Nella loro carta, gli autori hanno parlato dell'importantissimo set di dati per supportare la loro ricerca. "Dopo aver pulito e classificato il set di dati sulla base di commenti, mordendo le mosse di scacchi, e applicando la Sentiment Analysis al commento, presentiamo SentiChess un set di dati di 15, 000 mosse di scacchi rappresentate in formato bit, insieme al loro commento e valutazione del sentimento. Questo set di dati è offerto nella speranza di un ulteriore sviluppo del lavoro sui modelli di scacchi basati sul sentimento, e analisi statistica delle mosse."
Andando avanti, Will Knight ha affermato che le chiacchiere rilevanti per il gioco potrebbero aiutare i programmi di intelligenza artificiale a imparare a giocare in un modo nuovo. E, oltre gli scacchi, "la stessa tecnica potrebbe consentire alle macchine di utilizzare il contenuto emotivo della nostra lingua per padroneggiare vari compiti pratici".
(Come la Revisione della tecnologia del MIT sottotitolo mettilo, "Le macchine che apprezzano le mosse di scacchi 'brillanti' e 'stupide' potrebbero imparare a giocare e fare altre cose in modo più efficiente.")
© 2019 Science X Network