Un'illustrazione di DeepCube. Il processo di formazione e risoluzione è suddiviso in ADI e MCTS. Primo, addestriamo iterativamente un DNN stimando il vero valore degli stati di input utilizzando la ricerca in ampiezza. Quindi, utilizzando il DNN per guidare l'esplorazione, risolviamo i cubi usando Monte Carlo Tree Search. Attestazione:arXiv:1805.07470 [cs.AI]
Sbloccare modi per una macchina per risolvere il cubo di Rubik? Numerose squadre possono alzarsi in piedi e dire che ci sono stato, Fatto. Abbiamo visto molti titoli, pure, su come hanno timbrato il cartellino per stabilire i record di tempo. Allora, qual è il grosso problema dell'ultima storia del cubo che risolve la macchina?
David Grossman in Meccanica popolare ha osservato che gli scienziati della California hanno portato le cose nella terza dimensione con un algoritmo in grado di capire come risolvere un cubo di Rubik.
Un team dell'Università della California di Irvine è alla base di un approccio che ha attirato un'attenzione speciale. "Risolvere il cubo di Rubik senza la conoscenza umana" è il titolo del loro articolo, che descrive la loro esplorazione, e il documento è su arXiv.
Stephen McAleer, Bosco Agostinelli, Gli autori sono Alexander Shmakov e Pierre Baldi.
"Introduciamo l'iterazione autodidattica:un nuovo algoritmo di apprendimento per rinforzo che è in grado di insegnare a se stesso come risolvere il cubo di Rubik senza l'assistenza umana".
Paul Lilly in HotHardware :Le macchine in genere utilizzano un metodo di autoapprendimento basato su un sistema di ricompense. I ricercatori alimentano la macchina con le regole del gioco, e poi utilizza un processo di ricompensa per determinare se una mossa è stata buona o cattiva,
Però, come hanno scritto gli autori, "per molti ambienti di ottimizzazione combinatoria, le ricompense sono scarse e non è garantito che gli episodi finiscano."
Hanno seguito il percorso dell'iterazione autodidattica. Loro hanno detto, "Per risolvere il cubo di Rubik usando l'apprendimento per rinforzo, l'algoritmo imparerà una politica. La politica determina quale mossa intraprendere in un dato stato".
Revisione della tecnologia del MIT appuntato come funziona. "Dato un cubo irrisolto, la macchina deve decidere se uno spostamento specifico è un miglioramento della configurazione esistente. Per fare questo, deve essere in grado di valutare la mossa. L'iterazione autodidattica fa questo partendo dal cubo finito e lavorando a ritroso per trovare una configurazione simile alla mossa proposta."
Gli autori hanno scritto che "DeepCube ha scoperto una notevole quantità di conoscenza del cubo di Rubik durante il suo processo di addestramento, compresa la conoscenza di come utilizzare complessi gruppi di permutazione e strategie simili ai migliori "velocità-cuber" umani."
La loro macchina da allenamento era un server Intel Xeon E5-2620 a 32 core con tre GPU NVIDIA Titan XP. Hanno chiamato il loro risolutore DeepCube.
La valutazione di Lilly:non è una soluzione perfetta al problema, ma è impeccabile in termini di precisione.
Il team ha dichiarato nell'abstract del documento che "Il nostro algoritmo è in grado di risolvere il 100% dei cubi mescolati casualmente raggiungendo una lunghezza media di risoluzione di 30 mosse, inferiore o uguale ai risolutori che utilizzano la conoscenza del dominio umano".
Perché è importante:è una storia di risoluzione dei cubi e altro ancora. La squadra ha menzionato ulteriori obiettivi.
"Oltre ad ulteriori lavori con il cubo di Rubik, stiamo lavorando per estendere questo metodo per trovare soluzioni approssimate ad altri problemi di ottimizzazione combinatoria come la previsione della struttura terziaria delle proteine. Molti problemi di ottimizzazione combinatoria possono essere pensati come problemi decisionali sequenziali, nel qual caso possiamo usare l'apprendimento per rinforzo."
Revisione della tecnologia del MIT ha affermato che il nuovo approccio ha affrontato "un problema importante nell'informatica:come risolvere problemi complessi quando l'aiuto è minimo".
Idealmente, disse Lilly, "potrebbe portare a trovare cure per malattie, se il metodo è in grado di funzionare anche su cose del genere come fa con la risoluzione di un cubo di Rubik."
Revisione della tecnologia del MIT :"La vera prova, Certo, sarà il modo in cui questo approccio affronta problemi più complessi come il ripiegamento delle proteine. Staremo a vedere come si comporterà".
© 2018 Tech Xplore