• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • I ricercatori usano i videogiochi per sbloccare nuovi livelli di intelligenza artificiale

    Credito:CC0 Dominio Pubblico

    Le aspettative per le intelligenze artificiali sono molto reali e molto alte. Un'analisi in Forbes proietta i ricavi di A.I. salirà alle stelle da $ 1,62 miliardi nel 2018 a $ 31,2 miliardi nel 2025. Il rapporto includeva anche un sondaggio che ha rivelato che l'84% delle imprese crede che investire nell'intelligenza artificiale. porterà a vantaggi competitivi.

    "È emozionante vedere gli enormi successi e i progressi compiuti negli ultimi anni, "dice Daniel Jiang, assistente professore di ingegneria industriale presso la Swanson School of Engineering dell'Università di Pittsburgh. "Per continuare questa tendenza, stiamo cercando di sviluppare metodi più sofisticati per algoritmi per apprendere strategie per un processo decisionale ottimale".

    Il Dr. Jiang progetta algoritmi che apprendono strategie decisionali in ambienti complessi e incerti. Testando algoritmi in ambienti simulati, possono imparare dai propri errori scoprendo e rafforzando strategie per il successo. Per perfezionare questo processo, Il dottor Jiang e molti ricercatori nel suo campo richiedono simulazioni che rispecchiano il mondo reale.

    "Come ingegneri industriali, in genere lavoriamo su problemi con un focus operativo. Per esempio, trasporto, logistica e catene di approvvigionamento, i sistemi energetici e l'assistenza sanitaria sono diversi settori importanti, " dice. "Tutti questi problemi sono operazioni ad alto rischio con conseguenze nel mondo reale. Non sono gli ambienti migliori per provare tecnologie sperimentali, soprattutto quando molti dei nostri algoritmi possono essere pensati come modi intelligenti per ripetere "prova ed errore" su tutte le possibili azioni".

    Una strategia per preparare l'A.I. affrontare scenari e complicazioni del mondo reale significa utilizzare dati storici. Ad esempio, gli algoritmi potrebbero analizzare decenni di dati per scoprire quali decisioni sono state efficaci e quali hanno portato a risultati non ottimali. Però, i ricercatori hanno trovato difficile testare algoritmi progettati per apprendere comportamenti adattivi utilizzando solo dati del passato.

    Il dottor Jiang spiega, "I dati storici possono essere un problema perché le azioni delle persone fissano le conseguenze e non presentano possibilità alternative. In altre parole, è difficile per un algoritmo porre la domanda "come sarebbero diverse le cose se scegliessi la porta B invece della porta A?" Nei dati storici, tutto ciò che possiamo vedere sono le conseguenze della porta A."

    Videogiochi, in alternativa, offrono ricchi ambienti di test pieni di processi decisionali complessi senza i pericoli di mettere un'intelligenza artificiale immatura. completamente in carica. A differenza del mondo reale, forniscono un modo sicuro per un algoritmo di imparare dai propri errori.

    "I progettisti di videogiochi non creano giochi con l'obiettivo di testare modelli o simulazioni, "Dottor Jiang dice. "Spesso progettano giochi con una duplice missione:creare ambienti che imitano il mondo reale e sfidare i giocatori a prendere decisioni difficili. Questi obiettivi si allineano anche con ciò che stiamo cercando. Anche, i giochi sono molto più veloci. In poche ore di tempo reale, possiamo valutare i risultati di centinaia di migliaia di decisioni di gioco."

    Per testare il suo algoritmo, Il Dr. Jiang ha usato un genere di videogiochi chiamato Multiplayer Online Battle Arena o MOBA. Giochi come League of Legends o Heroes of the Storm sono MOBA popolari in cui i giocatori controllano uno dei tanti personaggi "eroi" e cercano di distruggere le basi degli avversari proteggendo le proprie.

    Un algoritmo di successo per addestrare un gameplay A.I. deve superare diverse sfide, come il processo decisionale in tempo reale e gli orizzonti decisionali lunghi, un termine matematico per quando le conseguenze di alcune decisioni non sono note fino a molto più tardi.

    "Abbiamo progettato l'algoritmo per valutare 41 informazioni e quindi produrre una delle 22 diverse azioni, compreso il movimento, attacchi e mosse speciali, " dice il dottor Jiang. "Abbiamo confrontato diversi metodi di allenamento l'uno contro l'altro. Il giocatore di maggior successo ha utilizzato un metodo chiamato ricerca albero Monte Carlo per generare dati, che viene poi alimentato in una rete neurale."

    La ricerca dell'albero di Monte Carlo è una strategia per il processo decisionale in cui il giocatore si muove casualmente attraverso una simulazione o un videogioco. L'algoritmo analizza quindi i risultati del gioco per dare più peso alle azioni di maggior successo. Nel tempo e in più iterazioni del gioco, le azioni di maggior successo persistono, e il giocatore diventa più bravo a vincere la partita.

    "La nostra ricerca ha fornito anche alcuni risultati teorici per dimostrare che la ricerca albero Monte Carlo è una strategia efficace per addestrare un agente a prendere decisioni difficili in tempo reale, anche quando si opera in un mondo incerto, "Il dottor Jiang spiega.

    Il Dr. Jiang ha pubblicato la sua ricerca in un articolo scritto in collaborazione con Emmanuel Ekweike e Han Liu e ha presentato i risultati alla Conferenza internazionale 2018 sull'apprendimento automatico a Stoccolma, Svezia la scorsa estate.

    All'Università di Pittsburgh, continua a lavorare nell'area del processo decisionale sequenziale con il dottorato di ricerca. studenti Yijia Wang e Ibrahim El-Shar. Il team si concentra sui problemi legati al ride-sharing, mercati energetici, e salute pubblica. Mentre le industrie si preparano a mettere l'A.I. responsabile di responsabilità critiche, Il Dr. Jiang assicura che gli algoritmi sottostanti rimangano al top del loro gioco.


    © Scienza https://it.scienceaq.com