• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Altro
    Le simulazioni basate sull'apprendimento per rinforzo mostrano il desiderio umano di volere sempre di più può accelerare l'apprendimento

    Progettazione dell'ambiente. (a) L'ambiente gridworld bidimensionale utilizzato nell'Esperimento 1. (b) Per studiare le proprietà della ricompensa ottimale, abbiamo apportato diverse modifiche all'ambiente gridworld. Riga superiore:nell'ambiente di apprendimento una tantum, l'agente può scegliere di rimanere costantemente nel luogo del cibo dopo averlo raggiunto. Nell'ambiente di apprendimento permanente, l'agente è stato teletrasportato in una posizione casuale nel mondo della griglia non appena ha raggiunto lo stato di cibo. Riga centrale:nell'ambiente stazionario, il cibo è rimasto nella stessa posizione per tutta la vita dell'agente. Nell'ambiente non stazionario, il cibo ha cambiato la sua posizione durante la vita dell'agente. Riga inferiore:abbiamo utilizzato un gridworld di dimensioni 7 × 7 per simulare un'impostazione di ricompensa densa. Per simulare un'impostazione di ricompensa scarsa, abbiamo aumentato le dimensioni del gridworld a 13 × 13. Credito:PLOS Computational Biology (2022). DOI:10.1371/journal.pcbi.1010316

    Un trio di ricercatori, due della Princeton University, l'altro del Max Planck Institute for Biological Cybernetics, ha sviluppato una simulazione basata sull'apprendimento per rinforzo che mostra che il desiderio umano di voler sempre di più potrebbe essersi evoluto come un modo per accelerare l'apprendimento. Nel loro articolo pubblicato su PLOS Computational Biology ad accesso aperto , Rachit Dubey, Thomas Griffiths e Peter Dayan descrivono i fattori coinvolti nelle loro simulazioni.

    I ricercatori che studiano il comportamento umano sono stati spesso perplessi dai desideri apparentemente contraddittori delle persone. Molte persone hanno un desiderio incessante di più di determinate cose, anche se sanno che soddisfare quei desideri potrebbe non portare al risultato desiderato. Molte persone vogliono sempre più soldi, ad esempio, con l'idea che più soldi renderebbero la vita più facile, il che dovrebbe renderli più felici. Ma una serie di studi ha dimostrato che fare più soldi raramente rende le persone più felici (ad eccezione di coloro che iniziano con un livello di reddito molto basso). In questo nuovo sforzo, i ricercatori hanno cercato di capire meglio perché le persone si sarebbero evolute in questo modo. A tal fine, hanno costruito una simulazione per imitare il modo in cui gli esseri umani rispondono emotivamente agli stimoli, come il raggiungimento degli obiettivi. E per capire meglio perché le persone potrebbero sentirsi in quel modo, hanno aggiunto dei checkpoint che potrebbero essere usati come un barometro della felicità.

    La simulazione era basata sull'apprendimento per rinforzo, in cui le persone (o una macchina) continuano a fare cose che offrono una ricompensa positiva e smettono di fare cose che non offrono alcuna ricompensa o una ricompensa negativa. I ricercatori hanno anche aggiunto reazioni emotive simulate ai noti impatti negativi dell'abitudine e del confronto, per cui le persone diventano meno felici nel tempo man mano che si abituano a qualcosa di nuovo e diventano meno felici quando vedono che qualcun altro ha più di qualcosa che vogliono.

    Durante l'esecuzione della simulazione, i ricercatori hanno scoperto che ha raggiunto gli obiettivi più velocemente quando sono entrati in gioco l'assuefazione e il confronto, un suggerimento che tali reazioni emotive potrebbero anche svolgere un ruolo nell'apprendimento più rapido negli esseri umani. Hanno anche scoperto che la simulazione è risultata meno "felice" di fronte a più scelte in merito a possibili opzioni realizzabili rispetto a quando ce n'erano solo poche tra cui scegliere.

    I ricercatori suggeriscono che il motivo per cui le persone sono inclini a rimanere intrappolate in un ciclo infinito di volere sempre di più è perché nel complesso aiuta gli esseri umani ad imparare più velocemente. + Esplora ulteriormente

    Felicità:perché l'apprendimento, non le ricompense, può essere la chiave

    © 2022 Rete Science X




    © Scienza https://it.scienceaq.com