Parole frequenti dal dizionario Linguistic Inquiry e Word Count Positive Emotion che si correlano come previsto (in alto) o inaspettato (in basso) con la felicità della contea di Gallup. Credito:Kokil Jaidka e Johannes C. Eichstaedt.
I social media possono rivelare più di un semplice stato d'animo o stato d'animo di una singola persona. Può catturare gli stati psicologici di un'intera popolazione, secondo una nuova ricerca dello studioso di Stanford Johannes Eichstaedt.
I risultati di Eichstaedt, pubblicato il 27 aprile su Atti dell'Accademia Nazionale delle Scienze , hanno scoperto che attraverso l'apprendimento automatico, insegnando a un computer a identificare e analizzare i modelli in grandi set di dati, i ricercatori possono vedere, in linea di principio, come sta andando una società in tempo reale.
"Questi metodi mostrano davvero come eseguire misurazioni psicologiche nel 21° secolo nel nostro mondo digitale, " disse Eichstaedt, che è assistente professore di psicologia presso la School of Humanities and Sciences e junior fellow presso lo Stanford Institute for Human-Centered Artificial Intelligence.
Per l'ultimo decennio, Eichstaedt ha testato come utilizzare i social media, compreso Twitter, come un modo per misurare il benessere di una comunità. Sostiene che i social media forniscono il più grande set di dati sul comportamento, emozioni e pensieri nella storia umana.
Mentre i ricercatori riconoscono nel documento che Twitter non è rappresentativo della popolazione degli Stati Uniti, può ancora fornire informazioni su come le persone vivono la loro vita quotidiana.
"Ciò che ci interessa davvero è quanto bene sta facendo la popolazione in termini di salute psicologica e fisica, piuttosto che semplicemente che il PIL sta crescendo, " ha detto Eichstaedt. "Potrebbe non interessarti misurare il benessere soggettivo in sé e per sé, ma il benessere soggettivo influisce sulla mortalità, comprese le malattie cardiache. Influisce anche sui risultati economici. Così, è una variabile piuttosto importante da catturare per una popolazione".
Dalla ricerca dei sondaggi ai social media
Per valutare i diversi modi di analizzare il benessere di una regione, Eichstaedt e un team di ricercatori hanno confrontato oltre un miliardo di Tweet geo-tag dal 2009 al 2015 con 1,7 milioni di risposte dal Gallup-Sharecare Well-Being Index, un'indagine approfondita che misura come le persone vivono la vita quotidiana.
I ricercatori hanno a lungo fatto affidamento su sondaggi come Gallup per misurare il benessere di una popolazione. Pur essendo accurato, possono essere imprese costose e dispendiose in termini di tempo. A volte ci vogliono anni per raccogliere dati sufficienti per stime approssimative della comunità, disse Eichstaedt.
Ma quando potenziato con tecniche basate sui dati, parte di tale onere può essere alleviato. Eichstaedt ha scoperto che quando un algoritmo viene addestrato con le risposte degli utenti a un sondaggio scritto sul benessere e un campione di post dai social media degli stessi intervistati, può quindi essere implementato su una scala molto più ampia per prevedere come le persone di un'intera regione avrebbero risposto a un sondaggio tradizionale basato solo sui loro Tweet.
Capire parole fuori contesto
Prima che venissero utilizzati i metodi di apprendimento automatico, i ricercatori hanno scelto parole o chiesto ai valutatori di annotare le parole per quanto fossero "positive". Ma può essere molto difficile scegliere parole che misurino il benessere, disse Eichstaedt.
Per esempio, i ricercatori hanno scoperto che lo slang di Internet come "LOL" - l'acronimo popolare per "ridere ad alta voce" - e le parole "buono" e "amore" erano spesso usate in aree con reddito e istruzione inferiori (e, generalmente, minor benessere). Quindi, anche se queste potrebbero sembrare parole positive, potrebbero non essere, disse Eichstaedt.
Allo stesso modo, Eichstaedt ha scoperto che parole come "compiti a casa" e "tasse" potrebbero sembrare negative fuori contesto, ma i ricercatori hanno scoperto che queste parole erano usate di più da persone con un'istruzione e un reddito superiori, un gruppo che altri studi hanno scoperto avere in genere un benessere maggiore.
"Quando scegli le parole per misurare il benessere, è molto importante prestare attenzione alle differenze culturali nell'uso della lingua negli Stati Uniti, ", ha detto Eichstaedt.
Ma i metodi di apprendimento automatico possono aiutare a determinare quali parole sono più importanti di altre. Quando l'algoritmo ha confrontato i post sui social media di una persona con le risposte al sondaggio, ha appreso che parole come "LOL" non sono indicatori affidabili di benessere e ha invece usato parole come "divertimento" ed "eccitato".
"Fare in modo che il computer impari le parole può essere il modo migliore per trovare parole che misurano il benessere, " Ha detto Eichstaedt. "Le differenze nell'uso della lingua possono essere piuttosto complesse".
Usi futuri
I ricercatori osservano che il benessere è associato anche ad altri importanti fattori, compresa la salute generale. Per esempio, il modo in cui le persone stressate possono indurre comportamenti non salutari, come bere o fumare eccessivamente, che a loro volta hanno un impatto negativo sulla loro salute, Egli ha detto.
"Quando le persone soffrono di depressione e ansia, dobbiamo sapere in modo da poter garantire che dispongano delle risorse di cui hanno bisogno, " disse Eichstaedt, che sta attualmente applicando questo metodo per studiare l'impatto della nuova pandemia di coronavirus sulla popolazione delle città degli Stati Uniti.
"COVID-19 è un disastro naturale che interrompe le nostre norme e routine sociali su una scala senza precedenti, " Ha detto Eichstaedt. "Con questa tecnologia basata su Twitter in tempo reale, gli psicologi possono monitorare se la solitudine e l'ansia stanno prendendo piede nelle comunità, e come il nostro benessere è influenzato dal distanziamento sociale. Non esiste un'altra fonte di dati in grado di fornire tale misurazione su scala demografica e fornire stime così rapidamente. Adesso più che mai, l'utilizzo di solidi metodi di apprendimento automatico è molto importante."