Il nuovo algoritmo di apprendimento automatico può prevedere età e sesso solo dal tuo profilo Twitter. Credito:Shutterstock
Un nuovo strumento di "inferenza demografica" sviluppato dagli accademici può fare previsioni basate esclusivamente sulle informazioni nel profilo dei social media di una persona (es. biografia, Foto profilo, e nome). Lo strumento, che funziona in 32 lingue, potrebbe aprire la strada all'inclusione delle opinioni espresse sui social media nei metodi di indagine più diffusi.
Ricercatori dell'Università di Oxford, Università del Michigan, Università del Massachusetts, GESIS – Istituto Leibniz per le Scienze Sociali, l'Istituto Max Planck, e la Stanford University hanno sviluppato un metodo per dedurre le informazioni sul proprietario di un account di social media in base alle informazioni divulgate nelle informazioni del loro profilo Twitter.
Un nuovo sistema di apprendimento automatico, presentato questa settimana alla Web Conference di San Francisco, ha appreso i modelli associati alle diverse età, generi, e tra organizzazioni e individui da un set di dati di oltre quattro milioni di account Twitter in 32 lingue. Queste informazioni sono state quindi combinate con le località stimate e riponderate rispetto ai dati del censimento per produrre stime più accurate della popolazione in 1, 101 regioni statistiche in tutta l'UE.
Ciò potrebbe aprire la strada a una comprensione più rappresentativa delle opinioni delle persone su questioni e argomenti chiave della società, in base a ciò che pubblicano sui social media e attribuiti a specifiche località geografiche e gruppi demografici.
Dottor Scott Hale, Assegnista di ricerca senior, Istituto Internet di Oxford, L'Università di Oxford ha dichiarato:"Nonostante fornisca molti punti dati, i social media sono stati a lungo uno strumento inaffidabile per comprendere quali questioni sono più importanti per una popolazione più ampia, dato il modo in cui le persone si autoselezionano per utilizzare una qualsiasi piattaforma.
"Questo primo studio nel suo genere esegue previsioni demografiche sul proprietario di un account di social media basate esclusivamente sulle informazioni del profilo dell'account in 32 lingue e quindi ripeserà il campione online per essere più simile a una popolazione offline.
"Vediamo questo come un passo significativo verso l'utilizzo dei social media per ottenere un'immagine più accurata delle questioni e degli argomenti che interessano maggiormente il pubblico e capire quali opinioni dei gruppi sono sovra o sottorappresentate".
Queste informazioni e dati alla base di questa ricerca sono stati resi disponibili in una libreria open source ed è possibile testare lo strumento di inferenza su www.euagendas.org/m3demo