Credito:CC0 Dominio pubblico
Linguisti e geografi hanno analizzato 8,9 miliardi di parole contenute in 980 milioni di Tweet pubblicati negli Stati Uniti tra il 2013 e il 2014 per identificare le regioni da cui tendono a provenire le nuove parole.
Guidati dal professor Jack Grieve, dal Center for Corpus Research dell'Università di Birmingham, i ricercatori hanno utilizzato una tecnologia informatica avanzata per analizzare i Tweet geocodificati che hanno rivelato la precisa longitudine e latitudine dell'utente al momento della pubblicazione.
Hanno rintracciato l'origine di 54 nuove parole emergenti in inglese americano. Per esempio, hanno scoperto che la parola 'baeless', che significa 'essere single', originato dal profondo sud, mentre la parola 'mutue', che è l'abbreviazione di "amici in comune", originario della costa occidentale.
I dati geocodificati di Twitter hanno permesso loro di creare mappe per queste 54 parole, mostrando come le frasi si erano diffuse nel paese nel tempo.
Applicando moderne tecniche computazionali allo studio della variazione e del cambiamento linguistico, il team ha identificato lo sviluppo di nuove parole nell'inglese americano moderno incentrato su cinque regioni:la costa occidentale, il nord-est, il Medio Atlantico, il profondo sud, e la costa del Golfo.
Il professor Grieve ha commentato:"Questa è la prima volta che un campione così ampio di parole emergenti o qualsiasi tipo di innovazione linguistica è stato mappato in una lingua. Twitter è solo una varietà di lingua, ma dato che quasi tutte queste parole sono usate nel linguaggio quotidiano, riteniamo che i nostri risultati riflettano la diffusione generale delle parole in inglese americano.
"Il nostro studio fornisce un quadro per la ricerca futura, mostrando come l'origine e la diffusione delle parole emergenti possono essere misurate e mappate. La linguistica si sta spostando da una scienza sociale a una scienza dei dati, dove i linguisti analizzano sempre più enormi quantità di linguaggio naturale raccolte online.
"Questo ci consente di perseguire nuove domande di ricerca che sarebbe stato impossibile investigare solo pochi anni fa. Possiamo analizzare nei minimi dettagli come cambia la lingua in brevi periodi di tempo e comprendere i processi attraverso i quali le lingue si evolvono, uno dei domande più impegnative della scienza."
I risultati dei ricercatori sfidano anche le teorie esistenti sulla diffusione di nuove parole. Mostrano che le nuove parole non si diffondono semplicemente liberamente dalla loro fonte, né si diffondono da una grande città all'altra, come previsto da teorie precedentemente sviluppate per la diffusione di nuove parole, noti come modelli "a onda" e "a gravità".
Anziché, lo studio ha rilevato che la diffusione di nuove parole è vincolata da modelli culturali. Nuove parole tendono a diffondersi all'interno delle regioni culturali, prima di raggiungere il resto degli Stati Uniti. Ha anche scoperto che l'inglese afroamericano era una delle principali fonti di innovazione lessicale su Twitter negli Stati Uniti.
Il professor Grieve sta parlando della ricerca del team alla conferenza New Ways of Analyzing Variation (NWAV) tenuta alla New York University dal 18 al 21 ottobre. Si concentrerà su come queste parole si sono diffuse proprio a New York City nel periodo in questione, oltre a tenere un seminario sulla "sociolinguistica computazionale".