Credito:Shutterstock
Il termine "big data" può far venire in mente porzioni di informazioni private detenute dalle aziende tecnologiche. Ma molti big data sono, infatti, visibile a tutti—potremmo semplicemente non pensarlo come "dati".
Se sei stato al cinema di recente, avrai visto un set di dati di crediti, che elenca i membri del cast e della troupe insieme ai loro ruoli. Anche se i crediti di un film potrebbero non essere così utili, i crediti di ogni film possono formare un grande set di dati. A Nesta e al PEC (un nuovo centro di politiche e prove per le industrie creative), abbiamo esplorato come questi tipi di big dataset non riservati possono illuminare nuova luce sulla rappresentazione di genere nelle industrie creative.
La rappresentazione di genere è stata tradizionalmente misurata utilizzando sondaggi sui lavoratori. Ma la maggior parte dei sondaggi non va avanti da così tanto tempo e possono volerci diversi anni (dopo il lancio di un nuovo sondaggio) prima di poter dire come sta cambiando il mix di genere. Anche, i sondaggi spesso non vanno oltre il conteggio del numero di donne e uomini, e quindi non possono far luce su quanto sia stato importante ciascun gruppo nel processo creativo, o come sono stati ritratti in una particolare forma d'arte.
Scavando in profondità
Di recente abbiamo esaminato i resoconti dei media sulle donne nelle industrie creative utilizzando più di mezzo milione di articoli dal quotidiano The Guardian, pubblicato tra il 2000 e il 2018, da sezioni del giornale relative alle industrie creative (come Libri, Film, Moda e Giochi).
Negli ultimi cinque anni, c'è stato un forte aumento dei riferimenti alle donne. Dal 2000 al 2013, meno di un terzo dei pronomi di genere all'interno degli articoli (ad esempio, "lui" e "lei") si riferivano alle donne. Ma questo ha iniziato a cambiare nel 2014 e nel 2018 la percentuale di pronomi di genere femminili aveva raggiunto il 40%. Al contrario, il mix di genere tra i lavoratori delle industrie creative del Regno Unito è rimasto piatto negli ultimi anni, e si attesta intorno al 37%.
Abbiamo anche studiato le parole che seguivano i pronomi "lui" e "lei", per ottenere informazioni sulla rappresentazione mediatica dei lavoratori creativi. Questo ci ha portato a scoprire che, rispetto agli uomini, c'era una maggiore attenzione su suoni particolari prodotti dalle donne, come "ride", "piange", "risatine", e "coo", e reazioni non verbali, come "sorrisi", "sorride" e "annuisce". Queste parole non furono mai usate frequentemente, ma quando sono stati usati, era più probabile che si riferissero alle donne rispetto agli uomini (rispetto ad altre parole).
In contrasto, le parole relative alle passate realizzazioni creative e alle attività di leadership si riferivano più frequentemente agli uomini. Per esempio, è molto più probabile che tu veda "lui ha diretto" che "lei ha diretto", e allo stesso modo "si esibì", "ha progettato", "ha gestito" e "ha fondato". Questa scoperta è coerente con gli squilibri di genere di lunga data nelle industrie creative.
I big data di The Guardian offrono una preziosa visione dell'uguaglianza di genere nei media. Credito:Shutterstock
In un altro studio, abbiamo utilizzato un set di dati del British Film Institute (BFI) che conteneva i crediti di ogni lungometraggio britannico uscito al cinema.
Dopo che il BFI ha dedotto il genere delle persone dai loro nomi, abbiamo scoperto che il mix di genere sullo schermo non è cambiato in modo significativo dalla fine della seconda guerra mondiale e nel 2017 le donne rappresentavano ancora solo il 30% circa dei membri del cast e il 34% dei membri dell'equipaggio.
Questo set di dati ha anche mostrato differenze di genere nei lavori dei personaggi sullo schermo. Dal 2005, Per esempio, solo il 16% dei "medici" sullo schermo (in ruoli senza nome) è stato interpretato da donne, il che è in contrasto con il fatto che le donne costituiscono il 46% dei medici nel Regno Unito.
Equità creativa
Non siamo affatto gli unici ricercatori a mostrare il potenziale delle fonti non riservate di big data per informare le metriche di genere nelle industrie creative. Ricercatori di Google, in collaborazione con il Geena Davis Institute, ha utilizzato la tecnologia di riconoscimento facciale e vocale per dimostrare che nei 100 film live-action con il maggior incasso negli Stati Uniti, in ogni anno dal 2014 al 2016, le donne occupavano solo il 36% del tempo davanti allo schermo e il 35% del tempo di parola.
Mentre gli studi sui big data possono arricchire le misure di diversità, ci sono due importanti fonti di potenziale bias. Primo, stiamo quasi sempre deducendo il genere, da una faccia, un nome o un singolo pronome, e quindi potremmo sbagliare il genere di una persona. Secondo, questi metodi di inferenza in genere rilevano solo "maschio" e "femmina", escludere o classificare erroneamente chiunque si identifichi con un genere non binario. Per queste ragioni, i metodi dei big data non sostituiscono i sondaggi, poiché i sondaggi consentono alle persone di identificarsi e rinunciare completamente.
Anche tenendo conto di questi potenziali pregiudizi, ci sono ancora molte fonti di big data che potrebbero gettare nuova luce sugli squilibri di genere, se solo fossero messi a disposizione dei ricercatori. Per esempio, l'accesso alle immagini fisse e ai sottotitoli di film e programmi televisivi potrebbe essere utilizzato per valutare schemi di diversità, mentre l'accesso al contenuto di più giornali consentirebbe uno studio più ampio sulla segnalazione dei lavoratori creativi da parte dei media.
Per realizzare il potenziale di questi nuovi metodi, dobbiamo incoraggiare e supportare le organizzazioni creative a condividere in modo sicuro i loro dati non riservati. Si spera che ciò consentirà ai ricercatori di diventare un po' più creativi nella misurazione dell'uguaglianza di genere nelle industrie creative del Regno Unito.
Questo articolo è stato ripubblicato da The Conversation con una licenza Creative Commons. Leggi l'articolo originale.