Credito:Diana Levine e MIT Press
Supponi di voler conoscere i tassi di mortalità delle donne durante il parto, per paese, Intorno al mondo. Dove guarderesti? Un'opzione è il progetto WomanStats, il sito web di uno sforzo di ricerca accademica che indaga sui collegamenti tra la sicurezza e le attività degli stati-nazione, e la sicurezza delle donne che le abitano.
Il progetto, fondata nel 2001, soddisfa un'esigenza collegando insieme i dati provenienti da tutto il mondo. Molti paesi sono indifferenti alla raccolta di statistiche sulla vita delle donne. Ma anche dove i paesi si sforzano di più di raccogliere dati, ci sono chiare sfide per arrivare a numeri utili, che si tratti della sicurezza fisica delle donne, diritti di proprietà, e partecipazione del governo, tra tante altre questioni.
Ad esempio:in alcuni paesi, le violazioni dei diritti delle donne possono essere denunciate più regolarmente che in altri luoghi. Ciò significa che un sistema legale più reattivo può creare l'apparenza di maggiori problemi, quando fornisce un sostegno relativamente maggiore alle donne. Il progetto WomanStats rileva molte di queste complicazioni.
Così il progetto WomanStats offre alcune risposte, ad esempio, Australia, Canada, e gran parte dell'Europa occidentale ha bassi tassi di mortalità per parto, mostrando anche quali sono le sfide nel prendere i numeri alla lettera. Questo, secondo la professoressa del MIT Catherine D'Ignazio, rende il sito insolito, e prezioso.
"I dati non parlano mai da soli, "dice D'Ignazio, riferendosi al problema generale di trovare numeri affidabili sulla vita delle donne. "Ci sono sempre persone e istituzioni che parlano per i dati, e persone diverse hanno i loro programmi. I dati non sono mai innocenti".
Ora D'Ignazio, un assistente professore nel Dipartimento di Studi Urbani e Pianificazione del MIT, ha approfondito la questione in un nuovo libro, co-autore con Lauren Klein, professore associato di inglese e teoria e metodi quantitativi alla Emory University. Nel libro, "Femminismo dei dati, " pubblicato questo mese dal MIT Press, gli autori usano la lente del femminismo intersezionale per esaminare come la scienza dei dati riflette le strutture sociali da cui emerge.
"Il femminismo intersezionale esamina il potere ineguale, " scrivono D'Ignazio e Klein, nell'introduzione del libro. "E nel nostro mondo contemporaneo, anche i dati sono potere. Poiché il potere dei dati è esercitato ingiustamente, deve essere sfidato e cambiato."
Il problema del 4 per cento
Per vedere un chiaro caso di relazioni di potere che generano dati distorti, D'Ignazio e Klein nota, considerare la ricerca condotta dalla stessa Joy Buolamwini del MIT, che come studente laureato in una classe che studia programmi di riconoscimento facciale, osservò che il software in questione non poteva "vedere" il suo viso. Buolamwini ha rilevato che per il sistema di riconoscimento facciale in questione, il software era basato su una serie di volti che erano per il 78 percento maschi e per l'84 percento bianchi; solo il 4% era di sesso femminile e di pelle scura, come se stessa.
La successiva copertura mediatica del lavoro di Buolamwini, D'Ignazio e Klein scrivono, conteneva "un accenno di shock". Ma i risultati sono stati probabilmente meno sorprendenti per coloro che non sono maschi bianchi, pensano.
"Se il passato è razzista, opprimente, sessista, e di parte, e questi sono i tuoi dati di allenamento, questo è ciò per cui ti stai sintonizzando, "D'Ignazio dice.
Oppure considera un altro esempio, dal gigante tecnologico Amazon, che ha testato un sistema automatizzato che utilizzava l'intelligenza artificiale per ordinare i CV promettenti inviati dai candidati al lavoro. Un problema:poiché un'alta percentuale di dipendenti dell'azienda erano uomini, l'algoritmo ha favorito i nomi degli uomini, altre cose a parità.
"Pensavano che questo avrebbe aiutato [il] processo, ma ovviamente ciò che fa è addestrare il [sistema] di intelligenza artificiale a essere prevenuto verso le donne, perché loro stessi non hanno assunto così tante donne, Osserva D'Ignazio.
A merito di Amazon, ha riconosciuto il problema. Inoltre, D'Ignazio, questo tipo di problema è un problema che può essere affrontato. "Alcune delle tecnologie possono essere riformate con un processo più partecipativo, o migliori dati di allenamento. … Se siamo d'accordo che è un buon obiettivo, una strada da percorrere è adattare il tuo set di allenamento e includere più persone di colore, più donne».
"Chi c'è nella squadra? Chi ha avuto l'idea? Chi sta beneficiando?"
Ancora, la domanda su chi partecipa alla scienza dei dati è, come scrivono gli autori, "l'elefante nella sala server." A partire dal 2011, solo il 26% di tutti gli studenti universitari che ricevono una laurea in informatica negli Stati Uniti erano donne. Non è solo una cifra bassa, ma in realtà un calo rispetto ai livelli passati:nel 1985, Il 37 per cento dei laureati in informatica erano donne, il punteggio più alto mai registrato.
A causa della mancanza di diversità nel campo, D'Ignazio e Klein credono, molti progetti di dati sono radicalmente limitati nella loro capacità di vedere tutti gli aspetti delle complesse situazioni sociali che pretendono di misurare.
"Vogliamo provare a sintonizzare le persone su questo tipo di relazioni di potere e sul motivo per cui sono profondamente importanti, Dice D'Ignazio. «Chi c'è in squadra? Chi ha avuto l'idea? Chi sta beneficiando del progetto? Chi è potenzialmente danneggiato dal progetto?"
In tutto, D'Ignazio e Klein delineano sette principi del femminismo dei dati, dall'esaminare e sfidare il potere, al ripensamento dei sistemi binari e delle gerarchie, e abbracciare il pluralismo. (Le statistiche sui laureati di genere e informatica sono limitate, notano, utilizzando solo le categorie "maschio" e "femmina", escludendo così le persone che si identificano in termini diversi.)
Persone interessate al femminismo dei dati, affermano gli autori, dovrebbe anche "valutare molteplici forme di conoscenza, " compresa la conoscenza di prima mano che potrebbe portarci a mettere in discussione dati apparentemente ufficiali. Inoltre, dovrebbero sempre considerare il contesto in cui i dati vengono generati, e "rendere visibile il lavoro" quando si tratta di data science. Quest'ultimo principio, notano i ricercatori, parla del problema che anche quando donne e altre persone escluse contribuiscono a progetti di dati, spesso ricevono meno credito per il loro lavoro.
Per tutta la critica del libro ai sistemi esistenti, programmi, e pratiche, D'Ignazio e Klein sono attenti anche a includere esempi di positività, sforzi di successo, come il progetto WomanStats, che è cresciuto e prosperato nel corso di due decenni.
"Per le persone che sono persone di dati ma sono nuove al femminismo, vogliamo fornire loro un'introduzione molto accessibile, e fornire loro concetti e strumenti che possono utilizzare nella loro pratica, Dice D'Ignazio. «Non immaginiamo che le persone abbiano già il femminismo nella loro cassetta degli attrezzi. D'altra parte, stiamo cercando di parlare con persone che sono molto sintonizzate sul femminismo o sui principi di giustizia sociale, ed evidenziare per loro i modi in cui la scienza dei dati è sia problematica, ma può essere schierato al servizio della giustizia".
Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.