Un piccolo team di scienziati politici, statistici e scienziati dei dati dell'Università di Harvard, della New York University e dell'Università di Yale ha scoperto che, passando a un nuovo metodo per proteggere meglio la privacy, il Dipartimento di censimento degli Stati Uniti ha introdotto fattori che riducono la precisione in alcuni casi .
Nel loro articolo pubblicato sulla rivista Science Advances , il gruppo descrive come ha analizzato un file fornito dai funzionari del censimento per misurare l'accuratezza dei dati del censimento disponibili al pubblico e dei relativi risultati.
Prima del censimento statunitense del 2020, i funzionari dell'U.S. Census Bureau, preoccupati per la privacy delle persone che fornivano risposte al censimento, decisero di modificare il metodo con cui garantivano la sicurezza dei dati.
Il vecchio metodo si chiamava "scambio". Si trattava di scambiare dati di persone che vivevano in un isolato di una città con persone di un altro isolato, impedendo così che le persone venissero identificate in base ai loro dati. Il nuovo metodo si chiama "privacy differenziale" e prevede l'aggiunta di ciò che l'Ufficio di presidenza descrive come "rumore" a ciascun dato raccolto.
In questo nuovo sforzo, il gruppo di ricerca non è riuscito a trovare alcun esempio di un'entità esterna che conducesse ricerche per determinare se il nuovo metodo fornisse effettivamente maggiore privacy o se i dati elaborati fossero più o meno accurati rispetto a quando è stato utilizzato lo scambio. Così ne iniziarono uno tutto loro.
Lo studio è iniziato con il gruppo di ricerca che ha chiesto al Census Bureau di fornire loro l’accesso a quello che viene chiamato file di misurazioni rumorose (NMF), quello utilizzato per il censimento del 2020. L'Ufficio di presidenza ha negato la richiesta, il che ha portato la squadra a denunciarli. Alla fine, la causa è stata archiviata quando l'Ufficio di presidenza ha accettato di fornire al team il NMF associato al censimento molto più ristretto del 2010, effettuato come un modo per testare il nuovo metodo e comportando sia lo scambio che la differenziazione.
I ricercatori hanno quindi analizzato quel file come un modo per studiare l’impatto sulla precisione del cambiamento nel nuovo sistema. Così facendo, hanno scoperto che, nel complesso, i due sistemi fornivano più o meno la stessa precisione su larga scala. Ma hanno anche trovato prove di una riduzione dell'accuratezza a livello di blocco tale da poter avere un impatto negativo sulle minoranze e sulle popolazioni multirazziali.