Raccolta dei dati di Facebook:cosa devi sapere

Una statua di cera del boss di Facebook Mark Zuckerberg. Credito:Shutterstock

Facebook guadagna la maggior parte dei suoi soldi dalla pubblicità, e, mentre lo scandalo Cambridge Analytica continua a perseguitare l'azienda di Mark Zuckerberg, gli utenti chiedono di sapere come vengono manipolati e raccolti i loro dati.

Ma mentre la preoccupazione per la privacy degli utenti di Facebook è aumentata, è stato chiaro fin dall'inizio di Facebook che la sua attività si basa sulla sorveglianza diffusa delle persone, i cui dati sono il prodotto.

Alcuni hanno descritto le rivelazioni dello scandalo Cambridge Analytica - in cui i dati sarebbero stati raccolti da 50 milioni di profili Facebook - come una "crisi esistenziale", mentre altri hanno evidenziato potenziali implicazioni per la ricerca accademica.

In breve, I metodi di raccolta dei dati di Facebook sono diventati oggetto di preoccupazione improvvisa e diffusa.

Che cos'è la raccolta dei dati?

Dati di raccolta, come suggerisce il nome agricolo, è simile alla raccolta dei raccolti perché comporta la raccolta e lo stoccaggio con l'aspettativa di una ricompensa futura.

I dati possono essere raccolti in diversi modi, che vanno dal semplice copia e incolla a una programmazione più complicata. Il metodo scelto è spesso vincolato dal sito che viene raccolto. A semplici livelli di ricerca, molti siti combattono la raccolta automatizzata con Google CAPTCHA e reCAPTCHA, che aiutano i siti a distinguere tra umani e bot.

Se hai mai copiato e incollato del testo da Facebook o salvato un'immagine da Twitter, hai raccolto i dati dei social media. L'azione di "screenshot" è consentita sulla maggior parte dei siti perché gli utenti di solito possono accedere solo alle informazioni pubbliche o visibili a loro perché hanno effettuato l'accesso. Inoltre, sarebbe impossibile sradicare completamente i metodi più semplici di raccolta dei dati, come prendere appunti e scattare fotografie.

Facebook e altri social network sono più interessati a limitare la raccolta automatizzata dei dati, a causa delle richieste sui server web e per controllare chi ha accesso a quali dati (e perché). Le informazioni personali e il comportamento sui social media hanno proprietà commerciali, valore politico e di ricerca.

I social network decidono le proprie politiche di utilizzo, bilanciare gli interessi commerciali con terze parti e le preoccupazioni normative sulla privacy degli utenti - spesso descritte nei documenti aziendali come destreggiarsi tra l'ottimizzazione del "comportamento del cliente" e l'adesione agli "standard comunitari".

Come vengono raccolti i dati?

Le interfacce di programmazione delle applicazioni (API) sono utilizzate da Facebook, Twitter, Instagram e altri siti per limitare l'accesso agli aspiranti raccoglitori. Le API funzionano come un intermediario software che consente al computer di un ricercatore o di uno sviluppatore di app di "parlare" con un social network in modo controllato.

Leggi di più:Come funzionava davvero il modello di targeting di Facebook di Cambridge Analytica, secondo la persona che l'ha costruito

Una delle condizioni principali riguarda le restrizioni su come i dati raccolti possono essere utilizzati e condivisi, che può essere perseguito in modo aggressivo. Nel 2010, Il programmatore di computer Pete Warden ha raccolto dati da 210 milioni di profili Facebook pubblici per scopi di ricerca. Ma non è riuscito a chiedere prima il permesso a Facebook, violando così i suoi termini di servizio. In seguito ha affrontato la minaccia di un'azione legale da parte di Facebook ed è stato costretto a cancellare i dati, facendo eco alla presunta parte del ricercatore accademico Aleksandr Kogan nello scandalo di Cambridge Analytica.

l'app di Kogan, soprannominato "thisisyourdigitallife", sviluppato nel 2014 attraverso la sua società Global Science Research (GSR) – separato dal suo lavoro universitario – è stato un test della personalità che 270, 000 utenti registrati, accettando che avrebbe avuto accesso ad alcune delle loro informazioni personali e anche ad alcuni dati dei loro amici. Significava anche che quegli amici non avevano acconsentito all'utilizzo dei loro dati in questo modo.

Facebook aggiorna regolarmente la sua API e nel 2014 la società ha confermato che avrebbe smesso di consentire alle app di terze parti di accedere ai dati sugli amici degli utenti delle app. Ciò ha disabilitato il metodo di raccolta dati presumibilmente utilizzato da Kogan.

Ci sono diversi modi in cui gli sviluppatori, che devono accettare le politiche di Facebook, possono raccogliere dati utilizzando l'API dell'azienda e tutti assumono almeno competenze di base di programmazione informatica. Uno dei modi più semplici per farlo è accedere all'API utilizzando un toolbox software specializzato:Python e R dispongono di strumenti progettati appositamente per questo scopo. Nella mia ricerca, Uso il pacchetto Rfacebook per raccogliere i dati di Facebook.

Una distinzione fondamentale tra la mia app e le altre è che non interagisco con gli utenti, perché la mia app non è attiva. La mia app è essenzialmente un modo automatizzato per copiare e incollare informazioni dai gruppi Facebook pubblici. Uso l'API di Facebook per ricercare come le pagine dei gruppi della comunità pubblica sono state utilizzate per protestare contro l'austerità in Irlanda.

Perché sto raccogliendo dati pubblici da pagine pubbliche, Non sto chiedendo agli utenti di accedere e non c'è un'interfaccia front-end su Facebook, sebbene ciò possa essere fatto utilizzando i toolkit API di Facebook per espandere la quantità di dati a cui è possibile accedere. È un metodo che solleva una serie di domande sulla funzionalità, informazioni sull'utente e autorizzazioni di accesso.

L'API di Facebook può essere utilizzata per raccogliere tutti i tipi di informazioni disponibili pubblicamente, come alcuni dei post recenti di The Conversation UK o dei post in gruppi pubblici.

Ma i tentativi di andare oltre le informazioni pubbliche per raccogliere i dati degli utenti di Facebook che non hanno effettuato l'accesso all'app, come Zuckerberg, ad esempio:errori di restituzione. I "Mi piace" di Facebook non possono essere raccolti perché Zuckerberg non è un utente della mia app e non gli ha concesso il permesso di accedere ai suoi dati.

Sotto gli ultimi aggiornamenti API di Facebook, le autorizzazioni dell'app sono necessarie per raccogliere qualsiasi informazione oltre alle proprietà del profilo pubblico. Ciò significa che gli utenti devono accedere a un'app e autorizzare l'accesso a qualsiasi altra informazione per consentire agli sviluppatori di raccogliere i dati.

Ricerca legittima a rischio?

Mentre le aziende piene di annunci hanno chiaramente interesse a "sfruttare" i dati, gli accademici – nelle ultime settimane – hanno attirato l'attenzione sui ricercatori che raccolgono i dati di Facebook. La pratica è diventata relativamente mainstream nella ricerca delle scienze sociali.

La misura in cui la ricerca futura potrebbe essere limitata dalle modifiche all'API di Facebook è urgente. Ma vale la pena notare che, una volta raccolti i dati, Facebook, che può perseguire legalmente le persone che "violano" i suoi termini di servizio per cercare di costringerle a cancellare i dati, ha un controllo limitato su dove finiscono i dati.

Per i ricercatori preoccupati di come lo scandalo Cambridge Analytica influenzerà il loro lavoro, vale la pena tenere d'occhio i cambiamenti che Facebook implementa nel suo prossimo aggiornamento API. Può fornire una migliore comprensione del tipo di ricerca che può essere consentito dall'uso dei dati raccolti da Facebook e di ciò che può essere escluso in modo permanente.

Questo articolo è stato originariamente pubblicato su The Conversation. Leggi l'articolo originale.