• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Il blocco dei dati di Facebook è un disastro per i ricercatori accademici

    Credito:Shutterstock

    Facebook ha recentemente annunciato drammatiche restrizioni all'accesso ai dati sulla sua app e sul suo sito web. La società ha inquadrato il blocco come un tentativo di proteggere le informazioni degli utenti, in risposta alla protesta pubblica seguita allo scandalo Cambridge Analytica.

    Ma la decisione è in linea con le crescenti restrizioni imposte ai ricercatori che studiano Facebook e la sua app di condivisione di foto Instagram, che ha anche iniziato a limitare immediatamente l'accesso ai suoi dati il ​​4 aprile.

    Infatti, nel febbraio di quest'anno sono state introdotte diverse limitazioni, prima che il fiasco di Cambridge Analytica, in cui i dati sarebbero stati raccolti da 50 milioni di profili Facebook, scoppiasse pubblicamente. API di Facebook, versione 2.5, doveva essere ritirato questo mese, da – tra l'altro – impedendo l'accesso all'ID degli utenti che partecipano a forum pubblici.

    I social network offrono due principali punti di ingresso per la raccolta dei dati:funzionano come interfacce per gli utenti e interfacce software progettate per il consumo da parte di programmi per computer, note come interfacce di programmazione delle applicazioni (API).

    Mentre le API sono destinate ai programmatori che creano app che si aggiungono al crescente ecosistema di servizi offerti dai social network, i ricercatori hanno anche sfruttato queste interfacce per studiare il comportamento sociale online.

    Data l'enorme dimensione della base utenti di Facebook (2,13 miliardi nell'ultimo conteggio), il controllo esterno del contenuto sul social network è estremamente importante. Negli ultimi anni, però, i ricercatori hanno combattuto una dura battaglia con l'azienda per fornire l'accesso ai dati. Ora la sua ultima decisione ha reso praticamente impossibile condurre ricerche su larga scala su Facebook.

    Le modifiche rendono defunti software e librerie dedicate alla ricerca accademica su Facebook, compreso netvizz, Nodo XL, SocialMediaLab, fb_scrape_public e Rfacebook, tutto ciò si basava sulle API di Facebook per raccogliere dati.

    La ricerca sistematica sui contenuti di Facebook è ormai insostenibile, trasformando quello che era già un preoccupante opaco, social network nascosto in una scatola nera che è probabilmente ancora meno responsabile per i legislatori e il pubblico, entrambi i quali hanno beneficiato degli accademici che hanno monitorato gli sviluppi sul sito.

    Deen Freelon, lo sviluppatore di fb_scrape_public che analizza grandi, set di dati pubblicamente disponibili su Facebook, ci ha detto via e-mail che "la decisione di limitare l'accesso all'API delle pagine potrebbe compromettere gravemente la ricerca su Facebook basata sui contenuti in futuro, a seconda di quanto Facebook è disposto ad approvare l'accesso. Se non approva l'accesso per la maggior parte degli scopi di ricerca, che potrebbe creare incentivi per i ricercatori a raschiare direttamente Facebook, che viola i suoi termini di servizio." Lo scraping o la raccolta dei dati è un metodo mediante il quale un programma per computer estrae informazioni dalle pagine web.

    Bernhard Rieder, un professore associato dell'Università di Amsterdam che ha sviluppato netvizz – uno strumento che estrae dati da Facebook a fini di ricerca – ritiene che la mossa sia stata una conseguenza del livello di accesso illimitato concesso a chiunque fino al 2015 e che "c'è una reale possibilità che questi servizi saranno sempre più imperscrutabili e inosservabili”.

    Fino a tre anni fa, Facebook ha consentito alle app di terze parti di accedere ai dati sugli amici degli utenti dell'app. Era questa funzione che veniva usata da Aleksandr Kogan, ricercatore presso l'Università di Cambridge.

    Kogan – attraverso la sua startup Global Science Research, che era separato dal suo lavoro accademico - presumibilmente ha raccolto informazioni sul profilo da 270, 000 utenti di Facebook e decine di milioni di loro amici che utilizzano un'app per test della personalità chiamata "thisisyourdigitallife". Si presume che Cambridge Analytica abbia utilizzato quei dati nel tentativo di prendere di mira campagne politiche tra cui le elezioni presidenziali statunitensi del 2016.

    Marc Smith, che ha guidato il team Microsoft che ha creato NodeXL, che analizza i dati dei social network, ci ha detto che c'era l'opportunità di ripensare ai social network che le persone scelgono di utilizzare alla luce dello scandalo dei dati.

    Perché le API sono importanti?

    Le API consentono ai ricercatori di recuperare dati su larga scala e di curare database associati a eventi significativi. Senza di loro, le interfacce web devono essere raschiate per accedere ai dati, che richiede molta manodopera e limita drasticamente la quantità di informazioni che possono essere raccolte ed elaborate.

    L'esclusione dei ricercatori dalle API li costringe a mezzi di raccolta dati ad alta intensità umana che non possono produrre campioni rappresentativi di eventi del mondo reale, come i movimenti sociali, elezioni e campagne di disinformazione.

    Twitter opera tre ben documentati, API pubbliche oltre alle sue offerte premium e aziendali. La relativa accessibilità di Twitter lo porta ad essere ampiamente sovrarappresentato nella ricerca sui social media. Ma le API pubbliche e aperte sono un'eccezione nell'ecosistema dei social media. API del feed pubblico di Facebook, Per esempio, è limitato a un numero limitato di editori di media.

    Blocco dei dati

    Il blocco delle API di Facebook allargherà il divario tra i ricercatori del settore assunti dai social network e i ricercatori che lavorano al di fuori delle società. È un divario caratterizzato come il divario tra "ricercatori ricchi di big data", che hanno accesso a dati proprietari e potrebbero lavorare solo nell'interesse della società a cui sono affiliati, e i "big data poveri" o il vasto universo dei ricercatori accademici.

    La decisione di Facebook espande notevolmente questo pool di "big data poveri". It limits research to projects sponsored by the network and potentially jeopardises research that is critical of Facebook.

    Shortly after the decision to drastically limit API access, Facebook vowed to help researchers gain access to social media data of public interest, starting with elections. The announcement was met with a mix of celebration and subdued support from researchers.

    Luca Rossi, who is associate professor at the IT University of Copenhagen, cautioned that the "data sharing model proposed by Facebook is deeply problematic and it will probably reinforce existing differences in terms of data access". The restriction is likely to continue the trend of researchers doing research they are able to as opposed to research they deem important.




    The impact on data science education is also considerable. If researchers are unable to access data from social networks, they will be unable to train students in data science, social science, computer sciences and digital humanities on methods of data collection and analysis that are rigorous, critical and ethical.

    Facebook's decision to render the API useless for meaningful research is a regrettable departure for collaboration between the social network giant and academics and it's already having an impact.

    The Events API, which researchers relied on to retrieve information about public events such as demonstrations, no longer permits access to users or posts on the event wall.

    Facebook's Groups API and Pages API were the endpoints researchers queried to study public discussions on Facebook, but the recent policy shift seals off those online conversations by restricting access to posts, comments or members participating in a public page or group.

    The changes made to Instagram's API are even more radical, with Facebook deciding to deprecate the API – a technical term for killing data access altogether.

    Nasty side effect

    Facebook's decision to restrict researchers is ironic because academics have long discussed the problems that led to the Cambridge Analytica scandal. Rieder wrote about the risks of Facebook API's wide open data door back in 2013.

    He cautioned against how much data a third-party app could get from Facebook. Facebook, però, ignored those concerns until 2015, when management and policies regulating the sharing of Facebook data took a sharp turn and became increasingly more restrictive for researchers.

    Da allora, Facebook has become increasingly more cautious about external scrutiny. In the wake of the Cambridge Analytica scandal, Facebook CEO Mark Zuckerberg told Wired that the feedback it received was that "having the data locked down is more important to people than having different kinds of experiences".

    The public uproar clearly underscores how users' data was poorly handled, but a lockdown is hardly the solution to a problem rooted in the weaponisation of social networks, where people use Facebook, Twitter and so on to spread disinformation.

    The Cambridge Analytica scandal has created a worrying side effect:restricting access to data is likely to facilitate further weaponisation, by turning Facebook into a de facto black box that is largely unaccountable to external oversight.

    Questo articolo è stato originariamente pubblicato su The Conversation. Leggi l'articolo originale.




    © Scienza https://it.scienceaq.com