La nuova piattaforma funge da gatekeeper per garantire che i servizi Web aderiscano alle restrizioni sui dati personalizzate degli utenti

science >> Scienza > >> Elettronica

I ricercatori del MIT e dell'Università di Harvard hanno sviluppato una piattaforma, chiamato letto del fiume, che garantisce che i servizi Web aderiscano alle preferenze degli utenti su come i loro dati vengono archiviati e condivisi nel cloud. Credito:Chelsea Turner, MIT

Una nuova piattaforma sviluppata dai ricercatori del MIT e dell'Università di Harvard garantisce che i servizi web aderiscano alle preferenze degli utenti su come i loro dati vengono archiviati e condivisi nel cloud.

Nel mondo odierno del cloud computing, gli utenti di app mobili e servizi Web archiviano i dati personali su server di data center remoti. Questi dati possono includere foto, profili social, indirizzi email, e persino dati di fitness da dispositivi indossabili. I servizi spesso aggregano i dati di più utenti sui server per ottenere informazioni su, dire, modelli di acquisto dei consumatori per consigliare nuovi articoli a utenti specifici, o può condividere i dati con gli inserzionisti. Tradizionalmente, però, gli utenti non hanno avuto il potere di limitare il modo in cui i loro dati vengono elaborati e condivisi.

In un documento presentato alla conferenza USENIX Networked Systems Design and Implementation di questa settimana, i ricercatori descrivono una piattaforma, chiamato letto del fiume, che obbliga i server dei data center a utilizzare i dati solo in modi che gli utenti approvano esplicitamente.

nel letto del fiume, il browser Web o l'app per smartphone di un utente non comunica direttamente con il cloud. Anziché, un proxy Riverbed viene eseguito sul dispositivo di un utente per mediare la comunicazione. Quando il servizio tenta di caricare i dati dell'utente su un servizio remoto, il proxy etichetta i dati con una serie di usi consentiti per i loro dati, chiamato "politica".

Gli utenti possono selezionare un numero qualsiasi di restrizioni predefinite, ad esempio "non archiviare i miei dati su un archivio permanente" o "i miei dati possono essere condivisi solo con il servizio esterno x.com". Il proxy contrassegna tutti i dati con il criterio selezionato.

Nel datacenter, Riverbed assegna i dati caricati a un cluster isolato di componenti software, con ogni cluster che elabora solo i dati contrassegnati con le stesse politiche. Per esempio, un cluster può contenere dati che non possono essere condivisi con altri servizi, mentre un altro può contenere dati che non possono essere scritti su disco. Riverbed monitora il codice lato server per assicurarsi che aderisca alle policy dell'utente. Se non lo fa, Riverbed interrompe il servizio.

Riverbed mira a far rispettare le preferenze sui dati degli utenti, pur mantenendo i vantaggi del cloud computing, come l'esecuzione di calcoli su larga scala su server in outsourcing. "Gli utenti forniscono molti dati alle app Web per i servizi, ma perdi il controllo su come vengono utilizzati i dati o dove stanno andando, " dice il primo autore Frank Wang SM '16, dottorato di ricerca '18, un neolaureato del Dipartimento di Ingegneria Elettrica e Informatica e del Laboratorio di Informatica e Intelligenza Artificiale. "Diamo agli utenti il controllo per dire alle app web, 'Questo è esattamente il modo in cui puoi utilizzare i miei dati.'"

Su quel filo, un vantaggio aggiuntivo per gli sviluppatori di app, Wang aggiunge, sta stabilendo più fiducia con gli utenti. "Questa è una grande cosa ora, " Dice Wang. "Un punto di forza per la tua app sarebbe dire, 'L'obiettivo della mia app è proteggere i dati degli utenti.'"

Unendo Wang sulla carta sono Ph.D. lo studente Ronny Ko e il professore associato di informatica James Mickens, entrambi di Harvard.

Creare "universi"

Nel 2016, l'Unione Europea ha approvato il Regolamento generale sulla protezione dei dati (GDPR), che stabilisce che gli utenti devono acconsentire all'accesso ai propri dati, di avere il diritto di chiedere la cancellazione dei propri dati, e che le aziende devono attuare misure di sicurezza adeguate. Per gli sviluppatori web, però, queste leggi forniscono poche indicazioni tecniche per la scrittura di app sofisticate che devono sfruttare i dati degli utenti.

Nel passato, gli scienziati informatici hanno progettato sistemi di "controllo del flusso di informazioni" (IFC) che consentono ai programmatori di etichettare le variabili del programma con le politiche dei dati. Ma con così tante variabili e molte possibili interazioni tra variabili, questi sistemi sono difficili da programmare. Così, nessun servizio web su larga scala utilizza tecniche IFC.

In primis, Riverbed sfrutta il fatto che il codice lato server di un'app può essere eseguito su uno speciale programma di "monitoraggio":programmi che tengono traccia, regolare, e verificare come altri programmi manipolano i dati. Il monitor crea una copia separata del codice dell'app per ogni criterio univoco assegnato ai dati. Ogni copia è chiamata "universo". Il monitor garantisce che gli utenti che condividono la stessa politica abbiano i propri dati caricati su, e manipolato da, lo stesso universo. Questo metodo consente al monitor di terminare il codice di un universo, se quel codice tenta di violare la politica dei dati dell'universo.

Questo processo incorpora un interprete personalizzato, un programma che compila il linguaggio di programmazione in codice che è compreso da un computer. Gli interpreti vengono utilizzati anche per aiutare i programmi runtime a implementare comandi di basso livello in un programma originale durante l'esecuzione. I ricercatori hanno modificato un interprete tradizionale per estrarre politiche definite dai dati degli utenti in entrata ed etichettare determinate variabili con una direzione politica specifica. Le etichette saranno, ad esempio, denota servizi Web autorizzati per la condivisione dei dati o limita l'archiviazione permanente, il che significa che i dati non possono essere archiviati quando l'utente smette di utilizzare il servizio Web.

"Dì che voglio che i miei dati vengano aggregati con altri utenti. Quei dati vengono inseriti nel proprio universo con altri dati utente con la stessa politica, " dice Wang. "Se un utente non vuole condividere alcun dato con nessuno, allora quell'utente ha il suo intero universo. Per di qua, non hai alcuna impollinazione incrociata di dati."

Per gli sviluppatori, questo rende molto più facile rispettare il GDPR e altre leggi sulla privacy, Wang dice, perché gli utenti hanno dato il consenso esplicito per l'accesso ai dati. "Tutti gli utenti in ogni universo hanno gli stessi criteri, così puoi fare tutte le tue operazioni e non preoccuparti di quali dati vengono inseriti in un algoritmo, perché tutti hanno la stessa politica sui dati in quell'universo, " dice Wang.

Copia efficiente

Nella peggiore delle ipotesi, Wang dice, ogni utente di ogni servizio avrebbe un universo separato. In genere, ciò potrebbe causare un sovraccarico di calcolo significativo e rallentare il servizio. Ma i ricercatori hanno sfruttato una tecnica relativamente nuova, denominata "virtualizzazione basata su container, " che consentono al monitor Riverbed di creare in modo più efficiente più universi dello stesso programma. Di conseguenza, la gestione dell'universo è veloce, anche se un servizio ha centinaia o migliaia di universi.

Nella loro carta, Riverbed valutato dai ricercatori su diverse app, la dimostrazione della piattaforma mantiene i dati al sicuro con un sovraccarico minimo. I risultati mostrano che più di 1, 000 universi possono spremere su un singolo server, con calcolo aggiuntivo che rallenta il servizio di circa il 10 percento. È abbastanza veloce ed efficiente per l'uso nel mondo reale, dice Wang.

I ricercatori immaginano che le politiche siano scritte da gruppi di advocacy, come Electronic Frontier Foundation (EFF), un gruppo internazionale per i diritti digitali senza scopo di lucro. Nuove politiche possono essere "inserite" in un servizio gestito da Riverbed in qualsiasi momento, il che significa che gli sviluppatori non hanno bisogno di riscrivere il codice.

Intelligenza artificiale ispirata al cervello nei robot

Il telefono pieghevole Samsung è diverso, ma anche quasi $ 2, 000

Elettronica