• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Altro
    Sistemi statistici svizzeri potenziati dai big data

    Credito:CC0 Dominio Pubblico

    È stato raccolto un enorme volume di dati digitali, archiviati e condivisi negli ultimi anni da fonti come social media, sistemi di geolocalizzazione e immagini aeree da droni e satelliti, offrendo ai ricercatori molti nuovi modi per studiare le informazioni e decifrare il nostro mondo. In Svizzera, l'Ufficio federale di statistica (UST) si è interessato alla rivoluzione dei big data e alle possibilità che offre di generare statistiche predittive a beneficio della società.

    I metodi convenzionali come i censimenti e le indagini rimangono il punto di riferimento per la generazione di indicatori socio-economici a livello comunale, livello cantonale e nazionale. Ma questi metodi possono ora essere integrati con metodi secondari, per lo più dati preesistenti, da fonti quali abbonamenti di telefoni cellulari e carte di credito. Secondo la Strategia per l'innovazione dei dati 2017 dell'UST, "L'obiettivo dell'innovazione dei dati è quello di migliorare la qualità, la portata e l'efficienza in termini di costi dei prodotti statistici e per ridurre l'onere di risposta per le famiglie e le imprese."

    Dati anonimi

    In questo contesto, un team di scienziati del Laboratorio dell'EPFL sulle relazioni uomo-ambiente nei sistemi urbani (HERUS) ha condotto uno studio innovativo su nuovi usi per i dati detenuti dalle compagnie assicurative. L'azienda partner leader del laboratorio, La Mobiliere, fornito dati anonimi da centinaia di migliaia di assicurati. Questi dati includevano fattori come l'età, codice postale di residenza, auto e casa, e stato occupazionale.

    "Volevamo vedere se potevamo usare questi dati per prevedere indicatori socioeconomici specifici, quelli che potrebbero darci un quadro migliore della qualità delle aree urbane svizzere. Un grande vantaggio dei dati in possesso degli assicuratori, a condizione che siano disposti condividerlo, è che sono economici da usare, visto che esistono già, e le indagini annuali possono essere effettuate senza costi aggiuntivi, "dice Emanuele Massaro, uno degli autori principali dello studio, che è stato pubblicato in PLOS UNO il 3 marzo.

    Utilizzando tecniche di data mining, il team di ricerca ha estratto le informazioni rilevanti e le ha aggregate per coprire le 170 città svizzere più popolate. In tutto, ne hanno ottenuti quasi 600, 000 profili, ciascuno identificato da un codice univoco. "Il dataset di La Mobilière è molto completo; contiene una vasta gamma di informazioni che ci hanno permesso di tenere conto di oltre 30 variabili, che abbiamo utilizzato principalmente per selezionare quelle variabili che meglio corrispondono a ciascun indicatore socio-economico, "dice Lorenzo Donadio, uno studente di Master in scienze e ingegneria ambientale presso l'EPFL e primo autore dello studio.

    Un modello di regressione spaziale

    Gli scienziati hanno sviluppato un modello di regressione spaziale per prevedere con precisione dodici variabili in sei categorie:popolazione, trasporto, opera, spazio e regione, alloggio, e l'economia. "Certo, le nostre previsioni non possono sostituire i censimenti ufficiali, ma possono fungere da segnaletica annuale. Volevamo anche dimostrare che i set di dati degli assicuratori contengono una grande quantità di informazioni socialmente rilevanti, oltre a quelle che usano per il marketing e le ricerche di mercato, e che gli assicuratori dovrebbero prendere in considerazione la possibilità di lavorare più a stretto contatto con i ricercatori, "dice Massaro.

    Il modello statistico del team è stato sviluppato esclusivamente per scopi di ricerca e non ha un'applicazione pratica in quanto tale. Potrebbe essere utilizzato per guidare i responsabili politici, ma sono ancora necessari i dati del censimento regolare. Ai dati di La Mobilière mancano alcune informazioni, come per i giovani di età inferiore ai 18 anni, ma sono comunque rappresentativi di una larga parte della popolazione. "Il nostro modello potrebbe essere utilizzato dai responsabili delle politiche cittadine e dagli uffici statistici del governo, che potrebbero incorporare questo tipo di informazioni nei loro sforzi di modernizzazione. I set di dati degli assicuratori sono altamente granulari perché contengono informazioni molto specifiche sui loro clienti, "dice Massaro.


    © Scienza https://it.scienceaq.com