L'assistente professore della Georgia Tech Mariel Borowitz è mostrato con apparecchiature di comunicazione satellitare. La drammatica crescita nella generazione e raccolta di dati cambierà il modo in cui le agenzie federali rendono disponibili i dati. Credito:Allison Carter, Georgia Tech
Come parte delle loro missioni, le agenzie federali generano o raccolgono enormi volumi di dati da fonti come i satelliti per l'osservazione della terra, reti di sensori e ricerca genomica. Molte di queste informazioni sono utili alle istituzioni commerciali e accademiche, che ora di solito può accedere gratuitamente a questi dati generati pubblicamente dai server dell'agenzia.
Ma poiché il volume dei dati continua ad espandersi, molte agenzie stanno prendendo in considerazione l'utilizzo di servizi cloud commerciali per aiutarli a archiviarli e renderli disponibili agli utenti. Mentre le agenzie possono avere strategie diverse, queste nuove partnership potrebbero comportare commissioni per gli utenti sui download e le analisi eseguite sui dati mentre rimangono nel cloud.
Scrivendo in un articolo del forum politico pubblicato l'8 febbraio sulla rivista Scienza , un ricercatore della politica spaziale del Georgia Institute of Technology che studia l'uso di tali dati esorta alla cautela sulla progettazione di queste partnership commerciali cloud e sulla possibile imposizione di tariffe per gli utenti.
"Con il sistema attuale, i dati governativi liberi e aperti vengono utilizzati dagli scienziati per condurre ricerche, dagli imprenditori per creare nuove imprese, e da cittadini e altre organizzazioni per promuovere la trasparenza del governo, " disse Mariel Borowitz, un assistente professore alla Sam Nunn School of International Affairs della Georgia Tech. "Se gli utenti devono pagare delle tasse per scaricare o analizzare i dati, ciò ridurrà la capacità di questi utenti di accedere e lavorare con i dati. L'esperienza passata suggerisce che gli impatti di questa diminuzione nell'uso dei dati potrebbero essere grandi, sia per i singoli utenti che per la società nel suo insieme".
Lo spostamento dei dati su sistemi cloud commerciali fornirebbe probabilmente un accesso più ampio e opzioni di analisi più efficienti, ma avverte che questi vantaggi potrebbero essere compensati dal costo, in particolare per le organizzazioni con budget ridotti.
"Le agenzie rischiano di perdere alcuni dei vantaggi di questa transizione non preventivando i costi associati al download e all'analisi dei dati, fino a un livello ragionevole, " Borowitz ha detto. "Molti che sarebbero interessati a utilizzare i dati potrebbero non essere in grado di pagare le tasse associate. Ricercatori, le organizzazioni senza scopo di lucro e altre che non traggono direttamente profitto dall'uso di questi dati hanno maggiori probabilità di essere colpite".
Borowitz ha recentemente trascorso due anni alla NASA e ha assistito allo sviluppo di sistemi che aumenteranno notevolmente la raccolta dei dati e ai dibattiti sulla futura memorizzazione dei dati. Recentemente ha scritto un libro, Spazio aperto:lo sforzo globale per l'accesso aperto ai dati satellitari ambientali, pubblicato da MIT Press.
Vorrebbe che le agenzie che forniscono dati continuino a sostenere i costi, fino a un "livello ragionevole, " per garantire che i dati continuino ad essere prontamente disponibili per tutti gli utenti. In alternativa ai servizi commerciali, alcune agenzie stanno valutando lo sviluppo in proprio, soluzioni cloud personalizzate, e dovrà pesare il costo dei benefici delle diverse opzioni. Ci saranno anche tecnici, questioni organizzative e politiche da considerare.
"Le agenzie stanno prendendo sul serio le questioni della sicurezza e della conservazione a lungo termine dei dati, " Borowitz ha aggiunto. "Quando si lavora con fornitori commerciali, alcuni sono preoccupati per la possibilità di essere "bloccati" su un fornitore, a causa degli elevati costi di migrazione dei dati da un sistema all'altro. È possibile che costi e capacità cambino nel tempo. D'altra parte, i fornitori di cloud commerciali dispongono di una grande forza lavoro e di un'infrastruttura estesa che consente loro di fornire servizi e capacità ben oltre ciò che qualsiasi agenzia sarebbe in grado di mantenere".
Borowitz osserva che la maggior parte delle agenzie non ha preso decisioni finali sui propri programmi basati su cloud, quindi dovrebbe esserci tempo sufficiente per lavorare su questi problemi.
L'assistente professore della Georgia Tech Mariel Borowitz è mostrato con apparecchiature di comunicazione satellitare. La drammatica crescita nella generazione e raccolta di dati cambierà il modo in cui le agenzie federali rendono disponibili i dati. Credito:Allison Carter, Georgia Tech
"La maggior parte delle agenzie che rendono i dati disponibili al pubblico, in particolare agenzie scientifiche, stanno già discutendo e/o iniziando a fare la transizione ai sistemi cloud, " ha detto. "Tuttavia, questi programmi, presso agenzie come NSF, NIH, NASA e NOAA sono ancora nelle loro fasi iniziali, e c'è ancora la possibilità di fornire un feedback e di apportare modifiche ai programmi".
L'esistenza di tariffe per l'accesso ai dati governativi non è senza precedenti, ma Borowitz sostiene che l'esperienza passata suggerisce che le tariffe degli utenti comportano un utilizzo significativamente inferiore. Prima che i dati Landsat, le immagini satellitari della Terra, fossero resi disponibili gratuitamente nel 2008, non più di 25, 000 immagini all'anno sono state acquistate dalla collezione. "In pochi anni dall'implementazione della politica dei dati liberi e aperti, il governo ne distribuiva 250, 000 immagini al mese, " lei disse.
Quel numero fornisce un suggerimento di ciò con cui hanno a che fare le agenzie spesso a corto di liquidità. Secondo il giornale, la National Oceanic and Atmospheric Administration (NOAA) ospita più di 100 petabyte (PB) di dati e genera più di 30 PB all'anno dai satelliti, radar, modelli informatici e altre fonti. La NASA prevede che il suo archivio crescerà fino a 250 PB entro il 2025. E la quantità di dati genomici presso il National Institutes of Health sta crescendo in modo esponenziale.
Un petabyte è 1, 024 terabyte, o un milione di gigabyte. Un gigabyte è 1, 024 megabyte. Per scala, una fotografia media scattata da una fotocamera di un telefono cellulare di fascia alta può essere di circa 10 megabyte. I computer portatili possono essere in grado di memorizzare fino a pochi terabyte di dati.
Borowitz vede la transizione al cloud computing sia come un'opportunità che come una sfida per la futura disponibilità dei dati governativi. "Le decisioni prese in questo momento sulla struttura di questi programmi hanno il potenziale per avere un impatto significativo sui ricercatori e sulla società nel suo insieme, quindi è importante aumentare la consapevolezza e aumentare il coinvolgimento su questi temi".