Internet sta crescendo, ma le vecchie informazioni continuano a scomparire ogni giorno. Credito:wk1003mike/shutterstock.com
Molti utenti di MySpace sono rimasti costernati nello scoprire all'inizio di quest'anno che la piattaforma di social media ha perso 50 milioni di file caricati tra il 2003 e il 2015.
L'incapacità di MySpace di curare e preservare il contenuto dei suoi utenti dovrebbe servire a ricordare che fare affidamento su servizi di terze parti gratuiti può essere rischioso.
MySpace ha probabilmente conservato i dati degli utenti; ha appena perso il loro contenuto. I dati erano preziosi per MySpace; il contenuto degli utenti meno.
Che fine ha fatto MySpace?
MySpace è un sito di social network in cui gli artisti possono caricare musica o altri contenuti per l'accesso e la distribuzione alla propria comunità di utenti. È sempre stato un sito gratuito, con entrate provenienti da annunci e programmazione che si rivolge agli utenti per prodotti specifici.
Costituita nel 2003 su imitazione del sito di social gaming Friendster, MySpace è cresciuto rapidamente ed è stato acquistato dalla News Corporation di Rupert Murdoch nel 2005. Entro il 2008, MySpace era il principale sito di social networking, valutato una volta a US $ 12 miliardi Ma è diminuito in popolarità - grazie a un'eccessiva prevalenza di annunci, preoccupazioni circa l'esposizione dei minori a contenuti sessuali e altri problemi. Nel 2011, News Corporation ha venduto MySpace a Specific Media, che lo ha rivenduto nel 2016 a Time Inc., che è stata a sua volta acquistata dalla Meredith Corporation nel 2018.
Quindi la società ha attraversato tre passaggi di proprietà in un periodo di 12 anni, e ha visto le entrate e l'adesione crollare precipitosamente in quel periodo. Una vendita potrebbe andare bene, ma tre vendite a breve termine mi suggeriscono un'attività travagliata che non era in una buona posizione per vegliare sulla proprietà intellettuale di altri.
Chiunque utilizzi MySpace come servizio di archiviazione e non disponesse di un backup alternativo è semplicemente sfortunato. Hai lasciato la tua proprietà intellettuale accanto all'autostrada dell'informazione, e quando sei tornato 10 anni dopo non c'era più.
MySpace non è il solo ad incontrare problemi. servizi cloud di Amazon, Per esempio, ha subito anche un'interruzione sostanziale nel 2011 e un'altra nel 2017. Sebbene temporanea, e senza effettiva perdita di dati, queste interruzioni hanno lasciato gli utenti senza accesso a file preziosi e importanti per qualche tempo.
Un problema molto più grande
La conservazione del contenuto o della proprietà intellettuale su Internet presenta un enigma. Se è accessibile, allora non è sicuro; se è sicuro, allora non è accessibile.
Il contenuto accessibile è soggetto a manomissione, furto o altri tipi di cattive azioni. Solo i contenuti inaccessibili possono essere bloccati e protetti dall'hacking.
Internet accede attualmente a circa 15 zettabyte di dati, e sta crescendo a una velocità di 70 terabyte al secondo. Si tratta di una nave dichiaratamente che perde, e i contenuti vanno costantemente offline per finire persi per sempre.
In una dichiarazione, Myspace ha detto, "Ci scusiamo per l'inconveniente." Credito:chrisdorney/shutterstock.com
Sono in corso sforzi massicci e disperati per preservare tutto ciò che vale la pena preservare, ma anche distinguere ciò che è e ciò che non è è di per sé un'impresa formidabile. Cosa avrà valore tra 10 anni – o 50 anni? E come conservarlo?
La carta priva di acidi può durare 500 anni; iscrizioni su pietra ancora più lunghe. Ma i supporti magnetici come i dischi rigidi hanno una vita molto più breve, durata solo da tre a cinque anni. Devono anche essere copiati e verificati su un ciclo di vita molto breve per evitare il degrado dei dati a tassi di guasto osservati tra il 3% e l'8% all'anno.
Poi c'è anche un problema di conservazione del software:come possono le persone oggi o in futuro interpretare quei file WordPerfect o WordStar degli anni '80, quando le società di software originali hanno smesso di supportarli o hanno cessato l'attività?
Una startup senza scopo di lucro chiamata The Internet Archive conserva istantanee del web su base continuativa, ma principalmente questo è per pagine Web HTML pubbliche di alto livello come il sito Web del New York Times e Facebook, non per i file di contenuto sottostanti. Dallo scorso autunno, la sua Wayback Machine conteneva oltre 450 miliardi di pagine in 25 petabyte di dati. Ciò rappresenterebbe lo .0003% di Internet totale.
Università, i governi e le società scientifiche stanno lottando per preservare i dati scientifici in un miscuglio di archivi, come la Digital Preservation Coalition del Regno Unito, MetaArchivio, o la rete collaborativa di conservazione digitale ormai dismessa. La conservazione è difficile e costosa nel tempo, denaro e attrezzature. Per essere più utile, non solo deve essere memorizzato, ma ospitato in una forma accessibile e disponibile per un riutilizzo futuro.
Lo storage effettivo costa meno di $ 0,05 per gigabyte, ma lo stoccaggio è solo una piccola percentuale dei costi di conservazione. Acquisizione, rete, la manutenzione e l'amministrazione richiedono tutte un lavoro umano notevole e costoso.
I modelli di budget suggeriscono una spesa di conservazione di 10 anni di circa $ 2,50 per gigabyte, o $2, 500 per terabyte, o $ 625, 000 per i file che MySpace non è riuscito a conservare.
Considerando i propri dati
Quindi sì, Internet sta marcendo, ma archivisti e bibliotecari digitali come me sapevano che era già marcio, così come chiunque abbia mai ricevuto un errore "404 File Not Found".
Laddove vi sia un incentivo economico a conservare e utilizzare i dati, come le informazioni dell'utente, profili o cronologia di navigazione:potrebbe esistere per un periodo piuttosto lungo. È stato detto da molti che i dati sono il nuovo petrolio, e le aziende sono ansiose di trivellare e sfruttare questa risorsa.
Però, dove il contenuto è meno prezioso per chi possiede i server, c'è meno incentivo a investire nella sua conservazione. Un sondaggio di 10 milioni di visite da 25 siti casuali nel 2004 suggerisce che gli errori 404 si verificano in quasi il 3% degli URL mirati. Internet sta crescendo molto più velocemente di quanto marcisca, ma entrambe le cose stanno accadendo contemporaneamente. Nessuna gigantesca compagnia Internet ha i tuoi interessi più a cuore dei suoi.
Una rete di conservazione è nota con l'acronimo LOCKSS – Lots of Copys Keeps Stuff Safe – e questa è una buona regola empirica. Avere sempre un backup, e avere sempre più backup. Proteggi la tua privacy e proteggi i tuoi contenuti, almeno quel contenuto che potresti voler conservare, come foto, e-mail, quella sceneggiatura o romanzo, o file video e musicali. Le regole sul copyright non vietano la memorizzazione di contenuti che potresti aver acquistato, purché non lo pubblichi per la condivisione pubblica.
Lo spazio di archiviazione gratuito è un'ottima offerta, ma a volte ottieni solo ciò per cui paghi. Internet non è né sicuro né permanente. Non ha mai promesso di essere, e gli utenti non devono presumere che lo diventerà. Le parti marciscono, si corrodono e collassano mentre scrivo questo. Spera solo e pianifica di non riposare su quella piattaforma quando cade.
Questo articolo è stato ripubblicato da The Conversation con una licenza Creative Commons. Leggi l'articolo originale.