• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Fisica
    La memorizzazione dei dati nel DNA porta la natura nell'universo digitale

    La prossima frontiera dell'archiviazione dei dati:il DNA. Credito:ymgerman/Shutterstock.com

    L'umanità sta producendo dati a una velocità inimmaginabile, al punto che le tecnologie di archiviazione non possono tenere il passo. Ogni cinque anni, la quantità di dati che produciamo aumenta di 10 volte, comprese foto e video. Non tutto deve essere archiviato, ma i produttori di dispositivi di archiviazione dati non stanno realizzando dischi rigidi e chip flash abbastanza veloci da contenere ciò che vogliamo conservare. Dal momento che non smetteremo di scattare foto e registrare filmati, dobbiamo sviluppare nuovi modi per salvarli.

    Nel corso dei millenni, la natura ha sviluppato un incredibile mezzo di memorizzazione delle informazioni:il DNA. Si è evoluto per immagazzinare informazioni genetiche, progetti per la costruzione di proteine, ma il DNA può essere usato per molti altri scopi oltre a quello. Il DNA è anche molto più denso dei moderni supporti di memorizzazione:i dati su centinaia di migliaia di DVD potrebbero essere contenuti in un pacchetto di DNA delle dimensioni di una scatola di fiammiferi. Il DNA è anche molto più durevole - dura migliaia di anni - rispetto ai dischi rigidi di oggi, che può durare anni o decenni. E mentre i formati del disco rigido e gli standard di connessione diventano obsoleti, Il DNA non lo farà mai, almeno finché c'è vita.

    L'idea di archiviare i dati digitali nel DNA è vecchia di diversi decenni, ma il recente lavoro di Harvard e dell'Istituto europeo di bioinformatica ha mostrato che i progressi nei moderni metodi di manipolazione del DNA potrebbero renderlo possibile e pratico oggi. Molti gruppi di ricerca, anche al Politecnico di Zurigo, l'Università dell'Illinois a Urbana-Champaign e la Columbia University stanno lavorando su questo problema. Il nostro gruppo presso l'Università di Washington e Microsoft detiene il record mondiale per la quantità di dati archiviati e recuperati con successo dal DNA:200 megabyte.

    Preparare i bit per diventare atomi

    Supporti tradizionali come dischi rigidi, le chiavette USB o i DVD memorizzano i dati digitali modificando il magnetico, proprietà elettriche o ottiche di un materiale per memorizzare 0 e 1.

    Per memorizzare i dati nel DNA, il concetto è lo stesso ma il processo è diverso. Le molecole di DNA sono lunghe sequenze di molecole più piccole, chiamati nucleotidi – adenina, citosina, timina e guanina, solitamente indicato come A, C, T e G. Invece di creare sequenze di 0 e 1, come nei media elettronici, La conservazione del DNA utilizza sequenze dei nucleotidi.

    Ci sono diversi modi per farlo, ma l'idea generale è assegnare modelli di dati digitali ai nucleotidi del DNA. Ad esempio, 00 potrebbe essere equivalente ad A, da 01 a C, 10 su T e 11 su G. Per memorizzare un'immagine, Per esempio, iniziamo con la sua codifica come file digitale, come un JPEG. Quel file è, in sostanza, una lunga stringa di 0 e 1. Diciamo che i primi otto bit del file sono 01111000; li dividiamo in coppie – 01 11 10 00 – che corrispondono a C-G-T-A. Questo è l'ordine in cui uniamo i nucleotidi per formare un filamento di DNA.

    I file dei computer digitali possono essere piuttosto grandi, anche terabyte per database di grandi dimensioni. Ma i singoli filamenti di DNA devono essere molto più corti, contenendo solo circa 20 byte ciascuno. Questo perché più lungo è un filamento di DNA, più difficile è costruire chimicamente.

    Quindi dobbiamo suddividere i dati in blocchi più piccoli, e aggiungi a ciascuno un indicatore di dove cade nella sequenza. Quando è il momento di leggere le informazioni memorizzate sul DNA, quell'indicatore assicurerà che tutti i blocchi di dati rimangano nell'ordine corretto.

    Ora abbiamo un piano su come archiviare i dati. Quindi dobbiamo farlo davvero.

    Memorizzazione dei dati

    Dopo aver determinato l'ordine in cui devono essere inserite le lettere, le sequenze di DNA sono prodotte lettera per lettera con reazioni chimiche. Queste reazioni sono guidate da apparecchiature che contengono flaconi di A, C, G e T e li mescola in una soluzione liquida con altre sostanze chimiche per controllare le reazioni che specificano l'ordine dei filamenti fisici del DNA.

    Questo processo ci offre un altro vantaggio dell'archiviazione del DNA:le copie di backup. Piuttosto che fare un filo alla volta, le reazioni chimiche producono molti filamenti identici contemporaneamente, prima di fare molte copie del prossimo filone della serie.

    Una volta creati i filamenti di DNA, dobbiamo proteggerli dai danni causati dall'umidità e dalla luce. Quindi li asciugiamo e li mettiamo in un contenitore che li mantenga freddi e blocchi acqua e luce.

    Ma i dati memorizzati sono utili solo se possiamo recuperarli in seguito.

    Rileggere i dati

    Per rileggere i dati fuori dalla memoria, usiamo una macchina di sequenziamento esattamente come quelle usate per l'analisi del DNA genomico nelle cellule. Questo identifica le molecole, generando una sequenza di lettere per molecola, che poi decodifichiamo in una sequenza binaria di 0 e 1 in ordine. Questo processo può distruggere il DNA mentre viene letto, ma è qui che entrano in gioco quelle copie di backup:ci sono molte copie di ogni sequenza.

    E se le copie di backup si esauriscono, è facile fare copie duplicate per riempire lo spazio di archiviazione, proprio come la natura copia continuamente il DNA.

    Al momento, la maggior parte dei sistemi di recupero del DNA richiede la lettura di tutte le informazioni memorizzate in un particolare contenitore, anche se ne vogliamo solo una piccola quantità. È come leggere le informazioni di un intero disco rigido solo per trovare un messaggio di posta elettronica. Abbiamo sviluppato tecniche, basate su metodi biochimici ben studiati, che ci consentono di identificare e leggere solo le informazioni specifiche di cui un utente ha bisogno per recuperare dalla memoria del DNA.

    Sfide rimanenti

    Attualmente, La conservazione del DNA è sperimentale. Prima che diventi un luogo comune, deve essere completamente automatizzato, ei processi sia di costruzione del DNA che di lettura devono essere migliorati. Sono entrambi soggetti a errori e relativamente lenti. Per esempio, l'odierna sintesi del DNA ci permette di scrivere poche centinaia di byte al secondo; un disco rigido moderno può scrivere centinaia di milioni di byte al secondo. Una foto media di iPhone richiederebbe diverse ore per essere archiviata nel DNA, anche se ci vuole meno di un secondo per salvare sul telefono o trasferire su un computer.

    Queste sono sfide importanti, ma siamo ottimisti perché tutte le tecnologie rilevanti stanno migliorando rapidamente. Ulteriore, L'archiviazione dei dati del DNA non ha bisogno della perfetta accuratezza richiesta dalla biologia, quindi è probabile che i ricercatori trovino modi ancora più economici e veloci per archiviare le informazioni nel sistema di archiviazione dati più antico della natura.

    Questo articolo è stato originariamente pubblicato su The Conversation. Leggi l'articolo originale.

    © Scienza https://it.scienceaq.com