Credito:CC0 Dominio pubblico
La sequenza del DNA di ognuno è unica. Ma per coloro che desiderano mantenere la propria privacy genetica, potrebbe non essere abbastanza unico.
Un nuovo studio sostiene che più della metà degli americani potrebbe essere identificata per nome se tutto ciò da cui si dovesse iniziare fosse un campione del loro DNA e alcuni fatti di base, come dove vivono e quanti anni potrebbero avere.
non sarebbe semplice, e non sarebbe economico. Ma il fatto che sia diventato fattibile costringerà tutti noi a ripensare al significato di privacy nell'era del DNA, hanno detto gli esperti.
C'è poco tempo da perdere. I ricercatori dietro il nuovo studio affermano che una volta che 3 milioni di americani hanno caricato i loro genomi su siti web pubblici di genealogia, quasi tutti negli Stati Uniti sarebbero identificabili solo dal loro DNA e solo da alcuni indizi aggiuntivi.
Più di 1 milione di americani hanno già pubblicato le loro informazioni genetiche, e decine di altri lo fanno ogni giorno.
"La gente si è chiesta quanto tempo ci vorrà prima che tu possa usare il DNA per rilevare praticamente chiunque, " disse Ruth Dickover, direttore del programma di scienze forensi presso l'Università della California, Davis che non era coinvolto nello studio. "Gli autori stanno dicendo che non ci vorrà così tanto tempo".
Questa nuova realtà rappresenta la convergenza di due tendenze di vecchia data.
Uno di questi è l'aumento dei test genetici diretti al consumatore. Aziende come Ancestry.com e 23andMe possono sequenziare il DNA di chiunque per circa $ 100. Tutto quello che devi fare è fornire un campione di saliva e inviarlo per posta.
L'altro elemento essenziale è la proliferazione di database genealogici consultabili pubblicamente come GEDmatch. Chiunque può caricare un genoma completo su questi siti e computer potenti lo sgranocchieranno, cercando tratti di sequenze di DNA corrispondenti che possono essere utilizzate per costruire un albero genealogico.
Per testare il potere crescente di questi siti, i ricercatori guidati dallo scienziato informatico della Columbia University Yaniv Erlich hanno cercato di vedere se potevano trovare il nome di una persona, e quindi, la sua identità, se tutto ciò su cui dovevano andare avanti fosse un pezzo del suo DNA e una piccola quantità di informazioni biografiche.
Hanno iniziato con una sequenza completa del DNA di una persona le cui informazioni genetiche sono state pubblicate anonimamente come parte di uno studio scientifico non correlato. (Avevano effettivamente identificato questa donna in uno studio precedente, ma ai fini di questo lavoro, facevano finta di non sapere chi fosse.)
Erlich e i suoi collaboratori hanno caricato il suo codice genetico su GEDmatch e hanno fatto una ricerca per vedere se aveva qualche parentela con il sito. Ne hanno trovati due:uno nel North Dakota e uno nel Wyoming.
I ricercatori potevano dire che erano tutti imparentati perché condividevano un certo numero di polimorfismi a singolo nucleotide, o SNP. Queste sono lettere singole in punti specifici tra i circa 3 miliardi di A, Cs, T e G che compongono il genoma umano.
Più SNP sono condivisi dalle persone, quanto più strettamente correlati sono.
Confrontando il DNA di tutti e tre i parenti, La squadra di Erlich è stata in grado di trovare una coppia ancestrale comune che erano i bisnonni della donna dello Utah.
Prossimo, i ricercatori hanno perlustrato siti web genealogici e altre fonti alla ricerca di ulteriori discendenti di quella coppia di tanto tempo fa. Hanno trovato 10 figli e centinaia di nipoti e pronipoti.
Quindi hanno iniziato a selezionare la loro enorme lista di discendenti. Hanno eliminato tutti gli uomini dal campione, poi quelli che non erano vivi quando è stato sequenziato il DNA della donna dello Utah. Gli autori sapevano anche che il loro soggetto era sposato e quanti figli aveva, che li ha aiutati a raggiungere il loro obiettivo.
Dopo una lunga giornata di duro lavoro, i ricercatori sono stati in grado di nominare correttamente il proprietario del campione di DNA.
Gli autori hanno affermato che lo stesso processo funzionerebbe per circa il 60 percento degli americani di origine europea, chi sono le persone più propense a utilizzare i siti web genealogici, disse Erlich. Sebbene le probabilità di successo sarebbero inferiori per le persone provenienti da altri contesti, ci si aspetterebbe comunque che funzioni per più della metà di tutti gli americani, loro hanno detto.
Per giungere a questa conclusione, i ricercatori hanno analizzato un database diverso composto da 1,28 milioni di individui anonimi il cui DNA è stato sequenziato da MyHeritage, una società di analisi del DNA e storia familiare in cui Erlich è il direttore scientifico.
Se riesci a trovare il cugino di terzo grado di una persona in un database genealogico, allora dovresti essere in grado di identificare la persona con una ragionevole quantità di indagini, disse Erlich. Quindi il team ha verificato quanti parenti dell'ordine di un cugino di terzo grado o più vicini riuscivano a trovare per ogni individuo nel proprio set di dati.
Ne hanno trovati in abbondanza:il 60 percento degli 1,28 milioni di persone erano abbinati a un parente che era almeno tanto vicino quanto un cugino di terzo grado, e il 15% aveva un parente stretto almeno quanto un cugino di secondo grado.
I risultati sono stati pubblicati giovedì sulla rivista Scienza .
Finora, Il 72enne Joseph James DeAngelo è la persona più famosa ad essere identificata in questo modo. Potresti conoscerlo meglio come il sospetto killer del Golden State, accusato di 13 capi di omicidio e 13 capi di tentato rapimento.
Quando i funzionari delle forze dell'ordine hanno utilizzato un database del DNA accessibile al pubblico per catturare DeAngelo ad aprile, è stata solo la seconda volta nella storia della risoluzione dei crimini che la strategia è stata attuata con successo.
Da allora, almeno 13 ulteriori sospetti criminali sono stati identificati allo stesso modo.
"La risoluzione del caso Golden State Killer ha aperto a questo metodo una possibilità e altri laboratori criminali ne stanno approfittando, "Disse Dickover. "Chiaramente è iniziata una tendenza."
Anche i privati stanno beneficiando della tecnologia. Gli adottati hanno trovato genitori e fratelli biologici, e altri hanno trovato cugini lontani che possono gettare nuova luce sulle origini e sul patrimonio di una famiglia.
Ma poiché molti di noi caricano il DNA in database consultabili pubblicamente, le implicazioni possono essere inquietanti.
"Quando la polizia ha catturato il Golden State Killer, quello è stato un giorno molto buono per l'umanità, " Ha detto Erlich. "Il problema è che la stessa strategia può essere utilizzata in modo improprio".
Pensa ai governi stranieri che usano questa tecnica per rintracciare i cittadini americani, Egli ha detto. O manifestanti e attivisti perseguitati in questo modo.
Erlich e i suoi coautori hanno proposto una strategia di mitigazione che renderebbe più difficile caricare una sequenza di DNA sconosciuta in un database genealogico e cercare una corrispondenza.
Suggeriscono che le società di test del DNA dirette al consumatore inseriscano un codice speciale sui file di dati grezzi che inviano ai loro clienti. I siti di genealogia potrebbero quindi accettare di consentire alle persone di caricare sequenze di DNA solo se dispongono di un codice valido. Ciò garantirebbe che le persone possano condurre ricerche relative solo al proprio DNA.
Un sistema come questo non impedirebbe alle forze dell'ordine di utilizzare database genealogici per cercare sospetti, disse Erlich.
L'obiettivo finale è consentire alle persone di utilizzare il proprio DNA per saperne di più sulle proprie famiglie senza sacrificare la propria privacy, disse Erlich.
Proprio quest'anno, suo cugino adottivo ha trovato una sorella biologica che vive dall'altra parte del mondo, Egli ha detto.
"Ecco perché abbiamo questa tecnica, " Egli ha detto.
©2018 Los Angeles Times
Distribuito da Tribune Content Agency, LLC.