Nei precedenti 6, 000 persone albero genealogico pulito e organizzato utilizzando la teoria dei grafi, gli individui che abbracciano sette generazioni sono rappresentati in verde, con i loro legami matrimoniali in rosso. Credito:Columbia University
Le riunioni del Ringraziamento potrebbero diventare più grandi, molto più grandi, man mano che la scienza scopre i legami familiari che ci legano. Da milioni di profili genealogici online interconnessi, i ricercatori hanno accumulato il più grande, albero genealogico scientificamente verificato fino ad oggi, che a 13 milioni di persone, è leggermente più grande di una nazione delle dimensioni di Cuba o del Belgio. Pubblicato sulla rivista Scienza , il nuovo set di dati offre nuove informazioni sugli ultimi 500 anni di matrimoni e migrazioni in Europa e Nord America, e il ruolo dei geni nella longevità.
"Attraverso il duro lavoro di molti genealogisti curiosi della loro storia familiare, abbiamo raccolto in crowdsourcing un enorme albero genealogico e boom, ha inventato qualcosa di unico, " ha detto l'autore senior dello studio, Yaniv Erlich, un informatico presso la Columbia University e Chief Science Officer presso MyHeritage, una società di genealogia e test del DNA che possiede Geni.com, la piattaforma che ospita i dati utilizzati nello studio. "Speriamo che questo set di dati possa essere utile agli scienziati che ricercano una serie di altri argomenti".
I ricercatori hanno scaricato 86 milioni di profili pubblici da Geni.com, uno dei più grandi siti web di genealogia collaborativa al mondo, e ha utilizzato la teoria dei grafi matematica per pulire e organizzare i dati. Quello che è emerso tra gli altri alberi genealogici più piccoli è stato un singolo albero di 13 milioni di persone che abbracciano una media di 11 generazioni. Teoricamente, avrebbero bisogno di tornare indietro di altre 65 generazioni per convergere su un antenato comune e completare l'albero. Ancora, il set di dati rappresenta una pietra miliare spostando le ricerche sulla storia familiare dai necrologi dei giornali e dagli archivi della chiesa nell'era digitale, rendendo possibili indagini a livello di popolazione. I ricercatori facilitano anche la sovrapposizione di altri set di dati per studiare una serie di tendenze socioeconomiche su larga scala.
"È un momento emozionante per la scienza dei cittadini, " disse Melinda Mills, un demografo dell'Università di Oxford che non è stato coinvolto nello studio "Dimostra come milioni di persone normali sotto forma di appassionati di genealogia possono fare la differenza per la scienza. Potere per le persone!"
Il set di dati dettaglia quando e dove ogni individuo è nato e morto, e rispecchia i dati demografici degli individui di Geni.com, con l'85% dei profili provenienti da Europa e Nord America. I ricercatori hanno verificato che il set di dati fosse rappresentativo del livello di istruzione della popolazione generale degli Stati Uniti effettuando un controllo incrociato di un sottoinsieme di profili di Vermont Geni.com con il registro dettagliato dei decessi dello stato.
"I pedigree ricostruiti mostrano che siamo tutti imparentati l'uno con l'altro, " ha detto Peter Visscher, un genetista quantitativo dell'Università del Queensland che non era coinvolto nello studio. "Questo fatto è noto dai principi di base della storia della popolazione, ma ciò che gli autori hanno ottenuto è ancora molto impressionante."
Matrimonio, Migrazione e parentela genetica L'industrializzazione ha profondamente alterato il lavoro e la vita familiare, e queste tendenze coincidono con il cambiamento delle scelte matrimoniali nei dati. Prima del 1750, la maggior parte degli americani ha trovato un coniuge entro sei miglia (10 chilometri) da dove sono nati, ma per i nati nel 1950, quella distanza si era estesa a circa 60 miglia (100 chilometri), i ricercatori hanno scoperto. "È diventato più difficile trovare l'amore della tua vita, "Erlich scherza.
Prima del 1850, sposarsi in famiglia era comune, a qualcuno che era, in media, un cugino di quarto grado, rispetto ai cugini di settimo oggi, i ricercatori hanno scoperto. Curiosamente, i ricercatori hanno scoperto che tra il 1800 e il 1850, le persone hanno viaggiato più lontano che mai per trovare un compagno - quasi 12 miglia (19 chilometri) in media - ma avevano maggiori probabilità di sposare un cugino di quarto grado o più vicino. Cambiare le norme sociali, piuttosto che aumentare la mobilità, potrebbe aver portato le persone a evitare i parenti stretti come coniugi, ipotizzano.
In una relativa osservazione, hanno scoperto che le donne in Europa e Nord America sono emigrate più degli uomini negli ultimi 300 anni, ma quando gli uomini emigrarono, hanno viaggiato molto più lontano in media.
Geni e longevità Per cercare di districare il ruolo della natura e dell'educazione nella longevità, i ricercatori hanno costruito un modello e lo hanno addestrato su un set di dati di 3 milioni di parenti nati tra il 1600 e il 1910 che avevano vissuto oltre i 30 anni. Hanno escluso i gemelli, persone morte nella guerra civile americana, prima e seconda guerra mondiale, o in un disastro naturale (dedotto se i parenti sono morti entro 10 giorni l'uno dall'altro).
Hanno confrontato la durata della vita di ogni individuo con quella dei loro parenti e il loro grado di separazione e hanno scoperto che i geni spiegavano circa il 16% della variazione di longevità osservata nei loro dati, nella fascia bassa delle stime precedenti che variavano da circa il 15% al 30%.
I risultati indicano che i geni di buona longevità possono prolungare la vita di qualcuno in media di cinque anni, disse Erlich. "Non è molto, " aggiunge. "Studi precedenti hanno dimostrato che il fumo toglie 10 anni alla tua vita. Ciò significa che alcune scelte di vita potrebbero essere molto più importanti della genetica".
In modo significativo, lo studio mostra anche che i geni che influenzano la longevità agiscono in modo indipendente piuttosto che interagire tra loro, un fenomeno chiamato epistasi. Alcuni scienziati hanno usato l'epistasi per spiegare perché gli studi genomici su larga scala finora non sono riusciti a trovare i geni che codificano tratti complessi come l'intelligenza o la longevità.
Se alcune varianti genetiche agiscono insieme per influenzare la longevità, i ricercatori avrebbero visto una maggiore correlazione tra individui strettamente imparentati che condividono più DNA, e quindi più interazioni genetiche. Però, hanno trovato un legame lineare tra longevità e parentela genetica, escludendo un'epistasi diffusa.
"Questo è importante nel campo perché l'epistasi è stata proposta come fonte di "ereditarietà mancante, '", ha detto l'autore principale dello studio, Joanna Thornycroft, un ex studente laureato presso il Whitehead Institute for Biomedical Research, ora al Wellcome Sanger Institute.
Aggiunge Visscher:"Questo è del tutto in linea con la teoria e le precedenti deduzioni dai dati SNP [variante], eppure per qualche ragione molti ricercatori in genetica umana ed epidemiologia continuano a credere che ci sia molta variazione genetica non additiva per malattie comuni e tratti quantitativi".
Il set di dati è disponibile per la ricerca accademica tramite FamiLinx.org, un sito web creato da Erlich e dai suoi colleghi. Sebbene i dati di FamiLinx siano anonimi, i lettori curiosi possono controllare Geni.com per vedere se un membro della famiglia potrebbe averli aggiunti lì. Se è così, ci sono buone probabilità che siano entrati nell'albero genealogico di 13 milioni di persone.
Oltre alla sua posizione in MyHeritage, un'azienda che consente ai consumatori di scoprire la propria storia familiare attraverso i test genetici e la sua piattaforma genealogica, Erlich è un professore di informatica alla Columbia Engineering, un membro del Data Science Institute della Columbia, e membro principale aggiunto del New York Genome Center (NYGC).
Altri autori dello studio sono Assaf Gordon, del NYGC e del Whitehead Institute; TalShor, di MyHeritage e Technion; Omer Weissbrod del Weizmann Institute of Science di Israele; Dan Geiger di Technion; Mary Wahl dell'Istituto Whitehead, NYGC e Harvard; Michael Gershovits, Barak Markus e Mona Sheikh del Whitehead Institute; Melissa Gymrek dell'Università della California a San Diego; e Gaurav Bhatia, Daniel MacArthur e Alkes Price di Harvard e del Broad Institute.