Credito:CC0 Dominio pubblico
L'era dei big data è qui:il mondo ha creato più dati negli ultimi due anni che nell'intera storia precedente della razza umana. I ricercatori della USC Leonard Davis School of Gerontology stanno dissezionando tesori di informazioni, da fonti diverse come le scansioni cerebrali e il genoma umano, per alimentare ricerche innovative sul miglioramento del modo in cui invecchiamo, e rimodellare l'educazione alla gerontologia per consentire ai futuri scienziati di avere un impatto in un campo in evoluzione.
La gerontologia è pronta ad affrontare gli strumenti più recenti, in parte perché il campo ha sempre coinvolto grandi set di dati, dice Mireille Jacobson, un microeconomista e professore associato di gerontologia presso la USC Leonard Davis School. Per esempio, il suo lavoro si è basato su ampi set di dati sulla popolazione e, in un certo senso, che non è cambiato, lei dice. "È soprattutto che sono disponibili sempre più dati".
Jacobson lavora con i dati di Medicare e di altri database pubblicamente disponibili per capire come l'assicurazione sanitaria influisce sul benessere delle persone anziane. Per esempio, un'analisi dei dati di Medicare ha rilevato che ricevere i benefici di Medicare può aiutare a ridurre lo stress finanziario nelle persone di età superiore ai 65 anni. Inoltre, ricerca gli operatori sanitari e il modo in cui prendono decisioni di assistenza in risposta a vari fattori esterni, comprese nuove raccomandazioni per lo screening e la carenza di farmaci.
"Lo sforzo di digitalizzare e rendere tutto disponibile elettronicamente è una cosa nuova, "aggiunge.
Jacobson fa parte di un gruppo di ricercatori di gerontologia presso la USC Leonard Davis School che si stanno immergendo in vasti set di dati per comprendere meglio l'invecchiamento e la durata della vita. Il loro lavoro ha importanti implicazioni per la formazione degli studenti e per la creazione di set di dati migliori, che possono aiutare i ricercatori a comprendere meglio i fattori di rischio individuali, identificare il ruolo dei geni nella malattia e sviluppare interventi più precisi.
Muoversi attraverso le discipline
Em Arpawong, professore assistente di ricerca di gerontologia e direttore del Gerontology Bioinformatics Core, cerca di riunire diverse informazioni per comprendere meglio come interagiscono i componenti genetici e ambientali per provocare diversi esiti di salute negli anziani. Il suo lavoro attuale integra l'uso di approcci di modellizzazione dell'intero genoma e dei gemelli e della famiglia da grandi set di dati che rappresentano centinaia di migliaia di individui per molti decenni, come lo studio sulla salute e la pensione degli Stati Uniti e lo studio sull'invecchiamento dei talenti del progetto, entrambi i quali abbracciano decenni di follow-up con decine di migliaia di partecipanti.
Arpawong afferma che lo studio dell'invecchiamento è unico nel campo della ricerca sanitaria perché ci sono così tante cose che accadono all'inizio della vita che influiscono sulla traiettoria di una persona in seguito.
"Prendo un approccio evolutivo per tutta la vita per studiare gli effetti delle condizioni di vita precedenti sulla salute in età avanzata, compresa la genetica, comportamenti e fattori contestuali come lo stato socioeconomico e le avversità familiari, " lei dice, "e questo richiede di mettere insieme molti pezzi di dati".
Lavorare su progetti come creare un indice di fragilità, sviluppare una scansione dell'intero genoma per la sintomatologia depressiva negli anziani, calcolare come i fattori genetici e ambientali contribuiscono ai cambiamenti cognitivi legati all'invecchiamento e valutare la stabilità dei marcatori MRI per la demenza richiede molte abilità in diverse aree e collaborazione. C'è un ulteriore livello di complessità quando i ricercatori devono tradurre i risultati degli studi sugli animali sui marcatori genetici per gli esseri umani.
"Il fulcro del mio lavoro con il Bioinformatics Core è la traduzione, o collaborare con persone alla traduzione, delle loro scoperte da sistemi modello come i topi in dati sulla popolazione umana, "dice Arpawong.
È un processo un po' circolare:spesso, i ricercatori utilizzano i dati degli esseri umani per esaminare l'impatto dei risultati dei sistemi di modelli animali. Una volta che trovano alcune cose nei dati umani, tornano indietro ed eseguono quegli esperimenti nei modelli animali per vedere se ci sono alcuni meccanismi causali. Questa esplorazione basata sui dati apre molti nuovi modi per comprendere l'invecchiamento, perché non è possibile fare questo tipo di studi gerontologici traslazionali e integrativi solo negli esseri umani, data la nostra lunga durata e gli ambienti di vita molto diversi.
"[Questa traduzione] è diventata una parte più importante del lavoro qui in Gerontologia che è stata affascinante e sta aiutando ad accelerare il ritmo dei risultati della ricerca in discipline che tradizionalmente hanno funzionato in modo più indipendente, " dice Arpawong.
Il lavoro è diventato naturalmente collaborativo, coinvolgendo molti investigatori diversi con background diversi.
"C'è un sacco di crossover in diversi dipartimenti e molteplici vantaggi di lavorare con gente del Dornsife College, Keck School of Medicine e l'Istituto di scienze dell'informazione, dalla psicologia alla biologia computazionale, " spiega Arpawong. "È davvero una rete intricata in tutta la USC. Indica solo l'intera natura transdisciplinare di questo lavoro. Devi parlare e lavorare con molte persone per assicurarti di muoverti nella giusta direzione".
Arpawong ha recentemente utilizzato diversi set di dati per trovare la connessione tra genetica e memoria verbale. Ha scoperto che un marcatore genetico della malattia di Alzheimer non era solo:esiste un secondo gene che svolge un ruolo specifico negli effetti sulla capacità di memoria correlata all'invecchiamento.
I big data hanno anche cambiato il modo in cui le persone collaborano, dice Eileen Crimmins, Professore dell'Università USC e professore AARP di Gerontologia. Nessun singolo ricercatore può conoscere tutte le parti di un progetto, lei spiega.
"Ci sono molti più grandi gruppi multidisciplinari in cui tutti hanno una specializzazione e nessuno sa tutto, " dice. "Quindi c'è molto di più da fidarsi delle persone che lo sanno e possono farlo bene".
Tutti questi dati richiedono soluzioni più recenti per alloggiarli e trasferirli, soprattutto quando si lavora con diversi ricercatori in tutto il mondo.
"La scala è molto più grande in ciò che dobbiamo affrontare e [in] la frequenza e la necessità di trasferire queste cose, mantenere la sicurezza dei dati, e poi avere a disposizione gli strumenti per farlo, " dice Arpawong. "Gran parte dell'analisi dei dati che dobbiamo fare richiede la codifica in diversi linguaggi di programmazione per i quali alcuni dei più comuni software statistici non hanno la capacità, e ospitare i dati in modi che vanno oltre il proprio disco rigido."
L'istruzione deve anche corrispondere ai più recenti sviluppi nella scienza dei big data, richiedendo agli studenti di essere abili nella programmazione, guidato dai dati e in grado di porre nuove domande sulla scienza dell'invecchiamento. I big data hanno cambiato il gioco degli studenti laureati, dice Crimmins, che dirige il Programma di ricerca multidisciplinare in gerontologia presso la USC Leonard Davis School. Il programma aiuta gli studenti pre-dottorato e post-dottorato a familiarizzare con lo studio dell'invecchiamento in più discipline.
"C'è molta più attività multidisciplinare perché le domande si sono davvero spostate, "Spiega Crimmins.
Gli studenti di oggi acquisiscono costantemente nuove competenze e conoscenze, dalla patologia dell'inquinamento atmosferico alla genetica, oltre ai loro studi fondamentali in gerontologia. Molto di ciò che le persone stanno facendo è imparare sul lavoro per acquisire le abilità che non vengono insegnate in classe, Arpawong aggiunge.
Per gli studenti che entrano in campo, comprendere le statistiche e avere una forte padronanza della matematica è fondamentale. Nella sua classe, Jacobson presenta alcuni "dati strani", ad esempio perché la media di un set di dati potrebbe essere molto più alta della mediana.
"Se pensi al reddito medio negli Stati Uniti rispetto a quello medio, questo potrebbe dirci qualcosa sugli americani in generale, "dice. "In un certo senso, i big data disponibili dovrebbero costringerci a tornare alle origini e vedere le fondamenta".
La competenza di codifica è anche al centro degli strumenti che i nuovi ricercatori utilizzano nel campo e talvolta ciò richiede la codifica in più lingue.
Adeguamento per il futuro
La disponibilità e i tipi di dati aumenteranno solo in futuro, e i ricercatori stanno pensando a come adattare i loro studi per fare spazio a nuove informazioni. Crimmins è un co-investigatore per lo studio sulla salute e la pensione, che va avanti da circa 30 anni. Lo studio viene condotto ogni due anni, metà di persona e metà al telefono. Dal 2006, i ricercatori hanno raccolto biomarcatori dalle persone che visitano di persona:metriche come peso e altezza, pressione sanguigna e un campione di sangue.
Queste metriche consentiranno ai ricercatori di creare associazioni più grandi nei dati esistenti e sminuiranno anche gli altri dati nell'analisi. "Due milioni di segnalini per ogni persona, e abbiamo 20, 000 persone nello studio, " Dice Crimmins. "Richiede davvero un'elevata capacità di elaborazione".
Utilizzando i dati dello studio sulla salute e la pensione, Crimmins ha fatto diverse scoperte sorprendenti. Uno è che le persone hanno effettivamente più anni di buona salute del cervello dopo i 65 anni rispetto al passato. Un altro studio sui dati ha scoperto che l'istruzione dà alle persone un vantaggio nei loro ultimi anni, aiutandoli a tenere a bada la demenza e i loro ricordi intatti. La raccolta di biomarcatori dai partecipanti allo studio ha anche permesso all'allieva della USC Leonard Davis Morgan Levine '08, dottorato di ricerca '15 e Crimmins per sviluppare un metodo promettente per misurare biologico, al contrario di cronologico, età. Il loro lavoro ha portato a risultati che mostrano che gli americani potrebbero invecchiare più lentamente di quanto non fossero due decenni fa.
USC è emersa come un'università che produce dati. Si lavora molto per incoraggiare l'uso dei dati rendendoli disponibili e in un formato utilizzabile, Crimmins dice. Costituisce gran parte di ciò che fa:fare servizio per un campo più ampio.
"È un po' previsto nel nostro campo per quelli di noi che sono produttori di dati, che è una cosa importante qui alla USC perché produciamo molti set di dati internazionali, " lei dice.
I big data stanno abbattendo i confini tradizionali tra i campi, dice Arpawong. I risultati migliori proverranno probabilmente da un miscuglio di diversi tipi di dati, ad esempio fatturazione medica e imaging, o genomica e dati ambientali.
"Devi suddividerlo in pezzi. Hai bisogno di persone che sappiano come manipolare i dati per ottenere ciò che vuoi, ed è molto sfumato per ogni pezzo, " dice. "Puoi ottenere risultati in qualsiasi modo tu possa codificare qualcosa, ma è corretto? E un grosso problema per la bioinformatica è assicurarsi che le persone siano formate su questo tipo di risorse di dati per assicurarsi che stiano facendo ciò che intendono fare".
Il preside della USC Leonard Davis School Pinchas Cohen concorda sul fatto che nel moderno ambiente di ricerca di oggi, sfruttare i dati da una varietà di fonti è importante quanto comprendere le funzioni cellulari. Nel suo laboratorio, sta conducendo studi basati su big data per identificare geni mitocondriali precedentemente sconosciuti, lavorando per capire le loro funzioni e se possono essere bersagli per i trattamenti per l'Alzheimer, diabete e altre malattie.
"Invece di una mentalità adatta a tutti, l'era dei big data ci consente di avere un approccio del 21° secolo per affrontare il rischio di malattia e promuovere un invecchiamento sano con una profonda comprensione dei fattori di rischio di un individuo, " Dice Cohen. "La scienza non è più guardare un microscopio nel proprio laboratorio; si tratta di guardare verso l'esterno i dati di milioni di persone in tutto il mondo".