• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Biologia
    Setacciare l'oro dal diluvio di dati

    Le tecnologie di sequenziamento del DNA di nuova generazione hanno inondato database e dischi rigidi di tutto il mondo con set di dati di grandi dimensioni, ma i ricercatori stanno ottenendo il massimo da questo diluvio di dati? In un nuovo studio nel numero di ottobre di Applicazioni nelle scienze vegetali , Il Dr. Brent Berger e colleghi propongono un modo per setacciare l'oro rimanente da grandi serie di dati di sequenza. Gli autori mostrano che una nuova tecnica di data mining può essere utilizzata per raccogliere informazioni preziose da set di dati esistenti, e dimostrare il concetto recuperando la sequenza dai geni che influenzano le peculiari strutture floreali osservate nella famiglia delle piante Goodeniaceae.

    Il sequenziamento del DNA è diventato così economico che anche se un ricercatore è realmente interessato solo alla sequenza di pochi geni, spesso è più pratico sequenziare solo l'intero genoma. Le tecniche bioinformatiche possono individuare in seguito la sequenza genica desiderata, con meno problemi rispetto al targeting di geni specifici da sequenziare. Questa pratica, noto come "scrematura del genoma, " è diventato un modo sempre più popolare per rispondere alle domande sulle relazioni tra le specie vegetali.

    La premessa della scrematura del genoma è utilizzare il sequenziamento shotgun a bassa copertura per recuperare la sequenza del DNA da frazioni ad alta copia del genoma. Nel sequenziamento del fucile, il genoma viene suddiviso in piccoli pezzi per il sequenziamento, e poi ricuciti insieme computazionalmente usando le sovrapposizioni tra i pezzi, un processo chiamato assemblaggio. La quantità di "copertura" corrisponde a quanti di quei piccoli blocchi vengono sequenziati; maggiore è la copertura, più è facile ricucire il genoma, determinando una sequenza genomica più completa.

    Ma una copertura più alta è più costosa, e alcune domande possono essere risolte con un più economico, corsa di sequenziamento a bassa copertura. "Frazioni ad alta copia" del DNA genomico totale, come i genomi dei cloroplasti o il DNA ribosomiale nucleare, sono in maggiore abbondanza nel pool di sequenza, e quindi può essere completamente sequenziato anche a buon mercato, corse a bassa copertura. La sequenza di queste frazioni genomiche ad alta copia viene tipicamente utilizzata per risolvere le relazioni evolutive tra diverse specie e gruppi. Ma nel processo di scrematura del genoma, i ricercatori producono e poi scartano enormi quantità di dati di sequenza potenzialmente preziosi. "Molti set di dati di scrematura del genoma vengono utilizzati per assemblare il genoma del cloroplasto, che nel nostro caso utilizzato solo il 3% dei dati sequenziati, " ha osservato la dottoressa Dianella Howarth, coautore dello studio.

    In questo studio, gli autori hanno dato una seconda occhiata a un set di dati di scrematura del genoma precedentemente utilizzato per risolvere le relazioni evolutive nelle Goodeniaceae, una famiglia di piante comunemente chiamate "fiori a ventaglio" o "mezzi fiori" per la loro intrigante forma a fiore, che sembra che qualcuno abbia tagliato a metà il fiore. Gli autori volevano vedere se questo set di dati di scrematura del genoma potesse essere sondato per ulteriori informazioni sulla genetica dietro questa struttura floreale unica. Hanno utilizzato diversi pacchetti software per assemblare frammenti di sequenza precedentemente inutilizzati dalla frazione a bassa copia del set di dati di scrematura del genoma originale. Hanno quindi cercato nell'assieme risultante la sequenza di un insieme di geni chiamato CICLOIDEA geni, che sono coinvolti nella struttura floreale e simmetria.

    Gli autori sono stati in grado di recuperare porzioni sufficienti dei geni, di più specie, per creare allineamenti completi di tutti e quattro CICLOIDEA geni nel nucleo delle Goodeniaceae. Questi dati potrebbero rivelarsi utili per futuri studi sull'evoluzione della bizzarra struttura floreale osservata in questo gruppo. "Confronto di sequenze da CICLOIDEA geni simili in questo clade potrebbero fornire indizi sui precisi cambiamenti di sequenza che provocano cambiamenti nella morfologia floreale, " ha spiegato il dottor Howarth.

    Più generalmente, Il dottor Howarth continuò, "Parti di qualsiasi gene di interesse potrebbero potenzialmente essere estratti da set di dati di scrematura del genoma che sono già stati completati". Un pezzo di un gene potrebbe non sembrare molto, ma ci sono un numero sorprendente di usi per questi frammenti. "Questi dati potrebbero fornire informazioni sufficienti per determinare regioni nucleari utili per analisi filogenetiche o individuare possibili eventi di duplicazione genica. Inoltre, le sonde per il sequenziamento dell'arricchimento target potrebbero essere generate rapidamente attraverso un clade per esaminare i geni candidati e le loro regioni regolatorie negli studi evo-devo".

    Approcci di data mining come questi consentono un uso molto più completo dei set di dati di scrematura del genoma. Ciò consente di rispondere a domande importanti con i dati esistenti, e apre la porta agli scienziati senza accesso alle risorse per produrre set di dati su larga scala, ad esempio, scienziati in college o paesi più piccoli senza grandi enti che erogano sovvenzioni. Mentre i dati sulla sequenza del DNA continuano ad affluire, studi come questo indicano modi per assicurarci di non lasciare che informazioni preziose fluttuino.


    © Scienza https://it.scienceaq.com