Il genoma umano è il catalogo completo delle informazioni genetiche trasportate dagli esseri umani. The Human Genome Project ha iniziato il processo di identificazione sistematica e mappatura dell'intera struttura del DNA umano nel 1990. Il primo genoma umano completo è stato pubblicato nel 2003 e il lavoro continua. Il progetto ha identificato oltre 20.000 geni codificanti proteine disseminati tra le 23 coppie cromosomiche che si trovano negli esseri umani.
Tuttavia, questi geni rappresentano solo circa l'1,5% del genoma umano. Sono stati identificati diversi tipi di sequenze di DNA, ma rimangono molte domande.
Geni di codifica delle proteine
I geni codificanti per proteine sono sequenze di DNA che le cellule usano per sintetizzare le proteine. Il DNA consiste in una lunga spina dorsale di fosfato di zucchero, dalla quale pendono quattro molecole più piccole chiamate basi. Le quattro basi sono abbreviate come A, C, T e G.
La sequenza di queste quattro basi lungo le porzioni di proteine della spina dorsale del DNA corrisponde a sequenze di amminoacidi, i blocchi costitutivi delle proteine. I geni codificanti le proteine specificano proteine che determinano la struttura fisica degli esseri umani e controllano la chimica del nostro corpo.
Sequenze del DNA regolatorio
Le diverse cellule hanno bisogno di proteine diverse in momenti diversi. Ad esempio, le proteine necessarie a una cellula cerebrale potrebbero essere molto diverse da quelle necessarie a una cellula epatica. Una cellula deve quindi essere selettiva su quali proteine deve produrre.
Le sequenze del DNA regolatorie si combinano con le proteine e altri fattori per controllare quali geni sono attivi in un dato momento. Servono anche da marcatori che identificano l'inizio e la fine dei geni. Attraverso processi biochimici e meccanismi di feedback, le sequenze regolative del DNA controllano l'espressione genica.
Geni per RNA non codificante
Il DNA non produce direttamente proteine. L'RNA, una molecola correlata, funge da intermediario. I geni del DNA vengono dapprima trascritti nell'RNA messaggero, che quindi trasporta il codice genetico nei siti di produzione di proteine altrove nella cellula.
Il DNA può anche trascrivere molecole di RNA che non codificano le proteine, che la cellula usa per una varietà di funzioni. Ad esempio, il DNA è il modello per un importante tipo di RNA non codificante utilizzato per costruire le fabbriche di proteine trovate in tutta la cellula.
Introni
Quando un gene viene trascritto in RNA, porzioni di potrebbe essere necessario rimuovere l'RNA perché contengono informazioni non necessarie o confuse. Le sequenze di DNA che codificano per questo RNA non necessario sono chiamate introni. Se l'RNA creato dagli introni nei geni codificanti le proteine non venisse isolato, la proteina risultante sarebbe malformata o inutile.
Il processo di splicing dell'RNA è piuttosto notevole - la biochimica delle cellule deve conoscere l'esistenza dell'introne, localizza precisamente la sua sequenza su un filamento di RNA e poi lo asporta esattamente nei posti giusti.
Vast Wasteland
Gli scienziati non conoscono la funzione di una grande percentuale delle sequenze di basi su un DNA molecola. Alcuni potrebbero essere solo spazzatura, mentre altri potrebbero interpretare ruoli non ancora compresi.