La genomica è una branca della genetica che studia i cambiamenti su larga scala nei genomi degli organismi. La genomica e il suo sottocampo della trascrittomica, che studia i cambiamenti dell'intero genoma nell'RNA che viene trascritto dal DNA, studia molti geni una volta. La genomica può anche comportare la lettura e l'allineamento di sequenze molto lunghe di DNA o RNA. L'analisi e l'interpretazione di tali dati complessi su larga scala richiede l'aiuto dei computer. La mente umana, per quanto sia superba, non è in grado di gestire queste molte informazioni. La bioinformatica è un campo ibrido che riunisce la conoscenza della biologia e la conoscenza della scienza dell'informazione, che è un sottocampo dell'informatica.
I genomi contengono molte informazioni
Genomi di organismi sono molto grandi Si stima che il genoma umano abbia tre miliardi di coppie di basi contenenti circa 25.000 geni. Per confronto, si stima che la mosca della frutta contenga 165 miliardi di coppie di basi contenenti 13.000 geni. Inoltre, un sottocampo di genomica chiamato transcriptomics studia quali geni, tra le decine di migliaia di un organismo, vengono attivati o disattivati in un dato momento, attraverso più punti temporali e più condizioni sperimentali in ciascun punto temporale. In altre parole, i dati "omici" contengono una grande quantità di informazioni che la mente umana non può cogliere senza l'aiuto di metodi computazionali in bioinformatica.
Dati biologici
La bioinformatica è importante per la ricerca genetica perché genetica i dati hanno un contesto. Il contesto è biologia. Le forme di vita hanno determinate regole di comportamento. Lo stesso vale per tessuti e cellule, geni e proteine. Interagiscono in determinati modi e si regolano a vicenda in determinati modi. I dati su larga scala e complessi generati nella genomica non avrebbero senso senza la conoscenza contestuale di come funzionano le forme di vita. I dati generati dalla genomica potrebbero essere analizzati con gli stessi metodi usati da ingegneri e fisici che studiano mercati finanziari e fibre ottiche, ma analizzando i dati in un modo che ha senso richiede la conoscenza della biologia. Così, la bioinformatica è diventata un campo ibrido di conoscenza inestimabile.
Scricchiolio di migliaia di numeri
Il crunch del numero è un modo per dire che si stanno facendo calcoli. La bioinformatica è in grado di scricchiolare decine di migliaia di numeri in pochi minuti, a seconda della velocità con cui il computer può elaborare le informazioni. La ricerca di Omics utilizza i computer per eseguire algoritmi - calcoli matematici - su larga scala al fine di trovare pattern in set di dati di grandi dimensioni. Gli algoritmi comuni includono funzioni come il clustering gerarchico (Vedi riferimento 3) e l'analisi delle componenti principali. Entrambe sono tecniche per trovare relazioni tra i campioni che contengono molti fattori. Questo è simile a determinare se alcune etnie sono più comuni tra due sezioni in una rubrica: cognomi che iniziano con un A contro cognomi che iniziano con B.
Biologia dei sistemi
Bioinformatica ha reso possibile studiare come un sistema che ha migliaia di parti in movimento si comporta a livello di tutte le parti che si muovono contemporaneamente. È come guardare uno stormo di uccelli volare all'unisono o una scuola di pesce nuotare all'unisono. In precedenza, i genetisti hanno studiato solo un gene alla volta. Sebbene quell'approccio abbia ancora una quantità incredibile di merito e continuerà a farlo, la bioinformatica ha permesso di fare nuove scoperte. La biologia dei sistemi è un approccio allo studio di un sistema biologico mediante la quantificazione di più parti mobili, come lo studio della velocità collettiva di diverse sacche di uccelli che volano come un grande stormo che devia.