BIONFORMATICA

Genomica: disciplina interessata al sequenziamento e allo studio dei genomi.

Una delle principali sfide alle quali la comunità scientifica è chiamata a rispondere consiste nell'integrare, organizzare

e nel dare significato a un volume di dati che giorno dopo giorno si espande esponenzialmente, l'enorme mole di dati di

sequenza che la genomica produce costantemente basta a far capire l'entità del problema e quindi il conseguimento di

un tale obiettivo ha reso e rende tuttora necessario lo sviluppo e l'utilizzo di metodologie e strumenti computazionali, in

grado di organizzare il dato grezzo per estrarre l'informazione contenuta in esso e permetterne la fruibilità; la

bioinformatica è preposta a svolgere tale compito è può essere definita come la disciplina che applica alla biologia i

principi della Scienza dell'informazione per rendere maggiormente comprensibile il complesso mondo delle Scienze

della vita. Quindi in sintesi quando parliamo di bioinformatica ci riferiamo da un lato a tutto ciò che ci permette di

conservare, organizzare e distribuire dati relativi agli esseri viventi che derivano per esempio dalla genomica e da

discipline affini e dall'altro allo sviluppo di metodologie e all'implementazione di algoritmi per l'indagine in campo

biomedico, cioè tali metodologie verranno utilizzate per l'estrapolazione dell'informazione biologica dai dati grezzi.

Una sequenza nucleotidica codificante per una proteina è delimitata da un codone d'inizio (codone codificante per una

metionina) e da un codone di stop; tale sequenza è spesso definita ORF (Open reading frame). Una ORF insieme alle

sequenze nucleotidiche necessarie alla sua regolazione trascrizionale (Promotore terminatori ecc) costituisce un gene.

Un gene è quindi un frammento di DNA presente in una porzione fisica del genoma detta Locus genico che può essere

trascritto in RNA messaggero e tradotto in una sequenza proteica. Sebbene i geni di cellule procariotiche ed

eucariotiche siano sostanzialmente simili esistono alcune differenze degne di nota prima tra tutte la frammentazione

delle ORF eucariotiche in porzioni codificanti dette esoni, intervallate da lunghe regioni nucleotidiche non codificanti,

gli introni.

i programmi utilizzati in bioinformatica sono molti e variano per funzione e tipo di esecuzione. nel solo ambito di

programmi di manipolazione di sequenze esempi di semplici operazioni di uso comune sono: editing di sequenze quindi

calcolo della sequenza complementare, traduzione, visualizzazione delle ORF, ricerca di siti di restrizione eccetera. Per

quanto riguarda la frequenza delle parole è importante precisare che i gruppi di nucleotidi vengono appunto definiti

Word cioè parole e la determinazione della frequenza relativa di Word di due tre o più nucleotidi permette a volte di

dare una grossolana valutazione sull'origine è funziona di una sequenza ad esempio nell'ambito di sequenze genomiche

umane quelle ricche In AT e TA, AA eccetera sono spesso non codificante, mentre quelli in cui prevalgono le parole

contenenti C e/o G sono spesso codificanti; sequenze ricche in CG potrebbero indicare la presenza di isole cpg. è

importante precisare che più programmi che complessivamente svolgono operazioni diverse ma finalizzate ad un

obiettivo comune sono riuniti in package, i programmi di uno stesso package rimangono separati ma tipicamente

utilizzano nei comandi una sintassi simile e permettono di scambiare dati con facilità. un esempio di package è

rappresentato da EMBOSS che è stato sviluppato per rispondere alle esigenze tipiche della comunità scientifica in

ambito di biologia molecolare; è costituito da un gran numero di programmi originali sviluppati nell'ambito del

progetto, ma Integra anche diversi programmi generati separatamente di uso comune. le aree di interesse sono piuttosto

ampie e nell'ambito del package i vari programmi sono organizzati in gruppi omogenei per funzione, ad esempio il

gruppo definito nucleic composition è costituito da programmi che analizzano la composizione in basi di una sequenza

e fanno predizioni su questa base, il gruppo nucleic translation permette la traduzione di sequenze nucleotidiche in

proteine con diverse modalità, invece il gruppo nucleic restriction contiene programmi utili alla ricerca di siti di

restrizione.

Dobbiamo capire che qualora si abbiano a disposizione due sequenze di geni o proteine il primo fondamentale passo per

studiare l'evoluzione delle due sequenze e stabilire se tra di esse sussiste una relazione di omologia cioè di discendenza

da un comune antenato. Infatti qualsiasi evento spaziale o temporale che porti alla separazione fisica di due sequenze

(speciazione, duplicazione genica) a partire da un comune antenato fa sì che le due sequenze smettano di scambiarsi il

reciproco contenuto di informazione e che inizino a evolvere differentemente l'una dall'altra accumulando mutazioni in

maniera indipendente. Alcune posizioni delle sequenze potranno conservare quindi il tratto caratteristico del comune

antenato, altre potranno mutare conferendo possibilmente caratteristiche diverse alle 2 sequenze. Poiché naturalmente

non è possibile seguire direttamente l'evoluzione di due o più sequenze l'unico metodo di cui si dispone per stabilire una

relazione di omologia è il confronto delle sequenze attraverso un allineamento, ovviamente non tutti gli allineamenti di

2 sequenze hanno lo stesso valore nel darci informazioni sulle relazioni evolutive, infatti si cerca l'allineamento che

identifica La corrispondenza biunivoca tra residui (nucleotidi o aa) che riflette nella maniera più accurata possibile

l'accumulo di mutazioni e quindi la storia evolutiva delle sequenze; in molti casi si cerca l'allineamento che permette il

Allineamento di Sequenze: Tecniche e Applicazioni in Bioinformatica, Dispense di Bioinformatica

Documenti correlati

Anteprima parziale del testo

Scarica Allineamento di Sequenze: Tecniche e Applicazioni in Bioinformatica e più Dispense in PDF di Bioinformatica solo su Docsity!

BIONFORMATICA

Algoritmi dinamici (Esaustivi)

Allineamento multiplo di sequenze

GENOMICA

eucariotici ) da accesso ad una collezione di genomi il cui sequenziamento ha raggiunto un livello adeguato di copertura.