BIOINFORMATICA

La bioinformatica è un ramo della biologia computazionale, essa si occupa dello sviluppo di strumenti di

analisi dedicati al campo biologico

La biologia computazionale è l'applicazione di questi strumenti

Algoritmi per l'allineamento di sequenze (di acidi nucleici e proteine)

La struttura primaria di ac nucleici e proteine è costituita da sequenze lineari rispettivamente di nucleotidi

e di aminoacidi

Quindi le sequenze di acidi nucleici e proteine possono essere rappresentate come stringhe di caratteri

analizzabili con metodi bioinformatici

[Una stringa di caratteri è soltanto una rappresentazione semplificata del corrispondente ac nucleico o

proteina]

Una procedura bioinformatica basilare è l'allineamento di sequenze

Allineare due sequenze significa compare due sequenze residuo per residuo in modo da mettere in

evidenza le regioni di similarità

L'allineamento di sequenze è una procedura che serve a comparare due o più sequenze con lo scopo di

stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che

massimizzino la similarità tra le sequenze stesse

Quindi un allineamento dovrebbe portare all'appaiamento delle regioni simili condivise tra due sequenze

Potremmo volere allineare due o più sequenze per:

- Comparare geni con la stessa funzione in due

organismi diversi (ortologhi)

- Ricercare di sequenze di DNA o proteine

in banche dati

- Identificare di domini funzionali

- Caratterizzare di proteine con funzione sconosciuta

- Costruire di alberi filogenetici

- Identificare frammenti contigui parzialmente

sovrapposti nella procedura di assemblaggio di

sequenze

Esistono vari tipi di algoritmi di allineamento che risultano utili in situazioni differenti

Allineamento di due sequenze:

Due sequenze possono essere comparate attraverso una matrice bidimensionale (tabella ordinata di

elementi) in cui una sequenza è scritta sul margine superiore, da dx verso sx, e l'altra sul margine sx,

dall'alto verso il basso per cui ogni casella fà riferimento a due residui uno di una seq ed uno dell'altra seq.

All'interno di ogni casella della matrice possiamo inserire dei punteggi che nel caso più semplice saranno

punteggi di identità (+1 per match e 0 per mismatch e gap) oppure possiamo inserire punteggi che

rispettano altri criteri, ad es che tengano conto anche delle similarità tra i residui (quindi possiamo

attribuire un punteggio ad ogni coppia di residui)

Il valore di un allineamento sarà dato dalla somma di tutti i punteggi attribuiti alle coppie di residui che

compongono l'allineamento

caratteristiche chimico-fisiche degli aa

Per trovare l'allineamento migliore (cioè la migliore corrispondenza tra due seq) è necessario stabilire dei

criteri per misurare la similarità ed avere un metodo che, in base a questi criteri, sia in grado di attribuire

un punteggio che sia rappresentativo della qualità di un dato allineamento

L'allineamento migliore sarà quello che, in base ai criteri di similarità, avrà totalizzato il punteggio più

alto. Il concetto di miglior allineamento è relativo al criterio utilizzato per valutarne la similarità

Bioinformatica: Allineamento di Sequenze, Dispense di Biologia

Documenti correlati

Anteprima parziale del testo

Scarica Bioinformatica: Allineamento di Sequenze e più Dispense in PDF di Biologia solo su Docsity!

BIOINFORMATICA

Algoritmi per l'allineamento di sequenze (di acidi nucleici e proteine)

Allineamento di due sequenze:

PAM 0 30 80 110 200 250

% IDENTITA'100% 75% 60% 50% 25% 20%