Domande d’esame scritto Bioinformatica

1) Cosa sono le tecnologie di sequenziamento Nanopore e in cosa si

differenziano da tecnologie short reads Illumina.

-> tecnologie short reads Illumina: Nel 2000 hanno iniziato a

prendere piede, tecnologie di Next-Generation-Sequencing (NGS). Esse si

caratterizzano da un elevato parallelismo, nel senso che possono effettuare

piu’ corse di sequenziamento in parallaleo; ciò determina un elevata copertura

della molecola di origine ed è per questo che vengono anche chiamate High –

Throughput Sequencing. Un altro aspetto positivo: sono poco costose e hanno

prodotto una esplosione di dati di sequenziamento, negli ultimi 20 anni. Tali

tecnologie vengono chiamate anche di seconda generazione per contrapporle

al metodo Sanger, di prima generazione. I reads NGS son caratterizzati

dall’essere relativamente corti (fino a 100-400 bp) e da una copertura elevata

(una base puo’ essere sequenziata anche da 300 reads). Le piattaforme

attualmente utilizzate per DNA sequncing sono tre di Illumina (Solexa) – HiSeq

System, Genome analyzer lix e MySeq - e tre di Ion Torrent. Il sequenziatore

MySeq, top performing di Illumina produce reads di 300 basi con una

accuratezza di 99.9 % e produce 25 milioni di reads per run di sequenziamento.

-> teconologie Nanopore: ultimamente si stanno sviluppando

tecnologie di terza generazione (Next-Next-Generation-Sequencing) per

produrre long reads che hanno lo scopo di ovviare i problemi dovuti all’uso di

short reads di seconda generazione, che sono per esempio più difficili da

assemblare in genomi completi e non sono robusti rispetto alle sequenze

ripetute che si manifestano all’interno del genoma. Le piattaforme attualmente

utilizzate sono una di Pacific Biosciences e due di Oxford Nanopore (GridION

System e MinION). Le tecnologie di terza generazione arrivano a produrre reads

fino a 10 000 basi e hanno una qualità elevata.

VIDEO "DNA e RNA in Bioinformatica"

2) Descrivere le idee principali per assemblare reads genomici con il metodo

overlay – layout – consensus. Fare un esempio di grafo di overlap di

assemblaggio.

Overlap: step in cui si trovano i potenziali reads in overlap. In particolare,

viene individuato il miglior match tra i suffissi di una read e i prefissi di una

read (calcola overlap migliore tra due read). A causa di errori di

sequenziamento, per trovare l’overlap migliore si utilizza un algoritmo di

programmazione dinamica (allineamento pairwise). I frammenti che non

condividono una sottostringa comune sufficientemente lunga vengono filtrati.

Domande esame scritto Bioinformatica, Prove d'esame di Bioinformatica

Documenti correlati