GENOMAS A ESCALA MASIVA | Apuntes de Biología Molecular

ANOTACIÓN DE GENOMAS CON SECUENCIACIÓN DE ARN A ESCALA MASIVA

Resumen

Las tecnologías de próxima generación permiten la secuenciación de ADNc a gran escala

(denominada RNA-Seq). Principalmente debido a la diﬁcultad de alinear las lecturas cortas en

las uniones exón-exón, hasta ahora no se han hecho intentos para utilizar RNA-Seq para

construir modelos de genes de novo , es decir, en ausencia de un conjunto de genes conocidos

y / o empalmes eventos. Presentamos G-Mo.R-Se (Modelado de genes usando RNA-Seq), un

enfoque dirigido a construir modelos de genes directamente a partir de RNA-Seq y demostrar

su utilidad en el genoma de la vid.

Antecedentes

Las tecnologías de secuenciación de próxima generación generan muchas lecturas cortas de

fragmentos de ADN en una escala de tiempo reducida y han reducido el costo por nucleótido [

1 , 2 ]. Se han utilizado lecturas cortas genómicas para investigar la variación genética [ 3 ], los

reordenamientos genómicos [ 4 ], la metilación del ADN [ 5 ] y los sitios de unión del factor de

transcripción (Chip-Seq) [ 6 , 7 ]. Se tuvieron que desarrollar nuevos algoritmos para la

secuenciación del genoma, con el ﬁn de mapear eﬁcientemente números muy altos de lecturas

[ 8 - 11 ], así como para ensamblajes de genoma de novo , con el ﬁn de hacer frente a la corta

duración de las lecturas (generalmente menos de 35 nucleótidos) [ 12 - 16 ]. Los métodos de

secuenciación de próxima generación también se han aplicado a la secuencia de ADNc en lugar

de ADN genómico, para catalogar microARN [ 17 - 19 ] o analizar el paisaje transcripcional de

varios genomas eucariotas: esta tecnología se llama ARN-Seq [ 20 - 26 ]

Antes del desarrollo de la tecnología RNA-Seq, el análisis de ARN a gran escala podría realizarse

con dos tipos de enfoques. Los primeros enfoques basados en etiquetas [ 27 ], como el análisis

en serie de la expresión génica (SAGE) [ 28 ] y la secuenciación de ﬁrma masivamente paralela

(MPSS) [ 29 ], se basaron en la secuenciación de etiquetas clonadas previamente ubicadas en

ubicaciones especíﬁcas de transcripción. (generalmente extremos de 3 'o 5'). La abundancia

de la transcripción podría derivarse del recuento de etiquetas en loci ya conocidos, pero no se

pudieron descubrir nuevos genes o nuevas formas alternativas de empalme. El enfoque

alternativo, los microarrays basados en hibridación, tiene el potencial de monitorear el nivel de

expresión en todo el transcriptoma (no necesariamente sesgado hacia genes conocidos,

cuando se usan arreglos de mosaico de genoma completo [ 30 - 32 ]) a bajo costo, pero está

sesgado por los niveles de fondo de hibridación y el hecho de que las sondas diﬁeren en sus

propiedades de hibridación. Sin embargo, el método estándar de oro para el descubrimiento de

la transcripción sigue siendo la secuencia de etiqueta de secuencia expresada (EST) (por

tecnología Sanger) de ADNc clonados [ 33 - 35] Su principal limitación, además del costo

relativamente alto, es que este método es sensible a los sesgos de clonación. La tecnología

RNA-Seq combina las ventajas de los métodos de análisis de ARN a gran escala anteriores al

permitir el monitoreo del paisaje transcripcional de un genoma completo a bajo costo, sin los

prejuicios introducidos por las matrices, y tiene la ventaja adicional de proporcionar información

sobre estructuras de transcripción (límites exón-exón), como la secuenciación tipo EST Sanger

en un rango más largo, pero sin sesgos de clonación. Además, debido a que se puede obtener

fácilmente un gran número de lecturas, RNA-Seq es lo suﬁcientemente sensible como para

detectar la transcripción de genes con bajos niveles de expresión, que generalmente se pierden

en el análisis EST [ 21 , 23 , 25 ].

En estudios recientes, RNA-Seq se ha utilizado principalmente para cuantiﬁcar los niveles de

expresión de loci ya anotados, identiﬁcar genes expresados diferencialmente y medir la

expresión fuera de esos loci (en regiones intrónicas o intergénicas) [ 21 - 24 , 26 ]. Además, la

información estructural se ha utilizado para detectar formas alternativas de empalme ya

conocidas [ 22 , 23 ], identiﬁcar nuevos eventos transcripcionales en relación con loci conocidos

(empalme alternativo, extremos 5 ') [ 24 , 26 ] y reﬁnar estructuras genéticas anotadas o

proponer nuevos modelos de genes [ 21 , 23] Sin embargo, no se han hecho intentos para

GENOMAS A ESCALA MASIVA, Apuntes de Biología Molecular

Documentos relacionados

Vista previa parcial del texto

¡Descarga GENOMAS A ESCALA MASIVA y más Apuntes en PDF de Biología Molecular solo en Docsity!

ANOTACIÓN DE GENOMAS CON SECUENCIACIÓN DE ARN A ESCALA MASIVA