Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


DATOS PARA ESTUDIAR, Tesis de Sociología Rural

MUY ULTHSXUSAXUGAUOXGaougxou sjdnsjdjAHSS

Tipo: Tesis

2019/2020

Subido el 17/09/2020

dahiana-ramirez-2
dahiana-ramirez-2 🇨🇴

10 documentos

1 / 12

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Taller 1. Ejercicios básicos en Bioinformática
El siguiente taller es un ejercicio en línea propuesto por la Universidad Autónoma de
Barcelona sobre aplicaciones bioinformáticas a la genética, La Bioinformática es la
aplicación de la informática a la resolución de cuestiones biológicas.”.
La investigación genética genera una gran cantidad de información:
Secuencias
DNA
mRNA
proteínas
Características de estas secuencias
Contenido de genes
Función de los genes
Estructura y dominios de las proteínas
Relación de los genes con enfermedades...
¿Donde se encuentra toda esta información?
NCBI (National Center for Biotechnology Information)
EMBL-EBI (European Molecular Biology Laboratory-European Bioinformatics Institute)
¿Como está ordenada toda esta información?
Bases de datos
Nucleótidos - GenBank
Proteínas - Uniprot
Artículos científicos - PubMed
Enfermedades - OMIM
Genes - Entrez Gene
Organismos específicos - FlyBase
Dominios y estructuras proteicas...
¿Como podemos utilizar esta información per investigar y generar nueva información?
Programas de análisis de secuencias
Búsqueda por similitud de secuencia
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga DATOS PARA ESTUDIAR y más Tesis en PDF de Sociología Rural solo en Docsity!

Taller 1. Ejercicios básicos en Bioinformática El siguiente taller es un ejercicio en línea propuesto por la Universidad Autónoma de Barcelona sobre “ aplicaciones bioinformáticas a la genética, La Bioinformática es la aplicación de la informática a la resolución de cuestiones biológicas. ”. La investigación genética genera una gran cantidad de información: Secuencias  DNA  mRNA  proteínas Características de estas secuencias  Contenido de genes  Función de los genes  Estructura y dominios de las proteínas  Relación de los genes con enfermedades... ¿Donde se encuentra toda esta información? NCBI (National Center for Biotechnology Information) EMBL-EBI (European Molecular Biology Laboratory-European Bioinformatics Institute) ¿Como está ordenada toda esta información? Bases de datos  Nucleótidos - GenBank  Proteínas - Uniprot  Artículos científicos - PubMed  Enfermedades - OMIM  Genes - Entrez Gene  Organismos específicos - FlyBase  Dominios y estructuras proteicas... ¿Como podemos utilizar esta información per investigar y generar nueva información? Programas de análisis de secuencias Búsqueda por similitud de secuencia

 nucleótidos - BLASTn  proteínas - BLASTp Alineamientos múltiples de secuencias - Clustal Omega


Ejercicio 1. Buscar información de una secuencia desconocida Estás trabajando en un laboratorio y has clonado y secuenciado un fragmento de DNA de 420 pb. Primero, quieres averiguar si este fragmento ya ha sido secuenciado anteriormente, ya que en este caso puede que la secuencia ya haya sido caracterizada por otros investigadores y puedas encontrar información sobre ella en las bases de datos correspondientes. Para hacer esto, es necesario utilizar un programa llamado BLASTn que permite buscar secuencias similares a una que nosotros tenemos. Copia tu secuencia y pégala en el formulario del BLASTn. cttcctgtccaatcgctgcctcaagctggcttaagtcctgctgagattcagcagttatggaaagaagtgactggagttcacagtatg gaagacaatggcattaaacatggagggctagacctcactactaacaattcctcctcgactacctcctccaacacttccaaagcat caccaccaataactcatcattccatagtgaatggacagtcttcagttctaagtgcaagacgagacagctcgtcacatgaggagac tggggcctctcacactctctatggccatggagtttgcaaatggccaggctgtgaaagcatttgtgaagattttggacagtttttaaa gcaccttaacaatgaacacgcattggatgaccgaagcactgctcagtgtcgagtgcaaatgcaggtggtgcaaca Las preguntas que quieres contestar son: a) ¿A qué especie pertenece la secuencia? b) ¿Esta secuencia corresponde a un gen o a una región no codificante del genoma? ¿Si es un gen, de cuál se trata? Justificar la respuesta. c) ¿Hay secuencias homólogas en otras especies cercanas? ¿En qué especies? Menciona por lo menos cinco especies. Para responder las preguntas anteriores es necesario tener claro:  ¿Que son secuencias homologas?  ¿Qué son especies cercanas?  ¿Qué es una región no codificante? Ahora que ya sabes de qué gen se trata, quieres ver lo que se sabe sobre este gen y su función. Para buscar información sobre un gen, irás a una base de datos de genes que se llama Entrez Gene. Aquí puedes introducir el nombre del gen que te interesa y obtendrás una página con una gran cantidad de información sobre este gen y enlaces a distintas bases de datos donde se dan más detalles sobre determinados aspectos. Contesta las siguientes preguntas:

gagctagtgcagcgatggctggagaggacgcccggactggaggagagtggcttcaacttctgggccaagtttcaggagagcgtc gatcgattcctggaggcgcaggtacagagcgccatggaggagcccgtggagaaggcgaaaaactaccgcctcatggacattga gaagcgacgcgaggtgtatcgctccatctttgatccggcagtgcacgatgcactggtgcgacgtggggatcgccggtttagccat cgtgccctccagggagccatcatgatcaccttctatagggatgaacccagattcagccagccacaccagttgctcaccctgctcat ggacatcgactcgttaataaccaagtggagatgtaagtattgcattctttgatactcttttataaatatatcttatgtttaagactgg ttttcctaaccaaatactttctattcccgccgcagacaatcacgtgatcatggtgcaacgcatgattggatcccaacagttgggcac tggtggctcgtctggatatcaatatctgcgctccactctcaggtgatcatcgcagatgtgattatatcggggatcaatgaactccaa ctgttctccctttgttttttttttggtttcagtgatcggtacaaggtgtttctggatctgttcaatctgtccacttttctgattccccgcgag gcgattccaccgctggacgagaccattcgcaagaaactgatcaacaaaagtgtctgacaatcggcagggtatccaattggtcaat gtttggctatgcgttgtttgttctgcctactgttttgtcgttttggtgtaataaaattacttgtttagtctttgttatcacatttgatgtgttc cttttctttatgtctgacatataatacatataacataacaaaataaatattcatatttcagacataaacaaattctatgggaatgtgt gagtcagcagcctgaaagtagaccatatatattctggttgtctttctcgctcgtttctattagttcgttagcaaattaaattccataat attgtgtggcaatacttgt

seq ccgctcgaggagtcacgatctgatctgagctgtgcaccatgagctgtccctatgcaggaaacggaaacgatcacgatgattcggc ggtgccattaaccacggaagtgggcaaaatctatggagagtatctgatgctggacaaactgctggatgcccagtgtatgctctcc gaggaggacaagcgacccgtgcacgatgagcatctgttcatcatcacgcaccaggcctacgagctttggttcaagcagatcatc tttgagttcgactccatacgagacatgttggatgcagaggtcatcgatgaaaccaagacgctggagattgtcaagcgactgaacc gagtggttctgattctaaaactcctggtggaccaagtgcccattctggagaccatgaccccgcttgacttcatggacttccgcaagt acctggcacccgcatctggtttccagtcgctgcagttccgtttgatcgagaacaagctgggagttctgacagagcagcgggtgag atacaaccagaagtactcggatgtctttagcgacgaggaggcgcggaattcgattcgcaactcggagaaagatccctcgctactg gagctagtgcagcgatggctggagaggacgcccggactggaggagagtggcttcaacttctgggccaagtttcaggagagcgtc gatcgattcctggaggcgcaggtacagagcgccatggaggagcccgtggagaaggcgaaaaactaccgcctcatggacattga gaagcgacgcgaggtgtatcgctccatctttgatccggcagtgcacgatgcactggtgcgacgtggggatcgccggtttagccat cgtgccctccagggagccatcatgatcaccttctatagggatgaacccagattcagccagccacaccagttgctcaccctgctcat ggacatcgactcgttaataaccaagtggagatacaatcacgtgatcatggtgcaacgcatgattggatcccaacagttgggcact ggtggctcgtctggatatcaatatctgcgctccactctcagtgatcggtacaaggtgtttctggatctgttcaatctgtccacttttct gattccccgcgaggcgattccaccgctggacgagaccattcgcaagaaactgatcaacaaaagtgtctgacaatcggcagggta tccaattggtcaatgtttggctatgcgttgtttgttctgcctactgttttgtcgttttggtgtaataaaattacttgtttagtctttgttatc acatttgat Cuando ya tengas tu alineamiento, contesta las siguientes preguntas: a) ¿Hay alguna diferencia entre las secuencias? ¿Qué tipo de diferencia es? b) ¿Para las regiones diferentes, cuáles son las diferencias? c) ¿A qué corresponden los agujeros? d) ¿Qué dirías que es cada una de las dos secuencias? Algunos organismos como Drosophila melanogaster tienen una base de datos propia, que en este caso se llama FlyBase. Ves al FlyBasey busca el gen vermilion en esta base de datos para ver toda la información que hay disponible sobre este gen.

Contesta estas preguntas: e) ¿En qué cromosoma se encuentra este gen? f) ¿Cuantos exones tiene? ¿Cuantos intrones tiene? g) ¿Cual es la función molecular de la proteína que codifica este gen? h) ¿En qué proceso biológico está implicada esta proteína? Ejercicio 3. El albinismo de copito de nieve Copito de Nieve fue capturado en el año 1966 en Guinea Ecuatorial cuando tan sólo era un pequeño gorila de aproximadamente unos 2 años de edad. Su pelo era blanco; su piel, rosada y sin pecas, y tenía los ojos azules. Cuando llegó al Zoo de Barcelona se le realizó un examen dermatológico y biopsias de su piel, a partir de las que se determinó que presentaba las características propias del albinismo oculocutáneo de tipo IA (OCA1A). Ve a la base de datos de las enfermedades genéticas (OMIM) y busca esta enfermedad con el tipo especifico. (albinism en inglés). a) ¿Cual es el gen responsable de esta enfermedad? b) ¿En qué cromosoma se encuentra? c) ¿Es de herencia autosómica o ligada al sexo? Un grupo de investigación de Barcelona secuenció hace unos años la región codificante del gen que causa el albinismo de Copito de Nieve la secuencia se muestra a continuación. Haz el alineamiento del alelo normal de gorila, que pertenece a un gorila llamado Ndengue (>Gorilla_gorilla_gen), con la secuencia nucleotídica de Copito de Nieve (>Copito_gen), que no presenta actividad para esta enzima. Utiliza el programa Clustal Omega como se utilizo anteriormente para realizar el alineamiento. Recuerda que tienes que poner en el programa las dos secuencias a la vez y en formato FASTA. Ten en cuenta que algunas de estas secuencias nucleotídicas incluyen símbolos diferentes de los 4 nucleótidos A, T, G, C. En la tabla 1 encontrarás los símbolos utilizados con más frecuencia en las secuencias nucleotídicas.

Gorilla_gorilla_gen atgctcctggctgttttgtactgcctgctgtggagtttccagacctccgctggccatttccctagagcctgtgtctcctctaagaacct gatggagaaggaatgctgtccaccgtggagcggggacaggagtccctgtggccagctttcaggcagaggttcctgtcagaatat ccttctgtccaatgcaccacttgggcctcaatttcccttcacaggggtggatgaccgggagtcgtggccttccgtcttttataatagg acctgccagtgctctggcaacttcatgggattcaactgtggaaactgcaagtttggcttttggggaccaaactgcacagagagacg actcttggtgagaagaaacatcttcgatttgagtgccccagagaaggacaaattttttgcctacctcactttagcaaagcataccat

T Timina Pirimidina N Cualquier nucleótido ---------------- R A ó G Purinas Y C ó T Pirimidinas S C ó G Enlace fuerte

- Ninguno (agujero o gap) ---------------- d) ¿Cuantos cambios de nucleótido hay entre los dos gorilas? Finalmente, sin cerrar el alineamiento de las secuencias nucleotídicas, abre otra ventana también con el Clustal Omega y realiza el alineamiento de las secuencias proteicas obtenidas al traducir las secuencias de DNA anteriores. Puedes utilizar también el programa Clustal Omega, ya que también permite alinear proteínas. Simplemente copia y pega las siguientes secuencias proteicas en el Clustal Omega. Es necesario seleccionar en el análisis proteínas.

Gorilla_gorilla_prot MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSPCGQLSGRGSCQNILLSNAPLGP QFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNCTERRLLVRRNIFDLSAPEKDK FFAYLTLAKHTISSDYVIPIGTYGQMKNGSTPMFNDINIYDLFVWMHYYVSMDALLGGSEIWRDIDFA HEAPAFLPWHRLFLLRWEQEIQKLTGDENFTIPYWDWRDAEKCDICTDEYMGGQHPTNPNLLSPASF FSSWQIVCSRLEEYNSHQSLCNGTPEGPLQRNPGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAA NFSFRNTLEGFASPLTGIADASQSSMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRR HRPLQEVYPEANAPIGHNRESYMVPFIPLYRNXDFFISSKDLGYDYSYLQDSDPDSFQDYIKSYLEQASRI WSWLLGAAMVGAVLTALLAGLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQSHL Copito_prot MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSPCGQLSGRGSCQNILLSNAPLGP QFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNCTERRLLVRRNIFDLSAPEKDK FFAYLTLAKHTISSDYVIPIGTYGQMKNGSTPMFNDINIYDLFVWMHYYVSMDALLGGSEIWRDIDFA HEAPAFLPWHRLFLLRWEQEIQKLTGDENFTIPYWDWRDAEKCDICTDEYMGGQHPTNPNLLSPASF FSSWQIVCSRLEEYNSHQSLCNGTPEGPLQRNPGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAA NFSFRNTLEGFASPLTGIADASQSSMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRR HRPLQEVYPEANAPIGHNRESYMVPFIPLYRNXDFFISSKDLGYDYSYLQDSDPDSFQDYIKSYLEQASRI WSWLLGAAMVGAVLTALLAGLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQSHL En las bases de datos de secuencias los aminoácidos se muestran en el código de una sola letra, no en el código de tres letras. En la tabla 2 encontrarás el aminoácido

! correspondiente a cada letra.

Código ( letra) Código (3 letras) Aminoácido A Ala Alanina R Arg Arginina N Asn Asparagina D Asp Aspartato C Cys Cisteína Q Gln Glutamina E Glu Ácido glutámico G Gly Glicina H His Histidina I Ile Isoleucina L Leu Leucina K Lys Lisina M Met Metionina F Phe Fenilalanina P Pro Prolina S Ser Serina T Thr Treonina W Trp Triptófano Y Tyr Tirosina V Val Valina Con los dos alineamientos, contesta las siguientes preguntas: e) ¿Cuantos cambios de aminoácido hay entre los dos gorilas? f) ¿Porque hay siempre menos cambios de aminoácido que de nucleótidos? g) ¿Copito tiene alguna mutación en la región codificante de este gen que explique porque la enzima no es activa en su piel? h) ¿Como explicas que Copito de Nieve sea albino? Ejercicio 4

traducción a proteína de este exón en cada una de las especies. Los aminoácidos se dan en el código de una sola letra, no en el código de tres letras (código aminoácidos).

exon18_MYH16_chimpance gagcagctgaacaagctgatgaccaccctccatagcaccgcaccccattttgtccgctgtattatccccaatgagtttaagcaatc gg exon18_MYH16_humano gagcagctgaacaagctgatgaccaccctccatagccgcaccccattttgtccgctgtattatccccaatgagtttaagcaatcgg Contesta las siguientes preguntas: e) ¿Cuantos aminoácidos iguales hay en los dos fragmentos de proteína? f) ¿Qué cambio ha habido en la secuencia de la proteína? Teniendo en cuenta que este gen tiene 42 exones, y que este es el exón 18, ¿qué crees que ha pasado con esta proteína en la especie humana? ¿Será más corta, más larga o igual que la de chimpancé? ¿Crees que será activa? g) Ahora que sabes que ha habido un cambio muy importante en la proteína, y después de ver como es esta secuencia en las otras especies de primates, ¿qué crees que ha pasado con estos nucleótidos de diferencia? ¿Se han eliminado en humanos o se han insertado en la secuencia del chimpancé? Ejercicio 5 El color de los mamuts El producto del gen Mc1r (Melanocortin type 1 receptor) es una proteína clave en la determinación del color del pelo tanto en humanos como en otros animales. La actividad reducida de este gen resulta en cabellos pelirrojos en humanos y vacas y en cabellos rojos o rubios en ratones, caballos y perros. Recientemente, se han secuenciado 1236 pb de este gen a partir de DNA obtenido de un hueso de mamut de Siberia que tenía 43.000 años de antigüedad. a) Busca las secuencias nucleotídicas del gen Mc1r de la especie Mammuthus primigenius en la base de datos del GenBank. ¿Cuántas secuencias has obtenido? b) ¿Cómo explicas que se haya obtenido más de una secuencia del mismo gen a partir del DNA de un solo hueso de mamut? Copia las secuencias en formato FASTA en un documento de texto. Para facilitar el trabajo con estas, cambia la primera línea por el nombre de la especie y los números

! 1, 2, 3... (sin ningún espacio).

c) Compara les distintas secuencias de mamut mediante el programa Clustal Omega y di cuántos cambios nucleotídicos hay entre ellas. d) Ahora busca las dos secuencias proteicas correspondientes codificadas por el gen Mc1r de la especie Mammuthus primigenius en la base de datos de proteínas del NCBI y alinéalas con el programa Clustal Omega. ¿Cuántos de los cambios observados en las secuencias nucleotídicas han dado lugar a cambios aminoacídicos? Busca en GenBank la secuencia nucleotídica del gen Mc1r del elefante ( Elephas maximus ) y alinéala con las secuencias nucleotídicas de mamut utilizando el programa Clustal Omega. Después, contesta las siguientes preguntas: e) ¿Cuántos cambios nucleotídicos observas que sean propios del elefante? f) Teniendo en cuenta la secuencia del elefante, di cuál de los alelos del mamut es el alelo primitivo y cuál es el alelo derivado. g) En muestras recogidas del permafrost se han encontrado pelos de mamut oscuros y claros. Sabiendo que el pelo de los elefantes es oscuro, ¿qué alelo tenían en el gen Mc1r los mamuts de pelo claro? Ejercicio 6 Buscar información sobre una secuencia desconocida Hemos secuenciado un fragmento de DNA de una región del cromosoma 21 humano que estamos estudiando. Queremos saber si nuestra secuencia forma parte de algún gen o si es una región no codificante. Para saberlo realizaremos un BLASTn que nos permitirá detectar si nuestra secuencia es similar a algún gen o no. Copia y pega la siguiente secuencia en el formulario del BLAST. ggccgggcacggtggctcatacctgtaatcccagcactttgggaggccaagacgggtggatcatgaggtcaggagatcgagacc attctggctaacacagtgaaaccccgtctgtactaaaaatacaaaaaaaagtagtcgggcatggtggcgggcacctgtggtccc agctactcgggaggctgaggcaggagaatggcatgaacccgggaggcggagcttgcagtgagccgagatcgcaccaccacact ccagcctgggtgacagagtgagactctatctcaaaaaaaaaaaaaaaaaaaaaa Cuando tengas el resultado del BLAST, contesta las siguientes preguntas: a) ¿A qué especie pertenecen las secuencias que se parecen a la nuestra? b) ¿Son todas las secuencias diferentes versiones de la misma (en diferentes individuos secuenciados, por ejemplo) o pertenecen a diferentes cromosomas de una misma especie? c) ¿Dirías que esta secuencia puede formar parte de la región codificante de un gen?