Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Funciones en R Studio, Ejercicios de Bioinformática

Funciones que encuentra similitudes en patrones dentro del Codigo R

Tipo: Ejercicios

2019/2020

Subido el 11/05/2020

jehieli-naharay
jehieli-naharay 🇲🇽

5

(1)

5 documentos

1 / 11

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Jehieli Naharay Almeida de la Cruz
Licenciatura en Genómica Bioinformática Avanzada
“Funciones en
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Funciones en R Studio y más Ejercicios en PDF de Bioinformática solo en Docsity!

Jehieli Naharay Almeida de la Cruz

Licenciatura en Genómica Bioinformática Avanzada

“Funciones en ”

Contenido

1 Conteo de Patrones

 ConteoDePatrones <- function(texto, patron) {  veces <- 0  for (i in 1: (nchar(texto) - nchar(patron) + 1) ){  if (substr(texto, i, i + nchar(patron)-1) == patron)  veces <- veces + 1  }  return(veces)  }

Significado de las líneas

Conteo de patrones es una función que busca específicamente un patrón o secuencia corta que se desee encontrar dentro de un texto con muchos más caracteres, y puede expresar el resultado a su búsqueda en números, es decir, cuantas veces aparece ese patrón deseado dentro de la cadena de texto.

  1. Es necesario guardar la función dándole las instrucciones al programa de lo que va a ejecutar y de qué tipo de código se está tratando, si se longitud de letras patrones específicos.
  2. Se guarda una variable con el número 0, para que cada vez que se ejecute la función inicie un nuevo conteo de patrones y no se sume con los patrones encontrados anteriormente.
  3. Si tenemos un patrón para búsqueda cual sea dentro de nuestro agrado, el ciclo de repetición for es el encargado de encontrar la similitud al 100% de un patrón dentro de una cadena de texto. Es necesario contar los caracteres del texto y del patrón nchar para que al momento de ejecutarse la función pueda existir un acomodo del patrón dentro de la cadena de texto y a este es necesario sumarle +1, para contemplar que la cuenta inicia desde el número
  4. En este apartado se sustrae la longitud del texto al igual que la longitud del patrón para comparar si es que existe dentro de la cadena de texto, a este se le resta -1 para que el código se regrese una letra y pueda dar una buena lectura y sustracción al texto a analizar.
  5. Ahora a la variable veces le sumará el valor de +1 por cada coincidencia del patrón que encuentre en el texto.
  6. Y el programa regresará la información de cuantas veces es que aparece cierto patrón dentro de la secuencia o cadena de texto.

2

Ejemplo:

Ilustración 1. Conteo de Patrones Vibrio cholerae Ori.

  1. Ahora, dentro del vector patrones, que funciona como una cajonea buscará^4 esas variables en texto.
  2. El vector frecuencias buscará todas las veces que aparece el patrón del vector patrones en la cadena de texto.
  3. El código names le dará el nombre y permitirá ver todas las frecuencias encontradas en el vector patrones.
  4. Y por último se regresara la información y ordenar un solo vector de forma inversa, del patrón con mayor frecuencia al de menor frecuencia.

Ejemplo:

Ilustración 2. Mapa de frecuencias Vibrio cholerae Ori.

5 Patrones frecuentes

Secuencia:

ATCAATGATCAACGTAAGCTTCTAAGCATGATCAAGGTGCTCACACAGTTTAT

CCACAACCTGAGTGGATGACATCAAGATAGGTCGTTGTATCTCCTTCCTCTCG

TACTCTCATGACCACGGAAAGATGATCAAGAGAGGATGATTTCTTGGCCATAT

CGCAATGAATACTTGTGACTTGTGCTTCCAATTGACATCTTCAGCGCCATATT

GCGCTGGCCAAGGTGACGGAGCGGGATTACGAAAGCATGATCATGGCTGTT

GTTCTGTTTATCTTGTTTTGACTGAGACTTGTTAGGATAGACGGTTTTTCATCA

CTGACTAGCCAAAGCCTTACTCTGCCTGACATCGACCGTAAATTGATAATGAA

TTTACATGCTTCCGCGACGATTTACCTCTTGATCATCGATCCGATTGAAGATCT

TCAATTGTTAATTCTCTTGCCTCGACTCATAGCCATGATGAGCTCTTGATCATG

TTTCCTTAACCCTCTATTTTTTACGGAAGAATGATCAAGCTGCTGCTCTTGATC

ATCGTTTC

Tabla de frecuencias

K 3 4 5 6 7 8 9

Ocurrencias 25 12 8 8 5 4 3

Patrón TGA^ ATGA^ GATCATGATC TGATCA^ ATGATCA^ ATGATCAA

ATGATCAAG CTCTTGATC TCTTGATCA CTTGATCAT

Ejecuciones:

Patrón en longitud tres:

Ilustración 3. Patrón longitud 3.

Patrón longitud seis:^7

Patrón longitud siete:

Ilustración 6. Patrón longitud 6.

Ilustración 7. Patrón longitud 7.

Patrón longitud ocho:^8

Patrón longitud nueve:

Ilustración 8. Patrón longitud 8.

Ilustración 9. Patrón longitud 9.