Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Resum pràctica 1 bioinformàtica, Resúmenes de Bioinformática

Asignatura: Bioinformatica, Profesor: , Carrera: Ciències Biomèdiques, Universidad: UB

Tipo: Resúmenes

2012/2013

Subido el 18/05/2013

ariadna22-1
ariadna22-1 🇪🇸

4.5

(31)

10 documentos

1 / 13

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Pràctica 1
La base de dades de referències bibiliogràfiques PubMed. Cerquem “ splicing” després
“spliceosome”i “spliceosome comaparaula claude l’article
Pàgina d’inici: buscador
Resultats obtinguts: aquí podem veure nº d’articles per la cerca
Display Settings ens permet escollir com volem l’ordre dels articles, quants en volem
veure per interfície, quina part volem veure…
Clicant aquests icones podem veure article original a la web on es va publicar (des de UB a
casa no perquè no estem subscrits):
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Vista previa parcial del texto

¡Descarga Resum pràctica 1 bioinformàtica y más Resúmenes en PDF de Bioinformática solo en Docsity!

Pràctica 1 La base de dades de referències bibiliogràfiques PubMed. Cerquem “ splicing” després “spliceosome”i “spliceosome” comaparaula claude l’article

Pàgina d’inici: buscador

Resultats obtinguts: aquí podem veure nº d’articles per la cerca

Display Settings ens permet escollir com volem l’ordre dels articles, quants en volem veure per interfície, quina part volem veure…

Clicant aquests icones podem veure article original a la web on es va publicar (des de UB a casa no perquè no estem subscrits):

Els articles poden parlar d’splicing o només anomenar la paraula. Els reviews fan resum de la info sobre splicing. En la nostra búsqueda l’etiqueta era SPLICING.

En el món de la bioinfo tenim habitualment:

  • proveidor (de recursos) : aquest que té habitualment bases de dades eines material documental tutorials... des del nostre punt de vista serà una pàgina web.
    • NCBI serà per nosaltres un proveidor-té molta info, és el proveidor americà. •L’EMBL seria L'Europeu (hi han diferents "còpies" a diferents llocs-Hinxton(el q farem servir), Hamburg,... són nòduls; petits sucursals que tenim).
    • El Sanger center és també un proveidor amb base de dades, informació,...

-bases de dades (conté la informació) -eines [tools en anglès]. (programes-habitualment per fer búsqueda d'info, visualitzacions, prediccions,...). No contenen info.

Si anem nosaltres a la biblio tenim un terminal i busquem un llibre. Si el busquem es xq el nostre pc té un programa i mostra uns espais on podem possar certa info del llibre q busquem. Això seria una eina que ens deixa uns espais per ficar característiques dels objectes que jo vull buscar. El programa et dona facilitats per buscar en una base de dades (que està amagada)- mai toques una base de dades previament, sempre tens un programa q ens facilita la busqueda. Una base de dades per nosaltres seria com una taula amb:

  • files = registre  cada objecte seria un llibre •Columnes = camps característiques de l'objecte (referencia, si està en prestec, nom, autor…). 'Un llibre és un objecte però en realitat tenim característiques del llibre no el llibre en si'

[Training a EMBL a assolir coneixements. Extres]

--> Volem intentar estudiar el tema d'splicing. Si volem treballar sobre un concepte concret (pex splicing) podem fer cerques "bulgars"-google (no és específica). La info d'splicing ens descobreix altres termes subrelacionats com p.ex.--> SPLICEOSOMA (anem afegint glossari de termes)--> busquem con funciona; seq conscens,... ==> això seria per búsqueda en google, una búsqueda simple per agafar una sèrie de conceptes. Si busquem RNA splicing a wiki la cerca ja és una mica més precissa i a google també, ens dona una relació de resultats diferents a si busquem sol splicing. Hem de formular bé la pregunta per evitar un excés de registres, cal fer la pregunta, el camp de la pregunta el més precís possible. Trovem vídeos p ex que ens expliquen d'una manera gràfica com funciona l'splicing. Tot això és formació bàsica sobre un tema. Google és un proveidor (té una base de dades i nosaltres tenim davant una eina per fer cerca a google, tú no l'estàs fent servir directament). Cada resultat (línees blaves) que ens surten al buscar són com registres (o pàg web o docs associades a pàg web). La cerca avançada ens permet filtrar l'objecte. A google tot el que estigui conectat és un objecte. Si volem buscar info científica hem d'anar a una base de dades bibliogràfica especialitzada. PubMed és la més coneguda, Medline és la versió europea. Pubmed és una base de dades que està en el proveidor NCBI. Hi ha moltes bases de dades que elles mateixes són proveidors (com google). Si fem servir la búsqueda normal (no avançada), mentre escrivim ens surten suggerències per completar la frase que estem escrivint per a buscar. La pestaña Reviews conté articles que fan revisió sobre el

Query  per fer la cerca i modificar-la Library page  ens ensenya les bases de dades disponibles i dividides per contingut. La base de dades PDB (protein data base) es sol fer servir per estructures terciàries. Si passem el ratolí per sobre de les diff bases de dades ens indica un camp amb info sobre ella. EMBL ens serveix per buscar nucleòtids.

Anem a EBI  tools  tools index  I al final de la pag trobarem SRS

Ens surt:

Anem a LIBRARY PAGE on trobarem llistat base de dades:

Seleccionem base de dades que volem Cliquem p.e. la base de dades EMBL (Release) (aquí podrem respondre 1rs preguntes guió) i cliquem la pestanya query form. Cal saber el codi del gen o proteína que busquem per poder-la trobar en totes les bases de dades. SRS permet buscar a la vegada el que ens interessa , proteína p.e., en diferents bases de dades. (la seq.,les interaccions amb altres prot., en quins proteomes es troven…) i té molts camps: ID = el codi de la prot. Que busquem, la longitud de la seq., molecula, topologia,etiquetes,organuls …

Diferents bases de dades que podem escollir en EMBL:

Seleccionem p.e. el camp “organism name” i li posem p.e. human o mouse. Podem fer una búsqueda més complexe amb els connectors següents: &=i | = o != NO

Organism Name human | mouse

Description U1 snRNA GENE

Busquem en huma o ratoli la descripció de la p U1 U1 snRNA GENE Podem canviar el format, en comptes d’embl en genbank. Si només vull la seq. Posarem

--Els dos primers resultats els descartem perquè són subseqüències. La 3 podria ser. La 4 també. Per la informació descriptiva és difícil determinar quina pot ser la correcte, apostem per la 4. Veiem un registre amb diferents camps. A sota està la seq sencera. El nostre RNA no codifica, s'enganxa. De manera que no volem la regió no codificant (perquè s'enganxa a la regió d'spliceosoma). Per fer-ho busquem la zona ncrna. Cliquem i ens ofereix la zona. Li demanem en format FASTA.

Si seleccionem les 2 seq. Que ens interressen i anem a tools podem fer difrerents coses:

EMBL (Release) Primary Accession (Links to SVA)

Access ion List

Description Seque nce Length

EMBL

(Release):DQ

DQ058355 DQ

Homo sapiens U1A snRNA gene, complete sequence.

172

EMBL

(Release):DQ

DQ058357 DQ

Homo sapiens U1A snRNA gene, complete sequence.

165

EMBL

(Release):J

J00318 J00318 Human U small nuclear RNA (snRNA) gene HU1-1.

806

EMBL

(Release):V

V00591 V00591 Homo sapiens U snRNA gene.

592

EMBL

(Release):J

J00645 J00645 mouse u small nuclear rna (snrna) gene.

247

EMBL

(Release):X

X54401 X54 401 Mouse U snRNA (intron 5 of hsc70 gene)

368

EMBL

(Release):X

X54402 X54 402 Mouse U snRNA (intron 6 of hsc70 gene)

269

EMBL

(Release):X

X54403 X54403 Mouse U snRNA (intron 8 of hsc70 gene)

262

--El bloc de notes del PC o llibreta és un editor que ens permet obtenir la distància en format FASTA. El blanc (espais entre la seq.) no importa. Hem de ficar "> alguna característica". Mecanimament l'eina ens ho pot fer però ara no funcionava bé.==> ja tenim la seq primaria. El

camí que havia que funcionar seria el SAVE (al costat de Save Entry). Aquest ens permet guardar en FASTAseq o en altres formats.

Per guardar coses posem a la dreta SAVE després ens surt Output To:

Browser Window (HTML) File (text)

Number of entries to download:

10

Save As:

ASCII text/table

Save with view: EMBLSeqSimpleView

Column Separator:

\t Record Separator:

\n

Generic XML format

Using the loader:

EMBL_XML_Class

Specific XML format

Using the loader:

EMBL_XML_Class

Using XML PrintMetaphors with id: no valid metaphors found

I clikem FILE. Si copiem les dos seq. La de huma i la de ratoli i les posem a una eina TOOL determinada en spot fer una gràfica de similitud entre aquestes dues seqüencies

-- l'estructura sec. Anem a una base de dades d'estructures secundàries que es diu RNA Strand (en una pag web). RNA Strand és proveidor, té un lloc físic. Posem la ID de la

Exemple d’estructura que en spot donar:

--Ara anem a buscar l'estructura tericària. (protein database) PDB que de per si és una database (que segur que té una eina associada). També podríem fer búsquedes de PDB a través de SRS (perquè és una eina que fa ús d'aquesta perquè està associada a base de dades), però anem al proveidor (web) de PDB directament.

Cerquem U1snRNA i ens suggereix mentres escrivim dues. Tenim doncs dues estructures registrades (cristalografia de raig X). Però agafa més coses a més del que jo vull perquè per exemple el primer és tot l'spliceosoma inclós l'U1. La base de dades té camps associats. Tenim també icones amb formes de visualització. Ho farem amb la eina Jmol que llegeix registres PDB. Veiem la visualització del registre que està indicat allà adalt. Clicant a display file podem veure el FASTA de la seq. i el PDB complet d'aquesta. En aquesta veiem els àtoms [[[[[[[anotacions sol ser info del genoma associat a possicions]]]]]]...,... en aquesta veiem els àtoms. El jmol les interpreta i les "pinta". En aquesta seqüència (una de les dues, que no era exactament la que buscavem) veiem dímers que forma l'spliceosoma. En espiral rosa la proteïna i els fils serien els RNAs.

(surtiría una pagina així per amb la nostra prot., la visualitzariem amb 3D gràcies a Jmol, complement)

Clikant PDB ens dóna : i clikant fasta dona:

==Un navegador genòmic ens permet interectuar amb les diferents regions del gen. La meva regla és el cromosoma i les etiquetes són informació associada a posicions, per tant anotacions a una zona del genoma. Això és genòmica. La proteòmica (bioquímica) seria el PDB.

Blast per comarar una seq determinada amb la resta de bases de dades!!!

A ENSEMBL per trovar llistat

1.5 Enllaços Web

PubMed: http://www.ncbi.nlm.nih.gov/pubmed NCBI: http://www.ncbi.nlm.nih.gov/ EBI: http://www.ebi.ac.uk/ SRS: http://srs.ebi.ac.uk/ RNAstrand: http://www.rnasoft.ca/strand/ Mfold: http://mfold.rna.albany.edu/?q=mfold PDB: http://www.pdb.org/ ENSEMBL: http://www.ensembl.org/