Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Examen Bioinformática 2011, Exámenes de Biotecnología

Asignatura: bioinformatica, Profesor: , Carrera: Bioquímica, Universidad: UB

Tipo: Exámenes

2014/2015

Subido el 04/06/2015

frani14
frani14 🇪🇸

4.3

(4)

1 documento

1 / 12

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Examen Bioinformàtica- Juliol 2011
1. En Lincoln Stein i en Sein Eddy van definir el sistema d’anotacions distribuïdes o DAS
per què fos possible compartir anotacions fetes sobre seqüències genòmiques
1. El client DAS integra les anotacions del servidor de referència i un o més servidors
d’anotacions
2. El servidor de referència proporciona les coordenades genòmiques sobre una versió
d’ensamblat.
3. El servidor de referència por fer alhora de servidor d’anotacions, com passa a
EnsEmbl.
4. Si hi ha canvis en la seqüència de referència, s’han de re-calcular totes les
anotacions perquè canvien les coordenades.
Quina de els afirmacions anteriors és certa:
a. Totes les anteriors són certes.
b. 2 i 3 són falses, de fet solament el servidor de referència és el que proporciona les
anotacions.
c. 1 és falsa, el client tan sols visualitza les dades que integren els servidors DAS.
d. 4 és falsa, les coordenades de les anotacions es mapen automàticament sobre la
nova seqüència.
2. A través dels servidors de l’NCBI, hom pot accedir tant a bases de dades primàries com
a bases de dades secundàries, i també accedir a diferents eines bioinformàtiques via
formularis web, per treballar amb aquestes eines sobre les bases de dades. Quina de les
següents afirmacions és certa:
a. Els repositoris són bases de dades primàries que no es poden modificar, ha qye ñes
ion els investigadors envien les seves seq¨`encies, i per tant no es poden emprar
tampoc per fer cerques.
b. Les bases de dades secundàries sols poden contenir dades confirmades
experimentalment.
c. Les bases de dades secundàries contenen anotacions i seqüències refinades a
paritr dels repositoris.
d. Ni les bases de dades primàries, ni les secundàries poden contenir registres relatius
a prediccions computacionals.
3. El problema de les bases de dades amb informació biològica és:
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Examen Bioinformática 2011 y más Exámenes en PDF de Biotecnología solo en Docsity!

Examen Bioinformàtica- Juliol 2011

  1. En Lincoln Stein i en Sein Eddy van definir el sistema d’anotacions distribuïdes o DAS per què fos possible compartir anotacions fetes sobre seqüències genòmiques
    1. El client DAS integra les anotacions del servidor de referència i un o més servidors d’anotacions
    2. El servidor de referència proporciona les coordenades genòmiques sobre una versió d’ensamblat.
    3. El servidor de referència por fer alhora de servidor d’anotacions, com passa a EnsEmbl.
    4. Si hi ha canvis en la seqüència de referència, s’han de re-calcular totes les anotacions perquè canvien les coordenades.

Quina de els afirmacions anteriors és certa:

a. (^) Totes les anteriors són certes.

b. 2 i 3 són falses, de fet solament el servidor de referència és el que proporciona les anotacions.

c. 1 és falsa, el client tan sols visualitza les dades que integren els servidors DAS.

d. 4 és falsa, les coordenades de les anotacions es mapen automàticament sobre la nova seqüència.

  1. A través dels servidors de l’NCBI, hom pot accedir tant a bases de dades primàries com a bases de dades secundàries, i també accedir a diferents eines bioinformàtiques via formularis web, per treballar amb aquestes eines sobre les bases de dades. Quina de les següents afirmacions és certa:

a. Els repositoris són bases de dades primàries que no es poden modificar, ha qye ñes ion els investigadors envien les seves seq¨`encies, i per tant no es poden emprar tampoc per fer cerques.

b. Les bases de dades secundàries sols poden contenir dades confirmades experimentalment.

c. Les bases de dades secundàries contenen anotacions i seqüències refinades a paritr dels repositoris.

d. Ni les bases de dades primàries, ni les secundàries poden contenir registres relatius a prediccions computacionals.

  1. El problema de les bases de dades amb informació biològica és:

a. Que la informació està fragmentada en moltes taules i els registres que les formen estan definits per camps diferents, el que fa necessari emprar programes per gestionar-les i per recuperar dades sobre un fitxer.

b. Que contenen informació estructurada de manera jeràrquica, el que dificulta l’accés a les dades.

c. Que cal validar experimentalment a posteriori totes les dades que emmagatzemen si es tracta de repositoris, cosa que no és necessària per les bbases de dades secundàries.

d. Que tenen massa seqüpencies que no són homòlogues per poder fer cerques a nivell de seqüència prou ràpides.

  1. Els models de Markov es fan servir per definir perfils de seqüència a la base de dades PFAM a partir d0alineaments de seqüències de proteïnes. Aquests perfils són útils per cercar dominis funcionals o estructurals ja que:

a. Tenen en compte quines regions estan mñes ben ali8neades i, per tanty, facilirtten alinear més fàcilment les proteïnes anònimes que volem anotar.

b. Poden incorporar en el model les insercions/delecions corresponents als gaps i, a probabilitats separades per cada bloc.

c. Relacionen les diferents probabilitats per les regions més o menys conservades, pels gaps, etc... de manera que les posicions en l’0alineamenr dels diferents símbols (nucleòtids o aminoàcids) siguin independents.

d. Al ser models probabilístics necessiten menys seqüències per calcular les freqüències de símbols a cada posició, fins i tot amb els gaps, que també es poden afegir amb la seva pròpia probabilitat.

  1. Digues quines de les següents cerques textuals serà més acurada per trobar els registres GenBank que contenen seqüències de Mus musculus i que es puguin estar relacionades amb el terme splicing enhancer:

a. Splic* enhancer [All Fields] AND “Mus musculus”

b. Splicing[Mesh term] AND enhancer [Mesh term] AND mouse

c. “splicing enhancer” [All fields] AND “Mus musculus” [Organism]

d. “splicing enhancer” [Mesh term] AND “Mus musculus” [Organism]

  1. Quan busquem per paraules clau, els programes com NCBI- Entrez implementen algoritmes de cerca de cadenes de text que troben els camps de la base de dades que continguin la paraula exacta, a menys que afegim caràcters comodí. Aleshores podem dir que:

b. Que podem modelitzar les seqüències biològiques matemàticament i aplicar en el seu anàlisi algorismes de cerca textual i de petons amb les freqüències dels símbols

c. Que si s’alineà per posició amb altres k- mers de la mateixa seqüència independentment de la seva posició podem generar una matriu de pesos

d. Que podem definir prefixes i/o sufixes per ancorar els alineaments per posicio i modelar aixi sinyals a nivell de sequencia mijançant matrius de pesos.

  1. El contingut d’informació de cada posició d una matriu de pesos permet re-escalar la representación grafica de la matriu per generar un logo de sequencia on podem veure quines posicions són més rellevants pel model Em de tenir en compte peró que

a. L´entropia relativa dependrà de com d´independents siguin les posicions consecutives de la matriu

b. Cal treballar amb bits perque aixi és més fàcil de calcular amb l’ordinador per moltes sequencies

c. És una mesura de com s´aparta la distribució de les fraquencies observades respecte les esperades per cadascuna de les posicions

d. Es calcula sumant totes les frequencies i despres es fa el logaritme en base 2 per ajustar les unitats a bits; d´aquesta manera sempre tindrem valors entre 0 i 2

  1. Amb Scan Prosite NO podem

a. Proporcionar un patró i cercar proteïnes que el verifiquen

b. Proporcionar una seqüència i cercar els patrons que conté

c. Alinear parelles de seqüències o de patrons

d. Recuperar la información associada a un determinat patró

  1. Pel que fa a la quantitat E() que reporta el llistat de BLAST o FASTA

a. Indica el nombre d alineaments esperats amb una puntuació com la obtinguda o més gran per cada alienament del llistat, suposant una base de dades de seqüències obtingudes a l´atzar de la mateixa mida on s´ha fet la cerca.

b. Se sap que un alineament am E()<0,05 sol indicar que la seqüència de la base de dades és candidata a ser homologa a la problema

c. Totes les altres opcions són certes

d. El valor de E() no és constant atès que depèn del nombre de registres de la base de dades

  1. Quina de les següents afirmacions és falsa:

a. (^) CustalW fa servir matrius de substitució

b. Per fer cerca d´homologies es pot fer servir els pogrames FASTA i el BLAST

c. FASTA és un programa i un format de fitxer

d. FASTA i BLAST són métodes heuristics i el ClustalW és un mètode òptim.

  1. La selecció de gens diferencialment expressats mitjançant un experiment amb microarrays:

a. No es pot fer si no es filtren abans les dades sorolloses.

b. Consisteix en ajustar el p-valor tan com cñahio èr yal de no equivocar-se si diem que un gen diferencialment expressat no ho està en realitat (és a dir, en controlar els falsos negatius).

c. Es pot fer però sense fer servir mètodes estadístics ja que la mida mostral ´ñes massa perira

d. Consisteix en fer un test estadístic entre les expressions normalitzades dels gens en cada categoria.

  1. Quina raó justificaria la utilització com a matriu de puntuació la PAM40 per a la comparació de seqüències?

a. La comparació de patrons

b. La comparació de seqüències d’aminoàcids poc distants evolutivament

c. La comparació de seqüències de nucleòtids molt distants evolutivament.

d. (^) Cap, ja que sempre és preferible la matriu BLOSUM

  1. L’algoritme que fa servir CLUSTALW per generar els alineaments múltiples és:

a. Molt semblant a FASTA

b. Una extensió del de Smith-Watermann

c. Heurístic on les seqüències similars són alineades primer (per parelles), afegint posteriorment les menys pròximes

d. Una extensió del de Needleman-Wunsch que fa servir programació dinàmica n- dimensional per alinear de forma òptima totes les seqüències

podem deduir que entre les dues seqüències comparades hi ha hagut

a. Una inserció

b. Una deleció

c. Pèrdua de similaritat per substitucions

d. Una inserció o una deleció, depèn de com definim l’orde de les seqüències

  1. Quina de les següents afirmacions és certa?

a. L’algorisme FASTA i BLAST són tots dos heurístics però, mentre que FASTA fa cerques globals, BLAST es basa en alineaments locals.

b. L’algorisme BLAST és un algorisme heurístic més ràpid que el de Smith- Waterman però aquest segon també es pot fer servir per fer cerques.

c. FASTA i BLAST són algorismes òptims basats en programació dinàmica però optimitzats per ser molt més ràpids que Needlman-Wünsch o Smith-Waterman realitzen alineaments globals.

d. El llistat de resultats d’un cerca FASTA o BLAST mostra totes les comparacions realitzades entre la seqüència problema i les seqüències de la base de dades escollida.

  1. Digueu quina de les següents afirmacions és certa respecte les matrius de substitució BLOSUM:

a. Estan basades en alineaments locals.

b. Serveixen per comparar seqüències nucleotídiques

c. Les matrius BLOSUM s’obtenen per extrapolació de la matriu BLOSUM

d. Cap de les altres afirmacions és correcta.

  1. Segons la teoria neutralista de l’evolució molecular:

a. Gens amb una gran constricció funcional tindran taxes de substitució nucleotídica reduïdes.

b. (^) Gens amb una gran constricció funcional tindran taxes de substitució nucleotídica reduïdes si el temps de divergència és petit.

c. Gens amb una gran constricció funcional tindran taxes de substitució nucleotídica molt grans.

d. Les taxes de substitució nucleotídica són independents dels nivells de restricció funcional.

  1. Una família multigènica

a. És un conjunt de gens ortòlegs que tenen una mateixa funció.

b. És un conjunt de proteïnes que tenen una mateixa funció.

c. (^) És un conjunt de gens originat per duplicacions gèniques.

d. Cap de les altres afirmacions és certa.

  1. Digueu quina de les següents afirmacions és certa respecte a la hipòtesi del rellotge molecular:

a. La hipòtesi fou encunyada als antes 90, al comparar els genomes de diverses espècies d’eucariotes.

b. La hipòtesi fou encunyada als antes 90, al comparar els genomes de diverses espècies de procariotes.

c. Fou formulada als anys 60 al veure que totes les molècules tenen la mateixa taxa de substitució.

d. Cap de les altres opcions és correcta.

  1. El format més utilitzat per representar arbres filogenètics és:

a. Format NEWICK.

b. No hi ha cap format standard.

c. Format dbSNP

d. Format GFF

  1. El paràmetre K (nombre de substitucions nucleotídiques per posició entres dues seqüències):

a. Efectuar una simulació de dinàmica molecular, emprant mecànica clàssica, del complex format pel DNA i la proteïna en qüestió i analitzar els modes de deformació de l’àcid nucleic.

b. Realitzar una simulació de Monte Carlo del DNA en absència de la proteïna, i extrapolar els seus modes normals de deformació.

c. Efectuar una determinació de les energies d’interacció entre la proteïna i les bases del DNA en la regió de contacte, emprant mecànica quàntica.

  1. Estem treballant amb una proteïna de la que no es coneix cap homòleg al PDB

a. Amb una predicció d’accessibilitat tindrem suficient per localitzar el centre actiu.

b. Un mostreig de Monte Carlo proporcionarà un bon model de les possibles estructures tridimensionals assequibles.

c. (^) Una predicció estructural ab-initio ens permetrà situar les regions funcionalment importants, però no obtenir una estructura tridimensional completa.

d. Una estimació del contingut en estructura secundària ens permetrà identificar el plegament.

  1. El docking té dues fases diferenciades, la generació d’estructures d’unió i la puntuació de les mateixes:

a. Les funcions de puntuació sempre defineixen relacions amb proteïnes estructura- activitat de series de compostos.

b. (^) La generació d’estructures s’efectua per comparació amb proteïnes conegudes presents al PDB que uneixin els mateixos lligands.

c. L’ús de dinàmica molecular en la generació d’estructures d’unió és habitual perquè permet introduir la flexibilitat de les estructures implicades.

d. Donat que la qualitat dels resultats obtinguts depèn fonamentalment de la qualitat de la funció de puntuació escollida, és habitual re-avaluar resultats quan es disposa de noves funcions de puntuació.

  1. Els camps de força emprats en mecànica clàssica contenen termes per descriure interaccions enllaçants i no enllaçants

a. (^) Dels termes enllaçants només cal parametritzant les torsions.

b. Els termes no enllaçants es representen normalment amb corbes parabòliques.

c. Els termes enllaçants corresponen a energies de solvatació i electroestàtiques.

  1. Desitgem construir un model de l’estructura 3D d’una proteïna que mostra una identitat de seqüència del 60% amb una altra present al PDB

a. No podem generar el model ja que es requereix una identitat no superior al 30%

b. En aquestes condicions l’estratègia més adequada és el modelat comparatiu o per homologia.

c. Un algorisme threading (Phyre per exemple) ens permetrà obtenir un “mostreig” acurat de l’estructura del 40% restant.

d. Únicament serà fiable l’estructura del 60% de la proteïna.

  1. L’entorn natural de les biomolècules inclou dissolvent, pressió i temperatura constants:

a. Fem servir una constat dielèctrica aparent de 80.

b. (^) Fem les simulacions en absència de dissolent, ja que la representació del mateix no és realista i falseja els resultats.

c. Per tant cal realitzar les simulacions emprant caixes de dissolvent i condicions periòdiques que permetin controlar el volum i mantenir el sistema acoblat a un bany tèrmic.

d. No és possible simular temperatura constant.

  1. L’estratègia anomenada screening invers

a. Totes les opcions són certes.

b. Permet estimar la possibilitat d’efectes secundaris en el cas de disseny de fàrmacs

c. (^) Consisteix en efectuar la predicció de docking d’una molècula contra un conjunt de receptors proteics.

d. És poc utilitzada ja que requereix de disposar d’un elevat nombre d’estructures de proteïna.

  1. En relació a l’estructura tridimensional de les proteïnes