Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


La Recuperación de Información en Bases de Datos: Desafíos y Técnicas, Apuntes de Biblioteconomía y Documentación

Este documento aborda el tema de la recuperación de información (ri) en bases de datos, una ciencia que se ocupa de la búsqueda relevante y pertinente de información en documentos y bases de datos. Se discuten los desafíos de lograr que la información recuperada sea la necesaria para satisfacer las demandas de los usuarios, incluyendo el uso de diferentes idiomas, la malformulación de preguntas, y la necesidad de recuperar no solo un documento sino todos los relacionados. Se presentan los conceptos básicos de la ri y se mencionan algunos de los campos documentales importantes en cualquier base de datos. Además, se introducen los operadores lógicos, posicionales, y relacionales utilizados en lenguajes de interrogación, y se hace referencia al lenguaje documental como herramienta para facilitar la recuperación y representación de la información.

Tipo: Apuntes

2019/2020

Subido el 13/04/2020

elenabq1997
elenabq1997 🇪🇸

4.4

(22)

64 documentos

1 / 3

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 2: LAS BASES DE DATOS
Las bases de datos
La recuperación de información (RI), Information Retrieval, es la ciencia que se ocupa de la
búsqueda de información en documentos, así como de los propios documentos originales.
Igualmente, también de la búsqueda en bases de datos de cualquier texto, imagen,
documentos sonoros, etc., siempre de un modo pertinente y relevante.
Así la mueva demanda de información se ha materializado con la aparición de las
bibliotecas virtuales hacia las que se tiende cada vez en mayor medida
de esta forma, en los sistemas informáticos no es más que una operación de términos.
Un usuario introduce unos términos en una base de dato o en un sistema de recuperación
de información, que trata de encontrar en un fichero las palabras introducidas y da como
respuesta una visualización normalmente abreviada
Finalmente, el usuario selecciona los que considera más adecuados y elige cuál desea ver.
Este proceso, aparentemente sencillo, tiene complicaciones cuando lo que se pretende es
lograr el objetivo principal de la Recuperación de Información (RI): que toda la información
recuperada sea la necesaria para satisfacer las demandas de los usuarios.
De hecho, existen varios factores que pueden convertir la recuperación de información en
una tarea difícil:
1. El sistema de recuperación puede no ser fácil de utilizar ni ser accesible
2. La pregunta puede estar mal formulada y no “corresponder” con el lenguaje utilizado
en la indización previa de esos documentos.
3. Se pretende recuperar no sólo un documento, sino todos los relacionados con la
consulta, porque pueden ser complementarios y, por tanto, relevantes para
nosotros.
4. No queremos que aparezcan documentos que no responden a la cuestión planteada
5. Los documentos recuperados con las características citadas deben estar en un
formato adecuado que no despiste ni confunda al usuario, sino que le facilite
encontrar la información que busca
6. El uso de diferentes idiomas en las operaciones de indización y búsqueda.
Algunos de los campos documentales importantes en cualquier base de datos o catalogo
digital son los siguientes:
Título
Autor
Fecha
Materia
Palabras clave
ISBN (International Standard Book Number) Código de identificación de libros y CD-
ROM. Antes era de 10 dígitos y actualmente es de 13.
ISSN (International Standard Serial Number) Código de identificación de las revistas.
ISSN-e. Código de identificación de las revistas electrónicas.
Si la revista se publica tanto en formato papel como digital tendrá un issn para el
formato físico y un issn-e para el formato electrónico.
Por tanto, la recuperación de la información no sólo exige conocimientos de
documentación, sino de también de otras disciplinas como lingüística, estadística, lógica…
pf3

Vista previa parcial del texto

¡Descarga La Recuperación de Información en Bases de Datos: Desafíos y Técnicas y más Apuntes en PDF de Biblioteconomía y Documentación solo en Docsity!

TEMA 2: LAS BASES DE DATOS

Las bases de datos La recuperación de información (RI), Information Retrieval, es la ciencia que se ocupa de la búsqueda de información en documentos, así como de los propios documentos originales. Igualmente, también de la búsqueda en bases de datos de cualquier texto, imagen, documentos sonoros, etc., siempre de un modo pertinente y relevante. Así la mueva demanda de información se ha materializado con la aparición de las bibliotecas virtuales hacia las que se tiende cada vez en mayor medida de esta forma, en los sistemas informáticos no es más que una operación de términos. Un usuario introduce unos términos en una base de dato o en un sistema de recuperación de información, que trata de encontrar en un fichero las palabras introducidas y da como respuesta una visualización normalmente abreviada Finalmente, el usuario selecciona los que considera más adecuados y elige cuál desea ver. Este proceso, aparentemente sencillo, tiene complicaciones cuando lo que se pretende es lograr el objetivo principal de la Recuperación de Información (RI): que toda la información recuperada sea la necesaria para satisfacer las demandas de los usuarios. De hecho, existen varios factores que pueden convertir la recuperación de información en una tarea difícil:

  1. El sistema de recuperación puede no ser fácil de utilizar ni ser accesible
  2. La pregunta puede estar mal formulada y no “corresponder” con el lenguaje utilizado en la indización previa de esos documentos.
  3. Se pretende recuperar no sólo un documento, sino todos los relacionados con la consulta, porque pueden ser complementarios y, por tanto, relevantes para nosotros.
  4. No queremos que aparezcan documentos que no responden a la cuestión planteada
  5. Los documentos recuperados con las características citadas deben estar en un formato adecuado que no despiste ni confunda al usuario, sino que le facilite encontrar la información que busca
  6. El uso de diferentes idiomas en las operaciones de indización y búsqueda. Algunos de los campos documentales importantes en cualquier base de datos o catalogo digital son los siguientes:  Título  Autor  Fecha  Materia  Palabras clave  ISBN (International Standard Book Number) Código de identificación de libros y CD- ROM. Antes era de 10 dígitos y actualmente es de 13.  ISSN (International Standard Serial Number) Código de identificación de las revistas.  ISSN-e. Código de identificación de las revistas electrónicas. Si la revista se publica tanto en formato papel como digital tendrá un issn para el formato físico y un issn-e para el formato electrónico. Por tanto, la recuperación de la información no sólo exige conocimientos de documentación, sino de también de otras disciplinas como lingüística, estadística, lógica…

Para lograr que los documentos recuperados coincidan con los que contienen la información buscada. Igualmente hay que diferenciar entre 4 conceptos:

  1. Relevante. Importante, significativo
  2. Pertinente. Utilidad del documento, es decir, que satisfaga las necesidades de información de os usuarios.
  3. Sistemas de gestión de bases de datos. Son programas informáticos capaces de operar con dichos datos.
  4. Bases de datos. Son conjuntos de datos insertados en una base jerarquizada Las reglas gramaticales en los lenguajes de interrogación las constituyen los operadores. Existen diversos tipos.  Operadores lógicos o booleanos o Intersección “Y” (AND) o Unión “O” (OR) o Diferencia “NO” (NOT)  Operadores posicionales o NEAR (cerca de) Búsqueda de una palabra próxima a otra.  Operadores relacionales Se utilizan para buscar números. o =, <, >  Operadores de truncamiento Consiste en sustituir una letra de una palabra por un asterisco. Busca todos los derivados de la raíz. Ejemplo: banc* recupera banco, banca, bancario…