Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


base de datos, Apuntes de Comunicación Audiovisual

Asignatura: d, Profesor: maria victoria, Carrera: Comunicación Audiovisual, Universidad: UNEX

Tipo: Apuntes

2013/2014

Subido el 05/01/2014

maik23
maik23 🇪🇸

3.9

(16)

4 documentos

1 / 15

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA0: BASE DE DATOS
1. Definición.
2. Estructura.
3. Modelos.
3.a. Relacional
3.b.Textual o documental.
4. Operadores.
5. Elemento (SGD) sistema de gestión documental.
6. Proceso.
7. Diccionario de datos.
1. DEFINICIÓN:
Una base de datos, es un conjunto de datos almacenados en un soporte informático para su
posterior recuperación.
[La definición relativamente le da igual, lo importante y esencial es que van en un soporte
informático.]
2. ESTRUCTURA:
Cosas sueltas: Se organizan en función del tipo de documentos (fotografías, televisión…)
y diferente del tipo de usuario. Cada documento se corresponde con una ficha o registro.
Tema 0 Documentación
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga base de datos y más Apuntes en PDF de Comunicación Audiovisual solo en Docsity!

TEMA0: BASE DE DATOS

  1. Definición.
  2. Estructura.
  3. Modelos.

3.a. Relacional

3.b. Textual o documental.

  1. Operadores.
  2. Elemento (SGD) sistema de gestión documental.
  3. Proceso.
  4. Diccionario de datos.

1. DEFINICIÓN:

Una base de datos, es un conjunto de datos almacenados en un soporte informático para su posterior recuperación.

[La definición relativamente le da igual, lo importante y esencial es que van en un soporte informático.]

2. ESTRUCTURA:

Cosas sueltas: Se organizan en función del tipo de documentos (fotografías, televisión…) y diferente del tipo de usuario. Cada documento se corresponde con una ficha o registro.

[Tipo de documentos y necesidades de las personas. Ficha o registro = documento] Documento = FICHA o REGISTRO = CAMPOS (etiqueta y valor de campo).

[Cada registro tiene a su vez una serie de campo o campos formados por etiquetas y contenidos, o valor de campo.]

Todo esto viene a decir:

Cada documento está relacionado con un registro. Por cada documento se crea una ficha, que estará formada por campos y por valores de campo (etiquetas o contenido.). La unidad básica de la base de datos es el DOCUMENTO. Cada documento se relaciona con cada registro de la base de datos. Por ejemplo, en una base de datos de libros, cada libro será un registro.

Para crear una base de datos hay que crear una estructura, una forma de guardar esos registros. La forma consiste en que por cada registro se crea una FICHA, formada por CAMPOS (o ETIQUETAS) o VALORES DE CAMPO (CONTENIDO).

3. MODELOS DE BASES DE DATOS

  1. Modelo relacional : El clásico modelo basado en tablas. Tabla se divide en: filas (registro) y columnas (Campos).

Son aquellos que se basan en tablas. Se usan para aquellos ámbitos de trabajo en el que no se precisa análisis de contenido, por ejemplo los que se usan para la contabilidad, documentación administrativa… Este modelo tiene algunos problemas:

-Los términos por los que yo puedo recuperar la información. Sólo se recupera la primera cadena de caracteres. -No admite campos que sean de longitud variable. La extensión es muy reducida por las celdas.

-En un modelo relacional solo es recuperable la primera cadena de caracteres. Ejemplo: si un libro tiene dos autores, habrá dos nombre y dos apellidos. Con este modelo solo se puede recuperar el primer carácter, es decir, el primer nombre

  • El modelo relacional No admite valores repetibles: cuando el tipo de información que voy a usar ya está en uso.

2.- Longitud de cada campo : En los modelos textuales existe la ventaja de que permiten una longitud variable. Por ello, hay que tener una previsión. Algunos campos, como “Resumen”, no pueden tener una longitud ilimitada, sino que habría que determinarla para que contuvieran solamente la información fundamental. Otros campos exigen de por sí una longitud fija, como el campo “Fecha”. Puedo determinar la longitud. Ejemplo: campo de fecha=dos dígitos para mes, dos para día y cuatro para año. Todos han de seguir este formato.

3.- Cuales serán repetibles: hay que pensar en el conjunto no en una única noticia, libro… etc. Repetible se refiere al tipo de información almacenada, si voy a tener más de un título, más de un autor, más de una fecha… Ejemplo: el título de una noticia nunca es repetible, pero si hay antetítulo y titulo, sí seria repetible o pondría dos etiquetas. Otro ejemplo, el campo autor ha de ser repetible, ya que puede ocurrir que una noticia, libro, fotografía… tenga más de un autor.

4.- Cálculo de ocurrencias: La ocurrencia es el número de veces que un término de búsqueda aparece en el conjunto de documentos resultantes de dicha búsqueda. Es decir, el número de veces que mi búsqueda (por ejemplo, Pedro Almodóvar) aparece en el conjunto resultante de los documentos, donde se ha realizado la búsqueda. El numero de ocurrencias siempre es igual o mayor al número de documentos.

[Ejemplo: mi búsqueda es PEDRO ALMODOVAR. Me aparecen tres documentos los cuales contienen las palabras que he insertado en mi búsqueda PEDRO ALMODOVAR. Esos documentos son fichas de tres películas de P.A. Las ocurrencias que me aparecen son tres, pues en esos tres documentos me aparece Pedro Almodóvar como director tres veces.

Otro supuesto: mi búsqueda es PEDRO ALMODOVAR, me siguen apareciendo tres documentos pero con cuatro ocurrencias. Tres de esas ocurrencias es que P.A es director y una cuarta ocurrencia es porque en una de esas tres películas también es productor, por lo que aparecería en un mismo documento el nombre de P.A dos veces. Por lo tanto el nombre de P.A aparece cuatro veces. 3 como director, más 1 de productor].

5.- Qué operadores se podrán utilizar. (Lo vemos más adelante, punto 4.)

6.- Que método se utilizará en la recuperación: Simple o avanzada.

Simple: Suele aparecer la caja de texto. La búsqueda es independiente a los campos, aunque se pueden refinar algunos datos. Hay acceso a una búsqueda avanzada y a otros sistemas como los de navegación.

-Caja de búsqueda (página principal) + ayuda [ejemplo: google]

-Acceso a búsqueda avanzada + acceso a otras opciones (ejemplo: navegación)

Avanzada: También aparece la caja de texto, pero la búsqueda se acota por campos. Además, se pueden usar diferentes operadores para limitar la información. Se usan campos, operadores y otras combinaciones (fecha +, - que, etc.)

-Búsquedas parametrizadas (ejemplo: hacer una búsqueda por campos.)

-Búsquedas con operadores: booleano o lógicos.

Booleanos. De proximidad.

-Búsquedas combinadas de las dos anteriores.

4. OPERADORES

[Sistemas de recuperación de datos] Junto con los Modelos de Recuperación, están los Operadores:

1.- Booleanos: [Seguimos con el ejemplo de Pedro Almodóvar y sus películas: a= Pedro Almodóvar. b= año 2002, en concreto]

-Intersección (a Y b): si le doy estos valores me aparece solo P.A en el 2002, solo las películas de ese año. Me aparecen todos aquellos documentos en los que a y b estén juntos.

-Unión (a O b): si le doy estos valores me aparece todo lo de P.A, todo lo de 2002 y todo lo de P.A en 2002, busca todo. Me busca a O b, o los dos, me busca todo.

La parte de A subrayada es lo único que me muestra. Lo que falta de A y B no me lo muestra. Porque le estas dando la orden de que te muestre uno u o

Lo que va entre paréntesis en una búsqueda de datos, se calcula antes que el resto. Esto evita errores al crear conjuntos de búsqueda, estableciendo un orden de preferencia

A o B y C o D de uno pasa a otro. (A o B) y (C o D): Evita errores al crear conjuntos de búsquedas y establece un orden de preferencias. [Como las operaciones matemáticas, primero calcula lo que hay dentro del paréntesis.] Ejemplo (A o B) es X y (C o D) es J, entonces tenemos que: (A o B) y (C o D) = X y J = H documentos.

  1. ELEMENTO EN UN MODELO TEXTUAL (SGD) [sistema de gestión documental]

¿?

[Elementos que forman parte de un modelo textual, de una base de datos.]

  • Modelo de registro textual, integrado por campos de longitud variable basado en un diccionario de datos.
  • Fichero invertido o inverso. Permiten localizar los registros por los campos recuperables de la base de datos. El archivo invertido se construye a través de los campos recuperables únicamente.
  • Herramientas para controlar el vocabulario como el Diccionario de control de indización. Por ejemplo debemos de contar con un registro de Palabras vacías , así como un registro de sinónimos, autoridades, artículos … para evitar la sinonimia, polisemia, etc. estableciendo relaciones entre palabras del mismo significado para facilitar la búsqueda. El registro de autoridades se utiliza para los nombres. Reúne todas las grafías de un mismo nombre para su uso en la base de datos. Los artículos: el, la, los… los deshecha.
  • (^) Sistema de recuperación basado en los operadores lógicos, boole. Sistema de recuperación basado en relaciones de cadena de caracteres: adyacencia, truncamiento…

[En resumen: Los modelos textuales están formados por: Una serie de operadores para recuperar la información. Un diccionario de datos (que son las características de los campos de mi base de datos). Un fichero inverso o invertido...]

6. PROCESO

Fichero maestro y fichero inverso, proceso de búsqueda. ¿?

La búsqueda se realiza en el fichero inverso, pero puedes ver el documento “original” siempre que quieras en el fichero maestro.

Fichero maestro: en este fichero se encuentran todos los documentos que voy almacenando. Es el fichero original que nosotros hemos creado o crearemos.

Al crear un fichero maestro se crea paralelamente un fichero inverso, el cual refleja el contenido de lo que hemos hecho RECUPERABLE. Cuando realizamos algún tipo de búsqueda, al lugar donde se acude, es al fichero inverso. Es en este fichero inverso, donde se realiza la búsqueda cuando yo entro “x” palabra/s o frases…

Ejemplo: creo una base de datos de libros. En el fichero maestro está todo: autor, titulo, fecha de la edición, fecha de publicación, ISBN… De todos los campos: autor, titulo, ISBN… solamente titulo, ISBN y autor los he hecho recuperables. Pues en el fichero inverso, solo me aparecerán los datos correspondientes a esos campos, autor, ISBN y titulo.

Introducción de datosSecuencialFichero maestroAcceso a documentosFichero inversoPalabrasFrases

información. Repetible: cuando el contenido puede tener más de uno, más de un autor, titulo, ubicación…]

PRACTICA EN CLASE 1 DE OCTUBRE 2012.

Crear la estructura de una base de datos para noticias.

Están los campos formales y los campos de contenido. Empezamos con los campos formales: Autor, Título, Medio, Fecha de publicación, Ubicación, Sección.

Campos o etiquetas : Autor, Título, Medio, Fecha de publicación, Ubicación, Sección.

Dominio: explicación breve de lo que van a tratar los campos. A qué hacen referencia los campos.

Autor : quien ha redactado la noticia; Título: el titular de la noticia. Aunque también podría ser todo el cuerpo de la noticia, e incluiría el antetítulo, el título y el subtitulo.

Medio: medio donde se ha publicado la noticia. Fuente donde se publica: el país, el mundo, Hoy…

Fecha de publicación : hay que especificar a qué fecha estoy haciendo referencia. Ubicación: localización dentro del medio de comunicación. Página o URL donde se encuentra la noticia. Sección: sección donde se ubica la noticia: economía, política, sociedad…

Tipo de datos: Autor: alfanumérico.

Título : alfanumérico.

Medio: alfanumérico. Fecha de publicación: fecha.

Ubicación : alfanumérico. Sección: alfanumérico.

Tratamiento de indización: Autor: recuperable.

Título: NO recuperable. Ya hay otros campos donde se recogen las palabras clave del titular.

Fecha de publicación : obligatorio y no repetible (no puede haber dos fechas para una misma noticia.)

Ubicación: obligatorio y no repetible (no puede estar una noticia en dos sitios.) Sección : obligatorio y no repetible (una noticia o está en economía o está en política, no puede aparecer en dos secciones. Siempre tiene unos tintes más políticos o económicos.) [Género: este campo o etiqueta ella nunca lo va a usar. Haría referencia a si es una crónica, opinión, noticia…]

CAMPOS DE CONTENIDO

Ahora analizaremos los campos de contenido. Estos campos son: Resumen, fecha de la noticia y descriptores. Los descriptores pueden ser: temáticos, geográficos, onomásticos y cronológicos.

Los descriptores nunca pueden ser una frase. Los campos de la estructura siempre se ponen, tengan o no información. Los descriptores SIEMPRE VAN A SER SUSTANTIVOS. Si tengo que crear una expresión de más de un término los uniré mediante preposición o bien adjetivo de un sustantivo, por ejemplo: Desempleo+ Jóvenes, lo convierto en Desempleo juvenil.

También está el identificador: es una forma de limitar la búsqueda. Cuando un caso genera mucha información usamos identificadores, es un tema más, que incluyen todos los subtemas que este caso ha generado. Caso Bretón, caso malaya, operación…

Descriptores onomásticos. Dominio: persona física o jurídica que aparece en la noticia.

Alfanumérico, recuperable, repetible (puede haber más de una persona física o jurídica), no obligatorio (puede que no aluda a nada ni a nadie).

D. geográficos. Dominio: lugar donde el hecho ha ocurrido. Alfanumérico, recuperable, obligatorio (todo ocurre en algún lugar) y repetible (puede haber más de un lugar ). El tratamiento documental sería el siguiente : Pueblo/ciudad*país. Entre ellos se separaran por comas. D. Temáticos. Dominio : diferentes temas dentro de una misma noticia. Alfanumérico, recuperable, repetible y obligatorio. Tratamiento documental sería : los diferentes temas separados por /.

D. Cronológico. Dominio: todas las fechas anteriores en el tiempo a las que se aluden en la noticia, es decir, que se incluyen en el contenido. Fecha (aunque la fecha aparezca con nombre

“8-septiembre”, el tipo de datos es fecha.) No recuperable (Es solo para contextualizar, ya habrá una noticia de ese día que sucedió.) No obligatorio. Si repetible (puede haber más de un caso o hecho ocurrid con anterioridad, mencionado en una noticia). Tratamiento documental DD/MM/ AAAA.

Fecha de la noticia. Dominio: fecha de cuando ocurre el hecho. Fecha, recuperable, obligatorio y no repetible. Tratamiento documental: DD/MM/AAAA.

Resumen. Dominio: breve reseña del contenido. Alfanumérico. No recuperable (en el resumen se le da forma a los descriptores, a los contenidos de los descriptores. Sería duplicar la información si lo hiciésemos recuperable. Ya hemos hecho recuperable a los descriptores.), si obligatorio (siempre lleva información), y no repetible (solo puede haber un resumen de cada noticia). Tratamiento documental: resumen breve del contenido de la noticia en 2 o 3 líneas.

FIN DE LA PRÁCTICA.