Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Informática Documental, Apuntes de Tecnología de la Información

1. Estructura de datos. 2. Organización de los datos en dispositivos de almacenamiento. 3. Las bases de datos. 4. Sistemas de gestión de bases de datos (SGBD). 5. Modelos de datos. 6. Bases de datos documentales. 7. Las bases de datos en una biblioteca. 8. Comunicaciones y redes de ordendores. 9. Acceso automatizado al documento primario.

Tipo: Apuntes

2014/2015

Subido el 19/06/2023

andrexxx-1
andrexxx-1 🇪🇸

3 documentos

1 / 35

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
INFORMÁTICA DOCUMENTAL
PROGRAMA DE LA ASIGNATURA.
1. Estructura de datos.
Introducción. Conceptos básicos.
Concepto y tipo de datos.
Concepto y tipos de estructuras.
Estructuras estáticas.
Estructuras dinámicas.
2. Organización de los datos en dispositivos de almacenamiento.
Registro, concepto y tipo.
Registro físico y registro lógico.
Ficheros.
Operaciones con ficheros.
Organización de ficheros.
Acceso a los ficheros.
3. Las bases de datos.
Sistemas de información.
Características y componentes de un sistema de información.
Sistemas de información orientados a procesos y a datos.
Sistemas de recuperación de información.
Aproximación al concepto de bases de datos.
Niveles de abstracción de una base de datos.
4. Sistemas de gestión de bases de datos (SGBD).
Concepto y principales funciones del SGBD.
Lenguajes de los SGBD.
Lenguajes de definición de datos.
Lenguajes de manipulación de datos.
Interacción del usuario con el SGBD.
5. Modelos de datos.
Concepto de modelo de datos.
Estática y dinámica de un modelo.
Clasificación de los modelos de datos.
Modelos convencionales y conceptuales.
Modelos conceptuales.
El modelo entidad/relación.
El modelo relacional.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23

Vista previa parcial del texto

¡Descarga Informática Documental y más Apuntes en PDF de Tecnología de la Información solo en Docsity!

INFORMÁTICA DOCUMENTAL

PROGRAMA DE LA ASIGNATURA.

  1. Estructura de datos. Introducción. Conceptos básicos. Concepto y tipo de datos. Concepto y tipos de estructuras. Estructuras estáticas. Estructuras dinámicas.
  2. Organización de los datos en dispositivos de almacenamiento. Registro, concepto y tipo. Registro físico y registro lógico. Ficheros. Operaciones con ficheros. Organización de ficheros. Acceso a los ficheros.
  3. Las bases de datos. Sistemas de información. Características y componentes de un sistema de información. Sistemas de información orientados a procesos y a datos. Sistemas de recuperación de información. Aproximación al concepto de bases de datos. Niveles de abstracción de una base de datos.
  4. Sistemas de gestión de bases de datos (SGBD). Concepto y principales funciones del SGBD. Lenguajes de los SGBD. Lenguajes de definición de datos. Lenguajes de manipulación de datos. Interacción del usuario con el SGBD.
  5. Modelos de datos. Concepto de modelo de datos. Estática y dinámica de un modelo. Clasificación de los modelos de datos. Modelos convencionales y conceptuales. Modelos conceptuales. El modelo entidad/relación. El modelo relacional.
  1. Bases de datos documentales. Necesidad y aspectos generales de las bases de datos documentales o sistemas de recuperación (SRI). Recuperación de datos y recuperación de información. Diferencias con las bases de datos relacionales (SGBD). Información estructurada y no estructurada. Características generales de las bases de datos documentales. Registros textuales de longitud variable. Fichero inverso. Lenguaje de interrogación. Características específicas. Diseño de bases de datos documentales. Criterios de evaluación de bases de datos documentales.
  2. Las bases de datos en una biblioteca. Automatización de las tareas de una biblioteca. Módulos de bases de datos en una biblioteca. Adquisiciones. Catalogación. OPAC. Préstamo. Publicaciones periódicas.
  3. Comunicaciones y redes de ordenadores. Concepto de telemática. Sistemas telemáticos. Elementos de software. Elementos de hardware. Redes de ordenadores. Redes de bibliotecas.
  4. Acceso automatizado al documento primario. Sistemas de almacenamiento digital de la información. Captura y digitalización de documentos. Acceso en línea al documento primario. Ventajas e inconvenientes. TEMA 1: ESTRUCTURAS DE DATOS.
  5. Introducción. Conceptos básicos. La información es una representación convencional de hechos, personas, ideas y acontecimientos mediante símbolos (caracteres). Internamente se representa mediante una descodificación, es decir, mediante la representación de elementos de un conjunto que a su vez representan los elementos de otro conjunto. El sistema de codificación utilizado es el sistema binario (0 y 1).

Concepto de estructura de datos : Una estructura de datos es un gran conjunto de datos de una relación que nos permite utilizar grandes cantidades de información y que está definida por las relaciones entre los elementos que la componen. Operaciones : Acceso, insertar y eliminar. Tipos de estructuras de datos (tal y como se utilizan en memoria central)

  1. Estática: Mantiene el mismo tamaño desde el momento en que se crea. La más habitual es la MATRIZ que es un conjunto de datos del mismo tipo almacenados de forma conjunta y en la que se accede a cada uno de los datos mediante un índice que indica su posición en una matriz. Se utiliza para cálculos numéricos. Dinámica: Varía el tamaño de sus datos. La más habitual es la LISTA que es un número variable de datos de un mismo tipo que están ordenados según un criterio lineal. Siempre tienen un elemento que le precede y otro que le sigue (excepto el primero y el último). NOTA : Dentro de la lista existe un puntero que es un dato que apunta a la dirección donde se encuentra otro dato y que contiene las posiciones de memoria de ese dato. Operaciones : Insertar y suprimir elementos en cualquier punto de ella. Ordenar datos. NOTA : La inserción se realiza de la siguiente manera : primero se toma el dato de donde esté almacenado luego se añade a la lista. Existen dos tipos de estructuras de datos relacionadas con la lista : Pilas : estructuras de datos que sólo permiten insertar o eliminar elementos por un extremo de la misma. Son conocidas como listas FIFO. Colas : solo permiten añadir elementos al final de ella. Son conocidas como listas LIFO. TEMA 2: ORGANIZACIÓN DE LOS DATOS EN DISPOSITIVOS DE ALMACENAMIENTO. Estructuras de datos en dispositivos de almacenamiento. La principal estructura que se utiliza para almacenar los datos en dispositivos de almacenamiento son los ficheros, cuya organización se

basa en la de los ficheros manuales.

  1. Concepto de fichero. Tipos de ficheros. Operaciones con un fichero. Organización de un fichero. Parámetros de un fichero. Concepto de fichero. Conjunto de información sobre un mismo tema y organizada de forma que permita el acceso. Se compone de registros. 1.2. Tipos de ficheros. Existen dos clases:
    1. Permanentes son los que contienen información relevante para el programa. Existen tres clases de ficheros permanentes : Fichero maestro : contiene los datos indispensables para el funcionamiento de una aplicación determinada y muestra el estado actual de la misma, por ejemplo. el catálogo de una biblioteca. Fichero constante : contiene un tipo de datos de carácter fijo, por ejemplo, un fichero que contuviese un alista de autoridades. Fichero histórico : es el fichero donde van los registros eliminados del fichero maestro.
    2. Temporales : contienen información relevante para determinado programa, pero no para la aplicación en su conjunto. Sus datos proceden de los ficheros permanentes, como por ejemplo: una consulta. Existen dos tipos de ficheros temporales : Intermedios : son los que almacenan resultados de un programa que han de ser utilizados por otro programa en una misma aplicación. De resultados, en los que se almacenan ficheros elaborados que se destinan a un dispositivo de salida (impresora...etc.) 1.3. Operaciones con un fichero. Creación: consiste en definir su estructura (campos, longitud de los campos, clave...). Actualización: Consiste en tres operaciones: Inserción de registros: Introducir los datos correspondientes. Borrado: Suprimir uno o varios registros. Modificación: Cambiar la información correspondiente a uno o varios registros. Consulta: Cualquier acceso a uno o varios registros para conocer su información o tratarla. 1.4. Organización de un fichero.

Volatilidad: Mide la importancia relativa de los procesos de adición y borrado. Es el porcentaje de registros añadidos y borrados a un fichero entre el nº total medio de registros. La volatilidad nos indica si un fichero tiene una gran rotación de datos, ello nos indica algo sobre la información del fichero en cuestión. Un fichero que tuviese baja volatilidad y alto crecimiento es un fichero que no se renueva, por ejemplo, un catálogo. Un fichero que tuviese alta volatilidad y bajo crecimiento tendría gran movilidad de datos, por ejemplo un fichero de alumnos de una universidad. EJERCICIO : Un fichero contiene registros de 10 campos cada uno. 5 de ellos con longitud de 50 bytes y los otros 5 con longitud de 100 bytes. Inicialmente tiene 4.000 registros y mensualmente se añaden 200, se borran 20, se modifican 40 y se realizan 100 consultas. Calcular el volumen del fichero al cabo de un año y los índices de crecimiento, volatilidad y actividad. RESPUESTA:

  1. Al cabo de un año el fichero tendrá 3.000. (5 * 50 + 5 * 100) * 4.000 = 3.000. El índice de crecimiento será de un 54 %
  • 4.000 = 2.
  • -------- 4. ( x = 54 % x - --------- 100 El índice de volatilidad. Mes: 200 - 20 = 180 * 12 = 2.160 + 4.000 = 6.160 * 750 = 4.620.
  • 6.160) / 2 = 5. 200 * 12 = 2.400 ( (2.400 * 100) / 5.080 = 47% 20 * 12 = 240 ( (240 * 100) / 5.080 = 47 % TOTAL: 47 % + 47 % = 517 % El índice de actividad. Mes: 40 * 12 = 480

Mes: 100 * 12 = 1. TASA DE MODIFICACIÓN: (480 * 100) / 5.080 = 9`4 % TASA DE CONSULTA: (1.200 * 100) / 5.080 = 236 % TOTAL: 94 % + 236 % = 33 % Concepto de registro. Tipos de registros. Registro lógico y registro físico. Concepto de registro. Estructuras de datos que contiene información relativa a un mismo ente. El registro se subdivide en campos. Tipos de registros. Existen dos tipos de registros : De longitud fija Es en el que al configurar el fichero se le asigna un determinado tamaño en bytes y lo mantiene a no ser que el registro sea modificado. Esto es así independientemente de la cantidad de información que contenga (Access). De longitud variable. En éstos el programa mide la cantidad de información de los registros y adapta su tamaño a ellos (bases de datos documentales = Knosys). Registro lógico. y registro físico Registro Lógico Es la información organizada tal como la percibe el usuario por medio del programa. Registro Físico Son los bloques de información que la memoria transfiere desde la unidad de almacenamiento masivo hasta la memoria central del sistema para procesarlos.

  1. Campos y tipos de campos. 3.1. Campo. Estructura que contiene un dato individual acerca de la entidad de la que trate.

Está orientado a la consecución de unos objetivos. Es siempre la parte de otro sistema de mayor envergadura. El sistema está limitado de forma natural o artificial (lo que está fuera de sus límites es lo que se llama entorno del sistema y es de aquí de donde el sistema se nutre (entradas) y hacia donde devuelve sus resultados (salidas). Concepto de sistema de información. Conjunto de elementos relacionados entre sí de acuerdo a ciertas reglas que aporta a la organización y que sirve la información necesaria para el logro de sus fines. Debe recoger, almacenar, y procesar datos de la propia organización y de fuentes externas facilitando la elaboración y presentación de los mismos. 1.2. Características. Posee las mismas características que un sistema cualquiera. Está orientado a la consecución de unos objetivos. Es siempre la parte de otro sistema de mayor envergadura. El sistema está limitado de forma natural o artificial (lo que está fuera de sus límites es lo que se llama entorno del sistema y es de aquí de donde el sistema se nutre (entradas) y hacia donde devuelve sus resultados (salidas)). Componentes de un sistema de información.

  1. Contenido (datos). Referenciales. Factuales. Estructurados. No estructurados. Equipo físico (hardware). CPU Equipos periféricos. Soporte lógico. Sistema operativo. Gestión de bases de datos. SGBD. SRI. Control de comunicaciones. Administrador. Área de datos. Área informática.

Usuarios. Informáticos. No informáticos. EXPLICACIÓN : Los datos referenciales y factuales se diferencias desde un punto de vista documental siendo los referenciales los que contienen descripciones donde se encuentra la información, pero no en sí misma (una ficha de una biblioteca) y los factuales los que contienen la información buscada en sí misma y permiten la utilización de la misma (base de datos con texto completo), dividiéndose a su vez en datos estructurados (datos con formato en los que los campos ocupan posiciones y longitudes fijas) y en datos no estructurados (formato o longitud no fijos). El equipo físico son los ordenadores y los equipos periféricos son el teclado, la impresora... El soporte lógico es el conjunto de programas que funcionan sobre el equipo físico y nos permite representar los datos y los SGBD tratan con datos estructurados y los SRI tratan con información textual. El administrador no siempre tiene que ser una persona pues puede referirse a una función. Se ocupa de la gestión y vigilancia de los datos en los sistemas de información a los que acceden diversos usuarios. Para ello utiliza las funciones de definir y modificar las estructuras de datos, autorizar el acceso de determinados usuarios a determinados datos, la seguridad de los datos, el almacenamiento físico de los mismos y se ocupa también de hacer copias de seguridad y de la elaboración de estadísticas del sistema. Los usuarios son personas que acceden y usan la información. Los informáticos suelen ser analistas, programadores. Los no informáticos utilizan la información porque la necesitan. Sistemas de información orientados a procesos y a datos. Hay fundamentalmente dos clases de sistema de información desde el punto de vista del tratamiento informático que se hace de los datos : Sistemas orientados a procesos de datos. Sistemas orientados a datos. Sistemas orientados a procesos. Es el primer sistema utilizado para el tratamiento de la información. Se denominan también sistemas de ficheros donde se almacenaba la información relativa a una entidad para realizar una aplicación. Unos mismos datos se recogen varias veces en distintos ficheros y se gestiona

datos pero no los programas). Incrusión o eliminación de datos sin alterar el programa. Existe una mejor disponibilidad de los datos para el usuario. Existe una mayor eficacia en la recogida de datos. La descripción de los datos va almacenada junto a los mismos datos. Reducción del espacio de almacenamiento. Desde el punto de vista de los resultados. Como los datos se recogen sólo una vez los programas utilizan siempre los mismos datos por lo que son homogéneos y comparables. Al desaparecer la redundancia las tareas de actualización son únicas. Los resultados que se obtienen del tratamiento posee un valor informativo ya que la base de datos no recoge únicamente los datos relativos a determinadas entidades sino que además recoge las interrelaciones entre ellos. Desde el punto de vista de los usuarios. Ofrece más posibilidades para compartir el conjunto de datos al estar almacenados solo una única vez. INCONVENIENTES: Relativas a la implantación. Costosa en material y en software. Larga y difícil. Ausencia de normas. Rentabilidad a medio plazo. Relativas al usuario. Personal especializado (difícil de encontrar, y fácil de perder). Desfase entre teoría y práctica. Riesgo de frustración. CARACTERÍSTICAS : Redundancia: Un dato d1 es redundante cuando conocidos los valores de otros datos, (d a dn) los primeros son deducibles a partir de los segundos y se encuentran almacenados junto a él. Hay dos tipos: Física: Se produce cuando los mismos datos son almacenados en lugares distintos de los datos que van a ser procesados. Lógica: Es la que se crea en la memoria del ordenador. Se recurre a la memoria para comparar datos o realizarlos. Se intenta obtener la mínima redundancia posible.

Independencia: Física: Se refiere a la capacidad del usuario para efectuar cualquier modificación en el soporte físico del fichero. Lógica: Se refiere a la capacidad del usuario para modificar los contenidos de la base de datos y los ficheros que hay en ellos. Flexibilidad: Se refiere a los tiempos de respuesta que obtiene un usuario cuando consulta una base de datos independientemente del método de acceso utilizado. Se trata de obtener una gran flexibilidad con tiempos de respuesta pequeños. Acceso Múltiple: Se refiere a la capacidad de varios usuarios par acceder de forma simultánea a la base de datos sin que ello provoque conflictos ni versiones diferentes. Uso múltiple: Capacidad de los usuarios para tener distintas visiones particulares. Seguridad: Capacidad del sistema para protegerse respecto a accesos no autorizados, para evitar así la posible manipulación o destrucción de los datos. Confidencialidad: Es el derecho que tenemos todos para determinar cuando como y en qué circunstancias se transmiten datos que nos afecten. Integridad de los datos: Se refiere a la capacidad de los sistemas para protegerse contra posibles errores o daños que se pudieran producir en los datos. Estos pueden venir por fallos del hardware, del software, por una indexación incompleta de los datos... Las bases de datos deben tener siempre mecanismos para recuperar los datos originales anteriores al error. Capacidad de búsqueda:

El sistema de gestión de bases de datos es un conjunto integrado de programas, procedimientos y lenguajes que suministra a distintos tipos de usuarios los medios necesarios para describir y manipular los datos almacenados en una base de datos y garantizar su seguridad. Este sistema debe de tener suficiente flexibilidad para atender las necesidades de los distintos usuarios y permitir que se manifiesten las ventajas de la base de datos. 4.1.2. Operaciones Un SGBD puede efectuar dos tipos de operaciones, las que afectan a todos los datos almacenados en la base de datos (creación de una base de datos, modificación de la estructura y consulta de toda la base de datos) o aquellas que sólo afectan a determinados registros (inserción, borrado, modificación de registros y consulta selectiva en vez de recuperar aquellos que cumplen determinadas condiciones). 4.1.3. Funciones. La descripción de los datos mediante la descripción de la estructura de datos, sus relaciones y su integridad realizando estas funciones en los tres niveles: externo, lógico global e interno. La manipulación de datos permite buscar datos mediante la consulta o la recuperación, insertar, eliminar y modificar datos. Esto supone que es necesario definir los criterios de selección, la estructura externa a recuperar y el acceso a la estructura física. El control o procedimientos del administrador determina la capacidad de ficheros, las estadísticas de utilización, la carga a ficheros, las copias de seguridad y las autorizaciones de acceso a datos. EXPLICACIÓN: La descripción El SGBD debe permitir a quién lo diseña especificar que datos lo van a integrar: tipo de datos, relaciones entre ellos, características de su almacenamiento físico y su presentación a los usuarios , es decir, proporcionar los medios para definir los tres niveles de abstracción. Definir el nivel interno consiste en determinar el espacio de almacenamiento (pistas, volúmenes, sectores, punteros...) y los sistemas de acceso a esos datos. Definir los otros dos niveles consiste en proporcionar instrumentos para definir los objetivos, las tablas, las entidades, registros, campos, así como las relaciones entre estos datos y las restricciones de integridad.

La manipulación Consiste en una serie de operaciones que pueden afectar a la totalidad o una parte determinada de datos. La necesidad de recuperación y actualización se debe a que la realidad es cambiante y esto implica una modificación. Cuando se recupera información bien sea de manera global o selectiva es necesario también que el sistema nos permita definir la estructura lógica externa que se desea recuperar. Cuando se hacen estas recuperaciones el sistema también accede a la estructura física localizando los registros y seleccionando la información que cumple la condición de búsqueda y por último los pone a disposición del usuario. Las consultas a la base de datos se pueden hacer de manera total o parcial. La actualización de la base de datos se puede realizar mediante la inserción, el borrado (función de manipulación) o la modificación. NOTA: Las operaciones de manipulación pueden referirse a actividades, por ejemplo el préstamo de libros en una biblioteca. La modificación consiste en modificar registros. El control o procedimiento del administrador Este control se encarga de determinar la capacidad de los ficheros, las estadísticas relacionándolas con el crecimiento de un determinado fichero. 4.2. Lenguajes de los SGBD. Para efectuar estas funciones el sistema utiliza lo que se denomina lenguaje de los SGBD que permite la comunicación de los usuarios con el sistema. Un lenguaje natural es un conjunto de caracteres con unas reglas que permite comunicar información. Un lenguaje artificial es un lenguaje muy delimitado y estricto en cuanto a la organización y concebido para generar y/o expresar programas (secuencias de instrucciones aptas para ser procesadas por un ordenador). Existen dos tipos de lenguajes: NOTA: Estos dos lenguajes actúan en los tres niveles de que consta la

Son aquellas personas que acceden a los datos porque necesitan la información para hacer un trabajo. A este usuario lo que le interesa es su contenido, no la estructura sino las relaciones. Estos usuarios utilizan lenguajes de manipulación de datos para comunicarse. NOTA: No tiene posibilidad de modificar la base de datos. TEMA 5: MODELOS DE DATOS

  1. Concepto de modelos de datos. Los modelos de datos son una representación de una parte de la realidad. Esta representación se hace con el fin de comprenderla, interpretarla y actuar sobre ella. Un modelo de datos es un conjunto de conceptos que permiten describir en determinados niveles de abstracción la estructura de una base de datos. De estos niveles el que ha nosotros nos interesa el nivel global que es el que representa los datos y la estructura general de la base de datos.
  2. Estática y dinámica de un modelo. Los modelos de datos tienen propiedades estáticas y dinámicas. 2.1. Estática de un modelo. La estructura estática es la estructura que permanece invariable en el tiempo. Ésta es la que nosotros llamamos la estructura de la base de datos. Está constituida por los siguientes elementos: 1. Objetos: entidades o registros. 2. Asociaciones entre objetos (relaciones). 3. Las características de esos objetos (atributos o campos). 4. Restricciones: serie de limitaciones y condicionamientos en las estructuras y valores de un modelo. Existen restricciones propias del modelo (este modelo es llamado relación inherente). existe otro tipo que es

un reflejo de las limitaciones del mundo real (ejemplo: un libro sólo puede tener un título). 2.2. Dinámica de un modelo. La parte dinámica de un modelo de datos es el conjunto de operaciones que se hacen con los datos para producir información (consulta, inserción, borrado y modificación).

  1. Clasificación de los modelos de datos. Se distinguen dos tipos de modelos de datos: los modelos conceptuales y los modelos convencionales. 3.1. Los modelos conceptuales. Son llamados también de alto nivel. Permiten la descomposición global del conjunto de la información de una organización con independencia del ordenador (tanto del hardware como de los programas). Los conceptos que maneja un modelo conceptual son conceptos del mundo real, es decir, son modelos de análisis. permiten una primera aproximación a la realidad que queremos manejar con un sistema informático. 3.2. Los modelos convencionales. Estos modelos están orientados a describir los datos a un nivel apto para ser gestionado por un SGBD. Éste es un modelo más próximo a la manipulación informática, porque permite desarrollar un sistema concreto de una base de datos que funcione con una determinada máquina y que se pueda gestionar mediante un programa de SGBD.
  2. Modelos conceptuales concretos. 4.1. Modelo entidad / interrelación. Este modelo es el más empleado para el diseño de la base de datos. Este modelo conceptual sólo tiene estructura estática. Es un aproximación a la realidad. Sus componentes son:
    1. Entidad: es cualquier persona, cosa, lugar, concepto, suceso de interés para la actividad de una determinada organización. Una entidad es un objeto acerca del cual queremos almacenar información. Al considerar una entidad tenemos que distinguir entre tipo de entidad y ocurrencia de entidad. El tipo de entidad es la definición genérica de esa entidad,