




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
APUNTES SOBRE LAS BASES DE DATOS UTILIZANDO SQL COMO LENGUAJE DE CONSULTA
Tipo: Apuntes
1 / 180
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































Dpto. de Lenguajes y
Sistemas Informáticos
Además proporciona la base formal lógica para introducir los lenguajes lógicos de interrogación, el Cálculo Relacional de Tuplas y el Cálculo Relacional de Dominios. En el capítulo 4 se introduce el lenguaje SQL, y en el capítulo 5 se profundiza en el concepto de sistema de gestión de bases de datos. El libro contiene numerosos ejemplos y ejercicios resueltos.
El libro ha sido realizado por un grupo de profesores de Bases de Datos de la Universidad Politécnica de Valencia y recoge su experiencia en la enseñanza de esta materia. Es por este motivo que se ajusta globalmente al enfoque docente propuesto en la asignatura, y tiene especial aplicación en las unidades 1, 2, 3, 4, y 7 del temario, aunque no incluye información sobre aspectos de normalización (unidad 5), ni sobre la organización física de una base de datos (unidad 6), y puesto que se basa en el modelo de datos relacional, no incluye información para el seguimiento de la unidad 8 del temario de la asignatura relativa al modelo entidad-relación.
Este libro es la traducción en castellano de la séptima edición del texto Date, ed. 2000 que revisa actualiza y mejora ciertos aspectos contemplados en la versión previa Date, ed. 1993. El libro se organiza en seis partes principales. La parte I proporciona una amplia introducción a los conceptos básicos de las bases de datos, adaptándose al temario propuesto en la unidad 1 de la asignatura, e incluyendo información acerca de los sistemas de gestión de las bases de datos, adaptándose al propuesto en la unidad 7; la parte II aborda el modelo relacional de datos incluyendo información actualizada y revisada respecto a la 5ª edición, lo que lo hace más recomendable en este sentido para el alumno (unidades 3, 4 y 5 del temario); la parte III trata la teoría general del diseño de bases de datos incluyendo información acerca de la teoría de la normalización (unidad 5 del temario) y del modelo entidad-relación (unidad 8 del temario); la parte IV profundiza en los aspectos de recuperación y concurrencia y la V en otros aspectos entre los que se incluye el de la seguridad, lo que las hace recomendable a ambas para la extensión de los conocimientos que los alumnos han manejado en la unidad 7 del temario. Finalmente, la parte VI se dedica a la descripción del impacto de la tecnología orientada a objetos en los sistemas de bases de datos, lo que puede servir para iniciar al alumno hacia la enseñanza que se mostrará en la asignatura de Bases de Datos Avanzadas (optativa).
Tercera edición de otro de los libros clásicos en bases de datos. El texto contiene seis partes principales en las que abarca la gran parte de los aspectos necesarios para la enseñanza de las bases de datos. En concreto, la parte I se centra en los conceptos básicos de los sistemas de bases de datos, y la parte II en el modelo relacional de datos, siendo ambas especialmente recomendables para abarcar la enseñanza de la asignatura de Bases de Datos I. De este texto se destaca además el rigor y la extensión con los que trata cualquiera de los temas, y además las frecuentes referencias a ejemplos sobre sistemas de gestión de bases comerciales como Oracle y Microsoft Access. También se destaca la profundidad con la que se trata el modelo entidad-relación con un frecuente uso de ejemplos, así como la cobertura de otros aspectos relativos a tecnologías emergentes (novedad de esta tercera edición) sobre las bases de datos como los relativos a los almacenes de datos, tecnologías Web, multimedia y bases de datos distribuidas. Estos aspectos son brevemente introducidos durante la unidad 1 del temario y serán analizados con mayor profundidad en la asignatura Bases de Datos Avanzadas (optativa).
Este libro es una versión revisada, ampliada y corregida de un texto anterior que con el mismo título fue escrito por los mismos autores korth93. En esta revisión se ofrece un marco completo de los fundamentos y diseño de las bases de datos, sus lenguajes de acceso y las diversas técnicas de implementación de bases de datos. Además incluye numerosos ejercicios después de cada tema que ayudan a la asimilación de los contenidos, así como frecuentes ejemplos para apoyar las diferentes explicaciones. Este libro se puede considerar como básico para el seguimiento de la asignatura ya que contiene un tratamiento elemental sobre todos y cada uno de los aspectos propios de las bases de datos, y además proporciona algunos aspectos más avanzados que pueden ser usados por el alumno como complemento a su enseñanza teórica o como introducción a otras asignaturas más avanzadas sobre las bases de datos.
Se destacan de este libro los capítulos 1 al 5 que contienen la introducción a las bases de datos, el modelo entidad-relación y posteriormente el desarrollo del modelo relacional encajando perfectamente en las unidades 1, 3, 4 y 8 del temario de la asignatura, aunque lo hace de una forma bastante elemental. Más interesantes resultan los capítulos 10 al 21 en los que se tratan los aspectos más avanzados de los sistemas de gestión de las bases de datos, desde el acceso físico a los datos pasando por aspectos como el procesamiento de las consultas, transacciones, concurrencia, seguridad, arquitectura, acceso cliente/servidor y bases de datos distribuidas, que permitirán al alumno profundizar en los temas mostrados en las unidades 6 y 7 del temario de la asignatura. Especialmente se destaca el capítulo 4 que realiza un estudio tanto teórico como práctico del lenguaje SQL lo que servirá al alumno para aclarar conceptos y problemas que se le presentan en las sesiones prácticas de la asignatura.
Sin embargo, el libro adolece de una falta de profundidad en el tratamiento del concepto de modelo de datos del que únicamente se presentan brevemente las diferencias entre los modelos de datos más tratados. Aún así puede ser considerado como una obra básica para la asignatura.
Introducción a las bases de datos
3
I1. introducción intuitiva
Pongamos como ejemplo un caso sencillo: queremos mantener de forma electrónica una lista con los discos que hemos comprado a lo largo de estos años. Tenemos un ordenador y un programa que nos permite almacenar la lista como se presenta a continuación. autor Título format año tipo COCTEAU TWINS Victorialand CS 86 Ambient BJÖRK Post CD 95 Pop BLACK CROWES Amorica CD 94 Rock BLUE NILE,THE High CD 04 Pop BOB MOULD CD 96 Independientes BLUR Leisure CD 90 Pop BUD POWELL Jazz Time CD Jazz CANDY DULFER Saxuality CS 93 Fusión CHURCH,THE The Blurred Crusade LP 82 Pop COCTEAU TWINS Blue Bell Knoll CD 88 Ambient CURVE Pubic Fruit CG Independientes COCTEAU TWINS Milk And Kisses CD 95 Ambient CODE BLUE Code Blue LP 80 Pop COP SHOT COP Ask Questions Later CD 93 Independientes COMITE CISNE Dulces Horas(Maxi) LP 85 Pop COMPLICES La Danza De La Ciudad CD 90 Pop CONSTANCE DEMBY Novus Magnificat CD 86 Nuevas Músicas CULT, THE Sonic Temple CD 89 Hard Rock CURVE Doppelgänger CS Nueva Psicodelia
La lista es muy sencilla, y está detallada por autor del volumen, título, año de publicación, formato en que lo tenemos disponible en nuestra discoteca (CD es disco compacto, CS es cassette, y LP es disco en vinilo), y una clasificación propia del estilo de música que contiene. ¿Para qué necesitamos almacenar los datos de esta manera? A lo largo del tiempo hemos ido adquiriendo más y más discos, y nos gusta intercambiar música con nuestros amigos (como se hacía antes, de forma inocente y legal, según lo que se entiende por legal hoy en día). Es más práctico dar una lista en papel, o enviarla por correo electrónico para que éste elija lo que más le guste, en vez de invitarle a casa y que él se lleve los discos viéndolos directamente en el estante; nuestro amigo también nos proporcionaría su propia lista para hacer nosotros lo propio. Precisamente en este punto, cuando la cantidad de discos es grande, hacer dicha lista no es tan fácil. Podemos pensar que lo normal es comenzar a confeccionarla un día y anotar en ella las nuevas adquisiciones a medida que van llegando. Más tarde, si alguien nos la pide, podemos fotocopiarla y proporcionársela. Sin embargo, es evidente que la lista no está ordenada bajo ningún criterio, salvo si nos hemos tomado la molestia de, cuando creamos la lista, anotar la información ordenada por autor, por ejemplo. No obstante, las nuevas entradas de la lista estarán desordenadas puesto que las anotamos al final de esa lista. Además, con la cantidad de discos que manejamos, es fácil que tengamos descripciones de discos repetidas, o mal catalogadas, o con el año equivocado; ¿qué hacemos?: ¿un borrón, escribir encima, escribirla a lápiz para poder borrar y rectificar? Un día, un amigo nos pide una lista de los discos que tenemos, pero sabemos que lo que le gusta es el guitarreo y el ruido, lo que nosotros catalogamos
Introducción a las bases de datos
5
momento a quien le prestamos los discos, con lo que todo sería una única base de datos. El SGBD nos facilita un interfaz para introducir nuestra información desde teclado o cualquier otro periférico que lo permita, y procesar después esa información para obtener informes de cualquier tipo. Por ejemplo nos puede interesar tener un listado ordenado por autor y otro por tipo de música. Otro informe puede que sólo tenga la información del autor, título y año de publicación del disco. La ventaja estriba en que la información sólo la hemos introducido una vez, y es el propio sistema de gestión de base de datos el que, según nuestras necesidades, se encarga de clasificar esa información cada vez que le pedimos un listado. Además, si nos hemos equivocado en el año de publicación de un disco, simplemente lo modificamos y en los siguientes listados ya saldrá corregido. Si quisiéramos borrar un disco, porque se nos haya perdido o roto, tampoco es un problema: simplemente, cuando el SGBD vaya a realizar un nuevo listado no se encontrará con ese disco entre los datps que maneja.
Figura 1.2. Ejemplo de consulta a la base de datos mediante una sentencia SQL.
El fundamento de toda BD se encuentra en el análisis y el diseño. Al SGBD se le han de proporcionar dos cosas: los datos y la forma en que los vamos a almacenar. Es decir, un disco musical, para nosotros, es un objeto que tiene como características que lo diferencian de otro disco conceptos tales como la información del autor, el título, el año de publicación, el formato del disco y el tipo de música que contiene. Debemos, antes de nada, darle al SGBD estos conceptos con su correspondiente tipo de datos: si es un número, si es una cadena de caracteres, si es una fecha, etc. Una vez hecho esto, ya podemos introducir los datos de nuestros discos. De la misma forma, una vez que se han introducido los mismos, podemos realizar consultas sobre los datos almacenados basándonos en los objetos definidos.
BD1 2006-
6
I1.1. Sistema de Gestión de Base de Datos
Un SGBD es un programa de ordenador que facilita una serie de herramientas para manejar bases de datos y obtener resultados (información) de ellas. Además de almacenar la información, se le pueden hacer preguntas sobre esos datos, obtener listados impresos, generar pequeños programas de mantenimiento de la BD, o ser utilizado como servidor de datos para programas más complejos realizados en cualquier lenguaje de programación. Además, ofrece otras herramientas más propias de la gestión de BD como sistemas de permisos para autorización de accesos, volcados de seguridad, transferencia de ficheros, recuperación de información dañada, indización, etc. En general, un SGBD es un software de BD que
Hay muchos tipos de SGBD, pero la mayor parte de los utilizados comercialmente en la actualidad son relacionales , es decir, se basan en una cierta teoría o forma de representar los datos para implementar sus herramientas e interfaces, en este caso el modelo relacional. Entendemos por representación de los datos como la forma en que se presentan al usuario y que permiten ciertas operaciones para poder manejarlos. De hecho, en estos SGBD, la información se presenta en forma de tablas (“relación” es el término formal), con columnas para las características de los objetos o conceptos que pretende representar la tabla, y filas para cada caso concreto o instancia de objeto. Existe un lenguaje considerado como estándar para manejar esas tablas, el SQL , que permite crear y modificar tablas, y consultarlas, introducir nuevos datos, modificar los ya almacenados, o borrarlos. Al decir que un SGBD es relacional, estamos hablando de que, como mínimo, sigue todas las reglas y conceptos propuestos por el modelo relacional. El modelo relacional se basa en la teoría de conjuntos y es, por tanto, un modelo con un fundamento matemático. Este modelo maneja una estructura de datos, la relación (concepto matemático que se representa “físicamente” como una tabla ), y unos operadores definidos sobre ella.
2 Nos referimos a las bases de datos centralizadas. En otras asignaturas se profundiza en el concepto de bases de datos distribuidas.
BD1 2006-
8
I2. evolución de las técnicas de
procesamiento electrónico de la
información
I2.1. sistemas de información mecanizados tradicionales.
Veamos ahora, de una forma muy sucinta, cuales fueron los inicios de los sistemas de información mecanizados. Éstos han ido evolucionando hasta el presente al ritmo de las innovaciones tecnológicas tanto en hardware como en software. El hecho de disponer de una determinada tecnología siempre conlleva ciertas ventajas sobre los sistemas anteriores, y una serie de limitaciones impuestas por las posibilidades de la técnica de ese momento. Todo se traduce en una carrera en la que se solucionan problemas y carencias para mejorar la calidad, prestaciones, flexibilidad y seguridad de nuestro sistema de información, a la vez que la mayor exigencia y las nuevas necesidades de los usuarios plantea nuevos problemas no previstos o no abordables en un momento dado. Los sistemas de información basados en archivo convencional se apoyan en las distintas organizaciones de fichero: secuenciales, directos (direccionamiento directo, calculado), indexados, invertidos... Estas organizaciones llevan aparejados unos métodos de acceso a los registros particulares: el acceso secuencial recorre todos los registros hasta encontrar el buscado; el indexado puede acceder en un solo paso al registro si estamos buscando por un campo clave. Para el manejo de estos ficheros los sistemas operativos llevan integradas rutinas que facilitan las operaciones básicas: inserción, borrado, modificación y recuperación. Para entender mejor el origen y necesidad de las bases de datos es interesante analizar las características del sistema tradicional. La característica básica de estos sistemas es que los ficheros se diseñaban para un programa concreto. Esto los hace muy eficientes en principio, pero los problemas aparecen cuando hay que ampliar o modificar el sistema inicial. Puesto que la definición de los datos está dentro de cada programa de aplicación, cualquier alteración de la estructura de los ficheros que manejan nos obliga a recompilar todos los programas que utilicen esos ficheros, o bien construir nuevos programas que utilicen nuevos ficheros con información replicada o calculada en base a los antiguos. La solución más rápida y fácil suele ser construir nuevos programas y ficheros con información redundante, más si se piensa en sistemas grandes donde cada departamento representa un conjunto de usuarios con una visión parcial de la Organización (la que es necesaria para su propio cometido), y por lo tanto, con un conocimiento parcial del sistema global. Por ejemplo, en una Universidad, la sección de Personal, la secretaría del Centro y el Departamento tienen una visión distinta de los datos almacenados sobre un empleado docente, algunos comunes a todos (nombre, dirección, categoría, ...), pero otros únicamente útiles para una de ellos. La información sobre cuenta bancaria, estado civil o número de hijos es necesaria para Personal, pero no las asignaturas impartidas por el profesor o su horario. Esta distinta perspectiva de la organización es la que conduce en muchos casos a desarrollar aplicaciones separadas con ficheros propios.
Introducción a las bases de datos
9
En definitiva, todos ellos manejan información que pertenece a la organización, pero el desarrollo de los tratamientos de esos datos se realiza independientemente de los otros usuarios, de tal forma que cada aplicación es un objeto autónomo. Puestas así las cosas, es fácil que nos encontremos, en un sistema de información mecanizado basado en archivo convencional, con los siguientes problemas:
Pasamos ahora a describir cada uno de estos puntos.
I2.2. deficiencias de los sistemas basados en archivo convencional
El desarrollo de las aplicaciones no termina nunca. Las necesidades de la organización son cambiantes y evolucionan con el tiempo. Esto quiere decir que siempre se están creando nuevas aplicaciones y modificando las existentes. En un sistema de ficheros tradicional, cada programa lleva su propia definición de datos y maneja sus propios ficheros. Además, suelen ser varios los programadores que las realizan, bien en el mismo período de tiempo, o porque se van sustituyendo unos a otros. El resultado fue, habitualmente, que muchos ficheros utilizados por diversos programas almacenaban la misma información. Y no solo eso, sino que la mayoría de las veces no recibían el mismo nombre ni coincidían los tipos de datos. Por ejemplo, un campo ciudad (cadena de 20 caracteres de longitud) en un fichero, se llamaba localidad en otro y podía tener una longitud mayor que la primera. Evidentemente, es la falta de control sobre los datos que generaba la empresa lo que llevaba a estas situaciones. Una persona o equipo que se dedicara a supervisar todas las aplicaciones podría intentar mejorar este problema. En realidad, estos sistemas no son los adecuados para la tarea por lo costoso que resultaría tal control (y así aparecerán las técnicas bases de datos). Aunque cada aplicación gestiona información propia, siempre hay datos comunes a varias aplicaciones. Al estar estos datos almacenados en ficheros independientes se produce redundancia dentro del sistema de información, lo que genera situaciones indeseables:
Introducción a las bases de datos
11
rechazados. Tradicionalmente se recurre a copias de seguridad de los ficheros afectados.
En resumen, las características de los sistemas basados en archivo convencional adolecen de los siguientes problemas al incrementarse las exigencias y el volumen de datos:
Podemos decir que esta situación es la que “obliga” a replantear la forma de gestionar grandes volúmenes de datos, buscando principalmente la independencia de las aplicaciones respecto de la representación física de los datos almacenados. Nacen entonces las técnicas de bases de datos , que se abordan en el siguiente tema.
BD1 2006-
12
1ª generación
(Desde mediados de los 40 a mediados
de los 50)
2ª generación
(Desde mediados de los 50 a mediados
de los 60)
3ª generación
(Desde mediados de los 60 a mediados de
los 70)
4ª generación
(Desde mediados de los 70 a
mediados de los 80)
5ª generación
(Desde mediados de los 80
a mediados de los 90)
Modelos de datos
o^
Modelo jerárquico o^
Modelo red
o^
Modelo relacional
o^
Modelos semánticos o^
M. Orientados a
Objetos o^
...
Dispositivos dealmacenamiento
o programas + datos o tarjetas perforadas o Cintas magnéticas (1945)
o Discos magnéticos
o^
Tambores o^
SGI o^
Discos
o^
o
Productos
o^
IDS de General Electric (1965) o^
BOMP, DBOMP, CFMS de IBM o^
TOTAL de Cincon (1971) o^
IMAGEN de HP o^
ADABAS de Software AG o^
SYSTEM 2000 de MRI o^
SGBD IMS/1 de IMB (1969) (Modelo
jerárquico) o^
Sistemas de red CODASYL (1969-71) o^
IDS/2 de Honeywell o^
DMS-1100 de Univac o^
IDMS de BF Goodrich o^
DBMS de Digital
o^
INGRES de la U.Berkeley
(1973-77) o^
System R de IBM (1974-78) o^
INGRES de RTI (1980) o^
SQL/DS de IBM (1981) o^
ORACLE de RSI (1981) o^
DB2 de IBM (1983) o^
RDB de Digital (1983)
o^
ORION de MCC o^
OpenOODB de TI o^
IRIS de HP o^
Gemstone de
ServioLogic o^
ONTOS de Ontologic o^
O2 de O2 Tech. o^
ObjectStone de Object
Design o^
CORAL de U.
Wisconsin o^
LDL de MCC
Acceso de datos
o Ficheros secuenciales
o Ficheros de a. directo o Ficheros indexados o Ficheros hash
o^
Ficheros integrados o^
Ficheros invertidos o^
Ficheros secuencial-indexado
Avances destacados de
la generación
o Gestión de datos apoyado en
aplicaciones
o Integración de información o Independencia de datos o SGBD prerelacionales
o^
Sistemas de gestión de bases de datos
relacionales
o^
Sistemas de gestión de bases
de datos postrelacionales
Visión diacrónica de la evolución de la tecnología de las bases de datos