




























Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Bases de datos, Profesor: , Carrera: Enginyeria Tècnica de Telecomunicació, especialitat en Telemàtica, Universidad: UOC
Tipo: Apuntes
1 / 36
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























PID_
Ninguna parte de esta publicación, incluido el diseño general y la cubierta, puede ser copiada, reproducida, almacenada o transmitida de ninguna forma, ni por ningún medio, sea éste eléctrico,químico, mecánico, óptico, grabación, fotocopia, o cualquier otro, sin la previa autorización escrita de los titulares del copyright.
Los datos que se utilizan en los sistemas de información (SI) se acostumbran a almacenar en bases de datos (BD). Para poder hablar y razonar con cier- ta propiedad sobre las BD, nos convendrá tener claro qué son los datos y la información , abstracciones que los informáticos representamos físicamente sobre dispositivos de almacenamiento externo no volátil. Con este objetivo, tendremos que adquirir algunas nociones teóricas fundamentales y disponer de herramientas formales en las que basarnos.
En este módulo didáctico estudiaremos los elementos básicos del mundo de las representaciones informáticas, y su correspondencia con el mundo real y con el mundo de las abstracciones. Introduciremos los términos más habituales y los conceptos fundamentales sobre datos e información, que utilizaremos en el resto de la asignatura para estudiar las BD.
Para tener un marco donde situar los términos y los conceptos que explicare- mos en la asignatura, distinguiremos tres ámbitos diferentes:
Figura 1.
1.1. La realidad: los objetos
Para analizar o construir un sistema de información (SI)^1 determinado, nece- sitamos conocer el mundo real al que este SI debe hacer referencia o modeli- zar; así, nuestro mundo real podrá ser un hospital, una empresa distribuidora de productos alimenticios, la matriculación de los estudiantes de una univer- sidad, etc.
(1)Un SI recoge, almacena y distri- buye información sobre el estado de un dominio.
Ejemplos de objetos concretos El enfermo Juan García,la cama 34 de la segundaplanta, el almacén de Soria,el camión B − 3452 − AG, la alumna María Pi, la asignatura Química I, la enfermedad meningitis, la devolución de un pedido concreto, un determinado accidente de tráfico, etc. son algunos ejemplos de objetos que pertenecen al mundo real.
El mundoreal , la parte de la realidad que nos interesa, es lo que perci- bimos con nuestros sentidos y está compuesto por objetos concretos, físicos o no.
1.2. Las concepciones: la información
A partir de la observación del mundo real, los humanos somos capaces de de- ducir conocimientos e información. La observación de los objetos del mundo real nos conduce a su análisis y su síntesis; después, obtenemos abstracciones de ello, hacemos clasificaciones (podemos saber que dos objetos son de la mis- ma clase a pesar de que sean diferentes), deducimos propiedades e interrela- ciones, etc.
De la observación obtenemos la información La observación del campo de la matriculación en una universidad nos permitereconocer diferentes claseso tipos de objetos, como por ejemplo el estudiante o la asignatura. Dedu- cimos que todo estudiante tendrá las propiedades (son abstracciones) fecha de nacimiento, DNI, nombre, etc., y de este modo obtenemos informaciones como las siguientes: el estu- diante de nombre Juan García tiene el DNI 34.567.854 y su año de nacimiento es 1979.
El conjunto de los conocimientos obtenidos a partir de la observación de un mundo real se denomina mundoconceptual o mundodelas concepciones. En la esfera de las concepciones construimos un modelo abstracto, conceptual, del mundo real, y esto nos ayuda a razonar y a expresarnos.
El procesodeobservación/abstracción es básicamente un proceso pa- ra modelizar la estructura, las propiedades y el funcionamiento de la realidad.
De hecho, existen diferencias entre conocimiento e información. La informa- ción es un conocimiento transmisible, es decir, que se puede representar. Los únicos conocimientos que nos interesarán aquí son, por lo tanto, las informa- ciones.
Un mismo mundo real puede ser visto, concebido y modelizado de distintas formas por diferentes observadores (incluso por un mismo observador) según su entorno o marco de referencia. Por ejemplo, un profesor no ve del mismo modo el ámbito de la gestión de un centro universitario que un administrativo de secretaría. Tienen marcos de referencia diferentes. No están interesados en los mismos conceptos. El profesor, a diferencia del administrativo, no necesi- tará conocer el importe de la matrícula, no querrá distinguir las abstracciones
El hecho de saber observar la realidad y hacer de ella las abstracciones lógicas más adecuadas, así como la habilidad para el análisis y la síntesis, llegan a ser cualidades fundamentales que debe tener el desarrollador de SI. Y estas cualidades se deben educar y cultivar.
Evolución del diseño de aplicaciones El paso de un mundo conceptual a un mundo de representaciones informáticas se hizo más sencillo a medida que la tecnología informática avanzaba y se simplificaba su utili- zación. En los años sesenta y setenta, el desarrollador de aplicaciones se veía obligado a tener en cuenta una multitud de detalles físicos de la representación informática. Actual- mente, la simplificación del proceso de diseño de la representación hace que el proceso de observación/abstracción se convierta en la tarea principal del desarrollador de SI.
1.4. La interpretación
Acabamos de ver el camino que nos conduce de la realidad a los cono- cimientos, y de éstos a los datos o las representaciones. Sin embargo, nos hará falta interpretar la representación. El proceso inverso al de re- presentación se denomina interpretación.
Si consideramos un dato, una representación que consta de la serie de símbolos 1 9 9 9, y que está extraída de una base de datos relativa a la matriculación de estudiantes, no podremos obtener ninguna información de ella si no sabemos si hace referencia al año de matriculación, al año de nacimiento, al importe de la matrícula, al número de la matrícula, etc.; además, no sabremos de qué estudiante concreto (de qué objeto del mundo real) se trata. Vemos, entonces, que para poder interpretar los datos se debe saber además a quién y a qué (a qué conceptos) hacen referencia.
Hemos dicho que una información es un conocimiento que se puede repre- sentar, pero ahora, teniendo en cuenta el camino inverso, podremos decir que la información es el significado que le damos a los datos.
Para reflexionar ¿Cómo se puede obtener co- nocimientos e información de una representación?
Como ya hemos visto, el mundo conceptual es el mundo de las abstracciones lógicas y el dominio de la información. Este campo es fundamental para con- cebir (analizar y diseñar) el SI.
2.1. La información: expresión lingüística
Cuando hablamos de información, nos movemos en el ámbito de las concep- ciones. Toda información se refiere a un objeto y nos describe una propiedad. Por ejemplo, una información sobre un estudiante (el objeto) podría ser la propiedad "nació en 1979".
En términos lingüísticos, una información (un conocimiento elemen- tal) se puede expresar con un sujeto (el estudiante concreto) y un pre- dicado ("nació en 1979"). El predicado está formado por el verbo y el complemento.
Con conectores lógicos (o, y, no) podemos expresar conocimientos más com- plejos. Por ejemplo, "este estudiante concreto se llama Juan García y nació en 1979".
2.2. Entidades, atributos y valores
Desde un punto de vista informático utilizamos unos términos diferentes de los que se emplean en lingüística.
Se denominan entidades los objetos que conceptualizamos como dis- tinguibles unos de otros (es decir, que son identificables), y de los que nos interesan algunas propiedades. El término entidad se corresponde con el término sujeto del campo de la lingüística. Es la conceptualiza- ción del objeto al que hace referencia la información.
El predicado es la propiedad descrita, y sus dos partes, verbo y comple- mento, las denominamos atributo ( año de nacimiento ) y valor ( 1979 ), respectivamente.
Ved también Para ampliar la información so- bre el mundo conceptual, con- sultad el subapartado 1.2 de este módulo didáctico.
Si E es un conjunto de entidades individuales (conceptualizaciones de los objetos del mundo real) y V es un conjunto de valores, podemos definir el atributo A como la aplicación de E sobre V. Si expresamos la aplicación en términos de una función, diremos que V = A ( E ).
{Entidad} → {Valor} Atributo
Figura 4.
Para un mismo conjunto origen podemos definir diferentes aplicaciones sobre diversos conjuntos imagen. Dicho de otro modo, una entidad puede tener más de un atributo.
Ejemplodeentidadmultiatributo
Supongamos que lo que hay que saber de los estudiantes es el número de matrícula, el número de DNI, el nombre y el año de nacimiento.
Las entidades tendrán cuatro atributos y un valor para cada atributo. Repre- sentamos ahora, en la figura 5 de la página siguiente, los atributos como apli- caciones.
2.3. El tiempo
Realmente, la información no es independiente del tiempo. El sueldo de un empleado, la altura de un estudiante, el número de hijos, etc., varían con el tiempo. En un SI nos puede interesar mantener el valor actual de los atributos,
pero tal vez también queremos incluir valores anteriores. Así, de este modo, el valor 3 del atributo número de hijos de Juan García no constituye una informa- ción suficientemente completa, si no sabemos a qué momento corresponde.
Incluso los atributos estables, como por ejemplo el DNI de un estudiante, pue- den cambiar en el mundo real. Sin embargo, aunque no sea así, en un SI todo atributo puede cambiar de valor en el tiempo. Por ejemplo, hemos introducido un DNI erróneo, y lo detectamos y lo cambiamos al cabo de unos meses. Dado que durante estos meses hemos podido comunicar el DNI erróneo al mundo exterior, nos convendría tener registrado en el SI los dos número de DNI y la fecha del cambio.
En general, para tener bien caracterizada una información no es sufi- ciente con los tres elementos entidad , atributo y valor , sino que nos hará falta el tiempo.
Figura 5
Y tal vez no tendremos suficiente con sólo un tiempo, sino que nos harán falta varios: el momento en que se produjo el cambio en el mundo real, el momento en que se introdujo en el SI, etc.
accidentes, los objetos de nuestro interés serán los accidentes de tráfico, y en- tonces el atributo DNI (el DNI del conductor), no será un atributo identifica- dor, ya que dos accidentes podrían ser del mismo conductor.
Una entidad puede tener más de un identificador, o incluso no tener ninguno. Los estudiantes pueden quedar identificados tanto por el número de matrícula como por el DNI. Sin embargo, puede ocurrir que la entidad no tenga ningún atributo identificador. Por ejemplo, si consideramos los objetos ciudad con los atributos nombre ciudad , número de habitantes , país y superficie de arbolado , nos encontramos con que el nombre ciudad no identifica una ciudad, ya que pue- den existir ciudades con el mismo nombre en diferentes países. Entonces, pa- ra identificar las ciudades tendremos que utilizar conjuntamente la pareja de atributos país y nombre ciudad.
Nombres de ciudades El nombre de las ciudades no es suficiente para identificarlas, porque un solo nombre puede hacer referencia a varias ciu- dades; por ejemplo, en Vene- zuela hay una ciudad que tiene por nombre Barcelona.
Conjuntos de atributos Como ya hemos visto anteriormente, las entidades corresponden a objetos que podemos identificar o distinguir. Para distinguir a los estudiantes, podemos utilizar el atributo nú- mero de matrícula , ya que se trata de un atributo identificador. Sin embargo, en el caso de los accidentes de tráfico, el DNI del conductor no nos identifica el accidente. Ya que no hay un atributo identificador, podríamos identificar los accidentes con el par DNI del con- ductor y fecha y hora , o tal vez el conjunto de atributos país , nombre ciudad , calle , número , fecha y hora , o cualquier otro conjunto de atributos que nos diferenciase los accidentes.
Todo atributo o conjunto de atributos que permite identificar las enti- dades individuales recibe el nombre de clave.
Ved también Consultad el concepto de enti- dad en el subapartado 2.2 de este módulo didáctico.
En el caso de los estudiantes, tanto el atributo número de matrícula como el DNI son claves, y cada uno es un atributo identificador. En el caso de las ciudades, el par de atributos país y nombre ciudad constituye una clave, pero ninguno de los dos es identificador.
Otros significados del término clave En el campo de los ficheros y las bases de datos (BD), el término clave se utiliza también con otros significados. Por ejemplo, se acostumbra a denominar clave el atributo o con- junto de atributos que se utiliza para efectuar una búsqueda en un fichero. Podemos buscar dentro de un fichero a los estudiantes que tienen el atributo nota igual a 8,5; es decir, utilizando como "clave" de búsqueda la nota. Sin embargo, obviamente, la nota no es una clave en el sentido que aquí damos a este término.
2.6. Atributos multivalor
Dado que el atributo es una aplicación entre conjuntos, a cada entidad le puede corresponder como máximo un solo valor. En consecuencia, un atributo no podrá ser multivalor (o multivaluado).
Nota Todo atributo identificador esuna clave, pero no toda cla- vees un atributo identificador.
Por ejemplo, no será posible un atributo nota tal que cada estudiantes pueda tener más de una nota, ya que entonces no sería una aplicación, sino una correspondencia.
Figura 6.
Esta restricción es propia del modelo relacional y ha sido seguida al pie de la letra por la mayoría de los sistemas de gestión de BD del mercado. Dado que aquí nos moveremos dentro del ámbito del modelo relacional, no aceptare- mos los atributos multivalor. En la práctica éstos se utilizan con frecuencia, especialmente en los ficheros clásicos.
2.7. La entidad: instancia y tipo
Hasta aquí hemos utilizado el término entidad para denominar la conceptua- lización de un objeto del mundo real (una instancia): un estudiante concreto, un accidente concreto, etc. Sin embargo, también lo utilizaremos para deno- minar la entidad genérica, el tipo, la abstracción estudiante o accidente (no un alumno o un accidente concreto, ni el conjunto de los estudiantes o de los accidentes). Todas las entidades estudiantes son elementos del conjunto de es- tudiantes. Todos los estudiantes son individuos o instancias del mismo tipo (son instancias del tipo de entidad estudiante ).
Ahora veremos los principales conceptos y términos que se utilizan en el cam- po de las representaciones informáticas, el mundo de los datos.
3.1. La representación tabular
La información pertenece al dominio conceptual o mental. Sin embargo, para transmitirla y procesarla necesitamos representarla físicamente. La representa- ción informática de una información elemental se denomina dato. El mundo de las representaciones será el mundo de los datos, y para describirlo hablare- mos de ficheros, registros, campos, BD, soportes, etc.
La figura 5 es, en realidad, una representación gráfica, no informatizada, de la información de los estudiantes. Se ha hecho utilizando este papel como sopor- te. Sin embargo, como hemos podido observar, con tantas flechas y conjun- tos, no resulta demasiado cómoda para procesarla o transmitirla; esto sucede especialmente en un caso real, en el que habría decenas de atributos y miles de estudiantes. Resulta mucho más sencillo llevar a cabo una representación tabular con una fila para cada entidad individual y una columna para cada atributo.
Figura 7
La tabla anterior es una representación tabular, formalmente muy similar a la representación típica en ficheros informáticos. Es como un fichero de datos de estudiantes que tiene un registro para cada estudiante (en estos momentos sólo tiene tres) con cuatro campos para cada registro.
Ved también Podéis ver la figura 5 en el subapartado 2.2 de este mó- dulo didáctico.
Una representacióntabular de un conjunto de n entidades e i donde cada una de ellas tiene m atributos aj es, de hecho, un conjunto de n tuplas de grado m formadas por los valores vij.
El esquema (formato o cabecera) de esta tabla se podría escribir de la si- guiente forma: E( a 1 , a 2 , ..., aj , ..., am ). Podríamos considerarlo una repre- sentación de la entidad tipo E, es decir, el tipo de las entidades instancia e i , i = 1 a n. Todas las ei tienen la misma estructura; en otros términos, tienen los mismos atributos aj , donde j = 1 a m.
3.2. Ficheros, registros y campos
Tradicionalmente, los datos han sido almacenados en ficheros sobre soportes magnéticos. El término fichero se emplea en el ámbito de los sistemas opera- tivos (SO) en un sentido mucho más genérico que aquí. Evidentemente, en esta asignatura no hablaremos de ficheros de programas, pero tampoco lo ha- remos de ficheros de texto libre, ficheros de gráficos, etc. Sólo hablaremos de ficheros de datos estructurados en registros y de bases de datos, que es lo que normalmente se utiliza en los SI.