









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Los conceptos básicos relacionados con la creación y gestión de bases de datos, incluyendo la definición de código, indice de bd, indización de datos, extracción de conceptos, definición de sbd y bd, y arquitectura del análisis de datos. También se tratan temas como las ventajas del control centralizado de las bases de datos y las restricciones en los sbd.
Tipo: Apuntes
1 / 16
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!










Grado^ Comercio Bases^ de^ Datos^1 Introducción^2 ^ Cualquier empresa, cuyo interés sea lograr beneficios,estará interesada en obtener datos sobre sus clientes yclientes potenciales, para construir una población decompradores de sus productos; y generar datos a partirdel funcionamiento de sus sistemas operacionales. ^ Este enfoque orientado al desarrollo de la comprensióndel^ comportamiento^
de^ los^ clientes,^ a^ través
del análisis de datos, tiene el propósito de lograr unagestión más efectiva, y hacer que la interacción con losclientes de la compañía sea mucho más efectiva que laque hay hoy en día.
Cuestiones^ referidas^ a^ las
bases^ de^ datos^3
Una buena base de datos da la posibilidad de clasificar yorganizar los datos, de manera que sea posible extraer todala información latente y de formas distintas, por ejemplo:^ •^ Una lista alfabética de las personas que asistieron a lacena de recaudación de fondo del curso pasado.^ •^ Cartas personalizadas a los donantes que han contribuidocon más de 100 euros.^ •^ Una lista de teléfonos de personas interesadas en unaactividad especifica de una compañia o institución.^ •^ Una lista de voluntarios disponibles para participar enuna actividad con una institución en un día u horaespecíficados.
4
5 Definición de dato. Un dato es una representación simbólica (numérica, alfabética,algorítmica etc.), de un atributo o una característica de una entidad,almacenados en un archivo o base de datos.En^ otras^ palabras,^ los^ datos
son^ símbolos^ que^ describen condiciones, hechos, situaciones, sucesos, magnitudes o valores,mediante números, letras, signos o cualquier otro símbolo. ^ Datos significativos. Para ser significativos, los datos debenconstar de símbolos reconocibles, estar completos y expresar unaidea no ambigua ^ Datos^ pertinentes.^ Se^ dice
6 Definición de Información: Definimos^ la^ información^
como^ un^ conjunto^ de^ datos significativos y pertinentes que describen sucesos o entidades.Dicho de otro modo, es una colección de hechos significativos ypertinentes, para la organización o institución que las recibe yutiliza. Definición de conocimiento : Se entiende como el proceso de generación de conceptos, teoríasy principios, útiles para la toma de decisiones, deducidos de laestructura de interrelaciones presentes en la información.El conocimiento está basado en la información, la cual a su vezestá basada en la organización de los datos, a la que se le ha dadosignificado, propósito y pertinencia
El flujo de la Comunicación Científica
7
Definición de código Es un sistema de signos y/o símbolos que, en el contexto de lasBases de datos, se usa para registrar datos sobre situaciones,hechos, eventos, sucesos, acciones, fenómenos, etc.. Dicho deotro modo, es una regla para convertir un conjunto de hechos osucesos en otra forma de representación de dichos sucesos. Definición de codificación y decodificación Es el proceso de transformación de los datos que contieneninformación subyacente de un evento a un tipo de símbolos olenguaje de máquina para ser leídos por un ordenador.La^ decodificación es^ el proceso inverso
Una guía sistemática a items contenidos en o conceptosderivados de una colección. Estos items o conceptosderivados^ están^ representados
por^ entradas^ con^ un mismo^ criterio^ de^ orden
conocido,^ que^ puede^
ser alfabético,^ cronológico^
o^ numérico.^ Este^ orden
es normalmente diferente del que presentan los ítems oconceptos de una colección. (ANSI Z39.4 – 1984)El término indización se refiere a la asignación a undocumento de una o más etiquetas que sirven paraidentificarlo y/o describirlo y para facilitar su posteriorrecuperación de algún tipo de base de datos” (Lancaster,2001: p. 164)
13 CUALIDADES DE LA INDIZACIÓN - I
14 ^ Pertinencia.^ Una^ Indización
pertinente,^ será, aquella en la que 66% de documentos ofrecidos porlos índices es realmente útil para el usuario Exhaustividad.^ Ofrecer el mayor repertorio posible ypertinente^ de^ temas,
conceptos^ y^ objetos representados en el dato. En función del tipo deunidad^ informativa,^ puede
ser^ útil^ una^ baja exhaustividad,^ (hasta
8 términos),^ una exhaustividad media (entre 8 y 12) o una alta (másde 12)
CUALIDADES DE LA INDIZACIÓN - II Especificidad.^ Grado de precisión de los términosseleccionados en una recuperación. Está en relacióndirecta^ con^ la^ eliminación
de^ ambigüedades^ del lenguaje natural (sinonimias, polisemias...) Tambiénse^ halla^ en^ relación^
directa^ con^ la^ correcta jerarquización de los términos así como con unacontrolada asociación de términos equivalentes. Uniformidad.^ Grado de coincidencia en el uso de lostérminos^ por^ parte^ de
un^ usuario^ recuperando información y un documentalista indizando. Se midepor la coherencia del lenguaje documental
15
16 ^ Indización Libre ^ Indización ControladaIndización libre: Aquella en la que la identificación serealiza a través de una lista o conjunto abierto detérminos. Indización^ controlada:
Aquella^ en^ la^ que
la identificación^ se^ realiza
por^ medio^ de^ una^ lista
o conjunto cerrado de términos. Existen una serie deherramientas^ de^ dónde
extraer^ los^ términos,^
que permiten la comprensión de datos e información porparte^ de^ los^ ordenadores
sin^ necesidad^ de^ la intervención del hombre.
Hipertexto I
17 Sistema que permite que un texto contenga enlacescon^ otras^ secciones^ del
documento^ o^ con^ otros documentos:"http"^ significa^ "protocolo
de^ transferencia^ para hipertexto".^ Hipertexto
II^18 Los^ recursos^ digitales^ presentan
características^ y^ problemas concretos^ que^ les^ alejan^ de
los^ documentos^ en^ soportes tradicionales. ^ Por un lado está el^ problema de la localización
puesto que el documento puede tener varias localizaciones, diferentes modosy condiciones de acceso, etc. Por otro, existen problemas relacionados con el formato ya queun mismo documento puede aparecer en varios formatos dearchivo distintos: HTML, PDF, ASCII, etc., y Otro^ problema^ añadido^ es^
la^ falta^ de^ estabilidad^ de^ los documentos^ en^ línea,^ ya^ que
suelen^ ser^ muy^ volátiles,^ se mueven o cambian de sitio o, incluso, desaparecen sin previoaviso.De esta forma, han surgido numerosos esfuerzos para normalizaraspectos referidos tanto a la localización e identificación de losdocumentos, como a la descripción formal de los mismos.
Clasificación^ Hipertexto
19 ^ Modelo basado en hipergrafos. ^ Modelo^ basado^ en^
grafos^ para^ el^ desarrollo
de NEPTUNE. Modelo basado en redes de Petri. Modelo^ basado^ en^ "Contextos
anidados”^ y^ los basados en Higrafos. Modelo^ expresados^ en
lenguaje^ formal,^ cuya implementación es el sistema Dexter y su derivadoAmsterdam. Modelo orientado a objeto.
20
Conceptualización multimedia
25 ^ Fichero o Archivo. En informática, un archivo ofichero también es un conjunto de informaciónque se almacena en forma virtual para ser leídoy/o accedido por medio de un ordenador.^ Fichero o Archivo
26
del^ archivo indizado, mientras que el apuntador es el que identificael registro, en ese archivo, que tiene ese cifra y en esecampo.^ A^ ese^ campo^
le^ denominamos^ «campo indizado».
27
Archivo de^ Archivo de proveedores (datos)ciudades (índice) Atenas^ *^ S1^ Salazar
20 Londres Londres^ *^ S2^ James
10 París Londres^ *^ S3^ Benites
30 París París^ *^ S4^ Cornelius
20 Londres París^ *^ S5^ Aldana Indización del archivo de proveedores según Ciudad^30 Atenas^28
-^ Agiliza la obtención de datos •^ Es de utilidad en el caso de consultas por intervalos. Por ejemplo:^ •^ “Encontrar a los proveedores cuya ciudad está incluida dentro decierto intervalo alfabético”. p.e. que empiece con letra «
N » en el intervalo L-R. • “Encontrar todos los proveedores cuya ciudad sea menor que (omayor que) algún valor especificado”. P.e. menor que Londres,donde “menor que” significa “antes en orden alfabético”. • Permite el acceso secuencial al archivo indizado (secuencial significaen el orden definidos por los valores del campo indizado) • Permite el acceso directo a los registros individuales del archivoindizado en base a una cifra dada del campo indizado. Un ejemplo, loencontramos en la consulta “Encontrar los proveedores de Londres”..
29 Ventajas^ del^ uso^ de
índices
-^ Es útil en el caso de consultas por listas, como:“Hallar^ todos^ los^ proveedores
cuya^ ciudad^ se
-^ Ralentiza^ la^ actualización
de^ los^ archivos (cuando se añade un registro nuevo al archivoindizado, es preciso agregar también una entradaen el archivo índice)
30
Archivo deArchivo de proveedores (datos)iudades (índice)^
Índice de situación Atenas^ *^ S1^ Salazar
20 Londres^ *^10 Londres^ *^ S2^ James
10 París^ *^20 Londres^ *^ S3^ Benites
30 París^ *^20 París^ *^ S4^ Cornelius
20 Londres^ *^30 París^ *^ S5^ Aldana
30 Atenas^ *^30
31
Clasificación^ teniendo^ en^ cuenta
el^ tiempo^ y^ el^ espacio
-^ Datos longitudinales. Son datos que están asociados altiempo. Su relevancia aparece cuando estamos interesadosen evaluar la evolución de sucesos, identificar tendencias ycambios en el comportamiento de los clientes a lo largo deltiempo. •^ Datos espaciales. Son datos asociados a la distribuciónespacial de los sucesos. Son relevantes en el caso de queestemos interesados en la evolución de las ventas por áreasgeográficas, la estructura y patrón económico por regiones,la representación de las actividades operacionales de unsector o país mediante imágenes o cartografía, entre otrosmuchos.^
32
Ventajas^ del^ Control
Centralizado^ de las Bases de Datos^ ‐^ I
-^ Reduce la redundancia^ en el almacenamiento, provocada por elalmacenamiento múltiple de datos (BD vs archivos específicosindependientes) •^ Reduce el uso ineficiente del espacio
de almacenamiento
-^ Evita las inconsistencias^ en la representación numérica de loseventos^ (una^ inconsistencia^
aparece^ cuando,^ por^ ejemplo,^
un empleado^ “E”^ que^ trabaja^ en^1
el^ departamento^ “D”,^ está^4 representado^ por^ dos^ entradas
distintas^ en^ la^ BD^ (existe duplicación por consiguiente la redundancia no está controlada), síambas^ entradas^ no^ coincidieran
cuando^ se^ actualiza^ la^ BD, entonces se dice que la base de datos es inconsistente (proporcionainformación incorrecta o contradictoria)
37 Ventajas^ del^ Control
Centralizados^ de la Bases de Datos^ ‐^ II
-^ Permite compartir datos. •^ Permite verificar el cumplimiento de las normas legales oreglamentos^ de^ empresa^
o^ entidad ,^ a^ nivel^ de^ empresa,industria, nacional o internacional.^ Por^ ejemplo,^ en
el intercambio de datos o en la confidencialidad de los datospersonales o entes jurídicos. • Permite aplicar restricciones de seguridad
(acceso a la BD. a través de canales específicos o funcionales a los usuarios). • Garantiza la integrabilidad. Los datos proporcionados por unaBD deben ser válidos y erróneos (una consulta podría revelarque un empleado trabajó 400 horas en una semana en vez de las 40 horas^ que^ realmente^
trabajó,^ o^ que^ pertenece^
al Departamento D20 , el cual no existe.
38
39
Lenguajes de Manipulación de datos Es un tipo de lenguaje que permite a los usuarios tener accesoa datos organizados mediante una herramienta informáticapara manipularlos. Los tipos de acceso son: ^ De recuperación de la información almacenada en la basede datos. ^ De inserción de información nueva en la base de datos. ^ De borrado de la información de la base de datos. ^ De modificación de la información almacenada en la basede datos.
41 Los lenguajes de Manipulación
de datos pueden ser de dos tipos:1.^ LMDs procedimentales,
requiere que el usuario especifique qué datos necesita y cómo obtenerlos.2. LMDs declarativos^ (tb. conocido como LMDs noprocedimental) requiere que el usuario especifiquelos^ datos^ que^ necesita,
sin^ que^ haga^ falta
Lenguaje de Consultas Una consulta es una instrucción u orden por el que se solicita larecuperación de cierta información. La parte del LMDs implicada enla recuperación de información se denomina lenguaje de consultas.Aunque^ técnicamente^ sea^ incorrecto,
resulta^ habitual^ usar^ las expresiones lenguaje de consultas y lenguaje de manipulación dedatos como sinónimos.Existen varios lenguajes de consultas de bases de datos en uso, tantocomerciales como experimentales. El lenguaje de consultas másutilizado^ es:^ la^ consulta^ SQL.
En^ este^ caso^ el^ procesador
de consultas del sistema de bases de datos traduce las consultas LMDen secuencias de acciones en el nivel físico del sistema de bases dedatos
Los dos aspectos más relevantes del SBD son: 1. BD integrada. Significa que una base de datos puede considerarsecomo un proceso de unificación de varios archivos de datos distintos,en el que se elimina del todo o en parte cualquier redundancia entreellos.Ejemplo:^ consideremos^ una^
BD^ que^ contiene^ el^ archivo EMPLEADOS de una empresa, en el que los datos registrados puedenser: nombres, apellidos,, domicilio, departamento o área de trabajo,salario, etc.., junto con el archivo INSCRIPCIÓN que contiene losdatos relativos a la inscripción de los empleados en un curso deadiestramiento. Si la administración del curso necesita conocer eldepartamento al que pertenece cada empleado inscrito, entonces nohace falta añadir más datos en el archivo INSCRIPCIÓN, porquesiempre se podrá obtener dichos datos mediante una consulta alarchivo EMPLEADOS.^
43
2.^ BD^ compartida.^ Significa
que^ los^ elementos individuales almacenados pueden compartirse entre variosusuarios distintos, en el sentido de que todos ellos puedentener acceso al mismo elemento o dato, simultáneamente ono, y se denomina “acceso concurrente”. Es decir, tiene lacapacidad de compartir.Ejemplo: En los archivos EMPLEADOS e INSCRIPCIÓN,los datos del primero seguramente serán compartidos porlos^ usuarios^ del^ Departamento
de^ Personal^ o^ el Departamento de formación. Esto es, los usuarios utilizanlas BD con diferentes propósitos.
44
BD.^ Como^ Estrategia
de Gestión^ de^ Clientes
50
51
-^ Una^ estrategia^ de^ retención
de^ clientes^ exitosa^ para^ una compañía es aquella que identifica las oportunidades parasatisfacer las necesidades de los clientes de manera oportuna. • A^ key^ element^ of^ customer
relationship^ management^ is communicating^ with^ the^ customer.
This^ consists^ of^ two components, namelyi.^ deciding what message to send to each customer segment,andii.^ selecting the channel through which the message must besent. • Message selection for each customer segment depends on the strategy beingfollowed for that segment Organización^ de^ los
datos^ por^ perfiles
52 A company’s customer data is organized into customer profiles. ^ A customer’s profile consists of three categories of data, namely(i) identity,(ii) characteristics, and(iii) behavior. ^ These categories correspond to the questions: ^ Who the person is?, ^ What attributes do they have?, and ^ How do they behave?
53
1. Datos numéricos ^ INTEGER. Entero ^ DECIMAL(p,q). Número decimal compactado, con “p” dígitos y “q” decimales ^ Float(p) Número de punto flotante, con precisión de p dígitos
(3.4E+38 o 1E-44)
2. Datos en Cadena ^ CHARACTER(n). Cadena de longitud fija, con exactamente n caracteres de 8bits ^ VARCHAR(n). Cadena de longitud variable, con hasta n caracteres de 8 bits. ^ GRAPHIC (n). Cadena de longitud fija con exactamente n caracteres de 16bits. ^ VARGRAPHIC(n). Cadena de longitud variable con hasta n caracteres de 16bits 3. Datos de Fecha y Hora ^ DATE. Fecha (aammdd) ^ TIME. Hora (hhmmss) ^ TIMESTAMP.^ Combinación^ de
fecha^ y^ hora,^ con^ una^ precisión
de
54
-^ BD:^ Tabla^ Base^ ^ Fila‐Columna Es^ un^ sistema^ relacional
formado^ por^ una^ fila^
de cabeceras de columna junto con cero o más filas devalores de datos. Esto es: •^ La fila de cabecera de columna, específica una o máscolumnas •^ Cada fila de datos contiene un valor escalar para cadauna de las columnas consideradas. •^ Todos los valores de una columna determinada estánmedidos^ en^ las^ mismas
unidades^ y/o^ escala^ de medición.
Obs\Var^ V1^ V2^ V
----^ V(p-2)^ V(p-1)^ Vp Obs1^ XXX^11 12
---^ XXX 1 (n-2)^ 1 (n-1)^ 1p Obs2^ X^21
X2p Obs3^ X^31
X3p ---^
---^
---^
---^
Obs(n-2)^ X()^ n-^
X(n-2)p Obs(n-1)^ X(n-1)^
X(n-1)p Obsn^ Xn^
Xnp BD:^ Texto^ plano^ [Flat
file]^56 BD de estudiantes (texto plano de 3 entradas)Código: 183023Nombre: JuliánApellido : PulecioCursos: 19003-01, 21001-01Email: [email protected]//Código: 183024Nombre: SoniaApellido : CuartasCursos : 19003-01, 17001-01Email: [email protected]//Código: 183025Nombre: JaimeApellido : MorenoCursos : 19003-01Email: [email protected]
61