Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Conceptos básicos en la creación y gestión de Bases de Datos - Prof. Peñaloza Figueroa, Apuntes de Industria y Comercio

Los conceptos básicos relacionados con la creación y gestión de bases de datos, incluyendo la definición de código, indice de bd, indización de datos, extracción de conceptos, definición de sbd y bd, y arquitectura del análisis de datos. También se tratan temas como las ventajas del control centralizado de las bases de datos y las restricciones en los sbd.

Tipo: Apuntes

2014/2015

Subido el 09/05/2015

cris_1994-1
cris_1994-1 🇪🇸

3.8

(10)

5 documentos

1 / 16

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
08/03/2015
1
ParteI:Cuestionesprevias
CreaciónyGestióndeBasesdeDatos
GradoComercio
1
Introducción
2
Cualquier empresa, cuyo interés sea lograr beneficios,
estará interesada en obtener datos sobre sus clientes y
clientes potenciales, para construir una población de
compradores de sus productos; y generar datos a partir
del funcionamiento de sus sistemas operacionales.
Este enfoque orientado al desarrollo de la comprensión
del comportamiento de los clientes, a través del
análisis de datos, tiene el propósito de lograr una
gestión más efectiva, y hacer que la interacción con los
clientes de la compañía sea mucho más efectiva que la
que hay hoy en día.
Cuestionesreferidasalasbasesdedatos
3
¿Qué tipo de datos se necesitan hoy en día de los
clientes, empresas o instituciones?
¿Cuáles serán los tipos de datos que se necesitaran en
el futuro?
¿Qué características tendrán los datos del futuro?
RoldelasBasesdeDatos
Una buena base de datos da la posibilidad de clasificar y
organizar los datos, de manera que sea posible extraer toda
la información latente y de formas distintas, por ejemplo:
Una lista alfabética de las personas que asistieron a la
cena de recaudación de fondo del curso pasado.
Cartas personalizadas a los donantes que han contribuido
con más de 100 euros.
Una lista de teléfonos de personas interesadas en una
actividad especifica de una compañia o institución.
Una lista de voluntarios disponibles para participar en
una actividad con una institución en un día u hora
específicados.
4
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Conceptos básicos en la creación y gestión de Bases de Datos - Prof. Peñaloza Figueroa y más Apuntes en PDF de Industria y Comercio solo en Docsity!

Parte^ I:^ Cuestiones

previas

Creación^ y^ Gestión^ de

Grado^ Comercio Bases^ de^ Datos^1 Introducción^2 ^ Cualquier empresa, cuyo interés sea lograr beneficios,estará interesada en obtener datos sobre sus clientes yclientes potenciales, para construir una población decompradores de sus productos; y generar datos a partirdel funcionamiento de sus sistemas operacionales. ^ Este enfoque orientado al desarrollo de la comprensióndel^ comportamiento^

de^ los^ clientes,^ a^ través

del análisis de datos, tiene el propósito de lograr unagestión más efectiva, y hacer que la interacción con losclientes de la compañía sea mucho más efectiva que laque hay hoy en día.

Cuestiones^ referidas^ a^ las

bases^ de^ datos^3

^ ¿Qué tipo de datos se necesitan hoy en día de losclientes, empresas o instituciones? ^ ¿Cuáles serán los tipos de datos que se necesitaran enel futuro? ^ ¿Qué características tendrán los datos del futuro?^ Rol^ de^ las^ Bases

de^ Datos

Una buena base de datos da la posibilidad de clasificar yorganizar los datos, de manera que sea posible extraer todala información latente y de formas distintas, por ejemplo:^ •^ Una lista alfabética de las personas que asistieron a lacena de recaudación de fondo del curso pasado.^ •^ Cartas personalizadas a los donantes que han contribuidocon más de 100 euros.^ •^ Una lista de teléfonos de personas interesadas en unaactividad especifica de una compañia o institución.^ •^ Una lista de voluntarios disponibles para participar enuna actividad con una institución en un día u horaespecíficados.

4

PARTE^ I:^ Cuestiones^ Previas

5 Definición de dato. Un dato es una representación simbólica (numérica, alfabética,algorítmica etc.), de un atributo o una característica de una entidad,almacenados en un archivo o base de datos.En^ otras^ palabras,^ los^ datos

son^ símbolos^ que^ describen condiciones, hechos, situaciones, sucesos, magnitudes o valores,mediante números, letras, signos o cualquier otro símbolo. ^ Datos significativos. Para ser significativos, los datos debenconstar de símbolos reconocibles, estar completos y expresar unaidea no ambigua ^ Datos^ pertinentes.^ Se^ dice

que^ los^ datos^ son^ pertinentes(relevantes) cuando pueden^ ser^ utilizados^ para^ responderpreguntas Definición de información^ y^ Conocimiento

6 Definición de Información: Definimos^ la^ información^

como^ un^ conjunto^ de^ datos significativos y pertinentes que describen sucesos o entidades.Dicho de otro modo, es una colección de hechos significativos ypertinentes, para la organización o institución que las recibe yutiliza. Definición de conocimiento : Se entiende como el proceso de generación de conceptos, teoríasy principios, útiles para la toma de decisiones, deducidos de laestructura de interrelaciones presentes en la información.El conocimiento está basado en la información, la cual a su vezestá basada en la organización de los datos, a la que se le ha dadosignificado, propósito y pertinencia

El flujo de la Comunicación Científica

7

Definición^ de^ Código

y^ Codificación^8

Definición de código Es un sistema de signos y/o símbolos que, en el contexto de lasBases de datos, se usa para registrar datos sobre situaciones,hechos, eventos, sucesos, acciones, fenómenos, etc.. Dicho deotro modo, es una regla para convertir un conjunto de hechos osucesos en otra forma de representación de dichos sucesos. Definición de codificación y decodificación Es el proceso de transformación de los datos que contieneninformación subyacente de un evento a un tipo de símbolos olenguaje de máquina para ser leídos por un ordenador.La^ decodificación es^ el proceso inverso

Definición^ de^ indización

de^ datos^ ‐^ III

Una guía sistemática a items contenidos en o conceptosderivados de una colección. Estos items o conceptosderivados^ están^ representados

por^ entradas^ con^ un mismo^ criterio^ de^ orden

conocido,^ que^ puede^

ser alfabético,^ cronológico^

o^ numérico.^ Este^ orden

es normalmente diferente del que presentan los ítems oconceptos de una colección. (ANSI Z39.4 – 1984)El término indización se refiere a la asignación a undocumento de una o más etiquetas que sirven paraidentificarlo y/o describirlo y para facilitar su posteriorrecuperación de algún tipo de base de datos” (Lancaster,2001: p. 164)

13 CUALIDADES DE LA INDIZACIÓN - I

14 ^ Pertinencia.^ Una^ Indización

pertinente,^ será, aquella en la que 66% de documentos ofrecidos porlos índices es realmente útil para el usuario  Exhaustividad.^ Ofrecer el mayor repertorio posible ypertinente^ de^ temas,

conceptos^ y^ objetos representados en el dato. En función del tipo deunidad^ informativa,^ puede

ser^ útil^ una^ baja exhaustividad,^ (hasta

8 términos),^ una exhaustividad media (entre 8 y 12) o una alta (másde 12)

CUALIDADES DE LA INDIZACIÓN - II  Especificidad.^ Grado de precisión de los términosseleccionados en una recuperación. Está en relacióndirecta^ con^ la^ eliminación

de^ ambigüedades^ del lenguaje natural (sinonimias, polisemias...) Tambiénse^ halla^ en^ relación^

directa^ con^ la^ correcta jerarquización de los términos así como con unacontrolada asociación de términos equivalentes.  Uniformidad.^ Grado de coincidencia en el uso de lostérminos^ por^ parte^ de

un^ usuario^ recuperando información y un documentalista indizando. Se midepor la coherencia del lenguaje documental

15

TIPOS DE INDIZACIÓN

16 ^ Indización Libre ^ Indización ControladaIndización libre: Aquella en la que la identificación serealiza a través de una lista o conjunto abierto detérminos. Indización^ controlada:

Aquella^ en^ la^ que

la identificación^ se^ realiza

por^ medio^ de^ una^ lista

o conjunto cerrado de términos. Existen una serie deherramientas^ de^ dónde

extraer^ los^ términos,^

que permiten la comprensión de datos e información porparte^ de^ los^ ordenadores

sin^ necesidad^ de^ la intervención del hombre.

Hipertexto I

17 Sistema que permite que un texto contenga enlacescon^ otras^ secciones^ del

documento^ o^ con^ otros documentos:"http"^ significa^ "protocolo

de^ transferencia^ para hipertexto".^ Hipertexto

II^18 Los^ recursos^ digitales^ presentan

características^ y^ problemas concretos^ que^ les^ alejan^ de

los^ documentos^ en^ soportes tradicionales. ^ Por un lado está el^ problema de la localización

puesto que el documento puede tener varias localizaciones, diferentes modosy condiciones de acceso, etc.  Por otro, existen problemas relacionados con el formato ya queun mismo documento puede aparecer en varios formatos dearchivo distintos: HTML, PDF, ASCII, etc., y  Otro^ problema^ añadido^ es^

la^ falta^ de^ estabilidad^ de^ los documentos^ en^ línea,^ ya^ que

suelen^ ser^ muy^ volátiles,^ se mueven o cambian de sitio o, incluso, desaparecen sin previoaviso.De esta forma, han surgido numerosos esfuerzos para normalizaraspectos referidos tanto a la localización e identificación de losdocumentos, como a la descripción formal de los mismos.

Clasificación^ Hipertexto

19 ^ Modelo basado en hipergrafos. ^ Modelo^ basado^ en^

grafos^ para^ el^ desarrollo

de NEPTUNE.  Modelo basado en redes de Petri.  Modelo^ basado^ en^ "Contextos

anidados”^ y^ los basados en Higrafos.  Modelo^ expresados^ en

lenguaje^ formal,^ cuya implementación es el sistema Dexter y su derivadoAmsterdam.  Modelo orientado a objeto.

20

Conceptualización multimedia

25 ^ Fichero o Archivo. En informática, un archivo ofichero también es un conjunto de informaciónque se almacena en forma virtual para ser leídoy/o accedido por medio de un ordenador.^ Fichero o Archivo

26

Indización^ de^ datos Un índice es un tipo especial de archivo almacenado, esuno en el que cada entrada (registro) está compuesta desólo dos valores: • un dato y • un apuntador o identificador.El dato es una^ cifra^ en^ algún^ campo

del^ archivo indizado, mientras que el apuntador es el que identificael registro, en ese archivo, que tiene ese cifra y en esecampo.^ A^ ese^ campo^

le^ denominamos^ «campo indizado».

27

Indización^ del^ archivo

de^ proveedores según Ciudad

Archivo de^ Archivo de proveedores (datos)ciudades (índice) Atenas^ *^ S1^ Salazar

20 Londres Londres^ *^ S2^ James

10 París Londres^ *^ S3^ Benites

30 París París^ *^ S4^ Cornelius

20 Londres París^ *^ S5^ Aldana Indización del archivo de proveedores según Ciudad^30 Atenas^28

Ventajas^ del^ uso^ de^

índices

-^ Agiliza la obtención de datos •^ Es de utilidad en el caso de consultas por intervalos. Por ejemplo:^ •^ “Encontrar a los proveedores cuya ciudad está incluida dentro decierto intervalo alfabético”. p.e. que empiece con letra «

N » en el intervalo L-R. • “Encontrar todos los proveedores cuya ciudad sea menor que (omayor que) algún valor especificado”. P.e. menor que Londres,donde “menor que” significa “antes en orden alfabético”. • Permite el acceso secuencial al archivo indizado (secuencial significaen el orden definidos por los valores del campo indizado) • Permite el acceso directo a los registros individuales del archivoindizado en base a una cifra dada del campo indizado. Un ejemplo, loencontramos en la consulta “Encontrar los proveedores de Londres”..

29 Ventajas^ del^ uso^ de

índices

-^ Es útil en el caso de consultas por listas, como:“Hallar^ todos^ los^ proveedores

cuya^ ciudad^ se

encuentre en alguna lista especificada”. p.e. unalista de ciudades que incluye Londres, París yNueva York Desventajas^ del^ uso^ de^

índices

-^ Ralentiza^ la^ actualización

de^ los^ archivos (cuando se añade un registro nuevo al archivoindizado, es preciso agregar también una entradaen el archivo índice)

30

Indización^ del^ archivo

de^ proveedores según ciudad y Situación

Archivo deArchivo de proveedores (datos)iudades (índice)^

Índice de situación Atenas^ *^ S1^ Salazar

20 Londres^ *^10 Londres^ *^ S2^ James

10 París^ *^20 Londres^ *^ S3^ Benites

30 París^ *^20 París^ *^ S4^ Cornelius

20 Londres^ *^30 París^ *^ S5^ Aldana

30 Atenas^ *^30

31

Clasificación^ de^ los

Datos

Clasificación^ teniendo^ en^ cuenta

el^ tiempo^ y^ el^ espacio

-^ Datos longitudinales. Son datos que están asociados altiempo. Su relevancia aparece cuando estamos interesadosen evaluar la evolución de sucesos, identificar tendencias ycambios en el comportamiento de los clientes a lo largo deltiempo. •^ Datos espaciales. Son datos asociados a la distribuciónespacial de los sucesos. Son relevantes en el caso de queestemos interesados en la evolución de las ventas por áreasgeográficas, la estructura y patrón económico por regiones,la representación de las actividades operacionales de unsector o país mediante imágenes o cartografía, entre otrosmuchos.^

32

Ventajas^ del^ Control

Centralizado^ de las Bases de Datos^ ‐^ I

-^ Reduce la redundancia^ en el almacenamiento, provocada por elalmacenamiento múltiple de datos (BD vs archivos específicosindependientes) •^ Reduce el uso ineficiente del espacio

de almacenamiento

-^ Evita las inconsistencias^ en la representación numérica de loseventos^ (una^ inconsistencia^

aparece^ cuando,^ por^ ejemplo,^

un empleado^ “E”^ que^ trabaja^ en^1

el^ departamento^ “D”,^ está^4 representado^ por^ dos^ entradas

distintas^ en^ la^ BD^ (existe duplicación por consiguiente la redundancia no está controlada), síambas^ entradas^ no^ coincidieran

cuando^ se^ actualiza^ la^ BD, entonces se dice que la base de datos es inconsistente (proporcionainformación incorrecta o contradictoria)

37 Ventajas^ del^ Control

Centralizados^ de la Bases de Datos^ ‐^ II

-^ Permite compartir datos. •^ Permite verificar el cumplimiento de las normas legales oreglamentos^ de^ empresa^

o^ entidad ,^ a^ nivel^ de^ empresa,industria, nacional o internacional.^ Por^ ejemplo,^ en

el intercambio de datos o en la confidencialidad de los datospersonales o entes jurídicos. • Permite aplicar restricciones de seguridad

(acceso a la BD. a través de canales específicos o funcionales a los usuarios). • Garantiza la integrabilidad. Los datos proporcionados por unaBD deben ser válidos y erróneos (una consulta podría revelarque un empleado trabajó 400 horas en una semana en vez de las 40 horas^ que^ realmente^

trabajó,^ o^ que^ pertenece^

al Departamento D20 , el cual no existe.

38

Definición^ de^ Base^ de

Datos^ de^ Clientes

Es una colección organizada y exhaustiva dedatos sobre los clientes o entidades, actuales,accesibles^ y^ procesables,

para^ fines^ de

marketing, tales como: •^ la generación de proyectos o planes, •^ calificación de clientes potenciales, •^ La venta de un producto o servicio, o •^ La política de continuidad de relaciones conlos clientes.

39

Lenguaje^ de^ Manipulación

de^ Datos^ ‐^ LMD^40

Lenguajes de Manipulación de datos Es un tipo de lenguaje que permite a los usuarios tener accesoa datos organizados mediante una herramienta informáticapara manipularlos. Los tipos de acceso son: ^ De recuperación de la información almacenada en la basede datos. ^ De inserción de información nueva en la base de datos. ^ De borrado de la información de la base de datos. ^ De modificación de la información almacenada en la basede datos.

Tipos^ de^ LMD

41 Los lenguajes de Manipulación

de datos pueden ser de dos tipos:1.^ LMDs procedimentales,

requiere que el usuario especifique qué datos necesita y cómo obtenerlos.2. LMDs declarativos^ (tb. conocido como LMDs noprocedimental) requiere que el usuario especifiquelos^ datos^ que^ necesita,

sin^ que^ haga^ falta

especificar la forma de obtenerlos.^ Sistema^ de^ Consulta

de^ Datos^42

Lenguaje de Consultas Una consulta es una instrucción u orden por el que se solicita larecuperación de cierta información. La parte del LMDs implicada enla recuperación de información se denomina lenguaje de consultas.Aunque^ técnicamente^ sea^ incorrecto,

resulta^ habitual^ usar^ las expresiones lenguaje de consultas y lenguaje de manipulación dedatos como sinónimos.Existen varios lenguajes de consultas de bases de datos en uso, tantocomerciales como experimentales. El lenguaje de consultas másutilizado^ es:^ la^ consulta^ SQL.

En^ este^ caso^ el^ procesador

de consultas del sistema de bases de datos traduce las consultas LMDen secuencias de acciones en el nivel físico del sistema de bases dedatos

Resumen:^ Aspectos^ Relevantes

del^ SBD^ ‐^ I

Los dos aspectos más relevantes del SBD son: 1. BD integrada. Significa que una base de datos puede considerarsecomo un proceso de unificación de varios archivos de datos distintos,en el que se elimina del todo o en parte cualquier redundancia entreellos.Ejemplo:^ consideremos^ una^

BD^ que^ contiene^ el^ archivo EMPLEADOS de una empresa, en el que los datos registrados puedenser: nombres, apellidos,, domicilio, departamento o área de trabajo,salario, etc.., junto con el archivo INSCRIPCIÓN que contiene losdatos relativos a la inscripción de los empleados en un curso deadiestramiento. Si la administración del curso necesita conocer eldepartamento al que pertenece cada empleado inscrito, entonces nohace falta añadir más datos en el archivo INSCRIPCIÓN, porquesiempre se podrá obtener dichos datos mediante una consulta alarchivo EMPLEADOS.^

43

Resumen:^ Aspectos^ Relevantes

del^ SBD^ ‐^ II

2.^ BD^ compartida.^ Significa

que^ los^ elementos individuales almacenados pueden compartirse entre variosusuarios distintos, en el sentido de que todos ellos puedentener acceso al mismo elemento o dato, simultáneamente ono, y se denomina “acceso concurrente”. Es decir, tiene lacapacidad de compartir.Ejemplo: En los archivos EMPLEADOS e INSCRIPCIÓN,los datos del primero seguramente serán compartidos porlos^ usuarios^ del^ Departamento

de^ Personal^ o^ el Departamento de formación. Esto es, los usuarios utilizanlas BD con diferentes propósitos.

44

Gráfica^ de^ la^ Arquitectura

del^ análisis^ de^ datos^49

BD.^ Como^ Estrategia

de Gestión^ de^ Clientes

50

BDs.^ Como^ Estrategia^

de^ Gestión^ de^ Clientes

51

-^ Una^ estrategia^ de^ retención

de^ clientes^ exitosa^ para^ una compañía es aquella que identifica las oportunidades parasatisfacer las necesidades de los clientes de manera oportuna. • A^ key^ element^ of^ customer

relationship^ management^ is communicating^ with^ the^ customer.

This^ consists^ of^ two components, namelyi.^ deciding what message to send to each customer segment,andii.^ selecting the channel through which the message must besent. • Message selection for each customer segment depends on the strategy beingfollowed for that segment Organización^ de^ los

datos^ por^ perfiles

52 A company’s customer data is organized into customer profiles. ^ A customer’s profile consists of three categories of data, namely(i) identity,(ii) characteristics, and(iii) behavior. ^ These categories correspond to the questions: ^ Who the person is?, ^ What attributes do they have?, and ^ How do they behave?

Datos^ escalares^ y^ su^ Clasificación

53

1. Datos numéricos ^ INTEGER. Entero ^ DECIMAL(p,q). Número decimal compactado, con “p” dígitos y “q” decimales ^ Float(p) Número de punto flotante, con precisión de p dígitos

(3.4E+38 o 1E-44)

2. Datos en Cadena ^ CHARACTER(n). Cadena de longitud fija, con exactamente n caracteres de 8bits ^ VARCHAR(n). Cadena de longitud variable, con hasta n caracteres de 8 bits. ^ GRAPHIC (n). Cadena de longitud fija con exactamente n caracteres de 16bits. ^ VARGRAPHIC(n). Cadena de longitud variable con hasta n caracteres de 16bits 3. Datos de Fecha y Hora ^ DATE. Fecha (aammdd) ^ TIME. Hora (hhmmss) ^ TIMESTAMP.^ Combinación^ de

fecha^ y^ hora,^ con^ una^ precisión

de

microsegundos^ Tipología^ de^ las

Bases^ de^ Datos

54

-^ BD:^ Tabla^ Base^ ^ Fila‐Columna Es^ un^ sistema^ relacional

formado^ por^ una^ fila^

de cabeceras de columna junto con cero o más filas devalores de datos. Esto es: •^ La fila de cabecera de columna, específica una o máscolumnas •^ Cada fila de datos contiene un valor escalar para cadauna de las columnas consideradas. •^ Todos los valores de una columna determinada estánmedidos^ en^ las^ mismas

unidades^ y/o^ escala^ de medición.

BD:^ Tabla^ Base^ ^ Fila

‐Columna^55

Obs\Var^ V1^ V2^ V

----^ V(p-2)^ V(p-1)^ Vp Obs1^ XXX^11 12

---^ XXX 1 (n-2)^ 1 (n-1)^ 1p Obs2^ X^21

X2p Obs3^ X^31

X3p ---^


---^


---^


---^


Obs(n-2)^ X()^ n-^

X(n-2)p Obs(n-1)^ X(n-1)^

X(n-1)p Obsn^ Xn^

Xnp BD:^ Texto^ plano^ [Flat

file]^56 BD de estudiantes (texto plano de 3 entradas)Código: 183023Nombre: JuliánApellido : PulecioCursos: 19003-01, 21001-01Email: [email protected]//Código: 183024Nombre: SoniaApellido : CuartasCursos : 19003-01, 17001-01Email: [email protected]//Código: 183025Nombre: JaimeApellido : MorenoCursos : 19003-01Email: [email protected]

END

61