
































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
pdf ejercicios libro gratis 2021
Tipo: Tesis
1 / 72
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!

































































Wladimiro Díaz Villanueva
[email protected] Universitat de València
13019 – Diseño de bases de datos
Introducción.
2.^
Almacenes de datos: motivación, definición y características.
3.^
Modelado de datos en almacenes de datos.
4.^
Construcción de un almacén de datos.
5.^
Funcionalidad de un almacén de datos.
6.^
Procesamiento analítico en línea.
7.^
Problemas de implementación.
13019 – Diseño de bases de datos
El cada vez mayor poder de procesamiento y sofisticación delas herramientas y técnicas analíticas ha dado como resultadola creación de los
almacenes de datos
Proporcionan almacenamiento, funcionalidad y receptividad alas consultas que van más allá de las posibilidades de las basesde datos destinadas a transacciones. A este poder en progresivo aumento, se le ha unido una grandemanda para mejorar el rendimiento del acceso a datos quetienen las bases de datos.
Las bases de datos tradicionales equilibran el requisito deacceso a datos con la necesidad de asegurar la integridadde los mismos.
13019 – Diseño de bases de datos
Los ejecutivos de mandos intermedios y superiores necesitanque se les proporcione información precisa adecuada para sulabor en la toma de decisiones.
Estos usuarios tan solo necesitan acceso de lectura a losdatos. Pero requieren un acceso muy rápido a un gran volumen dedatos que pueden descargarse cómodamente en sucomputador personal. Los vendedores de software y el personal de mantenimiento desistemas han comenzado a diseñar sistemas para realizar estasfunciones. El mercado de almacenes de datos ha sufrido un rápidocrecimiento desde mediados de los años noventa.
13019 – Diseño de bases de datos
13019 – Diseño de bases de datos
La mayoría de decisiones de empresas, organizaciones einstituciones se basan en información de experiencias pasadas. Generalmente, la información que es necesario investigar sobreun cierto dominio de la organización se encuentra en:
Bases de datos, tanto internas como externas. Otras fuentes muy diversas, no necesariamente bases dedatos. Muchas de estas fuentes son las que se utilizan para el trabajodiario.
13019 – Diseño de bases de datos
Disturba el trabajo transaccional diario de los sistemas deinformación originales:
Se realizan consultas muy pesadas (
killer queries
En situaciones de carga alta, la perturbación es tal que elproceso analítico se debe realizar por la noche o enperiodos festivos. La base de datos está diseñada para el trabajo transaccional yno para el análisis de los datos, por lo que el análisis es lento.
13019 – Diseño de bases de datos
Los costes de almacenamiento masivo y conectividad se hanreducido en los últimos años. Una forma eficiente de operar consiste en copiar los datosnecesarios para OLAP en un sistema unificado. Este es el origen de los almacenes de datos (
data warehouses
) y
toda la tecnología asociada (
data warehousing
Facilitan el análisis de los datos en tiempo real (OLAP). No disturban el OLTP de las bases de datos originales. Separar los datos a analizar con respecto a sus fuentes transaccio-nales requiere tener en cuenta cómo organizar los datos y cómomantenerlos actualizados.
13019 – Diseño de bases de datos
(^ on-line analitical processing
): análisis de datos
complejos del almacén de datos. Los
(^ decission support systems
) proporcionan a las
personas que han de tomar decisiones importantes dentro deuna organización, datos de nivel superior para la toma dedecisiones complejas. La
minería de datos
se emplea para el descubrimiento de
conocimiento: es un proceso de búsqueda, a partir de los datos,de conocimientos nuevos y no anticipados.
13019 – Diseño de bases de datos
Las bases de datos tradicionales soportan
Operaciones de inserción, actualización y borrado queimplican sólo algunas tuplas por relación. Aunque también soporta requisitos de consultas deinformación, están optimizadas para procesar consultasque abarcan una pequeña parte de la base datos. Por lo tanto, no pueden ser optimizadas para OLAP, DSS ominería de datos. Los almacenes de datos están diseñados precisamente pararealizar eficientemente la extracción, procesamiento ypresentación para el análisis y la toma de decisiones.
13019 – Diseño de bases de datos
Los almacenes de datos son no volátiles. Esto significa que lainformación contenida en el almacén de datos cambia conmenos frecuencia y puede considerarse como tiempo no realcon actualización periódica. La información del almacén de datos es menos precisa (degrano grueso) y se actualiza de acuerdo a una política deactualización, elegida con cuidado, y que es generalmenteincremental. Las actualizaciones del almacén de datos las realiza elcomponente de adquisición del almacén, que proporciona todoel procesamiento previo necesario.
13019 – Diseño de bases de datos
Salvado dedatos limpios
MINERÍADE DATOS
DATOSMETADATOS
Reformateo
Limpieza
Otras entradas de datos Bases de datos
Actualizaciones/Nuevos datos
DSSI/EIS
OLAP
ALMACÉN DE DATOS
13019 – Diseño de bases de datos
Manipulación de datos intuitiva. Buen rendimiento al crear informes consistentes. Creación de informes flexibles.
13019 – Diseño de bases de datos
Los almacenes de datos tienen un orden de magnitud (a vecesdos) superior al de las bases de datos fuente. Este inmenso volumen de datos (probablemente de
terabytes
ha sido tratado mediante:
Los
almacenes de datos en grandes empresas
son
proyectos de gran tamaño que requieren una enormeinversión de tiempo y recursos. Los
almacenes de datos virtuales
proporcionan vistas de
bases de datos operacionales que se materializan para unacceso eficiente. Los
data marts
tienen generalmente como objetivo un
subconjunto de la organización.
13019 – Diseño de bases de datos