








Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Este documento proporciona una introducción detallada a los conceptos de data mart y data warehouse, y describe las etapas clave del proceso de desarrollo de un data warehouse según la metodología de ralph kimball. Se explican los enfoques de inmon y kimball, destacando la importancia de los requerimientos del negocio, la calidad de los datos, la arquitectura técnica y el mantenimiento y crecimiento del data warehouse. El documento cubre aspectos como la planificación del proyecto, el diseño y desarrollo de la presentación de datos, la selección de productos e instalación, el desarrollo de la aplicación, la documentación y puesta en producción, y el mantenimiento y crecimiento del sistema. Es un recurso valioso para estudiantes y profesionales interesados en comprender los principios y mejores prácticas en el diseño e implementación de soluciones de data warehousing.
Tipo: Guías, Proyectos, Investigaciones
1 / 14
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!









Objetivo
Al finalizar el capítulo, el alumno:
Reconoce y diferencia los conceptos de Datamart y Datawarehouse..
Temas
Ralph Kimball
1. Concepto de Datamart
Orientado a un departamento dentro de la organización, puede ser implementado como una solución para problemas inmediatos, no es necesario para construir un Data Warehouse.
Implementación rápida y sencilla a un menor costo de implementación. Cubre necesidades específicas del Negocio, respuestas rápidas por el menor volumen de información y asegura la consistencia de los datos
El empleo de los Datamarts estará determinado por los que toman decisiones. Por ejemplo en una empresa el gerente de ventas necesitará analizar la información de su área, es decir las ventas de la empresa.
Inadvertidamente se puede usar datos no compatibles con otros Datamarts que luego alarguen el tiempo de unificación.
Si el Data Warehouse es construido primero, se requiere de hardware adicional para soportar Datamarts individuales.
3. La visión de Bill Inmon: Inmon Corporate Information
Factory
Bill Inmon es universalmente reconocido con el “Padre del Data Warehouse”. Tiene más de 26 años de experiencia en el campo de las bases de datos y diseño de Data Warehouses, ha publicado cerca de 40 libros y más de 350 artículos en las más importantes revistas especializadas. Su libro más reconocido es “Building DataWarehouse”
Bill Inmon ve la necesidad de transferir la información de los diferentes OLTP (Sistemas Transaccionales) de las organizaciones a un lugar centralizado donde los datos puedan ser utilizados para el analisis (sería el CIF o Corporate Information Factory). Insiste además en que ha de tener las siguientes características:
Orientado a temas. Los datos en la base de datos están organizados de manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre sí. Integrado. La base de datos contiene los datos de todos los sistemas operacionales de la organización, y dichos datos deben ser consistentes. No volátil. La información no se modifica ni se elimina, una vez almacenado un dato, éste se convierte en información de sólo lectura, y se mantiene para futuras consultas. Variante en el tiempo. Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones.
La información ha de estar a los máximos niveles de detalle. Los Dw departamentales o datamarts son tratados como subconjuntos de este Dw corporativo, que son construidos para cubrir las necesidades individuales de analisis de cada departamento, y siempre a partir de este Dw Central (del que también se pueden construir los ODS (Operational Data Stores ) o similares).
El enfoque Inmon también se referencia normalmente como Top-down. Los datos son extraídos de los sistemas operacionales por los procesos ETL y cargados en las áreas de stage, donde son validados y consolidados en el DW corporativo, donde además existen los llamados metadatos que documentan de una forma clara y precisa el contenido del DW. Una vez realizado este proceso, los procesos de refresco de los Data Mart departamentales obtienen la información de él, y con las consiguientes transformaciones, organizan los datos en las estructuras particulares requeridas por cada uno de ellos, refrescando su contenido.
Al tener este enfoque global, es más difícil de desarrollar en un proyecto sencillo (pues estamos intentando abordar el “todo”, a partir del cual luego iremos al “detalle”).
análisis, y luego ir añadiendo otros que comparten las dimensiones ya definidas o incluyen otras nuevas. En este sistema, los procesos ETL extraen la información de los sistemas operacionales y los procesan igualmente en el área stage, realizando posteriormente el llenado de cada uno de los Data Mart de una forma individual, aunque siempre respetando la estandarización de las dimensiones (dimensiones conformadas).
5. Etapas de un proceso de Data Mart y Data Warehouse
según la metodología de Ralph Kimball
Este diagrama muestra la secuencia de tareas de alto nivel requeridas para el efectivo diseño, desarrollo e implementación de Data Warehouses. El diagrama muestra una vista general del mapa de ruta de un proyecto en el cual cada rectángulo es una columna que nos indica dónde estamos, por dónde pasamos y hacia dónde debemos dirigirnos.
1. Planificación del Proyecto
La planificación del proyecto es dependiente de los requerimientos del negocio, como podemos apreciar en el diagrama del Business Dimensional Lifecycle (BDL), ya que los requerimientos del negocio determinan el alcance del proyecto, definen los recursos necesarios, etc., la planificación acotará los requerimientos ya sea por cuestiones de recursos y/o tiempo.
Esta etapa se concentra sobre la definición del proyecto, específicamente en la identificación del escenario del proyecto para saber de dónde surge la necesidad del Data Warehouse. Factores asociados con estas etapas incluyen: identificación de los usuarios, sponsors, convincentes motivaciones del negocio, cooperación entre áreas de sistemas y negocios, cultura analítica de la organización y análisis de factibilidad (tanto tecnológica como de disponibilidad de datos). Para medir estos factores propone un test de buena disposición del proyecto dónde describe diferentes escenarios posibles.
Adicionalmente, propone técnicas (Relevamientos de Alto Nivel, Priorización de Requerimientos y Pruebas de Concepto) para mitigar las deficiencias que el proyecto pudiera tener en algunos de los factores mencionados anteriormente.
Cómo metodología de estas etapas propone identificar el alcance preliminar basándose en los requerimientos del negocio y no en fechas límites (Deadlines) construyendo la
información inconsistente. Es por ello que la calidad de los datos es un factor determinante en el éxito de un proyecto de Data Warehousing. Es en esta etapa donde deben sanearse todos los inconvenientes relacionados con la calidad de los datos fuente.
Plan
Carga de dimensiones
Fact Tables y automatización
Ralph Kimball hace una analogía entre los planos arquitectónicos de una casa y la arquitectura de un Warehouse, Se debe de tener un plan antes de comenzar, no es simplemente reordenar y explotar la información.
Al igual que en una construcción, los planos sirven para comunicar los deseos entre los clientes y el arquitecto, como así también para medir esfuerzos y materiales necesarios para la obra (comunicación, planificación, flexibilidad y mantenimiento, documentación, productividad y reuso). Finalmente, argumenta Kimball (1998), “un buen conjunto de planos, como cualquier buena documentación, nos ayudará más tarde cuando sea tiempo de remodelar o hacer incorporaciones”.
7. Selección de Productos e Instalación
Utilizando el diseño de arquitectura técnica como marco, es necesario evaluar y seleccionar componentes específicos de la arquitectura cómo será la plataforma de hardware, el motor de base de datos, la herramienta de ETL o el desarrollo pertinente, herramientas de acceso, etc.
Una vez evaluados y seleccionados los componentes determinados se procede con la instalación y prueba de los mismos en un ambiente integrado de Data Warehousing.
8. Especificación de Aplicaciones para Usuarios Finales
Kimball (1998) divide el proceso de creación de las aplicaciones para usuarios finales en dos grandes fases: especificación y desarrollo. Clasifica a los usuarios según su perfil de consulta, desde usuarios con un perfil más estratégico y menos predecibles (Power Users) hasta usuarios netamente operacionales que consumen una serie de reportes estándares (Final Users) pasando por los usuarios gerenciales con uso de interfases push-button (EIS Users).
Kimball (1998) destaca cuatro pasos principales (siempre enfatizando el hecho de involucrar a los usuarios en cada uno de estos pasos).
Determinación del conjunto de templates iniciales (identificar reportes candidatos, clasificarlos y priorizarlos) Diseño de la estrategia de navegación dentro de la aplicación (esquema de pantallas, esquema de carpetas – directorios-, criterios de agrupamiento -por datos, por dueño, por regla del negocio, etc.) Determinación de estándares (nombre de objetos, ubicación de objetos, formato de las salidas) Detalle de las especificaciones (definición: nombre, descripción o propósito, frecuencia, parámetros, restricciones, layout, etc.)
9. Desarrollo de Aplicaciones para Usuarios Finales
Selección de un enfoque de implementación
fijadas con anterioridad), relevamiento de casos de estudio (situaciones reales donde una decisión basada en información del Warehouse tuvo impacto sobre el negocio).
Del mismo modo, la constante publicidad interna del uso del warehouse (permitiendo acceso siempre y cuando se tenga la capacitación correspondiente) y fluida comunicación con los sectores de negocios y sistemas para asegurar la buena salud del Data Warehouse.
12. Gerenciamiento del Proyecto
El gerenciamiento del proyecto se encuentra en cada una de las actividades del proyecto, desde su concepción hasta la puesta en producción. Es una fase vital dentro del Business Dimensional Lifecycle (BDL) permitiendo un fluido flujo de los requerimientos del área usuaria hacia el equipo de desarrollo del Data Warehouse. Asimismo el buen manejo de situaciones inesperadas que puedan hacer peligrar el proyecto.