






Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Practica sobre aplicación de algoritmos de minería.
Tipo: Ejercicios
1 / 10
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!







UNIDAD
ACADÉ
DATAWAREHOUSE
Un DATAWAREHOUSE se construye a partir de recolectar los datos de los sistemas operacionales y colocarlos en un repositorio corporativo centralizado. Simplificando el problema de acceso a la información y en consecuencia, acelera el proceso de análisis, consultas y el menor tiempo de uso de la información.
Componentes de una arquitectura de Datawarehousing Sistema Fuente (Source System): Denominamos sistema fuente a todo aquel sistema que proporciona datos al datawarehouse para su análisis y explotación. Como ejemplo de un sistema fuente (los sistemas operacionales o transaccionales nombrados anteriormente son sistemas fuente) podemos mencionar a los existentes en los puestos de caja de un supermercado, que se encuentran permanentemente generando registros en bases de datos transaccionales.
Área de Staging (almacenamiento intermedio) de Datos: Como ya se mencionó anteriormente, cuando se quiere analizar el funcionamiento de una empresa o de un área en particular, es necesario obtener datos de distintos sistemas fuente para analizarlos en su conjunto. Volviendo al caso de un supermercado, quizás algún directivo o gerente del mismo desee obtener un reporte que indique cuál ha sido el efecto de publicitar una determinada oferta de un producto por televisión. Para poder lograr esto, puede ser necesario integrar los datos de los sistemas transaccionales de caja (que indiquen cantidad de unidades vendidas de un producto) con los sistemas de marketing (que indiquen cuando y en qué canal apareció la oferta).
En definitiva, la función de un Area de Staging de Datos es recibirlos datos de los sistemas transaccionales al fin de limpiarlos, transformarlos, combinarlos, integrarlos y eliminar datos duplicados preparando los mismos para ser usados en un datawarehouse o data mart.
Transformación : Conjunto de pasos (steps) interconectados por medio de saltos (hops) que procesan
registros a partir de un origen de datos y cuya salida son uno o mas registros. Los steps dentro de una transformación se procesan de manera simultánea y asíncrona.
Trabajo (Job): Conjunto de transformaciones, trabajos y pasos que se ejecutan de manera secuencial. El JOB en sí no maneja registros sino secuencias de tareas. La salida de cada job es un estado exitoso o fallido.
IMPLEMENTACIÒN ETL PENTAHO (SPOON) BD UcacueAcademico Análisis notas estudiantes
■ botón “New”. ■ Se presentará un cuadro de diálogo “Selecciona un catálogo”, donde presionaremos el botón “New”.
■ Llenamos los campos correspondientes a la conexión de base de datos, en nuestro caso a la base de postgres.
Al finalizar la transformación periodo quedaría de la siguiente manera.
El procedimiento anterior se va replicar para las demás dimensiones: facultad, estudiantes, materia, Periodo, Profesor
Dimensión Tiempo:
Para la dimensión tiempo se les facilitara la transformación que ya se encuentra construida.
JOB.- Es un conjunto de tareas para realizar una acción determinada, dispone de varios procesos que son diferentes a las transformaciones y a los saltos. Los Jobs pueden ejecutar una o varias trasformaciones, que permiten dividir los procesos en partes para su posterior ejecución. ETLNOTAS