amazon redshit que es | Ejercicios de Análisis de Redes

Amazon Redshift, Revolucion en data

warehouse.

Hoy en día, es común en una organización tener un sistema heterogéneo de Aplicaciones, Sistemas Operativos, Bases de Datos, HW, SW;

en el tema de las aplicaciones algunas por su naturaleza integran un determinado motor de Base de Datos de alguna marca específica o

bien, open source.

Para el usuario final esto es completamente transparente y no se diga para las unidades de negocio que forman la empresa. Los servicios

están soportados en Bases de Datos distribuidas, estructuradas o NoSQL e incluso el origen de la información que se procesa no

necesariamente su fuente es una Base de Datos. Lo importante de lo anterior es el almacenamiento de información, sin considerar el

origen, ni la ubicación geográfica donde se genera, ni los medios como se obtienen.

El Data Warehouse concentra y almacena de forma estructurada toda la información obtenida a partir de las múltiples fuentes de datos en

nuestra organización, permitiendo así una rápida integración con herramientas de minería de datos, análisis y reportes (dashboards).

Cómo funciona el Data Warehouse

Funciona un poco diferente a las bases de datos convencionales (OLTP - OnLine Transactional Processing). Como su nombre lo indica,

manejan los datos transaccionales y los datos de cara a los procesos principales de la organización. Al ser transaccionales comúnmente

manejan segundo a segundo operaciones de consulta, inserción, borrado y actualización de datos según los requerimientos del usuario

(por ejemplo, una reserva de cine).

Los Data Warehouse usan OLAP (OnLine Analytical Processing). Son datos que, aunque no están disponibles en tiempo real, pueden ser

analizados de forma rápida y masiva sin interrumpir los procesos del usuario. Esto le otorga a los científicos de datos una perspectiva más

amplia para tomar decisiones (por ejemplo, total de ventas a través del tiempo). Como el Data Warehouse está diseñado con una finalidad

analítica, este proceso puede llegar a ser hasta 1000 veces más rápido que una base de datos convencional.

Amazon Redshift

Amazon sigue expandiendo su oferta de servicios basados en cloud computing a través de la línea AWS (Amazon Web Services). En esta

ocasión ha presentado una nueva oferta para el almacenamiento de grandes volúmenes de datos relacionales denominada Amazon

Redshift.

Básicamente se trata de un Data Warehouse optimizado para albergar bases de datos relacionales provenientes de múltiples fuentes y

sistemas y ofrecer un alto rendimiento en procesos de análisis e informes. En este tipo de infraestructuras se recopilan los datos de

transacciones financieras, de ventas, de cadenas de suministro y se unifican para que los responsables de las compañías puedan analizarlos

y tomar las decisiones correctas para los negocios.

amazon redshit que es, Ejercicios de Análisis de Redes

Documentos relacionados

Vista previa parcial del texto

¡Descarga amazon redshit que es y más Ejercicios en PDF de Análisis de Redes solo en Docsity!

Amazon Redshift, Revolucion en data

warehouse.

Cómo funciona el Data Warehouse

Amazon Redshift

Esquema de data warehouse.

Staging

Core

Data Mart

Aplicaciones cliente

Conexiones

Clústeres

Nodo principal

Nodos de computación

Sectores del nodo

Red interna

Bases de datos

Tipos de Datos de Data Warehouse Amazon

Redshift

Enterprise Data Warehouse

Operational Data Store (ODS)

Data Mart

Parámetros de configuración de la data

warehouse.

Extraer los datos desde los sistemas de origen.

Analizar los datos extraídos obteniendo un chequeo.

Interpretar este chequeo para verificar que los datos extraídos

cumplen la pauta o

estructura que se esperaba. Si no fuese así, los datos deberían

ser rechazados.

Convertir los datos a un formato preparado para iniciar el

proceso de transformación

Fase de

Extracción

La fase de transformación de los procesos de ETL aplica una

serie de reglas de negocio o funciones sobre los datos extraídos

para convertirlos en datos que serán cargados.

Deben consideras que sean:

Declarativas.

Independiente

Claras.

Inteligibles.

Con una finalidad útil para el negocio.

Fase de

Transformación

En esta fase, los datos procedentes de la fase anterior (fase de

transformación) son cargados en el sistema de destino.

Dependiendo de los requerimientos de la organización, este

proceso puede abarcar una amplia variedad de acciones

diferentes.

Acumulación simple : esta manera de cargar los datos consiste

en realizar un resumen de todas las transacciones comprendidas

en el período de tiempo seleccionado

Rolling : este proceso sería el más recomendable en los casos en

que se busque mantener varios niveles de granularidad

Fase de Proceso

de Carga