Data Ware House
Data Ware House
Data Ware House
TEMA:
Creación De Un Almacén De Datos Mediante Procesos Etl Y Cubo Olap Para
Análisis Estadísticos De Toma De Toma De Decisiones De La BD Neptuno
INTEGRANTES:
Eduardo Lino Reyes
Jonathan Bermeo Holguin
Carlos Ramirez Ruiz
Junior Loor Bailon
ASIGNATURA:
Inteligencia de Negocios
CURSO:
9no Nivel “A”
DOCENTE:
Ing. Patricia Quiroz Palma
FECHA DE ENTREGA:
13/01/2021
Manta 2020 II
0
Contenido
1. Resumen ....................................................................................................................... 2
2. Palabras claves.............................................................................................................. 2
3. Introducción .................................................................................................................. 2
4. Antecedentes o estado de arte ....................................................................................... 3
Business Intelligence .................................................................................................... 3
Procesos ETL................................................................................................................ 4
Procesos ETL: fase de Transformación ........................................................................ 4
Proceso de Carga: la culminación de los procesos ETL ............................................... 5
¿Qué es un Data Warehouse? ....................................................................................... 5
Estructuración de un DW ............................................................................................. 6
Cubo Olap ..................................................................................................................... 8
Resultados..................................................................................................................... 9
5. Desarrollo o propuesta (Fuentes de Información, Proceso ETL, DataWarehouse,
OLAP) .............................................................................................................................. 9
6. Resultados (Informes BI)............................................................................................ 10
7. Conclusiones/Recomendaciones y Trabajos Futuros ................................................. 22
8. Bibliografía ................................................................................................................. 22
1
1. Resumen
Con respecto al proyecto desarrollado se ha tomado los datos e información de una Base
se pretende realizar un Data Mart en donde con procesos multidimensionales se logre las
creación de informes que faciliten la toma de decisiones para la Distribuidora, “El Super
Económico”.
Mediante la utilización de Data Mart las consultas realizadas por medio de VisualStudio
se escogió un departamento de datos y así de esta manera agilizar las consultas lo que se
2. Palabras claves
3. Introducción
Los sistemas de apoyo a la toma de decisiones tienen una larga tradición en el mundo de
los negocios. Ya desde la década de 1960, las empresas utilizan todo tipo de métodos
analíticos que permiten obtener datos útiles con el objetivo de respaldar a la dirección
2
apenas se diferencian entre sí y desde los 1990 se engloban bajo el denominador común
Es por esto que las empresas en la actualidad optan por herramientas que ayudan de
multidimensionales obtener informes con los cuales se pueden llegar a tomar las mejores
Business Intelligence
Negocios”, conocido habitualmente como BI, es muy utilizado hoy en día. La inteligencia
permita a la alta gerencia una toma de decisiones más acertadas y ayuda a mejorar la
concisa”.
problema y, por lo tanto, la toma de decisiones se vuelve muy lenta. Las tecnologías de
BI intentan revertir esa situación, y ayudando a comprender mejor y más rápidamente los
datos. De este modo, quienes toman las decisiones pueden hacerlo de una manera más
Para llevar a cabo de manera correcta el proceso de extracción, primera fase de los
• Interpretar este chequeo para verificar que los datos extraídos cumplen la pauta o
estructura que se esperaba. Si no fuese así, los datos deberían ser rechazados.
transformación
Además, uno de las prevenciones más importantes que se deben tener en cuenta durante
el proceso de extracción sería el exigir siempre que esta tarea cause un impacto mínimo
en el sistema de origen. Este requisito se basa en la práctica ya que, si los datos a extraer
son muchos, el sistema de origen se podría ralentizar e incluso colapsar, provocando que
no pudiera volver a ser utilizado con normalidad para su uso cotidiano. (PowerData, 2017)
La fase de transformación de los procesos de ETL aplica una serie de reglas de negocio
o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Estas
• Declarativas.
• Independientes.
• Claras.
• Inteligibles.
4
• Con una finalidad útil para el negocio.
En esta fase, los datos procedentes de la fase anterior (fase de transformación) son
Acumulación simple: esta manera de cargar los datos consiste en realizar un resumen de
el resultado como una única transacción hacia el data warehouse, almacenando un valor
(PowerData, 2017)
Rolling: este proceso sería el más recomendable en los casos en que se busque mantener
ejemplo, totales diarios, totales semanales, totales mensuales, etc.) (PowerData, 2017)
Es una base de datos corporativa que centraliza, integra y depura la información que
recoge de todas las áreas o departamentos de una empresa, el Data Warehouse permite el
análisis de los datos desde una infinidad de perspectivas y con una gran velocidad de
5
Datos operativos: se trata de información transaccional que generan los sistemas de
Datos útiles: son los datos que resultan cuando los datos operativos de uso cotidiano se
Un DWH les ofrece a los analistas un amplio campo de visión sobre datos de origen muy
todos los datos empresariales relevantes, a los que suele accederse exclusivamente con
del negocio. Como base sobre la cual trabajan los diversos métodos de minería de datos,
con la gestión del rendimiento y la planificación estratégica del negocio. (IONOS, 2020)
Estructuración de un DW
Estas tres fases se reflejan en una arquitectura ideal básica, un modelo de referencia de
los sistemas de almacén de datos que, si bien puede constatar diferencias en función del
producto y el fabricante, en principio se orienta por una estructura modular a tres niveles:
6
• Recolección
• Almacenamiento y conservación
A estos tres niveles se añade un componente central de control, el gestor del almacén de
datos (Data Warehouse Manager), que asigna a cada nivel funciones especiales de
Ilustración 1 Los tres niveles de la arquitectura de referencia de un almacén de datos: recolección, almacenamiento
y entrega de los datos
7
Cubo Olap
jerarquías, por ejemplo, ciudad, estado, región, país y continente. El tiempo también es
una dimensión estándar con sus propias jerarquías tales como: día, semana, mes, trimestre
Para tener una idea más simple de la función de los cubos OLAP dentro de una base de
datos multidimensional, cabe destacar que cada una de las dimensiones o escalas del cubo
Pueden utilizarse otras dimensiones del cubo para recabar información referente a
situaciones, para obtener las soluciones correctas a los problemas de negocios. (Morales,
2016)
una de las dimensiones que posee la base de datos incorpora un campo determinado para
cierto tipo específico, que luego podrá ser comparado con la información contenida en el
8
Ilustración 2 Representación gráfica del funcionamiento el sistema OLAP, en cuanto a las consultas.
Resultados
Con la creación e implementación del cubo, se pueden crear muchas combinaciones entre
cada dimensión y medida, ya que la base de datos contiene gran cantidad de registros y
eso hace que las posibles combinaciones sean muchas; tanto con Analysis Services y
Excel se pueden analizar y tener las mismos resultados que se obtiene en una herramienta
como en otra, si es que se ha creado el mismo diseño del cubo para utilizarlo en ambas
navegador que proporciona y en cambio en Excel se inserta una tabla dinámica para poder
OLAP)
9
Las herramientas ETL juegan un papel principal en la creación de los data warehouse. Es
además uno de los cuatro principales componentes por los que está formada una solución
analíticas.
nivel de detalle, rendimiento tablas de hechos etc, y es primordial tener en cuenta las
dimensiones entorno a datamart y tener en cuenta las métricas que son indicadores valores
etc. son valores numéricos generados en una o varias separaciones o transacciones del
negocio ya sea por mes o por semana y la cual se verifica en la tabla de hechos ósea los
10
Nos saldrá un mensaje que se ha restaurado la base de datos
11
Diagrama de base de datos EL Económico
12
Se procederá a la creación del datamart como parte del DataWarehouse.
podemos decir que para la sección de pedidos en vez de realizar DataWarehouse se utilizó
datamart para que las consultas realizadas sean mucho más rápidas, para no coger toda
Diagrama Datamart
13
Procedemos a relacionar las tablas dimensiones con la tabla de hechos.
14
ETL CLiente
ETL Transporte
ETL Empleado
15
ETL Producto
ETL Tiempo
16
ETL HechoPEdido
Vista diagrama modelo estrella para Cubo Olap, y las dimensiones realizadas.
17
Se crea un cálculo comisión para las ventas monto antes de procesar el cubo
18
Procedemos a realizar la conexión para los reportes
Conjunto de datos necesarios para el reporte cantidad por clientes por meses del año.
19
Conjunto de datos para este reporte
20
Conjunto de datos utilizados para el reporte cantidad monto por clientes por
meses del año
Vista del reporte cantidad monto por clientes por meses del año
21
Vista reporte de pedidos de productos por clientes
Sea cual sea la manera elegida de desarrollar, hay que tener en cuenta que esta fase
interactúa de dos formas con la base de datos de destino y, por eso, al realizar esta
operación se aplicarán todas las restricciones que se hayan definido en ésta. Si están bien
8. Bibliografía
22