Proyecto - DataWareHouse

Descargar como rtf, pdf o txt
Descargar como rtf, pdf o txt
Está en la página 1de 9

INTRODUCCIN

El presente proyecto se enfoca en presentar un DataWareHouse para la empresa de


"Adventure Works Cycles", con el cual ayudar en la toma de decisiones gerenciales,
directivas y sus repectivas areas.El datamart analizado y desarrollado es un gran
almacn de datos al cual puedo consultar rapidamente. El DataWarehouse es lo mismo
simplemente que el Datamart es a un nivel ms pequeo (reas, jefaturas, etc) y el
Datawarehouse es a nivel de toda la empresa.
Los principales objetivos de este proyecto se orientan hacia la construccin de un
DataWareHouse que est dirigido fundamentalmente a responder de manera rpida a
las solicitudes de anlisis de los directivos o a la toma de decisiones gerenciales de la
empresa "Adventure Works Cycles". Un lugar importante en la construccin del
Datawarehouse lo ocupa el rea de transformacin de los datos, la cual vara en su
complejidad en dependencia de los requerimientos.
El DataWareHouse organiza y orienta los datos desde las perspectivas de los usuarios
gerenciales y directivos, mientras que los sistemas operacionales organizan sus datos
desde la perspectiva de la aplicacin, para lograr eficiencia en el acceso a datos. El
DataWareHouse surgi con el objetivo de hacer consultable la informacin que se tiene
de una empresa tanto de meses como de aos anteriores.
Los principales objetivos del Datawarehouse son:

Comprender las necesidades de los usuarios por reas dentro de la empresa.

Determinar qu decisiones se pueden tomar con la ayuda del DWH.

Seleccionar un subconjunto del sistema de fuentes de datos que sea el ms


efectivo y procesable para presentar el DWH.

Asegurar que los datos sean precisos , correctos y confiables y que mantengan
la consistencia.

Monitorear continuamente la precisin y exactitud de los datos y el contenido de


los reportes generados.

Publicar los datos.

Este DataWareHouse desarrollado es un repositorio de datos de muy fcil acceso,


alimentado de la fuente de informacion de la Base de Datos "Adventureworks",
transformadas en grupos de informacin sobre temas especficos del que la empresa
desea adoptar o adquirir, para permitir nuevas consultas, anlisis, reporteador y
decisiones.
II. OBJETIVO GENERAL
El presente proyecto tiene como objetivo plantear las bases tericas para el desarrollo
del DataWereHouse de Ventas para empresa "Adventure Works Cycles" cuya base de
datos es "Adventureworks". El uso de la metodologa a aplicar as como las herramientas
posibles a utilizar
III. BASE TERICA
Para el desarrollo del Datamart es necesario contar con una base terica en lo referente
a que es la inteligencia de negocios y para que se usa un Datamart..
Inteligencia de Negocios es el conjunto de estrategias y herramientas enfocadas a la
administracin y creacin de conocimiento mediante el anlisis de datos existentes en
una organizacin o empresa. Este conjunto de herramientas y metodologas tienen en
comn las siguientes caractersticas:
Accesibilidad a la informacin: Los datos son la fuente principal de este concepto.
Lo primero que deben garantizar este tipo de herramientas y tcnicas ser el
acceso de los usuarios a los datos con independencia de la procedencia de
estos.
Apoyo en la toma de decisiones: Se busca ir ms all en la presentacin de la
informacin, de manera que los usuarios tengan acceso a herramientas de
anlisis que les permitan seleccionar y manipular slo aquellos datos que les interesen.
Orientacin al usuario final. Se busca independencia entre los conocimientos
tcnicos de los usuarios y su capacidad para utilizar estas herramientas.
Inteligencia de negocios, tambin llamado Business Intelligence (BI), entonces permite la
mejor toma de decisiones en base a informacin histrica previamente analizada.
Con la ausencia de BI, existe de hecho un hueco: cuando los usuarios toman decisionesy
analizan riesgos y oportunidades basados en informacin anecdtica, incompleta o
desactualizada, lo cual no es mejor que adivinar.
La BI correcta no solamente advierte a una empresa de los problemas que surgen, sino
tambin destaca las oportunidades y ahorro en costos, por lo que en muchas empresas
se utiliza el concepto de centro de competencia para la inteligencia de negocios (BI
competency center).1

VI. DATAWAREHOUSE

Es un almacn de datos relacionados a las actividades de una organizacin y grabadas en


una base de datos diseada especficamente con el propsito de hacer informes para
despus analizar estos informes y conseguir informacin estratgica.
4.1. Objetivo
El DataWarehouse tiene como objetivo agrupar los datos de toda la empresa con el fin de
facilitar su anlisis, de forma que sean tiles para acceder y analizar informacin sobre la
propia empresa.

4.2. Componentes en la creacin de un data


4.2.1. Fuentes de datos
Son las que alimentan de informacin al DataWarehouse, estn diseadas para registrar
grandes cantidades de transacciones. Entre ella tenemos la base de datos OLTP (Una
base de datos para soportar procesos transaccionales).
Caractersticas:
Son pobladas por usuarios finales.
Se optimizan en funcin a procesos transaccionales.
Se actualizan constantemente.
Contienen mucha informacin de detalle.
OLTP:
Una base de datos para soportar procesos transaccionales en lnea (OLTP), puede no
ser adecuada para el DataWarehouse ya que ha sido diseada para maximizar la
capacidad transaccional de sus datos y tpicamente tiene cientos de tablas la gran
mayora normalizadas. Su diseo tambin ha sido condicionado por los procesos
operacionales que deber soportar para la ptima actualizacin de sus datos,
normalmente muchas de sus tablas en constantes y continuos cambios. Los sistemas
DataWarehouse estn orientados a procesos de consultas en contraposicin con los
procesos transaccionales"

4.2.2 Procesos de extraccin, transformacin y carga de datos (ETL)


Los datos se encuentran almacenados en base de datos destinados al registro de
transacciones. Es necesario extraer y transformar los datos antes de cargar los
resultados en el DataWarehouse.
Los mismos elementos de datos, si son usados por aplicaciones diferentes o
administrados por diferentes software DBMS, pueden definirse al usar nombres de
elementos inconsistentes, que tienen formatos inconsistentes y/o ser codificados de
manera diferente. Todas estas inconsistencias deben resolverse antes que los elementosde
datos sean almacenados en el DataWarehouse.
Uno de los desafos de cualquier implementacin de DataWarehouse, es el problema de
transformar los datos. La transformacin se encarga de las inconsistencias en los
formatos de datos y la codificacin, que pueden existir dentro de una base de datos nica y
que casi siempre existen cuando mltiples bases de datos contribuyen al
DataWarehouse.
La transformacin de datos tambin se encarga de las inconsistencias en el contenido
dedatos. Una vez que se toma la decisin sobre que reglas de transformacin sern
establecidas, deben crearse e incluirse las definiciones en las rutinas de transformacin. 3

4.2.3. DataWareHouse
Un DataWarehouse contiene la informacin de toda la empresa. Cualquier
departamento puede acceder a la informacin de cualquier otro departamento mediante
un nico medio, as como obligar a que los mismos trminos tengan el mismo significado
para todos. Un Datamart almacena la informacin de un rea o departamento especifico y
un conjunto de Datamarts forman un DataWarehouse
Un Datamart es una solucin que, compartiendo tecnologa con el DataWarehouse
(pero con contenidos especficos, volumen de datos ms limitado y un alcance histrico
menor), permita dar soporte a una empresa pequea, un departamento o rea de
negocio de una empresa grande.
El DataMart cubre de manera ptima las necesidades de informes. No es
conveniente efectuar consultas sobre los sistemas transaccionales, debido a que hay
que integrar datos de diversas OLTP.

4.2.4 Herramientas de Explotacin


El DataWarehouse est orientado a la toma de decisiones. Un buen diseo de la base de
datos favorece el anlisis y la recuperacin de datos para obtener una ventaja
estratgica y para facilitar la toma de decisiones. El DataWarehouse (DW) almacena
datos de acuerdo a categoras o estructurndolos de forma que favorezcan el anlisis delos
datos el anlisis histrico.
El DataWarehouse no est orientado a procesos relacionados con la operatividad
de la empresa. El DataWarehouse est preparado para ser explotado mediante
herramientas especficas que permiten la extraccin de informacin significativa y
patrones de comportamiento que permanecen ocultos en un enorme repositorio de
datos.
Veamos las herramientas software que existen:
Herramienta de consulta y reporte
Las herramientas de consulta al igual que la mayora de herramientas visuales,
permiten apuntar y dar un click a los mens y botones para especificar los
elementos de datos, condiciones, criterios de agrupacin y otros atributos de una
solicitud de informacin. La herramienta de consulta genera entonces un llamado
a una base de datos, extrae los datos pertinentes, efecta clculos adicionales, manipula los
datos si es necesario y presenta los resultados en un formato claro.
Se puede almacenar las consultas y los pedidos de reporte para trabajos
subsiguientes, como est o con modificaciones. El procesamiento estadstico se

limita comnmente a promedios, sumas, desviaciones estndar y otras funciones


de anlisis bsicas. Aunque las capacidades varan de un producto a otro, las
herramientas de consulta y reporte son ms apropiadas cuando se necesita
responder a la pregunta "Qu sucedi"?
Herramientas de base de datos multidimensionales / OLAP
Las primeras soluciones OLAP (On Line Analytical Processing), estuvieron basadas en
bases de datos multidimensionales (MDDBS). Un cubo estructural
(dos veces un hipercubo o un arreglo multidimensional) almacenaba los datos
para que se puedan manipular intuitivamente y claramente ver las asociaciones a
travs de dimensiones mltiples Pero este enfoque tiene varias limitaciones:
o Las nuevas estructuras de almacenamiento de datos requieren bases de
datos propietarias. No hay realmente estndares disponibles para
acceder a los datos multidimensionales.
o La segunda limitacin de un MDDB concierne al desarrollo de una
estructura de datos. Las compaas generalmente almacenan los datos
de la empresa en bases de datos relacionales, lo que significa que
alguien tiene que extraer, transformar y cargar estos datos en el
hipercubo.
Sistemas de informacin ejecutivos
Las herramientas de sistemas de informacin ejecutivos (Executive Information
Systems - EIS), proporcionan medios sumamente fciles de usar para consulta y
anlisis de la informacin confiable. Generalmente se disean para el usuario
que necesita conseguir los datos rpidamente, pero quiere utilizar el menor
tiempo posible para comprender el uso de la herramienta. El precio de esta
facilidad de uso es que por lo general existen algunas limitaciones sobre las
capacidades analticas disponibles con el sistema de informacin ejecutivo.
Adems, muchas de las herramientas de consulta/reporte y
OLAP/multidimensional, pueden usarse para desarrollar sistemas de informacin ejecutivos.
El concepto de sistema de informacin ejecutivo es simple: los
ejecutivos no tienen mucho tiempo, ni la habilidad en muchos casos, para
efectuar el anlisis de grandes volmenes de datos. El EIS presenta vistas de los
datos simplificados, altamente consolidados y mayormente estticas.
Herramientas de Data Mining
Data Mining es una categora de herramientas de anlisis open-end. En lugar de
hacer preguntas, se toma estas herramientas y se pregunta algo "interesante",
una tendencia o una agrupacin peculiar, por ejemplo. El proceso de Data Mining
extrae los conocimientos guardados o informacin predictiva desde el
DataWarehouse sin requerir pedidos o preguntas especficas. Las herramientas
Mining usan algunas de las tcnicas de computacin ms avanzadas para
generar modelos y asociaciones como redes neurales, deteccin de desviacin,
modelamiento predictivo y programacin gentica. Data Mining es un datoconducido,
no una aplicacin-conducida.

5. Mtodolga
5.1. Metodologia "......."
5.2. Modelo Dimesional

Conclusin

Un data warehouse es un sistema que te permite una organizacin y


un anlisis completo de gran informacin que se genere. Esto te
permite el poder darle mantenimiento a la informacin de manera
mas adecuada ya que en muchas ocasiones no se tiene un control
sobre toda la informacin que se pueda generar en una empresa y
este sistema te permite el control de un gran volumen de
informacin.

Un data warehouse se crea al extraer los datos de


diferentes bases de datos, esto permite o tiene como beneficio el
poder eliminar informacin redundante y puedes tambin realizar
resmenes de informacin lo cual te beneficiara para la toma de
decisiones.
Los beneficios de contar con una data warehouse es que tendrs
una herramienta que te ayudara y te facilitara la toma de decisiones,
ya que este sistema permite tener un buen control sobre toda la
informacin
que
necesitas
para
poder
tomar
esa
decisin, basndote en datos confiables y que tienes a la mano en
cualquier momento. Dado que tendrs informacin pasada de tu
empresa y puedes saber por datos probabilsticos como funcionara
tu empresa en el futuro.

También podría gustarte