Data Warehouse - Data Warehousing: Conceptos Básicos: Objetivos Específicos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

INTELIGENCIA DE NEGOCIOS - TEORÍA 7

SEMANA

1
Data Warehouse - Data Warehousing:
Conceptos básicos

OBJETIVOS ESPECÍFICOS

• Comprender los conceptos básicos de Data Warehouse.

• Comprender los conceptos básicos de Data Warehousing.

CONTENIDO

• Necesidad de un Data Warehouse

• Definiciones de Data Warehouse

• Componentes funcionales de un Data Warehouse

• Definir Data Warehousing

• Los componentes funcionales como proceso

• Infraestructuras

ACTIVIDADES

• Consolidar la definición de Data warehouse

• Entender los beneficios de un data warehouse

CIBERTEC CARRERAS PROFESIONALES


8

1. Necesidad de un Data Warehouse


Una de claves del éxito de las corporaciones modernas es el acceso a la
información correcta, en el tiempo adecuado, en el lugar correcto y en la forma
adecuada.

Es muy común escuchar a los ejecutivos decir las siguientes frases:

“Tenemos montañas de datos en esta compañía, pero no podemos acceder a


ellos”

“Nada enloquece más a un gerente que tener dos personas que le presenten el
mismo resultado de negocio, pero con diferentes cifras”.

“Sólo me interesa ver lo que es importante”.

“Todos sabemos qué datos no están bien”.

Estos problemas se presentan en la mayoría de las empresas, y pueden ser


convertidos en oportunidades y transformados en requerimientos:

El Data Warehouse proporciona acceso a los datos corporativos u


organizacionales.

Los datos en el Data Warehouse son consistentes.

El Data Warehouse no contiene solamente datos sino un conjunto de


herramientas de consulta, análisis y presentación de la información.

La calidad de los datos en un Data Warehouse, conducirá a una reingeniería de


las aplicaciones de negocio.

2. De los datos al conocimiento

Cuando los datos se ponen en un contexto, se convierten en información, y si


luego esta información es sintetizada con la ayuda de la experiencia se llega al
conocimiento.

CARRERAS PROFESIONALES CIBERTEC


INTELIGENCIA DE NEGOCIOS - TEORÍA 9

3. Definiciones de Data Warehouse

Hay muchas definiciones de Data Warehouse en la literatura, de las cuales se


presenta, las dos más representativas:

• William Inmon:

“El Data Warehouse es una colección de datos, orientados a un tema,


integrados, no volátiles, variantes en el tiempo, organizados para el apoyo a
toma de decisiones.”

• Ralph Kimball:

“Un Data Warehouse es una copia de los datos transaccionales,


específicamente diseñada para realizar consultas y análisis.”

4. Análisis del concepto de Data Warehouse

• El Data Warehouse es una colección de datos que están almacenados en un


lugar diferente a donde se almacenan los datos de las aplicaciones.

• Los datos en el Data Warehouse están integrados, lo que no sucede en los


sistemas transaccionales debido a que estos solo almacenan información
relevante al área usuaria y a la operatividad del sistema.

• Los datos en el Data Warehouse están orientados a un tema de negocio, se


tienen modelos que representan las entidades del negocio.

CIBERTEC CARRERAS PROFESIONALES


10

• Los datos en el Data Warehouse son no volátiles, es decir que se guardan los
datos históricos. Usualmente no se eliminan registros.

• Los datos en el Data Warehouse son variantes en el tiempo, es decir que se


actualizan periódicamente. Se mantiene la historia.

CARRERAS PROFESIONALES CIBERTEC


INTELIGENCIA DE NEGOCIOS - TEORÍA 11

5. Componentes funcionales de un Data Warehouse


Hay una serie de funciones que deben implementarse para el funcionamiento de
un Data Warehouse
• Bloque de bases de datos operacionales, que capturan los datos y son la
fuente de datos del Data Warehouse.
• Bloque de extracción, transporte, transformación, estandarización, limpieza y
carga de los datos, que es el bloque responsable de poblar el Data
Warehouse. Este bloque también es conocido como el “Staging area”.
• Almacén o base de datos de Data Warehouse, es donde se almacena la
información integrada, orientada al tema , histórica y actualizada.
• Bloque de explotación o acceso, que es donde se encuentran las
aplicaciones que permiten el acceso, exploración y análisis de los datos.
• Metadatos, que es otra base de datos que contiene información acerca de los
datos que hay en el Data Warehouse, acerca de los procesos y acerca del
negocio.

6. Definir Data warehousing


Data Warehousing es el proceso de construir un Data Warehouse, el cual es un
proceso continuo e incremental.
Transformar datos en conocimiento es un proceso complejo, en el que se transforman
e integran los datos y puede ser sintetizado en las etapas representativas de un
método industrial que se puede ilustrar con la siguiente frase:

“Ensamblar las materias primas(los datos de diferentes fuentes) según


instrucciones específicas(modelo) para realizar un producto terminado(los datos
listos para la consulta, exploración o análisis), guardado en un almacen de datos(el
Data Warehouse) para que esté disponible a los clientes(usuarios finales).”
La figura siguiente ilustra el marco general de un Data Warehouse.

CIBERTEC CARRERAS PROFESIONALES


12

En este marco, se observan tres ámbitos: las aplicaciones, los componentes


funcionales del Data Warehouse(adquisición, almacenamiento y acceso) y las
infraestructuras(técnica y operativa).

Las aplicaciones analíticas.

Un Data Warehouse no se construye en una sola iteración. Cada tema tratado, se


descompone en un conjunto de iniciativas (las aplicaciones).

Cada aplicación debe estar claramente definida(objetivos, actores, frecuencia y


periodicidad del análisis).

Las aplicaciones deben ser controlables y proporcionar resultados “tangibles” en


plazos menores a 6 meses, que corresponden al plazo medio de realización de
una aplicación.

La descomposición en aplicaciones aporta numerosas ventajas, pero genera


dificultades sobre ciertos temas, como los relacionados con la infraestructura
técnica y organizativa que necesitan ser visualizados globalmente dentro de una
arquitectura.

7. Los componentes funcionales como proceso

De los cinco componentes funcionales del Data Warehouse que se estudiaron en


la primera sesión, se pueden visualizar tres desde el punto de vista de procesos:
los componentes funcionales que son parte del proceso son la adquisición de
datos, el almacenamiento y el acceso por parte de usuarios finales.

I. Adquisición
Consiste en recoger los datos útiles del sistema de producción. Se debe
identificar los datos que sean necesarios para atender los requerimientos de
información, luego planificar las extracciones con el fin de evitar saturación en
la red, o afectar al sistema transaccional de producción.

Los procesos de extracción deben estar sincronizados con la finalidad de


garantizar la integridad de la información. Los problemas que surgen al hacer
esta sincronización puede ser muy complejos.

Después de extraer los datos del sistema transaccional, estos se deben


“preparar” para adecuarlos a la forma del Data Warehouse. Esta
“preparación” incluye la correspondencia de los formatos, la limpieza, la
transformación y la agregación en muchos casos.

La carga es la última fase de la adquisición de datos, esta fase es


particularmente importante sobre todo si se trata de volúmenes muy grandes.

II. Almacenamiento
El componente básico del soporte del almacenamiento es el DBMS
(DataBase Manager System). El DBMS o motor de base de datos debe tener
las características que le permitan responder eficientemente a las exigencias

CARRERAS PROFESIONALES CIBERTEC


INTELIGENCIA DE NEGOCIOS - TEORÍA 13

de las consultas analíticas. Para lograrlo debe contar con diversos recursos
como el paralelismo, la optimización del indexado con la finalidad de acelerar
las consultas agregadas, ordenamientos y agrupaciones.

En relación con los tipos de datos, generalmente, se almacenan en formatos


relacionales; sin embargo, frente a la gran cantidad de datos en forma de
documentos, imágenes, audio y video, los DBMS están evolucionando en el
sentido de permitir la gestión de estos tipos de datos. Esta evolución se ve
reforzada aún más con la llegada de Internet.

III. Acceso

El acceso al Data Warehouse se da mediante herramientas o aplicaciones de


tipo Cliente/servidor o herramientas que pueden utilizarse desde el Web. Hay
una gran variedad de herramientas en el mercado y el número de
aplicaciones de acceso que se pueden desarrollar es también muy grande.
Sea cual sea el tipo de herramienta, tendrá que adaptarse a las exigencias
del usuario y su manera de trabajar. En el mundo de la decisión, el análisis es
también un proceso iterativo y los resultados de la consulta actual influyen a
menudo en la consulta siguiente. Esto se puede resumir en la siguiente frase:
“ Dame lo que te pido y luego podré decirte lo que realmente quiero “.

8. Infraestructuras

Para hacer frente a las necesidades de Data Warehouse, el papel de la


informática es definir e integrar una arquitectura sobre la que implementará el
Data Warehouse.

Se debe considerar dos niveles de infraestructura en un Data Warehouse: la


infraestructura técnica o conjunto de componentes materiales y programas, y la
infraestructura operativa o conjunto de procedimientos y servicios para administrar
los datos, gestionar los usuarios y utilizar el sistema.

Por un lado, la infraestructura técnica se compone de productos que implementan


las tecnologías elegidas, integrados en un conjunto coherente y homogéneo. Por
otro lado la infraestructura operativa se compone de todos los procesos que
permiten, a partir de los datos de producción, crear y gestionar el Data
Warehouse.

CIBERTEC CARRERAS PROFESIONALES


14

Autoevaluación
1. Enumere al menos dos de los problemas que mencionan los ejecutivos y que
se pueden resolver con el Data Warehouse.

2. Describa el proceso que se debe seguir para llegar de los datos al


conocimiento.

3. En sus propias palabras, defina Data Warehouse.

4. ¿La base de datos del Data Warehouse está separada de las bases de datos
transaccionales?

5. ¿Porqué se dice que los datos están integrados en un Data Warehouse?

6. ¿Por qué se dice que los datos están orientados a un tema de negocio en
Data Warehouse?

7. ¿Por qué se dice que los datos son no-volátiles en Data Warehouse?

8. ¿Por qué se dice que los datos son variantes en el tiempo en Data
Warehouse?

9. Enumere los componentes funcionales del Data Warehouse.

10. ¿Los problemas de calidad de datos pueden ser solucionados con un data
Warehouse?

11. Defina Data Warehousing en sus propias palabras.

12. ¿Por qué se utiliza la analogía con un proceso industrial al definir Data
Warehousing?

13. ¿Cuáles deben ser las características de una “aplicación” en el contexto de


Data Warehousing?

14. Enumere los sub-procesos que se llevan a cabo dentro del proceso de
adquisición.

15. ¿Cuál es el componente básico del proceso de almacenamiento?

16. Mencione las características de un DBMS adecuado para Data Warehouse.

17. ¿Cuáles son las infraestructuras básicas para la implementación de un Data


Warehouse?.

CARRERAS PROFESIONALES CIBERTEC

También podría gustarte