Inteligencia de Negocios

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

MODULO III

CARRERA: GERENCIA DE NEGOCIOS

Carrera: Ingenieria en Computación

ASIGNATURA
INTELIGENCIA DE NEGOCIOS
<< PIN-0622 >>

Objetivo general:
Analizar para interpretar y modelar las necesidades de negocio,
procesando la información disponible en fuentes internas y
externas, donde los datos por sí solos no dicen nada, a menos que
sean transformados en conocimiento a partir del uso de
metodologías probadas de business intelligence y business
analytics.

Descripción actividades para módulo III


Descripción breve de actividades:

1. Desarrollo de la tarea sugerida en el módulo III


2. Participación en el foro “Data Warehouse”

Tarea:
Elabore un ensayo sobre todo lo relacionado con el tema de Data Warehouse,
lea el material y ademas investigue sobre el tema.
Indicaciones: Realizar de manera individual la tarea planteada
anteriormente y enviarla a través de la plataforma en el icono de tarea, debes
agregar una portada, introduccion, el ensayo de cinco paginas, conclusiones
y bibliografia, el informe debe incluir 9 paginas exactamente.
Formato: Times New Roman, tamaño 12, con interlineado de 1.5, margenes
normales.

Foro: Data Warehouse


Despues de leer detalladamente el Modulo III de la clase, deberan conversar
las siguientes interrogantes con sus compañeros:
Diferencia entre Data Warehousing y Data Warehouse?
Los Data Warehouse son ultiles solo para empresas grandes?explique
Diferencia entre OLAP y Data Mining?
Que recomienda Bases de datos tradicionales o Data Warehouse?
Definición
En vista de la diferencia entre Data Warehousing y Data Warehouse,
procederemos a definirlos formalmente, pues se trata de un proceso que
extrae, transforma, consolida e integra los datos de una organización, tanto
internos como externos, con la finalidad de hacerlos accesibles y útiles en la
toma de decisiones.
De igual forma el Data warehouse también puede definirse como una base
con información de sistema de archivos electrónicos, que almacena los datos
necesarios para el análisis de la información y la toma de decisiones. Su
diferencia radica en que que está orientada al negocio, integrada, variante en
el tiempo y no volátil.
Básicamente, Data Warehousing (DWH) es un proceso y Data Warehouse
(DW) es una base de datos.
Ver video: https://www.youtube.com/watch?v=jFsRdTcljeU

Características
Son varios los aspectos que caracterizan el Data warehouse que
proporcionan las herramientas necesarias para su optima utilización,
cumpliendo así lineamientos programados que generen las herramientas para
su suso de la mejor manera posible. Detallaremos las características de un
Data Warehouse:
1. Orientada al negocio

Al Data Warehouse sólo ingresan datos relevantes para el análisis y toma de


decisiones. Es decir, no se consideran datos que no tienen valor analítico,
como por ejemplo, direcciones de habitación, códigos postales, direcciones
de correo, entre otros. Pero son de interés variables como, tipo de cliente,
ubicación geográfica, edad, etc.
Se manejan entidades de alto nivel, como clientes, productos, rubros, zonas,
y otros. Los datos se guardan de forma multidimensional, es decir en tablas
de hechos y dimensiones.

2. Integrada

Todos los datos provenientes de fuentes heterogéneas se consolidan para


garantizar su calidad y limpieza. Los principales orígenes de datos son:

3. Según el tipo de usuario.


• Operacional: Diariamente produce gran cantidad de datos, pero por sí
mismos son de poca relevancia para el análisis requerido. Por ejemplo,
las ventas de productos.
• Medio: Genera datos con implicación a corto y mediano plazo, basados
en los datos operacionales. Un buen ejemplo de este concepto es la
generación de inventarios.
• Gerencial: Emplea datos resultantes del proceso de integración y
transformación. A su vez, genera nueva información. Se refiere,
básicamente, al usuario del Data Warehouse.
4. Según el área o el departamento de la organización
• Áreas: Cada una tiene responsabilidades bien definidas. Producen datos
propios que son compartidos con las demás áreas.
• Subdivisiones: Suelen ser geográficas. Aportan datos de localización,
que deben ser incorporados junto con los demás.
5. Según la fuente
• Internas: Generan datos propios, provenientes de las actividades diarias
de la empresa.
• Externas: Complementan los datos internos, por ejemplo censos y
estadísticas.

6. Variante en el tiempo

Permite el acceso a diferentes versiones de una misma situación, ya que los


datos actuales son almacenados junto con los históricos, en los ejemplos de
data warehouse.

7. No volátil

Garantiza la estabilidad de la información, ya que una vez que los datos


entran, no cambian. Es decir, los datos son manipulados únicamente cuando
se introducen y cuando se consultan.

8. Cualidades

Maneja datos en volumen, consecuencia de la acumulación de datos


históricos, actuales y agregados, provenientes de diversas fuentes.
Coloca todo el volumen de datos en una misma base de datos centralizada.
Estructura los datos de manera multidimensional.

Beneficios
Debido a sus características y cualidades, el Data Warehouse, presenta los
siguientes beneficios:

• Reduce el tiempo mínimo que se requiere para recoger todos los datos
relevantes acerca de un tema en específico.
• Proporciona herramientas de análisis.
• Muchos reportes y análisis son definidos por el usuario.
• Permite acceder, analizar y monitorear directamente los indicadores de
la organización.
• Ayuda a identificar los factores que inciden en el funcionamiento de la
empresa.
• Permite adelantar y determinar el comportamiento futuro de la
institución.
• Los usuarios pueden consultar datos de manera rápida y sencilla.

En definitiva, el Data Warehouse ayuda a la organización a responder


preguntas esenciales para la toma de decisiones. Esto logra obtener
beneficios de forma competitiva que optimizan su puesto en el mercado en
el que operan. Algunas de estas preguntas son:
• ¿Cuál es el perfil de los clientes?
• ¿Cómo es su comportamiento?
• ¿Cuál es la rentabilidad del negocio?
• ¿Cuál es el riesgo que corre la organización?
• ¿Qué servicios y productos utiliza y cómo puede incrementarlos?

Ámbito de aplicación
Un Data Warehouse puede adaptarse a cualquier organización, sin importar
su tamaño y complejidad. Esto es como consecuencia de la agenda de
cualquier institución, empresa u organización al momento de tomar
decisiones pertinentes referentes a los datos que produce.

Riesgos de aplicación
Requiere una gran inversión por parte de la organización. Los beneficios de
su implementación no se ven a corto plazo, sino a mediano y largo plazo.
La manipulación de datos atenta contra la manipulación de los datos
sensibles.

Aspectos a tomar en cuenta


Tal y como se comentó al principio, son varios los aspectos que hay que
tomar en cuenta para la aplicación de estos elementos para el uso de un
servidor. Entre ellos podemos mencionar los siguientes:

Costos de aplicación
Un data Warehouse conlleva costos de construcción, operación y de sostén.
El costo de construcción implica los costos de recursos humanos, tiempo y
tecnología, mientras que el de operación y mantenimiento, contempla los
costos de evolución, crecimiento y los producidos por los cambios en el
origen de los datos.
Impacto en las personas
La aplicación de un Data Warehouse siempre genera expectativas en los
usuarios, quienes necesariamente tendrán que adquirir nuevas destrezas. El
éxito de este tipo de data depende del uso activo y retroalimentación por
parte de los usuarios.

Impacto en los procesos empresariales y de toma de


decisiones
Con la aplicación de un Data Warehouse pueden quedar al descubierto
ciertas deficiencias en los procesos empresariales, pero al mismo tiempo
aumenta la confianza en las decisiones tomadas en base a los resultados
arrojados por la misma.
Arquitectura

La arquitectura general de un ejemplo de data Warehouse es la que se


muestra en la figura de arriba. Como se puede apreciar, este sistema implica
una serie de interacciones entre sus componentes. Al respecto y a manera de
resumen, su funcionamiento puede describirse de la siguiente forma:
• Los datos son tomados de diversas fuentes, como servicios web,
archivos y otras bases de datos, tanto internas como externas.
• Una vez extraídos los datos, estos son integrados, transformados y
limpiado, para posteriormente ser cargados en el Data Warehouse.
• Con la finalidad de generar información táctica y estratégica, se
obtienen informes y análisis provenientes de la carga de los datos.
• Finalmente, los usuarios pueden consultar y explorar los reportes y
análisis generados.

Elementos
Vamos ahora a describir algunos de los elementos que se pueden evaluar en
el Data Warehouse que deben ser de nuestra consideración.

Fuentes del Data Warehouse


Generalmente, son el resultado de la actividad diaria de la empresa, en cuyo
caso se denominan fuentes internas. Cuando los datos son tomados de, por
ejemplo, servidores web, éstas son consideradas fuentes externas. Son
diferentes entre sí, porque dependen de su procedencia, formato, función,
etc.

Extracción, transformación y carga


Conocido como ETL, es el proceso que comprende todas las tareas que se
realizan desde que se obtienen los datos hasta que se cargan en el Data
Warehouse. Éstas son: extracción, manipulación, control, integración,
depuración de datos, carga y actualización.

Extracción
Incluye técnicas enfocadas en obtener, desde diversas fuentes, sólo los datos
relevantes y mantenerlos en un almacenamiento interno. Este tipo de
almacenamiento permite manipular los datos sin intervenir ni alterar con mas
datos las fuentes ni el Data Warehouse, crear una capa de extracción entre la
lectura y la carga, almacenar y gestionar los metadatos que se generan en el
proceso y facilitar la integración. La extracción se basa en las necesidades
de los usuarios y los requisitos definidos para la solución.
Transformación
Se trata de las técnicas encargadas de hacer compatibles los diferentes
formatos, así como de filtrar y clasificar los datos, y relacionar fuentes.
Esta función es la responsable de aplicar todos los comandos aptos en
relación a los datos, a fin de promoverlos de forma fuerte y razonable que
hagan compatibilidad y coherencia con el Data Warehouse. Además, se
encarga de la limpieza y calidad de los datos.

Carga
Referente a las técnicas propias de la carga inicial de los datos y la
actualización periódica del Data Warehouse.
• La carga inicial se refiere a la primera carga de datos que recibe el Data
Warehouse. Generalmente, consume muchísimo tiempo debido a la
gran cantidad de registros pertenecientes a largos periodos de tiempo.
• La actualización periódica se refiere a la inserción de pequeños
volúmenes de datos. Su objetivo es añadir a los ejemplos de data
warehouse sólo aquellos datos que se generan de la última
actualización. Depende de las necesidades y requerimientos del
usuario.

En definitiva, mediante el proceso de la carga de datos, se garantiza el


mantenimiento del Data Warehouse.

A modo de resumen, se puede decir que el proceso ETL se lleva a cabo de la


siguiente manera:
• Los datos, una vez extraídos de las fuentes relevantes, se depositan en
el almacenamiento interno.
• Mientras los datos se mantienen en el almacenamiento interno, se
integran y transforman.
• Cuando los datos son limpiados, luego del paso anterior, son pasados al
Data Warehouse.

Reportes
Los reportes son herramientas gráficas que le permiten al usuario obtener
informes detallados sobre la información de su empresa. La forma de
interactuar con estos reportes es bastante sencilla para el usuario, pues se
trata de instrucciones de fácil seguimiento. Básicamente, debe seleccionar
opciones de un menú, referente a las condiciones y especificaciones del tema
presentado.

OLAP
Es el componente más poderoso del Data Warehouse, ya que contiene el
motor de consultas multidimensionales especializadas del sistema.
Permite el análisis de la organización desde diferentes escenarios históricos.
Proyecta su comportamiento y evolución desde una visión multidimensional,
es decir, mediante la combinación de diferentes perspectivas, temas de
interés o dimensiones. Esto permite deducir tendencias por medio del
descubrimiento de relaciones entre las perspectivas que a simple vista serían
difíciles de encontrar.

Data Mining
Es, principalmente, una herramienta estadística, mediante la cual se pueden
hacer predicciones. Se trata de inferir comportamientos, sin que hayan reglas
preestablecidas. Genera reportes en forma de tablas y gráficos, entre otros,
los cuales promueven la toma de decisión de una manera proactiva. Trabaja
sobre la base de la información que ya ha sido enteramente procesada.

Diferencia entre OLAP y Data Mining


Una vez considerados los principales aspectos de OLAP y el Data Minig, se
puede establecer una diferencia básica entre ellos.
Mediante OLAP se interpreta la situación actual de la empresa, dando
respuestas rápidas que faciliten la toma de decisiones.
El Data Minig predice situaciones, basado en el estudio de conocimientos
ocultos que provocan cierto tipo de comportamientos.
En consecuencia, ambos sistemas se ocupan de resolver diferentes tipos de
situaciones analíticas.

Data Minig y su relación con Data Warehouse


Un sistema Data Minig es una tecnología de soporte para el usuario final,
cuyo objetivo es extraer información útil a partir de la información contenida
en la base de datos de las empresas. Es decir, el origen de la información que
utilizan los algoritmos de Data Minig suelen ser datos históricos contenidos
en un Data Warehouse.
Debe existir una integración entre las técnicas de Data Minig y los procesos
que conlleva el Data Warehouse. Es decir, para poder realizar el análisis del
negocio, debe haber concordancia entre el Data Minig, el Data Warehouse y
el servidor OLAP. Cada vez que Data Warehouse proporciona nuevos
resultados, la empresa puede volver a aplicar Data Minig para optimizar la
toma de decisión.
En definitiva, el Data Minig y el Data Warehouse, son herramientas
completamente compatibles. El Data Warehouse aporta memoria, y el Data
Minig inteligencia.
Ver video: https://www.youtube.com/watch?v=ueAaIEr0PY4

Bases de datos tradicionales vs Data Warehouse


El análisis de los aspectos expuestos hasta ahora, nos lleva a comprender que
un Data Warehouse difiere de las bases de datos que soportan las
transacciones diarias de las organizaciones. Acá las diferencias básicas
• En las bases de datos tradicionales la información está organizada para
que sea recuperada y actualizada fácilmente. Un Data Warehouse está
organizado y orientado hacia el usuario final, el cual únicamente
puede realizar consultas.
• Las bases de datos transaccionales se ocupan del procesamiento diario
de los datos. El Data Warehouse trabaja con datos históricos, es decir,
correspondientes a largos períodos de tiempo.
• Las bases de datos tradicionales son accesadas en varias oportunidades
durante una jornada de trabajo. En un Data Warehouse las lecturas y
consultas son mínimas, pues se accede esporádicamente.
• El volumen de datos que administra un Data Warehouse es mucho
mayor que el administrado en las bases de datos tradicionales.
• La estructura de las bases transaccionales es estable. La estructura de
un Data Warehouse varía de acuerdo con su propia evolución y
utilización.
Ejemplos de Data Warehouse
Una empresa de alcance nacional, dedicada a la venta de artículos de
limpieza al mayor y al por menor, considerada además de mediano tamaño
por su volumen de ventas, tiene como meta principal maximizar sus
ganancias. De igual manera, con el fin de conseguir mayor cantidad de
clientes, desea expandirse a un nuevo nivel de mercado y, posteriormente,
ampliar su rubro de productos. Una de sus principales políticas es mejorar
continuamente para conseguir una mejor posición con respecto a sus
competidores de los ejemplos de data warehouse.
La aplicación de un Data Warehouse le ofrece los siguientes beneficios a la
organización.
• Permite a los usuarios tener una visión general del negocio.
• Transforma datos operativos en información analítica, enfocada hacia
la toma de decisiones.
• Genera reportes dinámicos que facilitan su análisis.
• Facilita la formación de estrategias para el cumplimiento de las metas
de la organización.
• Beneficia la estabilidad de la estructura de la empresa.

Otro ejemplo de data warehouse cotidiano se refiere a la gestión de una


institución educativa, la cual presenta deficiencias en cuanto a la
comunicación con sus estudiantes. De igual manera, carece de un centro de
información unificado que posea toda la información de los mismos. El
objetivo de la institución es acompañar a los alumnos durante su carrera y
luego de su egreso, para ofrecerle nuevas propuestas que potencien el
rendimiento de la organización y el desarrollo de los estudiantes.
Con la aplicación de un Data Warehouse se busca responder a las
necesidades de la universidad. En principio, eliminando la duplicidad de la
información y la presencia de detalles erróneos sobre los estudiantes, así
como toda la información que, en general, se considere de mala calidad y
que no resulte relevante. Adicionalmente, se integra toda la información,
formando un registro unificado de estudiantes que sirva de base para el buen
desarrollo del proyecto de la institución.
Finalmente, se impulsan las actividades de mercadotecnia, dándole a la
universidad mayor beneficio y ayudando a su crecimiento a través de la
correcta gestión de la información.
En conclusión, en ejemplos de data warehouse brinda la oportunidad de
conocer lo que está sucediendo en la organización, lo que ha sucedido, lo
que puede llegar a suceder y el porqué.

¿Cómo Elegir la Herramienta para Procesos ETL más


Adecuada?
En el mercado existe una gran variedad de herramientas para procesos ETL
disponibles y cada empresa debe elegir, en función de sus propias
características, necesidades y objetivos, la que más le conviene.
Pautas para elegir una herramienta ETL
• Definir si nos conviene crear una proceso ETL propio o comprar uno
ya existente. Si se trata de una organización grande lo más
recomendable y habitual es adquirir una licencia a nivel corporativo
de un sistema ETL ya desarrollado.
• Valorar los costes y recursos disponibles. La compra de una licencia
supone una inversión importante pero, en contrapartida, un ahorra de
personal y de muchos tiempo de trabajo en su conceptualización,
desarrollo e implantación.
• Tener en cuenta las expectativas de futuro de la empresa, sus
necesidades actuales, a corto y a medio plazo y su potencial de
crecimiento.

Ventajas de los procesos ETL


Sea cual sea la elección del proceso ETL concreto que se tome, ya sea propio
o adquirido, todas las herramientas ETL tienen una serie de ventajas. A lo
largo del e-book ya las hemos citado, pero a continuación las recopilamos a
modo de síntesis y conclusión:
• Son herramientas optimizadas para los procesos de manejo de datos.
• Gran variedad de conectores disponibles.
• Transformaciones pre-construidas.
• Filtros, agregaciones, ordenamientos, joins, etc. listos para usar.
• Integración con herramientas de Business Intelligent (inteligencia de
negocio).
• Funcionalidades para trabajo en equipo.
• Generación de documentación.
• Gobernabilidad de datos.
• Debugging (depurar). Detección, análisis y corrección de errores en
bases de datos.
• Redundancia.

También podría gustarte