Diseño e Implementacion de DataWarehouse 3
Diseño e Implementacion de DataWarehouse 3
Diseño e Implementacion de DataWarehouse 3
FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERÍA INFORMÁTICA
SOLUCIÓN DE INTELIGENCIA DE
NEGOCIOS PARA UNA PYME
MAYO DE 2011
PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO
FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERÍA INFORMÁTICA
SOLUCIÓN DE INTELIGENCIA DE
NEGOCIOS PARA UNA PYME
MAYO DE 2011
2
A Dios, a mis padres, hermanos,
familia y amigos por su apoyo
incondicional…
Índice de Contenidos
Índice de Contenidos..................................................................................................i
Glosario de Términos ............................................................................................... iv
Lista de Abreviaturas ................................................................................................ v
Índice de Ilustraciones ............................................................................................. vi
Abstract ..................................................................................................................vii
Resumen .................................................................................................................vii
1 Introducción ..................................................................................................... 8
1.1 Descripción y Observaciones previas del proyecto .................................... 8
1.2 La Empresa ............................................................................................... 8
1.3.- Problemática ................................................................................................... 9
2 Objetivos del Proyecto ................................................................................... 10
2.1 Objetivo General ..................................................................................... 10
2.2 Actividades del Proyecto ......................................................................... 10
3 Plan de Trabajo .............................................................................................. 11
4 Estado del Arte ............................................................................................... 12
4.1 Aspectos Generales de la Inteligencia de Negocios .................................. 12
4.1.1 Un poco de Historia ..................................................................................... 12
4.1.2 Beneficios .................................................................................................... 12
4.2 Datawarehouses y Datamarts ................................................................... 13
4.2.1 Características de los Datawarehouses ......................................................... 13
4.2.2 Ventajas de los Datawarehouses .................................................................. 14
4.2.3 Desventajas de los Datawarehouses ............................................................. 16
4.2.4 Modelos de Data Warehouses ...................................................................... 16
4.3 ETL (Extraction, Transformation and Load ............................................. 18
4.3.1 Importancia de los ETL ............................................................................... 18
4.4 OLAP (On-Line Analytical Processing) .................................................. 19
4.4.1 Cubos OLAP ............................................................................................... 19
4.4.2 Tipos de OLAP ............................................................................................ 20
4.5 Tendencias .............................................................................................. 20
5 Elementos de Análisis Empresarial ................................................................. 21
5.1 Misión y Visión....................................................................................... 21
5.1.1 Misión ......................................................................................................... 21
5.1.2 Visión .......................................................................................................... 21
5.2 Análisis FODA (Fortalezas, Oportunidades, Debilidades y Amenazas).... 21
5.2.1 Variables de Análisis ................................................................................... 23
5.2.2 La Matriz FODA ......................................................................................... 24
5.2.3 Estrategias ................................................................................................... 24
i
6 Análisis de la empresa .................................................................................... 26
6.1 Misión y Visión....................................................................................... 26
6.1.1 Misión ......................................................................................................... 26
6.1.2 Visión .......................................................................................................... 26
6.2 Análisis FODA........................................................................................ 26
6.2.1 Fortalezas .................................................................................................... 29
6.2.2 Debilidades .................................................................................................. 29
6.2.3 Oportunidades ............................................................................................. 30
6.2.4 Amenazas .................................................................................................... 30
6.2.5 Estrategia ..................................................................................................... 30
7 Metodología ................................................................................................... 31
7.1 Kimball e Inmon ..................................................................................... 31
7.1.1 Kimball (Bottom Up) ................................................................................... 31
7.1.2 Inmon (Top Down) ...................................................................................... 33
7.2 La Metodología de Larissa Moss ............................................................. 34
7.2.1 Justificación................................................................................................. 36
7.2.2 Planeación ................................................................................................... 36
7.2.3 Análisis del negocio ..................................................................................... 36
7.2.4 Diseño ......................................................................................................... 37
7.2.5 Construcción................................................................................................ 38
7.2.6 Despliegue ................................................................................................... 39
8 Desarrollo del Problema ................................................................................. 40
8.1 Justificación ............................................................................................ 41
8.1.1 Estudio de caso de negocio .......................................................................... 41
8.2 Planeación ............................................................................................... 43
8.2.1 Evaluación de la infraestructura técnica de la empresa ................................. 43
8.2.2 Planeación del proyecto ............................................................................... 44
8.3 Análisis del Negocio ............................................................................... 45
8.3.1 Definición de Requerimientos del Proyecto ................................................. 45
8.4 Diseño ..................................................................................................... 45
8.4.1 Diseño de la base de datos (Kimball) ........................................................... 45
8.5 Construcción ........................................................................................... 47
8.5.1 Diseño del ETL............................................................................................ 47
8.5.2 Desarrollo de la aplicación ........................................................................... 52
9 Herramientas .................................................................................................. 63
9.1 Pentaho ................................................................................................... 63
9.2 Jaspersoft ................................................................................................ 64
10 Propuesta Metodológica ................................................................................. 66
10.1 Formalización de los pasos: Formulación de Neil Salkind ....................... 66
10.1.1 Formulación del problema ....................................................................... 67
10.1.2 Identificación de Variables ...................................................................... 67
ii
10.1.3 Formulación de la Hipótesis de Investigación .......................................... 68
10.1.4 Recopilación de la información ............................................................... 68
10.1.5 Prueba, trabajo, reconsideración y confirmación o refutación .................. 71
11 Conclusiones .................................................................................................. 72
11.1 Implementación en AOSA....................................................................... 72
12 Referencias..................................................................................................... 74
iii
Glosario de Términos
PYME Según el ministerio de economía de Chile,
empresa que vende entre 2.400 y 100.000 UFs
anuales o que tiene entre 10 y 199 empleados.
iv
Lista de Abreviaturas
BI Business Intelligence.
ETL Extract, Transform and Load.
OLAP On-Line Analytical Processing.
TI Tecnologías de la Información
XML Extensible Markup Language
MDX Multidimensional Expressions
v
Índice de Ilustraciones
Figura n° 1: Diagrama Organizacional Alirio Olivares S.A. .................................... 9
Figura n° 2: Ejemplo de modelo estrella ............................................................... 17
Figura n° 3: Ejemplo de modelo copo de nieve ..................................................... 17
Figura n° 4: Evolución del proceso de carga de datos............................................ 18
Figura nº 5: Poblamiento y utilización de datos del datawarehouse ....................... 19
Figura nº6: Dimensiones del análisis FODA ......................................................... 22
Figura nº 7: Matriz FODA genérica ...................................................................... 24
Figura nº 8: Data warehouse según Kimball .......................................................... 32
Figura nº 9: Data warehouse según Inmon ............................................................ 33
Figura nº10: La metodología de Larissa Moss ....................................................... 35
Figura nº 11: Relación uno a uno de data mart y data warehouse........................... 38
Figura nº12: Metodología de Moss adaptada ......................................................... 40
Figura nº13: Diagrama del Data Warehouse .......................................................... 47
Figura nº14: Modelo de llenado tabla Cliente ........................................................ 49
Figura nº15: Función trim sobre campos seleccionados......................................... 49
Figura nº16: Modelo de llenado tabla Vendedor.................................................... 50
Figura nº17: Muestra de archivo fuente de fechas ................................................. 50
Figura nº18: Modelo de llenado tabla Fecha.......................................................... 51
Figura nº19: Modelo de llenado tabla Producto ..................................................... 51
Figura nº20: Modelo de llenado tabla Metrica ....................................................... 52
Figura nº21: Dimensión “Métrica” ........................................................................ 53
Figura nº 22: Dimensión “Producto” ..................................................................... 54
Figura nº 23: Dimensión “Cliente”........................................................................ 54
Figura nº 24: Dimensión “Vendedor”.................................................................... 54
Figura nº 25: Dimensión “Fecha”.......................................................................... 55
Figura nº 26: Grilla de Reporte 1 .......................................................................... 59
Figura nº 27: Gráfico de Reporte 1........................................................................ 59
Figura nº 28: Grilla de Reporte 2 .......................................................................... 60
Figura nº 29: Gráfico de Reporte 2........................................................................ 60
Figura nº 30: Grilla de Reporte 3 .......................................................................... 61
Figura nº 31: Gráfico de Reporte 3........................................................................ 61
Figura nº 32: Sistema BI Alirio Olivares S.A. ....................................................... 62
Figura n° 33: Clasificación PYMEs por ventas anuales ......................................... 68
Figura n° 34: Clasificación PYMEs por número de empleados ............................. 69
vi
Abstract
Strategic management support tools have been historically hard to acquire, being
reserved mostly for big enterprises. Nowadays there are great performance and low cost
(and even open source) alternatives to these tools. This allow an approachment between
business intelligence and smaller enterprises, letting them to include analysis tools as
dynamic dashboards, specially oriented to their business. The feasibility of a small or
medium enterprise business intelligence project it's about to be proved.
Resumen
Las herramientas de apoyo a la gestión estratégica han sido históricamente de difícil
adquisición, estando reservadas en su mayoría para grandes empresas. En la actualidad
existen alternativas de estas herramientas de bajo costo e incluso open source, de muy buen
desempeño. Esto permite hacer un acercamiento de la inteligencia de negocios a empresas
más pequeñas, permitiéndoles incluir herramientas de análisis como dashboards dinámicos,
especialmente orientados a su negocio. Está por probarse la factibilidad de un proyecto de
inteligencia de negocios en una PYME.
vii
1 Introducción
1.1 Descripción y Observaciones previas del proyecto
La motivación principal de este proyecto es investigar y experimentar hasta qué
punto podemos llevar tecnologías que históricamente han sido muy caras, a empresas de
limitados recursos. La directriz principal de este trabajo es, a su vez, demostrar que es
posible la implementación de un sistema de apoyo a la gestión en una PYME, en específico
un sistema de inteligencia de negocios.
El proyecto será realizado sobre una PYME de la región: Alirio Olivares S.A., una
empresa de compra – venta de artículos médicos, ubicada en Viña del Mar.
Este proyecto conjugará la investigación de las tecnologías necesarias para la
implantación de un sistema de apoyo a la gestión, como también la búsqueda de
metodologías que permitan un diseño correcto y eficiente. Además, se analizará a la
empresa en cuestión, con el fin de obtener un conocimiento de la situación inicial y estar al
tanto de posibles dificultades que puedan tenerse en el proceso, en cualquiera de sus etapas.
Debido a lo anterior, serán tomadas las precauciones que sean necesarias para evitar
un impacto cultural que atente contra las expectativas del proyecto.
Este informe expone las tecnologías que son necesarias para la implementación de
un sistema de inteligencia de negocios, tomando en cuenta cada uno de sus componentes.
1.2 La Empresa
Alirio Olivares S.A. compra y vende artículos médicos de toda clase, con excepción
de medicamentos. Vende desde parches y agujas hasta vaporizadores, camillas y sillas de
rueda. Sus compras no funcionan en base a importaciones, debido a que son una empresa
muy pequeña para traer grandes cargamentos, por lo que compran a intermediarios dentro
del país. Esto último hace que sus precios no sean los más convenientes.
1 vendedor externo
1 vendedor interno
1 encargado de bodega
8
Introducción
1 chofer
1 peoneta
1.3.- Problemática
Durante años, Alirio Olivares S.A. se ha ganado la confianza y la fidelidad de sus
clientes. La mayoría de las ventas que realiza en el mes corresponde a clientes frecuentes.
Extrañamente, esta fidelidad se ha mantenido en el tiempo a pesar de que los precios
ofrecidos por la empresa no son los más convenientes del mercado.
9
2 Objetivos del Proyecto
2.1 Objetivo General
10
3 Plan de Trabajo
Análisis FODA
Construcción datawarehouse
Construcción ETL
Llenado datawarehouse
Efectuar análisis
Evaluación de la entrega
11
Análisis
4.1.2 Beneficios
Las ventajas de implementar una solución de inteligencia de negocios son muy
variadas y radican en la motivación que se tuvo para ponerla en marcha. Sin embargo, el
beneficio directo que se obtiene (o debería obtenerse) tras su implementación es la
agilización de la toma de decisiones.
12
Análisis
13
Análisis
4.2.1.2 Integrados
Los datawarehouses deben integrar todos los datos de diferentes fuentes, tanto
internas como externas, de manera tal de establecer una convención de nombres, unidades
de medidas, codificaciones, etc. El componente encargado de esta integración es el ETL. El
ETL (Extracción, transformación y Carga) será explicado más adelante.
4.2.1.4 No Volátil
Los datos en un datawarehouse son estables, a diferencia de un sistema operacional
en el que son constantemente cambiados (eliminaciones, modificaciones e inserciones).
Cuando los datos son consolidados en la base de datos con su sello de tiempo, permanecen
constantes con sus características de carga.
Aumenta competitividad
14
Análisis
Definiciones Consistentes
Prioridad de la seguridad
15
Análisis
Incremento continuo de los requerimientos del usuario (que, según sea el caso,
puede verse como una ventaja)
16
Análisis
17
Análisis
18
Análisis
19
Análisis
4.5 Tendencias
La popularidad de la tecnología de inteligencia de negocios en los últimos años la
ha llevado a posicionarse firmemente entre empresas de cada vez más cantidad de tamaños.
Esto significa que la accesibilidad a esta es cada vez mayor para empresas con menor poder
adquisitivo. De la mano de la aparición de herramientas de código abierto, como Pentaho,
también han hecho su entrada soluciones de bajo costo de grandes empresas como Oracle,
como su producto Oracle BI Standard Edition One, que cuenta con base de datos, ETL y
herramientas de análisis por un precio bajo.
20
Análisis
5.1.1 Misión
Es un elemento fundamental para la planificación estratégica, puesto que de ella se
obtienen los objetivos organizacionales [Piedrabuena, 05]. Por consiguiente, es materia de
este proyecto, ya que las herramientas de inteligencia de negocios son un apoyo a la toma
de decisiones, lo que está estrechamente relacionado con los objetivos de la empresa.
Una versión más radical de lo que es la misión de una empresa consiste en que esta
contesta a la pregunta de por qué existe la empresa [Diez de Castro, 01].
5.1.2 Visión
La visión define hacia dónde va la empresa en el largo plazo y orienta las decisiones
estratégicas y de competitividad [Fleitman, 99]. Una característica que tiene la visión es la
de no centrarse única y exclusivamente en el presente de la organización, sino más bien en
las posibles situaciones que se podrían generar con el llegar de nuevas tecnologías, desafíos
productivos, nuevas competencias, etc. [Thomson, 01].
21
Análisis
El análisis FODA tiene la ventaja de ser muy simple y fácil de implementar, lo que
hace de esta herramienta un acercamiento muy rápido y eficaz para empresas de pequeño
tamaño al análisis empresarial [Maturana, 02].
22
Análisis
año 2005 no arrojará los mismos resultados que uno del 2009 de la misma empresa
[Instituto Politécnico Nacional, 02].
5.2.1.1.1 Fortalezas
Son capacidades que tiene la empresa que potencian una posible diferenciación
positiva sobre los demás competidores. Son recursos controlados directamente por la
empresa, habilidades o cualidades en general.
5.2.1.1.2 Debilidades
Son factores internos que gatillan una posición desfavorable frente a los
competidores. Son las carencias de habilidades y cualidades de la empresa.
5.2.1.2.1 Oportunidades
Son todos aquellos aspectos del entorno que resultan positivos y que, de alguna
manera, permiten a la empresa beneficiarse de ellos. Son los aspectos externos a la empresa
que proporcionan elementos de diferenciación con respecto a la competencia.
5.2.1.2.2 Amenazas
Son todas las situaciones externas a la empresa que pueden poner en riesgo la
capacidad competitiva de la misma. Pueden ser tan fuertes como para llegar a poner en
duda la permanencia de la organización. Son variables muy poderosas que difícilmente
pueden ser evadidas del todo, sin embargo, sus efectos han de ser minimizados luego de ser
identificadas.
La identificación de las variables internas y externas puede ser asistidas con el
reconocimiento de las actividades primarias y de apoyo según la teoría de la cadena de
valor [Hax y Majluf, 04].
23
Análisis
5.2.3 Estrategias
Dados los resultados del análisis en la matriz FODA, es necesario adoptar una
iniciativa que permita hacer frente (o tomar ventaja) de la situación que se enfrenta. De la
misma matriz FODA se desprenden 4 estrategias [Marquez, 99].
24
Análisis
25
Análisis
6 Análisis de la empresa
6.1 Misión y Visión
Estudiar la misión y visión de la empresa ayuda a entender de mejor manera sus
motivaciones y anhelos. Esto deberá alinearse con los resultados del análisis FODA y con
la estrategia a seguir.
6.1.1 Misión
“Nuestra misión es satisfacer las necesidades de nuestros clientes del mercado de
insumos médicos con integridad, ofreciendo productos y servicios de la mejor calidad y
variedad a un precio justo. Agregaremos valor a estos productos ofreciendo un excelente
servicio de despacho y poniendo a su disposición los más de 40 años de experiencia que
nos avalan.”
6.1.2 Visión
“Nuestra visión es liderar el mercado de venta y distribución de insumos médicos a
lo largo de la V Región, con el mejor equipo de trabajo y tecnología disponible para
satisfacer las necesidades de nuestros clientes, especialmente en el área de la salud pública
y privada, industria y la seguridad.”
Actividades Primarias
26
Análisis
Actividades de apoyo
Con el fin de analizar la influencia del entorno sectorial y el macro entorno sobre la
empresa, es que realizamos un análisis de 5 fuerzas de Porter:
o Existe gran valor de marca en la quinta región, siendo una empresa conocida
y solicitada por su gran prestación de servicios adicionales a la mera venta
27
Análisis
o No existe propensión por parte del consumidor a sustituir, puesto que son
elementos de primera necesidad y no se puede escatimar en ellos.
o El coste de cambio del comprador es bajo, dado que existen otras empresas
de compra y venta de artículos médicos que venden productos similares. Sin
embargo, si se toman en cuenta los servicios adicionales de post venta que
entrega la empresa, este costo aumento en cierto sentido.
28
Análisis
o Los costos fijos de la actividad son bajos, por lo que la competencia se hace
más dura según ese respecto.
6.2.1 Fortalezas
Buena relación con proveedores
6.2.2 Debilidades
Poca variedad de productos
Precios Altos
29
Análisis
6.2.3 Oportunidades
Cambio monetario favorable
6.2.4 Amenazas
Crisis cohíbe expansión de los negocios
6.2.5 Estrategia
Analizando sólo los factores internos, podemos determinar que la empresa posee
grandes fortalezas, las que claramente han sido fundamentales para la supervivencia en un
mercado tan turbulento como en el de la venta de artículos médicos. De todas ellas, el muy
buen servicio de despacho ha sido un gran elemento de diferenciación. Con respecto a las
debilidades, son elementos que la empresa ha sabido manejar. Aunque sería muy positivo
mejorarlos, es más conveniente enfocar la estrategia en las fortalezas.
Debido a la crisis económica y a la inestabilidad política e incluso social que existe en
gran parte del mundo, son las amenazas las que adquieren una connotación diferente. Si
bien es cierto existe una cantidad importante de oportunidades, las amenazas son mucho
más críticas en este caso (atentan contra la permanencia de la empresa).
La fuerza e importancia que adquieren las amenazas en este caso podrían suponer una
estrategia de supervivencia, pero considerando que Alirio Olivares S.A. es una empresa
fuerte internamente y que, durante años, ha permanecido vigente gracias a esa virtud, es
que se descarta una medida tan extrema. Por lo anterior es que se propone una estrategia
defensiva que haga frente a las peligrosas amenazas, potenciando las fortalezas que puedan
coparlas, es decir, estrategia FA (Maxi – Mini).
30
Análisis
7 Metodología
La utilización de una metodología de trabajo es lo primordial para asegurar que las
distintas etapas del proyecto se alineen entre ellas con el fin de conseguir el objetivo
principal. Usar una metodología en proyectos en los que no se tiene experiencia previa se
hace aún más necesario, como medida cautelar a posibles problemas. Dicho de otro modo,
trabajar al amparo de la madurez de una metodología sólida proporciona seguridad y
consistencia en el desarrollo de las distintas tareas involucradas en el proyecto.
31
Análisis
32
Análisis
3.- Escoger las dimensiones que apliquen a cada fila de la tabla de hechos:
La elección de las dimensiones se obtienen de responder la pregunta: “¿Cómo se
pueden describir los datos que resultan del proceso de negocio?”. Dicho de otro modo, las
dimensiones son descriptores de cada una de las filas de la tabla de hechos.
4.- Identificar los hechos numéricos que poblarán cada una de las filas de la
tabla de hechos:
Los hechos se desprenden de la pregunta: “¿qué queremos medir? “. La elección de
cada hecho debe tener estrecha relación con la elección de la granularidad (paso 2).
La visión más corporativa y amplia de Inmon la hace una buena opción para
proyectos de gran magnitud, pero no es una opción simple de implementar. Los procesos
necesarios para desagregar un data warehouse en distintas unidades base o data marts son
complejos.
33
Análisis
Como se explicaba, la metodología de Moss considera cada una de las etapas del
ciclo BI, pero además ofrece la posibilidad de dejar de lado ciertos pasos de la metodología,
advirtiendo oportunamente los riesgos que implica omitir cada uno de los pasos. Sin
embargo, en un proyecto pequeño existen varios de estos riesgos que no aplican de la
misma manera que un proyecto grande, como también hay riesgos que pueden acrecentarse.
Es por esto último que una adecuación de la metodología a la realidad del presente proyecto
se convierte en una acción obligada.
Las evidencias previamente mostradas ratifican a Moss como la metodología idónea
para este proyecto. No obstante, como también ya se estableció, serán realizadas ciertas
modificaciones en ella para que calce con la realidad de este proyecto.
Las etapas y flujo de la metodología de Moss están ilustrados en la siguiente figura:
34
Análisis
7.2.1 Justificación
Paso 1: Estudio de caso de negocio
En este paso deben presentársele al cliente las razones por las cuales debe ser
implementado el proyecto. Dicho de otro modo, se refiere al momento en que el cliente es
convencido con buenas y claras razones para poner en marcha el proyecto.
Este paso cobra vital importancia al tratarse de la instancia propicia para explicar el
por qué de un proyecto BI en una PYME. Esto es muy importante si va de la mano con
justificación del proyecto con el cliente, ya que él será el primero que deberá entender y
creer que incursionar en el proyecto será beneficioso para su empresa.
7.2.2 Planeación
Paso 2: Evaluación de la infraestructura de la empresa
En este paso se describe la infraestructura técnica y no técnica propia de la empresa
que formará parte de la infraestructura del proyecto, o que de alguna manera se conectará a
él. Además, es necesario especificar qué componentes serán tomados desde los ya
existentes y cuáles son necesarios de ser incorporados.
La especificación de la infraestructura técnica será muy útil para el diseño del ETL
y para mayor claridad y transparencia en la etapa de implementación. Sin embargo, Alirio
Olivares S.A. cuenta con apenas un sistema transaccional de facturación simple y no
existen repositorios de metadata o modelos lógicos que pudiesen ser importados o
reciclados. Por esto último, este paso se reducirá a la evaluación de la infraestructura
técnica de la empresa.
36
Análisis
7.2.4 Diseño
Paso 8: Diseño de la base de datos
Moss propone un diseño de base de datos orientado a los requerimientos de grandes
proyectos, que consideren la desagregación top down o integración bottom up. Sin
embargo, existiendo una única unidad de negocio como parte del sistema, se evidencia la
conveniencia de utilizar un enfoque que ataque en detalle la creación de un data mart.
Por lo anterior, se usará el enfoque de Kimball para el diseño de la base de datos,
por su simpleza y por estar enfocado principalmente al desarrollo de cada data mart por
separado (que sería la totalidad del presente proyecto). Con esto, se prescinde del paso
posterior de integración de data marts, considerando lo generado como la única unidad de
base de datos física del proyecto.
37
Análisis
7.2.5 Construcción
Paso 11: Desarrollo del ETL
Este paso contempla la construcción del ETL, como también el desarrollo del plan
de pruebas respectivo para analizar la integridad de los datos cargados en el data
warehouse.
Moss propone la utilización de 4 ambientes para cada una de las etapas del
desarrollo de aplicaciones de inteligencia de negocios. Estos son:
Ambiente de desarrollo: Donde las aplicaciones son creadas y probadas por los
desarrolladores.
Ambiente de producción: Donde las aplicaciones serán ejecutadas después que sea
puesto en marcha el sistema.
7.2.6 Despliegue
Paso 15: Implementación
Este paso consiste en el despliegue de la solución en el ambiente de producción.
Considera entre sus actividades:
Manejo de la seguridad
Respaldos y recuperación
39
8 Desarrollo del Problema
El sistema será desarrollado de la mano de la metodología de Larissa Moss,
utilizando la metodología de Kimball para el diseño del data warehouse. Las etapas de la
metodología de Moss seleccionadas para este proyecto quedan ilustradas en la siguiente
figura:
40
Diseño
8.1 Justificación
Conductores de Negocio
Los conductores de negocio corresponden a la motivación por la cual se incurrirá en
el proyecto. Alirio Olivares S.A. es una empresa pequeña que se ha mantenido en el tiempo
muy sólidamente gracias a una gran relación con su clientela. Sin embargo, lleva años sin
experimentar un crecimiento significativo. Esta congelamiento del negocio se debe a que el
manejo “por olfato” de una empresa tiene un límite relacionado con el tamaño de esta. Esto
quiere decir que mientras más crece la empresa, más difícil es visualizar la información que
la historia de la misma presenta y, por ende, más complicado se hace el tomar decisiones a
partir de ellas.
Por consiguiente, el conductor de negocio en una pyme se traduce en algo tan obvio
como esencial: mejorar la gestión de la empresa. Para una PYME esto puede ser un antes y
un después, especialmente para aquellas que se encuentran en una posición privilegiada con
respecto a sus competidores directos.
41
Diseño
A partir de esos datos históricos, es posible generar los modelos que darán origen a
al data warehouse y luego a los cubos y reportes para el tan ansiado análisis.
Estudio de Riesgos
Algunos riesgos o aspectos que deben ser tomados en cuenta son:
42
Diseño
necesario mostrar resultados efectivos para todos los niveles de participación, tanto
para la alta gerencia como para los operativos, con el fin de asegurar el compromiso
general con el proyecto.
8.2 Planeación
Hardware
Alirio Olivares S.A. cuenta con 3 computadores de escritorio, cada uno con las
siguientes características:
- Procesador Intel Pentium 4 1.6 Ghz
- 1 Gb RAM
- 256 Mb RAM
- 80 Gb Disco Duro
Se estima que los computadores de escritorio son suficiente como para ser empleados
como clientes del sistema (capa de análisis). En lo que respecta al servidor, claramente se
requerirá una inversión adicional.
43
Diseño
Red
La empresa cuenta con una LAN con conexión a Internet. Dado que sólo tienen una
dependencia física, toda la empresa está conectada. Esta red puede ser utilizada por el
sistema BI sin mayores complicaciones, conectando el servidor del proyecto al router.
Middleware
De middleware es poco lo que se puede decir. El único Middleware existente es el
driver de la base de datos, pero para efectos del proyecto esto no será utilizado, por lo que
se omitirá.
Herramientas de Análisis
Actualmente la empresa no cuenta con ninguna herramienta de análisis.
Plan de proyecto
El plan del proyecto está listado completamente en la primera parte de este informe,
en el capítulo “Actividades”.
44
Diseño
Analizar los comportamientos de las ventas de productos en todos los años de los
que se tiene registro histórico.
8.4 Diseño
45
Diseño
Declaración de Granularidad
La granularidad de la base de datos define qué representa cada hecho de la tabla de
hechos. En el caso de este data warehouse, el detalle que contendrá será a nivel de
transacción. El hecho de elegir granularidad lo más detallada posible aumentará la
versatilidad a la hora de diseñar el cubo OLAP. Además, rediseñar un data warehouse una
vez implementada la capa de análisis conlleva a la necesidad de rehacer también el ETL.
Identificación de Hechos
La elección de los hechos va de la mano de la elección de la granularidad. Los hechos
deben tener relación entre ellos y deben coexistir de manera lógica en cada registro de la
tabla de hechos. Esto quiere decir que deben describir el mismo proceso de negocio. La
elección de hechos es el último paso en el diseño del data warehouse, porque la tarea se
simplifica al conocer de qué manera describirán las dimensiones a la tabla de hechos.
Además, teniendo claridad del proceso de negocio que se quiere apoyar es posible
comprobar la relación de cada hecho con los requerimientos de manera directa. Los hechos
escogidos son los siguientes:
46
Diseño
8.5 Construcción
Carga inicial: Corresponde a la carga de datos una vez puesto en marcha el proyecto
hecha por el desarrollador.
47
Diseño
Carga Histórica: Es una extensión de la carga inicial, pero contempla los cambios
que puedan haberse manifestado durante el tiempo de desarrollo. Esta carga es
hecha por el desarrollador.
Carga Incremental: Corresponde a la carga de datos que se realiza una vez puesto en
marcha el proyecto. Debe definirse una periodicidad. Esta carga es realizada por el
usuario.
La ejecución del ETL será realizada por el usuario una vez que el proyecto esté en
producción. Para esto, es necesario definir una secuencia de carga de datos, en la que se
defina la periodicidad de extracciones de la base de datos transaccional y de lectura de los
archivos .dbf para el llenado del data warehouse. Esto forma parte de las políticas internas
de implementación, por lo que será incluido en las etapas finales.
Herramienta
La herramienta con la que se construyó el ETL es Spoon, el ETL de la Suite de BI
Pentaho. Con esta herramienta es posible realizar desde transformaciones simples (como
lectura de una fuente de datos y escritura de los datos en otra fuente de manera directa)
hasta transformaciones complejas (con joins entre distintos elementos, multiples fuentes de
datos, filtrado de valores, validación por valores de campos, control de flujo de datos, entre
otros).
Las cargas de las tablas se realizan mediante la ejecución del modelo del ETL,
representado de manera gráfica con pasos y flujos.
48
Diseño
las filas que tengan un código de cliente vacío (o nulo) y se envían a un paso que no haga
nada; si el campo tiene algún valor, entonces se pasa la información al último paso que se
encargará de hacer la inserción en la tabla Cliente del Data Mart, manejando las
credenciales e información de conexión respectiva de la base de datos en Mysql.
Figura nº15: Función trim (borrado de espacios sobrantes) sobre campos seleccionados
49
Diseño
Una vez creado el archivo fuente, sólo debe leerse su contenido, seleccionar los campos
y llenarlos en la tabla Fecha de la base de datos Mysql.
50
Diseño
51
Diseño
Data Mart
Para la construcción del Data Mart fue utilizado el motor de base de datos Mysql,
por ser de libre uso y además estar 100% soportado por las herramientas de inteligencia de
negocios a utilizar (Suite Pentaho). la construcción de las tablas fue realizado a mano,
según lo definido en el diseño del data mart.
Cubo
La creación del cubo deberá apoyar las potencialidades de análisis requeridas.
Básicamente, se incorporarán dos elementos fuertes del análisis OLAP: jerarquías y
miembros compartidos.
Jerarquías
Las jerarquías permiten modelar dependencias padre hijo a partir de una misma
dimensión del data warehouse. Esto evita incorporar manualmente relaciones inter tablas a
base de “joins”, reduciendo la complejidad lógica.
52
Diseño
Miembros Compartidos
Los miembros compartidos corresponden a miembros que son replicados en alguna
parte de la misma dimensión a la que pertenecen, ofreciendo otra perspectiva de análisis de
la misma información. Del punto de vista estructurado, son punteros a miembros que
replican toda la información que describen.
Un ejemplo de miembro compartido puede apreciarse en la dimensión cliente. Los
clientes son agrupados por su giro, pero también es necesario analizarlos por su ciudad de
origen. Sin embargo, el miembro “cliente” bajo ambas jerarquías es el mismo, debiendo
uno depender del otro.
Las dimensiones del cubo son las siguientes:
53
Diseño
54
Diseño
Un cubo está determinado por estructuras XML, las que son definidas en un
comienzo por el Aggregation Designer.
Las consultas sobre los cubos se realizan en lenguaje MDX (Expresiones multi
dimensionales).
El esquema del cubo de Ventas de esta solución es el siguiente:
<Schema name="AOSA">
<Cube name="Ventas" cache="true" enabled="true">
<Table name="metrica" alias="">
</Table>
<Dimension type="StandardDimension" foreignKey="Fecha_Key"
name="Tiempo">
<Hierarchy name="Por Año" hasAll="true" allMemberName="Por
Año - Todos" primaryKey="fecha_key" primaryKeyTable="fecha">
<Table name="fecha" alias="">
</Table>
55
Diseño
</Dimension>
<Dimension type="StandardDimension" foreignKey="Codigo_Cliente"
name="Cliente">
<Hierarchy name="Por Giro" hasAll="true" allMemberName="Por Giro -
Todos" primaryKey="Codigo_Cliente" primaryKeyTable="cliente">
<Table name="cliente" alias="">
</Table>
56
Diseño
</Level>
</Hierarchy>
</Dimension>
<Dimension type="StandardDimension" foreignKey="Codigo_Vendedor"
name="Vendedor">
<Hierarchy name="Vendedores" hasAll="true" allMemberName="Vendedores -
Todos" primaryKey="Codigo_Vendedor" primaryKeyTable="vendedor">
57
Diseño
</Table>
<Level name="Vendedor" table="vendedor" column="Nombre_Vendedor"
type="String" uniqueMembers="false" levelType="Regular" hideMemberIf="Never">
</Level>
</Hierarchy>
</Dimension>
<Measure name="Venta" column="Venta" datatype="Numeric"
aggregator="sum" visible="true">
</Measure>
<Measure name="Monto" column="Monto" datatype="Numeric"
aggregator="sum" visible="true">
</Measure>
El esquema del cubo define jerarquías y niveles de consolidación anidando los tags
del xml. De esta forma, la estructura del cubo se hace más natural de leer y entender.
58
Diseño
Este reporte muestra a los mejores clientes del año 2008 ordenados de manera
descendente, según ventas
59
Diseño
Este reporte grafica qué vendedores son los que tienen más ventas según el criterio
de tipo de venta.
60
Diseño
Este reporte grafica en qué parte del año fue más vendida una cierta familia de
productos. Además, ilustra qué familia de productos fue más vendida el año 2008 en su
total.
61
Diseño
62
9 Herramientas
9.1 Pentaho
La Suite Open Source de Pentaho, provee un completo espectro de funcionalidades de
Business Intelligence, incluyendo reportes, análisis, tableros de control, minería de datos,
integración de datos y una plataforma de BI que la han convertido en la suite de código abierto
más popular del mundo. Los productos Pentaho son utilizados por organizaciones líderes tales
como MySQL, Motorola, Terra Industries, DivX entre otras [Pentaho, 09].
Pentaho Corporation es el patrocinador principal y líder del proyecto Pentaho BI. El
proyecto Pentaho BI es una iniciativa en curso de la comunidad Open Source que provee a las
organizaciones de las mejores soluciones de su clase para sus necesidades de inteligencia de
negocios. Al aprovechar la riqueza de las tecnologías de código abierto y las contribuciones de la
comunidad de desarrollo de código abierto, Pentaho es capaz de innovar mucho más rápido que
los proveedores comerciales. Como resultado, Pentaho ofrece una alternativa de código abierto
que supera a las soluciones de Business Intelligence propietarias en muchas áreas como
arquitectura, soporte de estándares, funcionalidad y simplicidad de implantación. En otras
palabras, no se espera que la gente la adopte sólo porque es de código abierto sino porque es
superior.
Reportes
Análisis
Tableros de control
Minería de datos
9.2 Jaspersoft
La Suite de Business Intelligence Jaspersoft es un completo conjunto de herramientas
Open Source desarrolladas por Jaspersoft que provee de reportes sólidos, servidores de reporte,
análisis de datos e integración de los mismos para empresas que necesiten realizar decisiones
rápidas y mejores sobre su negocio [Jaspersoft, 09].
La visión principal de Jaspersoft BI Suite es cubrir todo tipos de empresas, ya sean
grandes o pequeñas, y que pueda ser integrado tanto con otras soluciones Open Source como con
soluciones propietarias. Esta Suite nace de la necesidad de complementar uno de los productos
estrella de la compañía llamado JasperReports, el cual es una librería de reportes desarrollada en
Java, y que ha tenido una amplia aceptación debido a que esta puede ser integrada en complejas
aplicaciones de reportes existentes hoy en día.
La Suite está orientada para que sea utilizada por usuarios esporádicos hasta analistas de
negocio y ejecutivos.
Jaspersoft BI Suite está compuesto por varios productos, estos son:
64
Diseño
Los productos de la Suite al ser desarrollados puramente en Java pueden ser integrados con
otros sistemas o bien pueden ser utilizados cada uno por separado.
65
Diseño
10 Propuesta Metodológica
La metodología que se utiliza para este proyecto corresponde a un derivado de la
metodología de Larissa Moss, además de la incorporación de Kimball para la creación del Data
Warehouse. Sin embargo, si se pensara en masificar este tipo de soluciones para la pequeña y
mediana empresa, el trabajo de adaptar una metodología a cada caso en particular se haría
demasiado tedioso, además de no garantizar una correcta aplicación de cada método.
No existe una metodología que albergue las excepciones y condiciones naturales de una
empresa chilena pequeña o mediana, lo que se traduce en una complejización del análisis y
diseño de un proyecto sobre este nicho, haciendo el desarrollo en masa virtualmente
impracticable.
Una metodología es un conjunto de procedimientos conectados mediante principios
lógicos. Una serie de pasos conectados arbitrariamente no es una metodología, son sólo un
conjunto de pasos. Para proponer una metodología es necesario un procedimiento consistente que
explique las decisiones de diseño. Es por esto que se optó por generar esta propuesta a través del
método científico, específicamente la formulación de método empírico-analítico de Neil Salkind.
El objetivo es generar una propuesta metodológica que permita realizar proyectos de
inteligencia de negocios para pequeñas y medianas empresas de Chile (V Región).
Lo que se presentará a continuación son los pasos a seguir para la generación de una
propuesta metodológica.
Identificación de variables.
Recopilación de la información.
Prueba de la Hipótesis.
66
Diseño
Reconsideración de la teoría.
Confirmación o refutación.
La problemática es, como fue señalado más arriba, la ausencia de una metodología que
albergue las necesidades de una pequeña y mediana empresa de Chile para el desarrollo de un
proyecto de inteligencia de negocios.
Para generar una metodología enfocada a un nicho en particular, primero es necesario
entender las características del mismo. Una vez hecho esto, se debe contrastar esa descripción
con la considerada en las demás metodologías, por ejemplo, Larissa Moss.
Tecnología
Educación empleadores
Trabajadores
Idioma
Exportaciones
Certificación
67
Diseño
Un nicho de mercado es parte de un segmento más grande del mismo. Las empresas que
serán consideradas en esta metodología corresponden a un sector productivo y de servicios del
país (dejando de lado el potencial internacional). En Chile, el nicho de la “Mediana Empresa”
posee necesidades o deseos específicos y parecidos.
El nicho de la mediana empresa presenta una “buena predisposición” por adquirir un
producto o servicio que satisfaga sus expectativas y, en el caso de las empresas u organizaciones,
tienen la capacidad de tomar decisiones de compra. Lo más atractivo a observar, si se quiere
focalizar esfuerzos organizacionales sobre competencias técnicas, es que existe la capacidad
económica que les permite incurrir en los gastos necesarios para obtener la satisfacción de su
necesidad o deseo. Incluso, están dispuestos a pagar un monto adicional por valor agregado.
En Chile el Ministerio de Economía define a las MIPYMES según las ventas anuales en UF
según el siguiente esquema:
68
Diseño
Microempresa hasta 9
Tecnologías
Un 70.4% de las pequeñas empresas y un 92.5% de las medianas cuenta con acceso a
Internet. En el caso de los sectores económicos, un 86% de las empresas de servicios financieros
tiene acceso a esta herramienta, mientras que sólo un 53.8% de las empresas del sector comercio
tienen acceso a Internet.
Por otra parte, mientras un 59.9% de las medianas empresas tiene página web, sólo un
26.0% de las pequeñas posee un sitio en Internet. En tanto, un 44.9% de las empresas del sector
de servicios financieros tiene página web.
Educación empleadores
Casi un 70% de los socios o gerentes generales de las empresas medianas tienen educación
universitaria o de postgrado, y un 50% de los socios o gerentes generales de las pequeñas
empresas tienen ese nivel educacional.
69
Diseño
Las pequeñas y medianas empresas son responsables de más de 90% del empleo en Chile.
Trabajadores
Durante 2005, las pequeñas y medianas empresas contrataron más obreros calificados que
cualquier otro tipo de trabajador. En el caso de las medianas empresas, los empleados
administrativos fueron el segundo tipo de trabajador más requerido.
Tanto en las pequeñas como en las medianas empresas, la gran mayoría de los trabajadores
(más del 40%) son obreros, y en ambos casos el porcentaje de ejecutivos no supera el 20%.
Idioma
Entre un 7,5% y un 10% del personal de pequeñas y medianas empresas habla inglés en
algún nivel. Sin embargo, sólo entre un 0% y un 4% de los trabajadores considera que sabe hablar
inglés en un nivel medio o avanzado.
Por otra parte, la mayor proporción de trabajadores que habla inglés trabaja en el sector de
servicios financieros y profesionales, y la menor proporción en el sector industrial.
Exportaciones
Certificación
Un 9% de las empresas pequeñas y un 24% de las medianas, cuentan o está en trámite para
adquirir algún tipo de certificación de proceso o calidad [CORFO, INE, 10].
70
Diseño
71
Diseño
11 Conclusiones
En el presente informe, se han expuesto las tecnologías necesarias para implementar
herramientas de análisis de gestión. Con respecto a esto, se evidencia una gran cantidad de
variantes de implementación, gracias a la versatilidad de las herramientas. Las distintas
herramientas disponibles en el mercado utilizan diferentes tipos de tecnología OLAP, lo que hizo
más fácil la elección de las herramientas, centrándose esta en la Suite de Pentaho, con el fin de
evitar coordinar y conectar módulos de diferentes propietarios.
Se cumple el objetivo de este informe en términos de generar un acercamiento positivo
entre la realidad de una PYME y el complejo mundo de la inteligencia de negocios. El análisis
empresarial efectuado arrojó elementos interesantes y desafíos importantes aunque abordables,
con respecto a la solución de problemas mediante el uso de herramientas BI. Eso más el apoyo
que dio el gran interés por parte de la contraparte en la empresa en cuestión, hizo de este un
proyecto muy dinámico.
Se hizo un análisis de los requerimientos del proyecto y se formuló una solución de la
mano de la metodología de Larissa Moss, con el apoyo de la metodología de construcción de data
warehouse de Ralph Kimball. Se hizo el diseño y construcción del data warehouse y se construyó
el cubo OLAP que se implementó como solución BI a la problemática de negocio: mejorar la
gestión de las ventas.
En otros términos, se logró un avance significativo en el acercamiento de una solución BI
a una PYME. Se logró demostrar que una metodología BI integral puede ser acoplada a los
requerimientos de una pequeña empresa sin mayores problemas. Se demostró también la
potencialidad analítica que presenta una empresa pequeña teniendo historia transaccional entre
sus activos.
El ETL fue construido de manera exitosa. Tras bastantes complicaciones debido a poca
uniformidad en los datos de origen, fue posible ejecutar con éxito cada uno de los modelos que
terminaron en el llenado del data mart.
Un proyecto BI es aplicable 100% a una PYME si se tienen correctas nociones de los
alcances de un eventual proyecto. Una capa de presentación amigable y orientada al negocio
mantiene alejado al usuario final de complicadas actividades como la programación o las
consultas a bases de datos. Esto hace que, sin importar cuál sea la naturaleza del negocio, el
usuario final pueda centrarse sólo en el análisis y no perder tiempo en prepararlo.
era el potencial de estas tecnologías que podían ser capitalizados de manera efectiva por una
pequeña empresa.
La inteligencia de negocios basa su terminología en conceptos sencillos, haciendo fácil una
primera inmersión en los temas relacionados a ella. Esto ayudó a centrar la conversación con
Alirio Olivares S.A. en las problemáticas de negocio y no en tratar de explicar cosas complejas.
A su vez, esta fue la razón del gran interés presentado por la dueña de Alirio Olivares S.A. en la
conversación inicial.
El trabajo realizado fue en gran parte hecho en la oficina de AOSA, por lo que se tuvo
mucha cercanía con el cliente. Esto permitió tener instancias de validación en la etapa de
levantamiento, como también en la implementación. Además, se generaron instancias de trabajo
grupal para la definición de reportes.
Los entregables del proyecto comenzaron bastante antes de la finalización del mismo, lo
que mantuvo constantemente el interés de los usuarios. Además, los informes y reportes no
permanecieron de manera exclusiva en la gerencia de la empresa, quedando disponible en
algunos casos para vendedores y administrativos, mostrando la información de manera clara y
entendible, lo que posibilitó una participación más profunda en el negocio por parte de muchos
de los miembros de la empresa.
Esto último tuvo un efecto positivo en la forma en que la empresa entiende su misión y la
manera en que la operativiza. A medida que los empleados fueron siendo incluidos en los análisis
e interpretaciones de la información presentada,se percibió un mayor compromiso con la
empresa. Además, el entender las metas y objetivos de manera gráfica y participativa permite que
los caminos recorridos para lograrlos sean comprendidos y puestos en marcha en función de
lograr un resultado positivo para la empresa y no resulten en realizar tareas sólo por hacerlas.
Por último, el trabajo realizado no sólo tuvo un efecto en la implementación misma, sino
que también representó una experiencia de aprendizaje interno para los usuarios tanto gerenciales
como no gerenciales, lo que sin duda cimienta el camino para la adopción de nuevas
implementaciones.
73
Diseño
12 Referencias
[Wolff, C. G., 2002]. La Tecnología Datawarehousing (pág 2). Concepción, Chile
[Walton, S. & Cline, A., 2000]. Data Warehouses/Data Marts (pág 1). Carolla
Development
[Forsman, S., 1997]. OLAP Council Whitepaper (pág 1). Olap Council
[Thomsen, E., 2002]. OLAP Solutions: Building Multidimensional Information Systems,
Second Edition (pág 5). New York: Wiley
[Kotler, P. & Ketler, K., 2006]. Marketing Management, 12th Edition (pág 44-52). United
States.
[Kotler, P. & Armstrong, G. & Cámara, D. & Cruz, I., 2004]. Marketing, 10th Edition (pág
43).
[Piedrabuena, F., 2005]. Relevamiento: Diseño Físico de Sistemas OLAP (pág 3 - 4).
Montevideo: PEDECIBA Informática
[Llombart, O. A., 2008] BI: Inteligencia Aplicada al Negocio (pág 17). España
[Diez de Castro, E. P., 2001]. Administración y Dirección (pág 244).
[Fleitman, J., 1999]. Negocios Exitosos. McGraw-Hill
[Thomson, A., 2001]. Administración Estratégica Conceptos y Casos 11ª Edición (pág 4).
México: McGraw-Hill
[Maturana, C., 2002]. Análisis FODA: un instrumento de aplicación práctica para las
MYPYMES (pág 5). Managua: Universidad Americana U.A.M.
[Instituto Politécnico Nacional, 2002]. Metodología para el Análisis FODA (pág 8).
Dirección de planeación y organización
[Hax, A. & Majluf, N., 2004]. Estrategias para el liderazgo competitivo. Santiago: Granica
[Marquez, F., 1999]. Autonomías y Análisis FODA. Ecuador.
[Kimball, R., 2002]. The DataWarehouse Toolkit. Wiley
74