Cubos OLAP
Cubos OLAP
Cubos OLAP
7 Votos Cubos OLAP (On-Line Analytic Processing): Son las herramientas que se basan en la capacidad de analizar y explorar por los datos. Nos permiten cambiar el enfoque del que esta pasando? que podemos obtener a travs de las herramientas de reporting al por que esta pasando?. Para descubrir el por que, los usuarios pueden navegar y profundizar en los datos para analizar los detalles o patrones.Las herramientas OLAP nos proporcionan analisis interactivo por las diferentes dimensiones de los datos (por ejemplo, tiempo, producto, cliente, criterios geogrficos, etc) y por los diferentes niveles de detalle (para la dimensin tiempo, habr nivel de detalle ao, trimestre, mes, dia). Esto significara pasar de la visin esttica de los datos a una visin dinmica, donde podemos ir navegando por los datos, bajando en el nivel de detalle, cambiando la dimensin por la cual analizamos la informacin. El tipico ejemplo sera una tabla con los datos de ventas y margenes por delegacin de una empresa, y cuando observamos un indicador de rentabilidad negativa, buceamos en los datos de esta delegacin hasta dar con el producto que se esta vendiendo a precios de coste con margen negativo. Este sera el tipico ejemplo de los Cubos Olap y los visores multidimensionales que nos permiten profundizar en los datos. Nos permitiran contestar a la pregunta: que sucedio y por que?.
Ejemplo de Visor Olap (Palo Web Client) Para entender que se analiza mediante los cubos Olap, hemos de saber que la informacin de gestin se compone de conceptos de informacin (dimensiones) y coeficientes de gestin (indicadores), que los cuadros directivos de la empresa pueden consultar segn las dimensiones de negocio que se definan.Dichas dimensiones de negocio se estructuran a su vez en distintos niveles de detalle (por ejemplo, la dimensin geogrfica puede constar de los niveles nacional, provincial, ayuntamientos y seccin censal). Este tipo de sistemas ha existido desde hace tiempo, en el mundo de la informtica bajo distintas denominaciones: cuadros de mando, MIS, EIS, etc. En general, los sistemas OLAP deben:
Soportar requerimientos complejos de anlisis. Analizar datos desde diferentes perspectivas. Soportar anlisis complejos contra un volumen ingente de datos.
La funcionalidad de los sistemas OLAP se caracteriza por ser un anlisis multidimensional de datos corporativos, que soportan los anlisis del usuario y unas posibilidades de navegacin, seleccionando la informacin a obtener. Normalmente este tipo de selecciones se ve reflejada en la visualizacin de la estructura multidimensional, en unos campos de seleccin que nos permitan elegir el nivel de agregacin (jerarqua) de la dimensin, y/o la eleccin de un dato en concreto, la visualizacin de los atributos del sujeto, frente a una(s) dimensiones en modo tabla, pudiendo con ello realizar, entre otras las siguientes acciones:
Rotar (Swap): alterar las filas por columnas (permutar dos dimensiones de anlisis) Bajar (Down): bajar el nivel de visualizacin en las filas a una jerarqua inferior. Detallar (Drilldown): informar para una fila en concreto, de datos a un nivel inferior. Expandir (Expand): id. anterior sin perder la informacin a nivel superior para ste y el resto de los valores.
Para ampliar el glosario de conceptos OLAP y de otros relacionados con el mundo BI, os recomiendo la visita a la pgina: http://www.dssresources.com/glossary/olaptrms.html Tal y como la tecnologa y los usuarios han evolucionado y madurado, las distinciones entre OLAP y las herramientas de reporting se han vuelto considerablemente confusas. Podemos tener informes bien formateados o sumarizados basados en datos multidimensionales y el usuario querr enseguida navegar y bucear en los datos para ver el problema con una metrica en particular. En este caso, el usuario no querra ser forzado a tener que pasar a una herramienta separada para analizar y explorar. Las siguientes caractersticas continuan distinguiendo las herramientas OLAP de las herramientas de query y reporting tools:
En una herramienta Multidimensional los usuarios analizan los valores numericos de diferentes dimensiones (como producto, tiempo, geografia). En un informe, por otro lado, solo hay una dimensin de anlisis. El cambio entre las diferentes dimensionales de analisis y los diferentes niveles de ellas es muy rpido en este tipo de herramientas. Si un usuario hace un doble click en la dimensin tiempo, en el nivel Ao, rapidamente va a poder ver la informacin de un mes o de un da en concreto, sin tiempos de espera excesivos. En un informe, los tiempos de calculo pueden ser muy considerables (hasta llegar incluso al punto de tener que se programados en procesos batch su ejecucin). La herramienta Olap es sumamente interactiva, permitiendonos pivotar sobre la informacin viendola desde diferentes perspectivas y cambiar dichas perspectivas de una forma muy rapida. Analizando las ventas por mes, podremos cambiar la visin de la informacin para verla por producto o por tipo de cliente. Ademas se pueden establecer filtrados interactivos y el desglose de la informacin se puede realizar para un subconjunto de la dimension en concreto. Este tipo de interaccin con los datos es imposible con los informes (aunque posible en algunos productos).
Para distinguir los requerimientos OLAP, es importante distinguir entre las plataformas OLAP y los interfases de usuario OLAP.
Plataformas OLAP
La plataforma OLAP es aquella en la que se almacenan los datos para permitir el anlisis multidimensional. El cubo mostrado en la imagen superior representa una base de datos OLAP. En este contexto, los usuarios finales no tendrn que preocuparse como se almacena la informacin, si se replica, tiene cache o que tipo de arquitectura utiliza, pero todos estos aspectos si influiran en que tipo de herramienta front-end puede utilizar, que podr analizar y como. Hay cuatro tipos de arquitectura OLAP: 1.Relational OLAP (ROLAP): este tipo de plataforma almacena los datos en una base de datos relacional, lo que implica que no es necesario que los datos se repliquen en un almacenamiento separado para el anlisis (veremos que en la mayora
de los casos es preferible esta diferenciacin). Los calculos se realizan en una base de datos relacional, con grandes volumenes de datos y tiempos de navegacin no predecibles. Parte de la premisa que las capacidades Olap se desarrollan mejor contra este tipo de bases de datos. El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona la funcionalidad analtica.
El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y obtencin del dato. El nivel de aplicacin es el motor que ejecuta las consultas multidimensionales de los usuarios. El motor ROLAP se integra con niveles de presentacin, a travs de los cuales los usuarios realizan los anlisis OLAP.
Los usuarios finales ejecutan sus anlisis multidimensionales, a travs del motor ROLAP, que transforma dinmicamente sus consultas a consultas SQL. Se ejecutan estas consultas SQL en las bases de datos relacionales, y sus resultados se relacionan mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios. La arquitectura ROLAP es capaz de usar datos precalculados si estos estn disponibles, o de generar dinmicamente los resultados desde los datos elementales si es preciso. Esta arquitectura accede directamente a los datos del Data Warehouse, y soporta tcnicas de optimizacin de accesos para acelerar las consultas. Estas optimizaciones son, entre otras, particionado de los datos a nivel de aplicacin, soporte a la desnormalizacin y joins mltiples. Algunos fabricantes son: Oracles BI EE, SAP Netweaver BI, MicroStrategy, Cognos 8, BusinessObjects Web Intelligence. 2.Multidimensional OLAP (MOLAP):los datos son replicados en plataformas con un almacenamiento construido a proposito que asegura mayor velocidad en los anlisis. Los calculos se llevan a cabo en un servidor con una base de datos multidimensional, partiendo de la premisa que un sistema OLAP estara mejor implantado almacenando los datos multidimensionalmente. El sistema MOLAP utiliza una arquitectura de dos niveles: La bases de datos multidimensionales y el motor analtico.
La base de datos multidimensional es la encargada del manejo, acceso y obtencin del dato. El nivel de aplicacin es el responsable de la ejecucin de los requerimientos OLAP. El nivel de presentacin se integra con el de aplicacin y proporciona un interfaz a travs del cual los usuarios finales visualizan los anlisis OLAP. Una arquitectura cliente/servidor permite a varios usuarios acceder a la misma base de datos multidimensional.
La informacin procedente de los sistemas operacionales, se carga en el sistema MOLAP, mediante una serie de rutinas batch. Una vez cargado el dato elemental en la Base de Datos multidimensional (MDDB), se realizan una serie de clculos en batch, para calcular los datos agregados, a travs de las dimensiones de negocio, rellenando la estructura MDDB. Tras rellenar esta estructura, se generan unos ndices y algoritmos de tablas hash para mejorar los tiempos de accesos a las consultas. Una vez que el proceso de compilacin se ha acabado, la MDDB est lista para su uso. Los usuarios solicitan informes a travs del interface, y la lgica de aplicacin de la MDDB obtiene el dato. La arquitectura MOLAP requiere unos clculos intensivos de compilacin. Lee de datos precompilados, y tiene capacidades limitadas de crear agregaciones dinmicamente o de hallar ratios que no se hayan precalculados y almacenados previamente. Algunos fabricantes son: Oracles Hyperion Essbase, Microsoft Analysis Services, TM1, SAS OLAP, Cognos PowerCubes. 3.Hybrid OLAP (HOLAP): plataformas que usan una combinacin de varias tcnicas de almacenamiento.Las agregaciones se realizan en cache, pero el drill-down a traves de la base de datos relacional. Algunos fabricantes son: Microsoft Analysis Services, SAS OLAP, Oracles Hyperion Essbase. 4.Dynamic OLAP (DOLAP): generan una pequea cache multidimensional cuando los usuarios ejecutan las consultas contra la base de datos. Algunos fabricantes son: BusinessObjects Web Intelligence, Oracles Hyperion Interactive Reporting(formerly Brio).
Los sistemas con alta volatilidad de los datos (aquellos en los que cambian las reglas de agregacin y consolidacin), requieren una arquitectura que pueda realizar esta consolidacin ad-hoc. Los sistemas ROLAP soportan bien esta consolidacin dinmica, mientras que los MOLAP estn ms orientados hacia consolidaciones batch. Los ROLAP pueden crecer hasta un gran nmero de dimensiones, mientras que los MOLAP generalmente son adecuados para diez o menos dimensiones. Los ROLAP soportan anlisis OLAP contra grandes volmenes de datos elementales, mientras que los MOLAP se comportan razonablemente en volmenes ms reducidos (menos de 5 Gb). Por ello, y resumiendo, el ROLAP es una arquitectura flexible y general, que crece para dar soporte a amplios requerimientos OLAP. El MOLAP es una solucin particular, adecuada para soluciones departamentales con unos volmenes de informacin y nmero de dimensiones ms modestos.
Visores OLAP
Los visores Olap son las herramientas que nos permiten atacar a la base de datos OLAP para sacar todo el partido a los datos con las consideraciones que hemos indicado. Una de las herramientas mas utilizada para visualizar el cubo es Microsoft Excel. De hecho, tres de los productos Olap lideres la utilizaron inicialmente como unico interfaz (Oracles Hyperion Essbase, Microsoft Analysis Services, SAP Business Explorer). Con Excel, los usuarios abren su hoja e inmediatamente pueden hacen drill en las celdas y en las Excel Pivot Tables para recuperar y explorar sus datos.
Ejemplo de Excel comoVisor Olap Hoy en dia, Excel continua siendo una importante interfaz OLAP, pero ademas, los usuarios pueden explorar los datos a traves de los visores OLAP. Hay visores basados en Web, que ademas tienen capacidades de navegacion y charting avanzadas. Tambien pueden disponer de herramientas de query y de generacin de informes. Expresiones Multidimensionales (MDX): en un lenguaje query similar al SQL que nos permite realizar consultas sobre una base de datos OLAP. Microsoft desarrollo este lenguaje para trabajar con su servidor OLAP, y al ganar el MDX aceptacin entre la industria, un gran numero de fabricantes la incorporaron a sus bases de datos, de forma que hoy muchos visores OLAP generan MDX para acceder y analizar los datos de diferentes bases de datos OLAP. Igual que las herramientas de query y reporting permiten a los usuarios recuperar informacin de las bases de datos relaciones sin conocer el lenguaje SQL, los visores OLAP nos permiten acceder a los datos de un BD Olap sin necesidad de conocer las expresiones multidimiensionales del lenguaje MDX.