Práctica2.1 ImplemFuenteDatos-P3

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Manual de Prácticas Bases de Datos Multidimensionales I.T. Z.

PRÁCTICA No. 2.1


Implementación de la base de datos de una fuente operacional

I Competencia a desarrollar
El estudiante implementará la base de datos que representa la fuente de datos (la base
de datos operacional) para un Data Warehouse con una arquitectura de tres capas.

II Introducción
La arquitectura de un Data Warehouse queda establecida de acuerdo al número de
capas de datos que están involucradas en todo el sistema. Dependiendo del número
de capas de datos, los Data Warehouses pueden ser clasificados de acuerdo a tres
tipos (cierta bibliografía podría mencionar hasta 4 tipos):
a) Data Warehouse de una capa: en esta arquitectura existe una sola capa de
datos. Dicha capa de datos está representada por la base de datos operacional.
Esta única capa de datos sirve para dos propósitos: 1) para almacenar los
datos del (los) sistema(s) operacional(es) y realizar procesamiento
transaccional (OLTP) y 2) para realizar procesamiento analítico (OLAP) para el
soporte a la toma de decisiones. La ventaja de esta arquitectura es su
simplicidad y economía, ya que la única fuente de datos que existe sirve para
dos propósitos diferentes, permitiendo de esta manera no invertir nada en
hardware y solamente un poco en las herramientas OLAP. La desventaja es la
enorme degradación de la eficiencia del todo el sistema, ya que el DBMS debe
atender solicitudes transaccionales, así como analíticas.
b) Data Warehouse de dos capas: en esta arquitectura existen dos capas de
datos. La primera está representada por la base de datos operacional, la cual
nos permite realizar procesamiento OLTP de las aplicaciones operacionales.
La segunda capa, generada a partir de los datos de la base de datos
operacional, nos permite realizar procesamiento OLAP para el soporte a la
toma de decisiones. Es común que haya más de una base de datos que
representen la segunda capa de datos.

9
Manual de Prácticas Bases de Datos Multidimensionales I.T. Z.

La ventaja de esta arquitectura es que no degrada a los sistemas operacionales


ni a los analíticos, cada tipo de aplicación tiene su propia base de datos para
realizar su trabajo. La desventaja radica en que debido a la duplicidad de
información (la segunda capa en el caso extremo es una copia tal cual de la
primera) es posible que exista desincronización de los datos en ambas capas
o entre los datos de la segunda capa, es decir, se puede presentar el caso de
tener datos inconsistentes, de tal forma que el procesamiento OLAP podría
erróneo o inconsistente debido a información desacoplada entre los datos de
la primer y segunda capa, o entre los datos de la segunda capa.
c) Data Warehouse de tres capas: En esta arquitectura existen tres capas de
datos. La primera es la base de datos operacional (teniendo la misma función
que en la arquitectura de dos capas). La segunda capa, es una base datos
altamente integrada y consistente que representa la única fuente de datos
autorizada para obtener datos para la realización de procesamiento analítico.
Y la tercer capa, que puede consistir de distintas bases de datos físicas,
llamados Data Marts, generadas a partir de la segunda capa de datos, nos
permite realizar procesamiento analítico para los distintas áreas de un
corporativo. La ventaja de esta arquitectura es que todos los Data Marts son
generados a partir de segunda capa de datos, la cual, como lo mencionamos
anteriormente es una capa de datos con un alto grado de consistencia. Esta
segunda capa, es lo que comúnmente llamamos el Data Warehouse.

III Correlación con los temas de estudio


2.1 Conceptos de Modelación dimensional
2.2 Metodología de Kimball para el análisis y diseño de almacenes de datos

10
Manual de Prácticas Bases de Datos Multidimensionales I.T. Z.

IV Medidas de seguridad e higiene


Durante el desarrollo de la práctica, el alumno deberá cumplir las siguientes normas
de higiene y seguridad:
• Prohibido tomar alimentos o bebidas dentro del laboratorio.
• Prohibido fumar dentro del laboratorio.
• No sobrecargar los suministros de energía eléctrica.
• No tender cables de cualquier tipo sobre áreas de paso.
• Mantener limpia su área de trabajo.

V Material y equipo necesario


a) Software:
• Sistema operativo (Windows, Linux)
• Buscador de internet (google, yahoo, entre otros)
• Procesador de texto (Word, Writter, entre otros)
• Sistema manejador de base de datos (DBMS). Se recomienda utilizar
MySQL.

b) Hardware:
• Computadora con requerimientos mínimos
• Red computacional con acceso a servicios web

VI Metodología
1. Instalar algún DBMS en la computadora de trabajo. Se sugiere MySQL.
2. Implementar la base de datos que se muestra en la figura 3.1; Requisito hacerlo
a través de un script en SQL.

11
Manual de Prácticas Bases de Datos Multidimensionales I.T. Z.

Figura 3.1 Esquema de la fuente operacional de un Data Warehouse de tres capas

3. Agrega tuplas con información variada a cada tabla de la fuente de datos. Mínimo
agrega, para cada tabla el siguiente número de tuplas.
a) Estados: 5 tuplas, represantando cada una un estado de la república
mexicana
b) Ciudades: 15 tuplas (3 ciudades por cada estado)
c) Hospitales: 30 tuplas (2 por cada ciudad)
d) Doctores: 90 tuplas (3 por hospital)
e) Desarrollo físico: 8 tuplas, representado las etapas de vida en el desarrollo
físico de una persona. Ejemplo: bebé, niño, adolecente, etc.
f) Pacientes: 300 tuplas, representando cada tupla un paciente.

12
Manual de Prácticas Bases de Datos Multidimensionales I.T. Z.

g) Conceptos: 8 tuplas, cada tupla respresentando un concepto de cobro de


un hospital a un paciente. Por ejemplo: consulta, medicamentos, análisis,
etc.
h) Facturas: 400 tuplas, cada tupla representado los datos generales de la
factura
i) Facturas detalle: 800 tuplas, cada tupla representano un concepto cobrado
a un paciente.
4. Crear un script con comandos de SQL para insertar las tuplas solicitadas en el
punto anterior, o en su defecto un programa que genere automáticamente las
tuplas requeridas en cada tabla (muy recomendable esta opción para las tablas
de pacientes, facturas y facturas detalle, por ser las más grandes). Recuerde que
debe haber información variada. Para el caso de la fecha de la factura, considerar
fechas que abarquen todo un año en particular

VII Sugerencias didácticas


• Formar equipos de tres o cuatro personas para la realización de la práctica.
• Al término de la práctica, tener una sesión plenaria para que los alumnos
comenten lo, el profesor responda dudas y se obtengan conclusiones de la
práctica

VIII Reporte del alumno


Cada equipo de trabajo, deberá entregar en forma impresa y digital, un reporte con las
siguientes características:
a) Portada con los siguientes datos:
• Nombre de la materia y grupo
• Nombre y número de la práctica
• Integrantes del equipo, especificando número de control y nombre
completo, empezando con apellidos.
• Fecha

13
Manual de Prácticas Bases de Datos Multidimensionales I.T. Z.

b) Índices de contenido, figuras y tablas.


c) Contenido (todo lo solicitado en el punto VI)
• Script de la creación de la base de datos operacional.
• Script o programas para insertar información a la base de datos
operacional.
• Diagrama del esquema de la base de datos operacional.
• Listado de cada tabla con la información insertada.
d) Bibliografía
e) Paginado
f) Cada figura, cuadro o tabla deberá estar referenciada en el texto
g) El reporte digital enviarlo a donde lo solicite el profesor (mail, Facebook,
plataforma educativa, sitio web, entre otras)

IX Bibliografía

[1] W.H. Inmon. Building the Data Warehouse. 4th Edition. Indianapolis: Wiley
publishing incorporation, 2005
[2] Ralph Kimball , Margy Ross. The Data Warehouse Lifecycle Toolkit. Second
Edition.John Wiley & Sons, Inc. January 10, 2008
[3] MySQL. Disponible en https://www.mysql.com/

14

También podría gustarte