PIAD-619_MATERIAL
PIAD-619_MATERIAL
PIAD-619_MATERIAL
MATERIAL TÉCNICO
DE APOYO
Inteligencia De Negocios Y Dataware
TAREA N°01
Con una estructura básica, sistemas operativos y archivos planos proporcionan datos
en bruto que se almacenan junto con metadatos. Los usuarios finales pueden acceder
a ellos para su análisis, generación de informes y minería.
Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y el
2
Inteligencia De Negocios Y Dataware
almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar
en el almacén. Es posible personalizar la arquitectura del almacén para diferentes
grupos dentro de la organización.
Se puede hacer agregando data marts, que son sistemas diseñados para una línea de
negocio en particular. Se pueden tener data marts separados para ventas, inventario y
compras, por ejemplo, y los usuarios finales pueden acceder a datos de uno o de todos
los data marts del departamento.
En muchos casos, el contexto de los datos no repetitivos es más importante que los
datos en sí. En cualquier caso, los datos no repetitivos no pueden utilizarse para la toma
de decisiones hasta que se haya establecido el contexto.
Estas son algunas diferencias clave entre data lake y data warehouse:
3
Inteligencia De Negocios Y Dataware
1. Datos: Un data warehouse sólo almacena datos que han sido modelados o
estructurados, mientras que un Data Lake no hace acepción de datos. Lo almacena
todo, estructurado, semiestructurado y no estructurado.
2. Procesamiento: Antes de que una empresa pueda cargar datos en un data
warehouse, primero debe darles forma y estructura, es decir, los datos deben ser
modelados. Eso se llama schema-on-write. Con un data lake, sólo se cargan los
datos sin procesar, tal y como están, y cuando esté listo para usar los datos, es
cuando se le da forma y estructura. Eso se llama schema-on-read. Dos enfoques
muy diferentes.
3. Almacenamiento: Una de las principales características de las tecnologías de big
data, como Hadoop, es que el coste de almacenamiento de datos es relativamente
bajo en comparación con el de un data warehouse. Hay dos razones principales para
esto: en primer lugar, Hadoop es software de código abierto, por lo que la concesión
de licencias y el soporte de la comunidad es gratuito. Y segundo, Hadoop está
diseñado para ser instalado en hardware de bajo coste.
4. Agilidad: Un almacén de datos es un repositorio altamente estructurado, por
definición. No es técnicamente difícil cambiar la estructura, pero puede tomar mucho
tiempo dado todos los procesos de negocio que están vinculados a ella. Un data
lake, por otro lado, carece de la estructura de un data warehouse, lo que da a los
desarrolladores y a los científicos de datos la capacidad de configurar y reconfigurar
fácilmente y en tiempo real sus modelos, consultas y aplicaciones.
5. Seguridad: La tecnología del data warehouse existe desde hace décadas, mientras
que la tecnología de big data (la base de un Data Lake) es relativamente nueva. Por
lo tanto, la capacidad de asegurar datos en un data warehouse es mucho más
madura que asegurar datos en un data lake. Cabe señalar, sin embargo, que se está
realizando un importante esfuerzo en materia de seguridad en la actualidad en la
industria de Big Data.
Existen muchas otras formas de análisis que también son posibles. Estas formas
incluyen análisis predictivo y prescriptivo, así como tecnologías de machine learning y
4
Inteligencia De Negocios Y Dataware
otras que están cambiando la forma en que los datos son administrados y analizados.
El data warehouse ha sido durante mucho tiempo un elemento básico de la arquitectura
de datos empresarial y sigue teniendo un gran futuro en el nuevo mundo de Big Data y
la analítica avanzada.
5
Inteligencia De Negocios Y Dataware
Los tres conceptos están interconectados y la perspectiva es que, cada vez más, la
mayoría de empresas utilicen el análisis generado por este tipo de tecnologías para
tener una visión más analítica de su negocio y así poder tomar las mejores decisiones
para crecer.
Se trata de tres conceptos completamente diferentes que tienen en común una nueva
manera de lidiar con los datos, siempre teniendo en cuenta la existencia de una gran
6
Inteligencia De Negocios Y Dataware
• Big Data
Llamamos big data a un gran volumen de datos con una variedad, complejidad y
velocidad de crecimiento enorme y que además tienen la característica de no ser
estructurados. Eso significa que no son relacionales, estando además fuera del entorno
corporativo. Es un tipo de tecnología que te permite analizar los datos en tiempo real y
puede provenir de diferentes fuentes y formas, tales como mensajería instantánea,
redes sociales, registros de grabaciones, imágenes, mensajes de correo electrónico,
etc.
Para tener una idea de la importancia del big data, este mercado está creciendo cada
año, alrededor de un 40%. La paradoja reside en el hecho de que cuanto mayor es la
evolución del big data, mayor es la escasez de profesionales cualificados para satisfacer
esa demanda. La expectativa es que en unos pocos años, haya un crecimiento aún más
significativo para el uso de big data y por lo tanto un aumento en la demanda mano de
obra especializada y de partners tecnológicos especializados en esta materia.
• Data Warehouse
Por otro lado, un data warehouse almacena datos consolidados de diversas fuentes o
sistemas de la empresa. Se trata de datos estructurados, que tiene como objetivo
principal ser precisos y de alta calidad para de esta forma poder dar soporte a la toma
de decisiones de la empresa. Se trata de conseguir tener todos los datos juntos para
después poder dividirlos para hacer un análisis de determinados sectores o estrategias.
• Business Intelligence
Un Business Intelligence (BI) es una especie de “cuello de botella” de los datos
recogidos del data warehouse, que llegan de forma exacta y útil para ayudar a la toma
de decisiones. Business Intelligence transforma los datos en información útil para
analizar no sólo los negocios, sino también las principales estrategias corporativas.
Estos tres conceptos están interconectados y la perspectiva es que, cada vez más, la
mayoría de empresas utilicen el análisis generado por este tipo de tecnologías para una
visión más analítica de su negocio y así poder tomar las mejores decisiones para crecer.
7
Inteligencia De Negocios Y Dataware
Los roles le permiten administrar quién puede hacer qué en un área de trabajo, para
que los equipos puedan colaborar. Las áreas de trabajo le permiten asignar roles a
usuarios individuales y también a grupos de usuarios, como grupos de seguridad,
grupos de Microsoft 365 y listas de distribución.
Para conceder acceso a un área de trabajo, asigne uno de los siguientes roles del área
de trabajo a un grupo de usuarios o a usuarios: Administrador, Miembro, Colaborador o
Lector. Para más información, consulte Proporcionar acceso a los usuarios a las áreas
de trabajo en Power BI.
Todos los miembros de un grupo de usuarios obtienen el rol que haya definido. Si algún
usuario está en varios grupos de usuarios, obtiene el nivel de permiso mayor
proporcionado por los roles que se le asignan. Si anida grupos de usuarios y asigna un
rol a un grupo, todos los usuarios contenidos obtienen los permisos de ese rol. Todas
estas funcionalidades, excepto las de visualización e interacción, requieren una licencia
de Power BI Pro o Premium por usuario (PPU). Para más información, consulte
Licencias.
8
Inteligencia De Negocios Y Dataware
3 Para copiar un informe en otra área de trabajo y para crearlo en un área de trabajo en
función de un conjunto de datos del área de trabajo actual, necesita el permiso de
compilación para el conjunto de datos. También necesita al menos el rol Colaborador
en las áreas de trabajo de origen y destino. En el caso de los conjuntos de datos del
área de trabajo original, si tiene al menos el rol Colaborador, tendrá automáticamente
permiso de compilación mediante el rol de área de trabajo. Para más información,
consulte Copia de informes desde otras áreas de trabajo.
9
Inteligencia De Negocios Y Dataware
5 Si los elementos están en un área de trabajo de una capacidad Premium, puede ver
los elementos e interactuar con ellos en el servicio Power BI aunque no tenga una
licencia de Power BI Pro.
Nota
• Puede asignar roles a los usuarios, ya sea de forma individual o en grupo, incluso si
no pueden usar el rol. En otras palabras, puede asignar a los usuarios que no tengan
licencias de Power BI Pro o PPU un rol que requiera una licencia. Consulte Licencias
para más información.
• Use el rol de Lector para imponer seguridad de nivel de fila (RLS) a los usuarios que
exploran el contenido de un área de trabajo. También puede aplicar RLS sin permitir
el acceso al área de trabajo, publicar una aplicación y distribuirlas a aquellos
usuarios, o bien utilizar el uso compartido para distribuir contenido.
• Los miembros pueden agregar usuarios a un área de trabajo con permisos inferiores,
pero no pueden quitar usuarios de ningún rol de área de trabajo.
Licencias
Si una de las áreas de trabajo está en una capacidad compartida, todos los usuarios
que agregue a ella necesitarán una licencia de Power BI Pro o de Premium por usuario
(PPU). Todos estos usuarios pueden colaborar en los paneles e informes del área de
trabajo. Si quiere distribuir contenido a otros usuarios dentro de la organización, asigne
licencias de Power BI Pro a esos usuarios o coloque el área de trabajo en una capacidad
Power BI Premium.
Cuando el área de trabajo está en una capacidad de Power BI Premium, los usuarios
con el rol de Espectador pueden acceder al área de trabajo incluso si no tienen una
licencia de Power BI Pro o de Premium por usuario (PPU). Sin embargo, si asigna a
estos usuarios un rol superior, como administrador, miembro o colaborador, se les
pedirá que inicien una evaluación Pro al intentar acceder al área de trabajo. Si quiere
que los usuarios sin licencias Pro o de Premium por usuario (PPU) usen el rol de
Espectador, asegúrese de que no tengan otros roles del área de trabajo, ya sea como
individuos o como parte de un grupo de usuarios.
Para publicar informes en el área de trabajo es necesario aplicar las reglas de las
licencias existentes. Si intenta publicar desde Power BI Desktop u otras herramientas
cliente sin una licencia Pro o Premium por usuario (PPU), verá el error "Solo los usuarios
con licencias de Power BI Pro pueden publicar en esta área de trabajo".
Nota
• Power BI para la Administración Pública no está disponible como licencia gratuita.
Para más información sobre las licencias, consulte Power BI para clientes de la
Administración pública de EE. UU.
10
Inteligencia De Negocios Y Dataware
Usuarios invitados
Los usuarios invitados de Azure AD B2B a los que se les haya asignado un rol de área
de trabajo o concedido permisos de elementos específicos, podrán realizar las
operaciones permitidas por dichos roles o permisos.
Nota
• Los usuarios invitados a los que se hayan asignado roles de área de trabajo o
permisos de elementos específicos seguirán teniendo esos roles y/o permisos,
incluso si la configuración del inquilino Permitir que los usuarios invitados de Azure
Active Directory editen y administren contenido de la organización está
deshabilitada.
Consideraciones y limitaciones
Un limitación que se debe tener en cuenta:
• Una persona con una licencia de Power BI Pro puede ser miembro de 1000 áreas
de trabajo como máximo.
Cada vez que tenemos una lista de datos, se ve más notorio el inconveniente que traen
las repeticiones e inconsistencias en los mismos. Por esto, es aconsejable usar una
base de datos que proporciona cierto nivel de abstracción de los datos; ocultando
detalles que para los usuarios finales, terminan siendo innecesarios.
Arquitectura en 3 niveles
Esta arquitectura, se resume en que se tiene un esquema interno, uno conceptual y otro
externo.
Nivel interno: Representa el contacto directo con el almacenamiento físico de los datos.
Permite escribir tal y como están almacenados en el ordenador. En este nivel se diseñan
los archivos que contienen la información, la ubicación de los mismos y su organización;
es decir se crean todos los archivos de configuración.
11
Inteligencia De Negocios Y Dataware
Nivel externo: Se conoce también cómo nivel de vistas y es el más cercano al usuario;
en este nivel se describen los datos o parte de los datos que más le interesan a los
usuarios.
Cabe resaltar que, que sea cual sea la base de datos; ésta siempre tendrá un único
nivel interno y un único nivel conceptual; pero en el nivel externo si puede tener varios
esquemas.
Este concepto hace referencia a la capacidad que una base de datos posee para
amoldarse y adaptarse a las demandas de rendimiento de la empresa. La idea es que,
a medida que el número de usuarios crezca, y que por consiguiente también lo hagan
los flujos de información que se deben almacenar y transaccionar, las bases de datos
no se vean colapsadas.
12
Inteligencia De Negocios Y Dataware
Generalmente, y sobre todo si no se lleva a cabo una correcta planificación previa, las
bases empiezan a tener problemas de funcionamiento ante estos cambios tan radicales
en las cargas.
Por lo tanto, la idea de la escalabilidad de una base de datos es que esta pueda
expandirse con tranquilidad, sin que dicha expansión ponga en pausa los procesos
productivos de la empresa.
La idea de esta planificación es poder elaborar un diseño escalable, que luego pueda
ser llevado a cabo por los arquitectos informáticos.
La idea es que la base de datos obtenida al final del proceso pueda expandir su
capacidad de almacenamiento sin que eso genere ningún tipo de problemática, tan solo
añadiendo nuevos componentes o recursos.
Sin embargo, ese límite puede ser más o menos distante según la profundidad con la
que se planifique la escalabilidad antes de dar forma a las bases.
Ese colapso hará que el negocio se pare, puesto que todas las tareas que se realizan
están directamente mediadas por la base de datos.
Esto puede ser perjudicial para el negocio, puesto que los podría hacer perder no solo
una gran suma de ingresos, sino también parte de su imagen positiva como marca.
Esto, en un mundo donde los mercados son cada vez más demandantes, es muy grave.
Un colapso así les impediría dar respuesta en tiempo y forma a sus clientes, generando
grandes niveles de frustración, haciendo que abandonen a la marca para nunca más
volver.
13
Inteligencia De Negocios Y Dataware
TAREA N°02
Cuando un cliente hace una pregunta, los vendedores van directamente a la base de
datos para obtener la respuesta. Por lo tanto, cuando esa base de datos es lenta o, peor
aún, completamente inactiva, estas preguntas no se responden. La información del
producto no se descubre y no se realizan actualizaciones de ventas, lo que significa que
se produce una interrupción del negocio.
14
Inteligencia De Negocios Y Dataware
Una base de datos puede ser lenta debido a problemas con la aplicación o la red. Esto
puede causar estragos en la productividad y frustrar a los clientes que tienen que
esperar una respuesta.
Microsoft SQL Server es una de las soluciones DBMS más populares en la actualidad,
por lo que la usaremos como ejemplo para describir las ventajas y desventajas del
monitoreo de bases de datos realizado por WhatsUp Gold de Progress. Recuerde que
todos los elementos descritos con respecto a SQL Server se aplican a otras bases de
datos.
Informes de consultas de SQL Server: SQL Server gestiona las consultas de SQL. Por
eso se llama lenguaje de consulta estructurado. Aquí, WhatsUp Gold Query Monitor
informa sobre el resultado de todas las consultas de SQL Server y resalta las áreas
donde el DBMS no está haciendo su trabajo. Cuando las consultas fallan, devuelven
resultados inesperados o degradan el rendimiento, se activan alertas o acciones.
Con SQL Query Monitor, verifica ciertas condiciones de una base de datos Microsoft
SQL o MySQL según el rendimiento y el resultado de las consultas de la base de datos.
TI establece los criterios deseados en la base de datos y, si se cumplen estas
condiciones, SQL Query Monitor indicará un estado UP. Por el contrario, si los datos de
la base de datos cambian fuera de los límites de los criterios de consulta, el monitor
informará un estado ABAJO.
15
Inteligencia De Negocios Y Dataware
Cree y configure múltiples estados de la aplicación: con WhatsUp Gold , puede crear
una variedad de estados como Arriba, Advertencia, Abajo, Mantenimiento y
Desconocido. A continuación, puede crear umbrales para cada uno de estos estados
que, cuando se superan, activan una alerta. Por ejemplo, se puede activar un estado
de advertencia cuando se excede un umbral de utilización del 80%. Esta es una señal
de peligro y la alerta solicitará al profesional de TI apropiado que actúe rápidamente.
16
Inteligencia De Negocios Y Dataware
Si su base de datos entra en un estado Inactivo, se puede activar una ruta de acción
para escribir una entrada de registro, ejecutar un script que reinicia el servidor o
simplemente enviar una notificación.
Cuando desee saber qué está sucediendo con su base de datos, solo mire el panel de
Monitoreo del rendimiento de la base de datos y verifique el estado actual para obtener
una vista en tiempo real. En caso de problema, este panel le permite encontrar
rápidamente la fuente.
El mismo panel le brinda información histórica para que pueda identificar tendencias
que podrían afectar el desempeño futuro y descubrir problemas crónicos que debe
corregir. Estos informes de estado históricos analizan los problemas de rendimiento de
la base de datos durante un período de tiempo y descubren problemas de rendimiento
intermitentes y difíciles de encontrar, como fallas de caché de URI y fugas de memoria.
Ejemplo de cliente: Optim Healthcare cura SQL Server con WhatsUp Gold
Optim Healthcare tiene tres hospitales en el estado estadounidense de Georgia. Matt
Cline, administrador senior de sistemas de Optim, adoptó WhatsUp Gold e
inmediatamente diagnosticó un problema de rendimiento crítico.
SQL Server Monitor admite la supervisión de Microsoft SQL Server 2000 o versiones
posteriores y MSDE 2000 o versiones posteriores, que se pueden instalar en cualquier
máquina de la red.
17
Inteligencia De Negocios Y Dataware
Puede un software como R conectarse a esas bases de datos ?, será que existen
paquetes que se pueden utilizar para realizar consultas, cuáles serían unas buenas
prácticas para realizar consultas adecuadamente?
Objetivos
Identificar la infraestructura de conectividad de aquellas bases de datos más comunes
en el mercado de acuerdo con el cuadrante mágico de Gardner.
• Identificar los paquetes más utilizados para acceder a la bases de datos desde R.
• Conocer el procedimiento para la conexión de SQL desde R studio.
• Conocer las buenas prácticas para establecer una adecuada conexión de BD.
• Realizar un caso práctico: Video Caso y Ejercicio práctico
Infraestructura de conectividad
Existen diferentes interfaces y sistemas de conectividad que permiten la ejecución de
operaciones sobre bases de datos desde el lenguaje de programación,
independientemente del sistema operativo donde se ejecute o de la base de datos a la
cual se esté accediendo. El objetivo es acceder a cualquier dato desde cualquier
aplicación, sin importar qué sistema de gestión de bases de datos almacene los datos.
Sin embargo, según el tipo de base de datos, su infraestructura es distinta.
Opensource
El centro de este enfoque es el paquete DBI. Este paquete actúa como middleware
entre los paquetes para permitir la conectividad con la base de datos del usuario u otros
paquetes. A su vez proporciona un conjunto coherente de funciones
independientemente del tipo de base de datos al que se accede. El paquete dplyr
depende del paquete DBI para la comunicación con las bases de datos. Actualmente,
dichos paquetes existen para las siguientes bases de datos: MySQL, SQLite,
PostgreSQL y bigquery.
18
Inteligencia De Negocios Y Dataware
Comercial source
La mayoría de las bases de datos comerciales, como Oracle y Microsoft SQL Server,
ofrecen controladores *ODBC que le permiten conectar su herramienta a la base de
datos. Aunque hay paquetes R que le permiten usar controladores ODBC, la conexión
probablemente no sea compatible con DBI. El nuevo paquete odbc resuelve ese
problema al proporcionar un backend DBI a cualquier conexión de controlador ODBC.
19
Inteligencia De Negocios Y Dataware
• DBI
El paquete DBI (Data Base Interface) define una interfaz común entre R y los sistemas
de administración de bases de datos (DBMS) que permite que los paquetes puedan
acceder a las bases de datos. En otras palabras permite que el código R pueda
conectarse a distintas bases de datos para poder manipular, crear sentencias en el
DBMS, extraer resultados entre otras funciones.
Estructura básica
Hay cuatro principales clases que deben incluirse en la estructura para el inicio de la
conexión:
• DBIObject: Creación de un objeto base para estructura.
• DBIDriver: Se instala un backend específico para la base de datos a la que desea
conectarse como: RSQLite(), RPostgreSQL(), RMySQL() etc.
• DBIConnection: representa la conexión para una base de datos específica
• DBIResult: El resultado de una consulta proveniente del DBMS.
• dplyr
Con la conexión del sistema DBI, dplyr tiene acceso a las bases de datos más comunes
: SQLite, PostgreSQL, MySQL. Lo importante es que ya no se necesitan ingresar
búsquedas en SQL, si no que se puede usar una sintaxis mucho más consistente con
el lenguaje R.
20
Inteligencia De Negocios Y Dataware
• odbc
El objetivo del paquete odbc es proporcionar una interfaz compatible con DBI para los
controladores de Open Database Connectivity (ODBC). Esto permite una conexión
eficiente y fácil de configurar a cualquier base de datos con controladores ODBC
disponibles, incluyendo SQL Server, Oracle, MySQL, PostgreSQL, SQLite y otros.
Read.
• dbplot
Al tener dplyr se puede procesar los cálculos de un gráfico dentro de una base de datos.
Este paquete proporciona funciones para la visualización gráfico de los datos.
21
Inteligencia De Negocios Y Dataware
Ejercicio práctico
Objetivo: Crear una base de datos SQLite en memoria de forma que se pueda mostrar
de forma general, los elementos vistos hasta el momento, con el fin de utilizar ciertos
paquetes de R para establecer consultas.
# Instalación de librerías
22
Inteligencia De Negocios Y Dataware
Hasta el momento hemos creado una base de datos. Ahora llenemos las tablas con
información.
dbWriteTable(con, "flights", nycflights13::flights)
dbWriteTable(con, "planes", nycflights13::planes)
dbWriteTable(con, "airlines", nycflights13::airlines)
Consultas Básicas
Usando el lenguaje SQL
##Pasamos las "queries" de SQL as character string usando dbGetQuery.
# Selecionaremos los vuelos que llegan más de 20 minutos tardes.
delays <- dbGetQuery(con, "SELECT * FROM flights WHERE arr_delay > 20")
head(delays)
## year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time
## 1 2013 1 1 542 540 2 923 850
23
Inteligencia De Negocios Y Dataware
Podemos usar la función tbl () para crear punteros a las tablas remotas en la base de
datos. Podemos guardar ese puntero en una variable y realizar manipulaciones en él
como si fuera un data frame local.
flights <- tbl(con, "flights")
head(flights)
## # Source: lazy query [?? x 19]
## # Database: sqlite 3.22.0 [:memory:]
## year month day dep_time sched_dep_time dep_delay arr_time
## <int> <int> <int> <int> <int> <dbl> <int>
## 1 2013 1 1 517 515 2 830
## 2 2013 1 1 533 529 4 850
## 3 2013 1 1 542 540 2 923
## 4 2013 1 1 544 545 -1 1004
## 5 2013 1 1 554 600 -6 812
## 6 2013 1 1 554 558 -4 740
## # … with 12 more variables: sched_arr_time <int>, arr_delay <dbl>,
## # carrier <chr>, flight <int>, tailnum <chr>, origin <chr>, dest <chr>,
## # air_time <dbl>, distance <dbl>, hour <dbl>, minute <dbl>,
## # time_hour <dbl>
Ahora que tenemos una referencia a la tabla que queremos, pero no hemos obstruido
la memoria local con un gran data frame , intentemos obtener el resultado que
queremos. Podemos usar el comando dplyr filter () para mantener solo los vuelos que
llegan más de 20 minutos tarde.
24
Inteligencia De Negocios Y Dataware
Cuando estamos manipulando datos, es muy importante para nosotros tener alguna
información básica al respecto. Con los data frame locales, siempre podemos ejecutar
comandos como dim (), ncol () y nrow () para comprender el tamaño y la forma de
nuestros datos. Intentemos:
dim(flights)
## [1] NA 19
# Número de columnas
ncol(flights)
## [1] 19
# Número de filas
nrow(flights)
## [1] NA
Consultas Avanzadas
25
Inteligencia De Negocios Y Dataware
La mayoría de las funciones principales de dplyr funcionarán con tablas remotas, que
incluyen (pero no se limitan a):
group_by() summarize() filter() select() mutate() arrange()
El dplyr pipe%>% también es compatible. Intentemos ver qué aeropuerto tiene las
llegadas más retrasadas.
delays_by_airport <- flights %>%
group_by(origin) %>%
summarize(mean_dep_delay = mean(dep_delay), mean_arr_delay =
mean(arr_delay)) %>%
arrange(-mean_arr_delay)
head(delays_by_airport)
## Warning: Missing values are always removed in SQL.
## Use `mean(x, na.rm = TRUE)` to silence this warning
## This warning is displayed only once per session.
## # Source: lazy query [?? x 3]
## # Database: sqlite 3.22.0 [:memory:]
## # Ordered by: -mean_arr_delay
## origin mean_dep_delay mean_arr_delay
## <chr> <dbl> <dbl>
## 1 EWR 15.1 9.11
## 2 LGA 10.3 5.78
## 3 JFK 12.1 5.55
Explicación: Sin nada más, hemos confirmado que el aeropuerto de Newark es el peor.
Revisemos el SQL detrás de ese código: podemos ver que es más complicado, pero
como la mayoría de las funciones de dplyr están diseñadas para actuar como comandos
SQL, se transfieren con bastante facilidad.
delays_by_airport %>%
dbplyr::sql_render()
## <SQL> SELECT `origin`, AVG(`dep_delay`) AS `mean_dep_delay`,
AVG(`arr_delay`) AS `mean_arr_delay`
## FROM `flights`
## GROUP BY `origin`
## ORDER BY -`mean_arr_delay`
Join
También podemos usar cualquiera de las funciones * _join (). En lugar de realizar
uniones similares a SQL con data frame locales , en realidad estamos realizando
uniones SQL de forma remota! Intentemos encontrar qué aerolínea tiene el mayor
promedio de demoras, separadas por aeropuerto.
delays_airport_airline <- flights %>%
group_by(origin, carrier) %>%
26
Inteligencia De Negocios Y Dataware
Plotting
Si estuviéramos interesados en ver cómo se realiza cada aeropuerto mes a mes,
podríamos hacer algo como esto:
flights %>%
group_by(month, origin) %>%
summarize(mean_arr_delay = mean(arr_delay)) %>%
collect() # Todos los registros
## # A tibble: 36 x 3
## # Groups: month [12]
## month origin mean_arr_delay
## <int> <chr> <dbl>
## 1 1 EWR 12.8
## 2 1 JFK 1.37
## 3 1 LGA 3.38
## 4 2 EWR 8.78
## 5 2 JFK 4.39
## 6 2 LGA 3.15
## 7 3 EWR 10.6
## 8 3 JFK 2.58
## 9 3 LGA 3.74
## 10 4 EWR 14.1
## # … with 26 more rows
GGplot
flights %>%
group_by(month, origin) %>%
summarize(mean_arr_delay = mean(arr_delay)) %>%
collect() %>%
ggplot(aes(x = month, y = mean_arr_delay)) +
geom_line(aes(color = origin)) +
geom_point(aes(color = origin))
27
Inteligencia De Negocios Y Dataware
Una vez que hayamos terminado, es importante cerrar la conexión de nuestra base de
datos. Lo hacemos con otra función DBI, dbDisconnect ():
dbDisconnect(con)
También es posible conocer los dispositivos utilizados para acceder y sus ubicaciones:
desde dónde se ingresó a la base, los permisos que los usuarios tienen, la manera en
que se modificaron en cada movimiento, etcétera.
28
Inteligencia De Negocios Y Dataware
Para hacer una auditoría de base de datos es necesario contar con una persona o
equipo responsable de realizarla. Puede ser interno o externo a la empresa
(dependiendo del tamaño de la información que se gestiona) y con el apoyo de un
software que facilite el proceso y clasificación de los datos y los registros de actividad.
Aunque cada empresa tendrá objetivos, personal y herramientas distintas, podemos
resumir los pasos de una auditoría de este tipo en 5 pasos que te describimos a
continuación.
2. Recopila información
Aquí será necesario que planees entrevistas con el personal encargado de la base de
datos, que las lleves a cabo y que el auditor o auditores conozcan los procedimientos
29
Inteligencia De Negocios Y Dataware
de recopilación y gestión de datos para poder hacer una comparativa con lo que está
en papel y lo que encontrarán en la práctica.
Ahora te presentamos una selección de software que te ayudará a realizar este tipo de
auditoría.
1. Redgate
30
Inteligencia De Negocios Y Dataware
Las soluciones de Redgate están clasificadas por la industria que las busca (como
finanzas, proveedores de servicios, cuidado de la salud) o también por necesidad
(desarrollo estandarizado para equipos, monitorear desempeño y disponibilidad,
proteger y preservar datos, entre otros). Ayuda a categorizar, respaldar y conectar tu
base de datos a tu sistema de control; además tiene compatibilidad con Oracle.
2. IDERA
3. Solarwinds
31
Inteligencia De Negocios Y Dataware
4. IDEA
Desarrollado por CaseWare Analytics, IDEA tiene más de cien tareas relacionadas con
la auditoría de base de datos que te serán de mucha utilidad. Tendrás la posibilidad de
detectar patrones en la información, crear reportes con gráficas que permitan
comprender mejor los datos y compartirlos con terceros (como Tableau, MS Excel,
ODBC); así podrás detectar irregularidades de manera sencilla.
5. Foglight
32
Inteligencia De Negocios Y Dataware
Quest tiene Foglight para la administración de bases de datos. Permite gestionar todas
las bases a las que tiene acceso tu empresa desde una única consola y lo mejor es que
está creada para entornos híbridos (equipos físicos y la nube). Podrás detectar
problemas de rendimiento antes de que sean un obstáculo para los usuarios, te brindará
datos históricos enriquecidos y también te dará acceso a un panorama histórico que te
ayudará a comprender mejor las incidencias que tengas.
Después de esta guía, recuerda que pese al esfuerzo una auditoria te ayudará a
mantener la protección de tu base de datos tan segura como si se tratara de tus propios
datos personales.
El Editor de Power Query registra los pasos especificados (por ejemplo, cambiar el
nombre de una tabla, transformar un tipo de datos o eliminar una columna). Cada vez
que esta consulta se conecte al origen de datos, el Editor de Power Query llevará a
cabo esos pasos para que los datos siempre tengan la forma indicada. Este proceso
tendrá lugar siempre que utilice el Editor de Power Query o que otra persona utilice su
consulta compartida; por ejemplo, en el servicio Power BI. Estos pasos se capturan, de
manera secuencial, en el panel Configuración de consulta, en PASOS APLICADOS.
33
Inteligencia De Negocios Y Dataware
Importe los datos desde un origen web. Seleccione la lista desplegable Obtener datos
y, a continuación, elija Web.
34
Inteligencia De Negocios Y Dataware
Sugerencia
Algunas informaciones de las tablas de la dirección URL anterior pueden cambiar o
actualizarse ocasionalmente. Como resultado, es posible que tenga que ajustar las
selecciones o los pasos de este artículo en consecuencia.
35
Inteligencia De Negocios Y Dataware
Se abre la ventana Editor de Power Query. Puede ver los pasos predeterminados
aplicados hasta ahora, en el panel Configuración de consulta en PASOS APLICADOS.
• Origen: conexión con el sitio web.
• Tabla extraída de HTML: selección de la tabla.
• Encabezados promovidos: cambiar la fila superior de datos en los encabezados de
columna.
• Tipo cambiado: cambiar los tipos de columna, que se importan como texto, a sus
tipos inferidos.
36
Inteligencia De Negocios Y Dataware
Los datos existentes se ordenan por una puntuación ponderada. Vamos a agregar una
columna personalizada para calcular una puntuación diferente. A continuación,
ordenaremos la tabla de esta columna para comparar la clasificación de la puntuación
personalizada con la clasificación existente.
37
Inteligencia De Negocios Y Dataware
38
Inteligencia De Negocios Y Dataware
Nota
Observe que los valores de Nueva puntuación no han cambiado, lo que se debe al orden
de los pasos. Editor de Power Query registra los pasos secuencialmente, pero de forma
independiente, entre sí. Para aplicar acciones en una secuencia diferente, puede mover
cada paso aplicado hacia arriba o hacia abajo.
Haga clic con el botón derecho en un paso para ver su menú contextual.
39
Inteligencia De Negocios Y Dataware
Suba el último paso, Columnas quitadas, y colóquelo justo encima del paso
Personalizada agregada.
40
Inteligencia De Negocios Y Dataware
Hay varias maneras de obtener más información sobre cada error. Si selecciona la celda
sin hacer clic en la palabra Error, el Editor de Power Query mostrará la información del
error.
41
Inteligencia De Negocios Y Dataware
Como no necesitamos mostrar información sobre los errores en ningún otro lugar,
seleccione Cancelar.
Para corregir los errores, es necesario realizar dos cambios: quitar el nombre de la
columna Weather y cambiar el divisor de 8 a 7. Puede realizar estos cambios de dos
maneras:
• Haga clic con el botón derecho en el paso Columna personalizada y seleccione
Editar configuración. Esta acción abre el cuadro de diálogo Columna personalizada
que usó para crear la columna Nueva puntuación. Edite la fórmula como se ha
descrito anteriormente, hasta que tenga este aspecto:
Edite la fórmula como se ha descrito anteriormente, hasta que tenga este aspecto y
luego presione Entrar.
42
Inteligencia De Negocios Y Dataware
Combinar datos
Los datos sobre los diferentes estados son interesantes y serán útiles para crear otras
consultas y análisis. Sin embargo, la mayoría de los datos sobre los estados usan una
abreviatura de dos letras para los códigos de estado, no el nombre completo del estado.
Debemos encontrar un modo de asociar las abreviaturas con los nombres de los
estados.
Hay otro origen de datos públicos que proporciona esa asociación, pero necesita unos
buenos ajustes para que podamos conectarlo a nuestra tabla sobre la jubilación. Para
dar forma a los datos, siga estos pasos:
En la cinta de opciones Inicio de Editor de Power Query, seleccione Nuevo origen >
Web. Escriba la dirección del sitio web que contiene las abreviaturas de los estados,
https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations , y seleccione Conectar.
43
Inteligencia De Negocios Y Dataware
Aparece el cuadro de diálogo Quitar filas superiores. Especifique 1 fila para quitar.
• Promueva la nueva fila superior a los encabezados con Usar primera fila como
encabezado desde la pestaña Inicio o desde la pestaña Transformar de la cinta de
opciones.
Como la tabla Datos de jubilación no tiene información sobre Washington D. C. ni
territorios, debemos filtrarlos en nuestra lista. Seleccione la lista desplegable de la
columna Nombre y estado de región_1 y desactive todas las casillas excepto Estado.
44
Inteligencia De Negocios Y Dataware
TAREA N°03
Este artículo puede ayudarle a comprender cómo puede usar Power View, una
aplicación de Silverlight basada en explorador que se inicia desde SharePoint Server,
para explorar datos de forma interactiva y crear visualizaciones dinámicas desde
modelos multidimensionales de Analysis Services.
45
Inteligencia De Negocios Y Dataware
Objetos de dimensión
a. Las dimensiones aparecen como tablas y se pueden expandir para mostrar otros
objetos en la tabla (dimensión). El cubo Adventure Works tiene muchas tablas,
cuenta a moneda de origen.
b. Mostrar carpetas divide y clasifica aún más cómo aparecen los objetos asociados en
las herramientas de cliente. Las carpetas de visualización pueden aparecer en la
lista de campos debajo de las tablas de dimensiones y medir las tablas de grupo.
c. Los atributos de dimensión aparecen como columnas en una tabla. Una sola
columna (atributo) puede aparecer tanto en una tabla como de nuevo en una
jerarquía, a menos que esté explícitamente oculta.
46
Inteligencia De Negocios Y Dataware
a. Los grupos de medida aparecen como tablas; sin embargo, a diferencia de las tablas
de una dimensión, una tabla de un grupo de medida se identifica con un icono sigma.
b. Las medidas aparecen en tablas de grupo de medida y se identifican con un icono
de calculadora. Si el cubo solo tiene una medida, se incluirá en un grupo de medida
asociado si hay una o en una sola tabla denominada Medidas.
c. Los KPI se incluyen en las tablas de grupo de medida asociadas y se identifican con
un icono de semáforo. Por ejemplo, si en el modelo Adventure Works expande
Ventas de revendedores > Perspectiva financiera > Aumentar ingresos, verá el KPI
de ingresos del canal y sus cuatro medidas; Valor, Objetivo, Estado y Tendencia.
47
Inteligencia De Negocios Y Dataware
Para convertir una tabla en otras visualizaciones, haga clic en un tipo de visualización
en la pestaña Diseño. Power View solo habilita los gráficos y el resto de las
visualizaciones que mejor funcionen para los datos de esa tabla. Por ejemplo, si Power
View no detecta ningún valor numérico agregado, no se habilita ningún gráfico.
En Power View SharePoint 2013 y en Excel 2013, puede crear rápidamente una
variedad de visualizaciones de datos, desde tablas y matrices hasta gráficos de barras,
columnas y burbujas, y conjuntos de varios gráficos. Para cada visualización que quiera
crear, empiece en una hoja de Power View creando una tabla que, a continuación,
convierta fácilmente en otras visualizaciones para encontrar una que ilustre mejor los
datos.
Sugerencia: Para crear otra visualización, inicie otra tabla haciendo clic en la hoja en
blanco antes de seleccionar campos de la sección campos de la lista de campos.
48
Inteligencia De Negocios Y Dataware
Gráficos
Power View ofrece varias opciones de gráfico: circular, columna, barra, línea, dispersión
y burbuja. Los gráficos pueden tener varios campos numéricos y varias series. Tiene
varias opciones de diseño en un gráfico: mostrar y ocultar etiquetas, leyendas y títulos.
49
Inteligencia De Negocios Y Dataware
en una hoja de Power View en un libro de Excel guardado en Excel Services o visto en
Microsoft 365.
Gráficos circulares
Los gráficos circulares son simples o sofisticados en Power View. Puede hacer un
gráfico circular que muestre información detallada al hacer doble clic en un solo
segmento o un gráfico circular que muestre subsegmentos dentro de los segmentos de
color mayores. Puede aplicar un filtro cruzado a un gráfico circular con otro gráfico.
Suponga que hace clic en una barra en un gráfico de barras. La parte del gráfico circular
que se aplica a la barra se resalta y el resto del gráfico circular se atenúa. Obtenga
información sobre los gráficos circulares en Power View.
Gráficos de barras
En un gráfico de barras, las categorías se organizan a lo largo del eje vertical y los
valores a lo largo del eje horizontal. Considere la posibilidad de usar un gráfico de barras
en cualquiera de estos casos:
• Tiene una o varias series de datos que desea trazar.
50
Inteligencia De Negocios Y Dataware
En Power View, tiene tres subtipos de gráfico de barras entre los que elegir: apiladas,
100 % apiladas y agrupadas.
Gráficos de columnas
Los datos organizados en columnas o filas de una hoja de cálculo se pueden
representar en un gráfico de columnas. Los gráficos de columnas resultan útiles para
mostrar cambios en los datos a lo largo de un período de tiempo o para ilustrar
comparaciones entre elementos. En los gráficos de columnas, las categorías se
encuentran a lo largo del eje horizontal y los valores a lo largo del eje vertical.
En Power View, tiene tres subtipos de gráfico de columnas entre los que elegir: apiladas,
100 % apiladas y agrupadas.
Gráficos de líneas
Los gráficos de líneas distribuyen los datos de categoría de forma uniforme a lo largo
de un eje horizontal (categoría) y todos los datos de valores numéricos a lo largo de un
eje vertical (valor).
Considere la posibilidad de usar un gráfico de líneas con escala de tiempo a lo largo del
eje horizontal. Los gráficos de líneas muestran fechas en orden cronológico a intervalos
específicos o unidades base, como el número de días, meses o años, incluso si las
fechas de la hoja de cálculo no están en orden o en las mismas unidades base.
Mapas
Los mapas de Power View usan mosaicos de mapas de Bing, de modo que puede hacer
zoom y crear panorámicas igual que con cualquier otro mapa de Bing. Agregar
ubicaciones y campos coloca puntos en el mapa. Cuanto mayor sea el valor, mayor será
el punto. Al agregar una serie de varios valores, se obtienen gráficos circulares en el
mapa, con el tamaño del gráfico circular que muestra el tamaño del total.
51
Inteligencia De Negocios Y Dataware
Matrices
Una matriz es similar a una tabla en la que está hecha de filas y columnas. Pero una
matriz tiene las siguientes capacidades que una tabla no:
• Mostrar datos sin repetir valores.
• Mostrar totales y subtotales por fila y columna
• Con una jerarquía, puede explorar en profundidad
• Contraer y expandir la pantalla
Tarjetas
Puede convertir una tabla en una serie de tarjetas que muestren los datos de cada fila
de la tabla diseñada en formato de tarjeta, como una tarjeta de índice.
52
Inteligencia De Negocios Y Dataware
Mosaicos
Puede convertir una tabla o matriz en mosaicos para presentar datos tabulares de forma
interactiva. Los mosaicos son contenedores con una franja de navegación dinámica.
Los mosaicos sirven de filtros: filtran el contenido que hay en el mosaico en función del
valor seleccionado en la franja de pestañas. Puede agregar más de una visualización
al mosaico y todas se filtran por el mismo valor. Puede usar texto o imágenes como
pestañas. Más información sobre mosaicos en Power View.
Esta imagen muestra el número de medallas ganadas por los países que compiten en
patinaje de velocidad.
53
Inteligencia De Negocios Y Dataware
TAREA N°04
Las bases de datos que utiliza una empresa para almacenar todas sus transacciones y
registros se llaman bases de datos de procesamiento de transacciones en línea (OLTP).
Normalmente, estas bases de datos tienen registros que se introducen uno cada vez. A
menudo contienen una gran cantidad de información de valor para la organización. Sin
embargo, las bases de datos que se usan para OLTP no se diseñaron para el análisis.
Por lo tanto, obtener respuestas de estas bases de datos es costoso en términos de
tiempo y esfuerzo. Los sistemas OLAP se han diseñado para ayudar a extraer de los
datos esta información de inteligencia empresarial con un alto rendimiento. Esto se debe
a que las bases de datos OLAP se optimizan para cargas de trabajo grandes en lecturas
y pequeñas en escrituras.
Modelos semánticos
Un modelo de datos semánticos es un modelo conceptual que describe el significado
de los elementos de datos que contiene. A menudo, las organizaciones usan sus
propios términos, a veces emplean sinónimos o incluso diferentes significados para un
mismo término. Por ejemplo, es posible que una base de datos de inventario realice el
seguimiento de una pieza de un equipo con un identificador de recurso y un número de
serie, mientras que una base de datos de ventas podría hacer referencia al número de
serie como el identificador de recurso. No existe una manera sencilla de relacionar estos
valores sin un modelo que describa la relación.
54
Inteligencia De Negocios Y Dataware
55
Inteligencia De Negocios Y Dataware
Otra opción consiste en encapsular toda la información que necesitan los usuarios en
un modelo semántico. Los usuarios pueden consultar el modelo semántico más
fácilmente con la herramienta de generación informes que prefieran. Los datos
proporcionados por el modelo semántico se extraen de un almacenamiento de datos, lo
que garantiza que todos los usuarios vean una misma versión. El modelo semántico
también proporciona nombres descriptivos de tablas y columnas, relaciones entre
tablas, descripciones, cálculos y seguridad a nivel de fila.
56
Inteligencia De Negocios Y Dataware
Los modelos semánticos pueden ayudar a los usuarios empresariales a abstraer las
complejidades de las relaciones y facilitan el análisis rápido de los datos.
Desafíos
A pesar de todas las ventajas que proporcionan los sistemas OLAP, producen algunos
desafíos:
• En tanto que los datos en los sistemas OLTP se actualizan constantemente a través
de transacciones que fluyen procedentes de diversos orígenes, los almacenes de
datos OLAP normalmente se actualizan a intervalos mucho más lentos, en función
de las necesidades del negocio. Esto significa que los sistemas OLAP son más
adecuados para tomar decisiones empresariales estratégicas, en lugar de dar
respuestas inmediatas ante los cambios. Además, se debe planear cierto nivel de
limpieza de datos y orquestación para mantener actualizados los almacenes de
datos OLAP.
• A diferencia de las tablas tradicionales, normalizadas y relacionales encontradas en
los sistemas OLTP, los modelos de datos OLAP suelen ser multidimensionales. Esto
hace difícil o imposible la asignación directa a modelos entidad-relación y modelos
orientados a objetos, en los que cada atributo se asigna a una columna. Los
sistemas OLAP normalmente usan un esquema de estrella o copo de nieve en lugar
de la normalización tradicional.
57
Inteligencia De Negocios Y Dataware
OLAP en Azure
En Azure, los datos que se mantienen en sistemas OLTP, como Azure SQL Database,
se copian en el sistema OLAP, como Azure Analysis Services. Las herramientas de
exploración y visualización de datos como Power BI, Excel y otras herramientas de
terceros se conectan a los servidores de Analysis Services y proporcionan a los usuarios
una información interactiva y enriquecida visualmente sobre los datos modelados. El
flujo de los datos desde OLTP a OLAP normalmente se orquesta con SQL Server
Integration Services, que se puede ejecutar con Azure Data Factory.
En Azure, los almacenes de datos siguientes cumplirán los requisitos principales para
OLAP:
• SQL Server con índices de almacén de columnas
• Azure Analysis Services
• SQL Server Analysis Services (SSAS)
SQL Server Analysis Services (SSAS) ofrece funciones de OLAP y de minería para
aplicaciones de inteligencia empresarial. SSAS se puede instalar en servidores locales,
o bien se puede hospedar en una máquina virtual en Azure. Azure Analysis Services es
un servicio completamente administrado que proporciona las mismas características
principales que SSAS. Azure Analysis Services admite la conexión a varios orígenes de
datos, que se encuentren tanto en la nube como en el entorno local, de su organización.
Los índices de almacén de columnas en clúster están disponibles en SQL Server 2014,
y en las versiones posteriores, así como en Azure SQL Database, y son ideales para
cargas de trabajo de OLAP. Sin embargo, a partir de SQL Server 2016 (incluido Azure
SQL Database), puede sacar partido del procesamiento transaccional/analítico híbrido
(HTAP) mediante el uso de índices de almacén de columnas no agrupados
actualizables. HTAP permite realizar el procesamiento de OLTP y OLAP en la misma
plataforma, lo que elimina la necesidad de almacenar varias copias de los datos y de
tener distintos sistemas de OLTP y OLAP. Para más información, consulte Introducción
al almacén de columnas para análisis operativos en tiempo real.
En este contexto, análisis en tiempo real se aplica a un origen de datos único, como
una aplicación de planificación de recursos empresariales (ERP), que ejecutará una
carga de trabajo tanto operativa como de análisis. Si tiene que integrar datos de
varios orígenes, o requieren un rendimiento extremo de los análisis mediante el uso
58
Inteligencia De Negocios Y Dataware
Matriz de funcionalidades
En las tablas siguientes se resumen las diferencias clave en cuanto a funcionalidades.
Funcionalidades generales
Capacidad Azure SQL Server SQL Server Azure SQL Database
Analysis Analysis con índices de con índices de
Services Services almacén de almacén de
columnas columnas
Es un servicio Sí No No Sí
administrado
Admite cubos No Sí No No
multidimensionales
Admite modelos Sí Sí No No
semánticos tabulares
Integra fácilmente Sí Sí No 1 No 1
varios orígenes de
datos
Admite análisis en No No Sí Sí
tiempo real
Requiere un proceso Sí Sí No No
para copiar los datos
de los orígenes
Integración de Sí No No 2 Sí
Microsoft Entra
Figura N° 42: Funcionalidades Generales
59
Inteligencia De Negocios Y Dataware
[1] Aunque SQL Server y Azure SQL Database no se pueden usar para consultar varios
orígenes de datos externos, e integrarlos, puede crear una canalización que lo haga
automáticamente mediante SSIS o Azure Data Factory. SQL Server hospedado en una
máquina virtual de Azure tiene opciones adicionales, como los servidores vinculados y
PolyBase. Para más información, consulte Choosing a data pipeline orchestration
technology in Azure (Elección de una tecnología de orquestación de canalizaciones de
datos en Azure).
[2] La conexión a una instancia de SQL Server que se ejecute en una máquina virtual
de Azure no se admite si se usa una cuenta de Microsoft Entra. Utilice en su lugar una
cuenta de Active Directory del dominio.
Funcionalidades de escalabilidad
Capacidad Azure SQL Server SQL Server Azure SQL
Analysis Analysis con índices de Database con
Services Services almacén de índices de almacén
columnas de columnas
Servidores regionales Sí No Sí Sí
redundantes para
lograr alta
disponibilidad
Admite el escalado Sí No Sí Sí
horizontal de
consultas
Escalabilidad Sí No Sí Sí
dinámica (escalado
vertical)
Figura N° 43: Funcionalidades de escalabilidad
60
Inteligencia De Negocios Y Dataware
REFERENCIAS BIBLIOGRÁFÍCAS
Data Warehouse: todo lo que necesitas saber sobre almacenamiento de datos
• https://www.powerdata.es/data-warehouse
Roles en áreas de trabajo de Power BI
• https://learn.microsoft.com/es-es/power-bi/collaborate-share/service-roles-new-
workspaces
¿Qué es la escalabilidad de una base de datos?
• https://preteco.com/escalabilidad-de-una-base-de-datos/
¿Qué es el Monitoreo de banco de datos y cuáles son sus ventajas?
• https://www.internationalit.com/post/que-es-el-monitoreo-de-banco-de-datos-y-
cuales-son-sus-
ventajas?lang=es#:~:text=La%20soluci%C3%B3n%20es%20el%20monitoreo,se%20
conviertan%20en%20verdaderas%20fallas.
Conexiones a bases de datos
• https://rstudio-pubs-
static.s3.amazonaws.com/495393_380fb942fbb64dc79b846a16918142b1.html
5 pasos para hacer una auditoría de base de datos
• https://blog.hubspot.es/marketing/auditoria-base-de-
datos#:~:text=%C2%BFQu%C3%A9%20es%20una%20auditor%C3%ADa%20de,ma
l%20manejo%20de%20la%20informaci%C3%B3n.
Dar forma a los datos y combinarlos en Power BI Desktop
• https://learn.microsoft.com/es-es/power-bi/connect-data/desktop-shape-and-combine-
data
Orígenes de datos para Power View
• https://support.microsoft.com/es-es/office/power-view-explorar-visualizar-y-presentar-
los-datos-98268d31-97e2-42aa-a52b-
a68cf460472e#:~:text=Or%C3%ADgenes%20de%20datos%20para%20Power%20Vi
ew,-
Excel%202013%20permite&text=Un%20modelo%20de%20datos%20es,el%20invent
ario%20y%20las%20ventas.
Descripción de los objetos de modelo multidimensional de Power View
• https://support.microsoft.com/es-es/office/descripci%C3%B3n-de-los-objetos-de-
modelo-multidimensional-de-power-view-9b236950-3d1e-4be2-a8bc-927ceff3d320
Gráficos y otras visualizaciones en Power View
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Procesamiento analítico en línea (OLAP)
• https://learn.microsoft.com/es-es/azure/architecture/data-guide/relational-data/online-
analytical-processing
61
Inteligencia De Negocios Y Dataware
REFERENCIAS DE IMÁGENES
Figura N° 01: Roles de área de trabajo
• https://learn.microsoft.com/es-es/power-bi/collaborate-share/service-roles-new-
workspaces
Figura N° 02: Open Source Databases
• https://rstudio-pubs-
static.s3.amazonaws.com/495393_380fb942fbb64dc79b846a16918142b1.html
Figura N° 03: Commercial Databases
• https://rstudio-pubs-
static.s3.amazonaws.com/495393_380fb942fbb64dc79b846a16918142b1.html
Figura N° 04: Data Base Interface
• https://learn.microsoft.com/es-es/power-bi/collaborate-share/service-roles-new-
workspaces
Figura N° 05: Modelo Count
• https://www.internationalit.com/post/que-es-el-monitoreo-de-banco-de-datos-y-
cuales-son-sus-
ventajas?lang=es#:~:text=La%20soluci%C3%B3n%20es%20el%20monitoreo,se%20
conviertan%20en%20verdaderas%20fallas.
Figura N° 06: Modelo Área
• https://www.internationalit.com/post/que-es-el-monitoreo-de-banco-de-datos-y-
cuales-son-sus-
ventajas?lang=es#:~:text=La%20soluci%C3%B3n%20es%20el%20monitoreo,se%20
conviertan%20en%20verdaderas%20fallas.
Figura N° 07: Modelo Meses
• https://www.internationalit.com/post/que-es-el-monitoreo-de-banco-de-datos-y-
cuales-son-sus-
ventajas?lang=es#:~:text=La%20soluci%C3%B3n%20es%20el%20monitoreo,se%20
conviertan%20en%20verdaderas%20fallas.
Figura N° 08: Muestra mensual
• https://www.internationalit.com/post/que-es-el-monitoreo-de-banco-de-datos-y-
cuales-son-sus-
ventajas?lang=es#:~:text=La%20soluci%C3%B3n%20es%20el%20monitoreo,se%20
conviertan%20en%20verdaderas%20fallas.
Figura N° 09: Redgate
• https://blog.hubspot.es/marketing/auditoria-base-de-
datos#:~:text=%C2%BFQu%C3%A9%20es%20una%20auditor%C3%ADa%20de,ma
l%20manejo%20de%20la%20informaci%C3%B3n.
Figura N° 10: IDERA
• https://blog.hubspot.es/marketing/auditoria-base-de-
datos#:~:text=%C2%BFQu%C3%A9%20es%20una%20auditor%C3%ADa%20de,ma
62
Inteligencia De Negocios Y Dataware
l%20manejo%20de%20la%20informaci%C3%B3n.
Figura N° 12: IDEA
• https://blog.hubspot.es/marketing/auditoria-base-de-
datos#:~:text=%C2%BFQu%C3%A9%20es%20una%20auditor%C3%ADa%20de,ma
l%20manejo%20de%20la%20informaci%C3%B3n.
Figura N° 13: Foglight
• https://blog.hubspot.es/marketing/auditoria-base-de-
datos#:~:text=%C2%BFQu%C3%A9%20es%20una%20auditor%C3%ADa%20de,ma
l%20manejo%20de%20la%20informaci%C3%B3n.
Figura N° 14: Configuración de consulta
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 15: Obtener datos
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 16: Desde la Web
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 17: Transformar datos
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 18: Importar datos
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 19: Tipo cambiado
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 20: Personalizar columna
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 21: Verificación de errores
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 22: Personalizada agregada
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 23: Quitar columna
Figura N° 24: Subir
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
63
Inteligencia De Negocios Y Dataware
64
Inteligencia De Negocios Y Dataware
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-
visualizaciones-en-power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 39: Mosaico
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-
visualizaciones-en-power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 40: OLAP
• https://learn.microsoft.com/es-es/azure/architecture/data-guide/relational-data/online-
analytical-processing
Figura N° 40: Modelo semántico
• https://learn.microsoft.com/es-es/azure/architecture/data-guide/relational-data/online-
analytical-processing
Figura N° 41: Características típicas del modelo semántico
• https://learn.microsoft.com/es-es/azure/architecture/data-guide/relational-data/online-
analytical-processing
Figura N° 42: Funcionalidades Generales
• https://learn.microsoft.com/es-es/azure/architecture/data-guide/relational-data/online-
analytical-processing
Figura N° 43: Funcionalidades de escalabilidad
• https://learn.microsoft.com/es-es/azure/architecture/data-guide/relational-data/online-
analytical-processing
65