PIAD-619_MATERIAL

Inteligencia De Negocios Y Dataware
MATERIAL TÉCNICO
DE APOYO
TAREA N°01
Diseña Data Warehouse y Arquitectura BI

Data Warehouse
Un Data Warehouse es un almacén electrónico donde generalmente una empresa u
organización mantiene una gran cantidad de información. Los datos de un data
warehouse deben almacenarse de forma segura, fiable, fácil de recuperar y fácil de
administrar.
El concepto de data warehouse se originó en 1988 con el trabajo de los investigadores

de IBM, Barry Devlin y Paul Murphy aunque el término data warehouse fue acuñado por
William H. Inmon, el cual es conocido como el padre de Data Warehousing. Inmon
describió un data warehouse como una colección de datos orientada a un tema
específico, integrado, variante en el tiempo y no volátil, que soporta el proceso de toma
de decisiones.
¿Qué es un Data Warehouse?

Un data warehouse es un repositorio unificado para todos los datos que recogen los
diversos sistemas de una empresa. El repositorio puede ser físico o lógico y hace
hincapié en la captura de datos de diversas fuentes sobre todo para fines analíticos y
de acceso.
Normalmente, un data warehouse se aloja en un servidor corporativo o cada vez más,

en la nube. Los datos de diferentes aplicaciones de procesamiento de transacciones
Online (OLTP) y otras fuentes se extraen selectivamente para su uso por aplicaciones
analíticas y de consultas por usuarios.
Data Warehouse es una arquitectura de almacenamiento de datos que permite a los

ejecutivos de negocios organizar, comprender y utilizar sus datos para tomar decisiones
estratégicas. Un data warehouse es una arquitectura conocida ya en muchas empresas
modernas.
Estructuras de un Data Warehouse

La arquitectura de un data warehouse puede ser dividida en tres estructuras
simplificadas: básica, básica con un área de ensayo y básica con área de ensayo y data
marts.
Con una estructura básica, sistemas operativos y archivos planos proporcionan datos
en bruto que se almacenan junto con metadatos. Los usuarios finales pueden acceder
a ellos para su análisis, generación de informes y minería.
Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y el
2
almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar
en el almacén. Es posible personalizar la arquitectura del almacén para diferentes
grupos dentro de la organización.
Se puede hacer agregando data marts, que son sistemas diseñados para una línea de
negocio en particular. Se pueden tener data marts separados para ventas, inventario y
compras, por ejemplo, y los usuarios finales pueden acceder a datos de uno o de todos
los data marts del departamento.
Pasado y presente del Data Warehouse

Históricamente, los data warehouses se habían formado utilizando datos repetitivos
estructurados que eran filtrados antes de entrar en el data warehouse. Sin embargo, en
los últimos años, el data warehouse ha evolucionado debido a información contextual
que ahora se puede adjuntar a los datos no estructurados y que también puede ser
almacenada.
Aquellos primeros datos relacionales estructurados no podían ser mezclados y

emparejados para temas analíticos con datos textuales no estructurados. Pero con el
advenimiento de la contextualización, estos tipos de análisis ahora sí pueden hacerse
de forma naturales y fácil.
En el data warehouse, datos no repetitivos, como los comentarios en una encuesta,

correos electrónicos y conversaciones, se tratan de forma diferente a las ocurrencias
repetitivas de datos, como el flujo de clics, mediciones o el procesamiento máquina o
analógico. Los datos no repetitivos son datos basados en textos que fueron generados
por la palabra escrita o hablada, leída y reformateada y, lo que es más importante, ahora
puede ser contextualizada. Con el fin de extraer cualquier sentido de los datos no
repetitivos para su uso en el Data Warehouse, deben tener el contexto de los datos
establecidos.
En muchos casos, el contexto de los datos no repetitivos es más importante que los
datos en sí. En cualquier caso, los datos no repetitivos no pueden utilizarse para la toma
de decisiones hasta que se haya establecido el contexto.
Data Lakes y Data Warehouses: ¿mutuamente exclusivos o partners perfectos?

Los data lakes han surgido en el paisaje de Data Management en los últimos años, sin
embargo, data lake no es necesariamente un reemplazo del data warehouse. En
cambio, complementan los esfuerzos existentes y dan soporte al descubrimiento de
nuevas preguntas. Una vez que se descubren esas preguntas se optimizan las
respuestas. Y optimizar puede significar moverse fuera del data lake para ir a un data
mart o al data warehouse.
Estas son algunas diferencias clave entre data lake y data warehouse:
3
1. Datos: Un data warehouse sólo almacena datos que han sido modelados o
estructurados, mientras que un Data Lake no hace acepción de datos. Lo almacena
todo, estructurado, semiestructurado y no estructurado.
2. Procesamiento: Antes de que una empresa pueda cargar datos en un data
warehouse, primero debe darles forma y estructura, es decir, los datos deben ser
modelados. Eso se llama schema-on-write. Con un data lake, sólo se cargan los
datos sin procesar, tal y como están, y cuando esté listo para usar los datos, es
cuando se le da forma y estructura. Eso se llama schema-on-read. Dos enfoques
muy diferentes.
3. Almacenamiento: Una de las principales características de las tecnologías de big
data, como Hadoop, es que el coste de almacenamiento de datos es relativamente
bajo en comparación con el de un data warehouse. Hay dos razones principales para
esto: en primer lugar, Hadoop es software de código abierto, por lo que la concesión
de licencias y el soporte de la comunidad es gratuito. Y segundo, Hadoop está
diseñado para ser instalado en hardware de bajo coste.
4. Agilidad: Un almacén de datos es un repositorio altamente estructurado, por
definición. No es técnicamente difícil cambiar la estructura, pero puede tomar mucho
tiempo dado todos los procesos de negocio que están vinculados a ella. Un data
lake, por otro lado, carece de la estructura de un data warehouse, lo que da a los
desarrolladores y a los científicos de datos la capacidad de configurar y reconfigurar
fácilmente y en tiempo real sus modelos, consultas y aplicaciones.
5. Seguridad: La tecnología del data warehouse existe desde hace décadas, mientras
que la tecnología de big data (la base de un Data Lake) es relativamente nueva. Por
lo tanto, la capacidad de asegurar datos en un data warehouse es mucho más
madura que asegurar datos en un data lake. Cabe señalar, sin embargo, que se está
realizando un importante esfuerzo en materia de seguridad en la actualidad en la
industria de Big Data.
El data warehouse continúa evolucionando

Hay todavía un gran potencial en la evolución del data warehouse y su uso sigue
adelante.
El procesamiento analítico clásico de datos basado en transacciones se realiza en el

data warehouse como siempre se ha hecho. Nada ha cambiado ahí. Pero ahora puede
hacerse analítica sobre datos contextualizados, y esa forma de análisis es nueva. La
mayoría de las organizaciones, hasta ahora no habían podido basar su toma de
decisiones en datos textuales no estructurados. Y ahora hay una nueva forma de
análisis posible en un Data Warehouse: la posibilidad de la mezcla de análisis. El
análisis combinado se realiza mediante una combinación de datos transaccionales
estructurados y datos contextuales no estructurados.
Existen muchas otras formas de análisis que también son posibles. Estas formas
incluyen análisis predictivo y prescriptivo, así como tecnologías de machine learning y
4
otras que están cambiando la forma en que los datos son administrados y analizados.
El data warehouse ha sido durante mucho tiempo un elemento básico de la arquitectura
de datos empresarial y sigue teniendo un gran futuro en el nuevo mundo de Big Data y
la analítica avanzada.
Data Warehouse en la nube

Los data warehouses están atravesando actualmente dos transformaciones muy
importantes que tienen el potencial de impulsar niveles significativos de innovación
empresarial:
• La primera área de transformación es el impulso para aumentar la agilidad general.
La gran mayoría de los departamentos de TI están experimentando un rápido
aumento de la demanda de datos. Los directivos quieren tener acceso a más y más
datos históricos, mientras que al mismo tiempo, los científicos de datos y los
analistas de negocios están explorando formas de introducir nuevos flujos de datos
en el almacén para enriquecer el análisis existente, así como impulsar nuevas áreas
de análisis. Esta rápida expansión de los volúmenes y fuentes de datos significa que
los equipos de TI necesitan invertir más tiempo y esfuerzo asegurando que el
rendimiento de las consultas permanezca constante y necesitan proporcionar cada
vez más entornos para equipos individuales para validar el valor comercial de los
nuevos conjuntos de datos.
• La segunda área de transformación gira en torno a la necesidad de mejorar el control
de costes. Existe una creciente necesidad de hacer más con cada vez menos
recursos, al mismo tiempo que se garantiza que todos los datos sensibles y
estratégicos estén completamente asegurados, a lo largo de todo el ciclo de vida, de
la manera más rentable.
• La nube está demostrando ser un facilitador dominante. Permite a las
organizaciones enfrentarse de forma activa a los desafíos que presentan estas dos
transformaciones clave.
¿Por qué migrar a la nube?

Las 3 tecnologías que ya tienen y seguirán teniendo un gran impacto en la
transformación de negocios son: la nube, datos y análisis, e Internet de las Cosas. Estas
tres tecnologías son parte clave del ecosistema del data warehouse actual. Por lo tanto,
es posible sacar la conclusión de que el data warehouse en la nube tiene un gran
potencial para generar un impacto significativo en los negocios.
La importancia de la nube para el data warehouse está directamente vinculado a tres

factores clave:
1. Mejora de la agilidad
Muchos data warehouses están embarcados en una fase de actualización. Con mucho
trabajo puesto ahora en torno al big data, las empresas buscan aprovechar los nuevos
flujos de datos y nuevos tipos de análisis más ricos para apoyar e impulsar nuevas
áreas, tales como: analítica de clientes de 360º, análisis predictivo, detección de fraude,
5
análisis de IoT y el establecimiento de los datos como centro de beneficio. Muchos de

estos proyectos requieren el aprovisionamiento de nuevos entornos de hardware y el
despliegue de software. Es más rápido, más fácil y eficiente iniciar estos nuevos
proyectos centrados en los datos utilizando los servicios en la nube.
2. Mayor control de costes

Muchos equipos de TI están buscando maneras de consolidar los data marts existentes,
cada uno ejecutándose en hardware dedicado o incluso en hardware propietario, en un
único entorno integrado. Los servicios en la nube de calidad ofrecen la oportunidad
perfecta para iniciar este tipo de proyectos. El cumplimiento legal no puede ser visto
como un extra opcional cuando se planifica un traslado a la nube. Los activos de datos
deben estar protegidos a lo largo de todo el ciclo de vida. Los servicios en la nube deben
facilitar todo esto, siendo más rentables ya que todas las características de seguridad
se pueden habilitar de forma predeterminada y mejorada, y actualizada de forma
transparente.
3. Co-Localización para una carga más rápida

La mayoría de los data warehouses generan datos directamente desde aplicaciones
clave, como entrada de pedidos, ventas, finanzas y fabricación. Por lo tanto, tiene
mucho sentido ubicar conjuntamente el data warehouse junto con los sistemas fuente
que ya se estén ejecutándose en la nube. La ubicación conjunta ofrece una carga de
datos más rápida, lo que significa que los usuarios obtienen un acceso más oportuno a
sus datos.
Principales ventajas de mover el data warehouse a la nube

Existen tres ventajas principales para mover un data warehouse a la nube, y estas están
directamente vinculados a los tres controladores clave enumerados anteriormente:
• Más fácil consolidación y racionalización
• Monetización más rápida de los datos en la nube
• La nube ofrece mejor protección
• Nueva llamada a la acción
Data Warehouse vs Big Data vs BI: cuales son las diferencias

En este apartado compararemos brevemente los conceptos Data Warehouse (DW), Big
Data y Business Intelligence (BI).
Los tres conceptos están interconectados y la perspectiva es que, cada vez más, la
mayoría de empresas utilicen el análisis generado por este tipo de tecnologías para
tener una visión más analítica de su negocio y así poder tomar las mejores decisiones
para crecer.
Se trata de tres conceptos completamente diferentes que tienen en común una nueva
manera de lidiar con los datos, siempre teniendo en cuenta la existencia de una gran
6
volumen de información en varios formatos que contribuyen, de forma estructurada o

no estructurada, a la toma de decisiones estratégicas. El objetivo final de cualquiera de
estas tecnologías es ofrecer una ventaja competitiva a las empresas, pero la forma en
que se utiliza es la que marcará la diferencia.
• Big Data
Llamamos big data a un gran volumen de datos con una variedad, complejidad y
velocidad de crecimiento enorme y que además tienen la característica de no ser
estructurados. Eso significa que no son relacionales, estando además fuera del entorno
corporativo. Es un tipo de tecnología que te permite analizar los datos en tiempo real y
puede provenir de diferentes fuentes y formas, tales como mensajería instantánea,
redes sociales, registros de grabaciones, imágenes, mensajes de correo electrónico,
etc.
Para tener una idea de la importancia del big data, este mercado está creciendo cada
año, alrededor de un 40%. La paradoja reside en el hecho de que cuanto mayor es la
evolución del big data, mayor es la escasez de profesionales cualificados para satisfacer
esa demanda. La expectativa es que en unos pocos años, haya un crecimiento aún más
significativo para el uso de big data y por lo tanto un aumento en la demanda mano de
obra especializada y de partners tecnológicos especializados en esta materia.
• Data Warehouse
Por otro lado, un data warehouse almacena datos consolidados de diversas fuentes o
sistemas de la empresa. Se trata de datos estructurados, que tiene como objetivo
principal ser precisos y de alta calidad para de esta forma poder dar soporte a la toma
de decisiones de la empresa. Se trata de conseguir tener todos los datos juntos para
después poder dividirlos para hacer un análisis de determinados sectores o estrategias.
• Business Intelligence
Un Business Intelligence (BI) es una especie de “cuello de botella” de los datos
recogidos del data warehouse, que llegan de forma exacta y útil para ayudar a la toma
de decisiones. Business Intelligence transforma los datos en información útil para
analizar no sólo los negocios, sino también las principales estrategias corporativas.
Estos tres conceptos están interconectados y la perspectiva es que, cada vez más, la
mayoría de empresas utilicen el análisis generado por este tipo de tecnologías para una
visión más analítica de su negocio y así poder tomar las mejores decisiones para crecer.
Roles en áreas de trabajo de Power BI

Las áreas de trabajo son lugares donde se colabora con compañeros y se crean
colecciones de paneles, informes, conjuntos de datos e informes paginados. En este
artículo se describen los distintos roles en las áreas de trabajo y qué pueden hacer los
usuarios de cada rol. Para más información, consulte Áreas de trabajo de Power BI.
7
Los roles le permiten administrar quién puede hacer qué en un área de trabajo, para
que los equipos puedan colaborar. Las áreas de trabajo le permiten asignar roles a
usuarios individuales y también a grupos de usuarios, como grupos de seguridad,
grupos de Microsoft 365 y listas de distribución.
Para conceder acceso a un área de trabajo, asigne uno de los siguientes roles del área
de trabajo a un grupo de usuarios o a usuarios: Administrador, Miembro, Colaborador o
Lector. Para más información, consulte Proporcionar acceso a los usuarios a las áreas
de trabajo en Power BI.
Todos los miembros de un grupo de usuarios obtienen el rol que haya definido. Si algún
usuario está en varios grupos de usuarios, obtiene el nivel de permiso mayor
proporcionado por los roles que se le asignan. Si anida grupos de usuarios y asigna un
rol a un grupo, todos los usuarios contenidos obtienen los permisos de ese rol. Todas
estas funcionalidades, excepto las de visualización e interacción, requieren una licencia
de Power BI Pro o Premium por usuario (PPU). Para más información, consulte
Licencias.
Roles de área de trabajo
8
Figura N° 01: Roles de área de trabajo
1 Los colaboradores pueden actualizar la aplicación asociada al área de trabajo, si el

administrador del área de trabajo delega este permiso en ellos. Sin embargo, no pueden
publicar una nueva aplicación ni cambiar quién tiene permiso para editarla.
2 Colaboradores y visores también pueden compartir elementos en un área de trabajo

o una aplicación, incluidos los conjuntos de datos, si el creador de la aplicación
seleccionó Permitir a los usuarios compartir los conjuntos de datos en esta aplicación.
Consulte la sección Crear y administrar varias audiencias sección "Publicar una
aplicación en Power BI."
3 Para copiar un informe en otra área de trabajo y para crearlo en un área de trabajo en
función de un conjunto de datos del área de trabajo actual, necesita el permiso de
compilación para el conjunto de datos. También necesita al menos el rol Colaborador
en las áreas de trabajo de origen y destino. En el caso de los conjuntos de datos del
área de trabajo original, si tiene al menos el rol Colaborador, tendrá automáticamente
permiso de compilación mediante el rol de área de trabajo. Para más información,
consulte Copia de informes desde otras áreas de trabajo.
4 Tenga en cuenta que también necesita permisos en la puerta de enlace. Estos

permisos se administran en otro lugar, independientemente de los roles y los permisos
del área de trabajo. Para más información, consulte Administración de una puerta de
enlace de datos local.
9
5 Si los elementos están en un área de trabajo de una capacidad Premium, puede ver
los elementos e interactuar con ellos en el servicio Power BI aunque no tenga una
licencia de Power BI Pro.
Nota
• Puede asignar roles a los usuarios, ya sea de forma individual o en grupo, incluso si
no pueden usar el rol. En otras palabras, puede asignar a los usuarios que no tengan
licencias de Power BI Pro o PPU un rol que requiera una licencia. Consulte Licencias
para más información.
• Use el rol de Lector para imponer seguridad de nivel de fila (RLS) a los usuarios que
exploran el contenido de un área de trabajo. También puede aplicar RLS sin permitir
el acceso al área de trabajo, publicar una aplicación y distribuirlas a aquellos
usuarios, o bien utilizar el uso compartido para distribuir contenido.
• Los miembros pueden agregar usuarios a un área de trabajo con permisos inferiores,
pero no pueden quitar usuarios de ningún rol de área de trabajo.
Licencias
Si una de las áreas de trabajo está en una capacidad compartida, todos los usuarios
que agregue a ella necesitarán una licencia de Power BI Pro o de Premium por usuario
(PPU). Todos estos usuarios pueden colaborar en los paneles e informes del área de
trabajo. Si quiere distribuir contenido a otros usuarios dentro de la organización, asigne
licencias de Power BI Pro a esos usuarios o coloque el área de trabajo en una capacidad
Power BI Premium.
Cuando el área de trabajo está en una capacidad de Power BI Premium, los usuarios
con el rol de Espectador pueden acceder al área de trabajo incluso si no tienen una
licencia de Power BI Pro o de Premium por usuario (PPU). Sin embargo, si asigna a
estos usuarios un rol superior, como administrador, miembro o colaborador, se les
pedirá que inicien una evaluación Pro al intentar acceder al área de trabajo. Si quiere
que los usuarios sin licencias Pro o de Premium por usuario (PPU) usen el rol de
Espectador, asegúrese de que no tengan otros roles del área de trabajo, ya sea como
individuos o como parte de un grupo de usuarios.
Para publicar informes en el área de trabajo es necesario aplicar las reglas de las
licencias existentes. Si intenta publicar desde Power BI Desktop u otras herramientas
cliente sin una licencia Pro o Premium por usuario (PPU), verá el error "Solo los usuarios
con licencias de Power BI Pro pueden publicar en esta área de trabajo".
Nota
• Power BI para la Administración Pública no está disponible como licencia gratuita.
Para más información sobre las licencias, consulte Power BI para clientes de la
Administración pública de EE. UU.
10
Usuarios invitados
Los usuarios invitados de Azure AD B2B a los que se les haya asignado un rol de área
de trabajo o concedido permisos de elementos específicos, podrán realizar las
operaciones permitidas por dichos roles o permisos.
Nota
• Los usuarios invitados a los que se hayan asignado roles de área de trabajo o
permisos de elementos específicos seguirán teniendo esos roles y/o permisos,
incluso si la configuración del inquilino Permitir que los usuarios invitados de Azure
Active Directory editen y administren contenido de la organización está
deshabilitada.
Consideraciones y limitaciones
Un limitación que se debe tener en cuenta:
• Una persona con una licencia de Power BI Pro puede ser miembro de 1000 áreas
de trabajo como máximo.
Arquitectura en Bases de Datos

Para hablar de la arquitectura en bases de datos, debemos tener en cuenta su objetivo.
Cuando tratamos el término de Arquitectura; estamos hablando de recopilación y
organización de la información; lo que le permite a los usuarios acceder de manera fácil,
eficiente y fiable a los datos.
Cada vez que tenemos una lista de datos, se ve más notorio el inconveniente que traen
las repeticiones e inconsistencias en los mismos. Por esto, es aconsejable usar una
base de datos que proporciona cierto nivel de abstracción de los datos; ocultando
detalles que para los usuarios finales, terminan siendo innecesarios.
La abstracción que mencionamos se debe básicamente a la separación de niveles que

presentan los sistemas de bases de datos. La separación entre los programas de
aplicación y los datos; el manejo de múltiples vistas por parte de los usuarios y el uso
de un catálogo para almacenar el esquema de la base de datos.
Arquitectura en 3 niveles
Esta arquitectura, se resume en que se tiene un esquema interno, uno conceptual y otro
externo.
Nivel interno: Representa el contacto directo con el almacenamiento físico de los datos.
Permite escribir tal y como están almacenados en el ordenador. En este nivel se diseñan
los archivos que contienen la información, la ubicación de los mismos y su organización;
es decir se crean todos los archivos de configuración.
11
Nivel Conceptual: Este nivel oculta detalles de las estructuras físicas de

almacenamiento y concentra su atención en las entidades, tipos de datos, relaciones y
restricciones.
Nivel externo: Se conoce también cómo nivel de vistas y es el más cercano al usuario;
en este nivel se describen los datos o parte de los datos que más le interesan a los
usuarios.
Cabe resaltar que, que sea cual sea la base de datos; ésta siempre tendrá un único
nivel interno y un único nivel conceptual; pero en el nivel externo si puede tener varios
esquemas.
Tenemos entonces que arquitectura en bases de datos definida en la arquitectura de

tres niveles puede facilitar la obtención de la verdadera independencia de datos; tanto
física como lógica; y esto se puede resumir como la capacidad para modificar el
esquema en un nivel del sistema; sin tener que modificar el esquema del nivel inmediato
superior.
Independencia de los datos

La independencia lógica es la capacidad de modificar el esquema conceptual sin tener
que alterar los esquemas externos ni los programas de aplicación. Se puede modificar
el esquema conceptual para ampliar la base de datos o para reducirla.
Ahora bien la independencia física es la capacidad de modificar el esquema interno sin

tener que alterar el esquema conceptual (o los externos); dado que la independencia
física se refiere sólo a la separación entre las aplicaciones y las estructuras físicas de
almacenamiento; es más fácil de conseguir que la independencia lógica.
Vemos que la arquitectura en bases de datos o arquitectura de 3 niveles trae consigo

una gran variedad de ventajas al momento de manipular y gestionar los datos. En DBA
Experts estamos con la mayor disposición para ayudarte a establecer e identificar cada
nivel en las BDs que uses en tu empresa; síguenos en nuestras redes sociales y
esperamos poder trabajar juntos muy pronto.
Escalabilidad de una base de datos

La escalabilidad de una base de datos es un pilar fundamental que se debe tener en
cuenta a la hora de diseñarla.
Este concepto hace referencia a la capacidad que una base de datos posee para
amoldarse y adaptarse a las demandas de rendimiento de la empresa. La idea es que,
a medida que el número de usuarios crezca, y que por consiguiente también lo hagan
los flujos de información que se deben almacenar y transaccionar, las bases de datos
no se vean colapsadas.
12
Generalmente, y sobre todo si no se lleva a cabo una correcta planificación previa, las
bases empiezan a tener problemas de funcionamiento ante estos cambios tan radicales
en las cargas.
Por lo tanto, la idea de la escalabilidad de una base de datos es que esta pueda
expandirse con tranquilidad, sin que dicha expansión ponga en pausa los procesos
productivos de la empresa.
¿Cómo se garantiza la escalabilidad de una base de datos?

La escalabilidad de una base de datos, así como la de cualquier otro componente de
una arquitectura IT, requiere de una exhaustiva planificación previa.
La idea de esta planificación es poder elaborar un diseño escalable, que luego pueda
ser llevado a cabo por los arquitectos informáticos.
La idea es que la base de datos obtenida al final del proceso pueda expandir su
capacidad de almacenamiento sin que eso genere ningún tipo de problemática, tan solo
añadiendo nuevos componentes o recursos.
¿La escalabilidad se puede realizar de forma infinita?

Es innegable que la escalabilidad de una base de datos, como todo en esta vida, tiene
un límite.
Sin embargo, ese límite puede ser más o menos distante según la profundidad con la
que se planifique la escalabilidad antes de dar forma a las bases.
Si la planificación no se hace de manera concienzuda y metódica, más pronto que tarde

llegará el momento en el que el hardware alcance su límite y colapse.
Ese colapso hará que el negocio se pare, puesto que todas las tareas que se realizan
están directamente mediadas por la base de datos.
Esto puede ser perjudicial para el negocio, puesto que los podría hacer perder no solo
una gran suma de ingresos, sino también parte de su imagen positiva como marca.
Esto, en un mundo donde los mercados son cada vez más demandantes, es muy grave.
Un colapso así les impediría dar respuesta en tiempo y forma a sus clientes, generando
grandes niveles de frustración, haciendo que abandonen a la marca para nunca más
volver.
13
TAREA N°02
Diseña Transacciones – Auditorias – Power View

Transacciones
El monitoreo de transacciones es un proceso de comprensión de la naturaleza y el
propósito de una transacción iniciada o incurrida por el cliente o la institución. El
monitoreo de transacciones es uno de los requisitos de las regulaciones o pautas ALD
/ CTF para garantizar que se identifiquen los riesgos de lavado de dinero en caso de
que se encuentre alguna transacción relacionada. La investigación adecuada se lleva a
cabo según los requisitos reglamentarios aplicables.
El propósito de monitorear las transacciones es comprender la naturaleza y el propósito

de una transacción en particular y evitar los riesgos de lavado de dinero y financiamiento
del terrorismo. Sin un proceso regular y periódico de monitoreo de transacciones basado
en el riesgo, las instituciones no pueden identificar o gestionar los riesgos de las
actividades de lavado de dinero o financiamiento del terrorismo, lo que lleva a posibles
pérdidas financieras y de reputación.
¿Qué es el monitoreo de transacciones?

El proceso de monitoreo de transacciones debe basarse en el riesgo, donde los clientes
se clasifican de acuerdo con sus perfiles de riesgo e información KYC. Los clientes más
riesgosos se centran más y se definen y aplican reglas estrictas de monitoreo de
transacciones para clientes de alto riesgo. Los clientes de alto riesgo incluyen personas
políticamente expuestas o PEP, familiares cercanos de PEP, PEP extranjeros, clientes
de países o jurisdicciones de alto riesgo, casinos, agentes inmobiliarios, agentes
inmobiliarios, agentes inmobiliarios, transacciones relacionadas con organizaciones sin
fines de lucro, etc. Algunas transacciones también se clasifican como de alto riesgo,
como la banca corresponsal o las transacciones transfronterizas.
¿Qué es el Monitoreo de banco de datos y cuáles son sus ventajas?

A lo largo de la historia, las Bases de Datos (Databases) han sido un punto central en
la mayoría de los negocios y fueron uno de los principales responsables de impulsar las
ventas de mainframes y computadoras personales. Hoy en día, las bases de datos
hacen un trabajo mucho más pesado, ya que sirven como depósito de información
crítica estructurada y no estructurada de una empresa.
Cuando un cliente hace una pregunta, los vendedores van directamente a la base de
datos para obtener la respuesta. Por lo tanto, cuando esa base de datos es lenta o, peor
aún, completamente inactiva, estas preguntas no se responden. La información del
producto no se descubre y no se realizan actualizaciones de ventas, lo que significa que
se produce una interrupción del negocio.
14
Una base de datos puede ser lenta debido a problemas con la aplicación o la red. Esto
puede causar estragos en la productividad y frustrar a los clientes que tienen que
esperar una respuesta.
La solución es el monitoreo de la base de datos, que mantiene información detallada y

actualizada sobre cómo funcionan las aplicaciones de la base de datos y cuándo se
detecta un problema. La idea es identificar los problemas antes de que se conviertan en
verdaderas fallas.
Microsoft SQL Server es una de las soluciones DBMS más populares en la actualidad,
por lo que la usaremos como ejemplo para describir las ventajas y desventajas del
monitoreo de bases de datos realizado por WhatsUp Gold de Progress. Recuerde que
todos los elementos descritos con respecto a SQL Server se aplican a otras bases de
datos.
Supervisión de SQL Server

Supervise los parámetros vitales de SQL Server: alertas totalmente personalizables
Informe a su equipo de TI cuando haya problemas críticos relacionados con el estado
de la CPU, poca cantidad de memoria libre, utilización peligrosa del disco y problemas
con la utilización de la caché, procesos del sistema, transferencias, usuarios, búferes
de página y esperar cerraduras. TI puede crear umbrales personalizados para cualquier
contador de rendimiento disponible.
Disponibilidad del servicio de SQL Server: un panel de WhatsUp Gold muestra

rápidamente la disponibilidad de todos los servicios de SQL Server según la supervisión
del motor de la base de datos, así como los servicios de indexación, búsqueda y
generación de informes. Las alertas detallan los problemas, mientras que las acciones
automatizadas se encargan de ellos por usted.
Informes de consultas de SQL Server: SQL Server gestiona las consultas de SQL. Por
eso se llama lenguaje de consulta estructurado. Aquí, WhatsUp Gold Query Monitor
informa sobre el resultado de todas las consultas de SQL Server y resalta las áreas
donde el DBMS no está haciendo su trabajo. Cuando las consultas fallan, devuelven
resultados inesperados o degradan el rendimiento, se activan alertas o acciones.
Con SQL Query Monitor, verifica ciertas condiciones de una base de datos Microsoft
SQL o MySQL según el rendimiento y el resultado de las consultas de la base de datos.
TI establece los criterios deseados en la base de datos y, si se cumplen estas
condiciones, SQL Query Monitor indicará un estado UP. Por el contrario, si los datos de
la base de datos cambian fuera de los límites de los criterios de consulta, el monitor
informará un estado ABAJO.
15
Monitoreo de WhatsUp Gold y SQL Server

Cree SLA factibles para mantener: crear o definir un SLA es una cosa, cumplirlo es otra.
Afortunadamente, con los SLA de SQL Server, puede usar el Control de monitoreo de
estado de SLA avanzado de WhatsUp Gold para definir y monitorear de cerca los
estados de las aplicaciones. También ayuda a informar cómo se calculan los SLA. Y
como tiene una buena idea del rendimiento y la disponibilidad, puede garantizar de
forma fiable el tiempo de actividad y el rendimiento de SQL Server. También puede
determinar qué componentes o servicios de la aplicación son críticos o no críticos y, por
lo tanto, distinguir qué partes, cuando están deshabilitadas, no deberían afectar los SLA.
Cree y configure múltiples estados de la aplicación: con WhatsUp Gold , puede crear
una variedad de estados como Arriba, Advertencia, Abajo, Mantenimiento y
Desconocido. A continuación, puede crear umbrales para cada uno de estos estados
que, cuando se superan, activan una alerta. Por ejemplo, se puede activar un estado
de advertencia cuando se excede un umbral de utilización del 80%. Esta es una señal
de peligro y la alerta solicitará al profesional de TI apropiado que actúe rápidamente.
Creando parámetros personalizados

SQL Server es una aplicación de Microsoft y, como tal, utiliza la interfaz de Instrumental
de administración de Windows (WMI) para permitir que los profesionales de TI accedan
a la aplicación a un nivel más profundo. WMI es esencial para crear parámetros
personalizados que desea monitorear y, como resultado, el host de SQL Server debe
estar habilitado para WMI.
El WhatsUp Gold puede monitorear y encontrar todos los dispositivos de red y

aplicaciones clave. De hecho, la solución de monitoreo de red podrá monitorear
cualquier cosa que pueda conectarse. Por ejemplo, WhatsUp Gold puede rastrear el
estado de los servicios comunes a los servidores TCP / IP, como SMTP, POP3 e IMAP,
FTP, HTTP y alertar al personal de TI si falla alguno de estos servicios. La solución
también sabe si su correo electrónico no funciona, si el sitio web no está disponible o si
los usuarios no pueden transferir archivos. Además de hacer lo mismo con tus bases
de datos. Como puede ver, el monitoreo de la base de datos es solo uno de los
numerosos beneficios de la herramienta.
Convertir las alertas en acciones

Con WhatsUp Gold , el personal de TI recibe una alerta tan pronto como cambia el
estado de un componente o aplicación supervisados. Lo que suceda a continuación
depende de TI, que puede crear políticas de acción en varios pasos. Esto va desde el
simple envío de alertas por mensaje de texto o correo electrónico hasta la captura de
eventos relevantes en un archivo de registro y la realización de acciones de
autocuración, como reiniciar un servicio de aplicación o iniciar un script de PowerShell.
16
Si su base de datos entra en un estado Inactivo, se puede activar una ruta de acción
para escribir una entrada de registro, ejecutar un script que reinicia el servidor o
simplemente enviar una notificación.
Cuando desee saber qué está sucediendo con su base de datos, solo mire el panel de
Monitoreo del rendimiento de la base de datos y verifique el estado actual para obtener
una vista en tiempo real. En caso de problema, este panel le permite encontrar
rápidamente la fuente.
El mismo panel le brinda información histórica para que pueda identificar tendencias
que podrían afectar el desempeño futuro y descubrir problemas crónicos que debe
corregir. Estos informes de estado históricos analizan los problemas de rendimiento de
la base de datos durante un período de tiempo y descubren problemas de rendimiento
intermitentes y difíciles de encontrar, como fallas de caché de URI y fugas de memoria.
Finalmente, el registro de cambios de estado de la base de datos rastrea todos los

cambios de estado de DBMS a nivel de componente y aplicación, lo que puede ayudar
a prevenir problemas futuros.
Ejemplo de cliente: Optim Healthcare cura SQL Server con WhatsUp Gold
Optim Healthcare tiene tres hospitales en el estado estadounidense de Georgia. Matt
Cline, administrador senior de sistemas de Optim, adoptó WhatsUp Gold e
inmediatamente diagnosticó un problema de rendimiento crítico.
WhatsUp Gold es un gran producto que monitorea nuestros dispositivos. Sabemos

cómo se cae algo. O cuando algo está cerca de causar dolor de cabeza. No se quede
en la oscuridad ni descubra un viernes por la noche que su servidor se ha bloqueado
cuando podría evitarlo fácilmente con las notificaciones adecuadas.
WUG es un buen software que ahorra tiempo y dinero a mi empresa. Puede monitorear
casi todo al mismo tiempo. Se puede monitorear cualquier cosa, desde instancias de
base de datos hasta una sola trampa SNMP. La alerta funciona muy bien y me ahorra
la molestia de decirle a alguien que una habitación se está sobrecalentando o que no
hay energía.
La solución hace mucho más que monitorear bases de datos, brinda una gran visibilidad
del estado de los servidores y los canales de red. Se ha convertido en una herramienta
integral en nuestras operaciones diarias.
El monitor de consultas SQL se incluye en las ediciones WhatsUp Gold Premium,

Distributed y MSP y funciona con bases de datos Microsoft SQL Server y MySQL.
SQL Server Monitor admite la supervisión de Microsoft SQL Server 2000 o versiones
posteriores y MSDE 2000 o versiones posteriores, que se pueden instalar en cualquier
máquina de la red.
17
Conexiones a bases de datos

Introducción
Hasta ahora, se ha tratado con pequeños conjuntos de datos que caben fácilmente en
la memoria de su computadora. Pero ¿qué pasa con los conjuntos de datos que son
demasiado grandes para que su computadora los maneje en conjunto? En este caso,
es útil almacenar los datos fuera de R y organizarlos en una base de datos o bien
conectarse a base de datos públicas o privadas, donde recupere solo los fragmentos
necesarios para el análisis actual.
Puede un software como R conectarse a esas bases de datos ?, será que existen
paquetes que se pueden utilizar para realizar consultas, cuáles serían unas buenas
prácticas para realizar consultas adecuadamente?
Objetivos
Identificar la infraestructura de conectividad de aquellas bases de datos más comunes
en el mercado de acuerdo con el cuadrante mágico de Gardner.
• Identificar los paquetes más utilizados para acceder a la bases de datos desde R.
• Conocer el procedimiento para la conexión de SQL desde R studio.
• Conocer las buenas prácticas para establecer una adecuada conexión de BD.
• Realizar un caso práctico: Video Caso y Ejercicio práctico
Infraestructura de conectividad
Existen diferentes interfaces y sistemas de conectividad que permiten la ejecución de
operaciones sobre bases de datos desde el lenguaje de programación,
independientemente del sistema operativo donde se ejecute o de la base de datos a la
cual se esté accediendo. El objetivo es acceder a cualquier dato desde cualquier
aplicación, sin importar qué sistema de gestión de bases de datos almacene los datos.
Sin embargo, según el tipo de base de datos, su infraestructura es distinta.
Opensource
El centro de este enfoque es el paquete DBI. Este paquete actúa como middleware
entre los paquetes para permitir la conectividad con la base de datos del usuario u otros
paquetes. A su vez proporciona un conjunto coherente de funciones
independientemente del tipo de base de datos al que se accede. El paquete dplyr
depende del paquete DBI para la comunicación con las bases de datos. Actualmente,
dichos paquetes existen para las siguientes bases de datos: MySQL, SQLite,
PostgreSQL y bigquery.
18
Figura N° 02: Open Source Databases
Comercial source
La mayoría de las bases de datos comerciales, como Oracle y Microsoft SQL Server,
ofrecen controladores *ODBC que le permiten conectar su herramienta a la base de
datos. Aunque hay paquetes R que le permiten usar controladores ODBC, la conexión
probablemente no sea compatible con DBI. El nuevo paquete odbc resuelve ese
problema al proporcionar un backend DBI a cualquier conexión de controlador ODBC.
Figura N° 03: Commercial Databases
Paquetes de R para realizar consultas

Para que un proyecto sea manejable, es importante tener una gestión no solo del código
R, pero también de los datos. A lo largo de cualquier proyecto de análisis van a ocurrir
correcciones, modificaciones y actualizaciones. Es posible manejar datos en archivos,
pero con un poco de complejidad en los datos o en los cambios, rápidamente se vuelve
inmanejable.
19
• DBI
El paquete DBI (Data Base Interface) define una interfaz común entre R y los sistemas
de administración de bases de datos (DBMS) que permite que los paquetes puedan
acceder a las bases de datos. En otras palabras permite que el código R pueda
conectarse a distintas bases de datos para poder manipular, crear sentencias en el
DBMS, extraer resultados entre otras funciones.
Figura N° 04: Data Base Interface
Estructura básica
Hay cuatro principales clases que deben incluirse en la estructura para el inicio de la
conexión:
• DBIObject: Creación de un objeto base para estructura.
• DBIDriver: Se instala un backend específico para la base de datos a la que desea
conectarse como: RSQLite(), RPostgreSQL(), RMySQL() etc.
• DBIConnection: representa la conexión para una base de datos específica
• DBIResult: El resultado de una consulta proveniente del DBMS.
Ejemplo de conexión a SQLlite

#library(DBI)
#conexion <- dbConnect(RSQLite::SQLite(), dbname = "mi_bd")
##dbListTables(conexion)
#resultado <- dbSendQuery(conexion, "SELECT * FROM mi_bd")
• dplyr
Con la conexión del sistema DBI, dplyr tiene acceso a las bases de datos más comunes
: SQLite, PostgreSQL, MySQL. Lo importante es que ya no se necesitan ingresar
búsquedas en SQL, si no que se puede usar una sintaxis mucho más consistente con
el lenguaje R.
20
En las expresiones dplyr: filter (filtrar condicionalmente), arrange (ordenar), select

(seleccionar variables / columnas) y summarize (resumir agregando filas o columnas)
entre otros, son utilizadas para manipular las tablas de la BD. Una combinación de
verbos hace posible crear búsquedas que serían complejas y difíciles de leer en SQL
de forma rápida y legible.
Comparación de comando R- SQL syntax
#*select() -> SELECT

#*mutate() -> user-defined columns
#*summarize() -> aggregated columns
#*left_join() -> LEFT JOIN
#*filter() -> WHERE
#*group_by() -> GROUP BY
#*filter() -> HAVING
#*arrange() -> ORDER BY
• odbc
El objetivo del paquete odbc es proporcionar una interfaz compatible con DBI para los
controladores de Open Database Connectivity (ODBC). Esto permite una conexión
eficiente y fácil de configurar a cualquier base de datos con controladores ODBC
disponibles, incluyendo SQL Server, Oracle, MySQL, PostgreSQL, SQLite y otros.
Read.
• dbplot
Al tener dplyr se puede procesar los cálculos de un gráfico dentro de una base de datos.
Este paquete proporciona funciones para la visualización gráfico de los datos.
Figura N° 05: Modelo Count
21
Figura N° 06: Modelo Área
Figura N° 07: Modelo Meses
Ejercicio práctico
Objetivo: Crear una base de datos SQLite en memoria de forma que se pueda mostrar
de forma general, los elementos vistos hasta el momento, con el fin de utilizar ciertos
paquetes de R para establecer consultas.
# Instalación de librerías
22
install.packages(c("tidyverse", "RSQLite", "nycflights13"))

## Installing packages into '/home/rstudio-user/R/x86_64-pc-linux-gnu-library/3.6'
## (as 'lib' is unspecified)
library(tidyverse)
## Registered S3 methods overwritten by 'ggplot2':
## method from
## [.quosures rlang
## c.quosures rlang
## print.quosures rlang
## ── Attaching packages ──────────────────── tidyverse 1.2.1 ──
## ✔ ggplot2 3.1.1 ✔ purrr 0.3.2
## ✔ tibble 2.1.2 ✔ dplyr 0.8.1
## ✔ tidyr 0.8.3 ✔ stringr 1.4.0
## ✔ readr 1.3.1 ✔ forcats 0.4.0
## Conflicts ──────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
library(DBI)
library(nycflights13)
Creación de una base de datos SqLite en memoria.

# Se conecta con el comando de dbconnect y se especifica el driver según la base de
datos que se utiliza, en este caso SQLite.
con <- dbConnect(RSQLite::SQLite(), ":memory:")
con
## <SQLiteConnection>
## Path: :memory:
## Extensions: TRUE
Hasta el momento hemos creado una base de datos. Ahora llenemos las tablas con
información.
dbWriteTable(con, "flights", nycflights13::flights)
dbWriteTable(con, "planes", nycflights13::planes)
dbWriteTable(con, "airlines", nycflights13::airlines)
Consultas Básicas
Usando el lenguaje SQL
##Pasamos las "queries" de SQL as character string usando dbGetQuery.
# Selecionaremos los vuelos que llegan más de 20 minutos tardes.
delays <- dbGetQuery(con, "SELECT * FROM flights WHERE arr_delay > 20")
head(delays)
## year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time
## 1 2013 1 1 542 540 2 923 850
23
## 2 2013 1 1 559 600 -1 941 910

## 3 2013 1 1 608 600 8 807 735
## 4 2013 1 1 624 630 -6 909 840
## 5 2013 1 1 628 630 -2 1016 947
## 6 2013 1 1 635 635 0 1028 940
## arr_delay carrier flight tailnum origin dest air_time distance hour
## 1 33 AA 1141 N619AA JFK MIA 160 1089 5
## 2 31 AA 707 N3DUAA LGA DFW 257 1389 6
## 3 32 MQ 3768 N9EAMQ EWR ORD 139 719 6
## 4 29 EV 4626 N11107 EWR MSP 190 1008 6
## 5 29 UA 1665 N33289 EWR LAX 366 2454 6
## 6 48 AA 711 N3GKAA LGA DFW 248 1389 6
## minute time_hour
## 1 40 1357034400
## 2 0 1357038000
## 3 0 1357038000
## 4 30 1357038000
## 5 30 1357038000
## 6 35 1357038000
Podemos usar la función tbl () para crear punteros a las tablas remotas en la base de
datos. Podemos guardar ese puntero en una variable y realizar manipulaciones en él
como si fuera un data frame local.
flights <- tbl(con, "flights")
head(flights)
## # Source: lazy query [?? x 19]
## # Database: sqlite 3.22.0 [:memory:]
## year month day dep_time sched_dep_time dep_delay arr_time
## <int> <int> <int> <int> <int> <dbl> <int>
## 1 2013 1 1 517 515 2 830
## 2 2013 1 1 533 529 4 850
## 3 2013 1 1 542 540 2 923
## 4 2013 1 1 544 545 -1 1004
## 5 2013 1 1 554 600 -6 812
## 6 2013 1 1 554 558 -4 740
## # … with 12 more variables: sched_arr_time <int>, arr_delay <dbl>,
## # carrier <chr>, flight <int>, tailnum <chr>, origin <chr>, dest <chr>,
## # air_time <dbl>, distance <dbl>, hour <dbl>, minute <dbl>,
## # time_hour <dbl>
Ahora que tenemos una referencia a la tabla que queremos, pero no hemos obstruido
la memoria local con un gran data frame , intentemos obtener el resultado que
queremos. Podemos usar el comando dplyr filter () para mantener solo los vuelos que
llegan más de 20 minutos tarde.
24
delays <- flights %>%

filter(arr_delay > 20)
head(delays)
## year month day dep_time sched_dep_time dep_delay arr_time
## <int> <int> <int> <int> <int> <dbl> <int>
## 1 2013 1 1 542 540 2 923
## 2 2013 1 1 559 600 -1 941
## 3 2013 1 1 608 600 8 807
## 4 2013 1 1 624 630 -6 909
## 5 2013 1 1 628 630 -2 1016
## 6 2013 1 1 635 635 0 1028
## # … with 12 more variables: sched_arr_time <int>, arr_delay <dbl>,
## # carrier <chr>, flight <int>, tailnum <chr>, origin <chr>, dest <chr>,
## # air_time <dbl>, distance <dbl>, hour <dbl>, minute <dbl>,
## # time_hour <dbl>
Inspeccionando el SQL de Dplyr

Podemos inspeccionar la consulta nosotros mismos usando la función sql_render () de
dbplyr (que se instaló con tidyverse).
## El dbplyr convierte el código dplyr en SQL.
delays %>%
dbplyr::sql_render()
## <SQL> SELECT *
## FROM `flights`
## WHERE (àrr_delay` > 20.0)
Examinando datos
Cuando estamos manipulando datos, es muy importante para nosotros tener alguna
información básica al respecto. Con los data frame locales, siempre podemos ejecutar
comandos como dim (), ncol () y nrow () para comprender el tamaño y la forma de
nuestros datos. Intentemos:
dim(flights)
## [1] NA 19
# Número de columnas
ncol(flights)
## [1] 19
# Número de filas
nrow(flights)
## [1] NA
Consultas Avanzadas
25
La mayoría de las funciones principales de dplyr funcionarán con tablas remotas, que
incluyen (pero no se limitan a):
group_by() summarize() filter() select() mutate() arrange()
El dplyr pipe%>% también es compatible. Intentemos ver qué aeropuerto tiene las
llegadas más retrasadas.
delays_by_airport <- flights %>%
group_by(origin) %>%
summarize(mean_dep_delay = mean(dep_delay), mean_arr_delay =
mean(arr_delay)) %>%
arrange(-mean_arr_delay)
head(delays_by_airport)
## Warning: Missing values are always removed in SQL.
## Use `mean(x, na.rm = TRUE)` to silence this warning
## This warning is displayed only once per session.
## # Ordered by: -mean_arr_delay
## origin mean_dep_delay mean_arr_delay
## <chr> <dbl> <dbl>
## 1 EWR 15.1 9.11
## 2 LGA 10.3 5.78
## 3 JFK 12.1 5.55
Explicación: Sin nada más, hemos confirmado que el aeropuerto de Newark es el peor.
Revisemos el SQL detrás de ese código: podemos ver que es más complicado, pero
como la mayoría de las funciones de dplyr están diseñadas para actuar como comandos
SQL, se transfieren con bastante facilidad.
delays_by_airport %>%
dbplyr::sql_render()
## <SQL> SELECT òrigin`, AVG(`dep_delay`) AS `mean_dep_delay`,
AVG(àrr_delay`) AS `mean_arr_delay`
## FROM `flights`
## GROUP BY òrigin`
## ORDER BY -`mean_arr_delay`
Join
También podemos usar cualquiera de las funciones * _join (). En lugar de realizar
uniones similares a SQL con data frame locales , en realidad estamos realizando
uniones SQL de forma remota! Intentemos encontrar qué aerolínea tiene el mayor
promedio de demoras, separadas por aeropuerto.
delays_airport_airline <- flights %>%
group_by(origin, carrier) %>%
26
summarize(mean_dep_delay = mean(dep_delay), mean_arr_delay =

mean(arr_delay)) %>%
arrange(-mean_arr_delay) %>%
left_join(airlines)
## Joining, by = "carrier"
## `x` and `y` must share the same src, set `copy` = TRUE (may be slow)
Explicación: La tabla de vuelos contiene el id carrier , pero no los nombres de las

aerolíneas. Eso está en la tabla de las aerolíneas. Sin embargo, tienen la columna
portadora en común ( primary key), por lo que podemos realizar una unión izquierda
para reunir esa información.
Plotting
Si estuviéramos interesados en ver cómo se realiza cada aeropuerto mes a mes,
podríamos hacer algo como esto:
flights %>%
group_by(month, origin) %>%
summarize(mean_arr_delay = mean(arr_delay)) %>%
collect() # Todos los registros
## # A tibble: 36 x 3
## # Groups: month [12]
## month origin mean_arr_delay
## <int> <chr> <dbl>
## 1 1 EWR 12.8
## 2 1 JFK 1.37
## 3 1 LGA 3.38
## 4 2 EWR 8.78
## 5 2 JFK 4.39
## 6 2 LGA 3.15
## 7 3 EWR 10.6
## 8 3 JFK 2.58
## 9 3 LGA 3.74
## 10 4 EWR 14.1
## # … with 26 more rows
GGplot
flights %>%
group_by(month, origin) %>%
summarize(mean_arr_delay = mean(arr_delay)) %>%
collect() %>%
ggplot(aes(x = month, y = mean_arr_delay)) +
geom_line(aes(color = origin)) +
geom_point(aes(color = origin))
27
Figura N° 08: Muestra mensual
Una vez que hayamos terminado, es importante cerrar la conexión de nuestra base de
datos. Lo hacemos con otra función DBI, dbDisconnect ():
dbDisconnect(con)
Auditoría De Base De Datos

Es un proceso con el que una empresa verifica y garantiza que la gestión de los datos
que tiene en su sistema está libre de amenazas de seguridad, fallas o mal manejo de la
información. Mediante una serie de actividades transparenta el uso que se le da a la
base, qué tipo de información tiene y quiénes pueden acceder.
También es posible conocer los dispositivos utilizados para acceder y sus ubicaciones:
desde dónde se ingresó a la base, los permisos que los usuarios tienen, la manera en
que se modificaron en cada movimiento, etcétera.
Sin importar el tamaño de la información almacenada, la auditoría de base de datos es

una revisión que toda organización está obligada a hacer. Sobre todo para cumplir con
los protocolos vigentes (según el territorio donde está la empresa) que se encargan de
proteger el manejo de información sensible de las personas.
La importancia de una auditoría de base de datos

Además de la seguridad que mencionamos líneas arriba, podemos mencionar que esta
práctica es importante porque:
28
• Reduce los riesgos por mal manejo de datos.

• Evita la fuga de datos.
• Previene colapsos en el sistema si se identifica a tiempo dónde se corrompió.
• Mantiene a raya conductas criminales, internas o externas.
• Detecta vulnerabilidades.
• Garantiza que la información se use solo para los objetivos establecidos por la
empresa y aprobados por las leyes vigentes.
• Protege las aplicaciones o herramientas que se alimentan con la base de datos.
Para hacer una auditoría de base de datos es necesario contar con una persona o
equipo responsable de realizarla. Puede ser interno o externo a la empresa
(dependiendo del tamaño de la información que se gestiona) y con el apoyo de un
software que facilite el proceso y clasificación de los datos y los registros de actividad.
Aunque cada empresa tendrá objetivos, personal y herramientas distintas, podemos
resumir los pasos de una auditoría de este tipo en 5 pasos que te describimos a
continuación.
¿Cómo hacer una auditoría de base de datos?

1. Plantea objetivos y verifica el tipo de gestión de los datos.
2. Recopila información.
3. Detecta incidencias o actividades irregulares.
4. Consulta auditorías de base de datos anteriores.
5. Realiza un informe detallado.
1. Plantea objetivos y verifica el tipo de gestión de los datos

Como en todos los proyectos que se espera concluir con éxito, es necesario que se
establezca una finalidad. Si bien la auditoría de base de datos es una práctica que debe
realizarse al menos una vez al año, lo más seguro es que también se lleve a cabo por
una cuestión particular, ya sea por una incidencia que vulneró la información, por un
cambio de personal a cargo de su gestión o porque la base aumentó de forma
considerable en el último trimestre. Si este último es el caso, es probable que haya un
desajuste en la clasificación y organización de los datos, así que más vale garantizar
que todo está en orden. Cuando hablamos de verificar la gestión de los datos, nos
referimos a que estés seguro de que haya un reglamento interno que explique cómo se
obtiene la información que guardas en tu base, cuáles son los datos que manejan,
quiénes los manejan y cuáles son sus permisos vigentes y para qué se utilizan. Junto a
eso debes contar con un documento que garantice que sigues los lineamientos de las
leyes de protección de datos del lugar donde operas, para así constatar que no rompes
ningún estatuto.
2. Recopila información
Aquí será necesario que planees entrevistas con el personal encargado de la base de
datos, que las lleves a cabo y que el auditor o auditores conozcan los procedimientos
29
de recopilación y gestión de datos para poder hacer una comparativa con lo que está
en papel y lo que encontrarán en la práctica.
3. Detecta incidencias o actividades irregulares

Durante todo el procedimiento será importante que registres por escrito todos los pasos
a seguir, y por supuesto todo aquello que no corresponde a los estatutos legales y de
buenas prácticas. Nos referimos a aspectos como la manera en que está clasificada la
información, la transparencia de accesos y acciones llevadas a cabo en la base de
datos. De esta forma será sencillo localizar intentos de robo de información o procesos
incompletos de captura que después se pueden convertir en una crisis delicada.
4. Consulta auditorías de base de datos anteriores

Así podrás garantizar que no se hayan repetido incidencias o vulnerabilidades, así como
confirmar que la gente a cargo de estas tareas domina la tarea sin errores. En resumen,
las auditorías de base de datos anteriores te ayudarán a crear un mejor panorama;
incluso para registrar el aumento de tamaño de la información que se almacena o para
llegar a conclusiones valiosas sobre el desempeño de las herramientas, consultar los
datos históricos es esencial.
5. Realiza un informe detallado

La información es uno de los activos más valiosos de las empresas, no importa la
industria a la que pertenezcas o qué tanto dependes de ella para tu negocio; por ello un
informe superficial podrá ser más rápido de realizar, pero definitivamente no aportará
valor a largo plazo. Es importante que incluyas a detalle las irregularidades que se
encontraron, qué se puede mejorar, cuáles podrían ser las soluciones y los aciertos que
son buena idea seguir replicando.
Ahora te presentamos una selección de software que te ayudará a realizar este tipo de
auditoría.
1. Redgate
Figura N° 09: Redgate
30
Las soluciones de Redgate están clasificadas por la industria que las busca (como
finanzas, proveedores de servicios, cuidado de la salud) o también por necesidad
(desarrollo estandarizado para equipos, monitorear desempeño y disponibilidad,
proteger y preservar datos, entre otros). Ayuda a categorizar, respaldar y conectar tu
base de datos a tu sistema de control; además tiene compatibilidad con Oracle.
2. IDERA
Figura N° 10: IDERA
IDERA puede hacer un reporte de desempeño, gestión basada en políticas

establecidas, garantizar la calidad de los datos y protecciones que avalan la seguridad
de tus datos. Es ideal para comenzar a diseñar la base de datos u optimizar la existente,
tanto en equipos de cómputo físicos de la empresa como en la nube. Si lo contratas,
tienes acceso a una comunidad que ayuda a usarla en su máximo potencial y a un
soporte técnico especializado.
3. Solarwinds
Figura N° 11: Solarwinds
31
Su misión es simplificar la auditoría de base de datos, y una de sus herramientas más

valiosas es que ayuda a comprobar que sus usuarios cumplan con los reglamentos de
protección de datos de diferentes entidades. Automatiza la auditoría en archivos,
carpetas y servidores; permite personalizar reportes para entregar información
actualizada sobre el estado de la información y te permite gestionar el acceso de tu
equipo así como los permisos que tiene autorizados desde un solo sitio.
4. IDEA
Figura N° 12: IDEA
Desarrollado por CaseWare Analytics, IDEA tiene más de cien tareas relacionadas con
la auditoría de base de datos que te serán de mucha utilidad. Tendrás la posibilidad de
detectar patrones en la información, crear reportes con gráficas que permitan
comprender mejor los datos y compartirlos con terceros (como Tableau, MS Excel,
ODBC); así podrás detectar irregularidades de manera sencilla.
5. Foglight
Figura N° 13: Foglight
32
Quest tiene Foglight para la administración de bases de datos. Permite gestionar todas
las bases a las que tiene acceso tu empresa desde una única consola y lo mejor es que
está creada para entornos híbridos (equipos físicos y la nube). Podrás detectar
problemas de rendimiento antes de que sean un obstáculo para los usuarios, te brindará
datos históricos enriquecidos y también te dará acceso a un panorama histórico que te
ayudará a comprender mejor las incidencias que tengas.
Después de esta guía, recuerda que pese al esfuerzo una auditoria te ayudará a
mantener la protección de tu base de datos tan segura como si se tratara de tus propios
datos personales.
Manejo De Estructuras y Datos en Power BI

Con Power BI Desktop, puede conectarse a muchos tipos de orígenes de datos distintos
y dar forma a la información para que se ajuste a sus necesidades. De este modo, podrá
crear informes visuales y compartirlos con otras personas. Dar forma a los datos
significa transformar los datos: cambiar el nombre de las columnas o las tablas, convertir
texto en números, quitar filas, configurar la primera fila como encabezado, etc. Combinar
datos significa conectarse a dos o más orígenes de datos, darles la forma necesaria y
consolidarlos después en una consulta individual.
Dar forma a los datos

Para dar forma a los datos en el Editor de Power Query, tiene que proporcionar
instrucciones paso a paso para que esta característica ajuste los datos a medida que
se cargan y se presentan. El origen de datos del que procede la información no se verá
afectado. Los únicos datos a los que se va a dar forma o que se van a ajustar son los
de esta vista concreta.
El Editor de Power Query registra los pasos especificados (por ejemplo, cambiar el
nombre de una tabla, transformar un tipo de datos o eliminar una columna). Cada vez
que esta consulta se conecte al origen de datos, el Editor de Power Query llevará a
cabo esos pasos para que los datos siempre tengan la forma indicada. Este proceso
tendrá lugar siempre que utilice el Editor de Power Query o que otra persona utilice su
consulta compartida; por ejemplo, en el servicio Power BI. Estos pasos se capturan, de
manera secuencial, en el panel Configuración de consulta, en PASOS APLICADOS.
33
Figura N° 14: Configuración de consulta
Importe los datos desde un origen web. Seleccione la lista desplegable Obtener datos
y, a continuación, elija Web.
Figura N° 15: Obtener datos
34
Pegue esta dirección URL en el cuadro de diálogo De web y seleccione Aceptar.
Figura N° 16: Desde la Web
En el cuadro de diálogo Navegador, seleccione Table 1 y, después, elija Transformar

datos.
Figura N° 17: Transformar datos
Sugerencia
Algunas informaciones de las tablas de la dirección URL anterior pueden cambiar o
actualizarse ocasionalmente. Como resultado, es posible que tenga que ajustar las
selecciones o los pasos de este artículo en consecuencia.
35
Se abre la ventana Editor de Power Query. Puede ver los pasos predeterminados
aplicados hasta ahora, en el panel Configuración de consulta en PASOS APLICADOS.
• Origen: conexión con el sitio web.
• Tabla extraída de HTML: selección de la tabla.
• Encabezados promovidos: cambiar la fila superior de datos en los encabezados de
columna.
• Tipo cambiado: cambiar los tipos de columna, que se importan como texto, a sus
tipos inferidos.
Figura N° 18: Importar datos
Cambie el nombre de la tabla del valor predeterminado Table 1 a Retirement Data y,

después, presione Entrar.
36
Figura N° 19: Tipo cambiado
Los datos existentes se ordenan por una puntuación ponderada. Vamos a agregar una
columna personalizada para calcular una puntuación diferente. A continuación,
ordenaremos la tabla de esta columna para comparar la clasificación de la puntuación
personalizada con la clasificación existente.
En la cinta de opciones Agregar columna, seleccione Columna personalizada.
Figura N° 20: Personalizar columna
En el cuadro de diálogo Columna personalizada, en Nuevo nombre de columna, escriba

Nueva puntuación. En Fórmula de columna personalizada, especifique lo siguiente:
( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] +
[#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] +
[Weather] ) / 8
Compruebe que el mensaje de estado es No se han detectado errores de sintaxis y

seleccione Aceptar.
37
Figura N° 21: Verificación de errores
En Configuración de consulta, la lista PASOS APLICADOS ahora muestra el nuevo

paso Personalizada agregada que acabamos de definir.
Figura N° 22: Personalizada agregada
38
Ajuste de los datos

Antes de poder trabajar con esta consulta, hagamos algunos cambios para ajustar los
datos:
• Ajustar las clasificaciones quitando una columna.
• Por ejemplo, supongamos que Weather no es un factor en nuestros resultados.
Quitar esta columna de la consulta no afecta a los demás datos.
• Corrija cualquier error.
• Al quitar una columna, es necesario ajustar los cálculos de la columna Nueva
puntuación mediante el cambio de su fórmula.
• Ordenar los datos.
• Ordene los datos en función de la columna Nueva puntuación y compare con la
columna Clasificación existente.
• Reemplazar los datos.
• Es importante resaltar cómo se van a reemplazar valores específicos y cómo insertar
un paso aplicado.
Estos cambios se describen en los pasos siguientes.

Para quitar la columna Weather, selecciónela, elija la pestaña Inicio de la cinta de
opciones y haga clic en Quitar columnas.
Figura N° 23: Quitar columna
Nota
Observe que los valores de Nueva puntuación no han cambiado, lo que se debe al orden
de los pasos. Editor de Power Query registra los pasos secuencialmente, pero de forma
independiente, entre sí. Para aplicar acciones en una secuencia diferente, puede mover
cada paso aplicado hacia arriba o hacia abajo.
Haga clic con el botón derecho en un paso para ver su menú contextual.
39
Figura N° 24: Subir
Suba el último paso, Columnas quitadas, y colóquelo justo encima del paso
Personalizada agregada.
40
Seleccione el paso Personalizada agregada. Observe que la columna Nueva

puntuación ahora muestra Error en lugar del valor calculado.
Figura N° 26: Error
Hay varias maneras de obtener más información sobre cada error. Si selecciona la celda
sin hacer clic en la palabra Error, el Editor de Power Query mostrará la información del
error.
Figura N° 27: Seleccione error
Si selecciona la palabra Error directamente, el Editor de Power Query crea un Paso

aplicado en el panel Configuración de la consulta y muestra información sobre el error.
41
Como no necesitamos mostrar información sobre los errores en ningún otro lugar,
seleccione Cancelar.
Para corregir los errores, es necesario realizar dos cambios: quitar el nombre de la
columna Weather y cambiar el divisor de 8 a 7. Puede realizar estos cambios de dos
maneras:
• Haga clic con el botón derecho en el paso Columna personalizada y seleccione
Editar configuración. Esta acción abre el cuadro de diálogo Columna personalizada
que usó para crear la columna Nueva puntuación. Edite la fórmula como se ha
descrito anteriormente, hasta que tenga este aspecto:
Figura N° 28: Columna personalizada
Seleccione la columna Nueva puntuación, luego muestre la fórmula de datos de la

columna seleccionando la casilla Barra de fórmulas de la pestaña Ver.
Figura N° 29: Pestaña Ver
Edite la fórmula como se ha descrito anteriormente, hasta que tenga este aspecto y
luego presione Entrar.
42
= Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] +

[Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public
health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)
Combinar datos
Los datos sobre los diferentes estados son interesantes y serán útiles para crear otras
consultas y análisis. Sin embargo, la mayoría de los datos sobre los estados usan una
abreviatura de dos letras para los códigos de estado, no el nombre completo del estado.
Debemos encontrar un modo de asociar las abreviaturas con los nombres de los
estados.
Hay otro origen de datos públicos que proporciona esa asociación, pero necesita unos
buenos ajustes para que podamos conectarlo a nuestra tabla sobre la jubilación. Para
dar forma a los datos, siga estos pasos:
En la cinta de opciones Inicio de Editor de Power Query, seleccione Nuevo origen >
Web. Escriba la dirección del sitio web que contiene las abreviaturas de los estados,
https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations , y seleccione Conectar.
En Navegador, se muestra el contenido del sitio web.
Figura N° 30: Sitio Web
43
Seleccione Códigos y abreviaturas para estados estadounidenses, distrito federal,

territorios y otras regiones.
Para ajusta los datos, siga estos pasos:

• Quite la fila superior. Esta fila es el resultado del modo en que se creó la tabla de la
página web, así que no la necesitamos. Desde la cinta de opciones Inicio, seleccione
Quitar filas > Quitar filas superiores.
Figura N° 31: Quitar Fila
Aparece el cuadro de diálogo Quitar filas superiores. Especifique 1 fila para quitar.
• Promueva la nueva fila superior a los encabezados con Usar primera fila como
encabezado desde la pestaña Inicio o desde la pestaña Transformar de la cinta de
opciones.
Como la tabla Datos de jubilación no tiene información sobre Washington D. C. ni
territorios, debemos filtrarlos en nuestra lista. Seleccione la lista desplegable de la
columna Nombre y estado de región_1 y desactive todas las casillas excepto Estado.
44
TAREA N°03
Diseña Dashboard: SQL Server Reporting Services
Orígenes de datos para Power View

Excel 2013 permite usar los datos directamente en Excel como base para Power View
para Excel y SharePoint. Al agregar tablas y crear relaciones entre ellas, Excel crea un
modelo de datos en segundo plano. Un modelo de datos es una colección de tablas y
sus relaciones que reflejan las relaciones reales entre procesos y funciones
empresariales, por ejemplo, la relación de los productos con el inventario y las ventas.
Puede continuar modificando y mejorando el mismo modelo de datos en Power Pivot
para Excel, para crear un modelo de datos más sofisticado para informes de Power
View.
Power View permite interactuar con los datos:

• En el mismo libro de Excel que la hoja de Power View.
• En modelos de datos Excel libros publicados en una galería de Power Pivot.
• En modelos tabulares implementados en instancias de SQL Server 2012 Analysis
Services (SSAS).
• En modelos multidimensionales de un servidor SSAS (si usa Power View para
SharePoint Server).
Descripción de los objetos de modelo multidimensional de Power View

Importante: En Excel para Microsoft 365 y Excel 2021, Power View se eliminará el 12
de octubre de 2021. Como alternativa, puede usar la experiencia visual interactiva
proporcionada por Power BI Desktop, que puede descargar de forma gratuita. También
puede importar fácilmente libros de Excel en Power BI Desktop.
Este artículo puede ayudarle a comprender cómo puede usar Power View, una
aplicación de Silverlight basada en explorador que se inicia desde SharePoint Server,
para explorar datos de forma interactiva y crear visualizaciones dinámicas desde
modelos multidimensionales de Analysis Services.
Al usar Power View para visualizar modelos multidimensionales, es importante tener en

cuenta que está trabajando con una representación de tipo de modelo tabular de un
modelo multidimensional. Los modelos tabulares tienen objetos como tablas y
columnas, al igual que con modelos multidimensionales, medidas y KPI.
Cuando usted o un administrador crean una conexión de origen de datos compartido en

SharePoint, se especifica un nombre de cubo o una perspectiva en la cadena de
conexión. Solo se puede especificar un cubo o una perspectiva. El cubo o la perspectiva
45
especificados en la conexión de origen de datos compartido se expone como un modelo

en la Power View de campos. Los objetos del modelo se exponen como campos que
puede usar en visualizaciones de tabla en una vista. Sin embargo, hay algunas
diferencias en la forma en que aparecen determinados objetos multidimensionales en
Power View. Al igual que con los modelos tabulares, la lista de campos muestra todos
los objetos que puede usar en una vista.
Los modelos multidimensionales tienen dimensiones. En este ejemplo, la lista de

campos contiene objetos en la dimensión Producto. El producto aparece como una tabla
en el modelo Adventure Works (cubo). Una tabla o dimensión también tiene otros
objetos.
Objetos de dimensión
Figura N° 32: Objetos Dimensiones
a. Las dimensiones aparecen como tablas y se pueden expandir para mostrar otros
objetos en la tabla (dimensión). El cubo Adventure Works tiene muchas tablas,
cuenta a moneda de origen.
b. Mostrar carpetas divide y clasifica aún más cómo aparecen los objetos asociados en
las herramientas de cliente. Las carpetas de visualización pueden aparecer en la
lista de campos debajo de las tablas de dimensiones y medir las tablas de grupo.
c. Los atributos de dimensión aparecen como columnas en una tabla. Una sola
columna (atributo) puede aparecer tanto en una tabla como de nuevo en una
jerarquía, a menos que esté explícitamente oculta.
46
d. Las jerarquías de usuario y de elemento primario y secundario se incluyen en tablas

(dimensiones). Las jerarquías se pueden expandir para mostrar columnas (niveles)
en ellas. Al seleccionar un nivel, todos los niveles anteriores también se seleccionan
automáticamente. Puede anular la selección de niveles superiores para quitarlos de
la visualización. Esto puede ser útil cuando determinados campos solo se exponen
en una jerarquía.
Los objetos con este icono indican que este objeto es una clave.
Los modelos multidimensionales también tienen grupos de medida, también conocidos

como dimensiones de medida, que contienen medidas que puede usar para agregar
datos en el análisis.
Medir objetos de grupos
Figura N° 33: Lista de campos
a. Los grupos de medida aparecen como tablas; sin embargo, a diferencia de las tablas
de una dimensión, una tabla de un grupo de medida se identifica con un icono sigma.
b. Las medidas aparecen en tablas de grupo de medida y se identifican con un icono
de calculadora. Si el cubo solo tiene una medida, se incluirá en un grupo de medida
asociado si hay una o en una sola tabla denominada Medidas.
c. Los KPI se incluyen en las tablas de grupo de medida asociadas y se identifican con
un icono de semáforo. Por ejemplo, si en el modelo Adventure Works expande
Ventas de revendedores > Perspectiva financiera > Aumentar ingresos, verá el KPI
de ingresos del canal y sus cuatro medidas; Valor, Objetivo, Estado y Tendencia.
47
Crear gráficos y otras visualizaciones

Power View permite crear rápidamente diversas visualizaciones, desde tablas y
matrices, pasando por gráficos circulares, de burbujas y de barras, hasta conjuntos de
varios gráficos. Para cada visualización que quiera crear, comience con una tabla que,
después, podrá convertir fácilmente en otras visualizaciones, para dar con la que mejor
ilustre los datos. Para crear una tabla, haga clic en una tabla o un campo en la lista de
campos, o arrastre un campo de la lista de campos a la vista. Power View traza la tabla
en la vista, muestra los datos reales y agrega automáticamente encabezados de
columna.
Para convertir una tabla en otras visualizaciones, haga clic en un tipo de visualización
en la pestaña Diseño. Power View solo habilita los gráficos y el resto de las
visualizaciones que mejor funcionen para los datos de esa tabla. Por ejemplo, si Power
View no detecta ningún valor numérico agregado, no se habilita ningún gráfico.
Gráficos y otras visualizaciones en Power View

Importante: En Excel para Microsoft 365 y Excel 2021, Power View se eliminará el 12
de octubre de 2021. Como alternativa, puede usar la experiencia visual interactiva
proporcionada por Power BI Desktop, que puede descargar de forma gratuita. También
puede importar fácilmente libros de Excel en Power BI Desktop.
En Power View SharePoint 2013 y en Excel 2013, puede crear rápidamente una
variedad de visualizaciones de datos, desde tablas y matrices hasta gráficos de barras,
columnas y burbujas, y conjuntos de varios gráficos. Para cada visualización que quiera
crear, empiece en una hoja de Power View creando una tabla que, a continuación,
convierta fácilmente en otras visualizaciones para encontrar una que ilustre mejor los
datos.
Crear una visualización

Cree una tabla en la Power View consultando una tabla o campo en la lista de campos
o arrastrando un campo de la lista de campos a la hoja. Power View la tabla de la hoja,
mostrando los datos reales y agregando automáticamente encabezados de columna.
Convierta la tabla en una visualización eligiendo un tipo de visualización en la pestaña

Diseño. En función de los datos de la tabla, hay diferentes tipos de visualización
disponibles para ofrecer la mejor visualización para los datos.
Sugerencia: Para crear otra visualización, inicie otra tabla haciendo clic en la hoja en
blanco antes de seleccionar campos de la sección campos de la lista de campos.
Ejemplos de visualizaciones disponibles en Power View
48
Figura N° 34: Ejemplos de visualización
1. Segmentación de datos que filtra el informe a panes

2. Navegación de flujo de mosaicos para mosaicos, actualmente en el cruasán
3. Tarjeta en un contenedor de mosaico, filtrada al mosaico actual (cruasán)
4. Gráfico de líneas en un contenedor de mosaico que muestra las cantidades
consumidas y el servidor, filtrado a los cruasanes de enero a diciembre
5. Múltiplo, filtrado a panes y ordenado en orden descendente por cantidad servida
6. Gráfico de columnas filtrado a panes, que muestra las cantidades servidas y
consumidas
Gráficos
Power View ofrece varias opciones de gráfico: circular, columna, barra, línea, dispersión
y burbuja. Los gráficos pueden tener varios campos numéricos y varias series. Tiene
varias opciones de diseño en un gráfico: mostrar y ocultar etiquetas, leyendas y títulos.
Los gráficos son interactivos: al hacer clic en valores de un gráfico, usted:

• Resalte ese valor en ese gráfico.
• Filtre a ese valor en todas las tablas, matrices y mosaicos del informe.
• Resalte ese valor en todos los demás gráficos del informe.
Los gráficos también son interactivos en una configuración de presentación, por

ejemplo, en los modos de lectura y pantalla completa en Power View en SharePoint o
49
en una hoja de Power View en un libro de Excel guardado en Excel Services o visto en
Microsoft 365.
Gráficos circulares
Los gráficos circulares son simples o sofisticados en Power View. Puede hacer un
gráfico circular que muestre información detallada al hacer doble clic en un solo
segmento o un gráfico circular que muestre subsegmentos dentro de los segmentos de
color mayores. Puede aplicar un filtro cruzado a un gráfico circular con otro gráfico.
Suponga que hace clic en una barra en un gráfico de barras. La parte del gráfico circular
que se aplica a la barra se resalta y el resto del gráfico circular se atenúa. Obtenga
información sobre los gráficos circulares en Power View.
Figura N° 35: Gráfico circular
Gráficos de dispersión y de burbujas

Los gráficos de dispersión y burbujas son una forma excelente de mostrar una gran
cantidad de datos relacionados en un gráfico. En los gráficos de dispersión, el eje x
muestra un campo numérico y el eje y muestra otro, lo que facilita ver la relación entre
los dos valores de todos los elementos del gráfico.
En un gráfico de burbujas, un tercer campo numérico controla el tamaño de los puntos

de datos. También puede agregar un eje de "reproducción" a un gráfico de dispersión o
burbuja para ver los datos a medida que cambia con el tiempo.
Gráficos de líneas, barras y columnas

Los gráficos de líneas, barras y columnas son útiles para comparar puntos de datos en
una o más series de datos. En los gráficos de líneas, barras y columnas, el eje x muestra
un campo y el eje y muestra otro, lo que facilita ver la relación entre los dos valores de
todos los elementos del gráfico.
Gráficos de barras
En un gráfico de barras, las categorías se organizan a lo largo del eje vertical y los
valores a lo largo del eje horizontal. Considere la posibilidad de usar un gráfico de barras
en cualquiera de estos casos:
• Tiene una o varias series de datos que desea trazar.
50
• Los datos contienen valores positivos, negativos y cero (0).

• Desea comparar los datos de varias categorías.
• Las etiquetas de eje son largas.
En Power View, tiene tres subtipos de gráfico de barras entre los que elegir: apiladas,
100 % apiladas y agrupadas.
Gráficos de columnas
Los datos organizados en columnas o filas de una hoja de cálculo se pueden
representar en un gráfico de columnas. Los gráficos de columnas resultan útiles para
mostrar cambios en los datos a lo largo de un período de tiempo o para ilustrar
comparaciones entre elementos. En los gráficos de columnas, las categorías se
encuentran a lo largo del eje horizontal y los valores a lo largo del eje vertical.
En Power View, tiene tres subtipos de gráfico de columnas entre los que elegir: apiladas,
100 % apiladas y agrupadas.
Gráficos de líneas
Los gráficos de líneas distribuyen los datos de categoría de forma uniforme a lo largo
de un eje horizontal (categoría) y todos los datos de valores numéricos a lo largo de un
eje vertical (valor).
Figura N° 36: Gráfico lineal
Considere la posibilidad de usar un gráfico de líneas con escala de tiempo a lo largo del
eje horizontal. Los gráficos de líneas muestran fechas en orden cronológico a intervalos
específicos o unidades base, como el número de días, meses o años, incluso si las
fechas de la hoja de cálculo no están en orden o en las mismas unidades base.
Mapas
Los mapas de Power View usan mosaicos de mapas de Bing, de modo que puede hacer
zoom y crear panorámicas igual que con cualquier otro mapa de Bing. Agregar
ubicaciones y campos coloca puntos en el mapa. Cuanto mayor sea el valor, mayor será
el punto. Al agregar una serie de varios valores, se obtienen gráficos circulares en el
mapa, con el tamaño del gráfico circular que muestra el tamaño del total.
51
Figura N° 37: Mapa
Múltiplos: Un conjunto de gráficos con los mismos ejes

Con múltiplos, puede crear una serie de gráficos con ejes X e Y idénticos y organizarlos
en paralelo, lo que facilita la comparación de muchos valores diferentes al mismo
tiempo. Los múltiplos a veces se denominan "gráficos enrejados".
Matrices
Una matriz es similar a una tabla en la que está hecha de filas y columnas. Pero una
matriz tiene las siguientes capacidades que una tabla no:
• Mostrar datos sin repetir valores.
• Mostrar totales y subtotales por fila y columna
• Con una jerarquía, puede explorar en profundidad
• Contraer y expandir la pantalla
Tarjetas
Puede convertir una tabla en una serie de tarjetas que muestren los datos de cada fila
de la tabla diseñada en formato de tarjeta, como una tarjeta de índice.
Figura N° 38: Tarjeta
52
Mosaicos
Puede convertir una tabla o matriz en mosaicos para presentar datos tabulares de forma
interactiva. Los mosaicos son contenedores con una franja de navegación dinámica.
Los mosaicos sirven de filtros: filtran el contenido que hay en el mosaico en función del
valor seleccionado en la franja de pestañas. Puede agregar más de una visualización
al mosaico y todas se filtran por el mismo valor. Puede usar texto o imágenes como
pestañas. Más información sobre mosaicos en Power View.
Esta imagen muestra el número de medallas ganadas por los países que compiten en
patinaje de velocidad.
Figura N° 39: Mosaico
53
TAREA N°04
Aplicar en un caso práctico la configuración y uso de almacenamiento de datos con

BI
Procesamiento analítico en línea (OLAP)
El procesamiento analítico en línea (OLAP) es una tecnología que organiza grandes
bases de datos empresariales y proporciona análisis complejo. Se puede utilizar para
realizar consultas analíticas complejas sin afectar negativamente los sistemas
transaccionales.
Las bases de datos que utiliza una empresa para almacenar todas sus transacciones y
registros se llaman bases de datos de procesamiento de transacciones en línea (OLTP).
Normalmente, estas bases de datos tienen registros que se introducen uno cada vez. A
menudo contienen una gran cantidad de información de valor para la organización. Sin
embargo, las bases de datos que se usan para OLTP no se diseñaron para el análisis.
Por lo tanto, obtener respuestas de estas bases de datos es costoso en términos de
tiempo y esfuerzo. Los sistemas OLAP se han diseñado para ayudar a extraer de los
datos esta información de inteligencia empresarial con un alto rendimiento. Esto se debe
a que las bases de datos OLAP se optimizan para cargas de trabajo grandes en lecturas
y pequeñas en escrituras.
Figura N° 40: OLAP
Modelos semánticos
Un modelo de datos semánticos es un modelo conceptual que describe el significado
de los elementos de datos que contiene. A menudo, las organizaciones usan sus
propios términos, a veces emplean sinónimos o incluso diferentes significados para un
mismo término. Por ejemplo, es posible que una base de datos de inventario realice el
seguimiento de una pieza de un equipo con un identificador de recurso y un número de
serie, mientras que una base de datos de ventas podría hacer referencia al número de
serie como el identificador de recurso. No existe una manera sencilla de relacionar estos
valores sin un modelo que describa la relación.
54
Los modelos semánticos proporcionan un nivel de abstracción sobre el esquema de la

base de datos, de forma que los usuarios no necesitan conocer las estructuras de datos
subyacentes. Así resulta más fácil para los usuarios finales consultar los datos sin
realizar agregados ni uniones sobre el esquema subyacente. Además, normalmente se
asignan nombres más descriptivos a las columnas, de forma que el contexto y el
significado de los datos resulten más obvios.
Los modelos semánticos se usan predominantemente en escenarios con mucha

actividad de lectura, como el análisis y la inteligencia empresarial (OLAP), a diferencia
del procesamiento de datos transaccionales (OLTP) con una elevada actividad de
escritura. Esto se debe principalmente a la naturaleza de una capa semántica típica:
• Los comportamientos de agregación se establecen para que las herramientas de
generación de informes los muestren correctamente.
• Se definen los cálculos y la lógica de negocios.
• Se incluyen cálculos orientados al tiempo.
• Se suelen integrar datos de varios orígenes.
Tradicionalmente, la capa semántica se coloca sobre un almacenamiento de datos por

estos motivos.
Figura N° 40: Modelo semántico
Hay dos tipos principales de modelos semánticos:

• Tabular. Utiliza construcciones de modelado relacional (modelo, tablas, columnas).
Internamente, los metadatos se heredan de construcciones de modelado OLAP
(cubos, dimensiones, medidas). El código y los scripts usan metadatos OLAP.
• Multidimensional. Usa construcciones de modelado OLAP tradicionales (cubos,
dimensiones, medidas).
Servicio de Azure correspondiente:

Azure Analysis Services
55
Ejemplo de caso de uso

Una organización tiene datos almacenados en una base de datos grande. Se desea
poner estos datos a disposición de clientes y usuarios de negocios para que puedan
crear sus propios informes y realizar análisis. Una opción es simplemente dar a dichos
usuarios acceso directo a la base de datos. Sin embargo, esta opción tiene varias
desventajas, incluida la administración de la seguridad y el control de acceso. Asimismo,
el diseño de la base de datos, incluidos los nombres de las tablas y columnas, puede
ser difícil de entender para los usuarios. Los usuarios tendrían que saber qué tablas
consultar, cómo deberían combinarse esas tablas y conocer otra lógica de negocios que
deba aplicarse para obtener los resultados correctos. Además, para empezar, los
usuarios deberían conocer un lenguaje de consulta, como SQL. Esto suele provocar
que varios usuarios generen informes con las mismas métricas, pero con resultados
distintos.
Otra opción consiste en encapsular toda la información que necesitan los usuarios en
un modelo semántico. Los usuarios pueden consultar el modelo semántico más
fácilmente con la herramienta de generación informes que prefieran. Los datos
proporcionados por el modelo semántico se extraen de un almacenamiento de datos, lo
que garantiza que todos los usuarios vean una misma versión. El modelo semántico
también proporciona nombres descriptivos de tablas y columnas, relaciones entre
tablas, descripciones, cálculos y seguridad a nivel de fila.
Características típicas del modelo semántico

Los modelos semánticos y el procesamiento analítico suelen presentar las siguientes
características:
Requisito Descripción
Schema Esquema durante la escritura, altamente aplicado
Usa transacciones No
Estrategia de bloqueo None
Actualizable No (normalmente es necesario recalcular el cubo)
Anexable No (normalmente es necesario recalcular el cubo)
Carga de trabajo Elevada actividad de lectura, solo lectura
Indización Indexación multidimensional
Tamaño de los datos Pequeño a mediano tamaño
Modelo Multidimensional
Forma de los datos: Cubo o esquema de estrella o copo de nieve
Flexibilidad de consulta Muy flexible
Escala: Grande (de decenas a centenares de GB)
Figura N° 41: Características típicas del modelo semántico
56
Cuando se debe utilizar esta solución
Considere el uso de OLAP en los siguientes escenarios:

• Necesita ejecutar consultas ad hoc y análisis complejos rápidamente, sin afectar
negativamente a los sistemas OLTP.
• Desea proporcionar a los usuarios empresariales una manera sencilla de generar
informes a partir de los datos
• Desea proporcionar diversas agregaciones que permitirán a los usuarios obtener
resultados rápidos y coherentes.
OLAP es especialmente útil para aplicar cálculos agregados en grandes cantidades de

datos. Los sistemas OLAP están optimizados para escenarios de uso intensivo de
lectura, como el análisis y la inteligencia empresarial. OLAP permite a los usuarios
dividir datos multidimensionales en segmentos que pueden visualizarse en dos
dimensiones (por ejemplo, una tabla dinámica) o filtrar los datos por valores específicos.
Este proceso se llama a veces "segmentar y desglosar" los datos y se puede llevar a
cabo independientemente de si los datos se dividen en varios orígenes de datos. Esto
ayuda a los usuarios a encontrar tendencias, detectar patrones y explorar los datos sin
tener que conocer los detalles del análisis de datos tradicional.
Los modelos semánticos pueden ayudar a los usuarios empresariales a abstraer las
complejidades de las relaciones y facilitan el análisis rápido de los datos.
Desafíos
A pesar de todas las ventajas que proporcionan los sistemas OLAP, producen algunos
desafíos:
• En tanto que los datos en los sistemas OLTP se actualizan constantemente a través
de transacciones que fluyen procedentes de diversos orígenes, los almacenes de
datos OLAP normalmente se actualizan a intervalos mucho más lentos, en función
de las necesidades del negocio. Esto significa que los sistemas OLAP son más
adecuados para tomar decisiones empresariales estratégicas, en lugar de dar
respuestas inmediatas ante los cambios. Además, se debe planear cierto nivel de
limpieza de datos y orquestación para mantener actualizados los almacenes de
datos OLAP.
• A diferencia de las tablas tradicionales, normalizadas y relacionales encontradas en
los sistemas OLTP, los modelos de datos OLAP suelen ser multidimensionales. Esto
hace difícil o imposible la asignación directa a modelos entidad-relación y modelos
orientados a objetos, en los que cada atributo se asigna a una columna. Los
sistemas OLAP normalmente usan un esquema de estrella o copo de nieve en lugar
de la normalización tradicional.
57
OLAP en Azure
En Azure, los datos que se mantienen en sistemas OLTP, como Azure SQL Database,
se copian en el sistema OLAP, como Azure Analysis Services. Las herramientas de
exploración y visualización de datos como Power BI, Excel y otras herramientas de
terceros se conectan a los servidores de Analysis Services y proporcionan a los usuarios
una información interactiva y enriquecida visualmente sobre los datos modelados. El
flujo de los datos desde OLTP a OLAP normalmente se orquesta con SQL Server
Integration Services, que se puede ejecutar con Azure Data Factory.
En Azure, los almacenes de datos siguientes cumplirán los requisitos principales para
OLAP:
• SQL Server con índices de almacén de columnas
• Azure Analysis Services
• SQL Server Analysis Services (SSAS)
SQL Server Analysis Services (SSAS) ofrece funciones de OLAP y de minería para
aplicaciones de inteligencia empresarial. SSAS se puede instalar en servidores locales,
o bien se puede hospedar en una máquina virtual en Azure. Azure Analysis Services es
un servicio completamente administrado que proporciona las mismas características
principales que SSAS. Azure Analysis Services admite la conexión a varios orígenes de
datos, que se encuentren tanto en la nube como en el entorno local, de su organización.
Los índices de almacén de columnas en clúster están disponibles en SQL Server 2014,
y en las versiones posteriores, así como en Azure SQL Database, y son ideales para
cargas de trabajo de OLAP. Sin embargo, a partir de SQL Server 2016 (incluido Azure
SQL Database), puede sacar partido del procesamiento transaccional/analítico híbrido
(HTAP) mediante el uso de índices de almacén de columnas no agrupados
actualizables. HTAP permite realizar el procesamiento de OLTP y OLAP en la misma
plataforma, lo que elimina la necesidad de almacenar varias copias de los datos y de
tener distintos sistemas de OLTP y OLAP. Para más información, consulte Introducción
al almacén de columnas para análisis operativos en tiempo real.
Principales criterios de selección

Para restringir las opciones, empiece por responder a estas preguntas:
• ¿Quiere un servicio administrado en lugar de administrar sus propios servidores?
• ¿Necesita autenticación segura mediante Microsoft Entra ID?
• ¿Desea realizar análisis en tiempo real? En ese caso, limite las opciones a las que
admitan análisis en tiempo real.
En este contexto, análisis en tiempo real se aplica a un origen de datos único, como
una aplicación de planificación de recursos empresariales (ERP), que ejecutará una
carga de trabajo tanto operativa como de análisis. Si tiene que integrar datos de
varios orígenes, o requieren un rendimiento extremo de los análisis mediante el uso
58
de datos previamente agregados, como cubos, puede que necesite un almacén de

datos independiente.
• ¿Necesita usar datos previamente agregados, por ejemplo, para proporcionar los
modelos semánticos que hacen que los usuarios empresariales entiendan mejor los
análisis? En ese caso, elija una opción que admita cubos multidimensionales o
modelos semánticos tabulares.
El hecho de proporcionar agregados puede ayudar a los usuarios a calcular

agregados de datos de forma coherente. Los datos agregados previamente también
pueden mejoras significativamente el rendimiento cuando se trabaja con varias
columnas en muchas filas. Los datos se pueden agregar previamente en cubos
multidimensionales o modelos semánticos tabulares.
• ¿Necesita integrar datos de varios orígenes, más allá de su almacén de datos de

OLTP? Si es así, considere la posibilidad de usar opciones que integren fácilmente
varios orígenes de datos.
Matriz de funcionalidades
En las tablas siguientes se resumen las diferencias clave en cuanto a funcionalidades.
Funcionalidades generales
Capacidad Azure SQL Server SQL Server Azure SQL Database
Analysis Analysis con índices de con índices de
Services Services almacén de almacén de
columnas columnas
Es un servicio Sí No No Sí
administrado
Admite cubos No Sí No No
multidimensionales
Admite modelos Sí Sí No No
semánticos tabulares
Integra fácilmente Sí Sí No 1 No 1
varios orígenes de
datos
Admite análisis en No No Sí Sí
tiempo real
Requiere un proceso Sí Sí No No
para copiar los datos
de los orígenes
Integración de Sí No No 2 Sí
Microsoft Entra
Figura N° 42: Funcionalidades Generales
59
[1] Aunque SQL Server y Azure SQL Database no se pueden usar para consultar varios
orígenes de datos externos, e integrarlos, puede crear una canalización que lo haga
automáticamente mediante SSIS o Azure Data Factory. SQL Server hospedado en una
máquina virtual de Azure tiene opciones adicionales, como los servidores vinculados y
PolyBase. Para más información, consulte Choosing a data pipeline orchestration
technology in Azure (Elección de una tecnología de orquestación de canalizaciones de
datos en Azure).
[2] La conexión a una instancia de SQL Server que se ejecute en una máquina virtual
de Azure no se admite si se usa una cuenta de Microsoft Entra. Utilice en su lugar una
cuenta de Active Directory del dominio.
Funcionalidades de escalabilidad
Capacidad Azure SQL Server SQL Server Azure SQL
Analysis Analysis con índices de Database con
Services Services almacén de índices de almacén
columnas de columnas
Servidores regionales Sí No Sí Sí
redundantes para
lograr alta
disponibilidad
Admite el escalado Sí No Sí Sí
horizontal de
consultas
Escalabilidad Sí No Sí Sí
dinámica (escalado
vertical)
Figura N° 43: Funcionalidades de escalabilidad
60
REFERENCIAS BIBLIOGRÁFÍCAS
Data Warehouse: todo lo que necesitas saber sobre almacenamiento de datos
• https://www.powerdata.es/data-warehouse
Roles en áreas de trabajo de Power BI
• https://learn.microsoft.com/es-es/power-bi/collaborate-share/service-roles-new-
workspaces
¿Qué es la escalabilidad de una base de datos?
• https://preteco.com/escalabilidad-de-una-base-de-datos/
¿Qué es el Monitoreo de banco de datos y cuáles son sus ventajas?
• https://www.internationalit.com/post/que-es-el-monitoreo-de-banco-de-datos-y-
cuales-son-sus-
ventajas?lang=es#:~:text=La%20soluci%C3%B3n%20es%20el%20monitoreo,se%20
conviertan%20en%20verdaderas%20fallas.
Conexiones a bases de datos
• https://rstudio-pubs-
static.s3.amazonaws.com/495393_380fb942fbb64dc79b846a16918142b1.html
5 pasos para hacer una auditoría de base de datos
• https://blog.hubspot.es/marketing/auditoria-base-de-
datos#:~:text=%C2%BFQu%C3%A9%20es%20una%20auditor%C3%ADa%20de,ma
l%20manejo%20de%20la%20informaci%C3%B3n.
Dar forma a los datos y combinarlos en Power BI Desktop
• https://learn.microsoft.com/es-es/power-bi/connect-data/desktop-shape-and-combine-
data
Orígenes de datos para Power View
• https://support.microsoft.com/es-es/office/power-view-explorar-visualizar-y-presentar-
los-datos-98268d31-97e2-42aa-a52b-
a68cf460472e#:~:text=Or%C3%ADgenes%20de%20datos%20para%20Power%20Vi
ew,-
Excel%202013%20permite&text=Un%20modelo%20de%20datos%20es,el%20invent
ario%20y%20las%20ventas.
Descripción de los objetos de modelo multidimensional de Power View
• https://support.microsoft.com/es-es/office/descripci%C3%B3n-de-los-objetos-de-
modelo-multidimensional-de-power-view-9b236950-3d1e-4be2-a8bc-927ceff3d320
Gráficos y otras visualizaciones en Power View
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-visualizaciones-en-
power-view-141bd462-9853-4973-ac37-842e8345f51e
Procesamiento analítico en línea (OLAP)
• https://learn.microsoft.com/es-es/azure/architecture/data-guide/relational-data/online-
analytical-processing
61
REFERENCIAS DE IMÁGENES
Figura N° 01: Roles de área de trabajo
workspaces
Figura N° 02: Open Source Databases
Figura N° 03: Commercial Databases
Figura N° 04: Data Base Interface
workspaces
Figura N° 05: Modelo Count
cuales-son-sus-
Figura N° 06: Modelo Área
cuales-son-sus-
Figura N° 07: Modelo Meses
cuales-son-sus-
Figura N° 08: Muestra mensual
cuales-son-sus-
Figura N° 09: Redgate
Figura N° 10: IDERA
62
Figura N° 12: IDEA
Figura N° 13: Foglight
Figura N° 14: Configuración de consulta
Figura N° 15: Obtener datos
Figura N° 16: Desde la Web
Figura N° 17: Transformar datos
Figura N° 18: Importar datos
Figura N° 19: Tipo cambiado
Figura N° 20: Personalizar columna
Figura N° 21: Verificación de errores
Figura N° 22: Personalizada agregada
Figura N° 24: Subir
63

Figura N° 26: Error
Figura N° 27: Seleccione error
Figura N° 28: Columna personalizada
Figura N° 30: Sitio Web
Figura N° 29: Pestaña Ver
Figura N° 31: Quitar Fila
Figura N° 32: Objetos Dimensiones
Figura N° 33: Lista de campos
Figura N° 34: Ejemplos de visualización
• https://support.microsoft.com/es-es/office/gr%C3%A1ficos-y-otras-
visualizaciones-en-power-view-141bd462-9853-4973-ac37-842e8345f51e
Figura N° 35: Gráfico circular
Figura N° 36: Gráfico lineal
Figura N° 37: Mapa

Figura N° 38: Tarjeta
64
Figura N° 39: Mosaico
Figura N° 40: OLAP
Figura N° 40: Modelo semántico
Figura N° 41: Características típicas del modelo semántico
Figura N° 42: Funcionalidades Generales
Figura N° 43: Funcionalidades de escalabilidad
65

PIAD-619_MATERIAL

Cargado por

Copyright:

Formatos disponibles

PIAD-619_MATERIAL

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

PIAD-619_MATERIAL

Cargado por

Copyright:

Formatos disponibles

Inteligencia De Negocios Y Dataware

Diseña Data Warehouse y Arquitectura BI

El concepto de data warehouse se originó en 1988 con el trabajo de los investigadores

¿Qué es un Data Warehouse?

Normalmente, un data warehouse se aloja en un servidor corporativo o cada vez más,

Data Warehouse es una arquitectura de almacenamiento de datos que permite a los

Estructuras de un Data Warehouse

Pasado y presente del Data Warehouse

Aquellos primeros datos relacionales estructurados no podían ser mezclados y

En el data warehouse, datos no repetitivos, como los comentarios en una encuesta,

Data Lakes y Data Warehouses: ¿mutuamente exclusivos o partners perfectos?

El data warehouse continúa evolucionando

El procesamiento analítico clásico de datos basado en transacciones se realiza en el

Data Warehouse en la nube

¿Por qué migrar a la nube?

La importancia de la nube para el data warehouse está directamente vinculado a tres

análisis de IoT y el establecimiento de los datos como centro de beneficio. Muchos de

2. Mayor control de costes

3. Co-Localización para una carga más rápida

Principales ventajas de mover el data warehouse a la nube

Data Warehouse vs Big Data vs BI: cuales son las diferencias

volumen de información en varios formatos que contribuyen, de forma estructurada o

Roles en áreas de trabajo de Power BI

Roles de área de trabajo

Figura N° 01: Roles de área de trabajo

1 Los colaboradores pueden actualizar la aplicación asociada al área de trabajo, si el

2 Colaboradores y visores también pueden compartir elementos en un área de trabajo

4 Tenga en cuenta que también necesita permisos en la puerta de enlace. Estos

Arquitectura en Bases de Datos

La abstracción que mencionamos se debe básicamente a la separación de niveles que

Nivel Conceptual: Este nivel oculta detalles de las estructuras físicas de

Tenemos entonces que arquitectura en bases de datos definida en la arquitectura de

Independencia de los datos

Ahora bien la independencia física es la capacidad de modificar el esquema interno sin

Vemos que la arquitectura en bases de datos o arquitectura de 3 niveles trae consigo

Escalabilidad de una base de datos

¿Cómo se garantiza la escalabilidad de una base de datos?

¿La escalabilidad se puede realizar de forma infinita?

Si la planificación no se hace de manera concienzuda y metódica, más pronto que tarde

Diseña Transacciones – Auditorias – Power View

El propósito de monitorear las transacciones es comprender la naturaleza y el propósito

¿Qué es el monitoreo de transacciones?

¿Qué es el Monitoreo de banco de datos y cuáles son sus ventajas?

La solución es el monitoreo de la base de datos, que mantiene información detallada y

Supervisión de SQL Server

Disponibilidad del servicio de SQL Server: un panel de WhatsUp Gold muestra

Monitoreo de WhatsUp Gold y SQL Server

Creando parámetros personalizados

El WhatsUp Gold puede monitorear y encontrar todos los dispositivos de red y

Convertir las alertas en acciones

Finalmente, el registro de cambios de estado de la base de datos rastrea todos los

WhatsUp Gold es un gran producto que monitorea nuestros dispositivos. Sabemos

El monitor de consultas SQL se incluye en las ediciones WhatsUp Gold Premium,

Conexiones a bases de datos

Figura N° 02: Open Source Databases

Figura N° 03: Commercial Databases

Paquetes de R para realizar consultas

Figura N° 04: Data Base Interface

Ejemplo de conexión a SQLlite

En las expresiones dplyr: filter (filtrar condicionalmente), arrange (ordenar), select