01 Material

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 40

Capítulo 2

Extracción y transformación de datos

Al finalizar el capítulo, el alumno podrá:

• Aplicar las técnicas de extracción y transformación de datos con Power BI Desktop.

Temas

1. Introducción del Editor Power Query.


2. Cinta de opciones para extracción y transformación.
3. Agregar datos.
4. Limpiar datos.
5. Ordenar datos.
6. ¿Cómo y por qué definir tipos de datos?
7. Usando condicionales.
8. Tipos de uniones
9. Combinar tablas (Merge Queries).
10. Anexar datos (Append Queries).
11. Columna personalizada.
12. Agrupar conjuntos de datos.
13. Transponer datos.
14. Importar archivos desde una carpeta

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 1


Extracción y transformación de datos

1. Introducción Editor Power Query

Power BI mejora la inteligencia empresarial (BI) con una experiencia intuitiva y coherente para
descubrir, combinar y transformar los datos en una amplia variedad de orígenes como
relacionales, estructurados y semiestructurados, OData, Web, Hadoop y mucho más.

Con Power BI se puede compartir y administrar consultas, así como buscar datos internos de la
organización. Los usuarios de la empresa pueden buscar y usar estas consultas compartidas (si

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 2


Extracción y transformación de datos

se comparte con ellos) para usar los informes y datos de las consultas para el análisis de los datos
subyacentes.

A través del editor de consultas de Power BI Desktop, se puede:

• Buscar y conectar datos en una gran variedad de orígenes.


• Combinar y dar forma a orígenes de datos para que coincidan con los requisitos de análisis
de datos o prepararlos para analizar y modelar.
• Crear vistas personalizadas de datos.
• Usar el analizador JSON para crear visualizaciones de datos en Big Data y HDInsight de Azure.
• Realizar operaciones de limpieza datos.
• Importar datos de varios archivos de registro.
• Crear una consulta de los me gusta de Facebook para representarlo en un gráfico.
• Extraer datos de nuevos orígenes de datos, como XML, Facebook y carpetas de archivos
como conexiones actualizables.
• Con Power BI se puede compartir y administrar consultas así como buscar datos internos de
la organización.

Con Power BI se puede obtener información de los siguientes orígenes de datos:

• Página Web
• Archivo CSV o de Excel
• Archivo XML
• Archivo de texto
• Carpeta
• Base de datos de SQL Server
• Base de datos SQL de Microsoft Azure
• Base de datos de Access
• Base de datos de Oracle
• Base de datos de IBM DB2
• Base de datos MySQL
• Base de datos PostgreSQL
• Base de datos de Sybase
• Base de datos de Teradata
• Lista de SharePoint
• Fuente de OData
• Microsoft Azure Marketplace
• Archivo de Hadoop (HDFS)
• Microsoft Azure HDInsight
• Almacenamiento de tablas de Microsoft Azure
• Active Directory
• Microsoft Exchange
• Facebook

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 3


Extracción y transformación de datos

1.1. Compresión de datos

Los datos con los que se trabaja en la ventana de Power BI Desktop y en Excel se
almacenan en una base de datos analítica dentro del libro de Excel; un eficaz motor local
carga consulta y actualiza los datos de dicha base de datos. Dado que los datos están en
Excel, están inmediatamente disponibles para las tablas dinámicas, los gráficos
dinámicos, Power View y otras características de Excel usadas para agregar datos e
interactuar con ellos. Asimismo, Excel proporciona todas las funciones de presentación
e interactividad con los datos; los datos y los objetos de presentación de Excel se
encuentran en el mismo archivo de libro. Power BI Desktop admite archivos de hasta 2
GB de tamaño y permite trabajar con hasta 4 GB de datos en memoria.

1.2. Diferencia entre Excel y Power BI Desktop

La diferencia básica entre Power BI Desktop y Excel es que se puede crear un modelo de
datos más sofisticado trabajando en la ventana de Power BI Desktop. A continuación, se
comparará algunas tareas.

Tarea En Excel En Power BI Desktop


Modifica los valores de
Editar datos en una
celdas individuales de una No modifica celdas individuales.
tabla
tabla.
Define jerarquías para usar en cualquier
Crear jerarquías
parte de un libro, incluido Power View.
Importar datos de
orígenes diferentes,
como bases de datos
corporativas grandes,
Importa todos los datos de Filtra los datos, cambia las columnas y las
fuentes de
un origen de datos. tablas mientras se importan.
distribución de datos
públicas, hojas de
cálculo y archivos de
texto en el equipo

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 4


Extracción y transformación de datos

Las tablas pueden estar en


cualquier hoja de cálculo Las tablas están organizadas por páginas
Crear tablas del libro. Las hojas de con pestañas individuales en la ventana
cálculo pueden tener más de Power BI Desktop.
de una tabla.

En la vista de diagrama o el cuadro de


Crear relaciones entre En el cuadro de diálogo diálogo Crear relaciones.
tablas Relaciones.
Obtiene información acerca de crear una
relación entre dos tablas.
Escribe fórmulas avanzadas con el
Crear cálculos Usa las fórmulas de Excel. lenguaje de Expresiones de análisis de
datos (DAX).
Crear indicadores clave Crea KPI para usar en informes de tablas
de rendimiento (KPI) dinámicas y Power View.
Crea perspectivas para limitar el número
Crear perspectiva. de columnas y tablas que los usuarios de
un libro observan.
Crea informes de tabla
Crear tablas dinámicas dinámica en Excel. Se selecciona el botón Tabla dinámica en
y gráficos dinámicos la ventana de Power BI Desktop.
Crea un gráfico dinámico.
Realiza mejoras como identificar los
campos predeterminados, las imágenes y
Mejorar un modelo Crea un modelo de datos los valores únicos.
para Power View básico.
Obtiene más información acerca
de mejorar un modelo para Power View.
Usar Visual Basic para No usa VBA en la ventana de Power BI
Usa VBA en Excel.
Aplicaciones (VBA) Desktop.
Agrupa en una tabla Usa DAX en columnas calculadas y
Agrupar datos
dinámica de Excel. campos calculados.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 5


Extracción y transformación de datos

2. Cinta de opciones del Editor de Power Query

Las pestañas del Editor de consultas de la cinta de opciones son el punto de partida de todas las
operaciones que se realizan en Power BI. La cinta de opciones del Editor de consultas consta de cuatro
pestañas: Inicio, Transformar, Agregar columna y Vista.

Control de la cinta de
Descripción
opciones
Aplicar la consulta de datos para importar datos o cargarlos en el modelo
Aplicar y cerrar
de datos.
Descartar y cerrar Descartar la consulta de datos.
Importar datos desde una página web de una extranet o intranet a la que
Desde la Web
tiene acceso.
Importar datos de un archivo:
Excel
CSV
Desde archivo
XML
Texto
Carpeta
Importar datos desde una base de datos:
SQL Server
Microsoft Azure SQL
Access
Oracle
Desde base de datos
IBM DB2
MySQL
PostgreSQL
Sybase
Teradata

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 6


Extracción y transformación de datos

Importar datos desde otro origen:


Lista de SharePoint
Fuente de OData
Microsoft Azure Marketplace
Archivo de Hadoop (HDFS)
Microsoft Azure HDInsight
Desde otros orígenes
Almacenamiento de blobs de Microsoft Azure
Microsoft Azure Almacenamiento de tablas
Active Directory
Microsoft Exchange
Facebook
Consulta en blanco
Crear una nueva consulta vinculada a la tabla de Excel seleccionada. Si el
Desde tabla rango seleccionado no pertenece a una tabla, se convertirá en una.
Quitar errores Quitar las filas de una consulta con errores de datos.
Quitar todas las filas de la tabla en las que los valores de las columnas
Quitar duplicados seleccionadas están duplicados, respecto de valores anteriores. No se
quitará la fila con la primera repetición de un conjunto de valores.

Mantener filas superiores Mantener n filas superiores.

Especificar el rango de filas que se debe conservar en la tabla. Este rango


Mantener rango comienza en primera fila y se extiende de acuerdo con el valor
de número de filas.
Una columna de texto se puede dividir en varias columnas de dos
formas:
División de columna
Por delimitador.
Por número de caracteres.
Resume los datos por valores de fila. Por ejemplo, si una tabla contiene
las columnas Estado, Ciudad y Población, el usuario puede:
Agrupar por Agrupar por Estado y contar el número de ciudades de cada estado, o
sumar la población de las ciudades para obtener la población de cada
estado.

Reemplazar un valor por otro en las columnas seleccionadas. Para


Reemplazar valores
reemplazar los valores de Número y de Fecha y hora.

En el caso de un valor de Texto, cambiar la forma en la que se


representan los valores de la columna:
Minúsculas
MAYÚSCULAS
Mayúscula Inicial En Cada Palabra
Recortar
Limpiar
Transformar
JSON
XML
En el caso de un valor de Fecha y hora, cambia la forma en que se
representan las columnas:
Fecha
Hora
Día

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 7


Extracción y transformación de datos

Mes
Año
Día de la semana
Usar primera fila como Los nombres de los encabezados de la tabla se reemplazan por los
encabezados valores de las celdas de la primera fila de la tabla.
Es para ver el código que el Editor de consultas está creando con cada
Editor avanzado paso, o si desea crear su propio código de forma.
Definir el nombre de la consulta.
Propiedades
Especificar el tipo de datos de cada campo de la tabla : Entero, Decimal,
Tipo de datos Texto, Fecha.

Insertar columna de índice Crear una nueva columna de índice empezando desde cero.

Crear un duplicado de la columna seleccionada en el lado derecho de la


Duplicar columna tabla. Se asignará a la nueva columna el nombre de Copia de <nombre
de columna>.
Combinar Combinar la consulta actual con otra consulta del libro actual.
Anexar Anexar la consulta actual a otra consulta del libro actual.
Insertar columna Insertar una nueva columna personalizada después de la última columna
personalizada de la tabla. Se debe definir la fórmula que calcula los nuevos valores.
Insertar columna de índice Crear una nueva columna de índice empezando desde cero.

2.1. Pestaña de Inicio

La pestaña Inicio contiene las tareas de consulta más comunes, incluyendo el primer paso en
cualquier consulta, que es Obtener datos. La siguiente imagen muestra la cinta de opciones Inicio.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 8


Extracción y transformación de datos

2.2. Pestaña Transformar

La pestaña Transformar proporciona acceso a tareas comunes de transformación de datos, como


agregar o quitar columnas, cambiar tipos de datos, dividir columnas y otras tareas orientadas a
datos. La siguiente imagen muestra la pestaña Transformar.

2.3. Pestaña Agregar columna

La pestaña Agregar columna proporciona tareas adicionales relacionadas con agregar una
columna, aplicar formato a los datos de una columna y agregar columnas personalizadas. La
siguiente imagen muestra la pestaña Agregar columna.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 9


Extracción y transformación de datos

2.4. Pestaña Vista

La pestaña Vista de la cinta de opciones se usa para alternar si se muestran determinados paneles
o ventanas. También sirve para mostrar el Editor avanzado. La siguiente imagen muestra la
pestaña Vista.

2.5. Pestaña Herramientas

La pestaña Herramientas de la cinta de opciones se usa para aplicar diagnóstico de cada paso
efectuado en las consultas.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 10


Extracción y transformación de datos

3. Agregar Datos

Con Power BI, se puede importar datos desde una amplia variedad de orígenes de datos. Usar el
Editor de consultas para modificar los pasos de consulta a la forma o transformar datos.

Para cada proveedor, Power BI es compatible con una versión específica del proveedor y objetos.

Versión
Objetos de
Origen de Versión mínima del mínima del
Proveedor origen de datos
datos proveedor origen de
compatibles
datos

Tablas o vistas
SQL
SQL Server ADO.NET (integrado en .Net .Net Framework 3.5
Server 2005 y Funciones
Framework) (solo)
posteriores escalares
Funciones de
tabla

Motor de base de datos de Sin


Access ACE 2010 SP1 Tablas o vistas
Microsoft Access (ACE) restricciones

Excel (solo Motor de base de datos de Sin Tablas


ACE 2010 SP1
archivos .xls) Microsoft Access (ACE) restricciones
Hojas
ODAC 11.2 Versión 5 9.x y
Oracle 2 ODP.NET Tablas o vistas
(11.2.0.3.20) posteriores

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 11


Extracción y transformación de datos

System.Data.OracleClient
9.x y
(integrado en .Net .NET Framework 3.5 Tablas o vistas
posteriores
Framework)

Cliente ADO.NET de IBM


(parte del paquete de 9.1 y
IBM DB2 10.1 Tablas o vistas
controladores de servidor de posteriores
datos de IBM)

Tablas o vistas
MySQL Conector o red 6.6.5 5.1 Funciones
escalares
Proveedor de ADO.NET de
PostgreSQL 2.0.12 7.4 Tablas o vistas
NPGSQL
Proveedor de datos .NET 12 y
Teradata 14 y posteriores Tablas o vistas
para Teradata posteriores
Ianywhere.Data.SQLAnywhe 16 y
Sybase IQ 16 y posteriores Tablas o vistas
re para .NET 3.5 posteriores

Siempre que se agregue un paso de consulta de Power BI, se debe insertar en la secuencia del
procedimiento que continua, el paso seleccionado. Si éste se añade en cualquier lugar distinto
al final del flujo, se debe comprobar que todos los pasos posteriores funcionan correctamente.

La imagen siguiente muestra el Editor de consultas con el panel de pasos aplicados en el lado
derecho de la ventana.

3.1. Conectarse desde la Web

Con Power BI, se puede obtener acceso y descubrir datos en una página Web que se puede
combinar con datos dentro de su organización.

1. En la ficha de cinta POWER BI, hacer clic en Desde Web.


2. En el cuadro de diálogo Desde la Web, escribir la dirección URL de una página Web.
3. Hacer clic en Aceptar.
4. Si la página Web requiere credenciales de usuario:
En la Web Access cuadro de diálogo, hacer clic en una opción de credenciales y escribir
los valores de autenticación.
5. Seleccionar Guardar.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 12


Extracción y transformación de datos

Una vez establecida una conexión con la página web, en el panel de navegación se verá
una lista de las tablas disponibles en esta página de Wikipedia. Se puede pasar el mouse
sobre cada una de estas tablas para obtener una vista previa de los datos. Para cada tabla,
se puede aplicar progresivamente actividades de consulta, como ordenar y filtrar, para dar
forma a los datos. Para obtener más información sobre cómo dar forma a los datos,
consultar Dar forma a los datos.

En el panel de navegación, hacer doble clic en la tabla Resultados[editar] para obtener los
resultados de Resumen del torneo, o seleccionar la tabla Resultados[editar] y hacer clic
en Editar consulta.

Después de abrir el Editor de consultas, se puede comenzar a dar forma a la consulta.

3.2. Conectarse desde un archivo CSV o de Excel

1. En la pestaña POWER BI de la ficha de cinta, hacer clic en Desde archivo > Desde Excel
o en Desde archivo > Desde CSV.
2. En el cuadro de diálogo Examinar Excel o Examinar valores separados por comas, buscar
o escribir una ruta de acceso al archivo que se desea consultar.
3. Hacer clic en Abrir.

Si el libro de origen tiene rangos con nombre, el nombre del rango estará disponible como
un conjunto de datos.

Si se intenta importar datos de un archivo de Excel o una base de datos de Access heredados
en algunas configuraciones, recibirá un error que el Motor de base de datos de Microsoft
Access (proveedor Microsoft.ACE.OLEDB.12.0) no está registrado en la máquina local. Este

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 13


Extracción y transformación de datos

error se produce en los sistemas que solo tienen instalado Office 2013. Para resolverlo, se
debe descargar los recursos siguientes para asegurarse de continuar con los orígenes de
datos a los que se intenta acceder.

3.3. Conectarse desde un archivo XML

1. En la pestaña POWER BI de la cinta de opciones, hacer clic en Desde archivo > Desde
XML.
2. En el cuadro de diálogo Examinar desde XML, buscar o escribir una URL de archivo para
importar un archivo o vincularlo a este.
3. Hacer clic en Abrir.

Cuando la conexión se complete correctamente, se podrá examinar las colecciones de


elementos del archivo XML y obtener una vista previa de ellas en el panel Navegador en un
formato tabular.

3.4. Conectarse desde un archivo de texto

1. En la ficha de cinta Power BI, hacer clic en Desde archivo > Desde texto.
2. En el cuadro de diálogo Examinar, buscar o escribir una ruta de acceso de archivo para
importar un archivo o vincularlo a este.

Cuando la conexión se complete correctamente, se podrá obtener una vista previa de las
líneas de texto del archivo.

Si se va a importar datos desde un archivo CSV, Power BI detectará automáticamente


delimitadores de columna incluidos, los nombres de columna y tipos de datos.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 14


Extracción y transformación de datos

3.5. Conectarse desde una carpeta

1. En la pestaña POWER BI de la cinta de opciones, hacer clic en Desde archivo > Desde
carpeta.
2. En el cuadro de diálogo Carpeta, buscar o escribir una ruta de acceso de archivo para
importar un archivo o vincularlo a este.
3. Hacer clic en Aceptar.

Se puede usar el Editor de consultas para escribir fórmulas de Power BI.

3.6. Conectarse desde una base de datos de SQL Server

1. En la pestaña POWER BI de la cinta de opciones, hacer clic en Desde base de datos >
Desde base de datos de SQL Server.
2. En el cuadro de diálogo Base de datos de Microsoft SQL, especificar el servidor SQL
Server al que se quiere conectar en el cuadro Nombre del servidor. Si se desea,
también se puede especificar un nombre de base de datos.
3. Si se desea importar datos con una consulta de base de datos nativa, especificar la
consulta en el cuadro Instrucción SQL. Para más información, consultar Importar
datos de una base de datos con una consulta de base de datos nativa.
4. Seleccionar Aceptar.
5. Elegir el modo de autenticación para conectarse a la base de datos de SQL Server.
a. Windows: esta es la selección predeterminada. Se elige esta opción si se desea
conectar con la autenticación de Windows.
b. Base de datos: se elige esta opción si se quiere conectar con la autenticación de
SQL Server. Si se escoge esta opción, se deberá especificar un nombre de usuario
y una contraseña para conectarse a la instancia de SQL Server.

6. De forma predeterminada, la casilla Cifrar conexión está activada para indicar que
Power BI se conecta a la base de datos mediante una conexión cifrada. Si no se desea
conectar usando una conexión cifrada, desactivar esta casilla de verificación y, a
continuación, hacer clic en Conectar.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 15


Extracción y transformación de datos

Si no se usa una conexión cifrada con SQL Server, Power BI solicitará establecer una
conexión no cifrada. Hacer clic en Aceptar en el mensaje para conectarse con una
conexión no cifrada.

3.7. Conectarse a una base de datos de Access

Nota: antes de que se puede usar Power BI para conectarse a una base de datos de Access, se
necesita el Redistribuible de 2010 de motor de base de datos Microsoft Access en el equipo.

1. En la ficha de cinta POWER BI, seleccionar Desde base de datos > Desde base de
datos Access.
2. En el cuadro de diálogo Base de datos de Microsoft Access, buscar o escribir una URL
de archivo para importar un archivo o vincular a él.
3. Hacer clic en Aplicar.

Si se intenta importar datos de un archivo de Excel o una base de datos de Access


heredados en algunas configuraciones, recibirá un error que el Motor de base de datos de
Microsoft Access (proveedor Microsoft.ACE.OLEDB.12.0) no está registrado en la máquina
local. Este error se produce en los sistemas que solo tienen instalado Office 2013. Para
resolverlo, se debe descargar los recursos siguientes para asegurarse de continuar con los
orígenes de datos a los que se intenta acceder.

3.8. Conectarse a una base de datos de Oracle

Antes de poder conectarse a una base de datos de Oracle con Power BI, se necesita v8.1.7
de software de cliente de Oracle o superior en el equipo. Para instalar el software de
cliente de Oracle, ubicar Componentes de Access datos (ODAC) con Oracle Developer
Tools para Visual Studio (12.1.0.2.4) de Oracle de 32 bits para instalar al cliente de Oracle
de 32 bits o 64 bits ODAC de 12 c Xcopy versión 4 (12.1.0.2.4) para Windows x64 para
instalar al cliente de Oracle de 64 bits.

En la pestaña POWER BI de la cinta de opciones, hacer clic en Desde base de datos >
Desde base de datos de Oracle.

En el cuadro de diálogo Base de datos de Oracle, en nombre del servidor, especificar el


servidor de Oracle al que quiere conectarse. Si se requiere un SID, se puede especificar
como NombreServidor/SID.

Si se quiere importar datos con una consulta de base de datos nativa, especificar la
consulta en el cuadro Instrucción SQL. Para más información, consultar Importar datos de
una base de datos con una consulta de base de datos nativa.
Hacer clic en Aceptar.

Si el servidor de Oracle requiere credenciales de usuario de la base de datos:

• En el cuadro de diálogo Acceder a una base de datos, escribir el nombre de usuario


y la contraseña.
• Hacer clic en Conectar.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 16


Extracción y transformación de datos

3.9. Conectarse a una base de datos MySQL

Antes de poder conectarse a una base de datos MySQL, se necesita la MySQL conector o
red 6.6.5 de Microsoft Windows en el equipo. Seleccionar el controlador que coincida con
la instalación de Power BI (32 bits o 64 bits).

1. En la pestaña POWER BI de la cinta de opciones, hacer clic en Desde base de datos >
Desde base de datos MySQL.
2. En el cuadro de diálogo Base de datos MySQL, en nombre del servidor, especificar el
servidor de bases de datos MySQL al que se desea conectar.
3. Si se quiere importar datos con una consulta de base de datos nativa, especificar la
consulta en el cuadro Instrucción SQL. Para más información, consultar Importar
datos de una base de datos con una consulta de base de datos nativa.
4. Hacer clic en Aceptar.
5. Si el servidor MySQL requiere credenciales de usuario de la base de datos:
a. En el cuadro de diálogo Acceder a una base de datos, escribir el nombre de
usuario y la contraseña.
b. Hacer clic en Conectar.

3.10. Conectarse a una base de datos PostgreSQL (Power BI)

Antes de poder conectarse a una base de datos PostgreSQL en Power BI, se necesita el
proveedor de datos de Ngpsql para PostgreSQL instalado en el equipo. Seleccionar el
controlador que coincida con la instalación de Power BI (32 bits o 64 bits). Además, se
debe asegurar que el proveedor registrado en la configuración del equipo coincida con la
versión más reciente de .NET en el dispositivo.

1. En la ficha de cinta POWER BI, seleccionar Desde base de datos > Desde base de datos
PostgreSQL.
2. En el cuadro de diálogo Base de datos PostgreSQL, en nombre del servidor, especificar
el servidor de base de datos PostgreSQL al que se desea conectar.
3. Si se quiere importar datos con una consulta de base de datos nativa, especificar la
consulta en el cuadro Instrucción SQL. Para más información, consultar Importar
datos de una base de datos con una consulta de base de datos nativa.
4. Seleccionar Aceptar.
5. Si el servidor PostgreSQL requiere credenciales de usuario de la base de datos:
a. En el cuadro de diálogo Acceder a una base de datos, escribir el nombre de
usuario y la contraseña.
b. Seleccionar Conectar.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 17


Extracción y transformación de datos

4. Limpiar datos

Power BI incluye un eficaz nuevo conjunto de características denominadas obtener y


transformar, que proporcionan la recopilación rápida y fácil de datos, así como capacidades de
forma. Además, obtener y transformar permite conectarse, combinar y refinar los orígenes de
datos para satisfacer sus necesidades de análisis.

Obtener y transformar, puede crear consultas que son simples o complejas, como sea necesario.
Cuando se agreguen los pasos a una consulta, el editor de consultas funciona en segundo plano
para crear un conjunto de instrucciones discretas que llevan a cabo sus comandos; cabe
mencionar que, las instrucciones se crean utilizado el lenguaje M. Los usuarios disfrutarán de la
eficacia y flexibilidad de secuencias de comandos de datos que pueden crear el lenguaje M, para
realizar manualmente (o ajustar) consultas con el editor avanzado. Esto ofrece poder y
flexibilidad, tanto si se crea pasos de forma automática o manualmente. El editor de consultas y
el editor avanzado se describen con más detalle más adelante.

Obtener y transformar permite transformar los datos de los datos de orígenes de maneras que
le ayudarán a analizar. Transformación de datos significa modificar de alguna manera con la
finalidad de satisfacer sus necesidades, por ejemplo, para quitar una columna, cambiar un tipo
de datos o combinar tablas, cada una de las cuales es una transformación de datos. Como para
transformar datos, colectivamente adopta la forma que necesita aún más el análisis. El proceso
de aplicar transformaciones a uno o varios conjuntos de datos a menudo se denomina modelado
de datos.

Power BI utiliza una ventana dedicada, denominada Editor de consultas para facilitar y mostrar
las transformaciones de datos. Cuando se seleccione Nueva consulta en la sección de la cinta de

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 18


Extracción y transformación de datos

opciones obtener y transformar de la ficha datos, luego se seleccione el origen de datos (por
ejemplo, un libro o una base de datos), aparecerá la ventana de navegador para seleccionar la
tabla (o tablas) que se desea usar en la consulta. Cuando se selecciona una tabla, se muestra una
vista previa de sus datos en el panel derecho de la ventana de navegador.

4.1. Dividir una columna por delimitador

Al utilizar el Editor de consultas, una columna de texto puede dividirse en varias columnas
de dos formas: por delimitador o un número de caracteres.

Por delimitador, analiza un valor de texto en función de un carácter comunes de dos o más
columnas. Por ejemplo, una columna de nombre como apellido, nombre se puede dividir
en dos columnas basadas en el carácter de coma (,).

Usando la cinta del Editor de consultas:

1. Seleccionar la columna que se desea dividir.


2. En la cinta de opciones del Editor de consultas, seleccionar División de columna > Por
delimitador.

Usando el menú contextual del editor de consultas:

1. Hacer clic con el botón secundario en el encabezado de la columna que se desea


dividir.
2. En el menú contextual de columna, seleccionar División de columna>Por delimitador.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 19


Extracción y transformación de datos

4.2. Dividir una columna por posición

Por número de caracteres, analiza un valor de texto en función de una posición dentro
de dicho valor.

Usando la cinta de opciones Editor de consultas:

1. Seleccionar la columna que desea dividir.


2. En la cinta de opciones Editor de consultas, hacer clic en División de columna > Por
número de caracteres.

Usando el menú contextual del Editor de consultas:

1. Hacer clic, con el botón secundario, en el encabezado de la columna que desea


dividir.
2. En el menú contextual de columna, seleccionar División de columna > Por número
de caracteres.

4.3. Reemplazar valores

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 20


Extracción y transformación de datos

Power BI permite reemplazar un valor por otro, en una columna seleccionada. Se puede:

a. Reemplazar valores de Texto.


b. Reemplazar valores de Número y Fecha y hora. Reemplazar valores lógicos.

Para reemplazar valores de Texto:

1. En la cinta de opciones del Editor de consultas, en la pestaña Transformar, seleccionar


Reemplazar valores.
2. Usar el menú contextual de Editor de consultas, hacer clic con el botón secundario en
una celda de texto. A continuación, seleccionar en Reemplazar valores.

Para reemplazar valores de número y fecha y hora. Reemplazar valores lógicos

1. En en la cinta de opciones Editor de consultas, en la pestaña Transformar, seleccionar


Reemplazar valores.
2. Usar el menú contextual de Editor de consultas, hacer clic con el botón secundario en
una celda de Número o Fecha y hora. A continuación, seleccionar en Reemplazar
valores.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 21


Extracción y transformación de datos

5. Ordenar datos

Al ordenar en función de varias columnas, el orden o la jerarquía se basa en la secuencia en que


se seleccionan las columnas. Para organizar una tabla en función de varias columnas:

En el Editor de consultas, seleccionar la columna principal para la ordenación.

1. Hacer clic en la flecha abajo (flecha abajo).


2. En el menú desplegable, hacer clic en Orden ascendente o en Orden descendente.
3. Repetir los pasos de 1 a 3 para cada una de las columnas que se desee usar en la ordenación.

Por ejemplo, si se ordena en primer lugar por Estado y a continuación por Población, el resultado
final es una tabla que se ordena por estado, con las ciudades de cada estado ordenadas por
población. Alfabéticamente, Arizona precede a California. Y, en Phoenix (Arizona) la población es
mayor que en Tucson. La fórmula muestra cada columna según la prioridad y el tipo de
ordenación que se le aplica.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 22


Extracción y transformación de datos

6. ¿Como y por que definir tipos de datos?

Cuando se cargan datos en Power BI, se intentará convertir el tipo de datos de la columna de
origen en un tipo de datos que admita mejor una visualización de datos, unos cálculos y un
almacenamiento más eficiente. Por ejemplo, si una columna de valores que importa desde Excel
no tiene ningún valor fraccionario, Power BI convertirá toda la columna de datos en un tipo de
datos de número entero, pues de este tipo es más adecuado para almacenar.

Esto es importante porque algunas funciones tienen requisitos de tipo de datos. Aunque en
muchos casos Power BI convertirá implícitamente un tipo de datos, hay algunos casos donde no
se puede. Por ejemplo, si una transformación requiere un tipo de datos de fecha y el tipo de
datos para la columna es de texto, la transformación no funcionará correctamente. Por lo tanto,
es importante y útil obtener el tipo de datos correcto para una columna.

En Power BI se puede determinar y especificar un tipo de datos de una columna en el Editor de


consultas en la vista de datos o la vista de informes.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 23


Extracción y transformación de datos

6.1. Tipos de número

Power BI admite tres tipos de números.

Números decimales: representa un número de punto flotante de 64 bits (8 bytes). Es el


tipo de número más común y se corresponde con los números de la forma en la que suele
pensar en ellos.

Número decimal fijo: tiene una ubicación fija para el separador decimal. El separador
decimal siempre tiene cuatro dígitos a la derecha y permite 19 dígitos de importancia. El
valor más grande que puede representar es 922.337.203.685.477,5807 (positivo o
negativo).

Número entero: representa un valor entero de 64 bits (8 bytes). Puesto que es un entero,
no tiene dígitos a la derecha del separador decimal. Permite 19 dígitos; números enteros
positivos o negativos entre -9.223.372.036.854.775.808 (-2^63) y
9.223.372.036.854.775.807 (2^63-1).

6.2. Tipos de fecha y hora

Power BI admite cinco tipos de datos de fecha y hora en la vista de consultas y tres en el
modelo y en la vista de informes. Tanto la duración como fecha/hora/zona horaria se
convierten durante la carga en el modelo.

Fecha y hora: representa el valor de fecha y hora. Interiormente, el valor de fecha y hora
se almacena como un tipo de número decimal. Por lo que realmente se puede realizar la
conversión de los dos.

Fecha: representa solo una fecha (ninguna parte de la hora). Cuando se convierte en el
modelo, una fecha es igual que un valor de fecha y hora con cero para el valor de
fracciones.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 24


Extracción y transformación de datos

Hora: representa precisamente la hora (ninguna parte de la hora). Cuando se convierte en


el modelo, el valor de hora es el mismo que el valor de fecha y hora sin dígitos a la izquierda
de la posición decimal.

Duración: representa un período. Se convierte en el tipo de número decimal cuando se


carga en el modelo. Como un tipo de número decimal, puede agregarse o quitarse del
campo de fecha y hora con resultados correctos. Como un tipo de número decimal, puede
usarlo fácilmente en las visualizaciones que muestran la magnitud.

6.3. Tipo de texto

Texto: cadena de datos de caracteres Unicode. Pueden ser cadenas, números o fechas
representadas en un formato de texto. La longitud de cadena máxima es de 268.435.456
caracteres Unicode (256 caracteres mega) o 536.870.912 bytes.

Verdadero/Falso: un valor booleano de Verdadero o Falso.

En blanco: es un tipo de datos en DAX que representa y reemplaza a los valores NULL de
SQL. Además, puede crear un espacio en blanco con la función BLANK y probarlos con la
función lógica ISBLANK.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 25


Extracción y transformación de datos

7. Usando condicionales

Con Power Query se puede agregar una columna condicional a la consulta, y se puede definir
condiciones IF-THEN-ELSE. Si se cumplen las condiciones, la columna condicional mostrará
automáticamente los valores que ha especificado.

Uno de los temas más frecuentes en las consultas es el de la función IF. Es decir, todo tipo de
ejercicios sobre como calcular un resultado bajo una serie de condiciones (por ejemplo, compras
de hasta los 1000 pesos reciben un descuento del 5%; si superan los 5000, un descuento del
10%; compras de más de 10000, 7%, etc.).

Estos ejercicios son muy populares en todo tipo de cursos Excel, inclusive en el sector académico.
En lugar de complicarse la vida generando una fórmula complicada, se debe recordar que Excel
acepta hasta 64 niveles de SI en una fórmula.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 26


Extracción y transformación de datos

8. Tipos de Combinaciones

Power BI permite combinar varias consultas mediante las operaciones Combinar y Anexar. Por tanto,
existen dos maneras de unir tablas, una seguida de la otra (Combinar) y la otra una debajo de la otra
(Anexar).

8.1. Tipo union combinar

El primer metodo es cuando tienes una tabla (1) y luego tienes otra tabla (2) y vemos como se unen
una a lado de la otra, a este procedimiento se le conoce como Merge Queries (Combinar)

La identificacion de este metodo es cuando la información de la segunda tabla complementa las


filas de la primera.

El metodo requiere que ambas tablas cuenten con un ID (llave). Este es el identificador para
relacionar las filas.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 27


Extracción y transformación de datos

Entonces para no equivocarnos en el uso de este metodo, cuando necesite unir filas y columnas de
unas tablas o consultas utilice Mezclar (Merge) o Combinar (Merge) filas.

El boton en Power Query esta en la pestaña Inicio opcion Combinar (Merge), a este procedimiento
se le conoce como Merge Queries (Combinar tablas)

8.2. Tipo union anexar

El segundo metodo es cuando tienes una tabla (1) y luego tienes otra tabla (2) y vemos como se
unen una debajo de la otra, a este procedimiento se le conoce como Append Queries (Anexar
consultas)

La identificacion de este metodo es cuando la segunda (2) tabla tiene las mismas columnas que la
primera (1) y contiene filas adicionales que no tiene la primera.

El metodo requiere que ambas tablas cuenten con la misma estructura, es decir las dos tablas
deben tener las mismas columnas y el nombre de las columnas es el identificador para hacer la
relacion.

Entonces para no equivocarnos en el uso de este metodo, cuando se necesite unir filas de una o
mas tablas o consultas utilice Agregar (Append) o Anexar (Append) filas.

El boton en Power Query esta en la pestaña Inicio opcion Combinar (Merge), a este procedimiento
se le conoce como Merge Queries (Combinar tablas)

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 28


Extracción y transformación de datos

9. Combinar tablas (Merge Queries)

La operación Combinar se lleva a cabo en cualquier consulta de Power BI con formato tabular,
independientemente del origen de los datos.

Power BI ofrece una interfaz de usuario intuitiva para combinar varias consultas. La operación
de Combinar se realiza en las consultas de Power BI (Editor Power Query) con una forma tabular
que es independiente del origen de datos que proceden los datos; es decir, que puede combinar
archivos Excel con archivos planos o tablas de base de datos, entre otros.

Existen varios tipos de combinaciones, pero en este caso nos centraremos en la combinación
Interna que es la más usada para mantener la integridad entre los datos.

Tipo
Resultado Combinaciones
combinación

Se devolverá todos los registros


Interna que coinciden entre las tablas A y
B

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 29


Extracción y transformación de datos

10. Anexar datos (Append Queries)

En Power BI, la operación de Anexar crea una nueva consulta que contiene todas las filas de la
primera consulta y todas las filas de la segunda consulta. Las operaciones de Anexar requieren
al menos dos consultas. Estas consultas también pueden basarse en diferentes fuentes de datos
externas

Cuando el editor de consultas Power Query usa esta funcion, el proceso es parecido al
procedimiento de transact SQL UNION ALL. Esto quiere decir que el editor de consultas de Power
Query intentará encontrar columnas equivalentes en todas las tablas a anexar y apilará los datos
de forma adecuada. Si una tabla tiene columnas que la otra no, entonces llenará los espacios
vacíos con valores nulo

Se pueden realizar dos tipos de operación de anexo: Anexo intermedio o Anexo en línea. Con el
Anexo intermedio, se crea una consulta nueva para cada operación de anexo. Con el Anexo en
línea, se anexan datos a la consulta existente hasta llegar a un resultado final. El resultado es un
paso nuevo al final de la consulta actual.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 30


Extracción y transformación de datos

10.1. Anexo en línea

En el Editor de consultas, en la cuadrícula de vista previa de consulta, hacer clic en el


ícono de tabla y seleccionar en Anexar consultas.

10.2. Anexo intermedio

En la cinta de opciones de POWER BI o Editor de consultas, en el grupo Combinar, hacer


clic en Anexar. Cuando se usa la cinta de opciones del Editor de consultas, la consulta
activa se selecciona como la tabla principal para la operación Anexar.

En el cuadro de diálogo Anexar, seleccionar las tablas (consultas) primera y segunda que
se desea anexar.

Cuando se completa la operación Anexar, Power BI muestra una nueva consulta en el


Editor de consultas.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 31


Extracción y transformación de datos

11. Agrupar conjuntos de datos

En Power Query, puede agrupar los valores de varias filas en un solo valor agrupando las filas
según los valores de una o varias columnas.

Esta transformacion intenta hacer dos tipos de operaciones de agrupacion.:

• Agrupaciones de columnas.
• Agrupaciones de filas.

Para obtener el botón de Agrupar por otenerlo de la cinta de opciones pestaña Inicio o en la
pestaña Transformar. Tambien puede hacer clic sobre la columna y selecionar Agrupar por,

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 32


Extracción y transformación de datos

11.1. Resumir sus datos

Se obtendrá la tabla resumida solo por las columnas que se seleccione. Esto es
importante si se está tratando de deshacer los duplicados o verificar dónde se tienen
duplicados.

11.2. Proporcionar agregaciones o datos no agregados

Esta transformacion permite generar nuevas columnas que proporcionarán


agregaciones como suma, máximo, mínimo, promedio de una columna y, en algunos
casos, otras columnas que no harán ninguna agregación y solo mostrarán filas agrupadas
como tabla.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 33


Extracción y transformación de datos

11.3. Operaciones disponibles

Con la característica Agrupar por, las operaciones disponibles se pueden clasificar de


dos maneras:

• Operación de nivel de fila


• Operación de nivel de columna

En la tabla siguiente se describe cada una de estas operaciones.

Nombre de la operación Categoría Descripción


Sum Operación de columna Suma todos los valores de una columna de números
Average Operación de columna Calcula el valor medio de una columna de números.
Valor medio Operación de columna Calcula la mediana a partir de una columna de números.
Mín. Operación de columna Calcula el valor mínimo de una columna de números.
Máx. Operación de columna Calcula el valor máximo a partir de una columna de números.
Recuento de valores Operación de columna Calcula el número de valores distintos de una columna.
distintos
Contar filas Operación de fila Calcula el número total de filas de un grupo determinado.
Recuento de filas distintas Operación de fila Calcula el número de filas distintas de un grupo determinado.
Todas las filas Operación de fila Genera todas las filas agrupadas en un valor de tabla sin
agregaciones

Es recomendable usar la funcionalidad Group By (Agrupar por) cuando necesite hacer


agrupaciones de filas en una tabla en función de los valores que tengan en sus campos.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 34


Extracción y transformación de datos

12. Columna personalizada

Una columna personalizada es aquella en la que el valor de una celda se calcula con una fórmula.

Cuando se crea una fórmula de columna, el editor de consultas valida su sintaxis. Este tipo de
validación es coherente con la manera en que el cuadro de diálogo Edición avanzada de
consultas valida las fórmulas que proporciona el usuario.

Ejemplo de fórmulas usadas en las consultas:

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 35


Extracción y transformación de datos

13. Transponer datos

La operación de transponer tabla Power Query rota la tabla 90 grados, convirtiendo las filas en
columnas y las columnas en filas.

13.1. Anular la dinamización de columnas

Se utiliza el Editor de consultas de Power BI para trasponer columnas. Cabe mencionar


que en Power BI a esta operación también se le conoce como Dinamización.

Existen tres formas de dinamizar las columnas:

Este procedimiento debera seleccionar las columnas que desea dinamizar. Puede
seleccionar Ctrl mientras selecciona tantas columnas como requiera.

En este ejemplo seleccionar todas las columnas excepto la denominada País. Después
de seleccionar las columnas, haga clic con el botón derecho en cualquiera de las
columnas seleccionadas y, a continuación, seleccione Anular la dinamizacion de las
columnas

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 36


Extracción y transformación de datos

13.2. Columna Dinámica

En Power BI, se puede transformar las columnas seleccionadas en pares de atributo-


valor donde las columnas se vuelven filas.

De forma predeterminada, Power Query intentará realizar una suma como agregación,
pero puede seleccionar la opción Avanzadas para ver otras agregaciones disponibles.

Dinamización de columnas crea una columna de atributo para cada encabezado de


columna seleccionada y una columna de valor para cada valor de celda de la columna
seleccionada. Las columnas de par atributo-valor se insertan después de la última
columna.

En el ejemplo, cada columna de Fecha se convierte en una fila con una columna de
atributo que contiene el valor de fecha y una columna de valor que contiene el valor de
la columna de fecha.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 37


Extracción y transformación de datos

14. Importar archivos desde una carpeta

El Editor de consultas de Power BI desktop puede manejar todos los tipos de archivos deseados
al mismo tiempo o filtrar los pasos para manejar solo un determinado tipo de archivo.

Entonces, Power Query se aplica de forma más sencilla consolidadando múltiples tablas, hojas
desde archivos Excel, archivos de texto y/o csv.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 38


Extracción y transformación de datos

14.1. Como se suele resolver este escenario

Anteriormente (antes Power Query), existía algunas formas de hacerlo pero no eran tan
fáciles de usar y se dependía en gran medida de codificación o de alguna manera tediosa
de hacerlo. Las formas más comunes fueron:

• Utilizando sentencias SQL para unir múltiples archivos.


• Crear un código VBA que realice el trabajo.
• Ir con la forma tediosa de combinar los archivos manualmente (tal vez con Excel
o con Access).

14.2. Consolidando / Combinando múltiples archivos con Power Query

El público objetivo que Power Query tiene es mucho más amplio que el de modelado de
datos. Principalmente, porque Power Query se centra en la limpieza, enriquecimiento y la
preparación de sus datos, lo cual es algo que la mayoría de los usuarios de Excel hacen a
diario – y debido a su facilidad de uso.

Por tanto, se tiene una manera más fácil y optimizada de realizar esta solicitud que cada
vez es más frecuente en los entornos de análisis de datos.

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 39


Extracción y transformación de datos

BIBLIOGRAFIA

• Power BI Desktop
Interfaz Power Query usuario. Consulta: 28 de enero de 2022

https://docs.microsoft.com/es-es/power-query/power-query-ui

• Agregando fila con Power BI

https://www.thepoweruser.com/es/2019/07/30/agrupar-filas-con-power-bi-power-query/

• Anexar consultas

https://support.microsoft.com/es-es/office/anexar-consultas-power-query-e42ca582-4f62-4a43-
b37f-99e2b2a4813a

IES Cibertec S.A.C - Data Analytics Power BI – Nivel Básico 40

También podría gustarte