Herramientas para La Integracion

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 29

SEMANA No 3-4

Practica extracción datos con


power query
PRACTICA ETL CON POWER QUERY
Que es Power Qwery

Power Query (conocido como Obtener &


transformar en Excel), puede importar datos
externos o conectarse a ellos y darles forma,
por ejemplo, quitar una columna, cambiar un
tipo de datos o combinar tablas de maneras
que satisfagan sus necesidades. Después,
puede cargar la consulta en Excel para crear
gráficos e informes. Periódicamente, puede
actualizar los datos para que se
actualicen. Power Query está disponible en
tres aplicaciones de Excel, Excel para
Windows, Excel para Mac y Excel para la
Web.
¿Para qué sirve Power Query?

Power Query sirve para buscar y organizar datos dispersos, realizar conexiones y darle
forma a la información. Por ejemplo: quitar una columna, cambiar un tipo de data o
combinar tablas. A continuación, te comentamos cuáles son algunas de las cosas que
puedes realizar con Power Query:

• Conectar datos de diferentes fuentes, formas y tamaños.


• Organizar datos para procesarlos y analizarlos.
• Realizar transformaciones de datos, incluyendo la transformación de bases de datos
de inteligencia artificial.
• Crear conectores y transformaciones de bases de datos, y compartirlos de forma
rápida y sencilla.
• Obtener datos de otras fuentes o de documentos de Excel.
Fases en Power Qwery
1.Conectar Realiza las
conexiones a datos en la nube, en
un servicio o localmente

2. Transformar Da forma a los


datos para satisfacer necesidades,
mientras que el origen original
permanece inalterado

3. Combinar Integra los datos


de varios orígenes para obtener
una vista única en los datos

4. Carga Completa la consulta y


la cárga en una hoja de cálculo o
un modelo de datos la cual se
puede actualízar periódicamente.
Ventajas de trabajar con Power Query

Power Query permite a los usuarios transformar y mezclar datos entre varias fuentes de
datos, incluso entre diferentes tipos de bases de datos.
 Power Query proporciona soporte para una variedad de formatos de archivo, como CSV,
Excel, JSON, ODBC, etc.
 Power Query ofrece herramientas para limpiar los datos y eliminar errores comunes en los
datos.
 Power Query ofrece una variedad de herramientas de agregación y filtros para manipular los
datos de manera eficiente.
 Power Query es fácil de aprender y usar, lo que hace que sea ideal para usuarios
principiantes.
 Power Query es compatible con una variedad de herramientas de análisis de datos, como
PowerBI, Excel, etc.
 Power Query es una herramienta de código abierto, por lo que es gratis para usar.
 Power Query es una herramienta escalable, por lo que se puede usar para manejar conjuntos
de datos grandes.
 Power Query ofrece una variedad de funciones de extracción y transformación para ayudar a
los usuarios a transformar y preparar sus datos.
 Power Query también ofrece funciones de análisis para ayudar a los usuarios a descubrir
patrones y tendencias en sus datos.
EJERCICIO PRACTICO OBTENIENDO DATOS DE FUENTE EXTERNA
EN LA WEB

Copiar la url
https://es.wikipedia.org/wiki/Anexo:Salario_m%C3%ADnimo_en_Colombia

En la pestaña Datos, nos dirigimos a


la opción Obtener datos Externos
Para obtener los datos de la
página de ejemplo
ingresamos a la opción
obtener datos o nueva
consulta y en la opción desde
otras fuentes seleccionamos
Desde una web
En la siguiente ventana pegaremos la
dirección web donde se obtendrán los
datos a transformar, y aplicaremos la
opción básico para obtener la información
del sitio
Dentro de la obtención de los
datos encontramos 2 tablas, en
la cual exploramos su contenido,
tomaremos la de salario minimo
en Colombia por año para
realizar el proceso.

Vamos seleccionar la opción


editar para tomar los elementos
para el análisis de dato,
seleccionamos la opción editar
para aplicar o transformar los
datos
Posterior a ello se habilita el editor de
Power Qwery, para realizar proceso ETL
Ingresamos a la opción Quitar filas
inferior, para eliminar datos que
contienen texto del origen del sitio
web y hacemos clic en quitar filas
inferiores
Indicamos que solo quitaremos 1 fila ya
que es la ultima de la tabla
A continuación seleccionaremos las columnas
que queremos utilizar, en la opción Administrar
columnas seleccionamos Elegir columnas
En dado caso que se requiera hacer algún
calculo tomaremos la columna Salario mensual
y retiraremos el símbolo $, para realizar la
transformación de campo ingresaremos al
grupo Transformar y seleccionaremos
Reemplazar Valores
Observamos que el tipo de
dato fue reemplazado
Podemos observar que algunos datos como
los de la columna Salario mensual pueden
tener un espacio o formato diferente,
realizaremos la transformación de este dato a
partir de una columna ejemplo para convertir
este dato
Transformaremos el dato de la columna
salario mensual para que tome el dato
de la secuencia de valor y realizar los
respectivos calculo. En la opción agregar
columna tomaremos la secuencia a
partir de todas las columnas

Se tomara la
secuencia del
primer valor como
se observa en el
ejemplo y tomara
el dato
consecutivo
En base al anterior si no se toma la secuencia
del valor repetiremos en el campo el valor
para que tome la secuencia de los valores
restantes
Damos clic en aceptar y se
generara una nueva columna
Quitamos la columna
anterior para realizar el
análisis correspondiente
al campo
Cambiamos el tipo de
datos para la columna
nueva y la dejamos
tipo numérico
Finalizamos el proceso y
cargamos los datos a la hoja
de excel
Damos formato a la tabla
de datos, desde el
formato de Excel
Generamos un grafico de líneas en 2d para
analizar el incremento del salario mensual
EJERCICIO EN CLASE

1. Basados en el ejercicio anterior realizar el proceso de obtención de datos para su debido análisis
mediante la herramienta de power query, de la siguiente fuente de datos:

es.wikipedia.org/wiki/Copa_Mundial_de_futbol

De la tabla “Resultados y estadísticas”, Organizar la información para que solo se pueda obtener los
datos de la Edición, Campeón, subcampeón y tercer puesto en los mundiales de futbol, teniendo en
cuenta los siguientes ajustes:
1. Usar la primera fila como encabezado
2. Eliminar Columnas innecesarias o quitar columnas otras columnas
3. Cambiar el valor del campo año por valor numero decimal en caso de ser requerido
4. Cargar los datos y presentarlos
2. De acuerdo a un tema de interés (ejm: Juegos Olimpicos, Poblacion
en america latina entre otros), realice el proceso ETL, transformando
los datos y aplicando un análisis respectivo
GRACIAS

También podría gustarte