Qué Es Etl

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 8

SECRETARÍA DE

EDUCACIÓN PÚBLICA

TECNOLÓGICO NACIONAL DE
MÉXICO

INSTITUTO TECNOLÓGICO DE IGUALA

Nombres de los Alumnos:


Emilia Mariana Jiménez Lara
Liliana Marín Feliciano
Víctor Hugo Salazar Morales
Francisco Alejandro Guzmán Santana

Docente: José Luis Zagal Arce

Carrera: Ingeniería en Informática

Semestre:
Octavo Semestre

Asignatura:
Inteligencia de Negocios

Actividad: Que es ETL


Ciudad de Iguala; Guerrero.
¿QUÉ ES ETL?

ETL son las siglas de Extract, Transform and Load. Es un proceso de gestión de
datos de tres pasos que extractos datos no estructurados de múltiples
fuentes, transformadas en un formato que satisfaga los requisitos operativos y
analíticos del negocio, y cargas a un destino objetivo.

Extraer, transformar y cargar (ETL, Extract, Transform, Load) es el proceso de


compilación de datos a partir de un número ilimitado de fuentes, su posterior
organización y centralización en un único repositorio.

Se utiliza una herramienta ETL para ejecutar un proyecto de integración e incluye


tres pasos: extracción, transformación y carga.

Por lo tanto, una herramienta ETL extrae datos de fuentes dispares, los transforma
para hacerlos compatibles con el sistema de destino y luego los carga en el
sistema de destino. Este destino podría ser un almacén de datos, un lago de
datos, una base de datos o cualquier otro sistema de aplicación.

¿Para qué se utiliza un proceso de ETL?

En prácticamente cualquier operación empresarial los datos desempeñan un papel


importante; para que tengan valor, deben trasladarse y prepararse para su uso, y
para ello se necesitan procesos de ETL. Enumeramos algunos casos de
aplicación de ETL:

Migración de datos de una aplicación a otra

Replicación de datos para copias de seguridad o análisis de redundancia

Procesos operativos, como la migración de datos desde un CRM a un ODS


(almacén de datos operativos) para potenciar o enriquecer los datos y luego
devolverlos al CRM
Depositar los datos en un almacén de datos para ingerir, clasificar y transformarlos
en business intelligence

Migración de aplicaciones de infraestructuras locales a cloud, cloud híbrida o


multicloud

Sincronización de sistemas clave

LOS PROCESOS DE ETL

Un proceso de ETL suele comprender 3 fases.  Cada vez es más habitual extraer
datos de sus ubicaciones originales y luego cargarlos en un almacén de datos
diana o transformarlos después de cargarlos.  Este proceso recibe el nombre de
ELT, en lugar de ETL. Obtenga más información sobre la diferencia entre ETL

Las tres fases del proceso de ETL:

Fase 1: Extracción

El objetivo de un proceso ETL es producir datos limpios y accesibles que puedan


utilizarse para analíticas u operaciones comerciales. Los datos en bruto deben
extraerse de una variedad de fuentes, por ejemplo:

Bases de datos existentes

Registros de actividad como el tráfico de red, informes de errores, etc.

Rendimiento y anomalías de aplicaciones

Incidencias de seguridad

Otras actividades transaccionales que deben comunicarse para dar cumplimiento


normativo

Los datos extraídos en ocasiones se transfieren a otro destino como por ejemplo
un data lake o un almacén de datos.

Fase 2: Transformación
La fase de transformación de ETL es donde se produce la operación más crítica.
El resultado más destacado de la transformación pasa por aplicar las normas
necesarias del negocio a los datos para cumplir con los requisitos de notificación. 
La transformación modifica los datos en bruto para que presenten los formatos de
notificación correctos.  Si los datos no se limpian, resulta más complicado aplicar
las normas comerciales de notificación.

La transformación se efectúa mediante una serie de normas y reglamentos que se


esbozan. Estos son algunos de los estándares que garantizan la calidad de
datos y su accesibilidad durante esta fase:

 Normalización: definir qué datos entrarán en juego, cómo se formatearán y


almacenarán, y otras consideraciones básicas que definirán las etapas
sucesivas.
 Eliminación de duplicados: notificar los duplicados a los administradores de
datos; excluyendo y/o eliminando los datos redundantes.
 Verificación: ejecutar comprobaciones automatizadas para cotejar
información similar, como tiempos de transacción o registros de acceso.
Las tareas de verificación permiten seguir cribando los datos no utilizables y
pueden alertar sobre anomalías en sus sistemas, aplicaciones o datos.
 Clasificación: maximizar la eficiencia de los almacenes de datos agrupando
y clasificando elementos como los datos en bruto, audios, archivos
multimedia y otros objetos en categorías. Las normas de transformación
determinarán cómo se clasifica cada dato y dónde se trasladará a
continuación. A menudo el proceso de ETL se emplea para crear tablas de
agregación a efectos de informes resumidos. Para ello debemos clasificar y,
posteriormente, agregar.

Estas fases de transformación reducen lo que hasta ahora era una montaña de
material sin utilidad posible a un producto de datos que puede presentar en la
última fase del ETL: la fase de carga.

Fase 3: Carga
La última fase de un proceso de ETL típico es la carga de esos datos extraídos y
transformados a su nuevo destino. Existen dos vías habituales de cargar los datos
a un almacén de datos: la carga completa y la carga incremental.

La ejecución de un ciclo aislado de ETL o de una serie de ellos programada puede


realizarse ejecutando una tarea desde una línea de comando o una interfaz GUI.
Sin embargo, debemos estar atentos a varios frentes. Gestionar las excepciones,
por ejemplo, puede resultar un proceso muy farragoso.  Muchas veces las
extracciones de datos pueden fallar cuando hay incidencias en uno o varios
sistemas. La existencia de datos erróneos en un sistema puede afectar a datos
que estén siendo extraídos de otro, por lo que el seguimiento y la gestión de
errores son actividades fundamentales.

EJEMPLOS DE CASOS DE USO DE LA HERRAMIENTA ETL

Construyendo un almacén de datos

Data Warehouse es un entorno organizado que contiene datos comerciales


críticos. Pero antes de que los datos se carguen en el almacén de datos, deben
limpiarse, enriquecerse y transformarse. Una vez cargados, estos datos se
convierten en una 'única fuente de verdad' para el negocio.

Uno de los pasos principales para construir un almacén de datos es asegurarse de


que los datos conserven calidad y precisión. Una herramienta ETL puede reforzar
este concepto y simplificar la ejecución de este caso de uso sin esfuerzo,
permitiendo una carga de datos confiable.

Migración de datos

Otro caso de uso vital de una herramienta ETL es la actualización de sistemas


o datos en movimiento de un sistema heredado a uno moderno.

El desafío con la migración de datos es principalmente la disparidad en el formato


de los sistemas antiguos y nuevos. Una herramienta ETL, con sus capacidades de
transformación mejoradas, garantiza que el formato, la estructura y el esquema de
los datos de origen sean compatibles con el sistema de destino.

Ejemplos de herramientas ETL:

 Ab Initio
 Benetl
 IBM Websphere DataStage (antes Ascential DataStage)
 Microsoft Integration Services
 Oracle Warehouse Builder
 Sybase
 Syncsort: DMExpress.
 Opentext (antes Genio, Hummingbird).
CONCLUSIÓN
Liliana Marín Feliciano

Como conclusión podemos decir que los ETL son proceso que organizan los flujos
datos entre distintos sistemas en una organización y aporta los métodos y
herramientas necesarias para movilizar los datos desde múltiples fuentes a un
almacén de datos, para transformarlos, limpiarlos y cargarlos en otra base de
datos. ETL es parte de la Inteligencia de Negocios, también llamado “Gestión de
los Datos” (Data Management).

Actualmente se generan muchos más datos que hace unos seis años atrás.
Estamos constantemente consultando nuestras redes sociales y usando nuestro
teléfono móvil, ordenador o Tablet. Es por esta cantidad de datos que hay que
tratar en la actualidad que es tan importante la herramienta de ETL porque éste se
encarga de extraer, transformar y cargar los datos, además de gestionar y
asegurarse de su integración y coherencia. Todo ello nos permite extraer unos
datos de un entorno y cargarlos en el entorno destino, después de haberlos
analizado.

Emilia Mariana:

Puedo mencionar que los procesos de ETL son de gran ayuda ya que son muy
fluidos a la hora de realizar distintos procesos dentro de los sistemas de las
grandes organizaciones, hoy en día toda empresa es una mina de datos que se
están generando al ritmo de los segundos, es por esta razón que tener un uso de
las herramientas de ETL es tan importante.

Víctor Hugo Salazar Morales

Los ETL son procesos que extraen, transforman y carga datos que son de una
fuente inicial a un Data Warehouse para que datos sean compartidos entre
diferentes tipos de sistemas de bases de datos para obtener mejoras en la
industria mundial. Son de gran ayuda hoy en día porque la población mundial hay
ido aumentando la utilidad de las redes sociales, teniendo así un exceso de
información que ya existe en el internet entre otras cosas que hace que millones
de datos sean creados para poder ser utilizados en distintos lugares.

Francisco Alejandro Guzmán Santana:

Los ETL son muy importante en la actualidad siendo estos una herramienta de
gran ayuda para poder manejar millones de datos que se comparten entre otras
empresas para ahorrar espacios y generar informes a partir de la información
obtenida.

REFERENCIAS

Diegocond. “Herramientas ETL y Algunos Ejemplos De Herramientas ETL, MOLAP, Data

Warehouse, DataMarts.” Análisis De Información y Minería De Datos Para La Toma De

Decisiones, 22 May 2017,

datosmineriainformacion.wordpress.com/2017/05/22/herramientas-etl-y-algunos-ejemplos-

de-herramientas-etl-molap-data-warehouse-datamarts/.

“¿En Qué Consiste Un Proceso De ETL (Extraer, Transformar y Cargar)? - Talend.” Talend

Real-Time Open Source Data Integration Software, 6 Jan. 2021,

www.talend.com/es/resources/what-is-etl/.

“¿Qué Es La Herramienta ETL? ¿Y Por Qué Lo Necesitas? El.” Astera, 30 Mar. 2021,
www.astera.com/es/type/blog/what-is-etl-tool/.

También podría gustarte