Tarea 2 Metadatos
Tarea 2 Metadatos
Tarea 2 Metadatos
UNAD
Wilson Joven
27/11/2022
2
Introducción
gobierno de datos, el cómo los datos son útiles en la organización y los procesos que se tienen
que llevar a cabo para que los datos sean seguros, confiables y disponibles, y como esos
procesos deberían ser aplicados para solucionar la situación del problema planteado.
Objetivo
datos para la situación del problema planteado, así como identificar los metadatos técnicos
Problema planteado
incentivar las ventas on-line. Para esto, junto con el departamento de marketing sugiere realizar
una fidelización de clientes, para lo cual marketing va a enviar por correo electrónico un cupón
de descuento que se podrá usar en una compra on-line. Si no cuentan con correo electrónico
del cliente, se hará una llamada (para solicitar el correo electrónico) y si no se cuenta con el
número telefónico, se hará un envío de correo físico con una carta que contiene un código de
descuento del 50% a los clientes que hayan realizado una compra en lo transcurrido del año,
con el fin que lo empleen en una única compra en la tienda on- line de la compañía, cuyo valor
ventas tienen para algunos clientes diferentes direcciones, correos electrónicos y teléfonos,
información de los clientes que se llama e-client. Adicionalmente, para saber cuál es la
contemplar, que si existió una devolución del producto o una queja, esa compra no se debe
contemplar como la compra de mayor valor, por lo tanto al cruzar los datos del mayor valor
según el departamento de ventas y servicio al cliente, los datos son diferentes, también se
Ante esta situación, la empresa lo ha contactado a usted para que les ayude a
implementar una estrategia que les permita solucionar esos problemas de datos.
4
s de mejora en relación con el cliente, para esto se debe realizar una limpieza de los
detectadas datos, eliminando los datos falsos, inexactos y duplicados; todo esto con el
decir, se deben eliminar los datos inexactos para poder establecer una
conexión exacta y confiable entre los datos del cliente y las devoluciones y
de metadatos.
hecho.
5
metadatos homologar la base de datos del sistema e-client con la base de datos
limpiar los datos para eliminar los datos que son falsos, inexactos o
redundantes.
ventas.
sistemas debe crear una política de datos sólida, que no permita el ingreso
cliente.
datos puede aumentar la eficacia en los procesos que tienen que llevar
el cliente).
obligatorios).
los datos.
https://www.goconqr.com/es-ES/flowchart/38040064/diagrama-datos-maestros
1
Metadatos técnicos
Arquitectura de metadatos
beneficiados
Archivo de
fuentes externas como por ejemplo el Excel del departamento de atención al cliente, y al mismo
tiempo almacenar los datos de los clientes, las ventas y las campañas; se propone este tipo de
arquitectura ya que la información como la del cliente, los datos de la campaña, la información
de los productos, los datos de los empleados: variaran poco y no tendrán muchas
modificaciones a largo plazo, mientras que las quejas se pueden seguir manejando en un
El flujo de la información es el siguiente: los datos de las compras, los productos, los
clientes, los empleados y las campañas se almacenarán en el repositorio, ya que los registros
de estos no cambian mucho una vez creados; las quejas se pueden seguir manejando en el
Excel pero es necesario implementar validaciones a los campos para asegurar su integridad,
productos, administrar la nomina de los empleados y realizar ventas a los clientes; pues bien,
todas esas actividades generan datos, datos que la organización debe almacenar ya que son
de vital importancia para sus operaciones, a medida que sus operaciones se van realizando y
diferentes formatos de información, cada uno de esos formatos debe tener un dato que
describen la información que se guarda y esos datos a su vez brindan una forma más fácil de
información para compararlos, a su vez esos datos van a estar en diferentes ubicaciones y
herramientas procesan los metadatos para administrar los datos y encontrar la información más
otros formatos mediante la estructuración de los metadatos de las diferentes fuentes, permiten
también permiten agrupar los metadatos de varias fuentes de datos de varios sistemas en un
solo lugar funcionando como un almacén de metadatos. La utilidad más resaltable de las
las personas que interactúan con los diferentes sistemas de información de la organización, ya
que al contener los metadatos de la información que buscan permite que la información con
datos comunes de diferentes sistemas sea fácil de buscar, precisa, confiable y comprensible.
6
Talend open studio es una herramienta de gestión de metadatos que nos permite
realizar operaciones ETL fácilmente, nos permite extraer información de diferentes fuentes de
datos, transformar los datos según nuestras especificaciones (formatearlos y realizar limpieza
de datos) y exportar la información a otros almacenes de datos. Esta herramienta nos permite
reunir diferentes componentes y establecer un flujo de datos entre ellos para completar tareas
complejas.
En resumen, Talend open studio es una herramienta muy útil de big data ya que nos
permite gestionar e integrar más fácilmente grandes volúmenes de datos de diferentes fuentes
mediante tareas o Jobs, es decir, automatiza el trabajo de acceder a los datos y moverlos a
otros sistemas, además de darnos opciones para definir el gobierno de datos y la integración
entre aplicaciones.
7
suministrado
Para agrupar los Jobs creamos una carpeta, para eso damos clic derecho en la sección
job designs y damos clic en la opción créate folder, allí le damos un nombre a la etiqueta de la
carpeta.
Job 1
8
9
Para crear el job damos clic derecho en la carpeta que creamos, y seleccionamos la
opción créate job, le damos un nombre, y le damos llenamos el campo que dice propósito y
productLines, ya que la tabla productLines no es un dato maestro y por eso no fue cargada del
seleccionando la conexión a la base de datos que contienen los datos que nos interesan,
desplegamos la carpeta que dice Table schemas y dando doble clic en la tabla products, luego
seleccionamos el campo que queremos eliminar y damos click en la equis roja y por ultimo le
Job 2
10
Este job exporta los datos de la tabla customers de la base de datos a un archivo json y
Para realizar este job tenemos que especificar la fuente de metadatos de la que vamos
a extraer los datos para los archivos que tenemos que generar, para esto:
base de datos.
luego necesitamos especificar el destino de los datos, entonces para eso damos
Una vez nos haya aparecido el icono del archivo destino podemos dar doble clic
sobre el y ver sus propiedades, la ruta en donde se guardará una vez generado
Luego relacionamos la fuente de datos con el archivo destino dando clic derecho
Job 3
12
En este job extrae los datos de un archivo excel y los exporta a un formato json.
Cargamos el archivo excel con los datos solicitados, para esto desplegamos el
Damos clic derecho sobre la opción File Excel para crear una conexión con el
archivo Excel.
excel.
cargar.
13
desde la que queremos exportar todos los datos, y damos clic en next.
luego necesitamos especificar el destino de los datos, entonces para eso damos
Una vez nos haya aparecido el icono del archivo destino podemos dar doble clic
sobre el y ver sus propiedades, la ruta en donde se guardará una vez generado
Conclusiones
tiene que sacar de fuentes que están en diferentes formatos; Talend Open Studio nos permite
y exportarlos a diferentes formatos y otros sistemas de información, Talend Open Studio es una
gran herramienta que nos facilita aplicar el gobierno de datos a los diferentes sistemas de
información.
17
Referencias bibliográficas
https://www.astera.com/es/type/blog/metadata-in-data-warehouse/
https://www.archivogeneral.gov.co/sites/default/files/Estructura_Web/5_Consulte/Recursos/
Publicacionees/GuiaDeMetadatos.pdf
video]. https://repository.unad.edu.co/handle/10596/36141
https://www.tibco.com/es/reference-center/what-is-metadata-management#:~:text=La%20gesti
%C3%B3n%20de%20metadatos%20le,datos%20en%20toda%20la%20organizaci%C3%B3n.
https://businessyield.com/es/management/metadata-management-tools/
18
https://www.adictosaltrabajo.com/2010/05/06/tos-4-0/#:~:text=Caracter%C3%ADsticas
%20principales%20de%20la%20herramienta,y%20carga%20de%20datos%20complejas