Tarea 2 Metadatos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 29

1

Unidad 2 – Paso 3 Diseñando la Arquitectura de Metadatos

Fabian Yesid Ortiz Velásquez

UNAD

204031_51 Introducción a los Metadatos

Wilson Joven

27/11/2022
2

Introducción

En este documento se evidencia la aplicación y comprensión de el concepto de

gobierno de datos, el cómo los datos son útiles en la organización y los procesos que se tienen

que llevar a cabo para que los datos sean seguros, confiables y disponibles, y como esos

procesos deberían ser aplicados para solucionar la situación del problema planteado.

Objetivo

Proponer y identificar procesos y entidades implicadas en el procesos de gestión de los

datos para la situación del problema planteado, así como identificar los metadatos técnicos

involucrados y los datos maestros.


3

Problema planteado

El departamento de ventas de su organización está desarrollando una estrategia para

incentivar las ventas on-line. Para esto, junto con el departamento de marketing sugiere realizar

una fidelización de clientes, para lo cual marketing va a enviar por correo electrónico un cupón

de descuento que se podrá usar en una compra on-line. Si no cuentan con correo electrónico

del cliente, se hará una llamada (para solicitar el correo electrónico) y si no se cuenta con el

número telefónico, se hará un envío de correo físico con una carta que contiene un código de

descuento del 50% a los clientes que hayan realizado una compra en lo transcurrido del año,

con el fin que lo empleen en una única compra en la tienda on- line de la compañía, cuyo valor

máximo corresponderá a la compra de mayor valor realizada durante el año en curso.

Al revisar la información de clientes, el departamento de marketing y el departamento de

ventas tienen para algunos clientes diferentes direcciones, correos electrónicos y teléfonos,

esta información proviene del sistema de ventas y de un sistema donde se almacena la

información de los clientes que se llama e-client. Adicionalmente, para saber cuál es la

venta de mayor valor, el departamento de servicio al cliente sugiere que se debe

contemplar, que si existió una devolución del producto o una queja, esa compra no se debe

contemplar como la compra de mayor valor, por lo tanto al cruzar los datos del mayor valor

según el departamento de ventas y servicio al cliente, los datos son diferentes, también se

detectó que en el reporte generado por el departamento de quejas existen números de

identificación duplicados para diferentes clientes. El departamento de servicio al cliente

tiene las quejas almacenadas en archivos Excel.

Ante esta situación, la empresa lo ha contactado a usted para que les ayude a

implementar una estrategia que les permita solucionar esos problemas de datos.
4

Oportunidade Se debe homologar la información que poseen los departamentos

s de mejora en relación con el cliente, para esto se debe realizar una limpieza de los

detectadas datos, eliminando los datos falsos, inexactos y duplicados; todo esto con el

fin de obtener la lista de clientes, sus compras, devoluciones y quejas, es

decir, se deben eliminar los datos inexactos para poder establecer una

conexión exacta y confiable entre los datos del cliente y las devoluciones y

quejas presentadas por él.

En lo posible se deben unificar las bases de datos de los clientes,

para evitar las inconsistencias en la información entre departamentos.

Se debe crear un departamento dedicado a la gestión de los datos,

para que estudie el caso y establezca reglas y procesos para el gobierno

de metadatos.

Partes  Departamento de marketing: ellos son los responsables

interesadas de la campaña de fidelización de clientes.

 Departamento de contabilidad: ellos deben determinar si

se cuenta con los recursos para distribuir los cupones a las

direcciones de sus clientes.

 Departamento de administración: ellos deben estudiar si

ese porcentaje de descuento es razonable y si no producirá

perdida, además deben definir la logística para repartir los

cupones a las direcciones físicas de sus clientes.

 Departamento de ventas: ellos tienen la lista de compras

que han hecho los clientes y las devoluciones que han

hecho.
5

 Departamento de servicio al cliente: ellos son los

encargados de proponer ideas para lograr la fidelización de

los clientes, deben ser uno de los principales implicados en

esta iniciativa del departamento de ventas.

 Departamento de quejas: en este departamento se

consignan todas las quejas que tienen los clientes con

respecto a los productos o la compra.

 Departamento de sistemas: este departamento es el

encargado de construir y mantener los sistemas, este

departamento debe buscar que los procesos realizados por

los sistemas sigan la lógica de negocio.


6

Fuentes de Fuentes de metadatos técnicos:

metadatos  Base de datos del sistema e-client.

 Base de datos del sistema de ventas.

Fuentes de metadatos de negocio:

 Excel con las quejas de los clientes.

Estrategia de El departamento de ventas y el departamento de marketing debe

metadatos homologar la base de datos del sistema e-client con la base de datos

del sistema de ventas para obtener la lista completa de clientes y sus

compras. Después de hacer esto, el departamento de ventas debe

limpiar los datos para eliminar los datos que son falsos, inexactos o

redundantes.

El departamento de ventas, en conjunto con el departamento de

servicio al cliente y el departamento de quejas debe limpiar la

información de las quejas y eliminar los registros que tengan un número

de identificación duplicado, una vez la información de las quejas este

limpia se debe homologar esa información con la del departamento de

ventas.

Para este punto se puede tener el panorama completo de las

compras que realizo el cliente, el valor de las compras, sus datos de

contacto, su dirección y si ha presentado quejas con la compra, en

resumen, ya se tiene la información necesaria para llevar a cabo el

envío de los cupones.

El departamento de administración, junto con el departamento de

sistemas debe crear una política de datos sólida, que no permita el ingreso

de datos duplicados, inexactos o falsos en los sistemas; también en esa


7

política se debe contemplar la posibilidad de hacer que el dato email sea

obligatorio, esto para poder tener seguro un medio de contacto con el

cliente.

Se debe manejar la información de los clientes en una sola base de

datos o por lo menos tener la información al día en los 3 sistemas, esto

para evitar las inconsistencias en cuanto a la información llevada por, el

sistema de ventas, el sistema e-client y la información llevada por el

departamento de quejas, como por ejemplo evitar las inconsistencias

presentadas en el número del documento de identidad del cliente en los 3

sistemas; esto es importante ya que ese es un dato sensible con el que la

organización podría tener consecuencias legales.

El departamento de administración debe crear un departamento

que se dedique a la gestión de datos de la empresa, el cual

preferiblemente debe estar conformado por personal que este familiarizado

con la lógica del negocio.

La agrupación de los datos del cliente en una única base de

datos puede aumentar la eficacia en los procesos que tienen que llevar

los departamentos, ya que, si la información está en un solo lugar,

ahorrara tiempo ya que no se tendrá que pedir la información a otro

departamento, además de que disminuiría el riesgo de inconsistencias

en la información entre departamentos, además, evitara la redundancia

de datos en las bases de datos.

Los datos necesarios para diseñar la base de datos para

resolver la situación son:

 Numero de documento de identidad del cliente (dato


8

obligatorio que puede servir como el identificador del

cliente en la base de datos).

 Nombres y apellidos del cliente (datos obligatorios).

 Correo electrónico (dato obligatorio para el contacto con

el cliente).

 Número de teléfono (puede ser opcional).

 Dirección del cliente (dato obligatorio).

 Artículos comprados por el cliente (campo obligatorio).

 Valor de cada uno de los artículos comprados (campos

obligatorios).

Los datos marcados como obligatorios son los datos necesarios

para mantener la calidad de los datos y evitar así la incongruencia de

los datos.

Con este conjunto de datos establecidos se puede hacer la

debida asociación de los datos del cliente con las quejas y

devoluciones, ya que ambas situaciones deben ir relacionadas con el

número de identificación del cliente, de esta manera solo es necesario

que se ingrese el número de identificación del cliente para una queja o

cuando se realice una devolución.

Las quejas de los clientes pueden ser llevadas en una base de

datos no relacional, la cual el sistema pueda relacionarla con los datos

del cliente llevados en una base de datos relacional.

El departamento de sistemas y el departamento de administración

deben crear restricciones a la información de esa base de datos, es decir,


9

cada departamento debe poder acceder solo a la información necesaria

para el desempeño de sus funciones.

El sistema debe realizar automáticamente la adición de metadatos

a la compra con el fin de aumentar la seguridad y confiabilidad de los

datos; entre los metadatos que se deberían incluir automáticamente están

la fecha en que se realizó la compra (dato obligatorio), la fecha en que se

realizó la devolución y la fecha en la que el cliente presento la queja.

El departamento de gestión de los metadatos


10
1

Datos maestros identificados

https://www.goconqr.com/es-ES/flowchart/38040064/diagrama-datos-maestros
1

Metadatos técnicos

Fuente de datos Metadato Detalles técnicos de los datos

Sistema de ventas customers Tabla


customerNumber Campo de tipo entero, su tamaño es de 11 dígitos, no
puede ser NULL y llave primaria de la tabla customers.
customerName Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
contactLastName Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
contactFirstName Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
phone Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
addressLine1 Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
addressLine2 Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y puede ser NULL.
city Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
state Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y puede ser NULL.
postalCode Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 15 caracteres y puede ser NULL.
country Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
salesRepEmployeeNumber Campo de tipo entero, su tamaño es de 11 dígitos,
puede ser NULL, es llave foránea de la tabla employees
en el campo employeeNumber.
creditLimit Campo de tipo decimal, su tamaño es de 10.2, puede
ser NULL
employees Tabla
employeeNumber Campo de tipo entero, su tamaño es de 11 dígitos, no
puede ser NULL y llave primaria de la tabla employees.
lastName Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
firstName Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
extension Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 10 caracteres y no puede ser NULL.
email Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 100 caracteres y no puede ser NULL.
officeCode Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 10 caracteres y no puede ser NULL, es
llave foránea y referencia a el campo officeCode.
reportsTo Campo de tipo entero, su tamaño es de 10 dígitos,
puede ser NULL, es llave foránea con el campo de la
misma tabla llamado employeeNumber.
jobTitle Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
payments Tabla
customerNumber Campo de tipo entero, su tamaño es de 11 digitos, no
2

puede ser NULL y hace parte de la llave compuesta de


la tabla payments en el campo customerNumber.
checkNumber Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL, y
hace parte de la llave compuesta de la tabla payments.
paymentDate Campo de tipo Date (fecha), no puede ser NULL.
amount Campo de tipo decimal, su tamaño es 10.2 y no puede
ser NULL.
orders Tabla
orderNumber Campo de tipo entero, su tamaño es de 11 digitos, no
puede ser NULL y es la llave primaria de la tabla orders.
orderDate Campo de tipo Date(fecha) no puede ser NULL
requiredDate Campo de tipo Date(fecha) no puede ser NULL
shippedDate Campo de tipo Date(fecha) puede ser NULL
status Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 15 caracteres y no puede ser NULL.
comments Campo de tipo text, puede ser nulo
customerNumber Campo de tipo entero, su tamaño es de 11 digitos, no
puede ser NULL y es la llave foránea que referencia el
campo customerNumber de la tabla customers.
orderDetails Tabla
orderNumber Campo de tipo entero, su tamaño es de 11 digitos no
puede ser NULL y es parte de la llave compuesta de la
tabla orderDetails, a su vez referencia el campo
orderNumber de la tabla orders.
productCode Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 15 caracteres y no puede ser NULL, y
hace parte de la llave compuesta de la tabla
orderDetails, a su vez referencia el campo productCode
de la tabla products.
quantityOrdered Campo de tipo entero, su tamaño es de 11 digitos no
puede ser NULL.
priceEach Campo de tipo decimal, su tamaño es de 10.2, no puede
ser NULL.
orderLineNumber Campo de tipo SMALLINT (tipo entero), su tamaño es
de 6, no puede ser NULL.
products Tabla
productCode Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 15 caracteres y no puede ser NULL, y es
la llave primaria de la tabla products.
productName Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 70 caracteres y no puede ser NULL.
productLine Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL, es
llave foránea y referencia el campo productLine de la
tabla productLines.
productScale Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 10 caracteres y no puede ser NULL.
productVendor Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
productDescription Campo de tipo text.
quantityInStock Campo de tipo SMALLINT (tipo entero), su tamaño es
de 6, no puede ser NULL.
buyPrice Campo de tipo decimal, su tamaño es 10.2, no puede
ser NULL.
MSRP Campo de tipo decimal, su tamaño es 10.2, no puede
ser NULL.
productLInes Tabla
productLine Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL, es
llave primaria de la tabla productLines.
textDescription Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 4000 caracteres y puede ser NULL.
htmlDescription Campo de tipo MEDIUMTEXT, puede ser NULL.
image Campo de tipo MEDIUMBLOB, puede ser NULL.
offices Tabla
officeCode Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 10 caracteres y no puede ser NULL, es
3

llave primaria de la tabla offices.


city Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
phone Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
addressLine1 Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
addressLine2 Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y puede ser NULL.
state Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y puede ser NULL.
country Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 50 caracteres y no puede ser NULL.
postalCode Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 15 caracteres y no puede ser NULL.
territory Campo de tipo Varchar (cadena de caracteres), su
tamaño es de 10 caracteres y no puede ser NULL.
Sistema de marketing Cliente Tabla
Id_cliente Campo de tipo número y clave principal de la tabla
Cliente.
Nombres Campo de tipo texto largo.
Apellidos Campo de tipo texto largo.
Telefono Campo de tipo Numero.
Direccion Campo de tipo texto largo.
Ciudad Campo de tipo texto corto.
Departamento Campo de tipo texto corto.
Correo Campo de tipo texto corto.
ClientexCampania Tabla intermedia entre las tablas Cliente y
CampaniaPublicitaria
Id_clientexcampania Campo de tipo número, automáticamente numerado y
clave de la tabla ClientexCampania.
Id_campania Campo de tipo número.
Id_cliente Campo de tipo número.
CampaniaPublicitaria Tabla
Id_campania Campo de tipo número y clave principal de la tabla
CampaniaPublicitaria.
Descripcion Campo de tipo texto largo.
Fecha_inicio Campo de tipo Fecha/Hora.
Fecha_fin Campo de tipo Fecha/Hora.
Sistema de quejas ExcelQuejas Excel que contiene las quejas de los clientes
Fecha Campo tipo fecha con formato dd/mm/aaaa
Cedula del Cliente Campo de tipo texto.
Nombre del Cliente Campo de tipo texto.
Teléfono de Contacto Campo de tipo texto.
Motivo de la Queja Campo de tipo texto.
Descripción de la Queja Campo de tipo texto.
Estado Campo de tipo texto.
Descripción del Producto Campo de tipo texto
4

Arquitectura de metadatos

1.Fuentes de metadatos 2.Repositorio 3.Usuarios finales,

beneficiados
Archivo de

Excel Quejas Departamento


ventas

Base de datos del Repositorio


hibrido
Departamento
sistema de ventas de marketing

Base de datos del Departamento


servicio al
sistema de marketing cliente

El enfoque de un repositorio de metadatos hibrido permitiría obtener los datos de

fuentes externas como por ejemplo el Excel del departamento de atención al cliente, y al mismo

tiempo almacenar los datos de los clientes, las ventas y las campañas; se propone este tipo de

arquitectura ya que la información como la del cliente, los datos de la campaña, la información

de los productos, los datos de los empleados: variaran poco y no tendrán muchas

modificaciones a largo plazo, mientras que las quejas se pueden seguir manejando en un

Excel, pero se recomienda la implementación de macros en Visual Basic para el ingreso de

nuevos datos y crear una validación de campos.

El flujo de la información es el siguiente: los datos de las compras, los productos, los

clientes, los empleados y las campañas se almacenarán en el repositorio, ya que los registros

de estos no cambian mucho una vez creados; las quejas se pueden seguir manejando en el

Excel pero es necesario implementar validaciones a los campos para asegurar su integridad,

también se le puede incorporar formularios en Visual Basic para facilitar el diligenciamiento.


5

Importancia de las herramientas de gestión de metadatos en una organización

En el ámbito de una organización es un hecho que se van a realizar varias actividades

relacionadas a su modelo de negocios, como por ejemplo contratar proveedores, adquirir

productos, administrar la nomina de los empleados y realizar ventas a los clientes; pues bien,

todas esas actividades generan datos, datos que la organización debe almacenar ya que son

de vital importancia para sus operaciones, a medida que sus operaciones se van realizando y

la organización va creciendo va generando más datos los cuales son almacenados en

diferentes formatos de información, cada uno de esos formatos debe tener un dato que

describen la información que se guarda y esos datos a su vez brindan una forma más fácil de

encontrar la información, a estos tipos de datos se les llama metadatos.

Entonces cada formato/fuente de información tiene sus propios metadatos, y en más de

una ocasión la organización va a necesitar consultar y extraer datos de diferentes fuentes de

información para compararlos, a su vez esos datos van a estar en diferentes ubicaciones y

diferentes formatos, y es aquí donde entran herramientas de gestión de metadatos, estas

herramientas procesan los metadatos para administrar los datos y encontrar la información más

rápidamente, gracias a esto facilitan la consulta, recuperación y exportación de los datos a

otros formatos mediante la estructuración de los metadatos de las diferentes fuentes, permiten

la agrupación de la información de diferentes almacenes de datos mediante conectores,

también permiten agrupar los metadatos de varias fuentes de datos de varios sistemas en un

solo lugar funcionando como un almacén de metadatos. La utilidad más resaltable de las

herramientas de gestión de metadatos es que proporcionan un lenguaje compartido para todas

las personas que interactúan con los diferentes sistemas de información de la organización, ya

que al contener los metadatos de la información que buscan permite que la información con

datos comunes de diferentes sistemas sea fácil de buscar, precisa, confiable y comprensible.
6

Sinopsis de la herramienta Talend Open Studio

Talend open studio es una herramienta de gestión de metadatos que nos permite

realizar operaciones ETL fácilmente, nos permite extraer información de diferentes fuentes de

datos, transformar los datos según nuestras especificaciones (formatearlos y realizar limpieza

de datos) y exportar la información a otros almacenes de datos. Esta herramienta nos permite

reunir diferentes componentes y establecer un flujo de datos entre ellos para completar tareas

complejas.

En resumen, Talend open studio es una herramienta muy útil de big data ya que nos

permite gestionar e integrar más fácilmente grandes volúmenes de datos de diferentes fuentes

mediante tareas o Jobs, es decir, automatiza el trabajo de acceder a los datos y moverlos a

otros sistemas, además de darnos opciones para definir el gobierno de datos y la integración

entre aplicaciones.
7

Captura de pantalla con la estructura de datos implementada con el modelo

suministrado

Evidencias graficas de los Jobs

Para agrupar los Jobs creamos una carpeta, para eso damos clic derecho en la sección

job designs y damos clic en la opción créate folder, allí le damos un nombre a la etiqueta de la

carpeta.

Job 1
8
9

Para crear el job damos clic derecho en la carpeta que creamos, y seleccionamos la

opción créate job, le damos un nombre, y le damos llenamos el campo que dice propósito y

descripción para documentar lo que hace el job.

En este job se eliminó la columna productLine que hace referencia a la tabla

productLines, ya que la tabla productLines no es un dato maestro y por eso no fue cargada del

modelo de la base de datos, esto se hizo dando clic en el apartado de metadatos y

seleccionando la conexión a la base de datos que contienen los datos que nos interesan,

desplegamos la carpeta que dice Table schemas y dando doble clic en la tabla products, luego

seleccionamos el campo que queremos eliminar y damos click en la equis roja y por ultimo le

damos clic a finalizar.

Job 2
10

Este job exporta los datos de la tabla customers de la base de datos a un archivo json y

a un archivo con extensión csv.

Para realizar este job tenemos que especificar la fuente de metadatos de la que vamos

a extraer los datos para los archivos que tenemos que generar, para esto:

 vamos al apartado izquierdo.

 desplegamos el menú Metadata.

 allí desplegamos el menú Db Connections y desplegamos la conexión a nuestra

base de datos.

 abrimos la carpeta que dice Table Schemas y seleccionamos la tabla de datos

que necesitamos, la arrastramos hasta nuestra área de trabajo y seleccionamos

el tipo de entrada de datos.


11

 luego necesitamos especificar el destino de los datos, entonces para eso damos

clic sostenido en el área de trabajo y arrastramos hacia cualquier lado, para

luego escribir tFileOutput.

 Seleccionamos el tipo de archivo de salida en este caso se escogió un Json.

 Una vez nos haya aparecido el icono del archivo destino podemos dar doble clic

sobre el y ver sus propiedades, la ruta en donde se guardará una vez generado

el archivo y allí mismo podemos cambiar el nombre del archivo si lo deseamos.

 Luego relacionamos la fuente de datos con el archivo destino dando clic derecho

sobre el icono de la fuente de datos.

 Seleccionamos la opción fila y luego la opción main, como resultado tendremos

una línea que podemos manipular con el ratón.

 Manipulando la línea damos clic en la salida de datos que deseamos, y así

quedan relacionadas la fuente de datos con el destino de los datos.

Job 3
12

En este job extrae los datos de un archivo excel y los exporta a un formato json.

Para lograr este resultado:

 Cargamos el archivo excel con los datos solicitados, para esto desplegamos el

menú de la izquierda llamado Metadata.

 Damos clic derecho sobre la opción File Excel para crear una conexión con el

archivo Excel.

 Seleccionamos la opción créate file Excel.

 Damos un nombre, un propósito y una descripción a la conexión con el archivo

excel.

 En el campo fichero damos clic a la opción browse y nos abrirá el explorador de

archivos, desde el cual podremos seleccionar el archivo excel que debemos

cargar.
13

 En el recuadro inferior de la izquierda seleccionamos la hoja del archivo Excel

desde la que queremos exportar todos los datos, y damos clic en next.

 En la siguiente pantalla damos clic en next.

 Luego podemos seleccionar el tipo de dato que queremos que se exporte.


14

 Luego damos clic en finish.

 Entonces nuestra conexión con excel quedo en el menú File Excel.

 luego necesitamos especificar el destino de los datos, entonces para eso damos

clic sostenido en el área de trabajo y arrastramos hacia cualquier lado, para

luego escribir tFileOutput.

 Seleccionamos el tipo de archivo de salida en este caso se escogió un Json.

 Una vez nos haya aparecido el icono del archivo destino podemos dar doble clic

sobre el y ver sus propiedades, la ruta en donde se guardará una vez generado

el archivo y allí mismo podemos cambiar el nombre del archivo si lo deseamos.


15

 Luego relacionamos la fuente de datos de Excel con el archivo destino dando

clic derecho sobre el icono de la fuente de datos.

 Seleccionamos la opción fila y luego la opción main, como resultado tendremos

una línea que podemos manipular con el ratón.

 Manipulando la línea damos clic en la salida de datos que deseamos, y así

quedan relacionadas la fuente de datos con el destino de los datos.


16

Conclusiones

La integración de la información es una tarea muy compleja, en especial cuando se

tiene que sacar de fuentes que están en diferentes formatos; Talend Open Studio nos permite

automatizar la recolección de los datos necesarios, la estandarización y limpieza de los mismos

y exportarlos a diferentes formatos y otros sistemas de información, Talend Open Studio es una

gran herramienta que nos facilita aplicar el gobierno de datos a los diferentes sistemas de

información.
17

Referencias bibliográficas

Ahmed, I. (2021, 9 de marzo). El enfoque basado en metadatos se encuentra con la

automatización del almacén de datos: una combinación perfecta. Astera.

https://www.astera.com/es/type/blog/metadata-in-data-warehouse/

Wilson Ramiro Sánchez Yopazá. (Consultado el 29 de septiembre del 2022). GUIA DE

METADATOS Guía para la formulación de un esquema de metadatos para la gestión de

documentos. Archivo General de la Nación Colombia.

https://www.archivogeneral.gov.co/sites/default/files/Estructura_Web/5_Consulte/Recursos/

Publicacionees/GuiaDeMetadatos.pdf

Amórtegui Vargas, P. (08, 28,2020). Arquitecturas de metadatos. [Archivo de

video]. https://repository.unad.edu.co/handle/10596/36141

TIBCO, ¿Qué es la gestión de metadatos?. Consultado el 19 de noviembre del 2022.

https://www.tibco.com/es/reference-center/what-is-metadata-management#:~:text=La%20gesti

%C3%B3n%20de%20metadatos%20le,datos%20en%20toda%20la%20organizaci%C3%B3n.

Nwokolo, U. (2022, 28 de agosto). HERRAMIENTAS DE GESTIÓN DE METADATOS:

significado y todo lo que necesita saber. Businessyield.com

https://businessyield.com/es/management/metadata-management-tools/
18

Madrid, V. (2010, 6 de mayo). Talend Open Studio (TOS) 4.0. adictosaltrabajo.com.

https://www.adictosaltrabajo.com/2010/05/06/tos-4-0/#:~:text=Caracter%C3%ADsticas

%20principales%20de%20la%20herramienta,y%20carga%20de%20datos%20complejas

El Boli. (2022, 11 de junio). 1.¿Que es Talend? | Talend en español | Talend Data

Integration [video]. https://youtu.be/3e7MycjUPWY

También podría gustarte