ET124 - BIY7131 - Instrucciones y Pauta Situacion Evaluativa
ET124 - BIY7131 - Instrucciones y Pauta Situacion Evaluativa
ET124 - BIY7131 - Instrucciones y Pauta Situacion Evaluativa
2. Evaluación
El encargo debe cumplir con todas las instrucciones establecidas previamente, considerando
aspectos asociados a contenido y forma de entrega.
INSTRUCCIONES ESPECÍFICAS
Este examen busca generar una plataforma de datos que contenga la información histórica
de los viajes, de tal forma de identificar la cantidad de transportes disponibles por cada uno
de los medios disponibles (buses, metro), ver qué horarios tiene mayor disponibilidad de
transporte en una zona determinada, y cuáles de esas zonas han tenido la mayor variabilidad
en los recorridos (señalando si han agregado o quitado recorridos). Por otro lado, es
importante tener siempre la información lo más actualizada posible, es por ello que también
será requerido en este examen la obtención diaria de los recorridos disponibles en Santiago.
Información
La información que utilizaremos para desarrollar este examen proviene de varias fuentes. A
continuación, se especifican dichas fuentes:
Datos Históricos: Estos datos se pueden obtener desde la plataforma de datos abiertos del
Gobierno de Chile, el link es el siguiente: https://datos.gob.cl/dataset/33245. Este set de datos
contiene la información mensual de la planificación de los distintos medios de transporte en
Santiago, y está disponible cerca del día 15 de cada mes. El examen requiere que la descarga
de datos sea automatizada, para ello deberá utilizar la siguiente API
https://datos.gob.cl/api/action/package_show?id=33245. Esta API devuelve los recursos
disponibles, debe identificar la ULR en la respuesta que le permitirá descargar los archivos.
Datos Diarios: Para obtener la información de transportes diarios, primero deber consultar una
API que le devolverá todos los recorridos disponibles
(https://www.red.cl/restservice_v2/rest/getservicios/all), luego, por cada uno de esos recorridos
deberá obtener la información de su trayecto, horarios y paradas desde la siguiente API:
Los procedimientos específicos incluyen las siguientes etapas con sus respectivos requisitos:
En esta etapa se debe realizar el diseño el o los modelos de datos finales optimizados para el
consumo de usuarios finales y/o de herramientas de visualización, los procesos Batch y
Streaming/api/near-real-time/real-time (según corresponda), junto con las mallas de ejecución y
puntos de control de errores.
Definir los procesos, flujos de información y orquestación de datos para dar inicio a la
construcción de la solución.
Entregable: Informe versión 1 (desde portada hasta elección de arquitectura para diseño de
procesos a construir para toma de decisiones) y avance PPT interactiva.
ETAPA 2: Durante la semana 16 se deberá construir los procesos Batch, se sugieren los
siguientes pasos:
Paso 1: Realizar las conexiones con la fuente de origen de datos (estas pueden ser bases
de datos, archivos que deben descargar desde internet, etc.)
Paso 3: Construir los procesos de limpieza, transformación y carga al modelo de datos final.
Para cada uno de estos pasos, debe considerar (si aplica) lo siguiente:
Control de errores: todos los procesos pueden tener puntos de fallo, de acuerdo con lo
identificado en la Etapa 1 (diseño), debe implementar los controles de errores
correspondientes.
ETAPA 3: Durante la semana 17, deberán construir los procesos de BigData utilizando una
estrategia de Real-Time, Streaming o API, según corresponda. Se sugieren los siguientes
pasos:
Paso 3: Construir los procesos de limpieza, transformación y carga al modelo de datos final,
considerando la trazabilidad de información y ciclo de vida del dato.
Para cada uno de estos pasos, debe considerar (si aplica) lo siguiente:
Control de errores: todos los procesos pueden tener puntos de fallo, de acuerdo a lo
identificado en la Etapa 1 (diseño), debe implementar los controles de errores
correspondientes.
Control de duplicidad de datos: Considerar que los procesos se pueden ejecutar múltiples
veces, y que los datos desde el origen pueden cambiar, por tanto, sus procesos deben
determinar qué hacer si una ejecución devuelve datos que ya existen (tome la decisión
Registro de actividad: Los procesos se podrían ejecutar varias veces, debe incorporar el
control de ejecución y considerar el ciclo de vida de los datos.
Elección de la arquitectura.
Conexión a las Fuentes de Origen, indicando nombres de servidores, archivos a leer, API
a consultar, etc.
Posibles transformaciones.
Informe Final: Debe ser entregado al finalizar la tercera semana. Este informe debe contener
lo mismo del informe versión 1, agregando una sección con el diseño de los procesos
realmente implementados, identificando las diferencias vs el diseño inicial, y reflexiones del
grupo en torno al proceso completo.
3. Pauta de Evaluación
%
Categoría Descripción niveles de logro
logro
Muy buen Demuestra un desempeño destacado, evidenciando el logro de todos los
100%
desempeño aspectos evaluados en el indicador.
Buen Demuestra un alto desempeño del indicador, presentando pequeñas
80%
desempeño omisiones, dificultades y/o errores.
Desempeño Demuestra un desempeño competente, evidenciando el logro de los
60%
aceptable elementos básicos del indicador, pero con omisiones, dificultades o errores.
Presenta importantes omisiones, dificultades o errores en el desempeño, que
Desempeño
30% no permiten evidenciar los elementos básicos del logro del indicador, por lo que
incipiente
no puede ser considerado competente.
Desempeño no
0% Presenta ausencia o incorrecto desempeño.
logrado
Categorías de Respuesta
Ponderación
Indicador de Evaluación Muy buen Desempeño Desempeño Desempeño no Indicador de
desempeño aceptable incipiente logrado Evaluación
100% 60% 30% 0%
Selecciona y Selecciona las La elección de No realiza
justifica las herramientas, las selección de
herramientas pero no justifica herramientas no herramientas
para de acuerdo a los es la adecuada, para
Selecciona las herramientas de
procesamiento, elementos o la justificación procesamiento,
procesamiento, transformación y
transformación exigidos en el que entrega no transformación
visualización de información, 5%
y visualización caso. se condice con a fin de justificar
justificando su uso en el ámbito de
de información, el uso que se ámbito de
aplicación.
de acuerdo a los hará de las aplicación
elementos mismas.
exigidos en el
caso.
Incorpora la No aplica No aplica Solo realiza
creación, creación y/o
actualización y actualización de
Incorpora el ciclo de vida del dato
eliminación de datos, sin una
en el proceso end to end,
información estrategia de 5%
considerando requerimientos y
histórica de ciclo de vida del
práctica de gobierno de datos.
acuerdo a dato.
criterios de
negocio y