Ciclo de Vida de Proyectos de Big Data

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

Instituto Tecnológico De Las Americas

Nombres:
Agueda Altagracia
Apellidos:
Caceres Dilone
Matricula:
2019-8520
Docente:
Amaurys Vargas
Asignatura:
Electiva 1
Instituto Tecnológico De Las Americas

Regresiones y extensiones lineales y no lineales clásicas

• Elementos del Ciclo de Vida

Fases Big Data Dadas las características del Big Data: volumen, velocidad y variedad; requieren
un tipo de recogida y análisis diferente a cualquier otro tipo de datos.
El análisis del Big Data presenta un gran desafío, no sólo por la gestión de una gran cantidad de
datos sino por la necesidad de conocer el ciclo de vida de los datos y establecer una base
basada en la naturaleza del Big Data.
Big Data: análisis
En lo relacionado al ciclo de vida de los datos hay que tener en cuenta cómo se usa la
información y la agilidad con la que se procesa el Big Data.
En un entorno tradicional, la recogida, almacenamiento y transformación de datos requieren un
gran esfuerzo para garantizar la calidad de los mismos. Contrario es lo que ocurre con el Big
Data, cuyo volumen y esfuerzo permite trabajar con grandes cantidades de información a un
coste reducido.
La problemática del Big Data radica en dotar a los datos de un significado lógico y comprensible
a raíz de un conjunto amplío, efímero y desorganizado. Es por ello, que establecer un ciclo de
vida de datos permite controlar y normalizar los procesos de recogida, análisis y transformación
del Big Data.

Las fases del ciclo de vida del Big Data


Las fases del Big Data son las siguientes:
1. Análisis interno
2. Recogida y filtrado de datos
3. Extracción de datos
4. Validación y limpieza de los datos
5. Análisis de los datos
6. Visualización de los datos

Análisis interno
El Ciclo de vida del Big Dara debe comenzar con la comprensión del negocio y una justificación
de la necesidad de llevar a cabo un análisis de este tipo, así como el establecimiento de los
objetivos que se desean alcanzar. Esta etapa de análisis permite comprender la situación actual
de la empresa y qué recursos serán requeridos a lo largo del análisis.

• Metodologías para proyectos de Ciencia de Datos


Instituto Tecnológico De Las Americas
Una metodología de ciencia de datos de 10 etapas que abarca tecnologías y enfoques A medida
que las capacidades de analítica de datos se vuelven más accesibles y prevalentes, los científicos
de datos necesitan una metodología fundamental capaz de proporcionar una estrategia de
orientación, que sea independiente de las tecnologías, los volúmenes de datos o los enfoques
involucrados.
Esta metodología tiene algunas similitudes con las metodologías reconocidas 1-5 para la
minería de datos, pero pone el énfasis en varias de las nuevas prácticas en la ciencia de datos,
como el uso de grandes volúmenes de datos, la incorporación de la analítica de texto en el
modelado predictivo y la automatización de algunos procesos. La metodología consta de 10
etapas que forman un proceso iterativo para el uso de datos para descubrir insights. Cada etapa
juega un papel vital en el contexto de la metodología general.

Etapa 1: Comprensión del negocio Todos los proyectos comienzan con la comprensión del
negocio. Los promotores de negocios que necesitan la solución analítica desempeñan el papel
más importante en esta etapa, al definir el problema, los objetivos del proyecto y los requisitos
de la solución desde una perspectiva empresarial. Esta primera etapa sienta las bases para que
el problema empresarial sea resuelto con éxito. Para ayudar a garantizar el éxito del proyecto,
los promotores deben participar mientras dure el proyecto para proporcionar experiencia en el
dominio, revisar los hallazgos intermedios y garantizar que el trabajo siga su curso para generar
la solución deseada.

• Evaluación del tema -Recolección

Para determinar si nos encontramos en el camino correcto, debemos preguntarnos en


qué medida el Big Data respalda y habilita las necesidades del proyecto o la evaluación.
Se deberá alinear la necesidad de trabajar con Big Data con los objetivos específicos del
proyecto o la evaluación. Algunas actividades previas incluyen entender cómo filtrar los
registros web para comprender el comportamiento del comercio electrónico, extraer el
sentimiento de las redes sociales, de las interacciones de atención al cliente, así como
entender los métodos de correlación estadística.
Gestión y Almacenamiento
Lo primero que se debe hacer es almacenar los datos. Su solución de almacenamiento
puede residir en la nube, on premise o ambas. La nube es la forma que más está
aumentando.
Análisis: Manipulación, limpieza, transformación de datos
Una vez localizados y clasificados existen técnicas y programas específicos que ayudan a
organizarlos y analizarlos, ya que los datos poseen un valor intrínseco que no tendrá
utilidad hasta que dicho valor se descubra. Los modelos y procesos analíticos de Big
Data pueden ser tanto humanos como automáticos. Las capacidades de análisis de Big
Data incluyen estadísticas, análisis especiales, semántica, detección interactiva y
Instituto Tecnológico De Las Americas

visualización. Mediante el uso de modelos analíticos, puede relacionar distintos tipos y


fuentes de datos para realizar asociaciones y hallazgos significativos.

También podría gustarte