Actividades Del Ingeniero en Tu Especialidad
Actividades Del Ingeniero en Tu Especialidad
Actividades Del Ingeniero en Tu Especialidad
MATERIA
FUNDAMENTOS DE LA INVESTIGACION
UNIDAD 3
INVESTIGACION DOCUMENTAL
“HERRAMIENTAS BASICAS DEL INGENIERO EN TU
ESPECIALIDAD.”
ESTUDIANTE
Estrada Artezán Guillermo Manuel
CATEDRATICA
M.ED. MARIA DEL CARMEN MARTINEZ DE LA ROSA
Hadoop
Es un marco capaz de almacenar grandes cantidades de
datos mediante la ejecución de código distribuido en
diferentes nodos. La principal ventaja de Hadoop es su
capacidad para realizar procesamiento de datos
distribuidos, lo que permite una escalabilidad
significativa.
Apache Spark
Es un marco para el procesamiento de datos. Su principal ventaja es la
arquitectura distribuida, es decir, el procesamiento de datos se delega a los
distintos hardware del sistema que lo implementa, lo que logra tiempos de
respuesta muy bajos
Se puede desarrollar código en Apache Spark en
múltiples lenguajes de programación, tales como Java,
R, Python, etc. En los últimos años ha desplazado a
Hadoop como la opción preferente para el
procesamiento del Big Data.
Apache Storm
Es un sistema distribuido para el procesamiento
en tiempo real de flujos de datos provenientes de
una fuente en particular (sensores de Internet de
las cosas, redes sociales, etc.) y convertirlos en
información que puede ser monitoreada. y
análisis al momento.
MongoDB
Es una base de datos NoSQL para almacenar
datos. Su uso es muy popular porque permite
almacenar datos de una manera que no se
basa en registros (tablas), sino en formato
BSON, que es un binario JSON (orientado a
documentos).
Las principales características de esta base de datos son la replicación de datos
en diferentes nodos y la división de estos datos en secciones más pequeñas de la
base de datos principal, y la distribución de información entre ellos. Ambas
características proporcionan a los sistemas que utilizan Mongo DB una alta
escalabilidad horizontal.
Lenguaje Python
Es un lenguaje de programación interpretado
de alto nivel con el que es fácil desarrollar
código, y es utilizado principalmente por
profesionales de cualquier campo (no
necesariamente conocedores de TI), que
necesitan desarrollar análisis de datos.
También tiene una gran colección de bibliotecas creadas por la comunidad que lo
apoya, lo que le permite crecer. El punto negativo más destacable es que su
tiempo de ejecución no es tan rápido como el de otros lenguajes utilizados para tal
fin. Estas herramientas, que se imparten en el Master of Volumes / Big Data
Visualization and Analysis de UNIR, ayudan a procesar, analizar y almacenar
datos que pueden ser útiles para las empresas, como aumentar sus ventas o
conocer mejor a sus clientes.
Lenguaje R
Es un lenguaje de programación muy parecido al
matemático y el entorno que lo soporta se emplea
para realizar principalmente cálculos estadísticos e
implementar visualizaciones de la información
obtenida al procesar los datos.
El lenguaje R y su entorno son de los más utilizados
para la minería de datos, procesar datos financieros…Dispone de una gran
colección de librerías creada por la comunidad que lo sustenta, lo que facilita el
desarrollo con él. Su principal desventaja es que al ser un lenguaje “matemático”
es más complicado de entender para desarrolladores no familiarizados con este
lenguaje.
BIBLIOGRAFIAS.
https://www.unir.net/ingenieria/revista/herramientas-big-data/