Tarea 4 Tecnología Aplicada A Los Negocios
Tarea 4 Tecnología Aplicada A Los Negocios
Tarea 4 Tecnología Aplicada A Los Negocios
(UAPA)
Asignatura:
Tecnología aplicada a los negocios
Tema:
Big data en las empresas
Facilitador:
Hilda Estrella
Participante:
Wilberto Ray Duarte
Mat. 201805267
Fecha:
02 de noviembre del 2019
Santiago de los Caballeros,
República Dominicana
INTRODUCCION
Big Data nació con el objetivo de cubrir unas necesidades no satisfechas por las
tecnologías existentes, como es el almacenamiento y tratamiento de grandes volúmenes
de datos que poseen unas características muy concretas definidas como las tres
V’s (puede haber más):
Volumen, hace referencia al tamaño de los datos que pueden provenir de múltiples
fuentes.
Velocidad, define la rapidez con que llegan los datos usando unidades como tera,
peta o exa bytes
Variedad, hablamos de datos:
o Estructurados
o Semi-estructurados
o No estructurados
Una característica importante acerca de los datos, es que son considerados como la fuente
de la verdad, es decir, no se alteran durante su tratamiento.
La tecnología subyacente en Big Data es Apache Hadoop, en la actualidad cuenta con
ocho años de historia, ¿pero qué es Hadoop?
Hadoop es un sistema operativo distribuido que permite procesar en paralelo grandes
volúmenes de datos, sobre un hardware convencional. Es un tipo de sistema operativo
especial, ya que trabaja sobre otro como Linux o Windows (utilizando la implementación de
Hortonworks). Posee las siguientes características:
Escalable, permite crear estructuras en cluster, a las que se les puede añadir
nuevos nodos fácilmente.
Flexible, se adapta a múltiples formatos de datos, puede utilizar o no esquemas
para tratar información y permite que los usuarios lo usen en diferentes niveles.
Fiable, ha sido diseñado, teniendo en cuenta que el hardware y software pueden
fallar.
Rápido y lento, es muy rápido para tratar grandes cantidades de datos, pero
puedeser lento al trabajar con poca información.
Una pregunta que siempre nos asalta al principio, ¿es si no son suficientes las bases de
datos relacionales RDBMS?, la respuesta es que hacen tareas diferentes y que una no
excluye a la otra, son complementarias.
DESARROLLO
1. Elabora una tabla Informativa acerca de las principales
características del Big Data y describa como cada una de estas,
aporta a la gestión empresarial.
Big data Características Como se aplica a la gestión empresarial
Volumen Es la cantidad de datos generados En este caso pondré el ejemplo de un financiero o
y almacenados. El tamaño – un negocio de préstamos que al momento de
cantidad– de los datos determina prestarle dinero a una persona está generando un
el valor y la perspectiva potencial. archivo diminuto, pero al globalizarlo con los otros
prestamos de ese mes son mucho y si se compara
con los datos generados con todos los datos de
esa empresa en ese mes es mucho más.
Variedad El tipo y la naturaleza de los En este caso pondré a esta el KALEL GROUP que
datos. Se produce porque los en la REP. DOM este grupo se dedica a varias
datos recopilados no pertenecen a actividades comercial como vehículos, aeronaves,
una categoría específica ni a una embarcaciones, maquinarias y equipos pesados,
fuente única, porque existen corredurías, garantías, tecnología, computación,
numerosos formatos de datos en comunicaciones y financiamientos, y realizar todas
bruto, obtenidos de la web, textos, operaciones que directamente se relacionen con
video, sonido, imágenes, tales objetos y que sirvan de medios para la
sensores, correos electrónicos, realización de los fines de la sociedad y cada una
aplicaciones, sistemas de de ellas genera diferentes tipos de archivos ya sea
información, etc. y pueden estar imágenes, video y sonidos.
estructurados o no estructurados.
Velocida En el contexto de Big Data se En este caso las empresas deben tener los datos
d refiere a la velocidad (TB/seg) a la de manera rápida y como la cantidad de usuarios
que se generan y procesan los de las empresas obtienes los datos de manera
datos para satisfacer las rápida aunque sean muchos los usuarios.
demandas y los desafíos que
requieren las empresas para su
crecimiento y desarrollo.
1. Presenta cuáles han sido tus enfoques
En este documento se relata cómo funciona la big data en una
cooperativa de argentina en este caso me enfoque en las 5 v.
En relación al Volumen. Aprendí que una compañía con mucho volumen de información
puede perder velocidad de procesamiento.
En relación al Variedad. Aprendí que no solo hay variedad en los tipos de archivos también
hay sub variedad entre los archivos.
En relación al Velocidad. Aprendí que esta característica no solo hace referencia a la
velocidad con que los datos son generados y transferidos a su lugar de almacenamiento,
sino que también se refiere a la necesidad de analizarlos y obtener información de los
mismos en plazos cortos de tiempo.
En relación al Valor. Aprendí el valor potencial de los datos, es decir, no solo aquellos
datos que fueron tomados de manera premeditada para un objetivo particular tienen valor
para la empresa, si no que los datos pueden ser utilizados en nuevos usos o necesidades
que no eran conocidas con anterioridad y así tener una incidencia similar a los tomados
con un propósito dado.
En relación al Veracidad. Aprendí que la obtención de buena calidad de información para
gestores en todos los niveles jerárquicos de una organización. Y como esta calidad afecta
las buenas decisiones de las empresas.
Mapreduce
Infraestructura como servicio (IaaS) se refiere a diversos productos que se venden como
servicios y se entregan en una red. Mientras que, con la nube, tus analistas sólo necesitan
acceso a una aplicación, un servicio basado en la web, donde están alojados todos los
recursos y programas necesarios. Una gran ventaja de tener la infraestructura en la nube
es que los costos se reducen significativamente, ya que generalmente solo pagas por lo
que usas y desde ahí puedes escalar hasta cubrir completamente tus necesidades. Es un
servicio que ofrece Amazon Web Services (AWS), Google Cloud Platform (GPC) y otras
compañías. Además, otra ventaja de la nube es que te permite saber más rápido lo que
está ocurriendo, para poder solucionarlo de manera más eficiente.
Claro que tener tus datos alojados en un servicio de terceros ocasiona que te preguntes
acerca de la seguridad. Ésta es la razón por la que muchos prefieren tener su información
confidencial en una ubicación privada y utilizan la nube para datos menos privados.
Además, es importante recordar que existen formas de elevar el nivel de seguridad de tus
datos que se encuentran en la nube.
Otra ventaja de contar con una infraestructura en la nube es que puedes utilizar servicios
de monitoreo, los cuales a través de una sola plataforma, como es el caso de inteligencia
de datos te permiten tener la información precisa que necesitas en cualquier momento, ya
que, mediante el uso de la auto-instrumentación se recolectan millones de métricas y
eventos que provienen del software, la infraestructura, los visitantes y el ecosistema
tecnológico. Al tener estos datos al alcance de la nube resulta sencillo también hacer
consultas que sean necesarias en muy poco tiempo.
5. como se relacionan estas tres palabras, las tres 'Vs' del Big Data:
Volumen, Variedad y Velocidad (3Vs).
Volumen
Variedad Velocidad
Volumen
Grandes volúmenes de datos
Muchos objetos (ejemplo: Clientes,).
Muchos atributos (ejemplo: Edad, Ingreso,).
Datos no balanceados
Velocidad
Data Streams
Llamadas telefónicas,
Transacciones bancarias,
Visitas en página web,
Variedad
Distintos tipos de datos
Textos,
Imágenes
Videos
En una red social como Facebook podemos ver la utilización de las 3 vs Big Data
Desde los comienzos, IBM y Gartner plantearon el Big Data como un modelo que abarca
tres dimensiones (volumen, velocidad y variedad) denominadas “Modelo de las tres V”.
Con las tres V es posible definir el Big Data como el conjunto de herramientas que trabajan
conjuntamente y permiten captar, almacenar y gestionar un gran volumen de información
variada a una alta velocidad, permitiendo obtener datos para la toma de decisiones.
CONCLUSIONES
La disponibilidad de Big Data, hardware de bajo costo y nuevo software de gestión y
análisis de información han producido un momento único en la historia del análisis de
datos. Estas tendencias significan que tenemos las capacidades necesarias para analizar
conjuntos de datos asombrosos de manera rápida y rentable por primera vez en la historia.
Representan un verdadero avance y una clara oportunidad de obtener enormes ganancias
en términos de eficiencia, productividad, ingresos y rentabilidad.
BIBLIOGRAFIA
Sistemas de información gerencial (7a. ed.). Libro de James A. O'Brien}
http://www.eumed.net/rev/caribe/2016/04/comercio.html
https://www.monografias.com/trabajos24/tics-empresas/tics-empresas.shtml#tipos