003 Big Data

¿Qué es Big Data?
Big Data es el concepto que engloba enormes volúmenes de datos, tanto

estructurados como no estructurados. Se trata de una cantidad de datos tan compleja
y tan grande que ninguna de las tradicionales herramientas de administración de datos
es capaz de almacenarlo ni procesarlo de forma eficiente.
Hoy en día, casi más de 7.000 millones de dispositivos comparten información por
Internet. Se estima que esta cifra se elevará hasta los 20.000 millones en 2025. En este
sentido, el Big Data se encarga de analizar este océano de datos para convertirlo en la
información que está transformando el mundo.
El concepto de Big Data también engloba las infraestructuras, tecnologías y servicios

que han sido creados para poder gestionar esta gran cantidad de información.
Historia del Big Data

Si buscamos en Google el término Big Data, encontraremos diferentes tipos de
conceptos, entre los cuales veremos de forma repetida palabras como «masivos», «gran
escala», «grandes conjuntos de datos», «enormes cantidades de datos», “Petabytes” y
“Exabytes”.
¿Sabes cuanta cantidad de información contiene un Exabyte? La respuesta es un billón

de Gigabytes. Una cantidad de datos inimaginable para nosotros como humanos, pero
no para una máquina. Las grandes compañías como Google suelen hablar de Petabytes y
Exabytes de información con mucha frecuencia, y es algo normal por la cantidad de
datos que manejan. En cambio, si rebajamos la escala y nos ponemos a hablar de pymes,
lo común sería hablar de Gigabytes y Terabytes. Es decir, de Small Data.
Las necesidades de gigantes como Google fueron incrementándose con el paso del
tiempo. En un momento dado, se tuvieron que plantear qué hacer con tanta cantidad
de datos y cómo sacar provecho de los mismos. Esto les llevó a comprender que, si
analizaban toda la información que recopilaban, podían llegar a entender mejor el
mercado y a crear estrategias personalizadas en base a esos datos con el objetivo de
satisfacer mejor las necesidades de los consumidores.
Así, toda esa información se convirtió en la nueva clave para tomar decisiones
inteligentes y acertadas minimizando riesgos. Además, lo más importante, podían
predecir el comportamiento de los consumidores y estar en el momento exacto en el que
quisieran satisfacer alguna necesidad.
¿Cómo funciona el Big Data?

El Big Data es muy complejo debido a su diversidad. Esto ha creado la necesidad de
contar con sistemas capaces de procesar sus diferencias estructurales y semánticas. Para
ello, requiere de bases de datos NoSQL especializadas que puedan almacenar los datos
de una forma que no suponga un cumplimiento estricto de un modelo en particular. Esto
proporciona la flexibilidad necesaria para analizar fuentes de información
aparentemente dispares y acabar obteniendo una visión holística de lo que está
sucediendo, cómo actuar y cuándo hacerlo.
A la hora de recoger, procesar y analizar Big Data, suele hablarse de datos operativos o
datos analíticos que se almacenan según distintos criterios.
 Los sistemas operativos gestionan grandes lotes de datos a través de múltiples

servidores e incluyen entradas como inventarios y datos de clientes o compras.
Hablamos de la información del día a día de una organización.
 Los sistemas analíticos son más sofisticados. Son capaces de procesar análisis
de datos complejos y de proporcionar información para la toma de decisiones.
Suelen integrarse en los procesos con el objetivo de maximizar la recopilación y
el uso de datos.
 ¿Para qué sirve el Big Data?
 Cada vez que entramos en una página web estamos facilitando una serie de datos
sobre nuestra actividad online. Por ejemplo, para qué utilizamos un sitio, si
somos visitantes habituales o a qué sitios accedemos y cómo lo hacemos. La
mayoría de las personas no son conscientes de la cantidad de información que
esto aporta.
 Esta enorme cantidad de datos llega mucho más allá del momento en el que
encendemos nuestros ordenadores, ya que cuando recorremos la vía pública
estamos igual de expuestos. Y es que, a través de la geolocalización de nuestras
terminales, las redes wifi o cámaras de vigilancia, cualquiera puede obtener
una jugosa base de datos que se convertirá en información útil mediante el
Big Data.
 Lejos queda ya el pensamiento de que solo estamos desprotegidos
cuando proporcionamos nuestros datos personales al completar algún
formulario o registrarnos para realizar alguna compra a través de Internet. Todo
esto es algo que quizá la mayoría de los usuarios pasa por alto y que las
empresas aprovechan, cada vez más, para conseguir nuevas oportunidades de
negocio.
 Esta nueva tecnología se ha convertido en una gran vía de negocio, ya
que permite a las empresas conocer en profundidad a sus clientes, además de
profundizar en sus necesidades y en la forma que tienen de actuar frente a los
productos y servicios.
 Todos los sectores empresariales utilizan esta nueva técnica, no solo las
empresas de comunicación y marketing, sino también sectores como la
medicina, la física o el deporte, buscando el retorno de inversión de sus
campañas. Ocurre, por ejemplo, al contar con una gran variedad de datos de
pacientes, lo que permite mejorar su calidad de vida a través de la prevención y
el control de enfermedades.
¿Por qué el Big Data es importante para las empresas?
Cualquier dispositivo que sea capaz de almacenar y procesar información es una
fuente generadora de datos. Lo que hay que hacer es organizarlos para que se conviertan
en información útil para las empresas. De forma resumida, el tipo de contenido
que resulta interesante analizar es:
Es decir, independientemente de la forma en la que se clasifiquen, podemos encontrar

datos en todas partes. En nuestros teléfonos móviles, tarjetas de crédito, aplicaciones de
software, vehículos, registros, páginas web, etc.
El Big Data es usado por la mayoría de industrias para identificar patrones y tendencias.
También para responder preguntas, detectar las necesidades del mercado, las demandas
y para obtener información sobre los clientes. Las empresas usan esta información para
mejorar sus negocios, entender las decisiones de los clientes, realizar investigaciones,
Estas empresas que han entendido qué es Big Data y para qué sirve tienen:
 Dos veces más probabilidades de obtener un rendimiento financiero superior

que la media de sus industrias.
 Cinco veces más probabilidades de tomar decisiones mucho más rápido que
sus competidores.
 Tres veces más probabilidades de ejecutar las decisiones según lo previsto.
 El doble de probabilidades de tomar decisiones basadas en datos.
Las cinco “Vs” del Big Data

El Big Data empezó como el proceso de las 3 Vs: volumen, velocidad y variedad. Sin
embargo, al ir evolucionando aparecieron otras Vs: veracidad, valor y variabilidad.
Puede ser que, cuando estés leyendo este post, incluso hayan aumentado. Es más,
cometeremos el atrevimiento de agregar una: la visión.
La mayoría de expertos definen el Big Data en términos de las cinco “Vs”:
 Volumen: la cantidad de datos que maneja.

 Velocidad: la segunda característica del Big Data está relacionada con el ritmo a
los cuales los datos se están generando, que suele aumentar constantemente y
que necesita una respuesta en tiempo real por parte de las empresas.tener la
infraestructura y los procesos necesarios para tratar los datos de forma ágil y en
el menor tiempo posible para aplicar estrategias de cambios.
 Variedad: sin embargo, el reto principal del Big Data reside en la gran
diferencia de formatos distintos en los cuales encontramos los datos y que
pueden ir desde texto sencillo, a imágenes, videos, hojas de cálculos y enteras
bases de datos. tener distintas fuentes de recopilación de datos sobre diferentes
aspectos relacionados con el negocio y los consumidores. No solo data
estructurada, sino de diferentes tipos: comportamiento, conversaciones,
afinidades, fotos, vídeos, etc.
 Veracidad: además, los datos tienen que ser confiables y han que ser
mantenidos limpios. Una gran cantidad de datos no tiene valor si son incorrectos
y puede ser altamente perjudicial, sobre todo en la toma de decisión
automatizada. cómo de acertada es la data que tenemos. A mayor volumen,
mayor es el trabajo para organizar esos datos.
 Valor: finalmente, los datos y su análisis tienen que generar un beneficio para
las empresas. sacarle un valor a la misma que ayude a tomar decisiones
acertadas.
 Variabilidad: las diferentes interpretaciones que pueden resultar en el proceso.
 Visión: el poder tener una visión clara de cómo proceder en base a los
diferentes patrones e interpretaciones de comportamiento del consumidor.
Tipos de Big Data

Para profundizar en qué es Big Data y para qué sirve, es necesario saber también
que existen distintos tipos de datos asociados a esta técnica.
A la hora de clasificar los “grandes datos” podemos hacerlo según dos criterios:
procedencia y estructura. Así, según su procedencia, los datos pueden llegar desde
distintas fuentes, entre otras:
 Web y Redes Sociales: información disponible en Internet como contenido

Web, generada por los usuarios en su actividad en las redes sociales o
información de búsquedas en buscadores.
 Machine-to-Machine (M2M): datos generados a partir de la comunicación entre
sensores inteligentes integrados en objetos de uso cotidiano.
 Transacciones: incluye registros de facturación, llamadas o transacciones entre
cuentas.
 Biométricos: datos generados por tecnología de identificación de personas
mediante reconocimiento facial, de huellas dactilares o mediante información
genética.
 Generados por personas: a través de correos electrónicos, servicios de
mensajería o grabaciones de llamadas.
 Generados por organizaciones tanto públicas como privadas: datos
relacionados con el medioambiente, estadísticas gubernamentales sobre
población y economía, historiales clínicos electrónicos, etc.
Por otro lado, según su estructura, los datos puede ser:
 Estructurados: datos que tienen definidos su formato, tamaño y longitud, como

las base de datos relacionales o Data Warehouse.
 Semiestructurados: datos almacenados según una cierta estructura flexible y
con metadatos definidos, como XML y HTML, JSON, y las hojas de cálculo
(CSV, Excel).
 No estructurados: datos sin formato específico, como ficheros de texto (Word,
PDF, correos electrónicos) o contenido multimedia (audio, vídeo, o imágenes).
Herramientas para poner en práctica lo que es Big
Data y para qué sirve en las empresas
Big Data necesita nuevas herramientas y tecnologías que puedan abarcar la complejidad
de datos no estructurados y en continua expansión. Para ello, las tecnologías
tradicionales de base de datos relacionales o RDBMS, no son adecuadas. Además, se
necesitan aplicaciones avanzadas de análisis y visualización, para poder extraer todo el
potencial de los datos y explotarlo para nuestros objetivos de negocio.
Así, luego de entender qué es Big Data y para qué sirve, veamos algunas de sus
principales herramientas:
 Hadoop: es una herramienta de código abierto que nos permite tanto gestionar
los grandes volúmenes de datos, como analizarlos y procesarlos. Hadoop
implementa MapReduce, un modelo de programación que da soporte a la
computación paralela sobre grandes colecciones de datos.
 NoSQL: se trata de sistemas que no utilizan SQL como lenguaje de consultas, lo
que, a pesar de no poder garantizar la integridad de los datos (principios ACID:
atomicidad, consistencia, integridad y durabilidad), les permite obtener
ganancias significativas en escalabilidad y rendimiento a la hora de trabajar con
Big Data. Una de las bases de datos NoSQL más populares es MongoDB.
 Spark: es un framework de computación en clúster de código abierto que
permite procesar los datos de forma rápida. Permite escribir aplicaciones en
Java, Scala, Python, R y SQL y funciona tanto sobre Hadoop, Apache Mesos,
Kubernetes, como de forma independiente o en la nube. Puede acceder a
centenares de fuentes de datos.
 Storm: es un sistema de computación en tiempo real distribuido de código libre.
Storm permite procesar flujos ilimitados de datos en tiempo real de manera
sencilla, pudiendo usarse con cualquier lenguaje de programación.
 Hive: es una infraestructura de Data Warehouse construida sobre Hadoop.
Facilita la lectura, escritura y administración de grandes conjuntos de datos que
residen en almacenamiento distribuido mediante SQL.
 R: es uno de los lenguajes de programación más utilizados en análisis
estadísticos y en minería de datos . Puede integrarse con distintas bases de datos
y permite generar gráficos con alta calidad.
 D3.js: es una biblioteca de JavaScript para producir visualizaciones dinámicas e
interactivas de datos en navegadores web, usando HTML, SVG y CSS.
Ventajas del uso del Big Data
Como hemos comentado en el punto anterior, el Big Data es enormemente beneficioso
si se usa correctamente. Las organizaciones pueden aprovechar toda la información que
se les brinda para mejorar la toma de decisiones, ser más eficientes y optimizar los
costes, así como segmentar a los clientes y conseguir nuevas fuentes de ingreso.
Además:
 Incrementa la productividad y la eficiencia, ya que las herramientas procesan

los datos de forma más rápida y facilita a los empleados su trabajo.
 Te da la oportunidad de mejorar la toma de decisiones, ya que nos proporciona
una base más informada y confiable.
 Reduce los costes, ya que el aumento de la productividad puede suponer
grandes ahorros en costes e impactar positivamente en la rentabilidad.
 Facilita la detección de fraudes y anomalías, ya que detectan transacciones
erróneas o problemas en las actividades.
 Mayor agilidad y velocidad de comercialización.
 Mejora la atención al consumidor y la experiencia del usuario, ya que
tenemos más información sobre lo que les gusta y lo que no.
Ejemplos reales de qué es Big Data y para qué sirve

Para entender de modo práctico qué es Big Data y para qué sirve, veamos algunos
ejemplos reales de su uso:
1. Marketing: segmentación de clientes. Muchas empresas usan datos

masivos para adaptar sus productos y servicios a las necesidades de sus clientes,
optimizar operaciones e infraestructuras, y encontrar nuevos campos de negocio.
2. Deportes: optimización del rendimiento. Dispositivos como los smart
watches registran automáticamente datos como el consumo de calorías o los
niveles de acondicionamiento físico.
3. Salud pública: codificación de material genético. Por ejemplo, existen
plataformas de análisis del Big Data que se dedican a descodificar cadenas de
ADN para comprender mejor las enfermedades y encontrar nuevos tratamientos.
4. Nuevas tecnologías: desarrollo de dispositivos autónomos. El análisis de
datos masivos puede contribuir a mejorar máquinas y dispositivos, y hacerlos
más autónomos. Un ejemplo son los coches inteligentes.
5. Seguridad: detección y prevención de crímenes. Los cuerpos de seguridad
usan el Big Data para localizar a criminales o prevenir actividades delictivas
como los ataques cibernéticos.
La plataforma de servicio de suscripción de vídeo bajo demanda Netflix es una de

las empresas que más partido le saca al Big Data. La empresa monitoriza el número
de reproducciones que hace cada uno de sus usuarios y analiza sus valoraciones, el
soporte que usan (desde dónde acceden a sus contenidos), su ubicación geográfica o el
día y hora del visionado. Con toda esta información construye un perfil completo de sus
suscriptores. Otros ejemplos del uso de Big Data son:
 Descubrir los hábitos de compra de los consumidores
 Ofrecer un marketing personalizado
 Herramientas de optimización del combustible para la industria del transporte
 Monitorización de las condiciones de salud a través de datos
 Mapas de carreteras en vivo para vehículos autónomos
 Planes de salud personalizados para pacientes con cáncer
 Orden de inventario predictivo
 Protocolos de ciberseguridad y monitorización de datos en tiempo real

003 Big Data

Cargado por

Copyright:

Formatos disponibles

003 Big Data

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

003 Big Data

Cargado por

Copyright:

Formatos disponibles

¿Qué es Big Data?

Big Data es el concepto que engloba enormes volúmenes de datos, tanto

El concepto de Big Data también engloba las infraestructuras, tecnologías y servicios

Historia del Big Data

¿Sabes cuanta cantidad de información contiene un Exabyte? La respuesta es un billón

¿Cómo funciona el Big Data?

 Los sistemas operativos gestionan grandes lotes de datos a través de múltiples

Es decir, independientemente de la forma en la que se clasifiquen, podemos encontrar

 Dos veces más probabilidades de obtener un rendimiento financiero superior

Las cinco “Vs” del Big Data

La mayoría de expertos definen el Big Data en términos de las cinco “Vs”:

 Volumen: la cantidad de datos que maneja.

Tipos de Big Data

 Web y Redes Sociales: información disponible en Internet como contenido

Por otro lado, según su estructura, los datos puede ser:

 Estructurados: datos que tienen definidos su formato, tamaño y longitud, como

 Incrementa la productividad y la eficiencia, ya que las herramientas procesan

Ejemplos reales de qué es Big Data y para qué sirve

1. Marketing: segmentación de clientes. Muchas empresas usan datos

La plataforma de servicio de suscripción de vídeo bajo demanda Netflix es una de

También podría gustarte