Impacto organizacionalBIG

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

Machine Translated by Google

4 Organizativo
Impacto de los grandes datos

Uno detransformación
los impactosnecesaria
más significativos
para apoyardel big data
y explotar es el cambio
la oportunidad delorganizacional o
big data. Será necesario
redefinir los viejos roles e introducir otros nuevos, lo que creará oportunidades y ansiedad tanto para
las personas como para las organizaciones. El propósito de este capítulo es resaltar el alcance
probable de estos cambios organizacionales y preparar a los profesionales existentes del almacén
de datos y de la inteligencia empresarial para las nuevas oportunidades profesionales que se les
presentan.

La inteligencia empresarial (BI) y la ciencia de datos (que incluyen estadísticas


avanzadas, análisis predictivos, ingeniería de datos, programación y visualización de
datos) tienen funciones muy diferentes y requieren habilidades y enfoques diferentes.
Uno no reemplaza al otro. De hecho, los dos se complementan mucho, uno
aprovecha las fortalezas y el enfoque del otro. Tradicionalmente, BI se ha centrado
en comprender los procesos comerciales clave a un nivel suficientemente detallado
para que se puedan crear métricas, informes, paneles, alertas y algunos análisis
básicos (tendencias, comparaciones) que respalden esos procesos comerciales
clave. Para respaldar estos procesos comerciales clave, el analista de BI ha pasado
por el proceso de capturar los roles, responsabilidades y expectativas de los usuarios
comerciales, identificando indicadores clave de desempeño contra los cuales se
medirá el desempeño de esos procesos comerciales, y capturar, agregar, alinear,
limpiar y poner a disposición los datos (en los niveles necesarios de granularidad y
frecuencia) para respaldar el seguimiento de esos procesos de negocio. La
comprensión de estos procesos de negocio es el punto de conexión entre los mundos de BI y ciencia d
La Figura 4­1 y la Tabla 4­1 presentan presentaciones visuales útiles de los mundos
complementarios de BI y ciencia de datos. Por lo general, se piensa que la BI es
retrospectiva: proporciona una visión retrovisora del negocio, enfocándose en lo que
sucedió y por qué (en retrospectiva). Por lo general, se piensa que la ciencia de datos
es una visión de futuro: proporciona una visión panorámica del negocio, predice lo que
va a suceder (previsión) y descubre pepitas ocultas enterradas en los vastos volúmenes de información.
Machine Translated by Google

38 Capítulo 4

datos estructurados y no estructurados (insights). Sin embargo, muchas implementaciones


de BI incluyen algunos análisis analíticos básicos, como análisis de series de tiempo,
comparaciones con períodos anteriores y modelos de "qué pasaría si", para ayudar a la
empresa a tomar decisiones prospectivas como: ¿Qué precio debo cobrar? ¿A qué
clientes debería dirigirme? ¿Cuántos empleados voy a necesitar?

Alto

Datos
Ciencia
NEGOCIO
VALOR

Negocio
Inteligencia

Bajo
Pasado Futuro
TIEMPO

Figura 4­1: Evolución del proceso analítico

Tabla 4­1: Inteligencia empresarial versus ciencia de datos

Técnicas típicas y tipos de datos Preguntas comunes

Inteligencia de Negocio

Informes estándar y ad hoc, paneles de control, ¿Qué pasó el último trimestre?


alertas, consultas, detalles bajo demanda, análisis ¿Cuántos vendimos?
estadístico básico.
¿Dónde está el problema? ¿En qué situaciones
Datos estructurados, fuentes tradicionales, conjuntos
ocurre el problema?
de datos manejables

Ciencia de los datos

Optimización, modelado predictivo, pronóstico, Y si…?


recomendaciones, análisis estadístico avanzado. ¿Cuál es el escenario óptimo para nuestro
negocio?
Datos estructurados/no estructurados, cualquier tipo de ¿Qué pasará después? ¿Qué pasa si
fuente, conjuntos de datos muy grandes estas tendencias continúan? ¿Por qué está
pasando esto?
Machine Translated by Google

Impacto organizacional de Big Data 39

Una de las mayores diferencias entre el analista de BI y el científico de datos es el entorno en el


que trabajan. Los especialistas en BI tienden a trabajar dentro de un entorno de almacén de datos
altamente estructurado. Un entorno de almacén de datos suele estar impulsado por la producción,
con acuerdos de nivel de servicio (SLA) altamente administrados para garantizar la generación
oportuna de informes y paneles de administración. Se necesita un gran esfuerzo para agregar una
nueva fuente de datos (a menudo este esfuerzo se mide en meses) o para obtener la aprobación
para mantener datos más granulares y/o más historial en el almacén de datos.

El científico de datos, sin embargo, crea una “caja de arena” analítica separada en la que cargar
todos los datos que pueda conseguir (fuentes de datos tanto internas como externas) y en cualquier
nivel de granularidad e historial que necesite. Una vez dentro de este entorno, el científico de datos
es libre de hacer con él lo que desee (por ejemplo, elaboración de perfiles de datos, transformaciones
de datos, creación de nuevas métricas compuestas y desarrollo, prueba y refinamiento de modelos
analíticos). El científico de datos necesita un entorno donde pueda explorar fácilmente los datos sin
preocuparse por afectar el rendimiento del almacén de datos de producción y los sistemas de BI que
generan los informes y paneles de gestión. La Tabla 4­2 presenta un resumen claro de los tipos de
trabajo inherentemente diferentes que realiza el analista de BI versus el tipo de trabajo que realiza
el científico de datos.

Tabla 4­2: Responsabilidades del analista de BI versus el científico de datos

Área Analista de BI científico de datos

Enfocar Informes, KPI, tendencias Patrones, correlaciones, modelos.

Proceso Estático, comparativo Exploratorio, experimentación, visual.

Fuentes de datos Planificado previamente, agregado lentamente Elegido sobre la marcha, bajo demanda

Transformación ELT inicial, cuidadosamente planificado, bajo demanda, en base de datos,


enriquecimiento

Calidad de datos Versión única de la verdad. Tolerante con lo “suficientemente


bueno”; probabilidades

Modelo de datos Lógico/relacional/formal Conceptual/semántico/informal

Resultados Informar lo sucedido Predice lo que sucederá

Análisis Comprensión retrospectiva Pronóstico, previsión, conocimiento


Machine Translated by Google

40 Capítulo 4

Ciclo de vida del análisis de datos


Las organizaciones de big data exitosas descubren y publican continuamente nuevos conocimientos sobre
clientes, productos, operaciones y mercados sobre el negocio. En consecuencia, estas organizaciones
necesitan desarrollar un proceso integral que no sólo defina cómo se descubrirán y publicarán estos
conocimientos, sino que también defina claramente los roles, responsabilidades y expectativas de todas
las partes interesadas clave, incluidos los usuarios comerciales, los administradores del almacén de datos,
Analistas de BI y científicos de datos. Utilicemos el ciclo de vida del análisis para comprender cómo
colaboran estas diferentes partes interesadas (consulte la Figura 4­2).

1) Usuario empresarial
Define mandato
2) Almacén de datos
y requisitos
Gerente
Adquiere e integra
1
datos

5) Usuario empresarial 2
Consume conocimientos
y medidas Llave
eficacia 5 Negocio
Procesos

3) Científico de datos

4) Analista de BI Construye y refina


Publica nuevo 3 modelos analíticos

perspectivas
4

Figura 4­2: El ciclo de vida del análisis

Este diagrama de flujo destaca las responsabilidades clave de cada actor principal:

■ El usuario empresarial (que también incluye al analista empresarial) es responsable de definir sus
procesos empresariales clave e identificar las métricas y los indicadores clave de rendimiento
con los que se medirán esos procesos empresariales. Los usuarios empresariales son los que
entienden qué preguntas intentan responder y qué decisiones intentan tomar. Los usuarios
empresariales son los que intentan aprovechar los datos y los conocimientos disponibles para
responder esas preguntas y tomar esas decisiones.

■ El administrador del almacén de datos (o DBA en algunos casos) es responsable de definir,


desarrollar y administrar la plataforma de datos. Las herramientas tradicionales elegidas por esta
parte interesada han sido históricamente los almacenes de datos, los mercados de datos y los
almacenes de datos operativos. Sin embargo, las nuevas innovaciones tecnológicas están permitiendo que
Machine Translated by Google

Impacto organizacional de Big Data 41

gerente de almacén de datos para ampliar su rol considerando nuevas tecnologías como
Hadoop, computación en memoria y federación de datos. Estas nuevas plataformas de
datos admiten datos estructurados y no estructurados y brindan acceso a datos ubicados
tanto dentro de la organización como a fuentes de datos seleccionadas que existen fuera
de las cuatro paredes de la organización. Estas modernas plataformas de datos también
admiten la capacidad de ingerir y analizar fuentes de datos en tiempo real y permitir la
"alimentación lenta" de datos en la plataforma de datos.
■ El científico de datos es responsable de extraer los datos de la organización (datos
estructurados y no estructurados que son tanto internos como externos a la organización)
para descubrir nuevos conocimientos sobre el negocio. Los científicos de datos son
acumuladores de datos que buscan nuevas fuentes de datos que puedan alimentar los
conocimientos analíticos que impulsan los procesos comerciales clave de la organización.
El científico de datos necesita un entorno de trabajo (zona de pruebas analítica) donde
tenga libertad para almacenar, transformar, enriquecer, integrar, interrogar y visualizar los
datos en busca de relaciones e ideas valiosas ocultas en las diferentes fuentes de datos.
El científico de datos necesita un entorno que le permita crear, probar y refinar modelos
de datos rápidamente (medidos en minutos y horas, no en días y semanas) y que adopte
el enfoque de “tiempos de fallo suficientes” que le da al científico de datos confianza en la
calidad de los modelos analíticos. “Fallar suficientes veces” se refiere al punto en el
proceso de desarrollo y prueba del modelo analítico en el que el científico de datos ha
“fallado” suficientes veces al probar otras variables y algoritmos como para sentirse
confiado de que el modelo resultante es el mejor modelo analítico.

■ El analista de BI es responsable de identificar, gestionar, presentar y publicar las métricas


clave y los indicadores clave de rendimiento con los que los usuarios empresariales
supervisarán y medirán el éxito empresarial. Los analistas de BI desarrollan los informes
y paneles que los usuarios comerciales utilizan para administrar el negocio y proporcionan
el "canal" para publicar conocimientos analíticos a través de esos informes y paneles para
los usuarios comerciales. Aquí es donde la visión empresarial predictiva en tiempo real se
hace realidad.
■ Y, por último, el proceso analítico regresa a los usuarios empresariales que utilizan los
informes, paneles y conocimientos analíticos resultantes para gestionar su negocio. Son
los usuarios de negocio y la eficacia de las decisiones que toman quienes, en última
instancia, determinan la eficacia del trabajo realizado por el administrador del almacén
de datos, el científico de datos y el analista de BI. Finalmente, los resultados de las
decisiones que toman los usuarios comerciales se pueden capturar y utilizar para impulsar
la siguiente iteración del ciclo de vida analítico.

La naturaleza exacta de los roles, responsabilidades y expectativas de estas diferentes partes


interesadas variará de una organización a otra, e incluso de un proyecto a otro.
Machine Translated by Google

42 Capítulo 4

proyecto. Algunos usuarios empresariales pueden sentirse más cómodos con las estadísticas y el análisis
predictivo y pueden intentar realizar parte del trabajo analítico ellos mismos. Lo mismo ocurre con los
analistas de BI que buscan ampliar sus habilidades con análisis avanzados y habilidades de visualización
de datos.

Cabe señalar que las funciones y responsabilidades de cada parte interesada se centran en procesos
comerciales clave específicos. Es muy posible que los roles y responsabilidades cambien para cada
proceso de negocio clave, dependiendo de las habilidades, capacidades y áreas de interés de las
diferentes partes interesadas. Por lo tanto, vea este ciclo de vida analítico más como un marco para
proporcionar cierto nivel de orientación para la colaboración organizacional, en lugar de un conjunto fijo
de roles y responsabilidades que ignora las habilidades e intereses individuales de las diferentes partes
interesadas.

Funciones y responsabilidades del científico de datos


Nuestro siguiente paso es profundizar más en las funciones y responsabilidades específicas del científico
de datos. El ciclo de vida del científico de datos que se muestra en la Figura 4­3 proporciona una
descripción general de alto nivel del proceso de descubrimiento y análisis del científico de datos. Destaca
la naturaleza altamente iterativa del trabajo del científico de datos, donde muchos de los pasos se repiten
para garantizar que el científico de datos esté utilizando el modelo analítico "correcto" para encontrar los
conocimientos "correctos". Echemos un vistazo a las tareas y habilidades específicas necesarias para
cada uno de los pasos del ciclo de vida del científico de datos.

¿Tengo suficiente?
1 información para
redactar una analítica
Descubrimiento
¿plan?

6 2 Tengo
suficiente
Operacionalizar Preparación de datos
“buenos” datos
para comenzar

construyendo el
5 3 ¿modelo?
Comunicar Modelo
Resultados Planificación

4
¿Es el modelo robusto? Modelo ¿Tengo una buena idea?

¿suficiente? Hemos sobre el tipo de modelo a


Edificio
¿Falló lo suficiente? ¿intentar? ¿Puedo refinar el
plan analítico?

Figura 4­3: El ciclo de vida del científico de datos


Machine Translated by Google

Impacto organizacional de Big Data 43

Descubrimiento

Discovery se centra en las siguientes actividades de los científicos de datos:

■ Obtener una comprensión detallada del proceso empresarial y del dominio empresarial. Esto incluye
identificar las métricas clave y los indicadores clave de rendimiento con los que los usuarios
empresariales medirán el éxito.
■ Capturar las preguntas y decisiones comerciales más importantes que los usuarios comerciales
intentan responder para respaldar el proceso comercial objetivo. Esto también debe incluir la
frecuencia y oportunidad óptima de esas respuestas y decisiones.

■ Evaluar los recursos disponibles (por ejemplo, habilidades de las personas, herramientas analíticas y
de gestión de datos, y fuentes de datos) y seguir el proceso de formular el problema empresarial
como una hipótesis analítica. Esta es también la etapa en la que el científico de datos elabora el
plan inicial de desarrollo de análisis que se utilizará para guiar y documentar los modelos y
conocimientos analíticos resultantes.

Cabe señalar que comprender en qué entornos operativos o de producción deben publicarse los
conocimientos analíticos es algo que debe identificarse en el plan de desarrollo analítico. Esta información
será fundamental a medida que el científico de datos identifique en el plan dónde “operacionalizar” los
conocimientos y modelos analíticos.

Esta es una oportunidad ideal para una estrecha colaboración con el analista de BI, quien probablemente
ya haya definido las métricas y los procesos necesarios para respaldar la iniciativa empresarial. El analista
de BI tendrá una buena comprensión del entorno de toma de decisiones de los usuarios comerciales y de
los requisitos que pueden impulsar el plan de desarrollo de análisis del científico de datos.

Preparación de datos

La preparación de datos se centra en las siguientes actividades del científico de datos:

■ Aprovisionar un espacio de trabajo analítico, o un espacio aislado analítico, donde el científico de


datos pueda trabajar sin las limitaciones de un entorno de almacén de datos de producción.
Idealmente, el entorno analítico está configurado de manera que el científico de datos pueda
autoproporcionarse tanto espacio de datos y potencia analítica como sea necesario y pueda ajustar
esos requisitos a lo largo del proceso de análisis.
■ Adquirir, limpiar, alinear y analizar los datos. Esto incluye el uso de técnicas y herramientas de
visualización de datos para comprenderlos, identificar (y eliminar, según sea necesario) valores
atípicos en los datos y evaluar las lagunas en los datos para determinar la calidad general de los
datos; determinar si los datos son “suficientemente buenos”.
Machine Translated by Google

44 Capítulo 4

■ Transformar y enriquecer los datos. El científico de datos buscará utilizar técnicas analíticas,
como transformaciones logarítmicas y wavelets, para abordar posibles sesgos en los datos.
El científico de datos también buscará utilizar técnicas de enriquecimiento de datos para
crear nuevas métricas compuestas, como frecuencia (¿con qué frecuencia?), actualidad
(¿qué tan reciente?) y secuenciación (¿en qué orden?). El científico de datos hará uso de
herramientas estándar como SQL y Java, así como herramientas comerciales y de código
abierto de extracción, transformación y carga (ETL) para transformar los datos.

Al final de este paso, el científico de datos debe sentirse lo suficientemente cómodo con la calidad y riqueza
de los datos para avanzar a la siguiente etapa del proceso de desarrollo analítico.

Hay varias oportunidades para que el científico de datos colabore con el equipo del almacén de datos,
especialmente el equipo de ETL, para comprender qué herramientas de transformación y ETL ya se están
utilizando y disponibles, y qué códigos o algoritmos de transformación ya se han escrito.

Planificación modelo

La planificación del modelo se centra en las siguientes actividades:

■ Determinar los diferentes modelos, métodos, técnicas y flujos de trabajo analíticos a explorar
como parte del desarrollo del modelo analítico. Es posible que el científico de datos ya crea
que sabe qué modelos y técnicas analíticos son los más apropiados, pero siempre es una
buena idea tener un plan para probar al menos uno más para garantizar que no se pierda la
oportunidad de construir un modelo más predictivo.
■ Determinar la correlación y colinealidad entre variables para seleccionar variables clave que
se utilizarán en el desarrollo del modelo. En la medida de lo posible, el científico de datos
quiere cuantificar las variables de causa y efecto. El científico de datos tendrá que utilizar
el criterio práctico, y esta puede incluso ser una buena oportunidad para volver a interactuar
con el analista de BI y los usuarios de negocio para garantizar que las variables que se
seleccionan “tengan sentido”. Recuerde, la correlación no garantiza la causalidad, por lo
que se debe tener cuidado al seleccionar variables que no sólo tengan sentido, sino que
también sean variables que puedan medirse en el futuro.

Construcción del modelo

La construcción de modelos se centra en las siguientes actividades:

■ Masajear los conjuntos de datos para pruebas, capacitación y producción. Es posible que sea
necesario probar nuevas técnicas de transformación para ver si se pueden mejorar la
calidad, la confiabilidad y las capacidades predictivas de los datos.
Machine Translated by Google

Impacto organizacional de Big Data 45

■ Evaluar la viabilidad y fiabilidad de los datos a utilizar en los modelos predictivos.


Habrá que tomar decisiones sobre la calidad y confiabilidad de los datos: si los datos son “lo
suficientemente buenos” para ser utilizados en el desarrollo de modelos analíticos. Nuevamente,
es posible que sea necesario probar diferentes técnicas de transformación para ver si se puede
mejorar la calidad de los datos.
■ Finalmente, desarrollar, probar y perfeccionar los modelos analíticos. Se realizan
pruebas para ver qué variables y modelos analíticos ofrecen la información
analítica más predictiva, procesable y de mayor calidad.

Este es un paso altamente iterativo en el que se afinarán varias veces el masaje de los datos, la
evaluación de su confiabilidad y la determinación de la calidad y los poderes predictivos del modelo
analítico. Y este no es un proceso lineal. El científico de datos fracasará varias veces al probar diferentes
variables y técnicas de modelado antes de decidirse por la “correcta”. Este es el “arte” del proceso de
desarrollo del modelo analítico donde el científico de datos, como artesano, está “jugando” con los
datos para ver qué capacidades predictivas se pueden extraer de los datos y del modelo analítico.

¡Esta es la etapa divertida!

Comunicar resultados
El paso de comunicar resultados es donde el científico de datos se centra en las siguientes actividades:

■ Determinar la calidad y confiabilidad del modelo analítico y la importancia


estadística, mensurabilidad y aplicabilidad de los conocimientos analíticos resultantes.
El científico de datos debe asegurarse de que el proceso y el modelo analítico hayan sido
exitosos y hayan logrado los objetivos analíticos deseados del proyecto.
■ Desarrollar cuadros y gráficos para comunicar las ideas, los resultados y las
recomendaciones del modelo analítico. Es fundamental que las partes interesadas
del negocio (los usuarios del negocio, los analistas del negocio y los analistas de BI)
comprender y “aceptar” los conocimientos analíticos resultantes. Si las partes interesadas del
negocio no tienen confianza en los resultados, entonces su trabajo habrá sido en vano.

Los analistas de BI son aliados naturales en esta parte del ciclo de vida de la ciencia de datos.
Los analistas de BI tienen un conocimiento sólido de qué presentar a sus usuarios comerciales y cómo
presentarlo. Entienden el entorno de trabajo de los usuarios empresariales y las herramientas de
presentación, los informes operativos actuales y los paneles de gestión en los que es probable que se
publiquen los resultados analíticos. Los analistas de BI pueden ayudar a garantizar que los análisis
resultantes se presenten de una manera o formato procesable para las partes interesadas del negocio.
Machine Translated by Google

46 Capítulo 4

Operacionalizar

El paso de operacionalización es donde el científico de datos se centra en las siguientes actividades:

■ Entregar las recomendaciones finales, informes, sesiones informativas, código y


documentos.

■ Opcionalmente, ejecutar un laboratorio piloto o analítico para verificar el caso de negocio y el retorno
financiero de la inversión (ROI) y el impulso analítico.
■ Implementar los modelos analíticos en los entornos productivos y operativos. Esto implica trabajar
con los equipos de aplicación y producción para determinar la mejor manera de sacar a la luz los
resultados y los conocimientos analíticos. Los equipos de aplicación y producción pueden ayudar
a determinar cómo “producir” los modelos analíticos para que se ejecuten de forma regular y
programada, algo que debería haberse cubierto en el plan de desarrollo de análisis.

■ Integrar puntuaciones analíticas en paneles de gestión y sistemas de informes operativos, como


centros de llamadas, sistemas de ventas, sistemas de adquisiciones y sistemas financieros.

La etapa de operacionalización es otra área donde la colaboración entre el científico de datos y los
analistas de BI debería ser invaluable. Muchos analistas de BI ya tienen experiencia en la integración de
informes y paneles de control en los sistemas operativos, así como en el establecimiento de centros de
excelencia para difundir el aprendizaje y las habilidades analíticas en toda la organización.

Nuevos roles organizacionales


Los macrodatos están provocando que las organizaciones reconsideren cómo gestionan, hacen crecer y
protegen sus nuevos activos de big data: conocimientos analíticos, modelos analíticos y datos. Repasemos
tres roles nuevos y críticos que deben agregarse al equipo de big data.

Equipo de experiencia del usuario


Las principales organizaciones de big data están empezando a darse cuenta de que si no se pueden
presentar los resultados de sus análisis de big data de una manera que sea intuitiva y procesable para las
partes interesadas del negocio, ¿para qué molestarse? Estas organizaciones se están dando cuenta de que
necesitan tener un equipo de experiencia de usuario (UEX) como parte del equipo de big data.
Cuando trabajaba en Yahoo!, tuve la gran suerte de trabajar con dos diseñadores de experiencia de
usuario con mucha experiencia. Me enseñaron el valor de una interfaz de usuario sencilla pero práctica
(piense en el iPod de Apple). Empresas web como Yahoo!, Amazon y eBay fueron algunas de las primeras
empresas en comprender la importancia de UEX. Pronto, otras empresas emplearon el “diseño centrado en
el usuario” como principal diferenciador en el desarrollo de productos y servicios atractivos y atractivos.
Definimos el diseño centrado en el usuario como:
Machine Translated by Google

Impacto organizacional de Big Data 47

El diseño centrado en el usuario es un proceso en el que se presta amplia atención a las necesidades,

deseos y limitaciones de los usuarios finales de un producto en cada etapa del proceso de diseño. El

diseño centrado en el usuario puede caracterizarse como un proceso de resolución de problemas

de múltiples etapas que no sólo requiere que los diseñadores analicen y prevean cómo es

probable que los usuarios utilicen un producto, sino también que prueben la validez de sus

suposiciones con respecto al comportamiento del usuario en pruebas del mundo real con usuarios reales.1

Los arquitectos y diseñadores de UEX me enseñaron la importancia de las herramientas UEX y


técnicas como:

■ Personas para documentar y comprender claramente las características de uso, los procesos
de toma de decisiones y el entorno de trabajo dentro del cual trabajan los usuarios objetivo.

■ Guiones gráficos para capturar los requisitos de experiencia del usuario, navegación
requisitos y patrones de uso y flujo del papel.
■ Estructuras alámbricas donde los requisitos de la experiencia del usuario comienzan a cobrar vida,
especialmente con respecto a cómo navegar por la interfaz para encontrar la información necesaria
(por ejemplo, todo lo que aparece en la mitad superior de la página, a nada más que dos clics de distancia).
■ Maquetas flash que permiten a los usuarios de destino interactuar con las maquetas para
identificar fallas de diseño de UEX, problemas de navegación y suposiciones de uso inexactas.

Nuevos roles de alta dirección


Las organizaciones están empezando a darse cuenta de que necesitan tratar sus datos y análisis
como activos corporativos estratégicos. Esto está llevando a la creación de dos nuevos roles de alta
dirección: el director de datos y el director de análisis. Estos dos nuevos roles participarán en la
gestión proactiva de los activos de datos y la propiedad intelectual analítica de la empresa.

El director de datos será responsable de adquirir, almacenar, enriquecer y aprovechar los activos
de datos de la empresa. Es probable que este papel lo desempeñen personas con experiencia en
economía o finanzas mientras buscan formas de asignar valor económico a los datos que tienen y
desean adquirir. El rol del director de datos podría cubrir las siguientes responsabilidades:

■ Inventario de datos: muchas organizaciones ni siquiera saben qué fuentes de datos tienen,
por lo que esta función sería responsable de inventariar los datos (buscando compras de
datos innecesarias y redundantes) y determinar cómo se utilizan esos datos (para determinar
si la organización debe continuar capturando los datos). Esta función también tendría la
responsabilidad crítica de identificar y valorar las fuentes de datos externas que podrían
adquirirse.

1
http://en.wikipedia.org/wiki/User­centered_design
Machine Translated by Google

48 Capítulo 4

■ Valoración económica de los datos: Establecer un marco en torno al cual determinar el valor

económico de los datos de la organización, especialmente cuando las empresas buscan


adquirir más datos externos, de socios y de terceros.
■ Monetización de datos: Establecer un proceso para evaluar continuamente los activos de datos de la
organización en busca de oportunidades de monetización a través de una mejor toma de
decisiones, la integración de datos en productos físicos o el empaquetado de datos para su venta a
otras organizaciones.
■ Instrumentación: desarrollar estrategias para determinar cómo utilizar etiquetas, balizas y sensores en
plataformas operativas, web y móviles para capturar datos operativos, de productos y de clientes
adicionales.
■ Gobernanza de datos: Desarrollar y aplicar (auditar) un conjunto de procesos que garanticen que los
activos de datos importantes se gestionen formal y consistentemente en toda la empresa para
garantizar el nivel adecuado de limpieza y precisión de los datos.

El director de análisis será responsable de capturar y rastrear los modelos analíticos y los conocimientos
analíticos resultantes que se desarrollan e implementan en toda la organización. El director de análisis ideal
probablemente tenga un título en derecho para proteger legalmente la propiedad intelectual (PI) analítica de
la organización, incluidos modelos de datos, modelos analíticos y algoritmos analíticos. El rol del director de
análisis podría cubrir las siguientes responsabilidades:

■ Activos analíticos: colaborar con el equipo de ciencia de datos para inventariar datos analíticos.
modelos y algoritmos en toda la organización.
■ Valoración analítica: Establecer un marco y un proceso para determinar el
Valor financiero de los activos analíticos de la organización.
■ Gestión de propiedad intelectual: desarrollar procesos y gestionar un repositorio para capturar y
compartir la propiedad intelectual de la organización (registro de entrada, salida, control de
versiones).
■ Solicitudes de patentes: administre la solicitud de patentes y el proceso de seguimiento para presentar
patentes para proteger la propiedad intelectual clave de análisis organizacional.
■ Protección de la propiedad intelectual: supervise el uso de análisis de la industria para identificar posibles

violaciones de la propiedad intelectual y luego dirija los esfuerzos de litigio para detener u obtener acuerdos de

licencia por violaciones de la propiedad intelectual.

■ Monetización de la propiedad intelectual: busque activamente socios comerciales y


Oportunidades para vender o licenciar IP de análisis organizacional.

Vemos organizaciones que buscan ampliar el equipo de ciencia de datos y los puestos de liderazgo
senior para explotar aún más la ventaja competitiva que ofrece el big data.
El equipo de Experiencia del Usuario es una poderosa incorporación al equipo de ciencia de datos, ya que el
equipo tiene una función que se centra singularmente en garantizar que se realicen los análisis correctos.
Machine Translated by Google

Impacto organizacional de Big Data 49

se entregan a los usuarios correctos en el momento correcto de la manera más procesable y


relevante. Y las funciones de director de datos y director de análisis garantizan que la organización
adquiera, gestione, empaquete y valore adecuadamente los activos de propiedad intelectual de
datos y análisis; y que hay roles en el personal del CEO cuyo enfoque y éxito se definen por qué
tan bien se monetizan esos activos.

Creatividad organizacional liberadora


Ah, la angustia de no saber las respuestas “correctas”. Las organizaciones luchan con el proceso
de determinar las respuestas “correctas”, lo que resulta en muchos debates desperdiciados y
argumentos divisivos sobre quiénes son las respuestas más correctas. Incluso tienen un nombre
para este proceso debilitante –parálisis del análisis– donde diferentes lados del argumento sacan
a relucir sus propios hechos y observaciones de antídotos para respaldar la justificación de su
respuesta “correcta”. Sin embargo, hay buenas noticias, ya que los conceptos de experimentación
e instrumentación pueden en realidad liberar a las organizaciones de esta parálisis del análisis al
brindarles una salida, un camino a seguir que conduzca a la acción en lugar de simplemente más
debate, más frustraciones y más parálisis del análisis.
Para muchas organizaciones, los conceptos de experimentación e instrumentación son un poco
extraños. Las empresas de Internet (como Yahoo!, Google, Facebook, Amazon) y las organizaciones
de marketing directo han integrado estos dos conceptos en sus procesos de análisis y participación
del cliente. Han aprovechado los conceptos de experimentación e instrumentación para liberar el
pensamiento organizacional (para explorar libremente nuevas ideas y probar corazonadas), pero
de una manera científica que resulta en evidencia sólida y nuevo aprendizaje organizacional.

Entendamos cómo su organización puede adoptar estos mismos conceptos como parte
de su estrategia de big data. Empecemos por definir dos conceptos clave:

■ La experimentación se define como el acto, proceso, práctica o instancia de realización de


experimentos, donde un experimento es una prueba, ensayo o procedimiento tentativo; un
acto u operación con el propósito de descubrir algo desconocido o de probar un principio,
suposición, etc.2
■ La instrumentación se define como el arte y la ciencia de medir y controlar las variables del

proceso dentro de un área de producción o fabricación.3

En conjunto, estos dos conceptos pueden liberar a las organizaciones que sufren de parálisis
del análisis, es decir, que luchan cuando no están seguras de qué decisión tomar (por ejemplo,
¿debería aumentar los precios un 10 por ciento o disminuir los precios un 10 por ciento? ¿Debería
utilizar el anuncio morado?). ¿O el anuncio rojo? ¿Debo ofrecer la promoción A o la promoción B?).

2
http://dictionary.reference.com/browse/experiment
3
http://en.wikipedia.org/wiki/Instrumentation
Machine Translated by Google

50 Capítulo 4

En conjunto, estos dos conceptos pueden impulsar el proceso de pensamiento creativo de “qué
pasaría si”, que es fundamental cuando una organización busca adoptar big data. El ciclo de
análisis "qué pasaría si" puede mejorar la comprensión de la organización sobre el potencial
empresarial de nuevas fuentes de datos estructurados y no estructurados, ubicadas tanto interna
como externamente a la organización, junto con metodologías avanzadas de análisis y ciencia de
datos (consulte la Figura 4­4). abajo).

Experimentación

Y si...

Instrumentación

Figura 4­4: Ciclo de experimentación “¿Y si?”

Este ciclo analítico de “qué pasaría si” permite a las organizaciones debatir libremente
diferentes ideas sin tener que preocuparse de cuáles son las correctas de antemano.
En consecuencia, las organizaciones pueden adoptar un entorno de experimentación para
fomentar el libre flujo de nuevas ideas. Las organizaciones pueden dejar que los resultados les
digan qué ideas son “correctas” y no permitir que el polemista más persuasivo o la persona de
mayor rango tomen esa determinación. Permite a la organización desafiar el pensamiento
convencional y potencia el pensamiento creativo que puede sacar a la luz ideas potencialmente valiosas.
Ya no es necesario pasar horas o días interminables debatiendo cuál es la idea correcta.
En su lugar, ¡ponga a prueba las ideas y deje que los datos le digan!
Veamos un ejemplo de cómo se podría aprovechar el ciclo analítico del tipo “qué pasaría si”:

1. Desarrolla una hipótesis o teoría que quieras probar. Por ejemplo, creo que mi público
objetivo responderá más favorablemente a la oferta A, mientras que mi colega cree que la
oferta B es más atractiva para nuestro público objetivo.
2. Cree un experimento (por ejemplo, un entorno de prueba con los casos de prueba
correspondientes) que pueda probar o refutar la hipótesis. También queremos identificar
las métricas con las que mediremos los resultados de la prueba (por ejemplo, tasa de
clics, tráfico en la tienda, ventas). En este ejemplo, crearíamos pruebas.
Machine Translated by Google

Impacto organizacional de Big Data 51

para tres casos de prueba: Oferta A, Oferta B y un Grupo de Control. Emplearíamos técnicas de
muestreo para seleccionar a nuestros miembros de prueba y control, y aseguraríamos que otras
variables potenciales se mantengan constantes durante la prueba (por ejemplo, la misma hora
del día, las mismas características de audiencia, el mismo canal, período de tiempo, etc.).
3. Instrumentar todos los casos de prueba para medir los resultados de la prueba. En este ejemplo,

queremos asegurarnos de que cada uno de los tres casos de prueba esté “etiquetado”
adecuadamente y que capturemos todos los datos relevantes para determinar quién respondió a
qué ofertas, quién no respondió y qué. fueron los resultados de sus respuestas.

4. Ejecutar las pruebas. Para nuestro ejemplo, determinaríamos las fechas de inicio y finalización de
las pruebas, ejecutaríamos las pruebas, capturaríamos datos y resultados relevantes y luego
concluiríamos la prueba.

5. Cuantificar los resultados de la prueba. Miraríamos los resultados de las pruebas, examinaríamos
quién hizo clic en qué anuncios, determinaríamos los resultados finales y declararíamos un ganador.
Y lo que es más importante, pasaríamos a la siguiente prueba.

La belleza de una organización que adopta el ciclo analítico de instrumentación y experimentación del
tipo “qué pasaría si” es probar ambas ideas y luego dejar que los datos nos digan cuál es la correcta. El
ciclo de análisis "qué pasaría si" aprovecha la experimentación y la instrumentación para capacitar a la
organización para explorar y probar libremente nuevas ideas, y permite a las organizaciones ponerse en
movimiento sin quedar estancadas en la parálisis del análisis. De hecho, big data es la parálisis anti­
análisis al brindar a las organizaciones los datos, las herramientas y las metodologías para probar ideas,
aprender de esas pruebas y seguir adelante.

También podría gustarte