04-Big-Data WHP Spa 0413
04-Big-Data WHP Spa 0413
04-Big-Data WHP Spa 0413
2013
-flSACA'
IMPACTOS Y BENEFICIOS
ARTCULO TCNICO
DE ISACA
los profesionales experimentados de negocios
y de n
saben
Big Data:
impactos y
Beneficios
Acerca de ISACA
Con ms de 100 000 miembros en 180 pases, ISACA (www.isaca.org) es un proveedor lder global de conocimiento,
certificaciones, comunidad profesional, promocin y educacin en materia de aseguramiento y seguridad de los sistemas de
informacin (information systems, IS), gobierno corporativo y gestin de TI, riesgos relacionados con las TI y cumplimiento
de las normas. Fundada en 1969, ISACA, una organizacin independiente sin nimo de lucro, auspicia conferencias
internacionales, publica ISACA Journal y desarrolla normas internacionales de control y auditora para los IS, lo que ayuda
a sus miembros a asegurar el valor y la confianza en los sistemas de informacin. Tambin desarrolla y certifica destrezas
y conocimientos en TI a travs de las siguientes designaciones mundialmente reconocidas: Certified Information Systems
Auditor (Auditor Certificado en Sistemas de Informacin) (CISA), Certified Information Security Manager (Gerente
Certificado en Seguridad de la Informacin) (CISM), Certified in the Governance of Enterprise IT (Certificado en el
Gobierno de Tecnologas de la Informacin Corporativa) (CGEIT) y Certified in Risk and Information Systems
ControlTM (Certificado en Riesgo y Control de Sistemas de Informacin) (CRISCTM).
ISACA actualiza y expande permanentemente la orientacin prctica y la familia de productos basadas en el marco COBIT.
COBIT ayuda a los profesionales de TI y a los lderes empresariales a cumplir con sus responsabilidades de gestin y gobierno
de las TI, particularmente en las reas de aseguramiento, seguridad, riesgo y control, y a aportar valor al negocio.
Exencin de responsabilidad
ISACA ha diseado y creado Big data: impactos y beneficios (el Trabajo), principalmente como un recurso educativo para
los profesionales de gobierno y aseguramiento. ISACA no garantiza que el uso de cualquier componente del Trabajo asegure
un resultado exitoso. El Trabajo no debe ser considerado como abarcativo de toda la informacin, procedimientos y pruebas
apropiadas ni tampoco como excluyente de otra informacin, procedimientos y pruebas que se aplican razonablemente para
obtener los mismos resultados. Para determinar la conveniencia de cualquier informacin especfica, procedimiento o prueba,
los profesionales de gobierno y aseguramiento debern aplicar su propio criterio profesional a las circunstancias especficas
presentadas por los sistemas particulares o por el entorno de tecnologa de la informacin.
Reserva de derechos
2013 ISACA. Todos los derechos reservados. Ninguna parte de esta publicacin se puede utilizar, copiar,
reproducir, modificar, distribuir, mostrar, almacenar en un sistema de recuperacin ni transmitir de ninguna manera a
travs de
ningn medio (electrnico, mecnico, fotocopiado, grabacin u otros) sin la autorizacin previa por escrito de ISACA. La
reproduccin y utilizacin de toda o parte de esta publicacin estn permitidas nicamente para el uso acadmico, interno y
no comercial, y para los compromisos de consultora y asesoramiento, y debern incluir la referencia completa de la fuente del
material. No se otorga otra clase de derechos ni permisos en relacin con este trabajo.
ISACA
3701 Algonquin Road, Suite 1010
Rolling Meadows, IL 60008 EE. UU.
Telfono: +1.847.253.1545
Fax: +1.847.253.1443
Correo electrnico: [email protected]
Sitio web: www.isaca.org
Enve sus comentarios: www.isaca.org/Big-Data-WP
Participe en el Centro de Conocimiento de ISACA: www.isaca.org/knowledge-center
Siga a ISACA en Twitter: https://twitter.com/ISACANews
nase a ISACA en LinkedIn: ISACA (Oficial), http://linkd.in/ISACAOfficial
Pulse Me gusta en el perfil de ISACA en Facebook: www.facebook.com/ISACAHQ
Big Data:
impactos y
Beneficios
Agradecimientos
ISACA desea agradecer a:
Equipo de desarrollo del proyecto
Richard Chew, CISA, CISM, CGEIT, Emerald Management Group, EE.
UU. Keith Genicola, KPMG LLP, EE. UU.
Brian Li, Ernst & Young LLP, CFE, CMCON, EE. UU.
Jothi Philip, CISA, ACA, CISSP, Banco de Inglaterra,
RU
Tichaona Zororo, CISA, CISM, CGEIT, CRISC, CIA, EGIT | Enterprise Governance of IT (PTY) Ltd., Sudfrica
Revisores expertos
Joanne De Vito De Palma, BCMM, The Ardent Group LLC, EE. UU.
Russell Fairchild, CISA, CRISC, CISSP, PMP, SecureIsle, EE. UU.
Rammiya Perumal, CISA, CISM, CRISC, Sumitomo Mitsui Bank, EE. UU.
Lily M. Shue, CISA, CISM, CGEIT, CRISC, CCP, LMS Associates LLP, EE. UU.
Consejo Directivo de ISACA
Gregory T. Grocholski, CISA, The Dow Chemical Co., EE. UU., Presidente Internacional
Allan Boardman, CISA, CISM, CGEIT, CRISC, ACA, CA (SA), CISSP, Morgan Stanley, RU, Vicepresidente
Juan Luis Carselle, CISA, CGEIT, CRISC, Wal-Mart, Mxico, Vicepresidente
Christos K. Dimitriadis, Ph.D., CISA, CISM, CRISC, INTRALOT S.A., Grecia, Vicepresidente
Ramss Gallego, CISM, CGEIT, CCSK, CISSP, SCPM, Cinturn Negro de Six Sigma, Dell, Espaa, Vicepresidente
Tony Hayes, CGEIT, AFCHSE, CHE, FACS, FCPA, FIIA, Gobierno de Queensland, Australia, Vicepresidente
Jeff Spivey, CRISC, CPP, PSP, Security Risk Management, Inc., EE. UU., Vicepresidente
Marc Vael, Ph.D., CISA, CISM, CGEIT, CRISC, CISSP, Valuendo, Blgica, Vicepresidente
Kenneth L. Vander Wal, CISA, CPA, Ernst & Young LLP (jubilado), EE. UU., Expresidente Internacional
Emil DAngelo, CISA, CISM, Bank of Tokyo-Mitsubishi UFJ Ltd. (jubilado), EE. UU., Expresidente Internacional
John Ho Chi, CISA, CISM, CRISC, CBCP, CFE, Ernst & Young LLP, Singapur, Director
Krysten McCabe, CISA, The Home Depot, EE. UU., Directora
Jo Stewart-Rattray, CISA, CISM, CGEIT, CRISC, CSEPS, BRM Holdich, Australia, Director
Comit de Conocimiento
Marc Vael, Ph.D., CISA, CISM, CGEIT, CRISC, CISSP, Valuendo, Blgica,
Presidente Rosemary M. Amato, CISA, CMA, CPA, Deloitte Touche Tohmatsu Ltd.,
Holanda Steven A. Babb, CGEIT, CRISC, Betfair, RU
Thomas E. Borton, CISA, CISM, CRISC, CISSP, Cost Plus, EE.
UU. Phil J. Lageschulte, CGEIT, CPA, KPMG LLP, EE. UU.
Jamie Pasfield, CGEIT, ITIL V3, MSP, PRINCE2, Pfizer,
RU Salomon Rico, CISA, CISM, CGEIT, Deloitte LLP,
Mxico
Comit de Orientacin y Prcticas
Phil J. Lageschulte, CGEIT, CPA, KPMG LLP, EE. UU., Presidente
Dan Haley, CISA, CGEIT, CRISC, MCP, Johnson & Johnson, EE.
UU. Yves Marcel Le Roux, CISM, CISSP, CA Technologies, Francia
Aureo Monteiro Tavares Da
Silva, CISM, CGEIT, Vista Point,
Brasil
Jotham Nyamari, CISA, Deloitte, EE. UU.
Connie Lynn Spinelli, CISA, CRISC, CFE, CGMA, CIA, CISSP, CMA, CPA, BKD LLP, EE.
UU. Siang Jun Julia Yeo, CISA, CPA (Australia), Visa Worldwide Pte. Limited, Singapur
Nikolaos Zacharopoulos, CISA, DeutschePostDHL, Alemania
Big Data:
impactos y
Beneficios
Agradecimientos (continuacin)
Afiliados y patrocinadores de ISACA y del IT Governance Institute (ITGI)
Foro de Seguridad de la Informacin (Information Security Forum)
Institute of Management Accountants Inc.
Captulos de ISACA
ITGI Francia
ITGI Japn
Norwich University
Socitum Performance Management Group
Solvay Brussels School of Economics and Management
Strategic Technology Management Institute (STMI) of the National University of Singapore
University of Antwerp Management School
ASIS International
Hewlett-Packard
IBM
Symantec Corp.
Big Data:
impactos y
Beneficios
Introduccin
Big data (grandes conjuntos de datos) es un trmino tcnico y de marketing que hace referencia a un activo valioso de la
empresa, es decir, la informacin. Representa una tendencia en tecnologa que lidera el camino hacia un nuevo enfoque en
el entendimiento del mundo y la toma de decisiones de negocio. Estas decisiones se toman en funcin de cantidades muy
grandes de datos complejos, estructurados y no estructurados (por ejemplo, tweets, videos, transacciones comerciales) que se
han vuelto difciles de procesar mediante la utilizacin de herramientas bsicas de bases de datos y de gestin de almacenes
de datos (data warehouse). La gestin y el procesamiento del conjunto de datos cada vez mayor requiere la ejecucin de
software especializado en mltiples servidores. Para algunas empresas, los grandes conjuntos de datos se cuentan en cientos de
gigabytes; para otras, en terabytes o incluso en petabytes, con una tasa de crecimiento y cambio frecuente y rpido (en algunos
casos, casi en tiempo real). Esencialmente el trmino big data se refiere a conjuntos de datos que son demasiado grandes
o que cambian demasiado rpido como para ser analizados mediante tcnicas tradicionales de bases de datos relacionales o
multidimensionales, o herramientas de software comnmente utilizadas para capturar, administrar y procesar los datos en una
ventana de tiempo razonable.
Segn COBIT 5, la informacin es efectiva si satisface las necesidades del consumidor de informacin (considerado un
actor). En el caso de los grandes conjuntos de datos, la empresa es el actor interesado y uno de sus principales intereses es la
calidad de la informacin. Los intereses se pueden relacionar con los objetivos de la informacin en el modelo habilitador de
COBIT 5, que los divide en tres subdimensiones de calidad, que se describen ms adelante en este artculo tcnico. Cuanto
mejor sea la calidad de los datos, mejores sern las decisiones basadas en esos datos; esto finalmente genera valor para la
empresa. Por lo tanto, la gestin de grandes conjuntos de datos debe garantizar la calidad de los datos en todo su ciclo de vida.
Los datos se recopilan para ser analizados, y para buscar patrones y correlaciones que inicialmente pueden no ser evidentes,
pero que pueden ser tiles en la toma de decisiones de negocio. Este proceso se denomina revisin analtica de grandes
conjuntos de datos. Con frecuencia, estos datos son datos personales tiles desde una perspectiva de marketing para
el entendimiento de las preferencias y aversiones de los posibles compradores, y para el anlisis y la prediccin de su
comportamiento de compra. Los datos personales se pueden clasificar en las siguientes categoras:
Datos voluntarios: creados y compartidos en forma explcita por las personas (por ejemplo, perfiles de redes sociales).
Datos observados: capturados mediante el registro de las acciones de las personas (por ejemplo, datos de ubicacin cuando
utilizan telfonos celulares).
Datos inferidos: datos acerca de las personas, basados en el anlisis de informacin voluntaria u observada (por ejemplo,
capacidad crediticia).
El objetivo principal de analizar grandes conjuntos de datos es respaldar a las
empresas en la toma de mejores decisiones de negocio. Los investigadores
que estudian los datos y otros usuarios analizan grandes cantidades de datos, de
transacciones y de otras fuentes de datos, que pueden ser ignorados por el
software de inteligencia financiera tradicional, como registros de servidores web,
informes de actividad de redes sociales, registros de telfonos celulares y datos
obtenidos a travs de sensores. La revisin analtica de datos puede permitir
un enfoque de marketing orientado, que proporciona a la empresa un mejor
entendimiento de sus clientes un entendimiento que influir en los procesos
internos y finalmente, aumentar las ganancias; esto brinda la ventaja competitiva
que la mayora de las empresas buscan.
Este artculo tcnico ofrece una visin general del impacto que puede tener la recopilacin y la revisin analtica de grandes
conjuntos de datos en una empresa. Identifica los posibles beneficios para el negocio, los desafos, los riesgos, las prcticas
de gobierno y la gestin de riesgos, y ofrece una visin general de las consideraciones de aseguramiento relevantes que se
relacionan con la revisin analtica de grandes conjuntos de datos.
informacin confidencial en
forma inapropiada.
La ventaja competitiva se puede mejorar mucho mediante el aprovechamiento de los datos correctos. Segn un informe de
investigacin realizado por McKinsey2, el valor potencial de los datos en el sector de la atencin sanitaria de los EE. UU.
podra ser de ms de US $300 mil millones cada ao; dos tercios de esta cifra reducira los gastos de atencin sanitaria
nacional en aproximadamente un ocho por ciento.
Se puede obtener beneficios financieros cuando los procesos de gestin de datos se alinean con la estrategia de la empresa;
esto puede requerir la participacin de la alta gerencia para establecer la direccin y supervisar las decisiones importantes.
La revisin analtica de grandes conjuntos de datos puede influir en forma positiva en:
El desarrollo del producto.
El desarrollo del mercado.
La eficiencia operativa.
La experiencia y lealtad del cliente.
Las predicciones de la demanda del mercado.
En la figura 1, se muestra el proceso para obtener acceso a conocimientos comerciales especficos de la organizacin a partir
de los grandes conjuntos de datos.
Figura 1: Cmo abordar los conocimientos comerciales especficos de la organizacin
Beneficios de negocio
Analizar
Mejores decisiones
Agotar datos
Cualquier dato
Adquirir
Descubrir
Predecir
Enormes cantidades de
informacin obtenida de
todas las fuentes
imaginables
Planificar
Faster Action
Mayor innovacin
Ventaja competitiva
ms marcada
1
2
Swalwell, John; Big Data and Intelligent Image Capture Platforms, Technology First, EE. UU., agosto de 2012
Manyika, James; Michael Chui; Brad Brown; Jacques Bughin; Richard Dobbs; Charles Roxburgh; Angela Hung Byers; Big data: The next frontier for innovation,
competition, and productivity, McKinsey Global Institute, McKinsey & Company, EE. UU., mayo de 2011
La empresa debe abocarse de lleno a los grandes conjuntos de datos o comenzar paulatinamente al aparecer pequeas
oportunidades objetivo? Comprar o tercerizar? Estas son estrategias que se deben implementar en funcin de los objetivos
estratgicos y las capacidades existentes de cada empresa. Para las empresas que estn listas para transformar los grandes
conjuntos de datos de un pasivo con prdida de ingresos en un activo con mejora de ingresos, se propone un plan de cuatro
niveles:
1. Tmese un tiempo para elaborar una estrategia: trabaje con los actores y unidades de negocio claves para entender sus
necesidades de datos. Acepte sus opiniones para mejorar los procesos en todo el negocio.
2. Piense analticamente: mejore el equipo de apoyo analtico y asegrese de que los gerentes tengan las aplicaciones y el
acceso que necesitan para analizar de primera mano la informacin crtica para el negocio.
3. Pida lo que se necesita: aproveche las aplicaciones y el software especficos de la industria, siempre que estn disponibles.
Si no se cubren las necesidades, alerte al equipo de gestin y/o a los proveedores de la industria.
4. Invierta para mejorar: equipe la empresa con la tecnologa, el personal y los sistemas/procesos adecuados y necesarios
para optimizar la informacin para contar con una verdadera inteligencia de negocios.
fase del ciclo de vida. El habilitador de informacin COBIT 5 identifica cuatro fases
diferentes (es decir, planificar, disear, construir/adquirir y usar/operar). Los datos
inexactos, incompletos o manipulados en forma fraudulenta plantean un riesgo en aumento, ya que las empresas se hacen ms
dependientes de los datos para la toma de decisiones y la evaluacin de resultados.
Es posible que la necesidad de gestionar los riesgos de los datos dentro de la empresa no se comunique ni entienda claramente
en todos los niveles de gestin. Es esencial destacar que el tratamiento de los riesgos y las preocupaciones acerca de los
grandes conjuntos de datos no se puede ver exclusivamente como un ejercicio desde la perspectiva de la tecnologa de la
informacin. La participacin de toda la empresa, incluido el departamento legal, el de finanzas, el de cumplimiento, el de
auditora interna y otros departamentos de negocio, permite que todos se enfoquen en los objetivos de negocio en la etapa de
planificacin. Por lo tanto, las empresas se pueden enfocar tanto en los aspectos tcnicos como en los de negocio cuando se
trata de de los grandes conjuntos de datos.
En determinados momentos, las empresas pueden resistir las revisiones peridicas de las estrategias relacionadas con los
grandes conjuntos de datos, y las polticas y los procedimientos de seguridad porque la alta gerencia cree que la prctica
actual es suficiente y es reacia a gastar ms si no es necesario. Esta filosofa, sin embargo, es inexacta. La seguridad y
la privacidad juegan un papel cada vez ms importante en relacin con los grandes conjuntos de datos y todos los actores
deben estar atentos a las implicaciones de almacenar y realizar un anlisis cruzado de grandes cantidades de distintos datos
confidenciales. Por otra parte, es imprescindible entender que algunos datos deben considerarse txicos ya que la prdida
de control sobre ellos podra causar un dao a la empresa. Ejemplos de datos potencialmentetxicos son:
Informacin privada o en custodia, como nmeros de tarjetas de crdito; informacin personal identificable, como nmeros
de la seguridad social; e informacin personal de salud.
Informacin estratgica, como propiedad intelectual, planes de negocio y diseos de productos.
Informacin como indicadores clave de desempeo, cifras de ventas, medicin financiera y medicin de produccin, que se
utilizan para tomar decisiones importantes.
Las vulnerabilidades de los datos son especialmente graves para las empresas que confan en los datos personales que genera
o pueden ser modificados por el pblico. Por ejemplo, los datos de las redes sociales pueden ser una fuente altamente valiosa
para evaluar las opiniones de los clientes, para realizar un seguimiento de la eficacia de las campaas de marketing y para
obtener ms informacin sobre los consumidores. Sin embargo, el uso de este tipo de datos personales requerir el tratamiento
de las incertidumbres y los puntos de tensin actuales:
Privacidad: las necesidades de privacidad de las personas varan. Los desarrolladores de polticas se enfrentan a un desafo
complejo cuando desarrollan leyes y regulaciones.
Gobierno global: existe una falta de interoperabilidad jurdica global; cada pas desarrolla sus propios marcos normativos y
legales.
Propiedad de los datos personales: el concepto de derechos de propiedad no se extiende fcilmente a los datos, lo que crea
desafos al establecer los derechos de uso.
Transparencia: demasiada transparencia demasiado pronto presenta el mismo riesgo de desestabilizar el ecosistema de datos
personales que la escasa transparencia.
Distribucin del valor: incluso antes de que el valor se pueda compartir de forma ms equitativa, se requiere ms claridad
sobre lo que verdaderamente constituye valor para cada actor.
Para reducir al mnimo la posibilidad de daos ocasionados por datos inexactos
o fraudulentos, las empresas deben realizar un inventario de todas las fuentes
de datos que incluyen en sus anlisis y evaluar cada fuente con relacin a sus
vulnerabilidades. Los datos se generan pblicamente? Quin tiene acceso a
los datos en cualquier momento antes de que ingresen en el anlisis? Existen
iniciativas para manipular los datos? En el caso de las fuentes de datos
vulnerables, se pueden emplear tcnicas de clasificacin para detectar posibles
puntos de datos fraudulentos y eliminarlos antes de que se diseminen ms.
Estrategias para abordar los riesgos relacionados con los grandes conjuntos de datos
La estrategia principal para abordar los riesgos es alinear la solucin de la tecnologa con las necesidades de negocio. El marco
COBIT 5 aborda esta estrategia en la cascada de objetivos alineando los factores conductores (drivers) de los actores con sus
necesidades. Estas necesidades se organizan en cascada en relacin con los objetivos de la empresa, luego con los objetivos
relacionados con TI y por ltimo, con los objetivos del habilitador. Existen siete habilitadores que se deben aplicar para ayudar a
la empresa a abordar los riesgos, y mejorar su capacidad para cumplir con sus objetivos de negocio y crear valor para sus
actores.
Cuando las nuevas iniciativas, como la adopcin de grandes conjuntos de datos, se alinean correctamente con el negocio, las
estructuras de gobierno existentes se pueden ajustar fcilmente para abordar la seguridad, el aseguramiento y un enfoque
general, a fin de adoptar nuevas tecnologas. Estos pasos deben incluir: generar una base de talentos, requerir el alineamiento de
las preocupaciones de seguridad de la informacin relacionadas con los grandes conjuntos de datos e iniciar programas piloto
para determinar si la necesidad es crecer internamente o aprovechar los beneficios de la experiencia anterior en grandes
conjuntos de datos. El personal que conoce y utiliza COBIT 5, es decir el habilitador de destrezas y competencias, que sugiere
que la empresa debe saber cul es su base de destrezas actual y planificar lo que debera ser, ser til en la creacin de la base
de talentos.
La creacin de la base de talentos internamente es un pilar fundamental de una mejor prctica. Quin puede entender la
cultura de la empresa, los procesos y el comportamiento de los datos de la empresa mejor que el personal? Los usuarios con
poder y las herramientas que utilizan constituyen un excelente inicio para:
Determinar qu capacidades y recursos internos estn disponibles para asimilar la informacin existente.
Determinar qu herramientas son necesarias para mejorar el proceso de adquisicin y asimilacin de informacin.
Abordar la forma en que se usar la informacin para lograr objetivos tcticos y estratgicos, si se determina que se necesita
informacin nueva y/o diferente.
Desarrollar u obtener programas de capacitacin para el equipo.
Determinar si se necesita un investigador de datos.
Establecer expectativas realistas y crear un plan tctico.
La integracin de la revisin analtica de grandes conjuntos de datos en la gestin de riesgos de negocio y las operaciones de
seguridad no es una tarea fcil. Si bien los grandes conjuntos de datos se han transformado en una dinmica competitiva en una
empresa, tambin han transformado los programas de seguridad de la informacin de la empresa, incluso la manera en que se
desarrollan y ejecutan estos programas de seguridad. Es prudente crear expectativas con los actores en cada paso del trayecto.
Esto ayuda a mitigar el riesgo de prdida de foco para la visin compartida respecto al alineamiento estratgico de negocios.
El riesgo tambin se puede mitigar garantizando la calidad de los datos. El habilitador de informacin COBIT 5 gua a la
empresa a travs del ciclo de la informacin sugiriendo que los procesos de negocio generan y procesan datos, convirtindolos
en informacin y conocimiento y por ltimo, produciendo valor para la empresa mediante la entrega de datos de calidad.
El habilitador de informacin tambin presenta el enfoque, sugiriendo que el primer paso es identificar a los actores y sus
intereses (es decir, por qu les importa o por qu estn interesados en la informacin). Los intereses se pueden relacionar con
los objetivos de la informacin. Los objetivos de la informacin se dividen en tres subdimensiones de la calidad (figura 2).
Figura 2: Subdimensiones de la calidad de los datos
Calidad intrnseca
Precisin
Objetividad
Credibilidad
Reputacin
La adopcin inmediata de la
externalizacin niega a una
empresa la propiedad
intelectual que necesita para
acompaar, gestionar y
controlar el trayecto de los
grandes conjuntos de datos.
Relevancia
Integridad
Actualidad
Cantidad adecuada de informacin
Representacin concisa
Representacin coherente
Interpretabilidad
Comprensibilidad
Facilidad de manipulacin
Calidad de la seguridad/accesibilidad
Disponibilidad/puntualidad
Acceso restringido
La seleccin es un primer paso fundamental y puede incorporar diversas estrategias, adems de la seleccin del proveedor de
grandes conjuntos de datos:
Puede generar una alianza estratgica con uno o ms proveedores de tecnologa de grandes conjuntos de datos.
Puede garantizar que las clases de capacitacin sean dictadas por especialistas y no por aquellos que no pueden responder
preguntas fundamentales, y que se utilice la infraestructura de capacitacin que respalde la interaccin prctica.
Puede garantizar que la informacin del curso se comparta con el equipo encargado de los grandes conjuntos de datos y que
ste la revise en forma integral.
El proyecto piloto puede abarcar al instructor y al equipo encargado de los grandes conjuntos de datos, en reconocimiento
al hecho de que el proyecto es realmente un trabajo en curso.
Los procesos de terceros, la gestin de proyectos y los objetivos se pueden alinear con los objetivos y la experiencia de la
empresa.
Se puede participar a los actores del negocio y a la gestin de riesgos para garantizar que se establezcan los controles
correspondientes a los terceros proveedores/socios.
Una vez que la empresa sepa lo que quiere, deber determinar cmo obtener la informacin que necesita. Un agente comercial
de datos es una posible fuente. Algunas empresas que ya estn en el negocio de la informacin sobre empresas, relacionada
con los agentes comerciales, son: Bloomberg, Thomson Reuters, Simmons Market Research y The Nielsen Company.
Si la empresa elige crecer, debe decidir:
Si debe utilizar un agente comercial.
Si va a utilizar un socio para la capacitacin en el proyecto.
Si dar pasos pequeos o saltos gigantes en cuanto a la confianza, a medida que adquiere terabytes.
Qu opciones estn disponibles en materia de socios.
Cules deben ser los entregables del proyecto.
La documentacin del proyecto debe ser un entregable para:
Impedir la dependencia hacia el proveedor/socio.
Demostrar la titularidad de la propiedad intelectual.
Optimizacin
de Riesgo
Catalizadores
del Gobierno
Optimizacin
de Recursos
Alcance
del Gobierno
Para ayudar a garantizar que los datos se mapeen correctamente, la tarea se debe asignar a un arquitecto de datos snior cuyos
conocimientos y experiencia en TI resultarn inestimables en esta compleja actividad.
Durante la fase exploratoria de los proyectos relacionados con grandes conjuntos de datos, que define el valor esperado para
el negocio y conduce a iniciativas formales, las empresas deben considerar las siguientes preguntas fundamentales (segn las
articula IBM) dentro de la gestin de la informacin:
Reconocemos completamente las responsabilidades asociadas con la gestin de grandes conjuntos de datos?
De qu manera cambian los grandes conjuntos de datos el concepto tradicional de informacin como un activo corporativo?
Cules son los requisitos emergentes relacionados con la privacidad?
Cmo se relacionan los grandes conjuntos de datos con nuestra infraestructura de TI actual?
La discusin que rodea a los grandes conjuntos de datos puede plantearle al director de informtica/sistemas (CIO) ms
preguntas de las que est preparado para responder. Muchas empresas justifican la falta de polticas adecuadas de gobierno
porque creen
que los grandes conjuntos de datos son de alguna manera diferentes; de esta forma, eluden el problema. Dicho de forma
simple, a medida que las tecnologas relacionadas con los grandes conjuntos de datos se hacen operativas, en oposicin a las
tecnologas exploratorias, necesitan las mismas disciplinas de gobierno que se aplican a los enfoques tradicionales de gestin de
datos.
Al implementar un programa de gobierno de la informacin, se debe evaluar el estado actual y se debe desarrollar el estado
futuro. COBIT 5 puede ayudar a la empresa a abordar tanto esta tarea como otras inherentes al gobierno de grandes conjuntos
de datos. Esto finalmente guiar los esfuerzos de la empresa para crear valor mediante un punto de equilibrio entre el hecho de
obtener beneficios y el de mantener el riesgo en un nivel aceptable.
datos
Los controles relacionados con los grandes conjuntos de datos se pueden agrupar en cuatro categoras:
Enfoque y entendimiento
Calidad
Confidencialidad y privacidad
Disponibilidad
Enfoque y entendimiento
Esta categora aborda la demostracin del tono correcto con los superiores de la
empresa. Un aspecto importante en este esfuerzo es establecer e implementar una
poltica de datos. La poltica (y los procedimientos asociados) deben definir el alcance
de los datos; establecer un sistema de gobierno y aseguramiento de la calidad de los
datos; e identificar criterios cualitativos y cuantitativos para evaluar la precisin,
confiabilidad, integridad y oportunidad de los datos. Sin duda, la empresa deber
invertir tiempo y dinero para realizar un inventario de todas las fuentes de datos,
evaluar las vulnerabilidades e implementar polticas y procedimientos. Esos costos son
necesarios cuando se gestionan riegos y se debe considerar el costo de realizar negocios.
El proceso de aseguramiento debe comenzar con la creacin de un inventario de
los datos. Una vez realizado el inventario, los datos se deben clasificar segn la
confidencialidad y relevancia, y se debe crear un flujo de datos. Luego se debe
desarrollar un proceso para identificar las vulnerabilidades del flujo de datos,
una actividad que comienza con la creacin de un diagrama de flujo de datos
multidimensional respaldado por un diccionario de datos3 que mapea el escenario
de los datos en toda la empresa. Este proceso debe capturar fuentes de datos
internas y externas, los diversos procesos manuales y automatizados (por ejemplo,
transformacin, consolidacin) que se realizan con cada conjunto de datos, y su
destino y uso finales. Cada vulnerabilidad identificada debe ingresarse en un proceso
establecido de gobierno de datos deficientes, para el anlisis del impacto y la
probabilidad, el escalamiento a la alta direccin cuando sea necesario y una resolucin
tctica o estratgica. Adems, cada vulnerabilidad necesita un propietario, alguien que
sea responsable de los datos.
Cada vulnerabilidad
identificada debe ingresarse
en un proceso establecido
de gobierno de datos
deficientes para el anlisis
del impacto y la
probabilidad,
una escalacin a la alta
direccin cuando sea
necesario y una resolucin
tctica o estratgica.
Se deben establecer criterios de materialidad que permitan a esos responsables del gobierno de datos identificar los conjuntos
de datos y los elementos ms relevantes en los cuales deben enfocar sus esfuerzos. Este proceso tambin facilitar la creacin
de una ruta de escalamiento para la gestin de datos deficientes.
El diccionario de datos tambin debe documentar todos los elementos de los datos de carcter material y la relacin entre ellos, su fuente y su uso, para que se pueda
establecer un entendimiento coherente en toda la empresa.
Los roles cambian a media que los datos se mueven a travs del flujo de datos.
Conclusin
La cultura de la empresa, que
lucha contra la innovacin o la
acepta, requiere un lder para
los grandes conjuntos de datos
que entienda
su rol en la innovacin o
direccin de la empresa.
Gestionar proyectos.
Comunicar bien para abarcar todos los canales de la empresa.
No es inusual que los diversos niveles de liderazgo discrepen. Las habilidades para tratar con delicadeza a las personas que
alientan un enfoque sobre metas compartidas y un deseo de evitar el fracaso, y no la discrepancia en s, son necesarias para
dirigir los conflictos dentro de la empresa y entre los miembros del equipo encargado de los grandes conjuntos de datos.
Recursos adicionales y retroalimentacin
Visite www.isaca.org/Big-Data-WP para obtener recursos adicionales y utilice la funcin de retroalimentacin para aportar
sus comentarios y sugerencias sobre este documento. Su opinin es muy importante en el desarrollo de las guas de ISACA
para sus miembros y es muy valorada.