Dados Na Gestão
Dados Na Gestão
Dados Na Gestão
x
Forma especializada de gerenciamento de documentos que se concentra nos registros -
documentos que fornecem evidências das atividades de uma organização. Essas atividades
podem ser eventos, transações, contratos, correspondência, políticas, decisões, procedimentos,
operações, arquivos de pessoal e demonstrações financeiras. Os registros podem ser
documentos físicos, arquivos e mensagens eletrônicos ou conteúdo do banco de dados.
Gerenciamento de conteúdo
x
Refere-se aos processos, técnicas e tecnologias para organizar, categorizar e estruturar recursos
de informações para que eles possam ser armazenados, publicados e reutilizados de várias
maneiras. O conteúdo pode ser volátil ou estático (documentos e outros ativos digitais, como
vídeos, fotografias, etc.). Pode ser gerenciado formalmente (estritamente armazenado,
gerenciado, auditado, retido ou descartado) ou informalmente por meio de atualizações ad hoc.
O gerenciamento de conteúdo é particularmente importante em sites e portais, mas as técnicas
de indexação com base em palavras-chave e organização com base em taxonomias podem ser
aplicadas em plataformas tecnológicas.
Até recentemente, a análise aprofundada de enormes conjuntos de dados era limitada pela
tecnologia. As análises basearam-se em amostragem ou outros meios de abstração para
aproximar padrões. À medida que cresce a capacidade de coletar e analisar grandes conjuntos de
dados, os cientistas de dados estão integrando métodos de matemática, estatística, ciência da
computação, processamento de sinais, modelagem de probabilidade, reconhecimento de
padrões, aprendizado de máquina, modelagem de incertezas e visualização de dados para
obter insights e prever comportamentos com base em conjuntos de Big Data.
Em suma, a ciência de dados encontrou novas maneiras de analisar e extrair conhecimento dos
dados. Em muitos casos, esse conhecimento pode ser traduzido em valor econômico.
Como o Big Data foi introduzido nos ambientes de data warehouse e BI, as técnicas de ciência de
dados podem fornecer uma visão prospectiva ('para-brisa') da organização. Recursos preditivos,
em tempo real e baseados em modelo, usando diferentes tipos de fontes de dados, oferecem às
organizações uma melhor visão para onde estão caminhando.
Os modelos de ciência de dados se tornam fontes de dados. Eles precisam ser monitorados e
explorados para obter informações. Como outras formas de ciência, a ciência de dados cria novos
conhecimentos e também novas hipóteses. Testar hipóteses resulta em novos modelos e novos
dados. Todas essas peças requerem gerenciamento para criar valor ao longo do tempo. Os
modelos precisam ser 'treinados' e avaliados. Novas fontes de dados podem ser incorporadas aos
modelos existentes. O ciclo de vida dos dados deve compor os esforços de ciência de dados que
precisa ser contabilizado como parte do planejamento e da estratégia.
Os modelos de ciência de dados que contêm lógica (algoritmos) para processar dados e fazer
previsões a partir deles, não são a mesma coisa que os modelos de dados descritos no tópico
“Habilitando e Mantendo Dados” que documentam a estrutura dos dados e os relacionamentos
entre entidades e atributos de dados.
Regulamentos governamentais
Existem regulamentos governamentais para proteger os interesses de algumas partes
interessadas. Os regulamentos têm objetivos diferentes. Alguns restringem o acesso às
informações, enquanto outros garantem abertura, transparência e responsabilidade. Os
regulamentos diferem entre os países, o que significa que as organizações que realizam negócios
internacionalmente precisam estar cientes e capazes de atender aos requisitos de proteção de
dados onde fazem negócios.
Obrigações contratuais
Acordos contratuais e de não divulgação também influenciam os requisitos de segurança de
dados. Por exemplo, o PCI Standard, um contrato entre empresas de cartão de crédito e
empresas individuais, exige que certos tipos de dados sejam protegidos de maneiras definidas
(por exemplo, criptografia obrigatória para senhas de clientes).
Políticas e procedimentos eficazes de segurança de dados permitem que as pessoas certas usem
e atualizem os dados da maneira correta e restrinjam todo acesso e atualizações inadequados.
* O princípio Cachinhos Dourados é nomeado por analogia à história infantil Os Três Ursos, na
qual uma garotinha chamada Cachinhos Dourados prova três tigelas diferentes de mingau e
descobre que . [1] Como a história das crianças é bem conhecida em todas as culturas, o conceito
de "a quantidade certa" é facilmente compreendido e aplicado a uma ampla gama de disciplinas,
incluindo psicologia do desenvolvimento, biologia, [2] astronomia, economia [3] e Engenharia.
• Colaboração
A segurança de dados é um esforço colaborativo que envolve gestores de segurança de TI,
Gestores de dados / governança de dados, equipes de auditoria interna e externa e o
departamento jurídico.
Colaboração
•Abordagem corporativa
Os padrões e políticas de segurança de dados devem ser aplicados de forma consistente em toda
a organização.
Colaboração
•Gerenciamento proativo
O sucesso no gerenciamento de segurança de dados deve ser proativo e dinâmico, envolver todas
as partes interessadas, gerenciar mudanças e superar gargalos organizacionais ou culturais, como
a separação tradicional de responsabilidades entre segurança da informação, tecnologia da
informação, gestão de dados e partes interessadas nos negócios.
Colaboração
•Responsabilidade Clara
As funções e responsabilidades devem ser claramente definidas, incluindo a 'cadeia de custódia'
dos dados nas organizações e funções.
Colaboração
Lição módulo 4
1. Gerenciamento de metadados
Como princípio, os metadados são essenciais para o gerenciamento de dados.
Em outras palavras, você precisa de dados para gerenciar dados. Os metadados descrevem quais
dados você possui e, se não souber isso, não poderá gerenciá-los. O gerenciamento de metadados é
uma atividade fundamental que precisa ser realizada durante todo o ciclo de vida dos dados. O ciclo
de vida dos metadados também precisa ser gerenciado.
A definição mais comum de metadados – "dados sobre dados" – é aparentemente simples. Para
alguns, infelizmente, é uma fonte de confusão e não de esclarecimento, porque muitos tipos de
informações podem ser classificados como metadados e não existe uma linha clara entre "dados" e
"metadados". Em vez de tentar traçar essa linha, descreveremos como os metadados são usados e
por que são tão importantes.
Para entender o papel vital dos metadados no gerenciamento de dados, imagine uma grande
biblioteca, com centenas de milhares de livros e revistas, mas sem catálogo. Sem um catálogo, os
leitores podem nem saber como começar a procurar um livro específico ou mesmo um tópico
específico.
O catálogo não apenas fornece as informações necessárias (quais livros e materiais a biblioteca
possui e onde estão guardadas), mas também permite que os clientes encontrem materiais usando
diferentes pontos de partida (área de assunto, autor ou título). Sem o catálogo, encontrar um livro
específico seria difícil, se não impossível. Uma organização sem metadados é como uma biblioteca
sem um catálogo.
Como outros dados, os metadados requerem gerenciamento. À medida que a capacidade das
organizações de coletar e armazenar dados aumenta, o papel dos metadados no gerenciamento de
dados cresce em importância. O gerenciamento de metadados, no entanto, não é um fim em si; é um
meio pelo qual uma organização pode obter mais valor com seus dados. Para ser guiada por dados,
uma organização deve ser guiada por metadados.
• Centralizada
Uma arquitetura centralizada consiste em um único repositório de metadados que contém cópias
dos metadados das várias fontes. As organizações com recursos limitados de TI, ou aquelas que
procuram automatizar o máximo possível, podem optar por evitar essa opção de arquitetura. As
organizações que buscam um alto grau de consistência no repositório comum de metadados
podem se beneficiar de uma arquitetura centralizada.
Centralizada
•Distribuída
Uma arquitetura completamente distribuída mantém um único ponto de acesso. O mecanismo de
recuperação de metadados responde às solicitações do usuário, recuperando dados dos sistemas
de origem em tempo real; não há repositório persistente.
Nessa arquitetura, o ambiente de gerenciamento de metadados mantém os catálogos do sistema
de origem e as informações de pesquisa necessárias para processar efetivamente as consultas e
pesquisas do usuário.
Um broker de solicitação de objeto comum ou protocolo de middleware semelhante acessa esses
sistemas de origem.
•Híbrida
Uma arquitetura híbrida combina características de arquiteturas centralizadas e distribuídas. Os
metadados ainda transitam diretamente dos sistemas de origem para um repositório
centralizado. No entanto, o design do repositório considera apenas os metadados adicionados
pelo usuário, os itens padronizados críticos e as adições de fontes manuais.
•Planejar
No estágio Planejar (Plan), a equipe de qualidade dos dados (QD) avalia o escopo, o impacto e a
prioridade dos problemas conhecidos e avalia alternativas para resolvê-los. Esse plano deve ser
baseado em uma base sólida de análise das causas dos problemas. A partir do conhecimento das
causas e do impacto dos problemas, é possível entender o custo / benefício, determinar a
prioridade e formular um plano básico para resolvê-los.
•Fazer
No estágio Fazer (Do), a equipe de qualidade de dados lidera os esforços para abordar as causas
principais dos problemas e planejar o monitoramento contínuo dos dados. Para causas raízes
baseadas em processos não técnicos, a equipe de QD pode trabalhar com os responsáveis pelos
processos para implementar mudanças. Para causas raiz que exigem alterações técnicas, a equipe
de QD deve trabalhar com equipes técnicas e garantir que os requisitos sejam implementados
corretamente e que nenhum erro não intencional seja introduzido por alterações técnicas.
•Verificar
O estágio de Verificar (Check) envolve o monitoramento ativo da qualidade dos dados, conforme
medido em relação aos requisitos. Desde que os dados atendam aos limites definidos para a
qualidade, ações adicionais não são necessárias. Os processos serão considerados sob controle e
atendendo aos requisitos de negócios. No entanto, se os dados estiverem abaixo dos limites de
qualidade aceitáveis, ações adicionais deverão ser tomadas para elevá-lo a níveis aceitáveis.
•Agir
O estágio Agir (Act) é para atividades que abordam e resolvem problemas emergentes de
qualidade de dados. O ciclo é reiniciado, à medida que as causas dos problemas são avaliadas e as
soluções propostas. A melhoria contínua é alcançada iniciando um novo ciclo.
Novos ciclos começam como:
As medidas existentes caem abaixo dos limites.
Novos conjuntos de dados estão sob investigação.
Novos requisitos de qualidade de dados emergem para conjuntos de dados existentes.
Regras, padrões ou expectativas de negócios mudam.
Estabelecer critérios para a qualidade dos dados no início de um processo ou construção do
sistema é um sinal de uma organização com maturidade no gerenciamento de dados. Fazer isso
exige governança e disciplina, além de colaboração multifuncional.
Integrar a qualidade nos processos de gerenciamento de dados desde o início custa menos do
que modernizá-la. Manter dados de alta qualidade em todo o ciclo de vida dos dados é menos
arriscado do que tentar melhorar a qualidade em um processo existente. Isso também cria um
impacto muito menor na organização.
É melhor fazer as coisas corretamente da primeira vez, embora poucas organizações tenham o
cuidado de fazê-lo. Mesmo se o fizerem, gerenciar a qualidade é um processo contínuo. As
demandas em mudança e o crescimento orgânico ao longo do tempo podem causar problemas
de qualidade dos dados que podem ser onerosos se desmarcados, mas podem ser cortados pela
raiz se uma organização estiver atenta aos riscos potenciais.
Nível 2 - Repetível
x
Surgimento de ferramentas consistentes e definição de função para apoiar a execução do
processo.
No nível 2, a organização começa a usar ferramentas centralizadas e a fornecer mais supervisão
para o gerenciamento de dados.
As funções são definidas e os processos não dependem apenas de um especialista.
Existe conscientização organizacional sobre questões e conceitos de qualidade de dados.
Os conceitos de gerenciamento de dados mestre e de referência começam a ser reconhecidos.
Os critérios de avaliação podem incluir a definição formal de função em artefatos, como
descrições de tarefas, a existência de documentação do processo e a capacidade de alavancar
conjuntos de ferramentas.
Nível 3 - Definido
x
Capacidade emergente de gerenciamento de dados.
O Nível 3 vê a introdução e a institucionalização de processos escaláveis e uma visão do
gerenciamento de dados como um facilitador organizacional.
As características incluem a replicação de dados em uma organização com alguns controles em
vigor e um aumento na qualidade dos dados, juntamente com definição e gerenciamento
coordenados de políticas.
Uma definição de processo mais formal leva a uma redução significativa na intervenção manual.
Isso, junto com um processo de design centralizado, significa que os resultados do processo são
mais previsíveis.
Os critérios de avaliação podem incluir a existência de políticas de gerenciamento de dados, o uso
de processos escalonáveis e a consistência de modelos de dados e controles do sistema.
Nível 4 - Gerenciado
x
O conhecimento institucional adquirido com o crescimento nos níveis 1 a 3 permite que a
organização preveja resultados ao abordar novos projetos e tarefas e comece a gerenciar os
riscos relacionados aos dados.
O gerenciamento de dados inclui métricas de desempenho.
As características do nível 4 incluem ferramentas padronizadas para gerenciamento de dados,
das estações de trabalho à infraestrutura, juntamente com uma função centralizada de
planejamento e governança.
As expressões desse nível são um aumento mensurável na qualidade dos dados e nos recursos
de toda a organização, como auditorias de dados de ponta a ponta.
Os critérios de avaliação podem incluir métricas relacionadas ao sucesso do projeto, métricas
operacionais para sistemas e métricas de qualidade dos dados.
Nível 5 - Otimizado
x
Quando as práticas de gerenciamento de dados são otimizadas, elas são altamente previsíveis,
devido à automação de processos e gerenciamento de mudanças tecnológicas.
As organizações nesse nível de maturidade se concentram na melhoria contínua.
No nível 5, as ferramentas permitem uma visualização dos dados entre os processos.
A proliferação de dados é controlada para evitar duplicação desnecessária.
Métricas bem entendidas são usadas para gerenciar e medir a qualidade e os processos dos
dados. Os critérios de avaliação podem incluir artefatos e métricas de gerenciamento de
mudanças na melhoria do processo.
Digamos que uma organização reconheça a necessidade de melhorar a qualidade de seus dados.
No entanto, sua avaliação atual do estado mostra que encontra-se no Nível 1. Ainda não
estabeleceu práticas repetíveis em torno da medição da qualidade dos dados, mas há indivíduos
que testaram as águas e descobriram algumas coisas. Com base em sua estratégia geral,
estabelece uma meta de passar do Nível 1 para o Nível 3 dentro de 18 meses.
Atingir esse objetivo requer um plano de ação que explique vários fluxos de trabalho:
•Pesquisa de abordagens para medir a qualidade dos dados e adoção de uma abordagem
alinhada com os pontos problemáticos da organização, as metas de medição e o setor.
•Treinamento de equipe sobre a metodologia.
•Identificação e adoção de ferramentas para apoiar a execução da metodologia.
Além de executar planos para atingir essas metas, os líderes também devem levar em
consideração o desenvolvimento futuro (ou seja, ao passar para o Nível 3, a organização também
deverá se preparar para passar para o Nível 4).
Esse exemplo simples mostra o processo de pensamento em torno do planejamento para a
melhoria de um componente do gerenciamento de dados. As avaliações de maturidade do
gerenciamento de dados podem ter diferentes áreas de foco.
Se sua organização avaliar de forma abrangente suas práticas de gerenciamento de dados, a saída
identificará diversas oportunidades de melhoria. Eles precisarão ser priorizados para apoiar a
estratégia de negócios.
Um modelo de maturidade de gerenciamento de dados inclui orientações internas, descrevendo
como é o progresso dentro e entre as áreas funcionais de gerenciamento de dados. O caminho
para a melhoria baseado em etapas pode ser adaptado às necessidades e prioridades de uma
organização.
Para cada um dos recursos (Governança, Arquitetura, etc.), o anel externo da tela mostra o nível
de capacidade que a organização determinou que precisa para competir com sucesso. O anel
interno exibe o nível de capacidade conforme determinado pela avaliação. As áreas em que a
distância entre os dois anéis é maior representam os maiores riscos para a organização. Esse
relatório pode ajudar a definir prioridades, como também, ser utilizado para medir o progresso ao
longo do tempo.
O objetivo de uma avaliação do estado atual é compreender o ponto de partida da organização
para planejar a melhoria. Uma avaliação precisa é mais importante que uma pontuação alta. Uma
avaliação formal da maturidade do gerenciamento de dados coloca a organização na escala de
maturidade, esclarecendo os pontos fortes e fracos de atividades críticas de gerenciamento de
dados. Ajuda a organização a identificar, priorizar e implementar oportunidades de melhoria.
Ao atingir seu objetivo principal, um DMMA pode ter um impacto positivo na cultura. Isso auxilia a:
•Conscientizar as partes interessadas sobre os conceitos, princípios e práticas de
gerenciamento de dados.
•Esclarecer as funções e responsabilidades das partes interessadas em relação aos dados
organizacionais.
•Destacar a necessidade de gerenciar dados como um ativo crítico.
•Ampliar o reconhecimento das atividades de gerenciamento de dados em toda a
organização.
•Contribuir para melhorar a efetividade da governança de dados.
Com base nos resultados da avaliação, uma organização pode aprimorar seu programa de
gerenciamento de dados, de forma a apoiar as atividades estratégicas da organização.
Normalmente, os programas de gerenciamento de dados são desenvolvidos em silos
organizacionais. Raramente começam com uma visão corporativa dos dados.
Um estudo de DMMA pode prover à organização meios para desenvolver uma visão coesa e
estratégica; além de permitir uma avaliação clara e criteriosa de suas prioridades, redefinição de
objetivos e desenvolvimento de um plano integrado de melhoria.
Visão clara
Os líderes devem garantir que todas as partes interessadas afetadas pelo gerenciamento de
dados - tanto internas quanto externas - entendam e internalizem o que é gerenciamento de
dados, por que é importante e como o trabalho deles afetará e será afetado por eles.
Alinhamento da liderança
O alinhamento da liderança garante que haja acordo - e suporte unificado para - a necessidade
de um programa de gerenciamento de dados e que haja acordo sobre como o sucesso será
definido. O alinhamento da liderança inclui o alinhamento entre as metas dos líderes e os
resultados do gerenciamento de dados, além de valor e alinhamento de propósito entre os
líderes.
Comunicação
A organização deve garantir que as partes interessadas tenham um entendimento claro do que é
o gerenciamento de dados e a sua importância. O que sofrerá transformações e quais mudanças
no comportamento são necessárias.
Orientação e treinamento
A capacitação é essencial para que o gerenciamento de dados aconteça. Diferentes grupos de
pessoas (líderes, gestores de dados, equipes técnicas) exigirão diferentes tipos e níveis de
educação para que possam desempenhar suas funções de maneira eficiente. Diversas pessoas
precisarão de treinamento em novas políticas, processos, técnicas, procedimentos e até
ferramentas.
Avaliação da adoção
Crie métricas em torno do progresso e da adoção das diretrizes de gerenciamento de dados
visando manter a continuidade da execução do programa de gerenciamento de dados. O aspecto
facilitador do gerenciamento de dados pode se concentrar na melhoria dos processos centrados
em dados, como identificação de risco e eficiência da execução do projeto. O aspecto de inovação
do gerenciamento de dados pode se concentrar na melhoria na tomada de decisão e na análise
por meio de dados aprimorados e confiáveis.
O gerenciamento de gastos
Expressa como o custo do gerenciamento de dados é alocado em uma organização e identifica os
impactos desse custo na sustentabilidade e no valor. Essas métricas se sobrepõem às métricas de
governança de dados.
Taxa de mudança
A taxa na qual uma organização está melhorando sua capacidade. Uma linha de base é
estabelecida por meio do DMMA. A reavaliação periódica é usada para melhorar a tendência.
Governança corporativa
Os elementos principais da boa governança corporativa estão vigentes e estão bem implantados?
Operam isoladamente um do outro ou garantem uma abordagem sincronizada? As atividades
relevantes e adaptáveis são realizadas regularmente e de forma eficiente? A governança deve
alinhar-se conformidade.
Liderança e patrocínio
Existem pessoas chaves nos níveis estratégicos da organização que compreendem a importância
e o valor do que está sendo feito? Apoiarão para garantir que se obtenha o tempo necessário
para demonstrar o verdadeiro valor advindo desse processo.
Políticas
Existem políticas, padrões, procedimentos para garantir que as pessoas da organização tenham
um instrumento de alinhamento estratégico? Essas políticas, procedimentos e padrões são claras,
consistentes e fáceis de utilizar? Existe uma estrutura para demonstrar a inter-relação entre essas
políticas?
Risco de informação
O risco das informações está bem definido e em que nível, tendo em vista a importância do
negócio? As ferramentas vigentes para auxiliar o gerenciamento de dados e adequada para
mitigar os riscos adequadamente?
Arquitetura
Como as informações de toda a organização são estruturadas e como transitam entre os silos? As
arquiteturas estão mapeadas? Quais são os responsáveis?
Habilidades
Quais habilidades são necessárias para alcançar os objetivos de gerenciamento de dados
definidos pela organização? A organização dispõe de programas de treinamento para os
profissionais de dados e de informações?
Métricas
As funções de gerenciamento de dados são mensuradas do ponto de vista de desempenho e
demonstrada por meio de relatórios que apontam os benefícios alcançados? O resultado do
processo de mensuração é direcionado para as mudanças comportamentais pretendidos pela
cultura de valorização de dados?
Tecnologia
A tecnologia disponível é facilmente escalável e adequada para atender os processos de
gerenciamento de dados?