Apostila Texto - ADD (1) Datawarehouse
Apostila Texto - ADD (1) Datawarehouse
Apostila Texto - ADD (1) Datawarehouse
2016
Análise Dimensional e Data Warehouse
Fernando Hadad Zaidan
©Copyright do Instituto de Gestão em Tecnologia da Informação.
Todos os direitos reservados.
Introdução
Entidade
Relacionamento
Atributos identificadores
Atributo qualificador
Atributo:
Abstração de uma propriedade de uma entidade ou de um
relacionamento.
- Nada mais é do que a informação associada à entidade ou relacionamento.
- Os atributos são os dados referentes à entidade.
Os atributos que nunca se repetem em uma entidade, chamamos
de atributo-identificador, que são candidatos à chave-primária das
tabelas.
Relacionamento:
Associação entre diferentes entidades. A ligação conceitual entre as
entidades é chamada de relacionamento. Definimos relacionamento como
o fato, o acontecimento que liga dois objetos, duas “coisas” do mundo
real. Os relacionamentos são os elementos que nos dão o sentido da
existência destes objetos e suas interrelações.
Cardinalidade:
Expressa o número de entidades às quais outra entidade pode estar
associada. Ex:
- um para um (1-1);
- um para muitos ou muitos para um (1-N) ou (N-1);
- muitos para muitos (N-N).
Normalização
Introdução
Tabelas fatos
• Contêm valores (métricas)
• E as chaves
• Podem existir várias no modelo
• Pk=concatenação de Fk das dimensões
• Uso de chaves sequenciais
Desnormalização:
Na modelagem do banco de dados relacional aplicamos a normalização
(formas normais). Contudo, no DW ou Data Marts faz-se necessário, em
alguns casos, desnormalizar as tabelas. Visa obter o grau de desempenho
elevado ao reduzir o número de junções das tabelas. Agilidade na
consolidação também é uma característica da desnormalização.
SCHEMA STARFLAKE
– Combinação das duas anteriores
– Dimensões com N x N com outras tabelas
GALAXY SCHEMA
– Várias fatos
– As dimensões podem estar dispostas de formas diversas
– As tabelas fatos não se relacionam
Capítulo 3 – Arquitetura do Data Warehouse
Introdução
Data Warehouse
Uma arquitetura de alto nível do B.I. Fonte: Turban et al. ,2004, p.30
Análise dimensional e Data Warehouse . 18
O Data Warehouse (DW) é um componente central de uma
infraestrutura de Business intelligence (BI), funciona como um repositório,
ou seja, um armazém de análise de informações numéricas estáveis e
verificáveis.
O projeto de DW mais conhecido é denominado banco de dados
dimensional. Este banco de dados trabalha com tabelas denominadas fato
e dimensão. Os fatos armazenam valores detalhados de medidas e as
tabelas de dimensão, que armazenam os membros das dimensões,
denominados atributos. O quadro 1 demonstra a comparação entre o
modelo dimensional com o modelo relacional.
Fundamentos e conceitos
Hierarquias em dimensões
Conceitos
Métricas e granularidade
• Quantidade
• Valor
• Custo do produto
• Lucro
• Consumo
• Etc.
– Consultas OLAP
– Forma física de tabelas relacionais vistas como estruturas dimensionais
Operações especiais permitem decompor um cubo de N dimensões em
sub-cubos de até três dimensões.
O cubo
A construção de um DW