Modelagem Da Informação

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 26

Modelagem

da Informação
Material Teórico
Modelagem de Dados no Power BI

Responsável pelo Conteúdo:


Prof. Me. José Ahirton Batista Lopes Filho

Revisão Textual:
Prof.ª Me. Sandra Regina Fonseca Moreira
Modelagem de Dados no Power BI

• Power BI para Modelagem de Dados;


• Usando o Power BI;
• O Esquema Relacional.

OBJETIVOS DE APRENDIZADO
• Capacitar os alunos para a utilização da ferramenta Power BI para Modelagem de Dados;
• Impulsionar o pensamento crítico quanto a utilização de ferramentas para modelagem
de dados e criação de visualizações para orientação à tomada de decisões, não só nas
especificidades de desenvolvimento, mas, de fato, pensando em como atender às neces-
sidades de negócios reais.
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Conserve seu
material e local de
estudos sempre
organizados.
Aproveite as
Procure manter indicações
contato com seus de Material
colegas e tutores Complementar.
para trocar ideias!
Determine um Isso amplia a
horário fixo aprendizagem.
para estudar.

Mantenha o foco!
Evite se distrair com
as redes sociais.

Seja original!
Nunca plagie
trabalhos.

Não se esqueça
de se alimentar
Assim: e de se manter
Organize seus estudos de maneira que passem a fazer parte hidratado.
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como seu “momento do estudo”;

Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma


alimentação saudável pode proporcionar melhor aproveitamento do estudo;

No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos
e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam-
bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua
interpretação e auxiliarão no pleno entendimento dos temas abordados;

Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus-
são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o
contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e
de aprendizagem.
UNIDADE Modelagem de Dados no Power BI

Power BI para Modelagem de Dados


Diante de mudanças constantes, tais como o volume crescente de dados (o cha-
mado Big Data) e a cada vez maior pressão por decisões mais produtivas, o BI
(Business Intelligence), ou Inteligência Empresarial, surge como um arcabouço de
técnicas e tecnologias indispensáveis no auxílio a gestores e organizações na defini-
ção de estratégias, avaliações, correções de planejamentos e de apoio a gestão de
negócios e melhor tomada de decisões.

Nesse contexto, o Power BI vem despontando como uma das soluções mais robustas dispo-
Explor

níveis, uma vez que tem muitos usos, adeptos ao redor do mundo, grandes empresas utiliza-
doras e material de referência fartamente disponível.
Disponível gratuitamente, para Windows, em: http://bit.ly/37A0jtb

Um desses usos, e o mais interessante no contexto desta disciplina de Mo-


delagem da Informação, é a possibilidade de modelagem de dados de modo a
facilitar o chamado self service BI, ou como conhecido em português, BI de
autoatendimento, tornando mais fácil o processo de conexão a dados, visuali-
zação e análise.

O Power BI é uma solução completa que inclui não só o carregamento de dados


e modelagem, mas também auxilia na utilização de diferentes métricas, bem como
na construção e distribuição de relatórios.

O software pode então se utilizar dos dados de origem e executar a mode-


lagem de dados em forma de processo, de modo bastante facilitado, além de
fornecer uma interface de usuário poderosa para a construção de análises e
relatórios variados.

Quer ver diferentes exemplos de painéis e relatórios feitos por usuários de todo o mundo?
Explor

Acesse o Data Stories Gallery, parte do site Microsoft Power BI Community no seguinte link:
http://bit.ly/37qLw3A

A adoção do Power BI para auxílio na modelagem de dados tem aumentado,


haja vista que um dos pontos fortes do software é que não é necessário nivelar os
dados em uma tabela. Ao invés disso, pode-se usar várias tabelas, de várias fontes
diferentes, e se definir a relação entre elas, o que será apresentado a partir de exem-
plo prático nesta unidade. 

Também podemos, por exemplo, criar cálculos personalizados e atribuir no-


vas métricas para se exibir segmentos específicos de dados, bem como usar essas
novas medidas em visualizações para uma fácil modelagem, tudo de acordo com
nosso escopo específico de negócio.

8
Por que modelar dados no Power BI?
A abordagem clássica de BI de autoatendimento geralmente segue a abordagem
descrita na Figura 1 abaixo:

Carregar dados Definir métricas Produzir reports

Figura 1 – Exemplo clássico de um self service BI convencional

Esta é a solução implementada pela ampla maioria de usuários que necessitam de um BI de


Explor

autoatendimento. Mas, afinal, o que seria um BI de autoatendimento?

Um BI de autoatendimento é uma abordagem na qual as equipes de dados forne-


cem soluções, sistemas e aplicações para que as outras equipes da empresa possam
acessar dados inerentes ao negócio de forma mais simplificada, de modo que eles
mesmos consigam fazer suas próprias análises, de modo independente.

Na estrutura mais tradicional, de acordo com o observado na Figura 1, ba-


sicamente se encontram fontes de dados, então há a devida conexão a elas,
importando-se o que se precisa à medida em que todos os cálculos necessários
são devidamente adicionados antes de se criar as visualizações e painéis (do
inglês, dashboards).

É exatamente para isso que o produto foi projetado, geralmente funcionando


perfeitamente a partir de uma grande variedade de fontes de dados.

Outro ponto a favor da utilização do Power BI é a existência do DAX (Data


Analysis Expressions), a linguagem de fórmulas proprietária do software, a qual,
em sua versão mais recente, pode ser utilizada para estender um modelo de dados
com métricas adicionais complexas. Ainda, o software também fornece recursos de
modelagem de dados que permitem a adição de hierarquias e definição de KPIs (do
inglês, key performance indicators), nossos indicadores para tomada de decisões.

No entanto, essa abordagem da Figura 1 pressupõe que os dados de origem


sejam compreensíveis para os usuários, e fáceis de se aplicar. Essa é uma suposi-
ção deveras otimista, uma vez que pode não funcionar quando nossa aplicação se
utiliza de dados mais complexos.

Dito isto, ultimamente tem havido uma mudança de paradigma quando fala-
mos em BI de autoatendimento. Mais especificamente, falamos da adição de uma
camada de metadados aos dados de origem para tornar as informações acessíveis
aos usuários. Esta é a abordagem descrita na Figura 2 a seguir:

9
9
UNIDADE Modelagem de Dados no Power BI

Modelar um Data Produzir reports


Carregar dados Definir métricas
Warehouse (DW)

Figura 2 – Exemplo clássico de um self service BI mais atual

Podemos perceber que não há nada original nessa abordagem; inclusive é o que a grande
Explor

maioria dos arquitetos e desenvolvedores de BI faz a partir do SQL Server há anos. Então, por
que não a aplicar a uma solução para modelagem de dados a partir do Power BI?

Pode ser uma surpresa para alguns, mas o Power BI pode, com o auxílio de ou-
tros produtos Microsoft, tornar-se uma solução de BI completa. Isso ocorre porque,
embora seja uma ferramenta única, permite executar as principais etapas de um
processo de BI.

A saber, para o processo de carregamento de dados temos, por exemplo, a inter-


face do Power BI Query Editor; para o processo de modelagem, podemos utilizar
ambos Power BI e Power BI Query Editor; para métricas, temos o Power BI e o
DAX; para a criação de relatórios temos o Power BI e, para distribuição do que foi
criado, podemos utilizar o PowerBI.com.

Ainda em comparação com o SQL Server, o Power BI leva certa vantagem


quando falamos de:
• Desenvolvimento de um data warehouse para construção de provas de concei-
to (POCs) em um curto prazo;
• Projetos onde devemos evitar estender um data warehouse corporativo para
capacitar apenas um pequeno grupo de usuários;
• Fornecimento de uma solução em específico e personalizada para um conjunto
de usuários;
• Fornecimento de uma solução direcionada para um grupo específico de usuá-
rios em que uma solução corporativa não é rentável;
• Projetos onde vamos permitir que os usuários acessem dados de fora dos da-
dos corporativos específicos que eles usam tradicionalmente (normalmente
fontes de Big Data).

A variedade de recursos que o Power BI oferece permite executar todas as se-


guintes tarefas diárias do BI, seja para carga de dados (sequenciamentos de cargas,
pesquisas de dados, conversão de tipo de dados dentre outros), seja para modela-
gem de dados e métricas (desenho do esquema, seja dimensional ou tabular, utili-
zação de camada semântica, onde podemos renomear objetos para maior clareza,
auxílio a hierarquias, KPIs e cálculo de métricas), bem como para camada de apre-
sentação (comparação de tipos de visualização, criação de pesquisa hierárquica,
definição de requisitos de interação do usuário) e muito mais.

10
Modelagem Star Schema vs. Snowflake Schema
O esquema em estrela (no inglês, star schema) é o tipo de modelo multidimen-
sional usado em data warehouses. No esquema em estrela, as tabelas de fatos e
as tabelas de dimensões estão contidas. Nesse esquema, menos junções de chaves
estrangeiras (foreign-key join) são usadas. Este esquema forma uma estrela com a
tabela de fato, e as tabelas de dimensões.

Dimension
Table Dimension
Table

Fact
Dimension Table
Table Dimension
Table

Dimension
Table

Figura 3 – Exemplo de Star Schema

Já o esquema de floco de neve (do inglês, snowflake schema) é outro tipo de


modelo multidimensional usado para a construção de data warehouses onde estão
contidas as tabelas de fatos, as tabelas de dimensão e as tabelas de subdimensão.
Esse esquema forma um floco de neve com tabelas de fatos, tabelas de dimensão e
tabelas de subdimensão, como na Figura 4 a seguir:

Sub-dimensional Sub-dimensional
Table Sub-dimensional
Table Table
Dimension
Table Dimension
Table

Sub-dimensional
Table Fact Sub-dimensional
Table
Dimension
Table
Table
Dimension
Table

Sub-dimensional Sub-dimensional
Table Dimension Table
Table

Sub-dimensional Sub-dimensional
Table Table

Figura 4 – Exemplo de Snowflake Schema

11
11
UNIDADE Modelagem de Dados no Power BI

Algumas das diferenças entre os esquemas em estrela e floco de neve, podem


ser definidas como:
• No esquema em estrela, as tabelas de fatos e as tabelas de dimensões estão
contidas. Já no esquema de floco de neve além das tabelas de fatos e das tabe-
las de dimensões, as subdimensionais também estão contidas;
• O esquema em estrela é um modelo de cima para baixo, enquanto o esquema
em floco de neve é considerado um esquema de baixo para cima;
• O esquema em estrela usa mais espaço, enquanto o esquema em floco de neve
usa menos espaço;
• Leva-se menos tempo para a execução de consultas no esquema em estrela;
• No esquema em estrela, a Normalização não é usada. Enquanto isso, a norma-
lização e a desnormalização são usadas no esquema em floco de neve;
• O design no esquema em estrela é muito simples, enquanto no esquema floco
de neva o design é complexo;
• A complexidade da consulta do esquema em estrela é baixa;
• O entendimento no esquema em estrela é muito simples.

Usando o Power BI
Agora que já sabemos o que o Power BI oferece, vamos nos concentrar nos
aspectos relacionados à modelagem de modo que, a partir de exemplos práticos,
possamos abordar os seguintes tópicos:
• Aplicação de uma estrutura dimensional lógica a uma fonte de dados relacional;
• Adaptação da camada semântica e adição de métricas calculadas e algu-
mas hierarquias.

Isso permitirá que você aprecie alguns dos aspectos mais conhecidos do Power
BI Query Editor no Power BI Desktop. O que veremos acaba por incluir também:
• Junção de tabelas a nível da consulta;
• Utilização de consultas intermediárias ocultas como uma área de preparação
de dados;
• Geração e aplicação de chaves substitutas no Power BI Query Editor;
• Renomeação de consultas e campos;
• Adição de hierarquias;
• Criação de medidas calculadas.

12
O Esquema Relacional
Os dados exemplo da atividade desta unidade estão disponíveis em um banco de
dados OLTP (transacional) simples, que contém seis tabelas, devidamente ilustradas
na Figura 5 a seguir:

Figura 5 – Tabelas do banco de dados exemplo referente


a vendas de carros e suas devidas informações
Fonte: ASPIN, 2016

Claramente, esse esquema não representa uma arquitetura de dados corpora-


tivos completa, no entanto, é suficiente para os propósitos do exemplo, pois nos
permitirá sobrepor o design relacional existente com uma topologia de dados radi-
calmente diferente, e então estendê-lo com uma dimensão de tempo, passos esses
que serão explicados melhor nas sessões seguintes desta unidade.
Para a feitura do exemplo a seguir, passo a passo, considere o seguinte cenário:
como usuários, para nossa análise, precisaremos de dados distribuídos entre dife-
rentes tabelas; também desejamos uma camada de apresentação simplificada que
nos forneça atributos e métricas em um esquema em estrela clássico.
Explor

Mais informações sobre o esquema estrela em: http://bit.ly/2TSd8uI

De fato, podemos simplificar ao máximo a visão de nossa arquitetura de BI ideal


exemplo (ou seja, nosso esquema dimensional desejado), como mostrado na Figura 6:

Localização
Geográfica

Clientes Vendas Veículos

Tempo

Figura 6 – Visão de arquitetura ideal para o exemplo da unidade

13
13
UNIDADE Modelagem de Dados no Power BI

Carregando dados
Como primeira etapa na criação de um esquema em estrela sobre um modelo
relacional, precisamos carregar os dados. Este exemplo usará o conhecido banco
de dados de exemplo, intitulado CarSalesData, consistindo em dados de vendas de
automóveis, ou seja, dados sobre carros, modelos, concessionárias, fabricantes etc.

Os arquivos referidos nessa unidade podem ser baixados no seguinte link do Google Drive,
Explor

disponível em: http://bit.ly/38Bb2U1

Se você preferir evitar o problema de criar um banco de dados e executar o


script para preencher as tabelas, os dados dessas tabelas também estão em uma
planilha denominada CarSales_Tables, também fornecida no link acima. Os passos
para carregar os dados exemplo no Power BI são:
1. Iniciar o Power BI Desktop e clicar em Obter Dados, na tela inicial;
2. Clique em Banco de Dados, Banco de Dados do SQL Server e então
em Conectar;
3. A caixa de diálogo Banco de Dados do SQL Server será exibida;
4. Digite o Nome do Servidor, clique em Importar e OK;
5. A caixa de diálogo Navegador será exibida;
6. Expanda o banco de dados CarSalesData e selecione as seis tabelas que
estão no DER da Figura 5;
A caixa de diálogo Navegador será semelhante à da Figura 7 a seguir:

Figura 7 – Caixa de diálogo Navegador (do inglês, Navigator)


Fonte: ASPIN, 2016

7. Clique em Editar. O Editor de Consultas do Power BI (Query Editor) abri-


rá e exibirá as tabelas que você selecionou. Podemos ver melhor isso na
Figura 8 a seguir:

14
Figura 8 – Editor de Consultas do Power BI (do inglês, Query Editor)
Fonte: ASPIN, 2016

8. No painel Consultas, à esquerda da tela, clique com o botão direito do


mouse em cada tabela de dados de origem individualmente e desmarque
a opção Ativar Carregamento;
Esse passo fará com que as tabelas de origem sejam transformadas em
tabelas intermediárias, as quais não estarão visíveis para nossos usuários
finais, mas que poderão ser usadas como base para as transformações
de dados que serão aplicadas posteriormente. Os nomes das tabelas apa-
recerão em itálico no painel Consultas, à esquerda;
9. Renomeie todas as consultas para remover o prefixo Data.

Ao final desse passo-a-passo, nossa primeira etapa, de carregamento de dados, es-


tará concluída. Como produto desta etapa temos nossos dados relacionais disponí-
veis no Power BI Desktop, prontos para a correta modelagem dimensional.

Criando a dimensão do veículo


Uma rápida análise nos dados de origem mostra que os atributos que descrevem
os veículos podem ser encontrados em algumas tabelas tais como Stock (estoque)
e Colors (cores).

Portanto, precisamos isolar os atributos necessários dessas tabelas e criar uma


única tabela virtual (em verdade, uma outra consulta), a qual ficará visível para o
usuário como a dimensão Vehicle (veículo).
1. Clique com o botão direito do mouse na consulta Stock e selecione Re-
ferência (Reference);
2. Isso criará uma cópia da consulta de estoque que dependerá dos dados
de origem na consulta de origem;
3. No painel de Configurações da Consulta (Query Settings), à direita, reno-
meie a consulta Stock (2) para Dim_Vehicle;

15
15
UNIDADE Modelagem de Dados no Power BI

4. Deixando a consulta Dim_Vehicle selecionada, clique em Mesclar Con-


sultas (Merge);
5. Quando a caixa de diálogo Mesclar aparecer, clique na coluna ColorID
na parte superior da caixa de diálogo;
6. Selecione a consulta Colors na lista pop-up e clique na coluna ColorID
na parte inferior da caixa de diálogo;
7. Defina o tipo de junção (Join) como interno (Inner);

Se tudo foi feito corretamente, você terá resultado semelhante ao da Figura 9:

Figura 9 – Exemplo de Junção (Merge) no Power BI


Fonte: ASPIN, 2016

8. Clique em OK. Uma nova coluna (NewColumn) aparecerá à direita da


tabela de dados;
9. Clique no ícone à direita da nova coluna;
10. No pop-up, selecione o botão de opção Expandir, desmarque ColorID e
desmarque a opção Usar o Nome da Coluna Original como Prefixo;
11. Clique em OK. A coluna Color da consulta Colors será adicionada à
consulta Dim_Vehicle;
12. Como efeito disso, você acabou de criar uma visualização com base nas
duas consultas;
13. Clique com a tecla Control pressionada para selecionar as seguintes co-
lunas: Make (Marca), Model (Modelo), VehicleType (Tipo de veículo) e
Color (Cor);
14. Em seguida, clique com o botão direito do mouse em qualquer uma das
colunas selecionadas e escolha a opção Remover Outras Colunas;
15. Isso deixará você com uma tabela de dados contendo apenas quatro colunas;
16. Essas colunas são os atributos exigidos pela dimensão Vehicle (Veículo);
17. Selecione todas as quatro colunas na tabela e, na faixa inicial, clique em
Remover Linhas e, em seguida, em Remover Duplicatas. Assim, somente
registros exclusivos permanecerão na tabela;

16
18. Na faixa de opções Adicionar Coluna, clique no triângulo pop-up no
botão Adicionar Coluna de Índice. Selecionar desde 1;
19. Então, uma nova coluna contendo um identificador monotônico cres-
cente único será adicionada. Essa será a chave substituta (no inglês,
surrogate key);
20. Clique com o botão direito do mouse na nova coluna e renomeie-a para
VehicleSK.

A consulta da dimensão final será semelhante à da Figura 10 a seguir:

Figura 10 – Exemplo da nossa dimensão VehicleSK criada nos passos anteriores


Fonte: ASPIN, 2016

Criando a tabela de fatos Vendas


Vamos agora criar a tabela de fatos que mostra todas as vendas de carros do
banco de dados de origem. Podemos fazer a criação da seguinte maneira:
1. Clique com o botão direito do mouse na consulta InvoiceLines e selecio-
ne Referência;
2. A partir desse comando será criada uma cópia da consulta de origem.
A consulta recém-criada usará a consulta original como fonte de dados;
3. Clique com o botão direito do mouse na tabela de referência que você
acabou de criar e selecione Renomear. Chame-a de Fact_Sales;
4. Deixando a consulta Fact_Sales selecionada, na faixa de opções Início,
clique em Mesclar Consultas. Quando a caixa de diálogo Mesclar apare-
cer, clique na coluna StockID, na parte superior da caixa de diálogo;
5. Selecione a consulta Stock na lista pop-up e clique na coluna StockID na
parte inferior da caixa de diálogo;

17
17
UNIDADE Modelagem de Dados no Power BI

6. Defina o tipo de Junção como Interno (lembrando, inner join). Clique


em OK;
7. Clique no ícone à direita da nova coluna;
8. No pop-up, selecione o botão de opção Expandir, desmarque Selecionar
todas as colunas e também desmarque Usar o nome da coluna original
como prefixo;
9. Selecione as colunas Make, Model, VehicleType e ColorID e clique em OK;
10. Clique em Mesclar Consultas;
11. Quando a caixa de diálogo Mesclar aparecer, clique na coluna
NewColumn.ColorID na parte superior da caixa de diálogo;
12. Selecione a consulta Colors na lista pop-up e clique na coluna ColorID
na parte inferior da caixa de diálogo;
13. Defina o tipo de junção como interno (inner). Clique em OK;
14. Clique no ícone à direita da nova coluna. No pop-up, selecione o botão
de opção Expandir, desmarque ColorID e desmarque Usar o nome da
coluna original como prefixo;
15. Selecione as colunas Make, Model, VehicleType e ColorID e clique OK;
16. Clique em Mesclar consultas (merge queries);
17. Quando a caixa de diálogo Mesclar aparecer, clique nas colunas
NewColumn.Make, NewColumn.Model, NewColumn.VehicleType e
NewColumn.Color, nesta respectiva ordem;
18. Selecione a consulta Dim_Vehicle na lista pop-up de consultas disponíveis;
19. Clique nas colunas Make, Model, VehicleType e Color, nesta ordem, na
parte inferior da caixa de diálogo e clique em OK;
20. Você estará então ingressando nas duas consultas utilizando-se de vá-
rios campos;
21. Clique no ícone à direita da nova coluna. No pop-up, selecione o botão
de opção Expandir, desmarque a opção Selecionar todas as colunas e
selecione apenas a coluna VehicleSK. Clique em OK;
22. Selecione os VehiclePrice e VehicleSK na tabela Fact_Sales;
23. Clique com o botão direito do mouse em qualquer uma dessas colunas e
selecione Remover outras colunas;
A tabela de fatos será semelhante à da Figura 11 a seguir:

18
Figura 11 – Exemplo da nossa tabela de fatos criada nos passos anteriores.
Fonte: ASPIN, 2016

O processo feito permite detectar e adicionar o campo VehicleSK da dimensão do


veículo à tabela de fatos.

Adicionando uma dimensão de tempo


É difícil imaginar um data warehouse, mesmo em um modelo exemplo pequeno
como o estudado nesta unidade, sem uma dimensão de tempo. Então, vamos ver como
adicionar isso ao modelo em alguns poucos passos, de maneira facilitada e intuitiva:
1. Na Visualização de Dados (Data View), ative a faixa de opções Modela-
gem e clique no botão Nova Tabela;
2. A expressão Table = aparecerá na barra de fórmulas;
3. Substitua a expressão Table por DateDimension;
4. Clique à direita do sinal de igual e insira a seguinte função DAX:
5. DateDimension = CALENDAR( “1/1/2012”, “31/12/2016” )
6. Adicione cinco novas colunas contendo as fórmulas mostradas na Tabela 1
a seguir:

19
19
UNIDADE Modelagem de Dados no Power BI

Tabela 1 – Colunas e Fórmulas a serem adicionadas


FullYear YEAR([DateSK])
Quarter “Q”&ROUNDDOWN(MONTH([DateSK])/4,0)+1
QuarterNumber ROUNDDOWN(MONTH([DateSK])/4,0)+1
MonthFull FORMAT([DateSK], “MMMM”)
MonthNumber MONTH([DateSK])
Fonte: Adaptação de ASPIN, 2016

7. Selecione a coluna Quarter (Trimestre). Na faixa de opções Modelagem,


clique no triângulo pop-up no botão Classificar por Coluna e selecione
QuarterNumber (número de trimestre);
8. Selecione a coluna FullMonth;
9. Na faixa de opções Modelagem, clique no triângulo pop-up no botão
Classificar por Coluna e selecione MonthNumber.

Você acaba de utilizar a fórmula DAX CALENDAR (), onde especificou um intervalo de
datas para o Power BI gerar uma tabela contendo um período contínuo. Em seguida,
você adicionou campos para exibir trimestre e mês, bem como os números desses
itens que são usados ​​como indicadores de classificação. Finalmente, você aplicou a
ordem de classificação a qualquer coluna do tipo não numérica.

Logo, isso evita que os nomes dos meses apareçam em ordem alfabética. Assim,
sua dimensão Data está concluída. É claramente uma versão reduzida do tipo de
tabela completa que você precisaria em um aplicativo a ser utilizado por clientes
finais em um projeto de larga escala.

Criando o modelo dimensional


Agora vamos criar o modelo dimensional, embora com apenas uma dimensão
no momento:
1. Supondo que você ainda esteja no Editor de Consulta do Power BI
Desktop, clique em Fechar e Aplicar para retornar à exibição do relatório;
2. Clique no ícone Relacionamentos, à esquerda (terceiro ícone para baixo);
3. Você deve ver a tabela de fatos e dimensões unida no campo VehicleSK;
O modelo inicial será semelhante ao da Figura 12:

Figura 12 – Exemplo do nosso modelo inicial de relacionamento Dim_Vehicle e Fact_Sales


Fonte: ASPIN, 2016

20
O Power BI Desktop acaba inferindo que as consultas (agora, no contexto do
Power BI, tabelas) foram projetadas para serem unidas em um campo específico, e
já adiciona o relacionamento entre as tabelas.

As duas dimensões restantes podem ser criadas usando exatamente as mesmas


técnicas que você viu na seção que descreve como criar a dimensão do veícu-
lo. O modelo finalizado, contendo todas as dimensões, pode ser encontrado no
arquivo ModelagemdeDadosnoPowerBI.Pbix disponível no drive.

A partir do arquivo, você pode conferir o modelo de dados finalizado na exibição Relaciona-
Explor

mentos do Power BI Desktop, e perceber que acabamos criando uma implementação prática
completa, com base no ponto inicial da Figura 4 anterior.

Finalizando o modelo de dados


O modelo de dados ainda precisa de alguns ajustes para torná-lo realmente ami-
gável e pronto para o BI de autoatendimento. Algumas coisas a fazer são:
1. Ocultar as chaves substitutas e classificá-las por colunas;
2. Adição de uma hierarquia de veículos e de uma hierarquia de tempo;
3. Criação de medidas calculadas, como exemplos simples do que pode ser
feito para se estender um modelo de dados.

O primeiro passo é simples, porém necessário. Tudo o que você precisa fazer,
em qualquer uma das visualizações do Power BI no Power BI Desktop, é clicar com
o botão direito do mouse no campo que você deseja mascarar e selecionar Ocultar
na exibição de relatório.

O campo Chave Substituta não será mais visível para os usuários. No entanto,
eles aparecerão em itálico na exibição Relacionamento e dados. Você deve fazer
isso não apenas para todas as chaves substitutas em todas as tabelas, mas também
para os campos QuarterNumber e MonthNumber na tabela DateDimension.

Adicionando hierarquias
As hierarquias são uma estrutura tradicional de metadados no BI; e o Power BI
Desktop possibilita que você as crie:
1. Na visualização Relatório, verifique se a lista Campos está visível à direita;
2. Expanda a tabela Dim_Vehicle;
3. Clique com o botão direito do mouse no campo Criar e selecione Nova
Hierarquia;
4. Clique com o botão direito do mouse no campo Model e selecione Adi-
cionar à hierarquia;

21
21
UNIDADE Modelagem de Dados no Power BI

5. Clique com o botão direito do mouse nos campos Make e Model origi-
nais (fora da hierarquia que você acabou de criar) e selecione Ocultar.
Dessa forma, esses campos serão visíveis apenas na hierarquia.

Agora você tem uma hierarquia pai-filho pronta para usar, que pode ser aplicada a
tabelas, matrizes e gráficos.

Criar uma hierarquia de tempo é um processo praticamente idêntico, a saber,


começamos com o campo FullYear como base para uma nova hierarquia na tabela
DataDimension e adicionam-se os campos Quarter e Month Full. Finalmente,
ocultamos esses dois últimos campos fora da hierarquia.

Criando medidas calculadas


O processo de BI inevitavelmente envolve adicionar mais cálculos analíticos ao
modelo de dados. A seguir temos passos para um breve demonstração do DAX
(a linguagem que o Power BI usa para o cálculo de métricas) para este fim:
1. Na visualização Dados, verifique se a lista Campos está visível à direita;
2. Selecione a tabela Fact_Sales na lista Campos;
3. Na faixa de opções Página inicial, clique no triângulo pop-up no botão
Nova medida e selecione Nova coluna;
4. Uma coluna, chamada de Column (Coluna) aparecerá na tabela Fact_Sales
à direita de todas as colunas pré-existentes;
5. Clique dentro da barra de fórmulas acima da tabela e insira a seguinte fórmula:
TotalCosts = [CostPrice] - [SpareParts] - [LaborCost]
6. Pressione Enter ou clique no ícone de visto na barra de fórmulas;
A nova coluna calculará o custo total para cada registro na tabela de fatos;
7. Como detalhe final, podemos adicionar um pouco de inteligência quanto
a Tempo ao modelo exemplo. Assim, na visualização Dados, verifique se
a lista Campos está visível à direita;
8. Selecione a tabela Fact_Sales na lista Campos;
9. Na faixa de opções Página inicial, clique no triângulo pop-up no botão
Nova medida e selecione Nova medida;
10. Digite a medida abaixo:
QuarterSales = TOTALQTD (SUM (Fact_Sales [SalePrice]), DateDimension
[DateSK])
11. Na faixa de opções Página inicial, clique no triângulo pop-up no botão
“Nova medida e selecione Nova medida;
12. Digite a seguinte medida:
YearSales = TOTALYTD (SUM (Fact_Sales [SalePrice]), DateDimension
[DateSK])

22
Agora temos algumas medidas que calcularão as vendas mês a dia e ano a data. Ago-
ra que o modelo de dados foi concluído, você deverá ver todas as medidas e atributos
exibidos na Figura 13 a seguir, que é a Lista de Campos da Exibição de Relatório no
Power BI Desktop.

Figura 13 – Lista de Campos de Exibição de Relatório de nosso exemplo


Fonte: ASPIN, 2016

Dashboards no Power BI
Agora você pode salvar e fechar o Editor de Consulta do Power BI Desktop e
começar a usar os atributos e medidas disponíveis para criar relatórios e painéis a
partir do painel Visualizações.
Explor

Diferentes visualizações disponíveis no Power BI: http://bit.ly/30NvuOY

Para mais detalhes a respeito de dashboards e visualizações, favor checar o seguinte mate-
Explor

rial, disponível em: http://bit.ly/2GjJnLt

Com o apresentado nestas unidades espera-se que você seja capaz de modelar
dados para todas as necessidades envolvidas em uma equipe de dados, principalmen-
te no que tange o fornecimento de informações para a correta tomada de decisões.

A partir disso, passará a perceber que o processo de self service BI tem se mos-
trado como um diferencial para os profissionais da área, uma vez que se espera
hoje em dia que as equipes de dados estejam compostas não só por perfis analíticos
e de uso de ferramentas, mas também por profissionais cada vez mais capazes a ní-
vel de entendimento de negócios e storytelling de dados, o que acaba por envolver
conhecimentos de modelagem, mineração e visualização de dados.

23
23
UNIDADE Modelagem de Dados no Power BI

Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:

 Leitura
Data Stories Gallery
http://bit.ly/37qLw3A
Data Warehouse – O Que É Star Schema?
http://bit.ly/2TSd8uI
Power BI: Novas ferramentas de modelagem de dados
http://bit.ly/2RMIjoz
Trabalhar com a exibição de Modelagem no Power BI Desktop
http://bit.ly/2NUALyM
Criação de relatórios facilitada
http://bit.ly/2NUAN9S
Introdução a dashboards para designers do Power BI
http://bit.ly/2GjJnLt
Criar um dashboard do Power BI de um relatório
http://bit.ly/2Rp8djm

24
Referências
ASPIM, A. Pro Power BI Desktop, Apress, 2016. Materiais de auxílio disponíveis
em: <https://github.com/Apress/pro-power-bi-desktop-2018>.

25
25

Você também pode gostar