Entrepôts de Données 2CS-Cours05

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 34

Institut Supérieur d’Informatique - Université Tunis El Manar

Cours 5 : Éléments
avancés pour la
modélisation des data
warehouses

Riadh ZAAFRANI
Avril 2021

2ème année Licence Computer Science - GLSI

Objectifs du cours

◼ Savoir faireun modèle dimensionnel


en étoile et en flocon
◼Savoir gérer les dimensions
dégénérées et attributs de
documentation, de segmentation et
d'agrégation

1
Plan
◼ Faits
◼ Dimensions
◼ Attributs des Dimensions
◼ Projet Fantastic : Rappel
◼ Exercice : Modélisation avancée du
data warehouse
3

Table de faits avec faits et table de


faits sans fait
Table de faits avec faits
En général la table des faits comporte un ou
plusieurs attributs représentant des faits, que l'on va
sommer sur les dimensions lors de l'analyse.
Exemple Table des faits avec faits
ventes (fk_date, fk_produit, quantite, ca)

SELECT sum(v.quantite)
FROM ventes v JOIN date d
ON fk_date=pk_date
GROUP BY d.week 4

2
Table de faits avec faits et table de
faits sans fait
Tables de faits sans fait (factless fact table)
Dans certains cas, on mesure directement dans la table
des faits des événements unitaires. Un fait est donc
juste un enregistrement dans la table des faits.
Dans ce cas la table des faits ne contient que des clés
étrangères, et aucun fait en tant que tel (c'est
l'enregistrement qui est le fait).
Analyse en count
Pour analyser une table de faits sans fait, on ne peut
pas utiliser sum (il n'y a rien à sommer), on utilise
count (on analyse le nombre de faits enregistrés). 5

Table de faits avec faits et table de


faits sans fait
Exemple Table des faits sans faits
ventes (fk_date, fk_produit)
SELECT count(*)
FROM ventes v JOIN date d
ON fk_date=pk_date
GROUP BY d.week
Ajouter une colonne avec la constante 1
Afin de rendre ce cas plus lisible, il est parfois conseillé
d'ajouter une colonne qui contient la valeur 1 pour toutes les
lignes. On matérialise ainsi le fait par une valeur, même si
elle est toujours la même, et il est de nouveau possible de
6
travailler en somme.

3
Clés artificielles

Every join between dimension and fact tables in the


data warehouse should be based on meaningless
integer surrogate keys. You should avoid using the
natural operational production codes. (Kimball,
Ross, 2008, p59)
• Les dimensions doivent être les points entrées
dans les faits pour les utilisateurs, donc les clés
naturelles n'apportent rien (aucune requête n'est
faite directement dans la table des faits, sans
jointure)
7

Clés artificielles

• L'usage de clés naturelles est plus simple au


début, mais plus coûteux sur le long terme : les
clés artificielles assurent l'indépendance aux
évolutions futures du système opérationnel (on
rappelle que le data warehouse vise le long terme,
au delà de la durée de vie d'une version d'un
système opérationnel typiquement)
• Les clés artificielles sont plus performantes
(entiers compressés)
• les clés artificielles permettent de gérer les valeurs
8

nulles (date...)
8

4
Clés artificielles

OID Méthode
Sous un système relationnel-objet les OID peuvent
être utilisés.
La mise en place de clés artificielles complique l'ETL
et implique la maintenance d'une table de
correspondance par exemple.

Exemples de modèles dimensionnels


Exemple de modèle dimensionnel d'analyse
de ventes (Kimball, Ross, 2008, p.51-53)

10

10

5
Exemples de modèles dimensionnels

Exemple de modèle dimensionnel dans le domaine


de l'assurance (Kimball, Ross, 2008, p.314)

11

11

Exemples de modèles dimensionnels

Exemple de modèle dimensionnel dans


le domaine du commerce électronique
(Kimball, Ross, 2008, p.293)
12

12

6
Exemples de modèles dimensionnels

Exemple de modèle dimensionnel dans le


domaine des télécommunications
(Kimball, Ross, 2008, p.225) 13

13

Exemples de modèles dimensionnels

Exemple de modèle dimensionnel dans le domaine 14

des transports (Kimball, Ross, 2008, p.233)


14

7
Gestion des valeurs nulles

You must avoid null keys in the fact table. A proper


design includes a row in the corresponding
dimension table to identify that the dimension is not
applicable to the measurement. (Kimball, Ross,
2008, p.49)

Exemple Lorsqu'un client qui ne possède pas de


carte de fidélité achète un produit, il n'est pas
possible de lier le fait à un client.
On évite de mettre une valeur nulle en ajoutant une
valeur "Client sans carte de fidélité" à la dimension. 15

15

Gestion des erreurs

Il est souvent utile d'ajouter des valeurs dans une


dimension afin de gérer les cas d'erreur dans les données.
Exemple Ces valeurs rendent compte d'une typologie
comme par exemple :
• Format invalide
• Valeur tronquée
• Référence inconnue
• ...

Si l'on dispose de suffisamment d'information sur la


cause de l'erreur, cette cause peut être utilisée. 16

16

8
Faits semi-additifs

Semiaddictive facts
Un fait est semi-additif s'il est additif sur une partie
seulement des dimensions du modèle.
“All measures that record a static level (inventory
levels, financial account balances, ans measures of
intensity such as room temperature) are inherently
nonadditive across date dimension and possibly
other dimensions. In these cases, the measure may
be aggregated usefully across time, for example, by
averaging over number of time periods.” (Kimball,
Ross, 2008, p72) 17

17

Faits semi-additifs

Pour analyser les faits semi-additifs sur les dimensions sur


lesquelles ils ne sont pas additifs, il faut faire des moyennes.
Modèle :
Exemple • Dimension compte
• Dimension date
• Fait (fkCompte, fkDate, solde)
Faits :
• (1,1,50)
• (1,2,100)
• La somme (150) ne veut rien dire, la moyenne (75)
donne bien le solde moyen du compte. 18

18

9
Plan
◼ Faits
◼ Dimensions
◼ Attributs des Dimensions
◼ Projet Fantastic : Rappel
◼ Exercice : Modélisation avancée du
data warehouse
19

19

Conception des dimensions

Most business processes can be represented with


less than 15 dimensions (Kimball, Ross, 2008, p.58)
Il ne faut pas dénormaliser la table des faits :
• les dimensions sont indépendantes entre elles ;
• il ne faut pas représenter des hiérarchies différentes
dans des dimensions différentes.
En particulier parce que :
• pour des raisons d'intelligibilité ;
• et de performance (la table des faits est la plus
volumineuse, elle doit être optimisée)
20
(Kimball, Ross, 2008, p57)
20

10
Dimension dégénérée

Operational control numbers such as


Exemple order numbers, invoice numbers, and bill-
of-lading numbers usually give rise to
empty dimensions and are represented
as degenerated dimensions (that is,
dimension keys without corresponding
dimension tables) [...] (Kimball, Ross,
2008, p.50)

21

21

Modélisation en flocon

Modélisation en flocon
Un modèle en flocon est un modèle pour lequel chaque
dimension est représentée avec plusieurs tables. Il est donc
plus normalisé (moins redondant) qu'un modèle en étoile.

Exemple de dimension représentée 22


en flocon (Kimball, Ross, 2008, p.55)

22

11
Modélisation en flocon

Les représentations en flocon sont déconseillées en


général (Kimball, Ross, 2008, p.56):
• Le modèle en flocon est plus complexe et son
appréhension par l'utilisateur est difficile
• Les performances en requêtes sont diminuées
par les jointures
• Le gain en espace disque est faible (les
dimensions sont peu volumineuses relativement
aux faits) 23

23

Modélisation en flocon

La normalisation partielle est préconisée lorsqu'il y a des


répétitions très nombreuses sur un grand nombre de
colonnes (Kimball, Ross, 2008, p.153).

Exemple de cas pertinent de


représentation en flocon d'une
dimension (Kimball, Ross, 2008, p.153)
24

24

12
Slow Changing Dimension (SCD)
La gestion des changements dans les dimensions est un
enjeu de l'historisation dans le data warehouse.
Ces changements sont généralement lents, on parle de SCD.
Il y a 5 grands types de solutions (Kimball, Ross, 2008, p.95) :
• Type 1 : Remplacer la valeur (pas de gestion d'historique)
• Type 2 : Ajouter une nouvelle dimension (multiplication du
nombre de lignes)
• Type 3 : Ajouter un attribut (gestion d'un seul niveau
d'historique)
• Type 3b : Ajouter plusieurs attributs (changements
prévisibles)
• Type 6 (1+2+3) : Combiner les type 1, 2 et 3 25

25

Slow Changing Dimension (SCD)

SCD type 1 (Kimball, Ross, 2008, p.96)

SCD type 2 (Kimball, Ross, 2008, p.97) 26

26

13
Slow Changing Dimension (SCD)

SCD type 3 (Kimball, Ross, 2008, p.101)

SCD type 3+
(Kimball, Ross,
2008, p.103)

27

27

Slow Changing Dimension (SCD)

SCD type 6 (Kimball, Ross, 2008, p.104) 28

28

14
Plan
◼ Faits
◼ Dimensions
◼ Attributs des Dimensions
◼ Projet Fantastic : Rappel
◼ Exercice : Modélisation avancée du
data warehouse
29

29

Attributs d'analyse

Attributs d'analyse
La majorité des attributs d'une dimension qui
servent à l'analyse (ils sont mobilisés dans les
GROUP BY).
Synonyme : Attribut de regroupement
Syntaxe Par défaut un attribut mentionné dans le
modèle dimensionnel est un attribut d'analyse. Ces
attributs sont notés tels quels, sans annotation ni
style particulier.
30

30

15
Attributs de description

Attributs de description
Certains attributs ne sont pas utiles à l'analyse, mais peuvent
être conservés dans le modèle, afin d'améliorer la qualité des
états, souvent parce qu'ils sont plus explicites pour identifier
un enregistrement d'une dimension.
Synonyme : Attribut de documentation
Exemple Numéro et nom de département
Si l'on dispose d'un numéro de département pour l'analyse, le
nom peut néanmoins être conservé à des fins d'amélioration
des rapports.
Syntaxe Les attributs de description sont notés en italique
dans le modèle dimensionnel et/ou annotés de la mention (d). 31

31

Attributs de segmentation

Afin qu'un attribut soit utilisable en analyse, il doit


disposer de valeurs discrètes (et non continues) ; et l'échelle
de ces valeurs doit avoir un niveau de précision en
adéquation avec les besoins d'analyse.
Lorsque ce n'est pas le cas, l'attribut en question est
remplacé par un attribut de segmentation qui projette les
valeurs de l'attribut initial dans des segments discrets et
utilisables.
Exemple Population d'un département.

• Exemple (Kimball, Ross, 2008, p.151)


• Age
32
• Revenus

32

16
Attributs de segmentation

Méthode

• Utiliser une segmentation reconnue (habitude


socio-économique, pratique de l'organisation...)
• Utiliser une segmentation statistique (parts
égales...)
Syntaxe

L'attribut est annoté d'un (s) dans le modèle


dimensionnel.

33

33

Attributs d'agrégation de faits

Certaines analyses requièrent de regrouper les faits en


fonctions de valeurs elles-mêmes issues des faits.
Dans ce cas des attributs d'agrégation des faits sont pré-
calculés au sein des dimensions concernées.
Exemple Les produits les plus vendus (livres best-
sellers...)
◼ Exemple Les clients "high spender" qui plus dépensent le
plus. (Kimball, Ross, 2008, p.152)
Syntaxe
L'attribut est annoté d'un (a) dans le modèle dimensionnel.
34

34

17
La dimension date

Quasiment tous les data


warehouses ont une
dimension date.

Exemple de dimension Date


35
(Kimball, Ross, 2008, p.39)
35

Plan
◼ Faits
◼ Dimensions
◼ Attributs des Dimensions
◼ Projet Fantastic : Rappel
◼ Etude de cas : Problème posé
◼ Etude de cas : Données disponibles
◼ Exercice : Modélisation avancée du 36

data warehouse
36

18
Projet Fantastique : Problème posé

Vous travaillez en tant qu'ingénieur spécialisé dans les systèmes


décisionnels au siège de l'entreprise française "Fantastique".
L'entreprise "Fantastique" vend principalement des ouvrages
de divertissement de type science fiction, thriller, policier... Elle
dispose pour cela de plusieurs magasins de vente dans les
centres des grandes villes en France.
La direction de l'entreprise souhaite faire une étude large sur les
ventes de l'année passée afin de prendre des orientations
stratégiques nouvelles : ouverture de nouveaux magasins,
fermeture ou transfert de magasins mal implantés, extension
territoriale à de nouveaux départements français, réorganisation
des directions, réorientation du marketing, élargissement ou
réduction du catalogue, etc. 37

37

Projet Fantastique : Problème posé

La question posée est donc : quels sont


les facteurs sur lesquels l'on pourrait
jouer pour augmenter les ventes ?

38

38

19
Projet Fantastique : Problème posé

Elle vous charge dans ce cadre de mettre en place une solution


logicielle permettant d'intégrer les données pertinentes et de
pouvoir les interroger efficacement sous des angles divers.
Notons que bien entendu, la direction éclairée de l'entreprise ne
compte pas se fier à ces seuls facteurs de ventes pour prendre
ses décisions, mais bien privilégier les facteurs sociaux et
territoriaux, en dialoguant avec ses salariés et ses clients, pour
maintenir sa mission culturelle et son rôle d'entreprise citoyenne.
Votre posture d'ingénieur est bien entendu de se préoccuper de
ces dimensions fondamentales, même si elles seront largement
ignorées dans le cadre de cet exercice à vocation
essentiellement technique. Elles pourront néanmoins être
brièvement abordées en marge de vos rapports d'analyse. 39

39

Plan
◼ Faits
◼ Dimensions
◼ Attributs des Dimensions
◼ Projet Fantastic : Rappel
◼ Etude de cas : Problème posé
◼ Etude de cas : Données disponibles
◼ Exercice : Modélisation avancée du 40

data warehouse
40

20
Projet Fantastique : Données disponibles

Catalogue des livres


Une base Oracle contient le catalogue
complet de l'entreprise que chaque magasin a
à sa disposition.
Cette base, composée d'une seule table
publique catalogue, est disponible sur le
serveur Oracle.
Le script de Création de la table Catalogue
est : 41

41

Projet Fantastique : Données disponibles

FantasticCatalogue.sql
CREATE TABLE catalogue (
ref INTEGER PRIMARY KEY,
isbn VARCHAR(13) UNIQUE NOT NULL,
title VARCHAR(255) NOT NULL,
authors VARCHAR(255) NOT NULL,
language VARCHAR(3),
pubdate VARCHAR(25),
publisher VARCHAR(255),
tags VARCHAR(255),
genre VARCHAR(255) CHECK (genre IN ('SF', 'Fantastic',
'Crime', 'History', 'Adventure'))
);
GRANT SELECT ON catalogue TO PUBLIC; 42

42

21
Projet Fantastique : Données disponibles
Importation des données dans la table Catalogue à partir du fichier
"FantasticCatalogue.csv":
◼Avec SQL Developer, vous avez la possibilité d'importer
les données à partir d'un fichier csv :
➢ Il suffit d'ouvrir la vue de la table, puis:
➢ importer des données

43

43

Projet Fantastique : Données disponibles

Importation des données dans la table Catalogue :


➢ Trouver votre fichier
➢ choisissez vos options.

44

44

22
Projet Fantastique : Données disponibles
Importation des données dans la table Catalogue :

45

45

Projet Fantastique : Données disponibles

Fichier des ventes


Un fichier contient une consolidation de l'ensemble des ventes de l'année
2015 réalisées dans chaque magasin.
• Ces données sont disponibles sous la forme d'un fichier CSV : Fantastic
• La structure du fichier est : Numéro de ticket, date de ticket, produit,
magasin. Sa documentation est disponible dans un fichier au format
HTML : Fantastic.html :
◼ Relevé des ventes de livres Fantastic pour l'année 2015
◼ Ticket number
◼ Date
◼ ISBN
◼ Store
Les données du fichier des ventes Fantastic fournies sont corrompues
(valeurs nulles, valeurs tronquées, valeurs nullifiées). 46

46

23
Projet Fantastique : Données disponibles

Extrait du fichier Fantastic :


"142282000001";2015-10-10;"769";"M143"
"0"; ;"9782841724680";"M119"
"082229000003";2015-08-18;"9782266186315";"83"
"082229000003";2015-08-18;"9782266186315";"M83"
"082229000003";2015-08-18;"9782266186315";"M83"
"028093000004";2015-04-04;"9780765341600";"M29"
"115072000005";2015-03-14;"9782290348789";"M116"
"040187000006";2015-07-07;"9782702141045";"M41"
"031002000007";2015-01-03;"552";"M32"
"055114000008";2015-04-25;"9782207301999";"M56"
"017033000009";2015-02-03;"9782226220592";"M18"
"014041000010";2015-02-11;"9782070441242";"M15"
"041266000011";2015-09-24;"9782290329924";"M42"
"041266000011";2;"9782290348789";"M42"
"113233000012";2015-08-22;"9782266162807";"M114"
"064076000013";2015-03-18;"9782811200282";"M65"
"125160000014";2015-06-10;"9782258049352";"M126"
….. 47

47

Projet Fantastique : Données disponibles

Fichier des magasins


Un fichier ODS géré par la direction marketing
contient pour chaque magasin l'organisation des
rayonnages : marketing.ods
• Le responsable des ventes de chaque
département décide de l'organisation des
rayonnages des magasins de son département.
• Il existe 3 types de rayonnage : par Auteur (A),
par Année (Y), par Éditeur (E)
48

48

24
Projet Fantastique : Données disponibles

Extrait du fichier : marketing.ods

49

49

Projet Fantastique : Données disponibles


Données géographiques sur les départements
Un stagiaire a trouvé sur Internet un fichier permettant de connaître la
population de chaque département, présageant que cette information
sera utile.
• Le stagiaire parvient à trouver une information un peu datée qui
pourra suffire sous la forme d'un fichier CSV :
departementsInsee2003.txt (population par département)
• Sa documentation est disponible dans un fichier au format HTML :
departementsInsee2003.txt.html :
◼ Liste des départements français, 2003
◼ Department
Départements français métropolitains
◼ DptName
Nom du département
◼ Population 50

Population du département en 2003

50

25
Projet Fantastique : Données disponibles

Extrait du fichier departementsInsee2003.txt :


"01";"Ain";"529378"
"02";"Aisne";"552320"
"03";"Allier";"357110"
"04";"Alpes-de-Haute-Provence";"144809"
"05";"Hautes-Alpes";"126636"
"06";"Alpes-Maritimes";"1022710"
"07";"Ardèche";"294522"
"08";"Ardennes";"299166"
"09";"Ariège";"142834"
"10";"Aube";"301388"
"11";"Aude";"319611"
"12";"Aveyron";"277779"
"13";"Bouches-du-Rhône";"1861068"
"14";"Calvados";"663408"
"15";"Cantal";"157481"
"16";"Charente";"353608"
"17";"Charente-Maritime";"579187"
….. 51

51

Projet Fantastique : Modélisation finale

52

52

26
Plan
◼ Faits
◼ Dimensions
◼ Attributs des Dimensions
◼ Projet Fantastic : Rappel
◼ Exercice : Modélisation avancée du
data warehouse
53

53

Projet Fantastique : Modélisation


avancée du data warehouse
◼ Afin d’améliorer les analyses du contexte
"Fantastic", on va enrichir le modèle
dimensionnel et l'implémenter.

54

54

27
Projet Fantastique : Modélisation
avancée du data warehouse
Données supplémentaires
Les données supplémentaires suivantes sont
apportés au projet :
◼ fichier Prices2015.csv
◼ fichier Sales2015.csv

55

55

Projet Fantastique : Modélisation


avancée du data warehouse
ISBN Price
Fichier Prices2015.csv 393
191
7
19
667 40
La structure du fichier est : ISBN, Price : 553
319
46
15

◼ Prix des articles en 2013 (hors soldes) 552


282
18
17
739 15
◼ ISBN 156 26
707 12
◼ Price 708

23
….

ISBN ForSales
Fichier Sales2015.csv 393
191
0
0
667 1
La structure du fichier est : ISBN, ForSales : 553 1
319 1
◼ Liste des articles soldés en 2013 552
282
0
0

◼ ISBN 739
156
0
0
707 1
◼ ForSales 708
56
0
…. …

56

28
Projet Fantastique : Modélisation
avancée du data warehouse : Question 1
Améliorer le modèle dimensionnel afin d'ajouter :
• le numéro de ticket (rappeler pourquoi c'est
une dimension dégénérée) ;
• le fait quantité (que l'on fixe toujours à 1, ou
bien que l'on calcule on regroupant les lignes
strictement identiques)
• le fait chiffre d'affaire de la vente que l'on
récupère du fichier des prix (on fera
l'hypothèse que le prix de vente est toujours le
prix enregistré dans ce fichier, on pensera à
multiplier le prix par la quantité) 57

57

Projet Fantastique : Modélisation


avancée du data warehouse : Question 1
Améliorer le modèle dimensionnel afin d'ajouter :
• les attributs apportés par les nouvelles
données
• des attributs de documentation (nom du
département, genre...)
• des attributs de segmentation (population, age
de publication...)
• un attribut d'agrégation pour savoir si un livre
est un best-seller ou non
58

58

29
Projet Fantastique : Modélisation
avancée du data warehouse : Question 1
Améliorer le modèle dimensionnel afin d'ajouter :
• le numéro de ticket (rappeler pourquoi c'est
une dimension dégénérée) ;
Les numéros de contrôle opérationnel tels que les
numéros de commande, les numéros de facture et
les numéros de ticket donnent généralement lieu à
des dimensions vides et sont représentés comme
des dimensions dégénérées (c'est-à-dire des clés
de dimension sans tables de dimensions
correspondantes)
59

59

Projet Fantastique : Modélisation


avancée du data warehouse : Question 1
Améliorer le modèle dimensionnel afin d'ajouter :
• le fait quantité (que l'on fixe toujours à 1, ou
bien que l'on calcule en regroupant les lignes
strictement identiques)
Ici, on mesure directement dans la table des faits des
événements unitaires. Un fait est donc un
enregistrement correspondant à une vente d’un seul
livre dans la table des faits.
Le fait quantité sera ainsi toujours fixé à 1 et il est de
possible de travailler en somme pour avoir la quantité
vendue d’un livre à une date donnée par exemple. 60

60

30
Projet Fantastique : Modélisation
avancée du data warehouse : Question 1
Améliorer le modèle dimensionnel afin d'ajouter :
• le fait chiffre d'affaire de la vente que l'on
récupère du fichier des prix (on fera
l'hypothèse que le prix de vente est toujours le
prix enregistré dans ce fichier, on pensera à
multiplier le prix par la quantité)
Ici, on ajoute simplement un fait ca dans la table des
faits, correspondant au prix de vente enregistré
dans le fichier des prix.
61

61

Projet Fantastique : Modélisation


avancée du data warehouse : Question 1
Améliorer le modèle dimensionnel afin d'ajouter :
• les attributs apportés par les nouvelles
données
Prix : Afin que le prix soit utilisable en analyse, il
doit disposer de valeurs discrètes (et non
continues) .
Ainsi, l'attribut prix est remplacé par un attribut de
segmentation qui projette les valeurs de prix dans
des valeurs discrètes entre 1 et 10.
Solde : est un attribut booléen : 1 si le livre est
soldé; 0 sinon. 62

62

31
Projet Fantastique : Modélisation
avancée du data warehouse : Question 1
Améliorer le modèle dimensionnel afin d'ajouter :
• des attributs de documentation (nom du
département, genre...)
NomDpt : Si l'on dispose d'un numéro de département pour
l'analyse, le nom permet d'améliorer les rapports.
Population : population dans chaque département qui figure
dans le fichier departementsInsee2003.txt et qui pourrait
être affichée.
Genre : genre du livre, qui figure dans la table catalogue
genre VARCHAR(255) CHECK (genre IN ('SF', 'Fantastic',
'Crime', 'History', 'Adventure’))
63

63

Projet Fantastique : Modélisation


avancée du data warehouse : Question 1
Améliorer le modèle dimensionnel afin d'ajouter :
• des attributs de segmentation (population, age
de publication...)
Age : Age de publication du livre est remplacé par un
attribut de segmentation qui projette les valeurs de l’âge
du livre dans des valeurs discrètes entre 1 et 10.
DptPop : est remplacé par un attribut de segmentation
qui projette les valeurs de la population du département
dans des valeurs discrètes entières à un seul chiffre.

64

64

32
Projet Fantastique : Modélisation
avancée du data warehouse : Question 1
Améliorer le modèle dimensionnel afin d'ajouter :
• un attribut d'agrégation pour savoir si un livre
est un best-seller ou non
BestSeller : Certaines analyses requièrent de regrouper les
faits en fonctions de valeurs elles-mêmes issues des faits.
BestSeller est un attribut d'agrégation des faits qui sont pré-
calculés au sein de la dimension produit, afin d’avoir les
quantités vendues de chaque livre et qui permettra
d’attribuer une valeur booléenne à chaque livre (1 : si le livre
dépasse une certaine quantité, 0 : sinon).

65

65

Projet Fantastique : Modélisation


avancée du data warehouse : Question 1

66

66

33
Projet Fantastique : Modélisation
avancée du data warehouse : Question 2
Implémenter le modèle dimensionnel et
modifier l'ETL en conséquence.

67

67

Projet Fantastique : Modélisation


avancée du data warehouse : Question 3
Expérimenter le nouveau modèle avec des
questions en rapport avec les modifications
apportées.

68

68

34

Vous aimerez peut-être aussi