Entrepots
Entrepots
Entrepots
De données
1
Plan
Vue d’ensemble sur les entrepôts de données
Architecture des entrepôts de données
Modélisation dimensionnelle
Option de modélisation
Comparaison entre les différentes approches
Conclusion
Bibliographie
Questions
2
Vue d’ensemble
3
Vue d’ensemble
Entrepôt de données :
D’après BILL Inmon : “Un ED est une collection de données
thématiques, intégrées, non volatiles et historisées, organisées pour la
prise de décision.”
4
Objectifs de l ’Entrepôt de Données
Accessibilité des informations
facile à comprendre donc à utiliser
Information cohérente
idempotence avec le temps
incomplétude signalée
5
Vue d’ensemble
• Conception
• Construction
• Administration
• Restitution
6
Vue d’ensemble
Conception
7
Vue d’ensemble
Administration
Restitution
10
Vue d’ensemble
11
Vue d’ensemble
12
Vue d’ensemble
13
Architecture des entrepôts de données
14
Modélisation multidimensionnelle
Objectif :
15
Modélisation multidimensionnelle
16
Modélisation multidimensionnelle
17
Modélisation multidimensionnelle
• MOLAP
– Multidimensionnelle OLAP (1 fichier)
• ROLAP
– Relationnelle OLAP (SGBDR)
• HOLAP
– Hybride OLAP (SGBDR + fichier)
18
Modélisation multidimensionnelle
Modes de stockage
19
Modélisation multidimensionnelle
Modes de stockage
20
Modélisation multidimensionnelle
Modes de stockage
21
Modélisation multidimensionnelle
Modes de stockage
La solution intermédiaire
Les “faits” (facts) sont gardés dans le SGBD/R
Les agrégations dans le MOLAP
Utilise le serveur OLAP comme
“accélérateur” de traitement
Pas de duplication de données
22
Entrepôts, Magasins et Cubes de données
23
Concepts de fait et de dimension
Le fait:
• Modélise le sujet de l'analyse.
• Il est formé de mesures correspondant aux informations
de l'activité analysée.
24
Concepts de fait et de dimension
Dimension:
• Modélise une perspective de l'analyse.
• Elle se compose de paramètres correspondant aux
informations faisant varier les mesures de l'activité..
25
Schéma en étoile
26
Du modèle entité relation aux modèle dimensionnel
27
Du modèle entité relation aux modèle dimensionnel
Étapes de conception
28
Du modèle entité relation aux modèle dimensionnel
Étapes de conception
29
Du modèle entité relation aux modèle dimensionnel
Étapes de conception
30
Du modèle entité relation aux modèle dimensionnel
Étapes de conception
Opérateur 2 : l’agrégation
31
Du modèle entité relation aux modèle dimensionnel
Étapes de conception
Réduire le
nombre de
Étape 4: Évaluation et raffinement schemas en étoile
Solution:
• Ignorer l’entité d’intersection
• Créer une relation primaire
32
Du modèle entité relation aux modèle dimensionnel
Étapes de conception
Sous-types de Traitement
• Relation super type/super type: Conversion directe
33
Option de la modélisation
34
Option de la modélisation
35
Option de la modélisation
36
Option de la modélisation
Schéma de Constellation
Schéma de Galaxie
Plus généralement, un jeu de schémas en étoile ou des
constellations peuvent être combiné ensemble pour former une
galaxie
37
Option de la modélisation
38
Option de la modélisation
Complexité élevée
Redondance élevée
39
Comparaison entre les diverses méthodes
Schéma en étoile:
L’utilisateur ne manipule pas des structures de dimension complexe (ER).
Il peut utiliser le modèle dimensionnel sans avoir à apprendre comment
interpréter correctement les schémas ER.
40
Conclusion
L'entrepôt de données est donc bien différent des bases de données de production car
les besoins pour lesquels on veut le construire sont différents.
Il contient des informations historisées, globalement cohérentes, organisées selon les
métiers de l'entreprise pour le processus de décision.
L'entrepôt n'est pas un produit ou un logiciel mais un environnement.
Il se bâtit et ne s'achète pas.
Les données sont puisées dans les bases de production, nettoyées, normalisées, puis
intégrées.
Des métadonnées décrivent les informations dans cette nouvelle base pour lever toute
ambiguïté quant à leur origine et leur signification.
Chaque approche de modélisation a sa place dans le contexte approprié
Le succès de telle ou telle approche de modélisation d’un entrepôt de données exige
que les techniques soient appliquées dans le bon contexte
42
Questions ?
Merci !
43