BI ETL&Modélisation
BI ETL&Modélisation
BI ETL&Modélisation
3
ETL
TRANSFORMATION
Application des opérations
de transformation sur les
1 données extraites à partir 3
des sources
EXTRACTION CHARGEMENT
2 Chargement de données
Extraction des données extraites et transformées
pertinentes à partir des dans l’entrepôt de
sources opérationnelles données
4
Sources de données
5
Extraction
7
Chargement
Opérations de calcul et d’agrégation des données
– Remplacement de certaines bases si aucune solution
d’extraction satisfaisante n’est possible
• Mise en place de procédures de chargement (nocturne?) et
de restauration (en cas de problème)
– Envisager la mise en place de systèmes redondants si la
disponibilité du système ne peut être interrompue
• Prise en compte de la notion de granularité
– Conservation des données détaillées
– Possibilité d’agrégation des données pour la synthèse 8
Entrepôt de données (DW)
9
Entrepôt de données (DW)
• Concept de fait:
- Sujet analysé
- Un ensemble d'attributs appelés mesures (informations
opérationnelles)
• Les ventes (chiffre d'affaire, quantités et montants
commandés, volumes des ventes, ...)
• Les stocks (nombre d'exemplaires d'un produit en stock, ...)
10
Entrepôt de données (DW)
• On distingue trois types de faits:
• Additif: additionnable suivant toutes les dimensions Quantités
vendues, chiffre d’affaire CA Peut être le résultat d’un calcul: o
Bénéfice = montant vente - coût
• Semi additif: additionnable suivant certaines dimensions 5
Solde d’un compte bancaire: o Pas de sens d’additionner sur les
dates car cela représente des instantanés d’un niveau o Σ sur les
comptes: on connaît ce que nous possédons en banque
• Non additif: fait non additionnable quelques soit la dimension
Prix unitaire: l’addition sur n’importe quelle dimension donne un
nombre dépourvu de sens
11
Entrepôt de données (DW)
• Mesure
12
Entrepôt de données (DW)
• Concept de dimension:
13
Entrepôt de données (DW)
• Concept de dimension:
- Hiérarchie :
• Les attributs/membres d'une dimension sont organisés
suivant des hiérarchies
• Chaque paramètre appartient à un niveau hiérarchique (ou
niveau de granularité) particulier
14
Entrepôt de données (DW)
• Exemple 1: Les paramètres des dimensions sont organisés suivant
une hiérarchie ; les paramètres sont ordonnés par une relation
"est_plus_fin" et notée P1 →P2.
15
Modélisation
• Modèle en étoile
- Une table de fait centrale et des dimensions
• Un fait central
• n dimensions (n>=2)
- Les dimensions n’ont pas de liaison entre elles
16
Modélisation
• Modèle en flocon de neige
- Dérivé du schéma en étoile
- Représenter la table dimension par plusieurs tables
- Le fait est conservé
- Les dimensions sont éclatées conformément à leurs niveaux
d’hiérarchie
17
Modélisation
• Modèle en constellation
- Fusionner plusieurs modèles en étoile
- Un modèle en constellation comprend plusieurs faits qui
partagent des dimensions (pas forcément toutes les
dimensions
18
Alimentation ODS & DWH
19