Informatique Décisionnelle (29847)
Informatique Décisionnelle (29847)
Informatique Décisionnelle (29847)
Intelligence
Informatique Décisionnelle
MHL2
2021-2022
Ahmed
ZELLOU
Ahmed.zellou
@um6p.ma
Business Intelligence, @A. ZELLOU
Business Intelligence, @A. ZELLOU
Plan
Système d’information
Intégration
Informatique décisionnelle
OLTP vs OLAP
Data Warehouse
ETL
Data mart
Modèles multidimensionnels
Opérations OLAP
Selon une étude menée par IBM : « pour 1 dollar américain dépensé pour une
application packagée, 5 à 9 dollars sont dépensés pour assurer son intégration ».
[IBM 2017]
S1 : dépôts régionaux
S2 : produits
S3 : clients et consommateurs
S1 S2 S3 S4
S4 : transporteurs
Domaines d’application
Analyse des ventes,
…
Quelles sont les médicaments les plus vendus pendant le trimestre A de l'année B pour la
tranche d'âge C ?
Informations :
Connaissances :
Décisions
Donner le traitement Y & Z dans R pour les patients plus âgés que A, ...
…
Traitements
Synthétiser / Résumer
Visualiser
Analyser
Utilisateurs
Experts et Analystes d'un
métier
Non informaticiens
Non statisticiens
Business Intelligence, @A. ZELLOU
Exploitation des données pour le décisionnel
Les données agrégées dans un système décisionnel servent à trois grandes catégories
d'usage :
L'exploration manuelle
OLTP OLAP
Backup Fréquent, complet et obligatoire De temps en temps, moins nécessaire
Espace de stockage Petit Large
Temps de réponse En millisecondes De secondes à minutes
Audience Orienté March Orienté Client
type d’utilisateur DBA Manager
Nombre d’utilisateurs Milliers Centaines
Les données temporelles sont réparties entre données actuelles et données archivées,
rendant la vue historique des données très difficile ou impossible,
organisée de façon à assurer la stabilité contextuelle des données selon les sujets de
l'entreprise.
alimenté en données depuis les bases de production grâce aux outils d'ETL.
Il propose des modèles d'étude et de prospective pour limiter la part d'incertitude lors du
processus de prise de décision.
Ils accèdent aux données collectées et mises en forme pour étudier des cas de réflexion.
Visualisation
Analyse
Intégré
Remplir l'entrepôt
Maintenir l'entrepôt
Nettoyage et Transformation
Chargement
Remarques :
une centaine de type d'inconsistances ont été répertoriées
valeur nulle
Fonctions de conversion
Fonctions d'analyse
des schémas
des données
Modélisation multidimensionnelle
Modèle en étoile
Modèle en flocon de neige
Modèle en constellation
Représentent des:
Entités (nom, attributs, clé primaire)
Relations entre les entités (base des jointures utilisées entre les tables)
Cardinalités des relations (un à un, un à plusieurs, plusieurs à plusieurs, zéro à un)
Dénormalisation du modèle
Approche pragmatique: analyse précise des besoins des utilisateurs
Pré-calcul de certains agrégats
Résultat adaptation
Chaque table est associée à un sujet d’intérêt
Le modèle présente un certain nombre d’informations agrégées
Modèle moins complexe plus simple que le normalisé
Nombre de tables diminue mais volume des tables augmente
Modélisation
• Relationnelle • Multidimensionnelle
• Tables • Dimensions
Différentes
• Relations formes • Mesures
de stockage des • Cubes
• Jointures données
• Hiérarchies
Plusieurs modèles en étoile liés entre eux par des dimensions communes.
Dimension
Fournisseur
ID Fournisseur
Nom Fournisseur
Catégorie
Fait Achat
ID Temps
ID Fournisseur
ID Produit
Qte Achetée
Montant Total
Caractéristiques :
Orienté vers un sujet unique : Exemple : comportement des patients (clientèle).
Dimensions
Les dimensions représentent des catégories qui fournissent un contexte aux mesures numériques. Elles sont
l'équivalent logique des dimensions du schéma en étoile.
Cubes
Les cubes associent toutes les dimensions et toutes les mesures dans un modèle conceptuel. Ils fonctionnent
comme un support de stockage logique pour une base de données OLAP.
Quadriller: placer plusieurs membres d'une dimension sur un axe, puis placer plusieurs membres
d'une autre dimension sur un autre axe. Voir la relation entre les membres de différentes dimensions.
Atlanta Sales
Fact
Chicago
Denver Grapes
Cherries
Dallas Melons
Apples
Q1 Q2 Q3 Q4
Dimension Time
2020
suppo rte pas les s
Tranche Age 2020
donnée creuses
NB Cas de 5 à 18 de 19 à 30 de 31 à 40
2021 2021
COVID
31-40
Ville Année Année Année
2020 2021 2020 2021 2020 2021 2020
Rabat 30 36 33 32 46 43
Casa 36 36 23 49 53 2021
Ne supporte pas les
Fes 20 données
26 23 creuses
22
Casa Fes
Permet de grouper sur une même représentation bi-dimensionnelle toutes les informations (mesures et
membres) d’un cube quelque soit le nombre de ses dimensions.
Exemple:
Les graphiques et tableaux croisés dynamiques