Ecosystemes de L'ingenierie Des Données
Ecosystemes de L'ingenierie Des Données
Ecosystemes de L'ingenierie Des Données
des données
KARIM EL ALAOUI Youssef
Décembre 2021
Sommaire
Sommaire:
Objectifs du cours
I- Contexte de la transformation digitale
1-La révolution numérique
2-Histoire de l’utilisation de la data
3-Les grands Hommes de la data
4-Le droit à l’information
5-L’Open Data
6-Les réseaux sociaux et internet
II- L’industrie de la data
1-Les métiers de la data
2-L’utilisation de la data
3-La connaissance client
4-Les grands acteurs de l’industrie
5-Comment devenir data driven?
III- L’apprentissage artificielle
IV- Gouvernance Data
Objectifs du cours
Vs
Contexte de la transformation digitale
Vs
Contexte de la transformation digitale
Top Secteur de
Client final Concurrence
management l’entreprise
Durant les trois derniers siècle, l'humanité a vécu trois révolutions industrielles.
1- LE PERE DE L'ALGEBRE
2- mathématicien, géographe,
astrologue et astronome...
5- …
Contexte de la transformation digitale
Contexte de la transformation digitale
Contexte de la transformation digitale
2- mathématicien, astronome et
physicien.
Alan Turing
1912-1954
1- LE PERE DE L'INFORMATIQUE
2- Mathématicien et cryptologue
britannique
4- L'Intelligence Artificielle
2 milliards YouTube
1 milliards Instagram
L’étude de l’utilisation d’internet dans le monde fait ressortir, sur 7,75 milliards
d’individus dans le monde, on recense:
1- 5,19 milliards d’utilisateurs de téléphone portable
2- 4,54 milliards d’internautes
3- 3,8 milliards d’utilisateurs actifs des réseaux sociaux
4- 3,75 milliard d’utilisateurs des médias sociaux sur mobile
Contexte de la transformation digitale
25 milliards
d’objets
Plus d’objets connectés dans
connectés que le monde
d’humains sur
terre
Aujourd’hui, 20% des données utilisées par les entreprises sont générées par
leurs Systèmes d’information. Les 80% restants sont issues
- Données Open Data
- Données issus d’internet
- Données des objets connectées
Contexte de la transformation digitale
Contexte de la transformation digitale
Valeur
Fait de la BIG DATA c’est bien beau, mais ce Variété
qui est utile c’est comment en créer de la Fait référence aux données structurées et
valeur? non structurés
Variété
Fiabilité et validation des données
Contexte de la transformation digitale
Contexte de la transformation digitale
Sommaire
Sommaire:
Objectifs du cours
I- Contexte de la transformation digitale
1-La révolution numérique
2-Histoire de l’utilisation de la data
3-Les grands Hommes de la data
4-Le droit à l’information
5-L’Open Data
6-Les réseaux sociaux et internet
II- L’industrie de la data
1-Les métiers de la data
2-L’utilisation de la data
3-La connaissance client
4-Les grands acteurs de l’industrie
5-Comment devenir data driven?
III- L’apprentissage artificielle
L’industrie de la data
???
DATA Processus
DATA
DATA
DATA
L’industrie de la data
L’industrie de la data
L’industrie de la data
L’industrie de la data
2. Compréhension de la données
1. Compréhension du besoin métier Identification des sources de données
Définition du use case Collecte des données & intégration
Evaluation d’impact Maitrise des inputs du modèle
Spécifications fonctionnelles
3. Préparation de la data
7. Back testing
4. Modélisation
Choix DU modèle
Back test et stress test du modèle Choix des modèles
Partage des résultats de modélisation Etude de stabilité des modèles
Maitrise des outputs du modèle Etude de signification des modèles
L’industrie de la data
Les métiers
Data Analytics
Manager
Data
Engineer
Les entreprises de nos jours passent d'une stratégie product-centric vers une
approche custmer-centric. Pour se faire l'entreprise doit avoir une connaissance
parfaite de son client.
% souscripteurs
plus élevés
Décile de Score
Calcul des notes de score :
somme des coefficients
• Données de transaction
– Volume des achats
– Nombre de transactions
– Nombre de connexion
– Régularité des achats
– …
• Données du client
– Age
– Ancienneté de la relation
– Lieu de résidence
– …
L’industrie de la data
L’univers des variables candidates à l’entrée au modèle est très important : plusieurs centaines de
variables calculées -> filtrer le sous ensemble de variables les plus utiles !
Principe de sélection :
Retenir que les variables les plus corrélées avec l’évènement à prédire ‘la souscription’, tout en étant
indépendantes les unes des autres ;
Ensemble
final
de variables
recodées
Filtrage
+
Groupement /
mise en classes
L’industrie de la data
Concrètement, notre modèle permet de définir la relation fonctionnelle entre la probabilité de souscription
et notre sélection de variables.
( )= + ∗ + ∗ é +⋯
L’industrie de la data
L’industrie de la data
L’industrie de la data
L’industrie de la data
L’industrie de la data
L'acronyme GAFA désigne quatre des entreprises les plus puissantes du monde grâce à leurs pouvoirs
économique et financier supérieur à plusieurs états.
Devenir une entreprise data driven implique de mettre la données au centre de la stratégie de
l'entreprise. La transformation ne se fait pas en un jour, cela nécessite du temps. les clés de la
réussite de cette transition :
-Le capital humain : recrutement de profils data : Data Engineer, Data Scientist...
-Mesurer l'impact
-etc...
L’industrie de la data
Sommaire
Sommaire:
Objectifs du cours
I- Contexte de la transformation digitale
1-La révolution numérique
2-Histoire de l’utilisation de la data
3-Les grands Hommes de la data
4-Le droit à l’information
5-L’Open Data
6-Les réseaux sociaux et internet
II- L’industrie de la data
1-Les métiers de la data
2-L’utilisation de la data
3-La connaissance client
4-Les grands acteurs de l’industrie
5-Comment devenir data driven?
III- L’apprentissage artificielle
IV- Gouvernance data
L’apprentissage artificielle
Objectifs du cours
I- Contexte de la transformation digitale
1-La révolution numérique
2-Histoire de l’utilisation de la data
3-Les grands Hommes de la data
4-Le droit à l’information
5-L’Open Data
6-Les réseaux sociaux et internet
II- L’industrie de la data
1-Les métiers de la data
2-L’utilisation de la data
3-La connaissance client
4-Les grands acteurs de l’industrie
5-Comment devenir data driven?
III- L’apprentissage artificielle
IV- Gouvernance data
Gouvernance data
- Disponibilité
- Exploitabilité
- Intégrité
- Et la sécurité des données
Gouvernance data
Gouvernance data
Source Gartner
Gouvernance data
Pourquoi l’agilité?
Agronyme : C.N.D.P.
Nom : La Commission Nationale
de contrôle de la protection des Données à caractère Personnel
DATA MANAGEMENT
La création de la données ainsi que sa transformation nécessite un ensemble de process, de
technologies et surtout de personnes c’est ce qu’on appelle le DATA MANAGEMENT
DATA Gouvernance
La Data Gouvernance est le cadre d’organisation pour établir la stratégie, les objectifs
et les politiques pour une gestion efficace des données de l’entreprise.
Elle consiste en l’ensemble des étapes nécessaires pour gérer et assurer la disponibilité,
l’utilité, l’intégrité, la cohérence et l’audit des données de l’entreprise
Gouvernance data
Gouvernance data
Expérience Présentation
Gouvernance data
Module
Data visualisation
Gouvernance data
Gouvernance data
Données structurées
Data non structurées 1
Images, video, audio
Données résumées en lignes et en
Data des réseaux sociaux
colonnes
3
Le flux sortant est les données
analysée, transformée...
Gouvernance data
Gouvernance data
Systèmes
Systèmes d’information
d’Informations Modélisation Analytique
Identification des impacts des
besoins Data sur les systèmes
Gouvernance data
Qualité de
Data Metadata
la donnée
gouvernance management
Architecture
Utilisation Data
de la data
Stratégie
Data
Gouvernance data
Gouvernance data
Gestion du changement
Auditer
Planifier
Tester
Déployer
Optimiser
Déploiement du changement
Gouvernance data
1- Conduite du changement
Promouvoir la culture DATA dans l’ensemble des
directions
2- Data gouvernance
Définition des responsabilités Data
Governance
3- Data office
Coordination entre les différentes parties
Recueillir le besoin du
client Concevoir le modèle
Identifier
Intégration
Data Nettoyer
DATA unifier
DATA
DATA
DATA
Gouvernance data