Etl Avec Pdi
Etl Avec Pdi
Etl Avec Pdi
Sommaire
Présentation de PDI ................................................................................................................................. 2
Premier Programme avec PDI ................................................................................................................. 5
Les transformations............................................................................................................................... 18
Le Tri : Transformation – Tri ligne ..................................................................................................... 18
Sélection : contrôle de flux – filtrage ligne ........................................................................................ 20
Exercice :........................................................................................................................................ 21
Script SQL : Execution Script – Execution Script SQL ......................................................................... 22
Exercice :........................................................................................................................................ 22
Cumul valeur d’un champ : statistique - agrégation de valeur .................................................... 22
Champ calculé : Transformation – calcul ...................................................................................... 26
Recherche : recherche – recherche dans la base de donnée........................................................ 27
Listage des noms des sous répertoires : Extraction – récupération sous répertoire .................... 29
Listage des noms des fichiers d’un répertoire : Extraction – récupération nom fichier ............... 32
Récupération depuis un serveur FTP : Transfert de fichier (FTP) - Récupération fichier via FTP . 32
Transfert vers un fichier FTP : Transfert de fichier (FTP) – Envoi de fichier via FTP ...................... 32
Clonage : divers – clonage ligne .................................................................................................... 32
Dédoublonnage : Transformation – dédoublonnage .................................................................... 32
Eclatement : Contrôle de flux – branchement conditionnel ......................................................... 32
Pentaho est une plate-forme décisionnelle open source complète possédant les
caractéristiques suivantes :
Dans MySQL :
Exercice :
Exercice : faire une ETL qui vérifie si la table Customers existe dans la base bdStock et le crée dans
le cas contraire, ensuite y insert les informations provenant de la table customers de la base
classicModel.
Listage des noms des sous répertoires : Extraction – récupération sous répertoire