Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main
Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main
Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main
du Big Data
TP 1
Apache Hadoop : Installation et prise en main
(Task Tracker)
Ecosystème de Hadoop
Les
distributions
de Hadoop
Installation
J'ai besoin d'une
distribution Linux.
comment dois-je
procéder ?
Présentation de docker
Docker est un logiciel libre permettant facilement de
lancer des applications dans des conteneurs logiciels.
Avantages
https://docs.docker.com/get-docker/
Etape 2 : Installation de l'image
Hadoop
1- Télécharger l'image depuis le
Docker hub
3- Lancer l'image
Hadoop (l'une des
commandes)
-a : Pour afficher tous les conteneurs disponibles (même ceux qui sont morts)
Etape 3 : Lancer l'image Hadoop
5- Accéder au conteneur en
mode shell
Option 2
Lancer le conteneur en mode
interactif (replace les étapes 4+5)
Etape 3 : Lancer l'image Hadoop
1- Créer un répertoire dans HDFS, appelé input (Tapez l'une de ces commandes)
Premiers pas avec Hadoop
2- Vérifier si le répertoire a bien été créé)
6- Afficher le contenu du
répertoire input
Les commandes Hadoop
Commande Fonctionnalité
hdfs dfs –cat file.txt \| less Lire le fichier page par page
Commandes Docker
Sauvegarder les modifications
Arrêter le conteneur
Références
https://www.youtube.com/watch?v=caXHwYC3tq8
https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-
common/SingleCluster.html
https://www.edureka.co/blog/install-hadoop-single-node-hadoop-cluster
Merci pour votre
attention