Bienvenue sur Scribd !

0% ont trouvé ce document utile (0 vote)

37 vues

Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main

Transféré par

Ce document décrit l'installation et la prise en main du framework Apache Hadoop en utilisant des conteneurs Docker. Il présente les concepts clés de Hadoop comme HDFS et MapReduce et explique les étapes d'installation de Docker et d'une image Hadoop, ainsi que les commandes de base pour interagir avec HDFS.

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main

Transféré par

Hmad SADAQ

0% ont trouvé ce document utile (0 vote)

37 vues24 pages

Titre original

TP1

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

0% ont trouvé ce document utile (0 vote)

37 vues24 pages

Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main

Transféré par

Hmad SADAQ

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

Passer à la page

Vous êtes sur la page 1sur 24

Rechercher à l'intérieur du document

Traitement

du Big Data
TP 1
Apache Hadoop : Installation et prise en main

Nassim Bahri M1 DSSD

Objectifs du Installation du framework hadoop

TP en se basant sur les conteneurs

Docker.

Apprendre les concepts et les

commandes afin de bien gérer les
fichiers sur HDFS.
Présentation de Hadoop
Apache Hadoop est un framework open-source
pour stocker et traiter les données
volumineuses sur un cluster.
HDFS (Hadoop Distributed File System)

Système de fichiers distribués permettant de stocker des fichiers de très

grandres tailles.
MapReduce

(Framework développé par Google) Système de traitement parallèle de grands

ensembles de données.
Présentation de Hadoop
(Job Tracker)

(Task Tracker)
Ecosystème de Hadoop
Les
distributions
de Hadoop
Installation
J'ai besoin d'une
distribution Linux.
comment dois-je
procéder ?
Présentation de docker
Docker est un logiciel libre permettant facilement de
lancer des applications dans des conteneurs logiciels.

L'utilisation des contenaires nous permettra de réduire considérablement la

complexité de configuration des machines ainsi que la lourdeur d'exécution (si
on opte pour l'utilisation d'une machine virtuelle).

Avantages

Portabilité - Meilleurs performances - Déploiement

Présentation de docker

Conteneurs Docker vs machines virtuelles

Présentation de docker
Etape 1 : Installation de Docker

https://docs.docker.com/get-docker/
Etape 2 : Installation de l'image
Hadoop
1- Télécharger l'image depuis le
Docker hub

2- Vérifier que l’image a bien été

téléchargée
Etape 3 : Lancer l'image Hadoop

3- Lancer l'image
Hadoop (l'une des
commandes)

--name : Pour spécifier le nom du conteneur

Etape 3 : Lancer l'image Hadoop

4- Afficher les conteneurs en cours

d'exécution

-a : Pour afficher tous les conteneurs disponibles (même ceux qui sont morts)
Etape 3 : Lancer l'image Hadoop

5- Accéder au conteneur en
mode shell

Option 2
Lancer le conteneur en mode
interactif (replace les étapes 4+5)
Etape 3 : Lancer l'image Hadoop

5- Lancer les services Hadoop

7- Vérifier que tous les services sont en

cours d'exécution
Premiers pas avec Hadoop
Toutes les commandes interagissant avec le système Hadoop commencent par
hadoop fs (aussi hdfs dfs). Ensuite, les options rajoutées sont très largement
inspirées des commandes Unix standard.

1- Créer un répertoire dans HDFS, appelé input (Tapez l'une de ces commandes)
Premiers pas avec Hadoop
2- Vérifier si le répertoire a bien été créé)

3- Télécharger un fichier distant

https://www.nassimbahri.ovh/docs/bigdata/words.txt
Premiers pas avec Hadoop
4- Vérifier si le fichier est bien placé dans
votre répertoire locale

5- Placer le fichier words.txt

dans le répertoire input que
vous avez créé

6- Afficher le contenu du
répertoire input
Les commandes Hadoop
Commande Fonctionnalité

hdfs dfs -help Afficher l'aide

hdfs dfs -ls [répertoire] Afficher le contenu du répertoire

Upload un fichier dans hadoop (à partir du répertoire

hdfs dfs –put file.txt
courant linux)

Download un fichier à partir de hadoop sur votre

hdfs dfs –get file.txt
disque local

hdfs dfs –tail file.txt Lire les dernières lignes du fichier

Les commandes Hadoop
Commande Fonctionnalité

hdfs dfs –cat file.txt Affiche tout le contenu du fichier

hdfs dfs –mv file.txt newfile.txt Renommer le fichier

hdfs dfs –rm newfile.txt Supprimer le fichier

hdfs dfs –cat file.txt \| less Lire le fichier page par page
Commandes Docker
Sauvegarder les modifications

Arrêter le conteneur
Références
https://www.youtube.com/watch?v=caXHwYC3tq8

https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-
common/SingleCluster.html

https://www.edureka.co/blog/install-hadoop-single-node-hadoop-cluster
Merci pour votre
attention

Vous aimerez peut-être aussi

Programme Formation BIM Starter
Document8 pages
Programme Formation BIM Starter
Sali Douae
Pas encore d'évaluation
Presentation Hadoop
Document27 pages
Presentation Hadoop
khadidja khadidja
Pas encore d'évaluation
TP1 Hadoop
Document2 pages
TP1 Hadoop
Manel Hkimi
Pas encore d'évaluation
Fascicule TP - Hdfs Et Mapreduce
Document5 pages
Fascicule TP - Hdfs Et Mapreduce
Ahmed Kartassi
Pas encore d'évaluation
Travaux Pratique N 1 - 3
Document4 pages
Travaux Pratique N 1 - 3
واحد تونسي
Pas encore d'évaluation
tp1 BigData
Document9 pages
tp1 BigData
Haitam Laaouini
Pas encore d'évaluation
TD2(Chap3_4)
Document6 pages
TD2(Chap3_4)
jeonchama9720
Pas encore d'évaluation
TP Hadoop
Document11 pages
TP Hadoop
Jas Min
Pas encore d'évaluation
Big Data tp1
Document6 pages
Big Data tp1
hajrikoussay03
Pas encore d'évaluation
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Document11 pages
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Rim Hancha
Pas encore d'évaluation
tp1 Enrichie 2018
Document5 pages
tp1 Enrichie 2018
Rania Benamara
Pas encore d'évaluation
Atelier HDFS
Document5 pages
Atelier HDFS
Fredj Kriaa
Pas encore d'évaluation
9782744026249_SP_01
Document18 pages
9782744026249_SP_01
Highconseil
Pas encore d'évaluation
Cluster Hadoop - Docker Portainee
Document33 pages
Cluster Hadoop - Docker Portainee
Oumayma Naffeti
Pas encore d'évaluation
TP1 - HDFS VF
Document9 pages
TP1 - HDFS VF
Chaymae
Pas encore d'évaluation
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
Document11 pages
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
Hanane Nadi
Pas encore d'évaluation
Gestion de Données Avec HDFS
Document7 pages
Gestion de Données Avec HDFS
z.essiddiqi
Pas encore d'évaluation
Chapitre II - Hadoop
Document37 pages
Chapitre II - Hadoop
Mariem SELMI
Pas encore d'évaluation
Atelier Big Data
Document16 pages
Atelier Big Data
Abdelhakim Traouli
Pas encore d'évaluation
Lab2 Hdfs
Document9 pages
Lab2 Hdfs
Maryâm Bôuch
Pas encore d'évaluation
tp1 Mapreduce
Document15 pages
tp1 Mapreduce
Ivan003
Pas encore d'évaluation
Atelier HDFS
Document6 pages
Atelier HDFS
Samy Hassine
Pas encore d'évaluation
TP1 Hadoop - HDFS
Document3 pages
TP1 Hadoop - HDFS
Zakariyae register
Pas encore d'évaluation
TP1 Hadoop
Document10 pages
TP1 Hadoop
Absence Manager
Pas encore d'évaluation
Tp1 Bigdata Mapreduce 171031163107
Document8 pages
Tp1 Bigdata Mapreduce 171031163107
Koffi Kanga
Pas encore d'évaluation
tp1 Hdfs
Document7 pages
tp1 Hdfs
Raja Bs
Pas encore d'évaluation
Semaine 3
Document63 pages
Semaine 3
benben08
Pas encore d'évaluation
TP5Bigdata INDIA 2023 2024
Document5 pages
TP5Bigdata INDIA 2023 2024
Zn
Pas encore d'évaluation
Tp0 Installation Hadoopv2
Document13 pages
Tp0 Installation Hadoopv2
AZELOUALIDINE KAWTAR
Pas encore d'évaluation
Ch3 Big Data Hdfs Map Reduce
Document52 pages
Ch3 Big Data Hdfs Map Reduce
Younes Oulad Sayad
Pas encore d'évaluation
Installation Cloudera HDFS
Document5 pages
Installation Cloudera HDFS
noussa79
Pas encore d'évaluation
TP01 Installation de Hadoop Sous Linux
Document10 pages
TP01 Installation de Hadoop Sous Linux
Manal Ess
Pas encore d'évaluation
TP 1 HADOOP
Document6 pages
TP 1 HADOOP
masrour
Pas encore d'évaluation
Hadoop 1
Document61 pages
Hadoop 1
Mouhamed Bouazzi
Pas encore d'évaluation
Manipulations Sur HDFS
Document2 pages
Manipulations Sur HDFS
hiba
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part4
Document2 pages
Mickaelbaron-Hadoopinstallation Part4
satmania
Pas encore d'évaluation
TP6Bigdata INDIA 2023 2024
Document4 pages
TP6Bigdata INDIA 2023 2024
Zn
Pas encore d'évaluation
Atelier Framework Big Data PDF
Document21 pages
Atelier Framework Big Data PDF
Zohra CHANNOUF
Pas encore d'évaluation
Chap2 Hadoop
Document74 pages
Chap2 Hadoop
Abdelhakim Traouli
Pas encore d'évaluation
Lab 2
Document3 pages
Lab 2
Hammami Mélek
Pas encore d'évaluation
Fonctionnement Du Système de Fichiers Distribués Hadoop (HDFS)
Document5 pages
Fonctionnement Du Système de Fichiers Distribués Hadoop (HDFS)
Hanane Nadi
Pas encore d'évaluation
Hadoop 3.3.6 On Ubuntu 22.04 LTS 1
Document13 pages
Hadoop 3.3.6 On Ubuntu 22.04 LTS 1
ﺟﻮﺍﻫﺮ ﻣﻮﺳى
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part8
Document2 pages
Mickaelbaron-Hadoopinstallation Part8
satmania
Pas encore d'évaluation
compte_rendu_tp1
Document9 pages
compte_rendu_tp1
masrour
Pas encore d'évaluation
Le Cluster Hadoop
Document8 pages
Le Cluster Hadoop
Amidou Bagayogo
Pas encore d'évaluation
Installation-Hadoop Mastere
Document17 pages
Installation-Hadoop Mastere
thouraya hsan
Pas encore d'évaluation
TP N°1 - Installation Via Paquets
Document6 pages
TP N°1 - Installation Via Paquets
Ferdaous Hd
Pas encore d'évaluation
Procedure D'installation de Hadoop
Document13 pages
Procedure D'installation de Hadoop
Aymen Bouazizi
100% (1)
TP Hadoop
Document50 pages
TP Hadoop
Mohamed
Pas encore d'évaluation
Word Count
Document5 pages
Word Count
nouharakrouki822
Pas encore d'évaluation
Bigdata 3
Document89 pages
Bigdata 3
Nidhal Larbi
Pas encore d'évaluation
Mooc Fun Big Data Semaine 9 Hadoop
Document84 pages
Mooc Fun Big Data Semaine 9 Hadoop
MONTCHO Wesley
Pas encore d'évaluation
TP2 Big Data Env Docker
Document3 pages
TP2 Big Data Env Docker
inesabdelali11
Pas encore d'évaluation
Cours Pig
Document93 pages
Cours Pig
Oussama Panorama
Pas encore d'évaluation
Hadoop
Document89 pages
Hadoop
CHAIMA SAKKA
Pas encore d'évaluation
Big Data
Document16 pages
Big Data
Rima CHEMENGUI
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
Document9 pages
TP1 BigDataAnalytics Initiation Hadoop
Souley
Pas encore d'évaluation
Hive Installation
Document37 pages
Hive Installation
Sana Bakrim
100% (1)
TP1 Installation
Document7 pages
TP1 Installation
bouazizchahine7
Pas encore d'évaluation
1atelier 1 - Installation Hadoop - V23-24
Document11 pages
1atelier 1 - Installation Hadoop - V23-24
Fredj Kriaa
Pas encore d'évaluation
Ubuntu Server 10.04
D'Everand
Ubuntu Server 10.04
MARTIN Pierre-Jean
Évaluation : 5 sur 5 étoiles
5/5 (1)
Python Et Le Module Pandas Pour Gérer Et Analyser Des Données
Document1 page
Python Et Le Module Pandas Pour Gérer Et Analyser Des Données
Hmad SADAQ
Pas encore d'évaluation
Exercices Corrigés Linux
Document7 pages
Exercices Corrigés Linux
Hmad SADAQ
100% (1)
Ex - Symétrie Centrale
Document4 pages
Ex - Symétrie Centrale
Hmad SADAQ
Pas encore d'évaluation
Correction TD Résolution Systèmes Linéaires
Document3 pages
Correction TD Résolution Systèmes Linéaires
Hmad SADAQ
Pas encore d'évaluation
08 Trainevo Ficheprod 01 Analyse de Donnees Avec Python
Document2 pages
08 Trainevo Ficheprod 01 Analyse de Donnees Avec Python
Hmad SADAQ
Pas encore d'évaluation
Durée: 2 Heures (Documents Autorisés) : Abderrahim - Chariete@
Document6 pages
Durée: 2 Heures (Documents Autorisés) : Abderrahim - Chariete@
Hmad SADAQ
Pas encore d'évaluation
Poly TP MongoDB
Document8 pages
Poly TP MongoDB
Hmad SADAQ
Pas encore d'évaluation
Ch6 Introduction À La Science de Données
Document15 pages
Ch6 Introduction À La Science de Données
Hmad SADAQ
Pas encore d'évaluation
Bases de Donnee Reparties
Document10 pages
Bases de Donnee Reparties
Hmad SADAQ
Pas encore d'évaluation
DESIGEO C1 Intro
Document60 pages
DESIGEO C1 Intro
Hmad SADAQ
Pas encore d'évaluation
Chapitre2 Fondements Big Data Hdfs
Document23 pages
Chapitre2 Fondements Big Data Hdfs
Hmad SADAQ
Pas encore d'évaluation
NoSQL AZOUGAGH
Document172 pages
NoSQL AZOUGAGH
Hmad SADAQ
Pas encore d'évaluation
Apercu
Document13 pages
Apercu
Hmad SADAQ
Pas encore d'évaluation
Corrigébarème 1
Document3 pages
Corrigébarème 1
Ikram Bouba
Pas encore d'évaluation
Un Terrorisme Imparable
Document6 pages
Un Terrorisme Imparable
Alex P
Pas encore d'évaluation
Toute La Priere
Document6 pages
Toute La Priere
babacar drame
100% (1)
Theorie Cellulaire
Document1 page
Theorie Cellulaire
Daniel Teyou
Pas encore d'évaluation
Narra Mus
Document30 pages
Narra Mus
charbonneau.charlotte
100% (1)
Contrôle Continu Danalyse 1
Document1 page
Contrôle Continu Danalyse 1
Nidhal Cherrat
Pas encore d'évaluation
Cours - Derivabilite PDF
Document12 pages
Cours - Derivabilite PDF
6666666666666-545255
100% (1)
Program Master Traitement Du Signal Et Des Images Parcours Traitement de L Information Et Instrumentation Pour L Ingenieur
Document7 pages
Program Master Traitement Du Signal Et Des Images Parcours Traitement de L Information Et Instrumentation Pour L Ingenieur
Rajan Paul
Pas encore d'évaluation
COMPTA 4è TCA2
Document3 pages
COMPTA 4è TCA2
Demba Kanoute
Pas encore d'évaluation
Renault Kangoo
Document52 pages
Renault Kangoo
92zap92
Pas encore d'évaluation
Agitador
Document24 pages
Agitador
Arquimedes Perez
Pas encore d'évaluation
Performance Du Travail de Capeco
Document18 pages
Performance Du Travail de Capeco
ScribdTranslations
Pas encore d'évaluation
Manuel Specifique Metal D'apport
Document1 page
Manuel Specifique Metal D'apport
mbe joseph
Pas encore d'évaluation
Publications Desmet2020
Document21 pages
Publications Desmet2020
Michele Tornincasa
Pas encore d'évaluation
Reseaux Communication Industriels PDF
Document190 pages
Reseaux Communication Industriels PDF
Khaled Ouni
0% (1)
2 - Cours - Java EE
Document40 pages
2 - Cours - Java EE
Douraid Dridi
Pas encore d'évaluation
Université de Carthage Mémoirexx
Document91 pages
Université de Carthage Mémoirexx
Lina
Pas encore d'évaluation
Formulation Bap
Document27 pages
Formulation Bap
Bouglada Mohammed
Pas encore d'évaluation
Plan D'action de La Directrice (Enregistré Automatiquement)
Document6 pages
Plan D'action de La Directrice (Enregistré Automatiquement)
Rodrigue Anderson
Pas encore d'évaluation
Un Stabilisateur Flume Sur: Problèmes Posés Existant Et Leur Résolution
Document14 pages
Un Stabilisateur Flume Sur: Problèmes Posés Existant Et Leur Résolution
rida roda
Pas encore d'évaluation
Corr QUIZ 2
Document9 pages
Corr QUIZ 2
slim yaich
Pas encore d'évaluation
Fondrie Laminage
Document10 pages
Fondrie Laminage
Ha Kim
Pas encore d'évaluation
Dossier Exercices: "La Gauche Et La Droite"
Document12 pages
Dossier Exercices: "La Gauche Et La Droite"
Shannon Haway
Pas encore d'évaluation
Synthese Du Paracetamol: Document 1: Protocole Expérimental
Document7 pages
Synthese Du Paracetamol: Document 1: Protocole Expérimental
Taim Khouri
100% (2)
Prix
Document5 pages
Prix
sam30492
Pas encore d'évaluation
No65 14 Sept 2022 Sujetexa - Com PDF
Document3 pages
No65 14 Sept 2022 Sujetexa - Com PDF
kouemo Dakleu
Pas encore d'évaluation
GERAC 2 Protection
Document72 pages
GERAC 2 Protection
Jocelyn Vaccani
Pas encore d'évaluation
Je Partage TP Thermodynamique II Avec Vous
Document13 pages
Je Partage TP Thermodynamique II Avec Vous
farid nano
Pas encore d'évaluation
L Amour Chez Les Grecs
Document2 pages
L Amour Chez Les Grecs
said
Pas encore d'évaluation