Bienvenue sur Scribd !

0% ont trouvé ce document utile (0 vote)

238 vues

TP3 Hadoop Exercices

Transféré par

Ce document présente trois exercices sur Hadoop MapReduce. Le premier concerne l'identification d'anagrammes dans une liste de mots. Le deuxième vise à analyser les sentiments exprimés dans des tweets. Le troisième consiste à générer un index inversé de pages web.

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

TP3 Hadoop Exercices

Transféré par

koyine9472

0% ont trouvé ce document utile (0 vote)

238 vues2 pages

Description originale:

TP3_Hadoop_exercices (1)

Titre original

TP3_Hadoop_exercices (1)

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

0% ont trouvé ce document utile (0 vote)

238 vues2 pages

TP3 Hadoop Exercices

Transféré par

koyine9472

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

Enseignante : Asma KERKENI

Institut supérieur d'informatique

Niveau : LF3
et de mathématiques de Monastir

Big Data

- TP3 : Hadoop MAP/REDUCE -

Objectif :
L'objectif principal de ce TP est de vous familiariser avec l'utilisation de Hadoop en conjonction
avec le langage de programmation Java pour la résolution de divers problème, tout en pratiquant
l'exécution de jobs MapReduce en local et sur un cluster Hadoop.

Exercice 1 : Anagrammes
On dispose d’un fichier texte contenant une liste de mots courants. On souhaite déterminer quels
mots sont des anagrammes.
On rappelle qu'un mot est une anagramme d'un autre si leurs lettres sont identiques (par exemple,
« crane » et « ancre »).
Le but de cet exercice est d'écrire un programme MapReduce pour identifier et regrouper les
anagrammes de cette liste. Vous pouvez tester ce programme avec l'exemple suivant:

Fichier en entrée

Résultat

Exercice 2 : Analyse des sentiments des clients sur Twitter

Une entreprise dispose d'un compte twitter pour son service après-vente, recevant plusieurs
dizaines de milliers de tweets par jour. Elle cherche à déterminer le taux de satisfaction de ses
clients à partir du compte twitter. Chaque heure, les tweets reçus sont exportés au sein d'un fichier
texte.

LF3 Page 1 sur 2

Big Data TP3

Écrire un programme MapReduce qui permet de calculer le nombre de tweets selon les calsses
suivantes : satisfait, insatisfait et incuoncluant.

Données d'entrée :

Résultat :

Indication :
 On pourra définir des descripteurs de sentiments et les mots attachés, par exemple :
o Sentiment négatif :"nul", "insatisfait", "bof", "incompétents", …
o Sentiment positif : "satisfait", "super", "excellent", …
 Si deux sentiments contradictoires détectés : renvoyer inconcluant

Exercice 3 : Index web inversé

Soit un très grand ensemble de pages web. Pour chaque page p dans l'ensemble, on souhaite trouver
l'ensemble des pages qui référencent p.

Exemple : Si dans les pages p1 et p2, il y a des liens vers la page q, alors nous avons :

Sources(q) : {p1, p2, ...}

Écrire un programme MapReduce permettant de générer un index web inversé en adoptant ka

représentation simplifié suivante :

Fichier en entrée Résultat

P1:P2,P3 P1: P2, P3, P4

P2:P1,P4 P2: P1, P4
P3:P1,P4 P3: P1, P4
P4:P1,P2,P3 P4: P2, P3

Page 2 sur 2

Vous aimerez peut-être aussi

Mise en Place D'une Infrastructure Cloud Basée Sur OpenStack - Rapport de Stage Samy ABBOUTE
Document54 pages
Mise en Place D'une Infrastructure Cloud Basée Sur OpenStack - Rapport de Stage Samy ABBOUTE
Samy ABBOUTE
Pas encore d'évaluation
Compte Rendu TP 1 Big Data
Document6 pages
Compte Rendu TP 1 Big Data
Gaith Belkacem
Pas encore d'évaluation
TP3 TP4
Document8 pages
TP3 TP4
Nikash Gomes
Pas encore d'évaluation
Corrigé TD N°1
Document2 pages
Corrigé TD N°1
Gédéon Ondele
75% (4)
Nosql, Mongodb: Questions de Cours
Document3 pages
Nosql, Mongodb: Questions de Cours
ala fezai
100% (1)
Td1: Hadoop: Exercice 1
Document3 pages
Td1: Hadoop: Exercice 1
ala fezai
50% (2)
Hadoop Map Reduce Exo
Document2 pages
Hadoop Map Reduce Exo
RAMZI Azeddine
100% (3)
Tp1: Installation de L'Apache Spark: Lebutdecetp
Document4 pages
Tp1: Installation de L'Apache Spark: Lebutdecetp
tabbabi marwen
100% (1)
Examen SP UE
Document4 pages
Examen SP UE
Med Nour Elhak Jouini
0% (1)
tp1 Hadoop Mapreduce 2023
Document5 pages
tp1 Hadoop Mapreduce 2023
mohamedfarouk.hamadi
100% (3)
TD1 MapReduce PDF
Document5 pages
TD1 MapReduce PDF
Mr : Anas
100% (2)
TP Map Reduce
Document3 pages
TP Map Reduce
fidaletaief58
100% (1)
TP3 Hive Correction
Document9 pages
TP3 Hive Correction
Bechir Mathlouthi
Pas encore d'évaluation
TP MapReduce Python
Document5 pages
TP MapReduce Python
nour elislem
Pas encore d'évaluation
Cours Spark
Document50 pages
Cours Spark
Nancy Dobé
Pas encore d'évaluation
tp2 Correction
Document8 pages
tp2 Correction
Lima Eco Fox Alpha
Pas encore d'évaluation
Exams
Document8 pages
Exams
Rouçadi Wafaa
Pas encore d'évaluation
BigDATA M1 GSI Corrigé - Type
Document3 pages
BigDATA M1 GSI Corrigé - Type
LAHDHEB Rim
100% (2)
tp1 BigData
Document9 pages
tp1 BigData
Haitam Laaouini
Pas encore d'évaluation
tp4 Hbase
Document18 pages
tp4 Hbase
aime
Pas encore d'évaluation
tp1 Mapreduce
Document15 pages
tp1 Mapreduce
Ivan003
Pas encore d'évaluation
Examen 3
Document8 pages
Examen 3
Sofien Haddad
Pas encore d'évaluation
Examen Big DATA
Document4 pages
Examen Big DATA
zaki worker
100% (1)
Chp4-Bases de Données NOSQL
Document85 pages
Chp4-Bases de Données NOSQL
Arnauld
Pas encore d'évaluation
EXAMEN
Document3 pages
EXAMEN
Ayachi Emna
Pas encore d'évaluation
Corrige Devoir de Revision2
Document4 pages
Corrige Devoir de Revision2
hassen.tahri
Pas encore d'évaluation
TP Pig and Hive
Document3 pages
TP Pig and Hive
oueslati ahlem
100% (1)
MAPREDUCE
Document9 pages
MAPREDUCE
patrice mvogo
Pas encore d'évaluation
Chp2 Hadoopmapreduce 140428061611 Phpapp01
Document58 pages
Chp2 Hadoopmapreduce 140428061611 Phpapp01
zid
Pas encore d'évaluation
CorrigéTD3 Versionetudiant
Document13 pages
CorrigéTD3 Versionetudiant
Dhiya Eddine Hachani
Pas encore d'évaluation
TP PIG Hadoop
Document3 pages
TP PIG Hadoop
Chouchen Nizar
Pas encore d'évaluation
Ex Amen Big Data 1617
Document6 pages
Ex Amen Big Data 1617
Med Nour Elhak Jouini
100% (1)
TP Business Intelligence PDF
Document8 pages
TP Business Intelligence PDF
Amine Hamdouchi
Pas encore d'évaluation
Partie 2 - Cours MongoDB
Document76 pages
Partie 2 - Cours MongoDB
Hassan BENHAMOU
Pas encore d'évaluation
Big Data
Document6 pages
Big Data
zaki worker
Pas encore d'évaluation
Bases de Données Avancées. TD - TP - NoSQL - MongoDB
Document48 pages
Bases de Données Avancées. TD - TP - NoSQL - MongoDB
Ibtissam Elhammoumy
Pas encore d'évaluation
td01 Hadoop
Document6 pages
td01 Hadoop
aissamemi
Pas encore d'évaluation
Ds Big Data Hachani
Document7 pages
Ds Big Data Hachani
Mohamed Amine Hachani
Pas encore d'évaluation
Formation Node Expressjs 617c0eb091742
Document41 pages
Formation Node Expressjs 617c0eb091742
Adil Khalki
Pas encore d'évaluation
SESSION 2 - BASE DE DONNEE NoSQL
Document20 pages
SESSION 2 - BASE DE DONNEE NoSQL
kouame.kobena
Pas encore d'évaluation
Chapitre 1 - Introduction Au Base de Données NoSQL
Document19 pages
Chapitre 1 - Introduction Au Base de Données NoSQL
Khadija Ho
Pas encore d'évaluation
TP2 Hadoop 22 23
Document3 pages
TP2 Hadoop 22 23
Morrocan Dream
Pas encore d'évaluation
Commandes Hadoop
Document5 pages
Commandes Hadoop
Oumayma Tajir
Pas encore d'évaluation
TP2 Introduction À Spark Et Scala
Document6 pages
TP2 Introduction À Spark Et Scala
Mariem Korghli
Pas encore d'évaluation
Cours Big Data Avancee Chp2 Data-Ingestion
Document46 pages
Cours Big Data Avancee Chp2 Data-Ingestion
MarwenCherif
Pas encore d'évaluation
Exam
Document5 pages
Exam
Did you know THAT
100% (2)
Examen Nosql SP 1819-1
Document3 pages
Examen Nosql SP 1819-1
eya.somai
Pas encore d'évaluation
NoSQL - MongoDb (Partie 1)
Document53 pages
NoSQL - MongoDb (Partie 1)
Leila Meriem
Pas encore d'évaluation
Cours Big Data
Document38 pages
Cours Big Data
ayadii safa
Pas encore d'évaluation
Révision Modélisation NoSQL
Document14 pages
Révision Modélisation NoSQL
Nora Mouhib
Pas encore d'évaluation
Atelier 3 - Hive
Document6 pages
Atelier 3 - Hive
Chorale Voix D'Anges Tunis
Pas encore d'évaluation
Correction TD - Cloud - Etude de Cas - Aws
Document4 pages
Correction TD - Cloud - Etude de Cas - Aws
barboura marwa
Pas encore d'évaluation
QCM Spring
Document6 pages
QCM Spring
Jamal Jabbour
Pas encore d'évaluation
TP 1
Document13 pages
TP 1
mohcinechekkour
Pas encore d'évaluation
Bases de Données Nosql: TP Mongodb
Document19 pages
Bases de Données Nosql: TP Mongodb
Brandon Hunt
Pas encore d'évaluation
Examen BigData SR 1617
Document5 pages
Examen BigData SR 1617
Med Nour Elhak Jouini
Pas encore d'évaluation
Control Big Data N°4-AU22-23
Document3 pages
Control Big Data N°4-AU22-23
Ferdaous Hdioud
100% (1)
Correction DS Nov 2022
Document9 pages
Correction DS Nov 2022
khaskhoussithamer
Pas encore d'évaluation
Examen BigData SP 1617
Document6 pages
Examen BigData SP 1617
Sofien Haddad
Pas encore d'évaluation
Scratch Livret Formation Exemples Pedagogiques
Document40 pages
Scratch Livret Formation Exemples Pedagogiques
Vinny Terranova
Pas encore d'évaluation
Algpr TD6
Document5 pages
Algpr TD6
btboutadrstone
Pas encore d'évaluation
Catalogue Imou
Document28 pages
Catalogue Imou
MárioAlmeida
Pas encore d'évaluation
Capitre2 Structures-Conditionnelles
Document25 pages
Capitre2 Structures-Conditionnelles
harrathihadil66
Pas encore d'évaluation
PHP 7.
Document110 pages
PHP 7.
jastololte
Pas encore d'évaluation
Curriculum Vitae French 03 04 2022
Document2 pages
Curriculum Vitae French 03 04 2022
fayomi
Pas encore d'évaluation
Dataprivilege French A4 v07
Document2 pages
Dataprivilege French A4 v07
Thibaut Serge Vianey Akpro
Pas encore d'évaluation
(GUIDE) Arduino Utiliser Module Horloge Temps Réel - Arduino Fra
Document7 pages
(GUIDE) Arduino Utiliser Module Horloge Temps Réel - Arduino Fra
Sargo Maloba
Pas encore d'évaluation
Hardware FR
Document4 pages
Hardware FR
pierre chouakam
Pas encore d'évaluation
Objectifs: A. Formateurs Et Coordination
Document2 pages
Objectifs: A. Formateurs Et Coordination
i.assoumani09
Pas encore d'évaluation
Correction Devoir Reseau
Document7 pages
Correction Devoir Reseau
Rodrigue Ouedraogo
Pas encore d'évaluation
StudioLive 64S Capture3 Reference Manual FR
Document37 pages
StudioLive 64S Capture3 Reference Manual FR
Marc Souet
Pas encore d'évaluation
Modéle TCP/IP: Couche Application: Proposer Par: MR Sabri
Document16 pages
Modéle TCP/IP: Couche Application: Proposer Par: MR Sabri
Yassir EL-MOUCHOUAT
Pas encore d'évaluation
Examen 2023 2024 Correction
Document3 pages
Examen 2023 2024 Correction
mehdi serouti
Pas encore d'évaluation
TP N°01 Réseaux
Document4 pages
TP N°01 Réseaux
abdelhafidboukar9
Pas encore d'évaluation
Langage Python
Document21 pages
Langage Python
Siwar Ncir
Pas encore d'évaluation
TP1 Installation
Document7 pages
TP1 Installation
bouazizchahine7
Pas encore d'évaluation
s3 Codage Robovolc Elève (1)
Document2 pages
s3 Codage Robovolc Elève (1)
nonymhe
Pas encore d'évaluation
08 Network Layer Protocols and IP Addressing
Document42 pages
08 Network Layer Protocols and IP Addressing
Djopkop Marc Arthur
Pas encore d'évaluation
Le Tutoriel de Android Chip Et ChipGroup - 1633658052914
Document27 pages
Le Tutoriel de Android Chip Et ChipGroup - 1633658052914
babi bo
Pas encore d'évaluation
Chapitre I Architecture Générale de L'unité Centrale D'un Ordinateur
Document22 pages
Chapitre I Architecture Générale de L'unité Centrale D'un Ordinateur
Ouramdane
Pas encore d'évaluation
SRWE Module 8
Document32 pages
SRWE Module 8
wc4dq5vmsc
Pas encore d'évaluation
Programmation Paramétrée Siemens Paramètres Locales
Document13 pages
Programmation Paramétrée Siemens Paramètres Locales
Ilyes
Pas encore d'évaluation
Corrgé - Doc PDF 1
Document50 pages
Corrgé - Doc PDF 1
awomariane hungerfort
Pas encore d'évaluation
INTRODUCTION
Document2 pages
INTRODUCTION
budiongozola
Pas encore d'évaluation
2 ApplicationsInteractives Swing 1page
Document109 pages
2 ApplicationsInteractives Swing 1page
ryan tchatat
Pas encore d'évaluation
U. Louvain
Document36 pages
U. Louvain
Victor Sosa
Pas encore d'évaluation
KX MB2230EU French
Document168 pages
KX MB2230EU French
Carla Mesquita
Pas encore d'évaluation
Epreuve Info Théorique 5ème Évaluation 1 Trim 2 Janvier 2020 Collège ST Marc PDF
Document2 pages
Epreuve Info Théorique 5ème Évaluation 1 Trim 2 Janvier 2020 Collège ST Marc PDF
BAMALJoseph Firmin
75% (4)
Culture Digitale Séquence 1
Document178 pages
Culture Digitale Séquence 1
aitbellaabdelhamid30
Pas encore d'évaluation
BDD Enonce
Document3 pages
BDD Enonce
Ghassane Hali
Pas encore d'évaluation