Skip to content

SakhriHoussem/MapReduce-Python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

26 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MapReduce Python

MapReduce Python Example

Exemples :

* Exemple 1: Total des ventes par magasin
* Exemple 4: Calculer maximum et minimum du salaire
* Exemple 5: Calculer moyenne de l'écart type du Salaire
* Exemple 6: Anagram 

Exemple 1 : en à utiliser un fichier input sous la forme suivant:

	 date | temps | magasin| produit | cout | paiement

Exemple 4 & 5: en à utiliser un fichier input sous la forme suivant:

	 id , age , sexe , adresse , salaire

Exemple 6 : en à utiliser un fichier input sous la forme suivant:

	melon barre deviner lemon
	arbre fiable fable vendre
	devenir faible barbe

Executer le program MapReduce Python on local

pour test avant de passer en MapReduce pour détecter les erreurs Syntaxique

cat <chemin de fichier input on local> | python <chemin de fichier mapper.py on local> | python <chemin de fichier reducer.py on local>

Copier le fichier input on HDFS

hdfs dfs -CopyFromLocal <chemin du ficher input on Local> <nom de dossier de destination>

ou :

hadoop fs -CopyFromLocal <chemin du fichier input on Local> <nom de dossier de destination>

Commande d'exécution du program MapReduce en Python :

hadoop jar <chemin de fichier streaming.jar> 
-Dmaperd.reduce,tasks=1
-file  <chemin du ficher map on Local>
-mapper "python <chemin du ficher map  on Local>"
-file <chemin du ficher reduce on Local>
-reducer "python <chemin du ficher reduce on Local>"
-input <chemin du ficher input on HDFS>
-output <chemin du ficher output on HDFS>

Commande d'afficher contenu de fichier Output :

hadoop fs -cat <chemin de fichier output>/part-00000 

Commande de suppression du répertoire Output :

hadoop fs -rm -r <répertoire de fichier output>

Execution d'un exemple :

en va choisi l'exemple 1 pour tester

copier l'exemple 1 dans le chemin suivant: /home/cloudera

# créer répertoire input dans HDFS
hadoop fs -mkdir /user/input
# transférer le fichier input.text du local vers HDFS
hadoop fs -copyFromLocal /home/cloudera/Exemple1/input.txt  input/ 
# execution Program Mapreduce
hadoop jar /usr/lib/hadoop-0.20-mapreduce/contrib/streaming/hadoop-streaming-2.6.0-mr1-cdh5.12.0.jar
-Dmaperd.reduce,tasks=1
-file /home/cloudera/Exemple1/mapper.py
-mapper "python /home/cloudera/Exemple1/mapper.py"
-file /home/cloudera/Exemple1/reducer.py
-reducer "python /home/cloudera/Exemple1/reducer.py"
-input Exemple1/input.txt #exemple
-output out
# afficher le contenu de fichier output
hadoop fs -cat out/part-00000 
# suppression du répertoire Output
hadoop fs -rm -r out
``