* Exemple 1: Total des ventes par magasin
* Exemple 4: Calculer maximum et minimum du salaire
* Exemple 5: Calculer moyenne de l'écart type du Salaire
* Exemple 6: Anagram
date | temps | magasin| produit | cout | paiement
id , age , sexe , adresse , salaire
melon barre deviner lemon
arbre fiable fable vendre
devenir faible barbe
pour test avant de passer en MapReduce pour détecter les erreurs Syntaxique
cat <chemin de fichier input on local> | python <chemin de fichier mapper.py on local> | python <chemin de fichier reducer.py on local>
hdfs dfs -CopyFromLocal <chemin du ficher input on Local> <nom de dossier de destination>
ou :
hadoop fs -CopyFromLocal <chemin du fichier input on Local> <nom de dossier de destination>
hadoop jar <chemin de fichier streaming.jar>
-Dmaperd.reduce,tasks=1
-file <chemin du ficher map on Local>
-mapper "python <chemin du ficher map on Local>"
-file <chemin du ficher reduce on Local>
-reducer "python <chemin du ficher reduce on Local>"
-input <chemin du ficher input on HDFS>
-output <chemin du ficher output on HDFS>
hadoop fs -cat <chemin de fichier output>/part-00000
hadoop fs -rm -r <répertoire de fichier output>
en va choisi l'exemple 1 pour tester
copier l'exemple 1 dans le chemin suivant: /home/cloudera
# créer répertoire input dans HDFS
hadoop fs -mkdir /user/input
# transférer le fichier input.text du local vers HDFS
hadoop fs -copyFromLocal /home/cloudera/Exemple1/input.txt input/
# execution Program Mapreduce
hadoop jar /usr/lib/hadoop-0.20-mapreduce/contrib/streaming/hadoop-streaming-2.6.0-mr1-cdh5.12.0.jar
-Dmaperd.reduce,tasks=1
-file /home/cloudera/Exemple1/mapper.py
-mapper "python /home/cloudera/Exemple1/mapper.py"
-file /home/cloudera/Exemple1/reducer.py
-reducer "python /home/cloudera/Exemple1/reducer.py"
-input Exemple1/input.txt #exemple
-output out
# afficher le contenu de fichier output
hadoop fs -cat out/part-00000
# suppression du répertoire Output
hadoop fs -rm -r out
``