TP #1 - Hadoop map-reduce

avec la librairie MRJobs

Ce TP fait suite au cours sur le framework libre et open source appelé Hadoop, développé et maintenu par la Fondation Apache.

La première étape consiste à rapatrier des fichiers qui nous seront utiles:

Wordcount_Local.md

Pour installer Hadoop sur votre machine (à l’aide de Docker), suivez les consignes du fichier :

Install_Docker_Hadoop.md

Suivez ensuite les consignes permettant de lancer le comptage de mots en tant que job Hadoop :

Wordcount_Hadoop.md

Enfin, répondez aux exercices de cet énoncé qui exploite la librairie MRJobs:

Enonce_TP_MRJobs.md