TP #2 - Spark

Ce TP fait suite au cours sur le framework Apache Spark, développé et maintenu par la Fondation Apache.

Le CR demandé en fin de séance ne porte que sur la seconde partie de la Partie 3.


Partie 1 (45 minutes)- Programmation fonctionnelle en Python

Voici quelques exercices pour vous entraîner avec les fonctions map, reduce et filter

Test_Spark.md


Partie 2 (30 minutes) - Tests de Spark, avec la librairie pyspark

Pour lancer votre premier script pyspsark, suivez les consignes exposées dans le fichier :

Test_Spark.md


Partie 3 (165 minutes) - Programmez avec pyspark

Le travail personnel (en monôme ou en binôme) :

Enonce_TP_Spark.md