TP : Spark Librairies

Auteurs

Objectifs

Ce TP fait suite au TP Spark et va vous permettre de découvrir deux librairies : Spark streaming et MLlib.



TP Spark streaming et MLlib

Ce TP fait suite au TP Spark sur le framework Spark. Ce dernier est doté de librairies : Spark SQL, Spark streaming, MLlib et GraphX (cf Apache Spark). Nous allons effleurer quelques possibilités offertes par Spark streaming et par MLlib. Et si vous en avez le temps, allez voir également SparkSQL !


Spark streaming est une extension de la librairie principale de Spark, qui permet de traiter des flux continus de données. Suivez les consignes décrites dans ce fichier pour mettre en place une petite manip:


Spark.MLlib est une extension de la librairie principale de Spark, qui permet de développer des algorithmes de Machine Learning efficace avec des données massives. Merci de suivre ce tutoriel pour expérimenter la librairie: