Technologies Informatiques du Big Data, EC Casablanca

Auteurs

Table des matières

Cet espace recueille les fichiers de cours et TP du module Technologies Informatiques du Big Data, enseigné à l’École Centrale de Casablanca. Tous les rendus se feront sur le site edunao.



Informations generales

Evaluation

  • Un examen de TP lors de la dernière séance (le mardi 24 décembre). La note comptera pour 33% de la note finale
  • Un dossier, à rédiger sur un sujet en lien avec le big data par 2 à 3 élèves. Les consignes sont disponibles sur ce lien et seront présentées lors de la première séance de cours. La note comptera pour 67% de la note finale.

Deroule des seances


Sequence #1 (16 & 17 dec. 2024) - Introduction au Big Data et a l’Open Data

Objectifs de la séquence

Vidéos complémentaires


Sequence #2 (18 & 23 dec. 2024) - Algorithme map-reduce (framework Hadoop)

Objectifs de la séquence

  • Présentation de map-reduce et du framework Hadoop.
  • Réalisation du TP Hadoop natif sur l’utilisation d’un cluster hadoop fonctionnant sous Linux (job map-reduce, HDFS…).

Sequence #3 (23 & 24 dec. 2024) - Algorithme map-reduce (librairie MrJob)

Objectifs de la séquence

  • Présentation de la librairie MRJob.
  • Réalisation du TP Hadoop avec MrJob sur l’usage de cette librairie.