Aller au contenu

Technologies Informatiques du Big Data, EC Casablanca

Auteurs

Table des matières

Cet espace recueille les fichiers de cours et TP du module Technologies Informatiques du Big Data, enseigné à l’École Centrale de Casablanca. Tous les rendus se feront sur le site edunao.


Informations generales

Evaluation

  • Un examen sur table lors de la dernière séance (le lundi 22 décembre). La note comptera pour 50% de la note finale
  • Un rapport, à rédiger selon les consignes donnée sur ce lien par groupe de 2 élèves. La note comptera pour 50% de la note finale.

Deroule des seances


Sequence #1 (15 dec. 2025) - Introduction au Big Data

Objectifs de la séquence

  • Introduction au Big Data: enjeux éthiques, économiques & scientifiques.

Vidéos complémentaires

Sequence #2 (15 & 16 dec. 2025) - Open Data et Web semantique

Objectifs de la séquence

Vidéos complémentaires


Sequence #3 (17 & 19 dec. 2025) - Algorithme map-reduce (framework Hadoop)

Objectifs de la séquence

  • Présentation de map-reduce et du framework Hadoop.
  • Réalisation du TP Hadoop natif sur l’utilisation d’un cluster Hadoop fonctionnant sous Linux avec un container Docker (job map-reduce, HDFS…).

Sequence #4 (19 & 22 dec. 2025) - Algorithme map-reduce (librairie MrJob)

Objectifs de la séquence

  • Présentation de la librairie MRJob.
  • Réalisation du TP Hadoop avec MrJob sur l’usage de cette librairie.