Technologies Informatiques du Big Data, EC Casablanca
Auteurs
- Stéphane Derrode & Lamia Derrode, Centrale Lyon, Dpt Mathématiques & Informatique
Table des matières
Cet espace recueille les fichiers de cours et TP du module Technologies Informatiques du Big Data, enseigné à l’École Centrale de Casablanca. Tous les rendus se feront sur le site edunao.
Informations generales¶
- 20h de cours et de TP, du 15 au 22 décembre 2025.
- Examen sur table programmé en dernière séance, le 22 décembre.
-
Slides des séquences de cours :
Evaluation¶
- Un examen sur table lors de la dernière séance (le lundi 22 décembre). La note comptera pour 50% de la note finale
- Un rapport, à rédiger selon les consignes donnée sur ce lien par groupe de 2 élèves. La note comptera pour 50% de la note finale.
Deroule des seances¶
Sequence #1 (15 dec. 2025) - Introduction au Big Data¶
Objectifs de la séquence
- Introduction au Big Data: enjeux éthiques, économiques & scientifiques.
Vidéos complémentaires
- Le Big Data pour mieux nous comprendre.
- Let’s pool our medical data.
- Why privacy matters?
- Big Data will impact every part of your life.
- Big data and dangerous ideas.
- Big Data and the Rise of Augmented Intelligence.
- How Big Data Can Influence Decisions That Actually Matter.
- Is Big Data Killing Creativity?
- Analyzing and modeling complex and big data.
- How to Monetize Big Data.
- How to predict the future with big data.
- Demand on a more open-source government.
Sequence #2 (15 & 16 dec. 2025) - Open Data et Web semantique¶
Objectifs de la séquence
- Introduction à l’Open Data et à SparQL. Vidéos utilisées en cours:
- TP LoD sur SparQL. Attention Contrairement à ce qu’indique l’énoncé de TP, il n’y a pas de compte-rendu à rendre.
Vidéos complémentaires
Sequence #3 (17 & 19 dec. 2025) - Algorithme map-reduce (framework Hadoop)¶
Objectifs de la séquence
- Présentation de map-reduce et du framework Hadoop.
- Réalisation du TP Hadoop natif sur l’utilisation d’un cluster Hadoop fonctionnant sous Linux avec un container Docker (job map-reduce, HDFS…).
Sequence #4 (19 & 22 dec. 2025) - Algorithme map-reduce (librairie MrJob)¶
Objectifs de la séquence
- Présentation de la librairie MRJob.
- Réalisation du TP Hadoop avec MrJob sur l’usage de cette librairie.