MSO 3.7 — Apprentissage bayésien

Décision bayésienne · Modèle de mélange · Chaîne de Markov cachée · Filtrage de Kalman

Responsable de la partie Apprentissage bayésien : Stéphane Derrode, Département Mathématiques et Informatique, Centrale Lyon

Objectifs¶

Cette page rassemble les ressources de la partie Apprentissage bayésien (Bayesian Learning) du module MSO 3.7 — Bayesian Learning and Text Mining, enseigné en filière Informatique (3A) de Centrale Lyon.

Fil conducteur : apprendre les paramètres d’un modèle statistique, puis prendre une décision optimale au sens bayésien — d’abord sur des données indépendantes (décision bayésienne, modèle de mélange gaussien et algorithme EM), puis sur des séries temporelles (chaîne de Markov cachée, puis filtrage de Kalman, présenté comme une chaîne de Markov à états continus).

4 cours de 2h : décision bayésienne ; modèle de mélange + EM ; chaîne de Markov cachée ; filtrage de Kalman.
3 TPs de 4h en présentiel (programmation Python) : décision bayésienne ; chaîne de Markov cachée ; filtrage de Kalman.
1 TP en autonomie : modèle de mélange (EM appliqué à la segmentation d’image).

Soit 20h en présentiel.

La partie Text Mining (J. Velcin) n’est pas couverte sur cette page — voir l’espace Moodle Pedagogie3 du cours.

Évaluation¶

La note de la partie Apprentissage bayésien est la moyenne de 2 comptes-rendus de TP, à poids égal.

Épreuve	Modalité	Coefficient	Échéance
CR TP — Chaîne de Markov cachée	Individuel, zip (rapport + sources + image traitée), déposé sur Pedagogie3	1/2	Fin de séance #5
CR TP — Filtrage de Kalman	Individuel, zip (rapport + sources), déposé sur Pedagogie3	1/2	Fin de séance #7

Format des rendus : rapport en .md ou .pdf uniquement (pas de .doc / .docx). Page de garde obligatoire (noms et prénoms des étudiants, date, titre du TP, module, encadrant).

Le TP de décision bayésienne (séance #2) et le TP de modèle de mélange (en autonomie) ne donnent pas lieu à un CR : ce sont des TP d’entraînement, mais ils préparent directement les deux TP notés.

Pas d’examen écrit : l’évaluation de cette partie repose entièrement sur les 2 CR.

Déroulé des séances¶

#	Type	Durée	Sujet	Supports	Rendu
1	Cours	2h	Décision bayésienne — critères de classification, cas discret et cas continu	Introduction · Décision bayésienne · Démonstration · Programmes	—
2	TP	4h	Décision bayésienne — segmentation d’une image bruitée, calcul des taux d’erreur	TP Décision bayésienne	—
3	Cours	2h	Modèle de mélange gaussien + EM — données i.i.d., estimation par Expectation-Maximization	Modèle de mélange · Programmes	—
4	Cours	2h	Chaîne de Markov cachée — séries temporelles, forward-backward, Viterbi, apprentissage EM	Chaîne de Markov cachée · Programmes	—
5	TP	4h	Chaîne de Markov cachée — restauration supervisée / non supervisée, application à la segmentation d’image	TP HMC	CR 1
6	Cours	2h	Filtrage de Kalman — système dynamique linéaire-gaussien = chaîne de Markov à états continus ; filtre et lisseur de Kalman ; Kalman étendu (EKF)	slides en préparation · Programmes	—
7	TP	4h	Filtrage de Kalman — implémentation du filtre de Kalman et de l’EKF, application au suivi	TP Kalman	CR 2

Entre les séances #3 et #5 : le TP Modèle de mélange (Tuto EM in MM) est à réaliser en autonomie — il met en place l’algorithme EM et prépare directement le TP noté de la séance #5.

Travail en autonomie¶

Entre les séances #1 et #2 — parcourir l’énoncé du TP Décision bayésienne pour arriver en séance avec une vue d’ensemble du travail à faire.
Entre les séances #3 et #5 — réaliser le Tuto EM in MM (EM appliqué à la segmentation d’image). Le maîtriser facilite directement le TP HMC noté (séance #5).
Avant la séance #7 — parcourir l’énoncé du TP Filtrage de Kalman pour arriver en séance avec une vue d’ensemble.
Reprendre les calculs laissés en exercice à la fin des cours.

Consignes de rendu (CR des séances #5 et #7)¶

Le travail est individuel.
Le CR est un fichier compressé déposé sur Pedagogie3 avant la fin de séance, contenant :
- les programmes développés et les images / courbes générées (un zip du répertoire de travail convient) ; pour le TP HMC, l’image que vous avez choisie pour la dernière partie doit également figurer dans le zip ;
- un mini-rapport (.pdf ou .md ; les formats .doc / .docx ne sont pas acceptés), avec page de garde (noms et prénoms des étudiants, date, titre du TP, module, encadrant).
Dans le rapport : reproduire les courbes générées et les commenter (montrer que la méthode est comprise), puis interpréter les résultats — en particulier, pour la dernière partie du TP HMC, dire si la segmentation est bonne ou mauvaise, et pourquoi.

Dernière mise à jour : mai 2026