MSO 3.7 — Apprentissage bayésien
Décision bayésienne · Modèle de mélange · Chaîne de Markov cachée · Filtrage de Kalman
Responsable de la partie Apprentissage bayésien : Stéphane Derrode, Département Mathématiques et Informatique, Centrale Lyon
Objectifs¶
Cette page rassemble les ressources de la partie Apprentissage bayésien (Bayesian Learning) du module MSO 3.7 — Bayesian Learning and Text Mining, enseigné en filière Informatique (3A) de Centrale Lyon.
Fil conducteur : apprendre les paramètres d’un modèle statistique, puis prendre une décision optimale au sens bayésien — d’abord sur des données indépendantes (décision bayésienne, modèle de mélange gaussien et algorithme EM), puis sur des séries temporelles (chaîne de Markov cachée, puis filtrage de Kalman, présenté comme une chaîne de Markov à états continus).
- 4 cours de 2h : décision bayésienne ; modèle de mélange + EM ; chaîne de Markov cachée ; filtrage de Kalman.
- 3 TPs de 4h en présentiel (programmation Python) : décision bayésienne ; chaîne de Markov cachée ; filtrage de Kalman.
- 1 TP en autonomie : modèle de mélange (EM appliqué à la segmentation d’image).
Soit 20h en présentiel.
La partie Text Mining (J. Velcin) n’est pas couverte sur cette page — voir l’espace Moodle Pedagogie3 du cours.
Évaluation¶
La note de la partie Apprentissage bayésien est la moyenne de 2 comptes-rendus de TP, à poids égal.
| Épreuve | Modalité | Coefficient | Échéance |
|---|---|---|---|
| CR TP — Chaîne de Markov cachée | Individuel, zip (rapport + sources + image traitée), déposé sur Pedagogie3 | 1/2 | Fin de séance #5 |
| CR TP — Filtrage de Kalman | Individuel, zip (rapport + sources), déposé sur Pedagogie3 | 1/2 | Fin de séance #7 |
Format des rendus : rapport en
.mdou.doc/.docx). Page de garde obligatoire (noms et prénoms des étudiants, date, titre du TP, module, encadrant).Le TP de décision bayésienne (séance #2) et le TP de modèle de mélange (en autonomie) ne donnent pas lieu à un CR : ce sont des TP d’entraînement, mais ils préparent directement les deux TP notés.
Pas d’examen écrit : l’évaluation de cette partie repose entièrement sur les 2 CR.
Déroulé des séances¶
| # | Type | Durée | Sujet | Supports | Rendu |
|---|---|---|---|---|---|
| 1 | Cours | 2h | Décision bayésienne — critères de classification, cas discret et cas continu | Introduction · Décision bayésienne · Démonstration · Programmes | — |
| 2 | TP | 4h | Décision bayésienne — segmentation d’une image bruitée, calcul des taux d’erreur | TP Décision bayésienne | — |
| 3 | Cours | 2h | Modèle de mélange gaussien + EM — données i.i.d., estimation par Expectation-Maximization | Modèle de mélange · Programmes | — |
| 4 | Cours | 2h | Chaîne de Markov cachée — séries temporelles, forward-backward, Viterbi, apprentissage EM | Chaîne de Markov cachée · Programmes | — |
| 5 | TP | 4h | Chaîne de Markov cachée — restauration supervisée / non supervisée, application à la segmentation d’image | TP HMC | CR 1 |
| 6 | Cours | 2h | Filtrage de Kalman — système dynamique linéaire-gaussien = chaîne de Markov à états continus ; filtre et lisseur de Kalman ; Kalman étendu (EKF) | slides en préparation · Programmes | — |
| 7 | TP | 4h | Filtrage de Kalman — implémentation du filtre de Kalman et de l’EKF, application au suivi | TP Kalman | CR 2 |
Entre les séances #3 et #5 : le TP Modèle de mélange (Tuto EM in MM) est à réaliser en autonomie — il met en place l’algorithme EM et prépare directement le TP noté de la séance #5.
Travail en autonomie¶
- Entre les séances #1 et #2 — parcourir l’énoncé du TP Décision bayésienne pour arriver en séance avec une vue d’ensemble du travail à faire.
- Entre les séances #3 et #5 — réaliser le Tuto EM in MM (EM appliqué à la segmentation d’image). Le maîtriser facilite directement le TP HMC noté (séance #5).
- Avant la séance #7 — parcourir l’énoncé du TP Filtrage de Kalman pour arriver en séance avec une vue d’ensemble.
- Reprendre les calculs laissés en exercice à la fin des cours.
Consignes de rendu (CR des séances #5 et #7)¶
- Le travail est individuel.
- Le CR est un fichier compressé déposé sur Pedagogie3 avant la fin de séance, contenant :
- les programmes développés et les images / courbes générées (un zip du répertoire de travail convient) ; pour le TP HMC, l’image que vous avez choisie pour la dernière partie doit également figurer dans le zip ;
- un mini-rapport (
.pdfou.md; les formats.doc/.docxne sont pas acceptés), avec page de garde (noms et prénoms des étudiants, date, titre du TP, module, encadrant).
- Dans le rapport : reproduire les courbes générées et les commenter (montrer que la méthode est comprise), puis interpréter les résultats — en particulier, pour la dernière partie du TP HMC, dire si la segmentation est bonne ou mauvaise, et pourquoi.
Dernière mise à jour : mai 2026