Aller au contenu

MSO 3.7 — Apprentissage bayésien

Décision bayésienne · Modèle de mélange · Chaîne de Markov cachée · Filtrage de Kalman


Responsable de la partie Apprentissage bayésien : Stéphane Derrode, Département Mathématiques et Informatique, Centrale Lyon


Objectifs

Cette page rassemble les ressources de la partie Apprentissage bayésien (Bayesian Learning) du module MSO 3.7 — Bayesian Learning and Text Mining, enseigné en filière Informatique (3A) de Centrale Lyon.

Fil conducteur : apprendre les paramètres d’un modèle statistique, puis prendre une décision optimale au sens bayésien — d’abord sur des données indépendantes (décision bayésienne, modèle de mélange gaussien et algorithme EM), puis sur des séries temporelles (chaîne de Markov cachée, puis filtrage de Kalman, présenté comme une chaîne de Markov à états continus).

  • 4 cours de 2h : décision bayésienne ; modèle de mélange + EM ; chaîne de Markov cachée ; filtrage de Kalman.
  • 3 TPs de 4h en présentiel (programmation Python) : décision bayésienne ; chaîne de Markov cachée ; filtrage de Kalman.
  • 1 TP en autonomie : modèle de mélange (EM appliqué à la segmentation d’image).

Soit 20h en présentiel.

La partie Text Mining (J. Velcin) n’est pas couverte sur cette page — voir l’espace Moodle Pedagogie3 du cours.


Évaluation

La note de la partie Apprentissage bayésien est la moyenne de 2 comptes-rendus de TP, à poids égal.

Épreuve Modalité Coefficient Échéance
CR TP — Chaîne de Markov cachée Individuel, zip (rapport + sources + image traitée), déposé sur Pedagogie3 1/2 Fin de séance #5
CR TP — Filtrage de Kalman Individuel, zip (rapport + sources), déposé sur Pedagogie3 1/2 Fin de séance #7

Format des rendus : rapport en .md ou .pdf uniquement (pas de .doc / .docx). Page de garde obligatoire (noms et prénoms des étudiants, date, titre du TP, module, encadrant).

Le TP de décision bayésienne (séance #2) et le TP de modèle de mélange (en autonomie) ne donnent pas lieu à un CR : ce sont des TP d’entraînement, mais ils préparent directement les deux TP notés.

Pas d’examen écrit : l’évaluation de cette partie repose entièrement sur les 2 CR.


Déroulé des séances

# Type Durée Sujet Supports Rendu
1 Cours 2h Décision bayésienne — critères de classification, cas discret et cas continu Introduction · Décision bayésienne · Démonstration · Programmes
2 TP 4h Décision bayésienne — segmentation d’une image bruitée, calcul des taux d’erreur TP Décision bayésienne
3 Cours 2h Modèle de mélange gaussien + EM — données i.i.d., estimation par Expectation-Maximization Modèle de mélange · Programmes
4 Cours 2h Chaîne de Markov cachée — séries temporelles, forward-backward, Viterbi, apprentissage EM Chaîne de Markov cachée · Programmes
5 TP 4h Chaîne de Markov cachée — restauration supervisée / non supervisée, application à la segmentation d’image TP HMC CR 1
6 Cours 2h Filtrage de Kalman — système dynamique linéaire-gaussien = chaîne de Markov à états continus ; filtre et lisseur de Kalman ; Kalman étendu (EKF) slides en préparation · Programmes
7 TP 4h Filtrage de Kalman — implémentation du filtre de Kalman et de l’EKF, application au suivi TP Kalman CR 2

Entre les séances #3 et #5 : le TP Modèle de mélange (Tuto EM in MM) est à réaliser en autonomie — il met en place l’algorithme EM et prépare directement le TP noté de la séance #5.


Travail en autonomie

  • Entre les séances #1 et #2 — parcourir l’énoncé du TP Décision bayésienne pour arriver en séance avec une vue d’ensemble du travail à faire.
  • Entre les séances #3 et #5 — réaliser le Tuto EM in MM (EM appliqué à la segmentation d’image). Le maîtriser facilite directement le TP HMC noté (séance #5).
  • Avant la séance #7 — parcourir l’énoncé du TP Filtrage de Kalman pour arriver en séance avec une vue d’ensemble.
  • Reprendre les calculs laissés en exercice à la fin des cours.

Consignes de rendu (CR des séances #5 et #7)

  • Le travail est individuel.
  • Le CR est un fichier compressé déposé sur Pedagogie3 avant la fin de séance, contenant :
    • les programmes développés et les images / courbes générées (un zip du répertoire de travail convient) ; pour le TP HMC, l’image que vous avez choisie pour la dernière partie doit également figurer dans le zip ;
    • un mini-rapport (.pdf ou .md ; les formats .doc / .docx ne sont pas acceptés), avec page de garde (noms et prénoms des étudiants, date, titre du TP, module, encadrant).
  • Dans le rapport : reproduire les courbes générées et les commenter (montrer que la méthode est comprise), puis interpréter les résultats — en particulier, pour la dernière partie du TP HMC, dire si la segmentation est bonne ou mauvaise, et pourquoi.

Dernière mise à jour : mai 2026