RMachine-learning-based analysis of Pseudo Mass-Spectrum Images for Targeted Peptides Identification

Author : Léo Schneider

Subject

Le projet de recherche de Léo Schneider est mené dans le cadre d’une collaboration entre le Professeur S. Derrode, responsable de l’équipe Imagine du LIRIS (Lyon), et l’équipe de spectrométrie de masse bioanalytique de l’Institut des Sciences Analytiques (Lyon/Villeurbanne), dirigée par Prof. J. Lemoine, dont les études portent sur le développement d’approches quantitatives omiques pour des applications cliniques et environnementales.

Ce projet est plus particulièrement lié à un programme de recherche interdisciplinaire (financement ANR, RHU IDBIORIV - 2019-2026 ) incluant des médecins, des microbiologistes cliniciens et des statisticiens (Institut des Agents Infectieux, Centre International de Recherche en Infectiologie), et dont l’objectif principal est de développer de nouvelles méthodes basées sur la spectrométrie de masse et des workflows computationnels pour réduire le délai de l’étape de diagnostic des infections du sang, des urines ou toute autre matrice biologique.

Le mode d’acquisition SWATH/DIA permet d’identifier des peptides rapporteurs sans recourir à la construction de banques spectrales. Le projet de recherche vise au développement d’algorithmes, basé sur l’apprentissage profond (deep learning), permettant de traiter les données brutes en mode DIA, et capable de fournir des informations directement interprétables par les médecins infectiologue. Il s’agira en particulier d’identifier des micro-organismes pathogènes et prédire le niveau des résistances aux antibiotiques de ces mêmes pathogènes.

L’idée que nous développons durant la thèse consiste à transformer les grands volumes de séries temporelles issues d’un spectrogramme de masse en images, sur lesquelles des méthodes de reconnaissance de formes et d’apprentissage statistique et/ou profond pourront s’appliquer pour identifier automatiquement les peptides cibles. Les performances en termes de taux d’identification de peptides cibles (sensibilité et spécificité) des algorithmes proposés, en bout de chaîne, seront évaluées grâce à la connaissance précise des échantillons biologiques analysés au sein des équipes de l’Institut des Sciences Analytiques et de l’Institut des Agents Infectieux de l’Hôpital de la Croix Rousse (F. Vandenesch).

Éléments bibliographiques

  1. Wishart, David S., Emerging applications of metabolomics in drug discovery and precision medicine, Nature reviews Drug discovery 15.7 (2016): 473-484.
  2. Chaleckis, Romanas, et al., Challenges, progress and promises of metabolite annotation for LC–MS-based metabolomics, Current opinion in biotechnology, 55 (2019): 44-50.
  3. Wang, H, Yandong Y, and Zheng-Jiang Z. Encoding LC–MS-Based Untargeted Metabolomics Data into Images toward AI-Based Clinical Diagnosis, Analytical Chemistry (2023).
  4. Shen X, Shao W, Wang C, Liang L, Chen S, Zhang S, Rusu M, Snyder MP. Deep learning-based pseudo-mass spectrometry imaging analysis for precision medicine. Brief Bioinform. 2022 Sep 20;23(5):bbac331.
  5. Guo, J, et Tao H. Mechanistic Understanding of the Discrepancies between Common Peak Picking Algorithms in Liquid Chromatography–Mass Spectrometry-Based Metabolomics, Analytical Chemistry 95, no 14 (2023): 5894 5902.