Approches géométriques et topologiques des données biomédicales
Lundi 31 janvier 2022
Présentée par Smita Krishnaswamy, Professeur associé, Département de génétique et d'informatique, Yale School of Medicine
Résumé de la rencontre Les données à haut débit et à haute dimension sont devenues omniprésentes dans les sciences biomédicales grâce aux percées réalisées dans les technologies de mesure et la collecte de données. Bien que ces grands ensembles de données contenant des millions d'observations de cellules, de peuples ou de voxels cérébraux présentent un grand potentiel pour comprendre l'espace d'état génératif des données, ainsi que les facteurs de différenciation, de maladie et de progression, ils posent également de nouveaux défis en termes de bruit, de données manquantes, d'artefacts de mesure et de ce que l'on appelle la "malédiction de la dimensionnalité". Dans cet exposé, je couvrirai les approches géométriques et topologiques des données pour comprendre la forme et la structure des données.
Tout d'abord, nous montrons comment la géométrie de diffusion et l'apprentissage profond peuvent être utilisés pour obtenir des représentations utiles des données qui permettent le débruitage, la réduction de la dimensionnalité. Ensuite, nous montrons comment combiner la géométrie de diffusion avec la topologie pour extraire des caractéristiques multi-granulaires des données afin de faciliter l'analyse différentielle et prédictive. D'un autre côté, nous créons également une géométrie manifold à partir de descripteurs topologiques, et montrons ses applications aux neurosciences. Enfin, nous montrerons comment apprendre la dynamique à partir de données statiques instantanées en utilisant un transport optimal basé sur des ODE neuronales régularisées par un manifold. Ensemble, nous montrerons un cadre complet pour l'analyse exploratoire et non supervisée des grandes données biomédicales.
Biographie Smita Krishnaswamy est professeur associé au département de génétique et d'informatique de l'école de Yale, membre principal du programme de mathématiques appliquées, de biologie computationnelle et de neurosciences interdisciplinaires. Elle est également affiliée au Yale Center for Biomedical Data Science, au Yale Cancer Center et au Wu-Tsai Institute. Les recherches de Smita se concentrent sur le développement de méthodes d'apprentissage de représentation profonde qui utilisent des concepts mathématiques issus de l'apprentissage des formes multiples, de la géométrie des données, de la topologie et du traitement du signal pour débruiter, imputer, visualiser et extraire la structure, les modèles et les relations des données biomédicales volumineuses, à haut débit et à haute dimension. Ses méthodes ont été appliquées à divers ensembles de données provenant de nombreux systèmes en biologie du cancer, en immunologie, en neurosciences et en biologie structurelle.