L’équipe de l’Université Great Bay a présenté PhysMamba, un cadre d’IA innovant pour mesurer la fréquence cardiaque et les signaux physiologiques associés via vidéos facialesCette innovation importante dans la photopléthysmographie à distance (rPPG) fournit une méthode sans contact pour la surveillance de la santé, ce qui ouvre de nouvelles opportunités pour des applications médicales et de bien-être immédiates.
PhysMamba se distingue des méthodologies rPPG antérieures qui s’appuyaient principalement sur des réseaux neuronaux convolutionnels (CNN) et des transformateurs. Ces approches de mesure traditionnelles avaient souvent du mal à capturer avec précision les dépendances temporelles à longue portée essentielles à la mesure de la fréquence cardiaque, en particulier lorsqu’il s’agissait de séquences vidéo plus longues. PhysMamba résout ces obstacles en introduisant un bloc de différence temporelle Mamba (TD-Mamba) de pointe ainsi qu’une architecture SlowFast à double flux. Ce faisant, le modèle traite efficacement les caractéristiques temporelles à court et à long terme, augmentant ainsi sa précision dans la détection de signaux physiologiques précis. Vous pouvez lire l’article ici.
Grâce à une série d’expériences détaillées sur des ensembles de données de référence, notamment PURE, UBFC-rPPG et MMPD, PhysMamba a montré des avancées impressionnantes par rapport aux modèles actuels. Cela a entraîné une diminution des taux d’erreur et une précision accrue dans l’estimation de la fréquence cardiaque. Surpassant largement les modèles CNN et Transformer classiques, le cadre innovant s’est avéré particulièrement efficace dans les situations réelles affectées par les variations d’éclairage et les mouvements du visage.
Cette nouvelle version d’un modèle d’IA, adoptée par le CCBR 2024, constitue une avancée cruciale dans la surveillance physiologique non invasive. L’équipe de recherche a publié le code pour PhysMamba sur GitHub, offrant des opportunités de recherche et de développement supplémentaires dans ce domaine passionnant de la vision par ordinateur et des technologies de la santé.