Reconnaissance automatique de la parole audiovisuelle.

Résumé: Conception et évaluation d’un système de reconnaissance audiovisuelle de la parole. Il s’agit d’utiliser des indices visuels tels le mouvement des lèvres et de la machoire afin d’améliorer les scores d’un système de reconnaissance audio à base de chaînes de Markov cachées. Plusieurs architectures d’intégration audiovisuelle ont été testées afin d’avoir un taux de […]

Études dans le cadre de l’inversion acoustico-articulatoire : Amélioration d’un modèle articulatoire, normalisation du locuteur et récupération du lieu de constriction des plosives.

Résumé: Cette thèse traite de l’inversion acoustico-articulatoire et de la robotique anthropomorphique de la parole. De manière plus précise, le sujet abordé porte sur le contrôle d’un modèle anthropomorphique du conduit vocal en vue de la production de séquences à partir de consignes acoustiques. Trois étapes ont été définies : -Amélioration d’un modèle articulatoire afin […]

Recherche d’invariants acoustiques pour la reconnaissance automatique du locuteur.

Résumé: L’identification du locuteur consiste à attribuer une identité au locuteur d’un énoncé. Cette identité sera celle du locuteur d’une base de référence qui est le plus proche de ce locuteur inconnu, au sens d’une mesure de similarité donnée. Le mode indépendant du texte signifie qu’il n’y a aucune contrainte sur le contenu des phrases […]