Résumé: Conception et évaluation d’un système de reconnaissance audiovisuelle de la parole. Il s’agit d’utiliser des indices visuels tels le mouvement des lèvres et de la machoire afin d’améliorer les scores d’un système de reconnaissance audio à base de chaînes de Markov cachées. Plusieurs architectures d’intégration audiovisuelle ont été testées afin d’avoir un taux de […]
Les thèses du domaine (en ligne depuis 1994)
Liste des thèses francophones traitant de la communication parlée.
Vous trouverez les plus récentes au format pdf ou ps compressés, ainsi que leur résumé.
Vous pouvez soumettre un manuscrit de thèse à l’aide de ce formulaire.
Application de la methode numérique TLM (Transmission Line Matrix) aux ondes acoustiques et à la parole.
ACHILE : un dispositif de décodage acoustico-phonétique et d’identification lexicale indépendant du locuteur à partir de modules mixtes.
Études dans le cadre de l’inversion acoustico-articulatoire : Amélioration d’un modèle articulatoire, normalisation du locuteur et récupération du lieu de constriction des plosives.
Résumé: Cette thèse traite de l’inversion acoustico-articulatoire et de la robotique anthropomorphique de la parole. De manière plus précise, le sujet abordé porte sur le contrôle d’un modèle anthropomorphique du conduit vocal en vue de la production de séquences à partir de consignes acoustiques. Trois étapes ont été définies : -Amélioration d’un modèle articulatoire afin […]
Extension du modèle stochastique des mélanges de trajectoires pour la reconnaissance automatique de la parole continue.
Modèles de séquences de longueurs variables : application au traitement du langage écrit et de la parole.
Réseaux à codage temporel : propagation libre et guidée.
Résumé: Ce travail s’inscrit dans le cadre général de la modélisation de systèmes neuromimétiques capables d’évoluer dans des environnements temporels. Il s’agit d’un travail où nous voulions voir quelles étaient les grandeurs et servitudes d’une représentation temporelle de l’information : intuition d’efficacité de traduction matérielle (analogique par le temps), spécificité d’une dimension » causale » pour représenter l’information […]
Informations segmentales et reconnaissance de parole par modèles de Markov cachés.
Pistes pour le contrôle d’un robot parlant capable de réduction vocalique.
Résumé: L’objectif de cette thèse est d’étudier comment la commande phonémique, par essence abstraite et invariante, est codée en termes de contrôle moteur pour générer un signal acoustique physique et variable. Pour cela, un modèle de contrôle moteur est exploité, s’appuyant sur la Théorie du « Point d’Équilibre », proposée par A. Feldman, selon laquelle tout mouvement […]