Reconnaissance automatique de la parole audiovisuelle.

Résumé:

Conception et évaluation d’un système de reconnaissance audiovisuelle de la parole. Il s’agit d’utiliser des indices visuels tels le mouvement des lèvres et de la machoire afin d’améliorer les scores d’un système de reconnaissance audio à base de chaînes de Markov cachées. Plusieurs architectures d’intégration audiovisuelle ont été testées afin d’avoir un taux de reconnaissance audiovisuelle toujours supérieur au score de reconnaissance visuelle et audio, pour tous niveaux de dégradation audio. Un système électronique à base de DSP 56002 a été concu et réalisé afin d’extraire les paramètres labiaux et de les transmettre en temps réel, vers un système de reconnaissance audiovisuelle de la parole.