Détection de mots-clés dans un flux de parole : Application à l’indexation de documents multimédias.

Résumé: La quantité d’information multimédia accessible croît de façon vertigineuse. L’avènement de la micro informatique permet à chacun d’apporter sa participation à la création de cette nouvelle source d’information planétaire qu’est « Internet », tandis que les média proposent maintenant la connexion à des bouquets de chaînes de télévision numériques transmis par satellite. L’accès à cette quantité […]

Reconnaissance automatique de la parole audiovisuelle.

Résumé: Conception et évaluation d’un système de reconnaissance audiovisuelle de la parole. Il s’agit d’utiliser des indices visuels tels le mouvement des lèvres et de la machoire afin d’améliorer les scores d’un système de reconnaissance audio à base de chaînes de Markov cachées. Plusieurs architectures d’intégration audiovisuelle ont été testées afin d’avoir un taux de […]

Reconnaissance de la parole continue : adaptation au locuteur et contrôle temporel dans les modèles de Markov cachés.

Résumé: Les systèmes les plus performants en reconnaissance de la parole continue exploitent une approche statistique par modèles de Markov cachés, mais leur qualité reste encore décevante. Nous avons cherché à améliorer un système standard de reconnaissance en étudiant plus particulièrement l’adaptation au locuteur et la modélisation de la durée acoustique. Afin d’évaluer la pertinence […]

Réseaux à codage temporel : propagation libre et guidée.

Résumé: Ce travail s’inscrit dans le cadre général de la modélisation de systèmes neuromimétiques capables d’évoluer dans des environnements temporels. Il s’agit d’un travail où nous voulions voir quelles étaient les grandeurs et servitudes d’une représentation temporelle de l’information : intuition d’efficacité de traduction matérielle (analogique par le temps), spécificité d’une dimension  » causale  » pour représenter l’information […]

Pistes pour le contrôle d’un robot parlant capable de réduction vocalique.

Résumé: L’objectif de cette thèse est d’étudier comment la commande phonémique, par essence abstraite et invariante, est codée en termes de contrôle moteur pour générer un signal acoustique physique et variable. Pour cela, un modèle de contrôle moteur est exploité, s’appuyant sur la Théorie du « Point d’Équilibre », proposée par A. Feldman, selon laquelle tout mouvement […]