Génération multiparamétrique de la prosodie du français par apprentissage automatique.

Résumé: Cette thèse a pour objet la conception, l’apprentissage automatique et l’évaluation d’un modèle de génération de la prosodie du français. Ce modèle, d’inspiration cognitive, suppose un encodage direct des informations linguistiques et para-linguistiques véhiculées par un énoncé via des formes prosodiques prototypiques. Ces formes – ou mouvements – sont enchaînées au sein d’un même […]

Détection de mots-clés dans un flux de parole : Application à l’indexation de documents multimédias.

Résumé: La quantité d’information multimédia accessible croît de façon vertigineuse. L’avènement de la micro informatique permet à chacun d’apporter sa participation à la création de cette nouvelle source d’information planétaire qu’est « Internet », tandis que les média proposent maintenant la connexion à des bouquets de chaînes de télévision numériques transmis par satellite. L’accès à cette quantité […]

Reconnaissance automatique de la parole audiovisuelle.

Résumé: Conception et évaluation d’un système de reconnaissance audiovisuelle de la parole. Il s’agit d’utiliser des indices visuels tels le mouvement des lèvres et de la machoire afin d’améliorer les scores d’un système de reconnaissance audio à base de chaînes de Markov cachées. Plusieurs architectures d’intégration audiovisuelle ont été testées afin d’avoir un taux de […]