Modélisation du langage pour les systèmes de reconnaissance de la parole destinés aux grands vocabulaires : application à MAUD

Résumé: Le traitement automatique de la parole suscite actuellement un grand intérêt ; il est considéré comme une branche importante de l’interaction homme-machine. En effet, nous éprouvons le besoin de communiquer avec nos ordinateurs, de la façon la plus naturelle et la plus directe qui soit : le langage parlé ; l’interaction et l’échange d’informations […]

L’expression et la perception de l’émotion extraite de la parole spontanée : évidences du coréen et de l’anglais.

Résumé: La thèse vise à investir comment l’émotion modifie la production vocale du locuteur et comment l’auditeur reconnaît l’émotion sur base des indices acoustiques. L’émotion est souvent présente dans la parole naturelle, tandis qu’elle n’est guère prise en compte à l’heure actuelle dans la synthèse et la reconnaissance automatique de la parole. D’où l’impression mécanique […]

Contribution au rehaussement du signal de parole par filtrage de Kalman : reformulation de techniques d’identification et modèles harmoniques

Résumé: Mon mémoire de thèse porte sur le rehaussement par filtrage de Kalman de signaux de parole perturbés par un bruit additif blanc ou coloré. En proposant une nouvelle formulation de différents résultats établis dans le domaine de l’identification, nous mettons en œuvre plusieurs solutions nouvelles. Dans un premier temps, nous avons retenu l’hypothèse où […]

Modélisation non-paramétrique pour la reconnaissance markovienne de la parole.

Résumé: Les modèles de Markov cachés sont à l’origine de la majorité des avancées récentes en reconnaissance de la parole continue. Ces modèles gèrent les distorsions temporelles du signal de parole en s’appuyant sur des densités de probabilité pour modéliser les distorsions en fréquence. Nous proposons d’améliorer leur performance à l’aide de l’estimateur de densité […]

Analyse statistique à deux dimensions pour la modélisation segmentale du signal de parole: Application à la reconnaissance.

Résumé: Les modèles de Markov cachés sont utilisées en reconnaissance automatique de la parole par la plupart des laboratoires et industriels du domaine. Ils permettent de rendre compte efficacement de la variabilité temporelle. La variabilité fréquentielle n’est représentée que par une distribution de probabilités de paramètres spectraux estimés à court terme. Nous proposons de modéliser […]

Contribution à la modélisation du langage pour des applications de recherche documentaire et de traitement de la parole.

Résumé: L’application des méthodes statistiques aux domaines de la recherche documentaire et de la reconnaissance automatique de la parole (RAP) prend une importance grandissante. Ce travail de thèse présente des solutions qui utilisent des modèles de langage dynamiques, suivant la théorie de l’information. Notre contribution est l’apport de nouvelles approches en modélisation du langage. Les […]

La segmentation et le regroupement par locuteurs pour l’indexation de documents audio

Résumé: Le traitement de l’information multimedia requiert de nouveaux outils tels des analyseurs de contenus ou indexeurs. Parmi ceux-ci, l’indexation par locuteurs d’un document audio, qui consiste à reconnaître la séquence de locuteurs engagés dans la conversation, tient une place essentielle. Il s’agit de savoir qui parle et quand afin de saisir la cohérence du […]