Liste des thèses francophones traitant de la communication parlée.
Vous trouverez les plus récentes au format pdf ou ps compressés, ainsi que leur résumé.
Vous pouvez soumettre un manuscrit de thèse à l’aide de ce formulaire.

Approche probabiliste par arbres de décision pour la vérification automatique du locuteur sur architectures embarquées.

Résumé: La vérification du locuteur consiste à déterminer automatiquement l’identité d’une personne à partir de sa voix. Actuellement, ses perspectives de mise en oeuvre se situent essentiellement dans le domaine de la sécurisation d’accès à des services, des locaux ou de transactions bancaires téléphoniques. Si les outils qu’elle utilise sont souvent issus des recherches et […]

Correction centralisée des distorsions spectrales de la parole sur les réseaux téléphoniques.

Résumé: Ces travaux ont pour objet la correction des distorsions spectrales subies par la parole sur les réseaux téléphoniques, en premier lieu le réseau fixe (terrestre) dans sa partie analogique. Ces distorsions sont dues aux fonctions de transfert des terminaux téléphoniques en émission et en réception, et aux lignes téléphoniques analogiques correspondantes. Le but est […]

Elaboration et comparaison de systèmes adaptatifs multi-flux de reconnaissance robuste de la parole : incorporation des indices de voisement et de localisation

Cette thèse effectuée à l’ICP et à l’IDIAP, dans le champ de la communication homme-machine et des projets EU. RESPITE & SPHEAR, contribue à augmenter la robustesse de reconnaisseurs automatiques de la parole dans le cadre original de l’analyse de scènes auditives. Deux voies sont traitées simultanément : (1) l’extraction d’indices fiables du signal et […]

Détection de ruptures et suivi de classe de sons pour l’indexation sonore.

Résumé: Dans le contexte actuel du besoin croissant d’outils de gestion de documents multimédia, cette thèse a pour objet de définir, étudier, mettre en oeuvre et évaluer des algorithmes de description de documents sonores pour l’indexation. Ces travaux se concentrent sur les trois problèmes suivants : la détection de changements de plage sonore, la détection […]

Modélisation non-paramétrique pour la reconnaissance markovienne de la parole.

Résumé: Les modèles de Markov cachés sont à l’origine de la majorité des avancées récentes en reconnaissance de la parole continue. Ces modèles gèrent les distorsions temporelles du signal de parole en s’appuyant sur des densités de probabilité pour modéliser les distorsions en fréquence. Nous proposons d’améliorer leur performance à l’aide de l’estimateur de densité […]

Analyse statistique à deux dimensions pour la modélisation segmentale du signal de parole: Application à la reconnaissance.

Résumé: Les modèles de Markov cachés sont utilisées en reconnaissance automatique de la parole par la plupart des laboratoires et industriels du domaine. Ils permettent de rendre compte efficacement de la variabilité temporelle. La variabilité fréquentielle n’est représentée que par une distribution de probabilités de paramètres spectraux estimés à court terme. Nous proposons de modéliser […]

Contribution à la modélisation du langage pour des applications de recherche documentaire et de traitement de la parole.

Résumé: L’application des méthodes statistiques aux domaines de la recherche documentaire et de la reconnaissance automatique de la parole (RAP) prend une importance grandissante. Ce travail de thèse présente des solutions qui utilisent des modèles de langage dynamiques, suivant la théorie de l’information. Notre contribution est l’apport de nouvelles approches en modélisation du langage. Les […]

La segmentation et le regroupement par locuteurs pour l’indexation de documents audio

Résumé: Le traitement de l’information multimedia requiert de nouveaux outils tels des analyseurs de contenus ou indexeurs. Parmi ceux-ci, l’indexation par locuteurs d’un document audio, qui consiste à reconnaître la séquence de locuteurs engagés dans la conversation, tient une place essentielle. Il s’agit de savoir qui parle et quand afin de saisir la cohérence du […]