Résumé: La vérification du locuteur consiste à déterminer automatiquement l’identité d’une personne à partir de sa voix. Actuellement, ses perspectives de mise en oeuvre se situent essentiellement dans le domaine de la sécurisation d’accès à des services, des locaux ou de transactions bancaires téléphoniques. Si les outils qu’elle utilise sont souvent issus des recherches et […]
Les thèses du domaine (en ligne depuis 1994)
Liste des thèses francophones traitant de la communication parlée.
Vous trouverez les plus récentes au format pdf ou ps compressés, ainsi que leur résumé.
Vous pouvez soumettre un manuscrit de thèse à l’aide de ce formulaire.
Correction centralisée des distorsions spectrales de la parole sur les réseaux téléphoniques.
Résumé: Ces travaux ont pour objet la correction des distorsions spectrales subies par la parole sur les réseaux téléphoniques, en premier lieu le réseau fixe (terrestre) dans sa partie analogique. Ces distorsions sont dues aux fonctions de transfert des terminaux téléphoniques en émission et en réception, et aux lignes téléphoniques analogiques correspondantes. Le but est […]
Elaboration et comparaison de systèmes adaptatifs multi-flux de reconnaissance robuste de la parole : incorporation des indices de voisement et de localisation
Cette thèse effectuée à l’ICP et à l’IDIAP, dans le champ de la communication homme-machine et des projets EU. RESPITE & SPHEAR, contribue à augmenter la robustesse de reconnaisseurs automatiques de la parole dans le cadre original de l’analyse de scènes auditives. Deux voies sont traitées simultanément : (1) l’extraction d’indices fiables du signal et […]
Détection de ruptures et suivi de classe de sons pour l’indexation sonore.
Résumé: Dans le contexte actuel du besoin croissant d’outils de gestion de documents multimédia, cette thèse a pour objet de définir, étudier, mettre en oeuvre et évaluer des algorithmes de description de documents sonores pour l’indexation. Ces travaux se concentrent sur les trois problèmes suivants : la détection de changements de plage sonore, la détection […]
Approche statistique pour la reconnaissance automatique du locuteur : informations dynamiques et normalisation bayesiennes des vraisemblances
Contribution à la modélisation du langage pour des applications de recherche documentaire et de traitement de la parole.
Résumé: L’application des méthodes statistiques aux domaines de la recherche documentaire et de la reconnaissance automatique de la parole (RAP) prend une importance grandissante. Ce travail de thèse présente des solutions qui utilisent des modèles de langage dynamiques, suivant la théorie de l’information. Notre contribution est l’apport de nouvelles approches en modélisation du langage. Les […]
La segmentation et le regroupement par locuteurs pour l’indexation de documents audio
Résumé: Le traitement de l’information multimedia requiert de nouveaux outils tels des analyseurs de contenus ou indexeurs. Parmi ceux-ci, l’indexation par locuteurs d’un document audio, qui consiste à reconnaître la séquence de locuteurs engagés dans la conversation, tient une place essentielle. Il s’agit de savoir qui parle et quand afin de saisir la cohérence du […]
Etude et développement d’architectures multi-bandes et multi-modales pour la reconnaissance robuste de la parole.
Modélisation du langage pour les systèmes de reconnaissance de la parole destinés aux grands vocabulaires : application à MAUD
Résumé: Le traitement automatique de la parole suscite actuellement un grand intérêt ; il est considéré comme une branche importante de l’interaction homme-machine. En effet, nous éprouvons le besoin de communiquer avec nos ordinateurs, de la façon la plus naturelle et la plus directe qui soit : le langage parlé ; l’interaction et l’échange d’informations […]
L’expression et la perception de l’émotion extraite de la parole spontanée : évidences du coréen et de l’anglais.
Résumé: La thèse vise à investir comment l’émotion modifie la production vocale du locuteur et comment l’auditeur reconnaît l’émotion sur base des indices acoustiques. L’émotion est souvent présente dans la parole naturelle, tandis qu’elle n’est guère prise en compte à l’heure actuelle dans la synthèse et la reconnaissance automatique de la parole. D’où l’impression mécanique […]