Actes et thèses
Modélisation statistique du langage à partir d’Internet pour la reconnaissance automatique de la parole continue.
Résumé: Les ressources textuelles sont celles qui font le plus défaut dans les recherches sur la modélisation statistique du langage, surtout pour l’apprentissage de modèles adaptés au dialogue. Cette thèse propose d’utiliser les documents en provenance d’Internet pour l’apprentissage de tels modèles. La collecte de plusieurs corpus a permis la mise en évidence de certaines […]
Approche probabiliste par arbres de décision pour la vérification automatique du locuteur sur architectures embarquées.
Résumé: La vérification du locuteur consiste à déterminer automatiquement l’identité d’une personne à partir de sa voix. Actuellement, ses perspectives de mise en oeuvre se situent essentiellement dans le domaine de la sécurisation d’accès à des services, des locaux ou de transactions bancaires téléphoniques. Si les outils qu’elle utilise sont souvent issus des recherches et […]
Correction centralisée des distorsions spectrales de la parole sur les réseaux téléphoniques.
Résumé: Ces travaux ont pour objet la correction des distorsions spectrales subies par la parole sur les réseaux téléphoniques, en premier lieu le réseau fixe (terrestre) dans sa partie analogique. Ces distorsions sont dues aux fonctions de transfert des terminaux téléphoniques en émission et en réception, et aux lignes téléphoniques analogiques correspondantes. Le but est […]
Intégration de sources de connaissances pour la modélisation stochastique du langage appliquée à la parole continue dans un contexte de dialogue oral homme-machine.
Elaboration et comparaison de systèmes adaptatifs multi-flux de reconnaissance robuste de la parole : incorporation des indices de voisement et de localisation
Cette thèse effectuée à l’ICP et à l’IDIAP, dans le champ de la communication homme-machine et des projets EU. RESPITE & SPHEAR, contribue à augmenter la robustesse de reconnaisseurs automatiques de la parole dans le cadre original de l’analyse de scènes auditives. Deux voies sont traitées simultanément : (1) l’extraction d’indices fiables du signal et […]
Détection de ruptures et suivi de classe de sons pour l’indexation sonore.
Résumé: Dans le contexte actuel du besoin croissant d’outils de gestion de documents multimédia, cette thèse a pour objet de définir, étudier, mettre en oeuvre et évaluer des algorithmes de description de documents sonores pour l’indexation. Ces travaux se concentrent sur les trois problèmes suivants : la détection de changements de plage sonore, la détection […]
ISCA ITRW ASR 2000, Orsay
http://www-tlp.limsi.fr/asr2000/
Approche statistique pour la reconnaissance automatique du locuteur : informations dynamiques et normalisation bayesiennes des vraisemblances
Contribution à la modélisation du langage pour des applications de recherche documentaire et de traitement de la parole.
Résumé: L’application des méthodes statistiques aux domaines de la recherche documentaire et de la reconnaissance automatique de la parole (RAP) prend une importance grandissante. Ce travail de thèse présente des solutions qui utilisent des modèles de langage dynamiques, suivant la théorie de l’information. Notre contribution est l’apport de nouvelles approches en modélisation du langage. Les […]
