Résumé: Depuis quelques années se développe le concept général d’espace perceptif ou salle intelligente qui répond de diverses façons aux besoins, demandes, attentes des acteurs humains. Les espaces perceptifs traitent des signaux de parole, des signaux vidéo, les données de l’environnement, la localisation des personnes, le suivi et la reconnaissance des gestes, etc. Ce travail […]
Actes et thèses
Interaction entre prosodie et (co)articulation linguopalatale en français.
Modélisation statistique du langage à partir d’Internet pour la reconnaissance automatique de la parole continue.
Résumé: Les ressources textuelles sont celles qui font le plus défaut dans les recherches sur la modélisation statistique du langage, surtout pour l’apprentissage de modèles adaptés au dialogue. Cette thèse propose d’utiliser les documents en provenance d’Internet pour l’apprentissage de tels modèles. La collecte de plusieurs corpus a permis la mise en évidence de certaines […]
Approche probabiliste par arbres de décision pour la vérification automatique du locuteur sur architectures embarquées.
Résumé: La vérification du locuteur consiste à déterminer automatiquement l’identité d’une personne à partir de sa voix. Actuellement, ses perspectives de mise en oeuvre se situent essentiellement dans le domaine de la sécurisation d’accès à des services, des locaux ou de transactions bancaires téléphoniques. Si les outils qu’elle utilise sont souvent issus des recherches et […]
Correction centralisée des distorsions spectrales de la parole sur les réseaux téléphoniques.
Résumé: Ces travaux ont pour objet la correction des distorsions spectrales subies par la parole sur les réseaux téléphoniques, en premier lieu le réseau fixe (terrestre) dans sa partie analogique. Ces distorsions sont dues aux fonctions de transfert des terminaux téléphoniques en émission et en réception, et aux lignes téléphoniques analogiques correspondantes. Le but est […]
Intégration de sources de connaissances pour la modélisation stochastique du langage appliquée à la parole continue dans un contexte de dialogue oral homme-machine.
Indexation en locuteurs de documents sonores : Segmentation d’un document et Appariement d’une collection.
Reconnaissance de la parole en langue vietnamienne.
Elaboration et comparaison de systèmes adaptatifs multi-flux de reconnaissance robuste de la parole : incorporation des indices de voisement et de localisation
Cette thèse effectuée à l’ICP et à l’IDIAP, dans le champ de la communication homme-machine et des projets EU. RESPITE & SPHEAR, contribue à augmenter la robustesse de reconnaisseurs automatiques de la parole dans le cadre original de l’analyse de scènes auditives. Deux voies sont traitées simultanément : (1) l’extraction d’indices fiables du signal et […]
Détection de ruptures et suivi de classe de sons pour l’indexation sonore.
Résumé: Dans le contexte actuel du besoin croissant d’outils de gestion de documents multimédia, cette thèse a pour objet de définir, étudier, mettre en oeuvre et évaluer des algorithmes de description de documents sonores pour l’indexation. Ces travaux se concentrent sur les trois problèmes suivants : la détection de changements de plage sonore, la détection […]