Résumé : Les performances d’un système de reconnaissance automatique de la parole (SRAP) subissent de lourdes dégradations lorsqu’il est utilisé dans un milieu acoustique (de test) qui diffère de son milieu d’entraînement. La différence entre ces deux milieux est, la plupart du temps, provoquée par des sources de bruits qui interagissent avec signal de parole […]
Actes et thèses
Incidence du développement linguistique et de la lecture sur les stratégies de pondération d’indices acoustiques et la perception catégorielle des sons de la parole.
Résumé : Nous avons mené deux études évaluant les relations entre la perception catégorielle des sons de la parole, la lecture et l’âge. La première examinait les relations entre lecture et perception catégorielle (PC) chez des enfants suivis longitudinalement de la GSM au CE1 et des bons et des mauvais lecteurs de CM1. La seconde […]
Analyse linguistique de l’expression du dysfonctionnement technique : le cas des échanges entre chefs de salle et maintenance opérationnelle dans la Navigation Aérienne
Résumé : Cette thèse envisage, au travers d’une approche ascendante (des données vers la systématisation), la mise au jour de régularités de fonctionnement à l’oral qui ne soient pas propres à un corpus particulier ou à un genre de corpus mais bien à une catégorie d’information. L’étude porte sur un corpus de communications téléphoniques dont […]
Représentations Verbales Multistables en Mémoire de Travail : Vers une Perception Active des Unités de Parole
Résumé : Constitutives d’un nouveau chapitre de la cognition – la cognition motrice – les études des systèmes cérébraux et cognitifs spécialisés dans l’émergence et le traitement des représentations d’action, ont permis de montrer les liens étroits unissant l’observation, la représentation mentale d’une action, enfin, son exécution. Des premières données comportementales, soulignant le couplage fonctionnel […]
Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle
Résumé : Le développement croissant des données numériques et l’explosion des accès multimédia à l’information, sont confrontés au manque d’outils automatiques efficaces. Dans ce cadre, plusieurs approches relatives à l’indexation et la structuration de la bande sonore de documents audiovisuels sont proposées. Leurs buts sont de détecter les composantes primaires telles que la parole, la […]
Systèmes de reconaissance de la parole revisités : Réseaux Bayésiens dynamiques et nouveaux paradigmes
Résumé : Dans cette thèse nous élaborons quatre composantes fondamentales d’un système de reconnaissance automatique de la parole : la modélisation acoustique, la modélisation du langage, la paramétrisation du signal acoustique et la compensation du bruit. Nous proposons des techniques nouvelles dans chacun de ces domaines, et nous apportons des perspectives novatrices. Nous traitons les […]
Approches robustes pour la vérification du locuteur par normalisation et adaptation hiérarchique.
Résumé : La vérification automatique du locuteur (VAL) consiste à authentifier l’identité d’une personne en analysant les caractéristiques de sa voix. Ses applications vont du contrôle d’accès à l’authentification d’enregistrements sonores, en passant par des tâches d’étiquetage automatique de documents audio en fonction des locuteurs. Lorsqu’ils sont utilisés en situation réelle et dans des environnements […]
