Algorithmes évolutionnaires pour l’étude de la robustesse des systèmes de reconnaissance de la parole.

Résumé: Les systèmes de reconnaissance automatique de la parole sont de plus en plus répandus et utilisés dans des conditions acoustiques très variées, par des locuteurs très différents. De ce fait, ces systèmes, généralement conçus en laboratoire, doivent être robustes afin de garder des performances optimales en situation réelle. Les travaux que nous avons effectués […]

Stratégie d’analyse pour la Compréhension de la parole : vers une approche à base de Grammaires d’Arbres Adjoints Lexicalisées.

Résumé: L’intégration de la Reconnaissance de la Parole (RP) et du Traitement Automatique du Langage Naturel (TALN) est une problématique centrale pour la mise en place de systèmes de dialogue vocaux. En effet, la reconnaissance acoustique nécessite des informations linguistiques pour atteindre des performances acceptables, et de son côté la compréhension des énoncés reconnus doit […]

Contribution à la vérification multi-modale de l’identité en utilisant la fusion de décisions

Résumé: La vérification automatique de l’identité d’une personne est utilisée dans beaucoup d’applications telles que l’accès à des services automatisés et à des endroits protégés (banques,…). Un facteur important, qui limite le développement de ces services, est la nécessité de diminuer la probabilité d’intrusion par des imposteurs (ce qu’on appelle le taux de fausses acceptations: […]

Structures de codage mixte de parole et musique.

Résumé: Le cadre de cette thèse est un contrat CTI financé par le CNET-France Telecom, dont l’objectif est de définir un codeur à débit variable hiérarchique, à délai réduit et de bonne qualité. Voici un sommaire en Francais de ma dérnière publication à ICASSP98: Le travail présenté dans ce papier est réalisé dans le cadre […]

Rythme et Discours: invariance et sources de variabilité des phénomènes accentuels en français.

Résumé: Notre recherche a pour objet la description du rythme du français, et plus particulièrement des phénomènes accentuels. Nous proposons de mettre en évidence les invariants rythmiques et accentuels de ce qui pourrait constituer le système noyau du français, ainsi que la part de variabilité inhérente à ce système lors de la mise en énonciation. […]

Analyse/synthèse des signaux de parole à partir d’un modèle de sinusoïdes et de bruit. Application au codage bas débit et aux transformations prosodiques.

Résumé: L’efficacite du modèle « sinusoides et bruit » dans le cadre de l’analyse/synthèse des signaux de parole a déjà été démontrée. Il s’agit de représenter ces signaux comme une somme de sinusoides reliées harmoniquement et d’un signal de bruit filtre par l’enveloppe spectrale du signal original. Les paramètres de ce modèle sont donc le pitch (ou […]