Sylvain Meignier
Université du Maine
Session JEP poster P2 Lundi 9 Juin - 16h00 18h00
-
papier 1654
Mistral : Plate-forme open source d'authentification biométrique
- Eric Charton ( LIA - Université d'Avignon)
- Teva Merlin ( LIUM - Université du Maine)
- Christophe Lévy ( LIA - Université d'Avignon)
- Anthony Larcher ( LIA - Université d'Avignon)
- Sylvain Meignier ( LIUM - Université du Maine)
- Résumé : Mistral est une plate-forme de reconnaissance biométrique open-source. Elle permet d'assurer les tâches de vérification du locuteur, de reconnaissance de la langue, de segmentation et classification en locuteurs, ainsi que la reconnaissance de visages ou d'empreintes digitales. Dans cet article, nous présentons l'utilisation de Mistral en tant qu'instrument scientifique libre et ouvert, ainsi que comme support d'enseignement.
- article
Session JEP orale OC Session commune JEP/TALN Mardi 10 Juin - 10h30 12h30
-
papier 1651
Etude pour l'amélioration d'un système d'identification nommée du locuteur
- Vincent Jousse ( Laboratoire d'Informatique de l'Université du Maine (LIUM), Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Christine Jacquin ( Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Sylvain Meignier ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Yannick Estève ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Béatrice Daille ( Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Résumé : La segmentation et la classification automatiques produisent des étiquettes génériques à la place des vraies identités des locuteurs. L'approche proposée est basée sur l'utilisation d'arbres de classification sémantique utilisant des règles lexicales pour extraire la véritable identité des locuteurs à partir de la transcription. Dans ce papier, des expériences sont menées sur des enregistrements de journaux d'information radiophoniques de la campagne ESTER 2005. Ils permettent d'évaluer cette approche en se focalisant sur l'impact des différentes combinaisons possibles entre transcriptions et segmentations / classifications manuelles et automatiques. Nous étudions ensuite les erreurs générées par le système.
- article
Session JEP poster P3 Mardi 10 Juin - 14h00 16h00
-
papier 1625
Combinaison de systèmes pour la phonétisation automatique de noms propres
- Antoine Laurent ( LIUM (Laboratoire d'Informatique de l'Université du Maine), Spécinov)
- Sylvain Meignier ( LIUM (Laboratoire d'Informatique de l'Université du Maine))
- Yannick Estève ( LIUM (Laboratoire d'Informatique de l'Université du Maine))
- Paul Deléglise ( LIUM (Laboratoire d'Informatique de l'Université du Maine))
- Résumé : Les systèmes de reconnaissance vocale à grand vocabulaire ont des performances correctes dans des contextes d'utilisation connus et contrôlés. Cependant, la reconnaissance de noms propres est généralement considérée comme une tâche difficile. La phonétisation automatique des noms propres est délicate à obtenir, bien qu'il s'agisse d'une des plus importantes ressources nécessaire au système de décodage. Dans cet article, nous proposons une méthode de phonétisation automatique appliquée aux noms propres. Cette méthode est fondée sur la combinaison du système de phonétisation automatique à base de règles LIA_PHON avec un système de décodage acoustico-phonétique. Sur le corpus ESTER, nous avons observé que le système de combinaison obtient de meilleurs résultats que notre système de référence (LIA_PHON).
- article
Session JEP orale O4 Reconnaissance de la parole et du locuteur Jeudi 12 Juin - 14h00 16h00
-
papier 1579
Segmentation et regroupement en locuteurs pour la parole conversationnelle
- Elie El-Khoury ( université paul sabatier)
- Sylvain Meignier ( Université du Maine)
- Christine Sénac ( université Paul Sabatier)
- Résumé : In the context of the ANR EPAC project of which aim is to treat conversational speech, we present a hybrid speaker diarization system based on the combination of the LIUM and IRIT systems. It contains speech detection followed by GLR/BIC segmentation. Then we apply a BIC clustering followed by a CLR clustering. Moreover, we make some improvements by optimizing clustering thresholds and by purifying the BIC clustering using feature F0. Results show this hybrid system is suitable on one hand for traditional corpus as ESTER and on the other hand for conversational data as used in EPAC project.
- article