Yannick Estève
Laboratoire d'Informatique de l'Université du Maine (LIUM)
Session JEP poster P2 Lundi 9 Juin - 16h00 18h00
-
papier 1641
Transcription manuelle vs assistée de la parole préparée et spontanée
- Thierry Bazillon ( Université du Maine)
- Yannick Estève ( Université du Maine)
- Daniel Luzzati ( Université du Maine)
- Résumé : Notre étude porte sur le gain de temps qui peut être obtenu lors de la transcription de parole préparée et spontanée en utilisant un système de reconnaisance automatique de la parole, par rapport à une transcription entièrement manuelle. Plusieurs tâches ont ainsi été minutées (transcription du texte, assignation des locuteurs, correction orthographique...), et nous présentons ici une analyse des principaux résultats.
- article
Session JEP orale OC Session commune JEP/TALN Mardi 10 Juin - 10h30 12h30
-
papier 1651
Etude pour l'amélioration d'un système d'identification nommée du locuteur
- Vincent Jousse ( Laboratoire d'Informatique de l'Université du Maine (LIUM), Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Christine Jacquin ( Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Sylvain Meignier ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Yannick Estève ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Béatrice Daille ( Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Résumé : La segmentation et la classification automatiques produisent des étiquettes génériques à la place des vraies identités des locuteurs. L'approche proposée est basée sur l'utilisation d'arbres de classification sémantique utilisant des règles lexicales pour extraire la véritable identité des locuteurs à partir de la transcription. Dans ce papier, des expériences sont menées sur des enregistrements de journaux d'information radiophoniques de la campagne ESTER 2005. Ils permettent d'évaluer cette approche en se focalisant sur l'impact des différentes combinaisons possibles entre transcriptions et segmentations / classifications manuelles et automatiques. Nous étudions ensuite les erreurs générées par le système.
- article
Session JEP poster P3 Mardi 10 Juin - 14h00 16h00
-
papier 1622
Combinaison de systèmes par décodage guidé
- Benjamin Lecouteux ( LIA, Avignon)
- Georges Linarès ( LIA, Avignon)
- Yannick Estève ( LIUM, Le Mans)
- Guillaume Gravier ( IRISA, Rennes)
- Résumé : In this paper, we propose an integrated approach for system combination named Driven Decoding Algorithm (DDA). It consists in guiding the search algorithm of a primary ASR system by the outputs of an auxiliary system. We first evaluate this method in simple configuration in which the primary search is driven by the one-best hypothesis of a single auxiliary system. Then, we generalize DDA to confusion-network driven decoding and we propose a general combination schemes for multiple system combination. The proposed extended DDA is evaluated using 3 ASR systems from different labs. Results show that generalized-DDA outperforms significantly ROVER method: we obtain a 15.7% relative word error rate improvement with respect to the best single system, as opposed to 8.5% with the ROVER combination.
- article
Session JEP poster P3 Mardi 10 Juin - 14h00 16h00
-
papier 1625
Combinaison de systèmes pour la phonétisation automatique de noms propres
- Antoine Laurent ( LIUM (Laboratoire d'Informatique de l'Université du Maine), Spécinov)
- Sylvain Meignier ( LIUM (Laboratoire d'Informatique de l'Université du Maine))
- Yannick Estève ( LIUM (Laboratoire d'Informatique de l'Université du Maine))
- Paul Deléglise ( LIUM (Laboratoire d'Informatique de l'Université du Maine))
- Résumé : Les systèmes de reconnaissance vocale à grand vocabulaire ont des performances correctes dans des contextes d'utilisation connus et contrôlés. Cependant, la reconnaissance de noms propres est généralement considérée comme une tâche difficile. La phonétisation automatique des noms propres est délicate à obtenir, bien qu'il s'agisse d'une des plus importantes ressources nécessaire au système de décodage. Dans cet article, nous proposons une méthode de phonétisation automatique appliquée aux noms propres. Cette méthode est fondée sur la combinaison du système de phonétisation automatique à base de règles LIA_PHON avec un système de décodage acoustico-phonétique. Sur le corpus ESTER, nous avons observé que le système de combinaison obtient de meilleurs résultats que notre système de référence (LIA_PHON).
- article
Session JEP orale O3 Parole spontanée et interaction Mercredi 11 Juin - 10h30 12h30
-
papier 1616
Caractérisation et détection de parole spontanée dans de larges collections de documents audio
- Vincent Jousse ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Yannick Estève ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Frédéric Béchet ( Laboratoire d'Informatique d'Avignon (LIA))
- Thierry Bazillon ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Georges Linarès ( Laboratoire d'Informatique d'Avignon (LIA))
- Résumé : Processing spontaneous speech is one of the many challenges that ASR systems have to deal with. The main evidences characterizing spontaneous speech are disfluencies (filled pause, repetition, repair and false start) and many studies have focused on the detection and the correction of these disfluencies. In this study we define spontaneous speech as unprepared speech, in opposition to prepared speech where utterances contain well-formed sentences close to those that can be found in written documents. This paper proposes a set of acoustic and linguistic features that can be used for characterizing and detecting spontaneous speech segments from large audio databases.
- article