Vincent Jousse
Laboratoire d'Informatique de l'Université du Maine (LIUM)
Session JEP orale OC Session commune JEP/TALN Mardi 10 Juin - 10h30 12h30
-
papier 1651
Etude pour l'amélioration d'un système d'identification nommée du locuteur
- Vincent Jousse ( Laboratoire d'Informatique de l'Université du Maine (LIUM), Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Christine Jacquin ( Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Sylvain Meignier ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Yannick Estève ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Béatrice Daille ( Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Résumé : La segmentation et la classification automatiques produisent des étiquettes génériques à la place des vraies identités des locuteurs. L'approche proposée est basée sur l'utilisation d'arbres de classification sémantique utilisant des règles lexicales pour extraire la véritable identité des locuteurs à partir de la transcription. Dans ce papier, des expériences sont menées sur des enregistrements de journaux d'information radiophoniques de la campagne ESTER 2005. Ils permettent d'évaluer cette approche en se focalisant sur l'impact des différentes combinaisons possibles entre transcriptions et segmentations / classifications manuelles et automatiques. Nous étudions ensuite les erreurs générées par le système.
- article
Session JEP orale O3 Parole spontanée et interaction Mercredi 11 Juin - 10h30 12h30
-
papier 1616
Caractérisation et détection de parole spontanée dans de larges collections de documents audio
- Vincent Jousse ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Yannick Estève ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Frédéric Béchet ( Laboratoire d'Informatique d'Avignon (LIA))
- Thierry Bazillon ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Georges Linarès ( Laboratoire d'Informatique d'Avignon (LIA))
- Résumé : Processing spontaneous speech is one of the many challenges that ASR systems have to deal with. The main evidences characterizing spontaneous speech are disfluencies (filled pause, repetition, repair and false start) and many studies have focused on the detection and the correction of these disfluencies. In this study we define spontaneous speech as unprepared speech, in opposition to prepared speech where utterances contain well-formed sentences close to those that can be found in written documents. This paper proposes a set of acoustic and linguistic features that can be used for characterizing and detecting spontaneous speech segments from large audio databases.
- article