Béatrice Daille
Laboratoire d'Informatique de Nantes Atlantique (LINA)
Session JEP orale OC Session commune JEP/TALN Mardi 10 Juin - 10h30 12h30
-
papier 1651
Etude pour l'amélioration d'un système d'identification nommée du locuteur
- Vincent Jousse ( Laboratoire d'Informatique de l'Université du Maine (LIUM), Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Christine Jacquin ( Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Sylvain Meignier ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Yannick Estève ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Béatrice Daille ( Laboratoire d'Informatique de Nantes Atlantique (LINA))
- Résumé : La segmentation et la classification automatiques produisent des étiquettes génériques à la place des vraies identités des locuteurs. L'approche proposée est basée sur l'utilisation d'arbres de classification sémantique utilisant des règles lexicales pour extraire la véritable identité des locuteurs à partir de la transcription. Dans ce papier, des expériences sont menées sur des enregistrements de journaux d'information radiophoniques de la campagne ESTER 2005. Ils permettent d'évaluer cette approche en se focalisant sur l'impact des différentes combinaisons possibles entre transcriptions et segmentations / classifications manuelles et automatiques. Nous étudions ensuite les erreurs générées par le système.
- article