Joseph Razik
LORIA
Session JEP poster P1 Lundi 9 Juin - 16h00 18h00
-
papier 1568
Transcription automatique pour malentendants : amélioration à l'aide de mesures de confiance locales
- Joseph Razik ( LORIA)
- Odile Mella ( LORIA)
- Dominique Fohr ( LORIA)
- Jean-Paul Haton ( LORIA)
- Résumé : Dans cet article nous présentons l'utilisation de mesures de confiance afin d'améliorer la compréhension de transcriptions automatiques par des malentandants. Pour cette étude, nous nous plaçons dans le cadre d'émissions ou de flux en directs automatiquement transcrits par un système de reconnaissance grand vocabulaire. Nous avons défini des mesures de confiance locales qui peuvent être estimées au plus tôt, sans attendre la fin du processus de reconnaissance. Ces mesures obtiennent des performances proches de la mesure de référence actuellement la plus précise du domaine et calculée a posteriori sur l'intégralité du signal. Nous avons mené une expérimentation afin d'évaluer l'apport de notre mesure de confiance dans l'amélioration de la compréhension d'une transcription automatique contenant des erreurs. Nous avons introduit plusieurs modalités de mise en valeur des mots de faible confiance dans ces transcriptions. Nous avons alors montré que ces modalités peuvent améliorer la compréhension de transcriptions automatiques.
- article
Session JEP orale O4 Reconnaissance de la parole et du locuteur Jeudi 12 Juin - 14h00 16h00
-
papier 1659
Mesures de confiance locales et trame-synchrones
- Joseph Razik ( LORIA)
- Odile Mella ( LORIA)
- Dominique Fohr ( LORIA)
- Jean-Paul Haton ( LORIA)
- Résumé : This paper presents several new confidence measures with the major advantage that they can be evaluated as soon as possible without having to wait for the recognition process to be completed : synchronously with the frame processed by the engine or with a slight delay. Such measures are useful to drive the recognition process by modifying the likelihood score or to validate recognized words in on-the-fly applications as keyword spotting task and on-line automatic speech transcription for deaf people. The EER evaluation on a French broadcast news corpus shows performance close to the batch version of these measures (23.0% against 22.0% of EER) with only 0.84s of data before and after the word to analyze.
- article