Frédéric Béchet
Université d'Avignon
Session JEP poster P2 Lundi 9 Juin - 16h00 18h00
-
papier 1620
Analyse des erreurs d'une stratégie de sondage automatique d'opinions
- Nathalie Camelin ( LIA - Université d'Avignon)
- Frédéric Béchet ( LIA - Université d'Avignon)
- Géraldine Damnati ( France Télécom R&D)
- Renato De-Mori ( LIA - Université d'Avignon)
- Résumé : La stratégie de sondage automatique d'opinions présentée extrait les distributions des opinions exprimées par les utilisateurs d'un service de téléphonie. Elle permet de sélectionner à partir d'un corpus de grande taille, les messages susceptibles d'être traités correctement par le module de Reconnaissance Automatique de la Parole (RAP) et le module de classification. Pour cette raison, il est très important de vérifier la représentativité du sous-corpus de messages sélectionnés par la stratégie de rejet. Plusieurs mesures, basées sur la divergence de Kullback-Leibler, sont proposées afin d'évaluer la validité de notre stratégie d'extraction d'opinions en analysant les différents types d'erreurs qu'elle implique.
- article
Session JEP poster P4 Mardi 10 Juin - 14h00 16h00
-
papier 1676
LUNA : Compréhension en contexte pour le dialogue oral
- Géraldine Damnati ( France Telecom R&D)
- Frédéric Béchet ( Université d'Avignon)
- Renato De-Mori ( Université d'Avignon)
- Résumé : This paper describes the first results achieved within the LUNA project in coupling the Spoken Language Understanding process with the Automatic Speech Recognition and Dialog Manager processes. This strategy is implemented and evaluated on a France Telecom telephone service application called FT3000.
- article
Session JEP orale O3 Parole spontanée et interaction Mercredi 11 Juin - 10h30 12h30
-
papier 1616
Caractérisation et détection de parole spontanée dans de larges collections de documents audio
- Vincent Jousse ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Yannick Estève ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Frédéric Béchet ( Laboratoire d'Informatique d'Avignon (LIA))
- Thierry Bazillon ( Laboratoire d'Informatique de l'Université du Maine (LIUM))
- Georges Linarès ( Laboratoire d'Informatique d'Avignon (LIA))
- Résumé : Processing spontaneous speech is one of the many challenges that ASR systems have to deal with. The main evidences characterizing spontaneous speech are disfluencies (filled pause, repetition, repair and false start) and many studies have focused on the detection and the correction of these disfluencies. In this study we define spontaneous speech as unprepared speech, in opposition to prepared speech where utterances contain well-formed sentences close to those that can be found in written documents. This paper proposes a set of acoustic and linguistic features that can be used for characterizing and detecting spontaneous speech segments from large audio databases.
- article
Session JEP orale O3 Parole spontanée et interaction Mercredi 11 Juin - 10h30 12h30
-
papier 1637
Composition sémantique pour la compréhension de la parole dans un cadre de dialogue
- Frédéric Duvert ( Laboratoire d'Informatique d'Avignon)
- Marie-Jean Meurs ( Laboratoire d'Informatique d'Avignon)
- Christophe Servan ( Laboratoire d'Informatique d'Avignon)
- Frédéric Béchet ( Laboratoire d'Informatique d'Avignon)
- Fabrice Lefèvre ( Laboratoire d'Informatique d'Avignon)
- Résumé : A knowledge representation formalism for SLU is introduced. It is used for incremental and partially automated annotation of the sc Media corpus in terms of semantic structures. An automatic interpretation process is described for composing semantic structures from basic semantic constituents using patterns involving constituents and words. The process has procedures for obtaining semantic compositions and for generating Frame hypotheses by inference. This process is evaluated on a dialogue corpus manually annotated at the word and semantic constituent levels.
- article
Session JEP orale O4 Reconnaissance de la parole et du locuteur Jeudi 12 Juin - 14h00 16h00
-
papier 1574
Enrichissement dynamique du vocabulaire à partir du Web
- Stanislas Oger ( Université d'Avignon)
- Georges Linarès ( Université d'Avignon)
- Frédéric Béchet ( Université d'Avignon)
- Pascal Nocéra ( Université d'Avignon)
- Résumé : Most of the Web-based methods for lexicon augmenting consist in capturing global semantic features of the targeted domain in order to collect relevant documents from the Web. We suggest that the local context of the out-of-vocabulary words contains relevant information on the OOV words. With this information, we propose to use the Web to build locally-augmented lexicons which are used in a final local decoding pass. We first demonstrate the relevance of the Web for the OOV word retrieval. Then, different methods are proposed to retrieve the hypothesis words. Finally we present the integration of new words in the transcription process based on part-of-speech models. This technique allows to recover 7.6% of the significant OOV words and the accuracy of the system is slightly improved.
- article
Session TALN poster P1P2 Jeudi 12 Juin - 14h00 17h00
-
papier 1372
Annotation en Frames Sémantiques du corpus de dialogue MEDIA
- Marie-Jean Meurs ( LIA - Université d'Avignon)
- Frédéric Duvert ( LIA - Université d'Avignon)
- Frédéric Béchet ( LIA - Université d'Avignon)
- Fabrice Lefèvre ( LIA - Université d'Avignon)
- Renato De-Mori ( LIA - Université d'Avignon)
- Résumé : Cet article propose un formalisme de représentation des connaissances utilisé pour annoter le corpus de dialogue en français MEDIA en terme de structures sémantiques. L'annotation est incrémentale et partiellement automatique. Nous décrivons un processus d'interprétation automatique dont les procédures permettent d'obtenir des compositions sémantiques et de générer des hypothèses de Frames par inférence. Le corpus français MEDIA est un corpus de dialogue manuellement annoté au niveau mots et au niveau constituants sémantiques. Le processus appliqué au corpus MEDIA produit une annotation de plus haut niveau en Frames sémantiques. La base de connaissance réalisée et les résultats de l'annotation automatique sont présentés.
- article
Session DEFT orale O1 Vendredi 13 Juin - 09h30 11h00
-
papier 6003
En finir avec la confusion des genres pour mieux séparer les thèmes
- Frédéric Béchet ( LIA, Université d'Avignon)
- Marc El-Bèze ( LIA, Université d'Avignon)
- Juan-Manuel Torres-Moreno ( LIA, Université d'Avignon)
- Résumé : Nous présentons des modèles d'apprentissage probabilistes appliqués à la tâche de classification telle que définie dans le cadre du défi DEFT'08 : la prise en compte des variations en genre et en thème dans un système de classification automatique. Une comparaison entre les résultats en validation et en tests montrent une coïncidence remarquable, et mettent en évidence la robustesse et les performances de la fusion que nous proposons. Les résultats que nous obtenons, en termes de précision, rappel et F-score strict sur les corpus de test sont très encourageants.
- article