Renato De-Mori
Laboratoire Informatique d'Avignon
Session JEP poster P2 Lundi 9 Juin - 16h00 18h00
-
papier 1620
Analyse des erreurs d'une stratégie de sondage automatique d'opinions
- Nathalie Camelin ( LIA - Université d'Avignon)
- Frédéric Béchet ( LIA - Université d'Avignon)
- Géraldine Damnati ( France Télécom R&D)
- Renato De-Mori ( LIA - Université d'Avignon)
- Résumé : La stratégie de sondage automatique d'opinions présentée extrait les distributions des opinions exprimées par les utilisateurs d'un service de téléphonie. Elle permet de sélectionner à partir d'un corpus de grande taille, les messages susceptibles d'être traités correctement par le module de Reconnaissance Automatique de la Parole (RAP) et le module de classification. Pour cette raison, il est très important de vérifier la représentativité du sous-corpus de messages sélectionnés par la stratégie de rejet. Plusieurs mesures, basées sur la divergence de Kullback-Leibler, sont proposées afin d'évaluer la validité de notre stratégie d'extraction d'opinions en analysant les différents types d'erreurs qu'elle implique.
- article
Session JEP poster P3 Mardi 10 Juin - 14h00 16h00
-
papier 1603
Combinaison de différents jeux de paramètres acoustiques pour la reconnaissance de la parole
- Loïc Barrault ( Laboratoire Informatique d'Avignon)
- Driss Matrouf ( Laboratoire Informatique d'Avignon)
- Georges Linarès ( Laboratoire Informatique d'Avignon)
- Renato De-Mori ( Laboratoire Informatique d'Avignon)
- Résumé : With the purpose of improving Automatic Speech Recognition (ASR) systems performance, many different approaches on combining them have been largely studied. In this paper, a combination of state a posteriori probabilities given by different feature sets is proposed. In order to perform a coherent combination of state posterior probabilities, the acoustic models trained on different feature sets must have the same topology (i.e. same set of states). For this purpose, a fast and efficient twin model training protocol is proposed. Two different strategies for combining probabilities are presented : the linear and the log linear interpolation. By using log linear interpolation, a relative Word Error Rate (WER) reduction of about 15% and 14% have been observed respectively on MEDIA and ESTER corpora.
- article
Session JEP poster P4 Mardi 10 Juin - 14h00 16h00
-
papier 1676
LUNA : Compréhension en contexte pour le dialogue oral
- Géraldine Damnati ( France Telecom R&D)
- Frédéric Béchet ( Université d'Avignon)
- Renato De-Mori ( Université d'Avignon)
- Résumé : This paper describes the first results achieved within the LUNA project in coupling the Spoken Language Understanding process with the Automatic Speech Recognition and Dialog Manager processes. This strategy is implemented and evaluated on a France Telecom telephone service application called FT3000.
- article
Session JEP orale O3 Parole spontanée et interaction Mercredi 11 Juin - 10h30 12h30
-
papier 1652
Approche non supervisée pour la gestion stochastique du dialogue
- Fabrice Lefèvre ( LIA - Université d'Avignon)
- Renato De-Mori ( LIA - Université d'Avignon)
- Résumé : Following recent studies in stochastic dialog management, an unsupervised approach is proposed to reduce the cost and complexity of a probabilistic POMDP-based dialog manager setup. A first decoding step derives semantic basic constituents from user utterances. Then the isolated units along with some relevant context features (previous system actions, previous user utterances...) are combined in vectors representing the current dialog situation. A clustering step is performed with these vectors and each partition of the derived space represents a particular dialog state. Any new utterance can be classified according to these automatic states and the system belief can be updated before the POMDP-based dialog manager can take a decision on the best next action to perform. The approach is applied to the challenging French sc Media task (tourist information and hotel booking). The sc Media training corpus is semantically rich (over 80 basic concepts) and its 10k utterances are segmentally annotated in terms of basic concepts. Some insights on the method effectiveness are obtained by an analysis of the POMDP model training convergence using user simulation.
- article
Session TALN poster P1P2 Jeudi 12 Juin - 14h00 17h00
-
papier 1372
Annotation en Frames Sémantiques du corpus de dialogue MEDIA
- Marie-Jean Meurs ( LIA - Université d'Avignon)
- Frédéric Duvert ( LIA - Université d'Avignon)
- Frédéric Béchet ( LIA - Université d'Avignon)
- Fabrice Lefèvre ( LIA - Université d'Avignon)
- Renato De-Mori ( LIA - Université d'Avignon)
- Résumé : Cet article propose un formalisme de représentation des connaissances utilisé pour annoter le corpus de dialogue en français MEDIA en terme de structures sémantiques. L'annotation est incrémentale et partiellement automatique. Nous décrivons un processus d'interprétation automatique dont les procédures permettent d'obtenir des compositions sémantiques et de générer des hypothèses de Frames par inférence. Le corpus français MEDIA est un corpus de dialogue manuellement annoté au niveau mots et au niveau constituants sémantiques. Le processus appliqué au corpus MEDIA produit une annotation de plus haut niveau en Frames sémantiques. La base de connaissance réalisée et les résultats de l'annotation automatique sont présentés.
- article