Renato De-Mori

Laboratoire Informatique d'Avignon

Session JEP poster P2 Lundi 9 Juin - 16h00 18h00

papier 1620 Analyse des erreurs d'une stratégie de sondage automatique d'opinions

Nathalie Camelin  ( LIA - Université d'Avignon)

Frédéric Béchet  ( LIA - Université d'Avignon)

Géraldine Damnati  ( France Télécom R&D)

Renato De-Mori  ( LIA - Université d'Avignon)

Résumé : La stratégie de sondage automatique d'opinions présentée extrait les distributions des opinions exprimées par les utilisateurs d'un service de téléphonie. Elle permet de sélectionner à partir d'un corpus de grande taille, les messages susceptibles d'être traités correctement par le module de Reconnaissance Automatique de la Parole (RAP) et le module de classification. Pour cette raison, il est très important de vérifier la représentativité du sous-corpus de messages sélectionnés par la stratégie de rejet. Plusieurs mesures, basées sur la divergence de Kullback-Leibler, sont proposées afin d'évaluer la validité de notre stratégie d'extraction d'opinions en analysant les différents types d'erreurs qu'elle implique.

article

Session JEP poster P3   Mardi 10 Juin - 14h00 16h00

papier 1603 Combinaison de différents jeux de paramètres acoustiques pour la reconnaissance de la parole

Loïc Barrault  ( Laboratoire Informatique d'Avignon)

Driss Matrouf  ( Laboratoire Informatique d'Avignon)

Georges Linarès  ( Laboratoire Informatique d'Avignon)

Renato De-Mori  ( Laboratoire Informatique d'Avignon)

Résumé : With the purpose of improving Automatic Speech Recognition (ASR) systems performance, many different approaches on combining them have been largely studied. In this paper, a combination of state a posteriori probabilities given by different feature sets is proposed. In order to perform a coherent combination of state posterior probabilities, the acoustic models trained on different feature sets must have the same topology (i.e. same set of states). For this purpose, a fast and efficient twin model training protocol is proposed. Two different strategies for combining probabilities are presented : the linear and the log linear interpolation. By using log linear interpolation, a relative Word Error Rate (WER) reduction of about 15% and 14% have been observed respectively on MEDIA and ESTER corpora.

article

Session JEP poster P4   Mardi 10 Juin - 14h00 16h00

papier 1676 LUNA : Compréhension en contexte pour le dialogue oral

Géraldine Damnati  ( France Telecom R&D)

Frédéric Béchet  ( Université d'Avignon)

Renato De-Mori  ( Université d'Avignon)

Résumé : This paper describes the first results achieved within the LUNA project in coupling the Spoken Language Understanding process with the Automatic Speech Recognition and Dialog Manager processes. This strategy is implemented and evaluated on a France Telecom telephone service application called FT3000.

article

Session JEP orale O3   Parole spontanée et interaction   Mercredi 11 Juin - 10h30 12h30

papier 1652 Approche non supervisée pour la gestion stochastique du dialogue

Fabrice Lefèvre  ( LIA - Université d'Avignon)

Renato De-Mori  ( LIA - Université d'Avignon)

Résumé : Following recent studies in stochastic dialog management, an unsupervised approach is proposed to reduce the cost and complexity of a probabilistic POMDP-based dialog manager setup. A first decoding step derives semantic basic constituents from user utterances. Then the isolated units along with some relevant context features (previous system actions, previous user utterances...) are combined in vectors representing the current dialog situation. A clustering step is performed with these vectors and each partition of the derived space represents a particular dialog state. Any new utterance can be classified according to these automatic states and the system belief can be updated before the POMDP-based dialog manager can take a decision on the best next action to perform. The approach is applied to the challenging French sc Media task (tourist information and hotel booking). The sc Media training corpus is semantically rich (over 80 basic concepts) and its 10k utterances are segmentally annotated in terms of basic concepts. Some insights on the method effectiveness are obtained by an analysis of the POMDP model training convergence using user simulation.

article

Session TALN poster P1P2   Jeudi 12 Juin - 14h00 17h00

papier 1372 Annotation en Frames Sémantiques du corpus de dialogue MEDIA

Marie-Jean Meurs  ( LIA - Université d'Avignon)

Frédéric Duvert  ( LIA - Université d'Avignon)

Frédéric Béchet  ( LIA - Université d'Avignon)

Fabrice Lefèvre  ( LIA - Université d'Avignon)

Renato De-Mori  ( LIA - Université d'Avignon)

Résumé : Cet article propose un formalisme de représentation des connaissances utilisé pour annoter le corpus de dialogue en français MEDIA en terme de structures sémantiques. L'annotation est incrémentale et partiellement automatique. Nous décrivons un processus d'interprétation automatique dont les procédures permettent d'obtenir des compositions sémantiques et de générer des hypothèses de Frames par inférence. Le corpus français MEDIA est un corpus de dialogue manuellement annoté au niveau mots et au niveau constituants sémantiques. Le processus appliqué au corpus MEDIA produit une annotation de plus haut niveau en Frames sémantiques. La base de connaissance réalisée et les résultats de l'annotation automatique sont présentés.

article

Renato De-Mori

Laboratoire Informatique d'Avignon

Session JEP poster P2 Lundi 9 Juin - 16h00 18h00

Session JEP poster P3 Mardi 10 Juin - 14h00 16h00

Session JEP poster P4 Mardi 10 Juin - 14h00 16h00

Session JEP orale O3 Parole spontanée et interaction Mercredi 11 Juin - 10h30 12h30

Session TALN poster P1P2 Jeudi 12 Juin - 14h00 17h00