Fabrice Lefèvre
Laboratoire d'Informatique d'Avignon
Session JEP orale O3 Parole spontanée et interaction Mercredi 11 Juin - 10h30 12h30
-
papier 1637
Composition sémantique pour la compréhension de la parole dans un cadre de dialogue
- Frédéric Duvert ( Laboratoire d'Informatique d'Avignon)
- Marie-Jean Meurs ( Laboratoire d'Informatique d'Avignon)
- Christophe Servan ( Laboratoire d'Informatique d'Avignon)
- Frédéric Béchet ( Laboratoire d'Informatique d'Avignon)
- Fabrice Lefèvre ( Laboratoire d'Informatique d'Avignon)
- Résumé : A knowledge representation formalism for SLU is introduced. It is used for incremental and partially automated annotation of the sc Media corpus in terms of semantic structures. An automatic interpretation process is described for composing semantic structures from basic semantic constituents using patterns involving constituents and words. The process has procedures for obtaining semantic compositions and for generating Frame hypotheses by inference. This process is evaluated on a dialogue corpus manually annotated at the word and semantic constituent levels.
- article
Session JEP orale O3 Parole spontanée et interaction Mercredi 11 Juin - 10h30 12h30
-
papier 1652
Approche non supervisée pour la gestion stochastique du dialogue
- Fabrice Lefèvre ( LIA - Université d'Avignon)
- Renato De-Mori ( LIA - Université d'Avignon)
- Résumé : Following recent studies in stochastic dialog management, an unsupervised approach is proposed to reduce the cost and complexity of a probabilistic POMDP-based dialog manager setup. A first decoding step derives semantic basic constituents from user utterances. Then the isolated units along with some relevant context features (previous system actions, previous user utterances...) are combined in vectors representing the current dialog situation. A clustering step is performed with these vectors and each partition of the derived space represents a particular dialog state. Any new utterance can be classified according to these automatic states and the system belief can be updated before the POMDP-based dialog manager can take a decision on the best next action to perform. The approach is applied to the challenging French sc Media task (tourist information and hotel booking). The sc Media training corpus is semantically rich (over 80 basic concepts) and its 10k utterances are segmentally annotated in terms of basic concepts. Some insights on the method effectiveness are obtained by an analysis of the POMDP model training convergence using user simulation.
- article
Session TALN poster P1P2 Jeudi 12 Juin - 14h00 17h00
-
papier 1372
Annotation en Frames Sémantiques du corpus de dialogue MEDIA
- Marie-Jean Meurs ( LIA - Université d'Avignon)
- Frédéric Duvert ( LIA - Université d'Avignon)
- Frédéric Béchet ( LIA - Université d'Avignon)
- Fabrice Lefèvre ( LIA - Université d'Avignon)
- Renato De-Mori ( LIA - Université d'Avignon)
- Résumé : Cet article propose un formalisme de représentation des connaissances utilisé pour annoter le corpus de dialogue en français MEDIA en terme de structures sémantiques. L'annotation est incrémentale et partiellement automatique. Nous décrivons un processus d'interprétation automatique dont les procédures permettent d'obtenir des compositions sémantiques et de générer des hypothèses de Frames par inférence. Le corpus français MEDIA est un corpus de dialogue manuellement annoté au niveau mots et au niveau constituants sémantiques. Le processus appliqué au corpus MEDIA produit une annotation de plus haut niveau en Frames sémantiques. La base de connaissance réalisée et les résultats de l'annotation automatique sont présentés.
- article