Laurent Gillard
CEA
Session TALN orale O2 Extraction d'information Lundi 9 Juin - 13h30 15h00
-
papier 1366
Quelles combinaisons de scores et de critères numériques pour un système de Questions/Réponses ?
- Laurent Gillard ( CEA)
- Patrice Bellot ( LIA, Université d'Avignon)
- Marc El-Bèze ( LIA, Université d'Avignon)
- Résumé : Dans cet article, nous présentons une discussion sur la combinaison de différents scores et critères numériques pour la sélection finale d'une réponse dans la partie en charge des questions factuelles du système de Questions/Réponses développé au LIA. Ces scores et critères numériques sont dérivés de ceux obtenus en sortie de deux composants cruciaux pour ce système : celui de sélection des passages susceptibles de contenir une réponse et celui d'extraction et de sélection d'une réponse. Ils sont étudiés au regard de leur expressivité. Des comparaisons sont faites avec des approches de sélection de passages mettant en œuvre des scores conventionnels en recherche d'information. Parallèlement, l'influence de la taille des contextes (en nombre de phrases) est évaluée. Cela permet de mettre en évidence que le choix de passages constitués de trois phrases autour d'une réponse candidate, avec une sélection des réponses basée sur une combinaison entre un score de passage de type Lucène ou Cosine et d'un score de compacité apparaît un compromis intéressant.
- article