Jean-Baptiste Berthelin
LIMSI-CNRS
Session DEFT orale O1 Vendredi 13 Juin - 09h30 11h00
-
papier 6001
Présentation de DEFT'08 (DEfi Fouille de Textes)
- Jean-Baptiste Berthelin ( LIMSI-CNRS)
- Cyril Grouin ( LIMSI-CNRS)
- Sarra El-Ayari ( LIMSI-CNRS)
- Martine Hurault-Plantet ( LIMSI-CNRS)
- Sylvain Loiseau ( LIMSI-CNRS)
- Résumé : Dans le cadre de la campagne d'évaluation annuelle DEFT (défi fouille de textes), la quatrième édition a pour objet l'identification de catégories textuelles en genre et en thème. Nous avons utilisé des articles provenant de deux sources, Le Monde et Wikipédia, chaque article ayant été rattaché à l'une des neuf catégories extraites de ces corpus. Cet article présente l'objectif de la tâche, les corpus utilisés ainsi que les prétraitements effectués sur ces corpus. Nous reviendrons également sur les tests manuels que nous avons réalisés pour mesurer la faisabilité de la tâche. Enfin, nous détaillerons les mesures utilisées pour évaluer les résultats des participants.
- article
Session DEFT orale O1 Vendredi 13 Juin - 09h30 11h00
-
papier 6002
Résultats de l'édition 2008 du DÉfi Fouille de Textes
- Martine Hurault-Plantet ( LIMSI-CNRS)
- Cyril Grouin ( LIMSI-CNRS)
- Sarra El-Ayari ( LIMSI-CNRS)
- Jean-Baptiste Berthelin ( LIMSI-CNRS)
- Sylvain Loiseau ( LIMSI-CNRS)
- Patrick Paroubek ( LIMSI-CNRS)
- Résumé : Cet article présente les résultats obtenus par les participants de l'édition 2008 du défi fouille de textes (DEFT). Ces résultats se révèlent particulièrement élevés et homogènes entre chaque participant, avec une réussite accrue sur l'identification du genre par opposition à l'identification des thèmes. Dans cet article, nous revenons sur l'ensemble des résultats en opposant les F-scores stricts aux F-scores de confiance . nous mettons également en avant l'incidence du score de confiance sur les résultats. Enfin, nous présentons les méthodes utilisées par les participants.
- article