Antoine Doucet
GREYC, Université de Caen
Session DEFT orale O1 Vendredi 13 Juin - 09h30 11h00
-
papier 6004
Trois approches du GREYC pour la classification de textes
- Thierry Charnois ( GREYC, Université de Caen)
- Antoine Doucet ( GREYC, Université de Caen)
- Yann Mathet ( GREYC, Université de Caen)
- François Rioult ( GREYC, Université de Caen)
- Résumé : Cet article présente la participation de l'équipe du GREYC à DEFT'08, en détaillant les différentes approches mises en place ainsi que les résultats obtenus. Plusieurs techniques très différentes ont été étudiées et mises en oeuvre. D'une part, un traitement à base de n-grammes a constitué un classifieur indépendant. D'autre part, deux autres traitements s'appuient sur un classifieur supervisé par règles d'association, qu'ils alimentent chacun avec des indices provenant d'une chaîne de traitements linguistiques pour l'un, et d'extraction de séquences pour l'autre.
- article