Erwan Moreau
Institut Télécom ParisTech
Session TALN poster P1P2 Jeudi 12 Juin - 14h00 17h00
-
papier 1363
Appariement d'entités nommées coréférentes : combinaisons de mesures de similarité par apprentissage supervisé
- Erwan Moreau ( Institut Télécom ParisTech)
- François Yvon ( Université Paris Sud - LIMSI CNRS)
- Olivier Cappé ( Institut Télécom ParisTech - LTCI CNRS)
- Résumé : L'appariement d'entités nommées consiste à regrouper les différentes formes sous lesquelles apparaît une entité. Pour cela, des mesures de similarité textuelle sont généralement utilisées. Nous proposons de combiner plusieurs mesures afin d'améliorer les performances de la tâche d'appariement. À l'aide d'expériences menées sur deux corpora, nous montrons la pertinence de l'apprentissage supervisé dans ce but, particulièrement avec l'algorithme C4.5.
- article