Thomas Girault
France Telecom, Université de Rennes
Session TALN orale O8 Entités Nommées Mercredi 11 Juin - 10h30 12h00
-
papier 1368
Exploitation de treillis de Galois en désambiguïsation non supervisée d'entités nommées
- Thomas Girault ( France Telecom, Université de Rennes)
- Résumé : Nous présentons une méthode non supervisée de désambiguïsation d'entités nommées, basée sur l'exploitation des treillis de Galois. Nous réalisons une analyse de concepts formels à partir de relations entre des entités nommées et leurs contextes syntaxiques extraits d'un corpus d'apprentissage. Le treillis de Galois résultant fournit des concepts qui sont utilisés comme des étiquettes pour annoter les entités nommées et leurs contextes dans un corpus de test. Une évaluation en cascade montre qu'un système d'apprentissage supervisé améliore l'étiquetage des entités nommées lorsqu'il s'appuie sur l'annotation réalisée par notre système de désambiguïsation non supervisée.
- article