François Yvon
Université Paris Sud - LIMSI CNRS
Session TALN orale OC Session commune JEP/TALN Mardi 10 Juin - 10h30 12h30
-
papier 1364
Transcrire les SMS comme on reconnait la parole
- Catherine Kobus ( Orange Labs)
- François Yvon ( LIMSI/CNRS et Université Paris Sud 11)
- Géraldine Damnati ( Orange Labs)
- Résumé : Cet article présente une architecture inspirée des systèmes de reconnaissance vocale pour effectuer une normalisation orthographique de messages en langage SMS. Nous décrivons notre système de base, ainsi que diverses évolutions de ce système, qui permettent d'améliorer sensiblement la qualité des normalisations produites.
- article
Session TALN poster P1P2 Jeudi 12 Juin - 14h00 17h00
-
papier 1363
Appariement d'entités nommées coréférentes : combinaisons de mesures de similarité par apprentissage supervisé
- Erwan Moreau ( Institut Télécom ParisTech)
- François Yvon ( Université Paris Sud - LIMSI CNRS)
- Olivier Cappé ( Institut Télécom ParisTech - LTCI CNRS)
- Résumé : L'appariement d'entités nommées consiste à regrouper les différentes formes sous lesquelles apparaît une entité. Pour cela, des mesures de similarité textuelle sont généralement utilisées. Nous proposons de combiner plusieurs mesures afin d'améliorer les performances de la tâche d'appariement. À l'aide d'expériences menées sur deux corpora, nous montrons la pertinence de l'apprentissage supervisé dans ce but, particulièrement avec l'algorithme C4.5.
- article