Thierry Waszak
LIA / Université d'Avignon
Session TALN poster P1P2 Jeudi 12 Juin - 14h00 17h00
-
papier 1342
Repérage de citations, classification des styles de discours et identification des constituants citationnels en écrits journalistiques
- Fabien Poulard ( LINA / Université de Nantes)
- Thierry Waszak ( LIA / Université d'Avignon)
- Nicolas Hernandez ( LINA / Université de Nantes)
- Patrice Bellot ( LIA / Université d'Avignon)
- Résumé : Ce travail s'inscrit dans le cadre du projet ANR PIITHIE (Plagiats et Impacts de l'Information Textuelle recHerchée dans un contexte InterlinguE). Dans ce contexte, le repérage de citations et de ses constituants est primordial puisqu'il peut amener à évaluer le caractère licite ou illicite d'une reprise (source citée ou non). Nous proposons ici une comparaison de méthodes automatiques pour le repérage de ces informations et rapportons une évaluation quantitative de celles-ci. Un corpus d'écrits journalistiques français a été manuellement annoté pour nous servir de base d'apprentissage et de test.
- article