Session TALN orale - O4
Résumé Automatique
Lundi 9 Juin - 16h00 17h00
-
papier 1356
Enertex : un système basé sur l'énergie textuelle
- Silvia Fernandez ( Universite d'Avignon)
- Eric Sanjuan ( Universite d'Avignon)
- Juan-Manuel Torres-Moreno ( Universite d'Avignon)
- Résumé : Dans cet article, nous présentons des applications de l'énergie textuelle, approche de réseaux de neurones inspirée de la physique statistique de systèmes magnétiques, dans le Traitement Automatique de la Langue Naturelle. Nous avons appliqué cette approche aux problèmes de résumé automatique multi-documents et de détection de frontières thématiques. Les résultats, en trois langues : anglais, français et espagnol, sont très encourageants.
- article
-
papier 1374
Intégration d'une étape de pré-filtrage et d'une fonction multi-objectif en vue d'améliorer le système ExtraNews de résumé de documents multiples
- Jaoua-Kallel Fatma ( MIRACL)
- Jaoua Maher ( MIRACL)
- Lamia Hadrich-Belguith ( MIRACL)
- Abdelmajid Ben-Hamadou ( MIRACL)
- Résumé : Dans cet article, nous présentons les améliorations que nous avons apportées au système ExtraNews de résumé automatique de documents multiples. Ce système se base sur l'utilisation d'un algorithme génétique qui permet de combiner les phrases des documents sources pour former les extraits, qui seront croisés et mutés pour générer de nouveaux extraits. La multiplicité des critères de sélection d'extraits, nous a inspiré une première amélioration qui consiste à utiliser une technique d'optimisation multi-objectif en vue d'évaluer ces extraits. La deuxième amélioration consiste à intégrer une étape de pré-filtrage de phrases qui a pour objectif la réduction du nombre des phrases des textes sources en entrée. Une évaluation des améliorations apportées à notre système est réalisée sur les corpus disséminés lors des conférences DUC'04 et DUC'07
- article