Session RECITAL poster - P1

Jeudi 12 Juin - 14h00 17h00

papier 1320 Génération intégrée localisée pour la production de documents

Pierre Hankach  ( France Telecom & Paris 7)

Résumé : Dans cet article, nous proposons une nouvelle approche de construction d'un système de génération basée sur une génération intégrée localisée, où le traitement intégré des décisions linguistiques est limité à la production des propositions dont les décisions linguistiques qui concernent leur réalisation sont dépendantes. La génération se fait par groupes de propositions de tailles limitées avec traitement intégrée des décisions linguistiques pour la production des propositions d'un groupe. Notre approche apporte une solution pour le problème de complexité de la génération intégrée classique. Elle fournit ainsi une alternative à la génération séparée (séquentielle ou interactive) qui présente plusieurs défauts mais qui est implémentée de manière répandue dans les systèmes de générations existants.

article

papier 1311 Un système de génération et étiquetage automatique de dictionnaires linguistiques de l'arabe

Mourad Mars  ( Université Stendhal)

Mounir Zrigui  ( Faculté des Sciences de Monastir)

Georges Antoniadis  ( Université Sthendal Grenoble3)

Mohamed Belgacem  ( Université Sthendal Grenoble3)

Résumé : . L'objectif de cet article est la présentation d'un système de génération automatique de dictionnaires électroniques de la langue arabe classique, développé au sein de laboratoire UTIC (unité de Monastir). Dans cet article, nous présenterons, les différentes étapes de réalisation, et notamment la génération automatique de ces dictionnaires se basant sur une théorie originale : les Conditions de Structures Morphématiques (CSM), et les matrices lexicales.Ce système rentre dans le cadre des deux projets MIRTO et OREILLODULE réalisés dans les deux laboratoires LIDILEM de Grenoble et UTIC Monastir de Tunisie

article

papier 1321 Analyse quantitative et qualitative de citations extraites d'un corpus journalistique

Fabien Poulard  ( LINA / Université de Nantes)

Résumé : Dans le contexte de la détection de plagiats, le repérage de citations et de ses constituants est primordial puisqu'il peut amener à évaluer le caractère licite ou illicite d'une reprise (source citée ou non). Nous proposons ici une étude quantitative et qualitative des citations extraites d'un corpus que nous avons auparavant constitué. Cette étude a pour but de tracer des axes de recherche d'une méthode de repérage automatique des citations.

article

papier 1316 Une structure pour les questions enchainées

Kévin Séjourné  ( Université de Paris Sud XI, Limsi/CNRS)

Résumé : Nous présentons des travaux réalisés dans le domaine des systèmes de questions réponses (SQR) utilisant des questions enchaînées. La recherche des documents dans un SQR est perturbé par l'absence d'informations sur la valeur à accorder aux éléments de texte éventuellement utiles à la recherche d'informations qui figurent dans les questions liées. Les récentes campagnes d'évaluation montrent que ce problème est sous estimé, et n'a pas fait l'oeuvre de technique dédiée. Afin d'améliorer la recherche des documents dans un SQR nous étudions une nouvelle méthode pour organiser les informations liées aux interactions entre questions. Celle-ci se base sur l'exploitation d'une structure de données adaptée à la transmission des informations des questions liées jusqu'au moteur d'interrogation.

article

papier 1322 Vers une nouvelle approche de la correction grammaticale

Agnès Souque  ( Université Stendhal - Grenoble 3)

Résumé : La correction grammaticale automatique du français est une fonctionnalité qui fait cruellement défaut à la communauté des utilisateurs de logiciels libres. Dans le but de combler cette lacune, nous avons travaillé à l'adaptation au français d'un outil initialement développé pour une langue étrangère. Ce travail nous a permis de montrer que les approches classiques du traitement automatique des langues utilisées dans le domaine ne sont pas appropriées. Pour y remédier, nous proposons de faire évoluer les formalismes des correcteurs en intégrant les principes linguistiques de la segmentation en chunks et de l'unification. Bien qu'efficace, cette évolution n'est pas suffisante pour obtenir un bon correcteur grammatical du français. Nous envisageons alors une nouvelle approche de la problématique

article

papier 1309 Informations spatio-temporelles et objets touristiques dans des pages Web : repérage et annotation

Stéphanie Weiser  ( MoDyCo - CNRS et Université Paris X)

Résumé : Cet article présente un projet de repérage, d'extraction et d'annotation d'informations temporelles, d'informations spatiales et d'objets touristiques dans des pages Web afin d'alimenter la base de connaissance d'un portail touristique. Nous porterons une attention particulière aux différences qui distinguent le repérage d'information dans des pages Web du repérage d'informations dans des textes. Après avoir introduit et classifié les différentes informations à extraire, nous ferons le point sur la façon de lier ces informations entre elles et de les annoter. Nous présenterons également le logiciel que nous avons réalisé afin d'effectuer cette opération d'annotation ainsi que les premiers résultats obtenus. Enfin, nous nous intéresserons aux autres types de marques que l'on trouve dans les pages Web, les marques sémiotiques en particulier, dont l'analyse peut être intéressante.

article