Session TALN orale - O5
Syntaxe
Mardi 10 Juin - 14h00 16h00
-
papier 1316
Convertir des grammaires d'arbres adjoints à composantes multiples avec tuples d'arbres (TT-MCTAG) en grammaires à concaténation d'intervalles (RCG)
- Laura Kallmeyer ( Université de Tübingen)
- Yannick Parmentier ( Université de Tübingen)
- Résumé : Cet article étudie la relation entre les grammaires d'arbres adjoints à composantes multiples avec tuples d'arbres (TT-MCTAG), un formalisme utilisé en linguistique informatique, et les grammaires à concaténation d'intervalles (RCG). Les RCGs sont connues pour décrire exactement la classe PTIME, il a en outre été démontré que les RCGs >simples> sont même équivalentes aux systèmes de réécriture hors-contextes linéaires (LCFRS), en d'autres termes, elles sont légèrement sensibles au contexte. TT-MCTAG a été proposé pour modéliser les langages à ordre des mots libre. En général ces langages sont NP-complets. Dans cet article, nous définissons une contrainte additionnelle sur les dérivations autorisées par le formalisme TT-MCTAG. Nous montrons ensuite comment cette forme restreinte de TT-MCTAG peut être convertie en une RCG simple équivalente. Le résultat est intéressant pour des raisons théoriques (puisqu'il montre que la forme restreinte de TT-MCTAG est légèrement sensible au contexte), mais également pour des raisons pratiques (la transformation proposée ici a été utilisée pour implanter un analyseur pour TT-MCTAG).
- article
-
papier 1350
Factorisation des contraintes syntaxiques dans un analyseur de dépendance
- Piet Mertens ( Université de Leuven)
- Résumé : Cet article décrit un analyseur syntaxique pour grammaires de dépendance lexicalisées. Le formalisme syntaxique se caractérise par une factorisation des contraintes syntaxiques qui se manifeste dans la séparation entre dépendance et ordre linéaire, la spécification fonctionnelle (plutôt que syntagmatique) des dépendants, la distinction entre dépendants valenciels (la sous-catégorisation) et non valenciels (les circonstants) et la saturation progressive des arbres. Ceci résulte en une formulation concise de la grammaire à un niveau très abstrait et l'élimination de la reduplication redondante des informations due aux réalisations alternatives des dépendants ou à leur ordre. Les arbres élémentaires (obtenus à partir des formes dans l'entrée) et dérivés sont combinés entre eux par adjonction d'un arbre dépendant saturé à un arbre régissant, moyennant l'unification des noeuds et des relations. La dérivation est réalisée grâce à un analyseur chart bi-directionnel.
- article
-
papier 1333
Grammaires factorisées pour des dialectes apparentés
- Pascal Vaillant ( Université des Antilles et de la Guyane)
- Résumé : Pour la formalisation du lexique et de la grammaire de dialectes étroitement apparentés, il peut se révéler utile de factoriser une partie du travail de modélisation. Les sous-systèmes linguistiques isomorphes dans les différents dialectes peuvent alors faire l'objet d'une description commune, les différences étant spécifiées par ailleurs. Cette démarche aboutit à un modèle de grammaire à couches: le noyau est commun à la famille de dialectes, et une couche superficielle détermine les caractéristiques de chacun. Nous appliquons ce procédé à la famille des langues créoles à base lexicale française de l'aire américano-caraïbe.
- article
-
papier 1351
Expériences d'analyse syntaxique statistique pour le Français
- Benoit Crabbé ( Université Paris 7)
- Marie Candito ( Université Paris 7)
- Résumé : Dans cet article, on montre qu'il est possible d'obtenir une analyse syntaxique statistique satisfaisante pour le Français à partir des données issues du French Treebank du laboratoire Llf, à l'aide d'un algorithme d'analyse non lexicalisé.
- article