Mary Hearne
National Centre for Language Technology, Dublin City University
Session TALN poster P1P2 Jeudi 12 Juin - 14h00 17h00
-
papier 1338
Comparing Constituency and Dependency Representations for SMT Phrase-Extraction
- Mary Hearne ( National Centre for Language Technology, Dublin City University)
- Sylwia Ozdowska ( National Centre for Language Technology, Dublin City University)
- John Tinsley ( National Centre for Language Technology, Dublin City University)
- Résumé : Nous évaluons le recours à des techniques de traduction à base de segments syntaxiquement motivés, seules ou en combinaison avec des techniques à base de segments non motivés, et nous comparons les apports respectifs de l'analyse en constituants et de l'analyse en dépendances dans ce cadre. A partir d'un corpus parallèle Anglais--Français, nous construisons automatiquement deux corpus d'entrainement arborés, en constituants et en dépendances, alignés au niveau sous-phrastique et en extrayons des correspondances bilingues entre mots et syntagmes motivées syntaxiquement. Nous mesurons automatiquement la qualité de la traduction obtenue par un système à base de segments. Les résultats montrent que la combinaison des correspondances bilingues non motivées et motivées sur le plan syntaxique améliore la qualité de la traduction quel que soit le type d'analyse considéré. Par ailleurs, le gain en qualité est plus important avec le recours à l'analyse en dépendances au regard des constituants.
- article