Session TALN orale - O7

Traduction automatique

Mercredi 11 Juin - 10h30 12h00

papier 1349 Une alternative aux modèles de traduction statistique d'IBM: Les triggers inter-langues

Lavecchia Caroline  ( LORIA - Université Nancy2)

Kamel Smaïli  ( LORIA - Université Nancy2)

David Langlois  ( LORIA - IUFM de Lorraine)

Résumé : Dans cet article, nous présentons une nouvelle approche pour la traduction automatique fondée sur les triggers inter-langues. Dans un premier temps, nous expliquons le concept de triggers inter-langues ainsi que la façon dont ils sont déterminés. Nous présentons ensuite les différentes expérimentations qui ont été menées à partir de ces triggers afin de les intégrer au mieux dans un processus complet de traduction automatique. Pour cela, nous construisons à partir des triggers inter-langues des tables de traduction suivant différentes méthodes. Nous comparons par la suite notre système de traduction fondé sur les triggers inter-langues à un système état de l'art reposant sur le modèle 3 d'IBM. Les tests menés ont montré que les traductions automatiques générées par notre système améliorent le score BLEU de 2,4% comparé à celles produites par le système état de l'art.

article

papier 1362 Génération de reformulations locales par pivot pour l'aide à la révision

Aurélien Max  ( LIMSI-CNRS & Université Paris-Sud 11)

Résumé : Cet article présente une approche pour obtenir des paraphrases pour de courts segments de texte qui peuvent aider un rédacteur à reformuler localement des textes. La ressource principale utilisée est une table d'alignements bilingues de segments d'un système de traduction automatique statistique. Un segment marqué par le rédacteur est tout d'abord traduit dans une langue pivot avant d'être traduit à nouveau dans la langue d'origine, ce qui est permis par la nature même de la ressource bilingue utilisée sans avoir recours à un processus de traduction complet. Le cadre proposé permet l'intégration et la combinaison de différents modèles d'estimation de la qualité des paraphrases. Les modèles linguistiques proposés et évalués dans ce travail permettent l'étude empirique des caractéristiques des paraphrases de courts segments de texte. Les domaines d'application possibles incluent, outre l'aide à la reformulation, le résumé et la réécriture des textes pour répondre à des conventions ou à des préférences stylistiques. L'approche est critiquée et des perspectives d'amélioration sont proposées.

article

papier 1375 Les architectures linguistiques et computationnelles en traduction automatique sont orthogonales

Christian Boitet  ( UJF (Université Joseph Fourier))

Résumé : Contrairement à une idée répandue, les architectures linguistiques et computationnelles des systèmes de traduction automatique sont orthogonales. Les premières concernent le choix des représentations intermédiaires, les secondes le type d'algorithme, de programmation et de ressources utilisés. Il est ainsi possible d'utiliser des méthodes de calcul >expertes> ou >empiriques> pour construire diverses phases ou modules de systèmes d'architectures linguistiques variées. Nous terminons en donnant quelques éléments pour le choix de ces architectures en fonction des situations traductionnelles et des ressources disponibles, en termes de dictionnaires, de corpus, et de compétences humaines.

article