Yves Scherrer
Université de Genève
Session RECITAL orale O2 Mardi 10 Juin - 16h30 18h30
-
papier 1313
Transducteurs à fenêtre glissante pour l'induction lexicale
- Yves Scherrer ( Université de Genève)
- Résumé : Nous appliquons différents modèles de similarité graphique à la tâche de l'induction de lexiques bilingues entre un dialecte de Suisse allemande et l'allemand standard. Nous comparons des transducteurs stochastiques utilisant des fenêtres glissantes de 1 à 3 caractères, entraînés à l'aide de l'algorithme de maximisation de l'espérance avec des corpus d'entraînement de tailles différentes. Si les transducteurs à unigrammes donnent des résultats satisfaisants avec des corpus très petits, nous montrons que les transducteurs à bigrammes les dépassent à partir de 1500 paires de mots d'entraînement. En général, les modèles entraînés nous ont permis d'améliorer la F-mesure de 6% à 14% par rapport à la distance de Levenshtein.
- article