Stéphane Rauzy
Laboratoire Parole et Langage, Université de Provence
Session JEP poster P6 Jeudi 12 Juin - 10h30 12h30
-
papier 1684
Utilisation des grammaires probabilistes dans les tâches de segmentation et d'annotation prosodique
- Irina Nesterenko ( Université Blaise Pascal, Clermont-Ferrand II)
- Stéphane Rauzy ( Laboratoire Parole et Langage, Université de Provence)
- Résumé : L'objectif de notre étude est de modéliser comment les informations probabilistes dans l'espace tonal peuvent être explorées dans une tâche de segmentation du continuum sonore à la fois par les humains et par les algorithmes de l'annotation semi-automatique des corpus. Nous testons également si implémenter une structure hiérarchique minimale améliore la performance de l'algorithme. Nous nous appuyons sur l'appareil mathématique des grammaires probabilistes et nous décrivons et évaluons les étapes de la construction des modèles probabilistes et de leur testes en prédiction.
- article
Session TALN orale O9 Etiquetage et indexation Jeudi 12 Juin - 10h30 12h00
-
papier 1345
Influence de la qualité de l'étiquetage sur le chunking: une corrélation dépendant de la taille des chunks
- Philippe Blache ( Laboratoire Parole et Langage, CNRS & Université de Provence)
- Stéphane Rauzy ( Laboratoire Parole et Langage, CNRS & Université de Provence)
- Résumé : Nous montrons dans cet article qu'il existe une corrélation étroite existant entre la qualité de l'étiquetage morpho-syntaxique et les performances des chunkers. Cette corrélation devient linéaire lorsque la taille des chunks est limitée. Nous appuyons notre démonstration sur la base d'une expérimentation conduite suite à la campagne d'évaluation Passage 2007 (cf. de la Clergerie et al. (2008)). Nous analysons pour cela les comportements de deux analyseurs ayant participé à cette campagne. L'interprétation des résultats montre que la tâche de chunking, lorsqu'elle vise des chunks courts, peut être assimilée à une tâche de >super-étiquetage>.
- article