Dans le cadre du projet Technolangue, l’AFCP a coordonné une campagne d’évaluation des systèmes de transcription automatique de la parole (ESTER). Au terme de cette campagne, un corpus de parole important est rendu disponible, étiqueté orthographiquement et pour lequel on dispose de ressources générées automatiquement : phonétisations, alignements, réseaux de confusion, etc.
Autour d’une présentation des ressources liées au corpus ESTER et des questions linguistiques menant à l’utilisation de corpus oraux, les participants et intervenants seront amenés à discuter de leurs problématiques et intérêts respectifs afin d’identifier les enjeux communs, les échanges possibles et les collaborations futures.
INFORMATIONS PRATIQUES
- Lieu
Fédérations de Recherche ILF (FR 2393) et TUL (FR 2559) CNRS
44, rue de l’Amiral Mouchez
75014 Paris - Accès
- Inscription
Membre AFCP et étudiants 5 euros
Autres 10 euros
Pour nous permettre de gérer les repas, merci de vous inscrire AVANT le 5 mai, en envoyant un email à Cécile Fougeron (en indiquant votre nom, affiliation et le tarif auquel vous avez droit). Le paiement se fera sur place.
PROGRAMME
09h30-10h00 Accueil des participants
10h00-11h30 Présentation du corpus ESTER : corpus, tâches, ressources. Guillaume Gravier CNRS – UMR 6074, IRISA
Présentation de la campagne, du corpus, des tâches et des resources qui peuvent être produit automatiquement ; Analyse des faiblesses des systèmes de transcription automatique.
11h30-12h30 Utilisation de corpus oraux : les problématiques Linguistiques. Elisabeth Delais-Roussarie CNRS – UMR 7110 / Laboratoire de Linguistique Formelle
Utilisation des corpus oraux en phonétique et phonologie pour l’étude et la modélisation de phénomènes segmentaux et suprasegmentaux ; Utilisation de corpus oraux en syntaxe.
12h30-14h00 Repas sur place
14h00-15h00 Exposés courts
Analyse phonétique et linguistique de grands corpus oraux Martine Adda-Decker LIMSI, CNRS.
Perception des traits segmentaux : comparaison humain/système automatique Willy Serniclaes LEAPLE, UMR 8606
Utilisation de corpus oraux en synthèse de la parole Olivier Boëffard ENSSAT, IRISA / Univ. Rennes 1
Présentation du corpus et du projet PFC et présentation de la politique du département SHS Jacques Durand ERSS UMR5610 CNRS
15h00-16h30 Table ronde
Que peut-on faire avec le corpus ESTER ? Quelle(s) collaboration(s) possibles entre les communautés STIC et SHS ? Comment peut-on utiliser les outils automatiques dérivés de ESTER sur d’autres corpus ? Quelles réponses linguistiques aux problèmes des systèmes automatiques ? Qu’est-ce que les linguistes et les phonéticients attendent d’un corpus, d’un pré-traitement automatique ?
Vers l’étude de parole spontanée : réflexion commune sur les défis posés au traitement automatique, sur les besoins de la communauté SHS, et sur les solutions communes possibles.
ORGANISATEURS
- Cécile Fougeron, Laboratoire de Phonétique et Phonologie, CNRS/Paris3
- Guillaume Gravier, CNRS – UMR 6074, IRISA
- François Pellegrino, UMR5596 Dynamique Du Langage, CNRS – Université Lumière Lyon 2