Corpus Ester – Traitement automatique et exploitation phonétique/linguistique

Dans le cadre du projet Technolangue, l’AFCP a coordonné une campagne d’évaluation des systèmes de transcription automatique de la parole (ESTER). Au terme de cette campagne, un corpus de parole important est rendu disponible, étiqueté orthographiquement et pour lequel on dispose de ressources générées automatiquement : phonétisations, alignements, réseaux de confusion, etc.

Autour d’une présentation des ressources liées au corpus ESTER et des questions linguistiques menant à l’utilisation de corpus oraux, les participants et intervenants seront amenés à discuter de leurs problématiques et intérêts respectifs afin d’identifier les enjeux communs, les échanges possibles et les collaborations futures.

INFORMATIONS PRATIQUES

  • Lieu
    Fédérations de Recherche ILF (FR 2393) et TUL (FR 2559) CNRS
    44, rue de l’Amiral Mouchez
    75014 Paris
  • Accès
  • Inscription
    Membre AFCP et étudiants 5 euros
    Autres 10 euros
    Pour nous permettre de gérer les repas, merci de vous inscrire AVANT le 5 mai, en envoyant un email à Cécile Fougeron (en indiquant votre nom, affiliation et le tarif auquel vous avez droit). Le paiement se fera sur place.

PROGRAMME

09h30-10h00 Accueil des participants

10h00-11h30 Présentation du corpus ESTER : corpus, tâches, ressources. Guillaume Gravier CNRS – UMR 6074, IRISA

Présentation de la campagne, du corpus, des tâches et des resources qui peuvent être produit automatiquement ; Analyse des faiblesses des systèmes de transcription automatique.

11h30-12h30 Utilisation de corpus oraux : les problématiques Linguistiques. Elisabeth Delais-Roussarie CNRS – UMR 7110 / Laboratoire de Linguistique Formelle

Utilisation des corpus oraux en phonétique et phonologie pour l’étude et la modélisation de phénomènes segmentaux et suprasegmentaux ; Utilisation de corpus oraux en syntaxe.

12h30-14h00 Repas sur place

14h00-15h00 Exposés courts

Analyse phonétique et linguistique de grands corpus oraux Martine Adda-Decker LIMSI, CNRS.

Perception des traits segmentaux : comparaison humain/système automatique Willy Serniclaes LEAPLE, UMR 8606

Utilisation de corpus oraux en synthèse de la parole Olivier Boëffard ENSSAT, IRISA / Univ. Rennes 1

Présentation du corpus et du projet PFC et présentation de la politique du département SHS Jacques Durand ERSS UMR5610 CNRS

15h00-16h30 Table ronde

Que peut-on faire avec le corpus ESTER ? Quelle(s) collaboration(s) possibles entre les communautés STIC et SHS ? Comment peut-on utiliser les outils automatiques dérivés de ESTER sur d’autres corpus ? Quelles réponses linguistiques aux problèmes des systèmes automatiques ? Qu’est-ce que les linguistes et les phonéticients attendent d’un corpus, d’un pré-traitement automatique ?

Vers l’étude de parole spontanée : réflexion commune sur les défis posés au traitement automatique, sur les besoins de la communauté SHS, et sur les solutions communes possibles.

ORGANISATEURS

  • Cécile Fougeron, Laboratoire de Phonétique et Phonologie, CNRS/Paris3
  • Guillaume Gravier, CNRS – UMR 6074, IRISA
  • François Pellegrino, UMR5596 Dynamique Du Langage, CNRS – Université Lumière Lyon 2