Séminaire AFCP – 10 mai 2011 – Aspects éthiques et juridiques des corpus oraux

Séminaire AFCP organisé par S. Rossato, L. Besacier, H. Gelas, G. Adda
(solange.rossato@imag.fr, laurent.besacier@imag.fr,
hadrien.gelas@univ-lyon2.fr, Gilles.ADDA@limsi.fr)

Titre : Aspects éthiques et juridiques des corpus oraux

Lieu : Lyon, Laboratoire Dynamique du Langage (DDL)

Date : Mardi 10 Mai 2011, 10h

L’objet de cette journée est de s’interroger sur les aspects éthiques et
juridiques de la collecte, de
l’annotation, de l’utilisation et de la diffusion de corpus oraux. En
effet, on a vu récemment émerger
de nouvelles approches de collecte et d’annotation via des sites
collaboratifs ou de crowdsourcing tels
que Amazon Mechanical Turk (https://www.mturk.com/mturk/welcome). Cette
évolution nous amène
à nous interroger sur les différentes pratiques du chercheur (linguiste
de terrain, dialectologue,
ingénieur en traitement automatique des langues) face à la collecte et
l’annotation de corpus. Il nous a
donc semblé important de mettre en perspective ces nouveaux outils avec
les pratiques des linguistes
et des acteurs du domaine du traitement de la parole et du langage naturel.
Le principe de ces journées consiste à recueillir l’expérience de
différents chercheurs, sur la collecte
de corpus, leur éthique, les aspects juridiques auxquels ils ont été
confrontés, etc. De ces exposés, nous
espérons obtenir un premier matériau pour discussion (ou table ronde)
sur les « bonnes pratiques »
nécessaire dans le domaine, quelque soit la (plate)forme de collecte
utilisée.

Programme

10h : début du séminaire

10h-10h45 : Nouveaux outils de collecte et d’annotation et concept de «
crowd-sourcing » :

présentation et réserves : Gilles Adda (LIMSI-CNRS)

10h45-11h30 : L’expérience des linguistes de terrain : Didier Demolin
(Université Stendhal, Grenoble
III)

11h30-12h15 : L’expérience des dialectologues : Elisabetta Carpitelli
(Université de Nice-Sophia-Antipolis)

12h15-13h30 : repas sur place (buffet)

13h30-14h15 : L’expérience des organismes qui gèrent et collectent des
ressources langagières : Khalid Choukri (ELRA)

14h15-15h : Le droit et les corpus oraux : Ibrahim Coulibaly (CDF,
Université de Grenoble)

15h-16h : Table ronde et discussions avec les intervenants

Retrouvez les présentations des différents intervenants ici.