Bonjour,
Bienvenue sur " PAROLE ", le lien de la Communauté Francophone de la
Communication Parlée. Elle est gérée par l'Association Francophone de
la Communication Parlée (AFCP) et a pour but de permettre la
circulation d'informations importantes relatives à notre communauté.
Vous pouvez donc m'envoyer vos " Nouvelles Brèves " (annonces de
conférences, séminaires, thèses, appels d'offres, offres d'emploiŠ) en
vue de la prochaine édition (mi avril 2003).
Par ailleurs, permettez-moi de vous annoncer que les prochaines
Journées d'Etudes sur la Parole (JEP 2004) seront confiées
au Laboratoire Parole et Langage - LPL, de l'Université de
Provence, pour une co-organisation avec TALN, à Fès
(MAROC).
Toutes les informations concernant ces JEP seront tres
prochainement disponibles sur le site de l'Association
(www.afcp-parole.org).!!!
*******************************************************************
SOMMAIRE :
A. LE NOUVEAU BUREAU DE L'AFCP
B. ASSOCIATION CHRISTIAN BENOÎT et PRIX CHRISTIAN BENOÎT
C. APPEL À COmmunications RIA
D. APPEL A COMMUNICATION : La partition en langue et en discours
E. NOS THESES : PASSEES ET FUTURESŠ
F. POSTE DE PROFESSEUR DE PHONETIQUE
G. HUMOUR ?
*******************************************************************
A. Le nouveau Bureau de l'AFCP est composé de :
Président, Jean-François BONASTRE
Vice-Président, Pascal PERRIER
Trésorier, François PELLEGRINO
Secrétaire, Laurent BESACIER
Secrétaire adjointe, Cécile FOUGERON
*****************************************************************************
B. ASSOCIATION CHRISTIAN BENOÎT et PRIX CHRISTIAN BENOÎT
Association Christian Benoît
L'Association
Christian Benoît est une association à but non lucratif. L'objet
de l'association est de permettre le développement de projets de
recherche dans le domaine de la communication parlée. Elle est créée en
l'honneur de Christian Benoît, chercheur au CNRS dans le domaine de la
communication parlée, décédé le 26 avril 1998 à 41 ans.
L'association essaiera d'atteindre ses objectifs:
…
en contribuant, sous
la forme d'un prix appelé "Prix Christian Benoît pour la promotion de
la recherche en communication parlée", au financement de la promotion
d'un projet de recherche présenté à titre individuel par un chercheur,
de quelque nationalité qu'il soit, afin d'aider ce chercheur à trouver
les moyens logistiques nécessaires à la réalisation de son projet.
…
en organisant des
sessions de formation ou des rencontres scientifiques sur le thème de
la communication parlée.
Le Bureau de l'Association est composé de :
Jean-Luc Schwartz (Directeur de l'ICP) : Président
Frédéric Bimbot (Bureau d'ESCA): Vice-Président
Gérard Bailly : Trésorier
Pascal Perrier : Secrétaire
Marcelle Benoît
Eric Vatikiotis-Bateson (Bureau d'AVISA)
Pour soutenir cette action, vous pouvez devenir membre
de l'Association Christian Benoît. Pour
cela il suffit d'en manifester l'intention sur papier libre, en
stipulant vos noms et adresse, et d'envoyer ce courrier avec votre
cotisation au trésorier de l'association (Gérard Bailly, ICP, INPG, 46
Av. Félix-Viallet, 38031 Grenoble Cedex 1, France / Chèques à l'ordre
de Association Christian Benoît).
Les cotisations sont fixées à : 15 Euros pour un membre actif, 45 Euros
et plus pour un membre bienfaiteur.
Association Christian Benoît
The
Association Christian Benoît is a
nonprofit organization. The purpose of the association is to facilitate
the development of research projects in the field of speech
communication. The association has been created in honor of Christian
Benoît, CNRS researcher in the field of speech communication, who died
on the 26th of April, 1998, at the age of 41.
The association will pursue its purpose by:
…
contributing,
through the "Christian Benoît Award for the promotion of speech
communication research", to the financial support of a research project
presented individually by a researcher of any nationality, in order to
help this researcher to find the logistic means necessary for the
realization of his/her project.
…
organizing training
sessions or scientific meetings on the theme of speech communication.
The association board is made up of :
Jean-Luc Schwartz (ICP's Head): President
Frédéric Bimbot (ESCA board): Vice-President
Gérard Bailly : Treasurer
Pascal Perrier : Secretary
Marcelle Benoît
Eric Vatikiotis-Bateson (AVISA Board)
To support this organization, you can become a member of the
Association Christian Benoît. For that
you simply should write a letter with your name and address, and send
the letter together with your registration fee to the association
treasurer (Gérard Bailly, ICP, INPG, 46 Av. Félix-Viallet, 38031
Grenoble Cedex 1, France).
Fees are fixed at: 15 Euros for active member status, 45 Euros or more
for benefactor status.
Prix Christian Benoît
Le prix Christian Benoît est délivré par
l'Association Christian Benoît en mémoire
de Christian Benoît. Il sera attribué à un chercheur dont la thèse et
le travail de recherche se situent dans le domaine de la Communication
Parlée, afin de l'aider à réaliser un produit multimedia pour faire
connaître et valoriser sa recherche. On privilégiera les dossiers
émanant de chercheurs ayant obtenu leur thèse au cours des 5 années
précédant la clôture du dépôt de candidature. Le bénéficiaire du prix
s'engagera à réaliser un site web décrivant ses recherches et ses
perspectives, ainsi qu'un support matériel du type CDROM, DVD ou
cassette vidéo . La sélection sera effectuée par le Comité Scientifique
de l'Association, nommé par le bureau. Le montant de ce prix est
de 7625 Euros .
Chaque candidat devra envoyer au secrétaire de l'association un
exemplaire du manuscrit de thèse, ainsi que 10 exemplaires d'un dossier
d'une dizaine de pages (en français ou en anglais) comprenant un CV,
une liste des publications, un résumé des travaux, une description du
projet scientifique et une description du projet de réalisation
multimedia.
Le comité scientifique est composé de :
Christian Abry (ICP Grenoble) Paul Bertelson (LPE, UL
Bruxelles) Frédéric Bimbot (ESCA, IRISA, Rennes) Denis Burnham
(UNSW, Sydney)
Jean-Luc Schwartz (Pdt de l'Association
Christian Benoît) Dominic Massaro (UCSC, Santa Cruz)
Philip Rubin (Président d'AVISA, Haskins Lab., New Haven) Marney Smyth
(MIT Press, Cambridge)
Rudolph Sock (AFCP - IPS Strasbourg) Eric Vatikiotis-Bateson (ATR,
Kyoto)
Christian Benoît Award
The Christian Benoît Award is one of the actions that the
Association Christian Benoît has set up
in memory of Christian Benoît. It will be attributed to a doctoral
graduate whose PhD and further scientific project is in the Speech
Communication domain. The purpose of the award is to provide financial
support for the development of a multi-media product promoting his/her
work. Preference will be given to scientists whose thesis was awarded
within the five years prior to the application deadline. The commitment
of the successful applicant will involve building a web-site describing
his/her past research and his/her scientific project, together with a
hardware product such as a CDROM, a DVD or a Videotape1. The Award will
be attributed following a selection process overseen by the Scientific
Committee, which will be appointed by the board of the
Association Christian Benoît. The value
of the Award is 7625 Euros 2.
Candidates should forward their application to the Secretary of
the Association3. The application should consist of a copy of the
thesis manuscript, together with 10 copies of a dossier (around 10
pages, in French or in English) containing a biographical sketch, a
list of publications, a summary of past scientific work, and a
description of the scientific project and of the multimedia project.
The Scientific Committee is made up of:
Christian Abry (ICP Grenoble) Paul Bertelson (LPE, UL
Bruxelles) Frédéric Bimbot (ESCA, IRISA, Rennes) Denis Burnham (UNSW,
Sydney)
Jean-Luc Schwartz (Pdt of the Association
Christian Benoît) Dominic Massaro (UCSC, Santa Cruz)
Philip Rubin (President of AVISA, Haskins Lab., New Haven) Marney
Smyth (MIT Press, Cambridge)
Rudolph Sock (GFCP-SFA, IP Strasbourg) Eric Vatikiotis-Bateson (ATR,
Kyoto)
***************************************************************************************
C. APPEL À COmmunications RIA - Revue d'Intelligence
Artificielle (Édition Hermes)
NUMÉRO SPÉCIAL sur la présentation d'information "sur mesure"
incluant les documents virtuels personnalisés ainsi que les interfaces
adaptatives
***************************************************************************
Éditeurs du Numéro Spécial:
Cécile Paris, CSIRO - Mathematical and Information Sciences, Australia
Nathalie Colineau, CSIRO - Mathematical and Information Sciences,
Australia
Présentation: -
Devant le flot d'information toujours croissant, un certain nombre de
services et/ou systèmes personnalisés ont fait leur apparition.
Produit du marché ou de la recherche, la problématique du « contenu
sur mesure » pose de nombreux problèmes de recherche et implique des
techniques de plus en plus sophistiquées.
Ce numéro spécial sera consacré à la présentation d'information
adaptée à l'utilisateur (incluant à la fois les documents virtuels
personnalisés et les interfaces adaptatives). Les travaux relatifs à
cette thématique mettent en oeuvre des techniques de filtrage et
d'extraction d'information issue de sources hétégorènes, ainsi que des
mécanismes permettant d'organiser et d'assembler le contenu à
présenter. Ils reposent entre autres sur une caractérisation des
données, une modélisation de l'utilisateur, de sa tâche et de son
besoin d'information, ainsi que sur des principes de cohérence
discursive.
L'objectif de ce numéro spécial est de présenter les recherches
actuelles et de couvrir les différentes problématiques rencontrées par
les systèmes proposant un contenu taillé « sur mesure ». Les
soumissions pourront porter sur les aspects incluant: Domaines
d'Application et systèmes ; Modèles, Techniques et Outils ; Principes,
Représentations et Techniques de composition ; Évaluation; et
Perspectives et Tendances Futures.
Soumission des articles: Les auteurs sont invités à
soumettre des travaux de recherche originaux, n'ayant pas fait l'objet
de publications antérieures ni simultanées. Les soumissions seront
examinées par au moins deux spécialistes du domaine. Les articles
pourront être en français comme en anglais. Nous attendons des
soumissions d'une vingtaine de pages environ. Pour des informations
complémentaires concernant les instructions aux auteurs, se reporter au
site Internet de la revue : <http://ria.e-revues.com/auteurs.jsp>
http://ria.e-revues.com/auteurs.jsp
<<http://ria.e-revues.com/acceuil.jsp>
http://ria.e-revues.com/acceuil.jsp>
Les soumissions devront parvenir aux éditeurs de ce numéro spécial,
sous la forme d'un document attaché (fichiers word, ps ou pdf au
format A4), par courrier électronique, adressées à
nathalie.colineau@csiro.au <<mailto:nathalie.colineau@csiro.au>
mailto:nathalie.colineau@csiro.au>
Dates Importantes:
30 mai 2003: Date limite de soumission
15 septembre 2003:Notification aux auteurs
31 octobre 2003: Réception des papiers finaux
Le numéro spécial devrait être publié en décembre 2003.
Comité de programme: Elisabeth André, Université
d'Augsburg, Allemagne Jean-Yves Antoine, VALORIA - Université de
Bretagne-sud, France Michel Beaudoin-Lafon, LRI - Université
Paris-Sud, France Paul De Bra, Université de Technologie d'Eindhoven,
Les Pays-Bas Patrick Brézillon, LIP6 - Université Paris 6, France
Marie-France Bruandet, CLIPS - IMAG, France Peter Brusilovsky,
Université de Pittsburgh, USA Gaëlle Calvary, CLIPS - IMAG, France
Kathy Mc Coy, Université de Delaware, USA Robert Dale, Université de
Macquarie, Australie Tony Hartley, Université de Leeds, Angleterre
Daniele Hérin, LIRMM - Université de Montpellier II, France Richard
Kittredge, CoGenTex, USA Guy Lapalme, Université de Montréal, Canada
Philippe Lenca, ENST Bretagne, France Mark Maybury, MITRE Corporation,
USA Alain Mille, LISI -Université de Lyon 1, France Catherine
Pelachaud, Université de Rome "La Sapienza", Italie Jean-Marie
Pierrel, LORIA, France Fiorella de Rosis, Université de Bari, Italie
Ehud Reiter, Université d'Aberdeen, Ecosse Gérard Sabah, LIMSI, France
Oliviero Stock, ICT - IRST, Italie Peter Stockinger, ESCoM - MSH,
France Jacques Siroux, IRISA - Université de Rennes 1, France André
Tricot, CERFI - Université de Toulouse-le-Mirail, France Keith Vander
Linden, Calvin College, USA
************************ ENGLISH VERSION **************************
***************************************************************************
Call for papers RIA - (Revue d'Intelligence Artificielle) "Artificial
Intelligence Review" (Hermes Publisher)
Special Issue on
Tailored Information Delivery including both Tailored Virtual
Documents and Tailored Displays
***************************************************************************
----------------------------- Special issue Editors:
----------------------------- Cécile Paris, CSIRO - Mathematical and
Information Sciences, Australia Nathalie Colineau, CSIRO -
Mathematical and Information Sciences, Australia
-------------- Overview: -------------- As an increasing amount of
information becomes available, the number of systems and services that
deliver customised information on a variety of media have increased. To
be able to answer the user's information needs, these systems must
address a wide range of issues and deploy increasingly sophisticated
techniques.
This special issue is concerned with Tailored Information Delivery
(including both Tailored Virtual Documents and Tailored Displays). The
objective of this special issue is to present research on systems that
deliver information relevant to users in the context of a task or an
information need, using techniques to filter and extract information
from heterogeneous sources, and mechanisms to organise and integrate
the content to be presented. Research in this domain is typically
based on a characterisation of the data (size, modality, media), the
users, their tasks and information needs, and coherence or narrative
principles.
This special issue aims at encompassing work on current applications,
methodologies, techniques and evaluations related to this research
problem. We thus seek submissions related to the following: -
Application Domains and systems; - Models,
Techniques and Tools; - Principles, Representation
Issues, and Integration and Layout Techniques; -
Evaluation; and, - Perspectives and Future Trends.
--------------------------- Submission Details:
--------------------------- We will be seeking full papers describing
original and unpublished research that are not simultaneously submitted
for publication elsewhere. The papers may be written in either French
and English. We expect papers to be about 20 pages long, in the format
described in the instructions for authors (please refer to the Journal
web site: <http://ria.e-revues.com/auteurs.jsp>
http://ria.e-revues.com/auteurs.jsp
<<http://ria.e-revues.com/acceuil.jsp>
http://ria.e-revues.com/acceuil.jsp>) Papers will be reviewed by at
least two expert reviewers.
The paper should be sent as an attached document (word, ps or pdf
file, format A4) and emailed to nathalie.colineau@csiro.au
<<mailto:nathalie.colineau@csiro.au>
mailto:nathalie.colineau@csiro.au>.
---------------------- Important Dates: ---------------------- May
30, 2003: Submission Deadline September 15, 2003: Author
Notification October 31, 2003: Camera-ready Paper Submission
The Special Issue is expected to be published in December 2003. RIA
is a main AI journal in France.
--------------------------------------------- International Program
Committee: --------------------------------------------- Elisabeth
André, Augsburg University, Germany Jean-Yves Antoine, VALORIA, France
Michel Beaudoin-Lafon, LRI - Paris-Sud University, France Paul De
Bra, Eindhoven University of Technology, The Netherlands Patrick
Brézillon, LIP6 - Paris 6 University, France Marie-France Bruandet,
CLIPS - IMAG, France Peter Brusilovsky, University of Pittsburgh, USA
Gaëlle Calvary, CLIPS - IMAG, France Kathy Mc Coy, University of
Delaware, USA Robert Dale, Macquarie University, Australia Tony
Hartley, University of Leeds, United Kingdom Daniele Hérin, LIRMM -
University of Montpellier II, France Richard Kittredge, CoGenTex, USA
Guy Lapalme, Montreal University, Canada Philippe Lenca, ENST
Bretagne, France Mark Maybury, MITRE Corporation, USA Alain Mille,
LISI - Lyon 1 University, France Catherine Pelachaud, "La Sapienza"
University, Italy Jean-Marie Pierrel, LORIA, France Fiorella de
Rosis, University of Bari, Italy Ehud Reiter, University of Aberdeen,
Scotland Gérard Sabah, LIMSI, France Oliviero Stock, ICT - IRST,
Italy Peter Stockinger, ESCoM - MSH, France Jacques Siroux, IRISA -
Rennes 1 University, France André Tricot, CERFI - University of
Toulouse-le-Mirail, France Keith Vander Linden, Calvin College, USA
----------------------------------------------------------------------
Nathalie Colineau Research Scientist CSIRO - Mathematical and
Information Sciences Intelligent Interactive Technology Locked Bag
17, North Ryde NSW 1670, Australia Phone: +61 2 9325 3151 Fax:
+61 2 9325 3200
-----------------------------------------------------------------------
--
Jérôme Goulian
IUT Vannes - Dpt Informatique VALORIA Université de Bretagne Sud
8 Rue Montaigne 56000 VANNES Tohannic - Rue Yves Mainguy
tel: 02.97.46.31.71 02.97.01.72.13
********************************************************************
D. 1er APPEL A COMMUNICATION
Colloque international
Strasbourg, Université Marc Bloch, 6-8 novembre 2003
La partition en langue et en discours
Il existe une abondante littérature consacrée à la relation
partie/tout, abordée principalement sous l'angle de la sémantique
lexicale (relation dite de méronymie/partonymie) ou sous celui des
configurations discursives que constituent notamment les anaphores
associatives (Nous entrâmes dans un village.
L'égliseŠ). Quant à l'opération de partition, elle est
généralement abordée avec la question des quantificateurs (p.e. dans la
théorie des quantificateurs généralisés) qui délimitent, entre autres,
des ensembles d'ensembles.
Sans exclure ces aspects, le colloque accueille toutes les
contributions, portant sur le français ou sur d'autres langues,
susceptibles de répondre aux questions suivantes :
- comment définir la relation de partition en langue, en discours ?
- quel rapport existe-t-il entre partition et quantification ?
- quelles sont les formes, les structures exprimant la partition aux
différents niveaux de l'analyse linguistique (morphologie, lexique,
syntaxe, discours, etcŠ ?
- quelle évolution et quels processus de grammaticalisation ces outils
ont-ils connus au fil du temps ?
- quelle définition opératoire donner dans la langue et la métalangue à
des noms tels que
totalité/tout/ensemble/groupe/classe/collection, Š ;
part/partie/portion, etc. ;
- quelle a été la productivité lexicale de ces unités dans la
constitution d'autres formes exprimant la partition (part : à
part Paul, personne n'avait faim, de part en part, quelque
part, etc.) ?
La durée des exposés est de 35 mn (discussion comprise)
La publication des actes est prévue.
Calendrier :
Proposition de communication : à envoyer pour le 15 avril 2003
Les propositions sont à envoyer à :
Colloque.Partition@umb.u-strasbg.fr
- Le nom, le prénom, l'affiliation et le titre de la communication
seront sur une page à part
- Sur une 1 page max. figureront le titre, l'argumentaire, les exemples
et les références bibliographiques
Notification d'acceptation : 15 juin 2003
Comité d'organisation : C. Benninger, B. Combettes, G. Kleiber,
J.-C. Pellat, C. Schnedecker, A. Theissen
Comité scientifique : J.-C. Anscombre (CNRS, LLI), A.-M.
Berthonneau (Lille III), B. Combettes (Nancy II), J.H. Deulofeu (Aix en
Provence), N. Flaux (Arras), C. Guimier (Caen), M. Herslund
(Copenhague), J. Jayez (Lyon), G. Kleiber (Strasbourg II), L. Kupferman
(Tel Aviv), R. Martin (Paris IV), L. Mélis (Leuven), M.A. Morel (Paris
III), C. Muller (Bordeaux), H. Nølke (Aarhus), D. Paillard (CNRS),
M.-P. Péry-Woodley (Toulouse), M. Riegel (Strasbourg II), R. Sock
(Strasbourg II), I. Tamba (EHESS), S. Vogeleer (Bruxelles), M. Wilmet
(Bruxelles)
*******************************************************************************************
E. Nos thèses : passées et futuresŠ
Modèles a posteriori de la forme et de l'apparence des lèvres pour la
reconnaissance automatique de la parole audiovisuelle
Auteur : Philippe DAUBIAS
Thèse soutenue le jeudi 5 décembre 2002 pour obtenir le titre de
docteur en informatique de l'Université du Maine.
Jury : Bernard PEROCHE (Professeur, LIRIS, Lyon) Président Régine
ANDRE-OBRECHT (Professeur, IRIT, Toulouse) Rapporteur Marinette REVENU
(Professeur, GREYC, Caen) Rapporteur Jean-Luc SCHWARTZ (Directeur de
Recherche, ICP, Grenoble) Examinateur Paul DELEGLISE (Professeur, LIUM,
Le Mans) Examinateur, Directeur de Thèse
Mots Clés: Reconnaissance de parole audiovisuelle, construction de
corpus audiovisuels, étiquetage automatique de formes, modèle des
lèvres.
Résumé de la thèse : Dans cette thèse, nous présentons nos travaux sur
l'extraction de paramètres visuels à l'aide de modèles des lèvres en
vue de l'utilisation de la reconnaissance automatique de la parole
audiovisuelle dans des environnements peu contraints, dans des
conditions que nous qualifions de naturelles.
Plus précisément, nous décrivons les modèles a
posteriori, c'est-à-dire appris à partir de corpus, de la
forme et de l'apparence des lèvres que nous proposons d'utiliser. Ces
modèles nécessitent pour leur entraînement que les lèvres soient
facilement repérables sur les images, ce qui n'est pas le cas dans des
conditions naturelles. Plutôt que de recourir à un
étiquetage manuel des images, coûteux en temps de manipulation et
difficile à réaliser sur des corpus de grande taille, nous proposons
des méthodes automatiques basées sur l'utilisation du maquillage et de
la bimodalité de la parole.
Dans un premier temps, suite à une étude bibliographique approfondie
des travaux du domaine, nous avons défini un modèle de la forme,
constitué de deux polygones décrivant les contours interne et externe
des lèvres pour permettre d'extraire l'essentiel des informations
utilisées pour la reconnaissance automatique de la parole
audiovisuelle. Pour l'entraîner, nous utilisons des séquences où les
locuteurs ont les lèvres maquillées en bleu, ce qui permet d'extraire
facilement le contour des lèvres, pour en apprendre statistiquement la
forme moyenne et les déformations.
Dans un second temps nous avons étudié le modèle de l'apparence, qui
nécessite un apprentissage supervisé, et ne peut être entraîné que sur
des images naturelles. Sur ces images, la localisation
automatique des lèvres sans contrainte supplémentaire reste un problème
non résolu. Pour réussir cet étiquetage sans intervention manuelle,
nous utilisons deux répétitions d'une même phrase par le même locuteur,
avec et sans maquillage bleu sur les lèvres. La séquence d'images
maquillées permet d'extraire de façon automatique le contour des lèvres
et l'alignement par programmation dynamique des informations
acoustiques associées aux deux séquences permet d'estimer la forme des
lèvres sur une image naturelle, à partir des formes
extraites sur les images avec maquillage. Avec cet alignement, nous
réussissons à étiqueter les images naturelles avec une
précision suffisante pour entraîner un modèle d'apparence de façon
totalement automatique.
Le modèle d'apparence automatique obtenu après
entraînement est très proche du modèle obtenu en entraînant le même
modèle initial à l'aide d'images étiquetées manuellement et se révèle,
selon nos mesures, très supérieur aux modèles d'apparence de la
littérature qui utilisent généralement la teinte. Le modèle d'apparence
que nous construisons possède de plus l'avantage par rapport aux
approches a priori, d'être adaptable à tout locuteur.
La méthode utilisant l'alignement par l'acoustique que nous proposons
permet ainsi d'envisager de créer des corpus de parole audiovisuelle de
grande taille et d'en étiqueter la partie visuelle en repérant les
lèvres de façon fiable et automatique. Cette création d'un corpus de
grande taille est particulièrement importante pour la recherche dans le
domaine de la parole audiovisuelle, car elle permettrait aux modèles
d'intégration des informations acoustiques et visuelles d'être testés
sur des volumes de données significatifs. De plus, des corpus de grande
taille permettraient d'avoir suffisamment de données pour estimer les
nombreux paramètres des modèles dans les approches probabilistes.
Enfin, nos modèles des lèvres pourraient également servir à
l'extraction du contour des lèvres du locuteur, dans une application de
reconnaissance de parole audiovisuelle, mais il faudrait pour cela
opérer des optimisations afin de rendre nos modèles fonctionnels en
temps réel.
Contact : philippe.daubias@lium.univ-lemans.fr
<http://www710.univ-lyon1.fr/~pdaubias/>
http://www710.univ-lyon1.fr/~pdaubias/
*************************************************************************
Soutenance de thèse de Laurent Blin
Jeudi 19 décembre 2002 à 14h30
IRISA- ENSSAT, Lannion
Apprentissage de structures d'arbres à partir d'exemples ;
application à la prosodie pour la synthèse de la parole.
Composition du jury :
- Jean-Sylvain Liénard, LIMSI, Paris (Rapporteur)
- Patti Price, PPRICE SLT, Menlo Park, CA, USA (Rapporteur)
- François Yvon, ENST, Paris
- Marie-Odile Cordier, IRISA (Dream), Rennes
- Thierry Moudenc, France Télécom R&D, Lannion
- Laurent Miclet, ENSSAT/IRISA (Cordial), Lannion (Directeur de Thèse)
Résumé :
Cette thèse présente une nouvelle approche de génération de la
prosodie pour la synthèse de la parole. Son originalité réside
dans la définition de représentations arborescentes des énoncés
et l'utilisation de mesures de similarité entre ces structures.
En utilisant une base de phrases ainsi modélisées et annotées,
la prosodie d'un nouvel énoncé est générée par un apprentissage
par plus proche voisin en utilisant celle du candidat à plus
faible distance. Cette approche constitue une alternative aux
modèles utilisés couramment pour la génération de prosodie
(arbres de décision, réseaux neuronaux, etc.) qui nécessitent
une mise à plat des énoncés et l'étude locale des propriétés
de leurs composants. Ces travaux se sont attachés à étudier plusieurs
configurations
expérimentales. Deux types de structures arborescentes ont été
utilisées : une représentation syntaxique classique et une
représentation par «structure de performance», divisant un
énoncé en groupes accentuels et intonatifs, et ainsi plus
proche de la réalité prosodique des phrases. L'influence
d'une construction automatique de ces structures a en outre
été testée.
Deux algorithmes de calcul de distance entre arbres ont
également été employés. Fondés sur des opérateurs d'édition
entre noeuds, chacun possède des propriétés particulières
offrant différents critères structurels de sélection pour
une prédiction par plus proche voisin.
Les bases d'une génération de la prosodie par analogie ont
également été posées, enrichissant l'approche pour les cas
où les cas où l'apprentissage par plus proche voisin est
insuffisant.
Ces travaux ont été effectués sur une portion du Boston
University Radio News Corpus et se sont intéressés à la
prédiction d'étiquettes ToBI sur des énoncés en anglais
américain. Une comparaison avec les résultats du système
Anglovoc de France Télécom R&D sur les mêmes données a
également été menée.
************************************************************************
Soutenance de la thèse de Hélène François
Le mercredi 18 décembre 2002 à 14h30 à l'IRISA-Enssat (Lannion)
"Synthèse de la parole par concaténation d'unités acoustiques:
construction et exploitation d'une base de parole continue".
--- Membres du Jury:
- Christophe d'Alessandro, LIMSI, Paris (Rapporteur)
- Jan van Santen, OGI/OHSU/CSLU, Portland OR, USA (Rapporteur)
- Laurent Miclet, ENSSAT/IRISA (Cordial), Lannion (Directeur de thèse)
- Olivier Boëffard, ENSSAT/IRISA (Cordial), Lannion (Co-Directeur de
thèse)
- Daniel Luzzati, LIUM, Université du Maine, Le Mans
- Olivier Ridoux, IRISA (Lande), Rennes
- Paul Bagshaw, France Telecom R&D, Rennes
--- Résumé:
Ces travaux s'inscrivent dans le cadre de la synthèse de la parole par
concaténation d'unités acoustiques, ces unités étant de taille
variable
et multi-représentées. Pour remédier à l'hétérogénéité de la qualité
et
de l'intelligibilité des voix obtenues par ces méthodes, nous
travaillons avec une base de parole continue, qui est un jeu de
phrases
naturelles.
Cette base doit satisfaire des critères spécifiques pour être riche au
niveau linguistique. Sa construction est vue sous la forme d'un
problème
de recouvrement minimal d'ensemble, problème NP-complet. Trois
méthodes
sont approfondies: les méthodes gloutonne, cracheuse et d'échange par
paire, qui condensent des corpus d'environ 100000 phrases à 5000
phrases
en conservant leur richesse linguistique.
Ensuite nous procédons à l'exploitation de ce type de base. Nous
considérons 10 phrases de test, et recherchons dans un corpus
spécifique
l'ensemble des séquences d'unités acoustiques permettant la synthèse
de
ces phrases. Pour chaque séquence trouvée, nous évaluons sa qualité de
façon objective en mesurant sa distance acoustique à une référence
naturelle. Une version minimale de la méthode PSOLA a été utilisée
pour
concaténer les unités d'une séquence, sans modification de prosodie
pour
le moment. La qualification objective et exhaustive des séquences nous
permet de mesurer des critères de sélection d'unités, connus ou non.
Ces travaux contribuent ainsi à l'élaboration de spécifications pour
la
construction de bases ``génératives'' qui permettent à la fois
d'améliorer la qualité de la parole en général et d'offrir plus de
variabilité en sortie; cela permet aussi de caractériser ces bases, de
développer de nouvelles méthodes de sélection d'unités et de les
évaluer.
***************************************************************************
F. POSTE DE PROFESSEUR DE PHONETIQUE - BESANçON,
Université de Franche-Comté (poste G. Konopczynski) est vacant à ce
mouvement. Le profil publié au JO du 20/02/03 est" phonétique "
PROFIL : PHONETIQUE ACOUSTIQUE, PROSODIE.
Les cours de phonétique s'adressent à plusieurs types
d'étudiants :
- DEUG Lettres et Sciences du lange : environ 70, communication orale
et non verbale
- tronc commun de la licence de Sciences du Langage, cours de
phonétique et phonologie CM et TD : environ130 inscrits
- module de licence Phonétique et Acquisition du langage
environ 90 inscrits (CM et TD)
- module très spécialisé de phonétique instrumentale, niveau licence
environ 60 inscrits (CM et TD)
- module de maîtrise de sciences du langage, spécialisation prosodie
entre 15 et 20 inscrits
- étudiants du DEA de Sciences du langage, Sémiotique, FLE,
tronc commun obligatoire 19h
module optionnel : L'oral des langues, environ 15 inscrits, 25h. ,
PROFIL FORMATION
L'enseignant retenu devra en priorité assurer des cours de
phonétique
générale, comparative et surtout acoustique de la parole. Les cours
de maîtrise et de DEA dans ce domaine sont capitaux. Il est
indispensable que sa formation lui permette non seulement de prendre
en charge la formation expérimentale des étudiants, avec les
techniques acoustiques et informatiques disponibles actuellement,
mais également d'évoluer aussi rapidement que le fait en ce moment
notre discipline et donc d'être constamment au courant des techniques
contemporaines de traitement du son, particulièrement en prosodie.
Il devra également s'intéresser à la didactique du FLE, aspects
phonétiques, car une part importante des étudiants sont inscrits en
section FLE, à laquelle l'enseignant appartiendra.
PROFIL RECHERCHE
Par ses activités de recherche, l'enseignant devra pouvoir
s'intégrer
dans l'équipe labellisée LaSELDI ( Laboratoire de sémiologie,
linguistique, didactique, informatique) car le laboratoire de
phonétique est le seul spécialisé dans le domaine de l'oral, et bien
des collègues font appel aux compétences de l'enseignant pour
co-dirige des DEA et thèses où la prosodie de l'oral occupe une part
importante. Il devra pouvoir suivre des travaux en prosodie de l'oral
( grands corpus) essentiellement, en socio-phonétique, représentaions
langagières, etc. Enfin, il devra pouvoir intégrer un programme de
recherche du Ministère de la Culture sur les aspects cognitifs de
l'apprentissage des langues. Il sera bien entendu responsable du
Laboratoire de Phonétique (qui dispose d'une bonne infrastructure),
du choix de l'appareillage et des logiciels spécifiques, etc.
Prof. G. Konopczynski
Directeur du département LSL le 6/9/2001, profil confirmé
en septembre 2002 et le 1/03/03
Professeur émérite Gabrielle KONOPCZYNSKI
Directeur du Laboratoire de Phonétique
Faculté des Lettres
30, rue Mégevand
F 25030 BESANCON-Cedex
tél.33.3.81.66.53.96
Fax 33.3. 81.66.53.00
gkonop@niv-fcomte.fr
http://granvelle.univ-fcomte.fr/~gkonop
************************************************
G. Humour ?
Le Monde appartient-il à ceux qui ont le veto ?
****************************************************************
**************************************************
**************************************************
Rudolph Sock
Institut de Phonetique de Strasbourg
IPS - Equipe d'Accueil 3403
Universite Marc Bloch
22, rue Descartes
67084 Strasbourg
FRANCE
Tel. + (33) 3 88 41 73 68
Fax + (33) 3 88 41 73 69
+++++++++++++++++++++++++++++++++++++++++
Home: 23, rue de l'Ancienne Eglise
67076 Gambsheim
Tel + (33) 3 88 96 97 67