Subject:

From: "R. Sock, Institut de Phonetique de Strasbourg"

Date: Thu, 13 Mar 2003 12:01:17 +0100

To: parole@listes.univ-avignon.fr

Bonjour,
Bienvenue sur " PAROLE ", le lien de la Communauté Francophone de la Communication Parlée. Elle est gérée par l'Association Francophone de la Communication Parlée (AFCP) et a pour but de permettre la circulation d'informations importantes relatives à notre communauté. Vous pouvez donc m'envoyer vos " Nouvelles Brèves " (annonces de conférences, séminaires, thèses, appels d'offres, offres d'emploiŠ) en vue de la prochaine édition (mi avril 2003).

Par ailleurs, permettez-moi de vous annoncer que les prochaines Journées d'Etudes sur la Parole (JEP 2004) seront confiées au Laboratoire Parole et Langage - LPL, de l'Université de Provence, pour une co-organisation avec TALN, à Fès (MAROC).

Toutes les informations concernant ces JEP seront tres prochainement disponibles sur le site de l'Association (www.afcp-parole.org).!!!

*******************************************************************
SOMMAIRE :

A. LE NOUVEAU BUREAU DE L'AFCP
B. ASSOCIATION CHRISTIAN BENOÎT et PRIX CHRISTIAN BENOÎT
C. APPEL À COmmunications RIA
D. APPEL A COMMUNICATION : La partition en langue et en discours
E. NOS THESES : PASSEES ET FUTURESŠ
F. POSTE DE PROFESSEUR DE PHONETIQUE
G. HUMOUR ?

*******************************************************************

A. Le nouveau Bureau de l'AFCP est composé de :
Président, Jean-François BONASTRE
Vice-Président, Pascal PERRIER
Trésorier, François PELLEGRINO
Secrétaire, Laurent BESACIER
Secrétaire adjointe, Cécile FOUGERON

*****************************************************************************
B. ASSOCIATION CHRISTIAN BENOÎT et PRIX CHRISTIAN BENOÎT

Association Christian Benoît

L'Association Christian Benoît est une association à but non lucratif. L'objet de l'association est de permettre le développement de projets de recherche dans le domaine de la communication parlée. Elle est créée en l'honneur de Christian Benoît, chercheur au CNRS dans le domaine de la communication parlée, décédé le 26 avril 1998 à 41 ans.

L'association essaiera d'atteindre ses objectifs:
… en contribuant, sous la forme d'un prix appelé "Prix Christian Benoît pour la promotion de la recherche en communication parlée", au financement de la promotion d'un projet de recherche présenté à titre individuel par un chercheur, de quelque nationalité qu'il soit, afin d'aider ce chercheur à trouver les moyens logistiques nécessaires à la réalisation de son projet.
… en organisant des sessions de formation ou des rencontres scientifiques sur le thème de la communication parlée.

Le Bureau de l'Association est composé de :
Jean-Luc Schwartz (Directeur de l'ICP) : Président
Frédéric Bimbot (Bureau d'ESCA): Vice-Président
Gérard Bailly : Trésorier
Pascal Perrier : Secrétaire
Marcelle Benoît
Eric Vatikiotis-Bateson (Bureau d'AVISA)

Pour soutenir cette action, vous pouvez devenir membre de l'Association Christian Benoît. Pour cela il suffit d'en manifester l'intention sur papier libre, en stipulant vos noms et adresse, et d'envoyer ce courrier avec votre cotisation au trésorier de l'association (Gérard Bailly, ICP, INPG, 46 Av. Félix-Viallet, 38031 Grenoble Cedex 1, France / Chèques à l'ordre de Association Christian Benoît).
Les cotisations sont fixées à : 15 Euros pour un membre actif, 45 Euros et plus pour un membre bienfaiteur.

Association Christian Benoît

The Association Christian Benoît is a nonprofit organization. The purpose of the association is to facilitate the development of research projects in the field of speech communication. The association has been created in honor of Christian Benoît, CNRS researcher in the field of speech communication, who died on the 26th of April, 1998, at the age of 41.

The association will pursue its purpose by:
… contributing, through the "Christian Benoît Award for the promotion of speech communication research", to the financial support of a research project presented individually by a researcher of any nationality, in order to help this researcher to find the logistic means necessary for the realization of his/her project.
… organizing training sessions or scientific meetings on the theme of speech communication.

The association board is made up of :
Jean-Luc Schwartz (ICP's Head): President
Frédéric Bimbot (ESCA board): Vice-President
Gérard Bailly : Treasurer
Pascal Perrier : Secretary
Marcelle Benoît
Eric Vatikiotis-Bateson (AVISA Board)

To support this organization, you can become a member of the Association Christian Benoît. For that you simply should write a letter with your name and address, and send the letter together with your registration fee to the association treasurer (Gérard Bailly, ICP, INPG, 46 Av. Félix-Viallet, 38031 Grenoble Cedex 1, France).
Fees are fixed at: 15 Euros for active member status, 45 Euros or more for benefactor status.

Prix Christian Benoît

Le prix Christian Benoît est délivré par l'Association Christian Benoît en mémoire de Christian Benoît. Il sera attribué à un chercheur dont la thèse et le travail de recherche se situent dans le domaine de la Communication Parlée, afin de l'aider à réaliser un produit multimedia pour faire connaître et valoriser sa recherche. On privilégiera les dossiers émanant de chercheurs ayant obtenu leur thèse au cours des 5 années précédant la clôture du dépôt de candidature. Le bénéficiaire du prix s'engagera à réaliser un site web décrivant ses recherches et ses perspectives, ainsi qu'un support matériel du type CDROM, DVD ou cassette vidéo . La sélection sera effectuée par le Comité Scientifique de l'Association, nommé par le bureau. Le montant de ce prix est de 7625 Euros .

Chaque candidat devra envoyer au secrétaire de l'association un exemplaire du manuscrit de thèse, ainsi que 10 exemplaires d'un dossier d'une dizaine de pages (en français ou en anglais) comprenant un CV, une liste des publications, un résumé des travaux, une description du projet scientifique et une description du projet de réalisation multimedia.

Le comité scientifique est composé de :
Christian Abry (ICP Grenoble) Paul Bertelson (LPE, UL Bruxelles) Frédéric Bimbot (ESCA, IRISA, Rennes) Denis Burnham (UNSW, Sydney)
Jean-Luc Schwartz (Pdt de l'Association Christian Benoît) Dominic Massaro (UCSC, Santa Cruz)
Philip Rubin (Président d'AVISA, Haskins Lab., New Haven) Marney Smyth (MIT Press, Cambridge)
Rudolph Sock (AFCP - IPS Strasbourg) Eric Vatikiotis-Bateson (ATR, Kyoto)

Christian Benoît Award

The Christian Benoît Award is one of the actions that the Association Christian Benoît has set up in memory of Christian Benoît. It will be attributed to a doctoral graduate whose PhD and further scientific project is in the Speech Communication domain. The purpose of the award is to provide financial support for the development of a multi-media product promoting his/her work. Preference will be given to scientists whose thesis was awarded within the five years prior to the application deadline. The commitment of the successful applicant will involve building a web-site describing his/her past research and his/her scientific project, together with a hardware product such as a CDROM, a DVD or a Videotape1. The Award will be attributed following a selection process overseen by the Scientific Committee, which will be appointed by the board of the Association Christian Benoît. The value of the Award is 7625 Euros 2.

Candidates should forward their application to the Secretary of the Association3. The application should consist of a copy of the thesis manuscript, together with 10 copies of a dossier (around 10 pages, in French or in English) containing a biographical sketch, a list of publications, a summary of past scientific work, and a description of the scientific project and of the multimedia project.

The Scientific Committee is made up of:
Christian Abry (ICP Grenoble) Paul Bertelson (LPE, UL Bruxelles) Frédéric Bimbot (ESCA, IRISA, Rennes) Denis Burnham (UNSW, Sydney)
Jean-Luc Schwartz (Pdt of the Association Christian Benoît) Dominic Massaro (UCSC, Santa Cruz)
Philip Rubin (President of AVISA, Haskins Lab., New Haven) Marney Smyth (MIT Press, Cambridge)
Rudolph Sock (GFCP-SFA, IP Strasbourg) Eric Vatikiotis-Bateson (ATR, Kyoto)

***************************************************************************************

C. APPEL À COmmunications RIA - Revue d'Intelligence Artificielle (Édition Hermes)
NUMÉRO SPÉCIAL sur la présentation d'information "sur mesure" incluant les documents virtuels personnalisés ainsi que les interfaces adaptatives
***************************************************************************

Éditeurs du Numéro Spécial:
Cécile Paris, CSIRO - Mathematical and Information Sciences, Australia Nathalie Colineau, CSIRO - Mathematical and Information Sciences, Australia

Présentation: -
Devant le flot d'information toujours croissant, un certain nombre de services et/ou systèmes personnalisés ont fait leur apparition. Produit du marché ou de la recherche, la problématique du « contenu sur mesure » pose de nombreux problèmes de recherche et implique des techniques de plus en plus sophistiquées.
Ce numéro spécial sera consacré à la présentation d'information adaptée à l'utilisateur (incluant à la fois les documents virtuels personnalisés et les interfaces adaptatives). Les travaux relatifs à cette thématique mettent en oeuvre des techniques de filtrage et d'extraction d'information issue de sources hétégorènes, ainsi que des mécanismes permettant d'organiser et d'assembler le contenu à présenter. Ils reposent entre autres sur une caractérisation des données, une modélisation de l'utilisateur, de sa tâche et de son besoin d'information, ainsi que sur des principes de cohérence discursive.
L'objectif de ce numéro spécial est de présenter les recherches actuelles et de couvrir les différentes problématiques rencontrées par les systèmes proposant un contenu taillé « sur mesure ». Les soumissions pourront porter sur les aspects incluant: Domaines d'Application et systèmes ; Modèles, Techniques et Outils ; Principes, Représentations et Techniques de composition ; Évaluation; et Perspectives et Tendances Futures.
Soumission des articles: Les auteurs sont invités à soumettre des travaux de recherche originaux, n'ayant pas fait l'objet de publications antérieures ni simultanées. Les soumissions seront examinées par au moins deux spécialistes du domaine. Les articles pourront être en français comme en anglais. Nous attendons des soumissions d'une vingtaine de pages environ. Pour des informations complémentaires concernant les instructions aux auteurs, se reporter au site Internet de la revue : <http://ria.e-revues.com/auteurs.jsp> http://ria.e-revues.com/auteurs.jsp <<http://ria.e-revues.com/acceuil.jsp> http://ria.e-revues.com/acceuil.jsp>
Les soumissions devront parvenir aux éditeurs de ce numéro spécial, sous la forme d'un document attaché (fichiers word, ps ou pdf au format A4), par courrier électronique, adressées à nathalie.colineau@csiro.au <<mailto:nathalie.colineau@csiro.au> mailto:nathalie.colineau@csiro.au>
Dates Importantes:
30 mai 2003: Date limite de soumission
15 septembre 2003:Notification aux auteurs
31 octobre 2003: Réception des papiers finaux
Le numéro spécial devrait être publié en décembre 2003.

Comité de programme: Elisabeth André, Université d'Augsburg, Allemagne Jean-Yves Antoine, VALORIA - Université de Bretagne-sud, France Michel Beaudoin-Lafon, LRI - Université Paris-Sud, France Paul De Bra, Université de Technologie d'Eindhoven, Les Pays-Bas Patrick Brézillon, LIP6 - Université Paris 6, France Marie-France Bruandet, CLIPS - IMAG, France Peter Brusilovsky, Université de Pittsburgh, USA Gaëlle Calvary, CLIPS - IMAG, France Kathy Mc Coy, Université de Delaware, USA Robert Dale, Université de Macquarie, Australie Tony Hartley, Université de Leeds, Angleterre Daniele Hérin, LIRMM - Université de Montpellier II, France Richard Kittredge, CoGenTex, USA Guy Lapalme, Université de Montréal, Canada Philippe Lenca, ENST Bretagne, France Mark Maybury, MITRE Corporation, USA Alain Mille, LISI -Université de Lyon 1, France Catherine Pelachaud, Université de Rome "La Sapienza", Italie Jean-Marie Pierrel, LORIA, France Fiorella de Rosis, Université de Bari, Italie Ehud Reiter, Université d'Aberdeen, Ecosse Gérard Sabah, LIMSI, France Oliviero Stock, ICT - IRST, Italie Peter Stockinger, ESCoM - MSH, France Jacques Siroux, IRISA - Université de Rennes 1, France André Tricot, CERFI - Université de Toulouse-le-Mirail, France Keith Vander Linden, Calvin College, USA
************************ ENGLISH VERSION **************************

*************************************************************************** Call for papers RIA - (Revue d'Intelligence Artificielle) "Artificial Intelligence Review" (Hermes Publisher)
Special Issue on
Tailored Information Delivery including both Tailored Virtual Documents and Tailored Displays
***************************************************************************

----------------------------- Special issue Editors: ----------------------------- Cécile Paris, CSIRO - Mathematical and Information Sciences, Australia Nathalie Colineau, CSIRO - Mathematical and Information Sciences, Australia
-------------- Overview: -------------- As an increasing amount of information becomes available, the number of systems and services that deliver customised information on a variety of media have increased. To be able to answer the user's information needs, these systems must address a wide range of issues and deploy increasingly sophisticated techniques.
This special issue is concerned with Tailored Information Delivery (including both Tailored Virtual Documents and Tailored Displays). The objective of this special issue is to present research on systems that deliver information relevant to users in the context of a task or an information need, using techniques to filter and extract information from heterogeneous sources, and mechanisms to organise and integrate the content to be presented. Research in this domain is typically based on a characterisation of the data (size, modality, media), the users, their tasks and information needs, and coherence or narrative principles.
This special issue aims at encompassing work on current applications, methodologies, techniques and evaluations related to this research problem. We thus seek submissions related to the following: - Application Domains and systems; - Models, Techniques and Tools; - Principles, Representation Issues, and Integration and Layout Techniques; - Evaluation; and, - Perspectives and Future Trends.
--------------------------- Submission Details: --------------------------- We will be seeking full papers describing original and unpublished research that are not simultaneously submitted for publication elsewhere. The papers may be written in either French and English. We expect papers to be about 20 pages long, in the format described in the instructions for authors (please refer to the Journal web site: <http://ria.e-revues.com/auteurs.jsp> http://ria.e-revues.com/auteurs.jsp <<http://ria.e-revues.com/acceuil.jsp> http://ria.e-revues.com/acceuil.jsp>) Papers will be reviewed by at least two expert reviewers.
The paper should be sent as an attached document (word, ps or pdf file, format A4) and emailed to nathalie.colineau@csiro.au <<mailto:nathalie.colineau@csiro.au> mailto:nathalie.colineau@csiro.au>.
---------------------- Important Dates: ---------------------- May 30, 2003: Submission Deadline September 15, 2003: Author Notification October 31, 2003: Camera-ready Paper Submission
The Special Issue is expected to be published in December 2003. RIA is a main AI journal in France.
--------------------------------------------- International Program Committee: --------------------------------------------- Elisabeth André, Augsburg University, Germany Jean-Yves Antoine, VALORIA, France Michel Beaudoin-Lafon, LRI - Paris-Sud University, France Paul De Bra, Eindhoven University of Technology, The Netherlands Patrick Brézillon, LIP6 - Paris 6 University, France Marie-France Bruandet, CLIPS - IMAG, France Peter Brusilovsky, University of Pittsburgh, USA Gaëlle Calvary, CLIPS - IMAG, France Kathy Mc Coy, University of Delaware, USA Robert Dale, Macquarie University, Australia Tony Hartley, University of Leeds, United Kingdom Daniele Hérin, LIRMM - University of Montpellier II, France Richard Kittredge, CoGenTex, USA Guy Lapalme, Montreal University, Canada Philippe Lenca, ENST Bretagne, France Mark Maybury, MITRE Corporation, USA Alain Mille, LISI - Lyon 1 University, France Catherine Pelachaud, "La Sapienza" University, Italy Jean-Marie Pierrel, LORIA, France Fiorella de Rosis, University of Bari, Italy Ehud Reiter, University of Aberdeen, Scotland Gérard Sabah, LIMSI, France Oliviero Stock, ICT - IRST, Italy Peter Stockinger, ESCoM - MSH, France Jacques Siroux, IRISA - Rennes 1 University, France André Tricot, CERFI - University of Toulouse-le-Mirail, France Keith Vander Linden, Calvin College, USA
---------------------------------------------------------------------- Nathalie Colineau Research Scientist CSIRO - Mathematical and Information Sciences Intelligent Interactive Technology Locked Bag 17, North Ryde NSW 1670, Australia Phone: +61 2 9325 3151 Fax: +61 2 9325 3200
----------------------------------------------------------------------- --
Jérôme Goulian
IUT Vannes - Dpt Informatique VALORIA Université de Bretagne Sud
8 Rue Montaigne 56000 VANNES Tohannic - Rue Yves Mainguy
tel: 02.97.46.31.71 02.97.01.72.13

********************************************************************

D. 1er APPEL A COMMUNICATION

Colloque international
Strasbourg, Université Marc Bloch, 6-8 novembre 2003

La partition en langue et en discours

Il existe une abondante littérature consacrée à la relation partie/tout, abordée principalement sous l'angle de la sémantique lexicale (relation dite de méronymie/partonymie) ou sous celui des configurations discursives que constituent notamment les anaphores associatives (Nous entrâmes dans un village. L'égliseŠ). Quant à l'opération de partition, elle est généralement abordée avec la question des quantificateurs (p.e. dans la théorie des quantificateurs généralisés) qui délimitent, entre autres, des ensembles d'ensembles.
Sans exclure ces aspects, le colloque accueille toutes les contributions, portant sur le français ou sur d'autres langues, susceptibles de répondre aux questions suivantes :
- comment définir la relation de partition en langue, en discours ?
- quel rapport existe-t-il entre partition et quantification ?
- quelles sont les formes, les structures exprimant la partition aux différents niveaux de l'analyse linguistique (morphologie, lexique, syntaxe, discours, etcŠ ?
- quelle évolution et quels processus de grammaticalisation ces outils ont-ils connus au fil du temps ?
- quelle définition opératoire donner dans la langue et la métalangue à des noms tels que totalité/tout/ensemble/groupe/classe/collection, Š ; part/partie/portion, etc. ;
- quelle a été la productivité lexicale de ces unités dans la constitution d'autres formes exprimant la partition (part : à part Paul, personne n'avait faim, de part en part, quelque part, etc.) ?

La durée des exposés est de 35 mn (discussion comprise)
La publication des actes est prévue.

Calendrier :
Proposition de communication : à envoyer pour le 15 avril 2003
Les propositions sont à envoyer à : Colloque.Partition@umb.u-strasbg.fr
- Le nom, le prénom, l'affiliation et le titre de la communication seront sur une page à part
- Sur une 1 page max. figureront le titre, l'argumentaire, les exemples et les références bibliographiques
Notification d'acceptation : 15 juin 2003
Comité d'organisation : C. Benninger, B. Combettes, G. Kleiber, J.-C. Pellat, C. Schnedecker, A. Theissen
Comité scientifique : J.-C. Anscombre (CNRS, LLI), A.-M. Berthonneau (Lille III), B. Combettes (Nancy II), J.H. Deulofeu (Aix en Provence), N. Flaux (Arras), C. Guimier (Caen), M. Herslund (Copenhague), J. Jayez (Lyon), G. Kleiber (Strasbourg II), L. Kupferman (Tel Aviv), R. Martin (Paris IV), L. Mélis (Leuven), M.A. Morel (Paris III), C. Muller (Bordeaux), H. Nølke (Aarhus), D. Paillard (CNRS), M.-P. Péry-Woodley (Toulouse), M. Riegel (Strasbourg II), R. Sock (Strasbourg II), I. Tamba (EHESS), S. Vogeleer (Bruxelles), M. Wilmet (Bruxelles)

*******************************************************************************************

E. Nos thèses : passées et futuresŠ

Modèles a posteriori de la forme et de l'apparence des lèvres pour la reconnaissance automatique de la parole audiovisuelle

Auteur : Philippe DAUBIAS
Thèse soutenue le jeudi 5 décembre 2002 pour obtenir le titre de docteur en informatique de l'Université du Maine.
Jury : Bernard PEROCHE (Professeur, LIRIS, Lyon) Président Régine ANDRE-OBRECHT (Professeur, IRIT, Toulouse) Rapporteur Marinette REVENU (Professeur, GREYC, Caen) Rapporteur Jean-Luc SCHWARTZ (Directeur de Recherche, ICP, Grenoble) Examinateur Paul DELEGLISE (Professeur, LIUM, Le Mans) Examinateur, Directeur de Thèse
Mots Clés: Reconnaissance de parole audiovisuelle, construction de corpus audiovisuels, étiquetage automatique de formes, modèle des lèvres.
Résumé de la thèse : Dans cette thèse, nous présentons nos travaux sur l'extraction de paramètres visuels à l'aide de modèles des lèvres en vue de l'utilisation de la reconnaissance automatique de la parole audiovisuelle dans des environnements peu contraints, dans des conditions que nous qualifions de naturelles.
Plus précisément, nous décrivons les modèles a posteriori, c'est-à-dire appris à partir de corpus, de la forme et de l'apparence des lèvres que nous proposons d'utiliser. Ces modèles nécessitent pour leur entraînement que les lèvres soient facilement repérables sur les images, ce qui n'est pas le cas dans des conditions naturelles. Plutôt que de recourir à un étiquetage manuel des images, coûteux en temps de manipulation et difficile à réaliser sur des corpus de grande taille, nous proposons des méthodes automatiques basées sur l'utilisation du maquillage et de la bimodalité de la parole.
Dans un premier temps, suite à une étude bibliographique approfondie des travaux du domaine, nous avons défini un modèle de la forme, constitué de deux polygones décrivant les contours interne et externe des lèvres pour permettre d'extraire l'essentiel des informations utilisées pour la reconnaissance automatique de la parole audiovisuelle. Pour l'entraîner, nous utilisons des séquences où les locuteurs ont les lèvres maquillées en bleu, ce qui permet d'extraire facilement le contour des lèvres, pour en apprendre statistiquement la forme moyenne et les déformations.
Dans un second temps nous avons étudié le modèle de l'apparence, qui nécessite un apprentissage supervisé, et ne peut être entraîné que sur des images naturelles. Sur ces images, la localisation automatique des lèvres sans contrainte supplémentaire reste un problème non résolu. Pour réussir cet étiquetage sans intervention manuelle, nous utilisons deux répétitions d'une même phrase par le même locuteur, avec et sans maquillage bleu sur les lèvres. La séquence d'images maquillées permet d'extraire de façon automatique le contour des lèvres et l'alignement par programmation dynamique des informations acoustiques associées aux deux séquences permet d'estimer la forme des lèvres sur une image naturelle, à partir des formes extraites sur les images avec maquillage. Avec cet alignement, nous réussissons à étiqueter les images naturelles avec une précision suffisante pour entraîner un modèle d'apparence de façon totalement automatique.
Le modèle d'apparence automatique obtenu après entraînement est très proche du modèle obtenu en entraînant le même modèle initial à l'aide d'images étiquetées manuellement et se révèle, selon nos mesures, très supérieur aux modèles d'apparence de la littérature qui utilisent généralement la teinte. Le modèle d'apparence que nous construisons possède de plus l'avantage par rapport aux approches a priori, d'être adaptable à tout locuteur.

La méthode utilisant l'alignement par l'acoustique que nous proposons permet ainsi d'envisager de créer des corpus de parole audiovisuelle de grande taille et d'en étiqueter la partie visuelle en repérant les lèvres de façon fiable et automatique. Cette création d'un corpus de grande taille est particulièrement importante pour la recherche dans le domaine de la parole audiovisuelle, car elle permettrait aux modèles d'intégration des informations acoustiques et visuelles d'être testés sur des volumes de données significatifs. De plus, des corpus de grande taille permettraient d'avoir suffisamment de données pour estimer les nombreux paramètres des modèles dans les approches probabilistes. Enfin, nos modèles des lèvres pourraient également servir à l'extraction du contour des lèvres du locuteur, dans une application de reconnaissance de parole audiovisuelle, mais il faudrait pour cela opérer des optimisations afin de rendre nos modèles fonctionnels en temps réel.
Contact : philippe.daubias@lium.univ-lemans.fr <http://www710.univ-lyon1.fr/~pdaubias/> http://www710.univ-lyon1.fr/~pdaubias/
*************************************************************************

Soutenance de thèse de Laurent Blin
Jeudi 19 décembre 2002 à 14h30
IRISA- ENSSAT, Lannion

Apprentissage de structures d'arbres à partir d'exemples ;
application à la prosodie pour la synthèse de la parole.

Composition du jury :
- Jean-Sylvain Liénard, LIMSI, Paris (Rapporteur)
- Patti Price, PPRICE SLT, Menlo Park, CA, USA (Rapporteur)
- François Yvon, ENST, Paris
- Marie-Odile Cordier, IRISA (Dream), Rennes
- Thierry Moudenc, France Télécom R&D, Lannion
- Laurent Miclet, ENSSAT/IRISA (Cordial), Lannion (Directeur de Thèse)

Résumé :
Cette thèse présente une nouvelle approche de génération de la
prosodie pour la synthèse de la parole. Son originalité réside
dans la définition de représentations arborescentes des énoncés
et l'utilisation de mesures de similarité entre ces structures.
En utilisant une base de phrases ainsi modélisées et annotées,
la prosodie d'un nouvel énoncé est générée par un apprentissage
par plus proche voisin en utilisant celle du candidat à plus
faible distance. Cette approche constitue une alternative aux
modèles utilisés couramment pour la génération de prosodie
(arbres de décision, réseaux neuronaux, etc.) qui nécessitent
une mise à plat des énoncés et l'étude locale des propriétés
de leurs composants. Ces travaux se sont attachés à étudier plusieurs configurations
expérimentales. Deux types de structures arborescentes ont été
utilisées : une représentation syntaxique classique et une
représentation par «structure de performance», divisant un
énoncé en groupes accentuels et intonatifs, et ainsi plus
proche de la réalité prosodique des phrases. L'influence
d'une construction automatique de ces structures a en outre
été testée.
Deux algorithmes de calcul de distance entre arbres ont
également été employés. Fondés sur des opérateurs d'édition
entre noeuds, chacun possède des propriétés particulières
offrant différents critères structurels de sélection pour
une prédiction par plus proche voisin.
Les bases d'une génération de la prosodie par analogie ont
également été posées, enrichissant l'approche pour les cas
où les cas où l'apprentissage par plus proche voisin est
insuffisant.
Ces travaux ont été effectués sur une portion du Boston
University Radio News Corpus et se sont intéressés à la
prédiction d'étiquettes ToBI sur des énoncés en anglais
américain. Une comparaison avec les résultats du système
Anglovoc de France Télécom R&D sur les mêmes données a
également été menée.

************************************************************************

Soutenance de la thèse de Hélène François
Le mercredi 18 décembre 2002 à 14h30 à l'IRISA-Enssat (Lannion)

"Synthèse de la parole par concaténation d'unités acoustiques:
construction et exploitation d'une base de parole continue".

--- Membres du Jury:

- Christophe d'Alessandro, LIMSI, Paris (Rapporteur)
- Jan van Santen, OGI/OHSU/CSLU, Portland OR, USA (Rapporteur)
- Laurent Miclet, ENSSAT/IRISA (Cordial), Lannion (Directeur de thèse)
- Olivier Boëffard, ENSSAT/IRISA (Cordial), Lannion (Co-Directeur de
thèse)
- Daniel Luzzati, LIUM, Université du Maine, Le Mans
- Olivier Ridoux, IRISA (Lande), Rennes
- Paul Bagshaw, France Telecom R&D, Rennes

--- Résumé:

Ces travaux s'inscrivent dans le cadre de la synthèse de la parole par
concaténation d'unités acoustiques, ces unités étant de taille variable
et multi-représentées. Pour remédier à l'hétérogénéité de la qualité et
de l'intelligibilité des voix obtenues par ces méthodes, nous
travaillons avec une base de parole continue, qui est un jeu de phrases
naturelles.

Cette base doit satisfaire des critères spécifiques pour être riche au
niveau linguistique. Sa construction est vue sous la forme d'un problème
de recouvrement minimal d'ensemble, problème NP-complet. Trois méthodes
sont approfondies: les méthodes gloutonne, cracheuse et d'échange par
paire, qui condensent des corpus d'environ 100000 phrases à 5000 phrases
en conservant leur richesse linguistique.

Ensuite nous procédons à l'exploitation de ce type de base. Nous
considérons 10 phrases de test, et recherchons dans un corpus spécifique
l'ensemble des séquences d'unités acoustiques permettant la synthèse de
ces phrases. Pour chaque séquence trouvée, nous évaluons sa qualité de
façon objective en mesurant sa distance acoustique à une référence
naturelle. Une version minimale de la méthode PSOLA a été utilisée pour
concaténer les unités d'une séquence, sans modification de prosodie pour
le moment. La qualification objective et exhaustive des séquences nous
permet de mesurer des critères de sélection d'unités, connus ou non.

Ces travaux contribuent ainsi à l'élaboration de spécifications pour la
construction de bases ``génératives'' qui permettent à la fois
d'améliorer la qualité de la parole en général et d'offrir plus de
variabilité en sortie; cela permet aussi de caractériser ces bases, de
développer de nouvelles méthodes de sélection d'unités et de les
évaluer.

***************************************************************************

F. POSTE DE PROFESSEUR DE PHONETIQUE - BESANçON, Université de Franche-Comté (poste G. Konopczynski) est vacant à ce mouvement. Le profil publié au JO du 20/02/03 est" phonétique "

PROFIL : PHONETIQUE ACOUSTIQUE, PROSODIE.

Les cours de phonétique s'adressent à plusieurs types d'étudiants :
- DEUG Lettres et Sciences du lange : environ 70, communication orale
et non verbale
- tronc commun de la licence de Sciences du Langage, cours de
phonétique et phonologie CM et TD : environ130 inscrits
- module de licence Phonétique et Acquisition du langage
environ 90 inscrits (CM et TD)
- module très spécialisé de phonétique instrumentale, niveau licence
environ 60 inscrits (CM et TD)
- module de maîtrise de sciences du langage, spécialisation prosodie
entre 15 et 20 inscrits
- étudiants du DEA de Sciences du langage, Sémiotique, FLE,
tronc commun obligatoire 19h
module optionnel : L'oral des langues, environ 15 inscrits, 25h. ,

PROFIL FORMATION
L'enseignant retenu devra en priorité assurer des cours de phonétique
générale, comparative et surtout acoustique de la parole. Les cours
de maîtrise et de DEA dans ce domaine sont capitaux. Il est
indispensable que sa formation lui permette non seulement de prendre
en charge la formation expérimentale des étudiants, avec les
techniques acoustiques et informatiques disponibles actuellement,
mais également d'évoluer aussi rapidement que le fait en ce moment
notre discipline et donc d'être constamment au courant des techniques
contemporaines de traitement du son, particulièrement en prosodie.
Il devra également s'intéresser à la didactique du FLE, aspects
phonétiques, car une part importante des étudiants sont inscrits en
section FLE, à laquelle l'enseignant appartiendra.

PROFIL RECHERCHE
Par ses activités de recherche, l'enseignant devra pouvoir s'intégrer
dans l'équipe labellisée LaSELDI ( Laboratoire de sémiologie,
linguistique, didactique, informatique) car le laboratoire de
phonétique est le seul spécialisé dans le domaine de l'oral, et bien
des collègues font appel aux compétences de l'enseignant pour
co-dirige des DEA et thèses où la prosodie de l'oral occupe une part
importante. Il devra pouvoir suivre des travaux en prosodie de l'oral
( grands corpus) essentiellement, en socio-phonétique, représentaions
langagières, etc. Enfin, il devra pouvoir intégrer un programme de
recherche du Ministère de la Culture sur les aspects cognitifs de
l'apprentissage des langues. Il sera bien entendu responsable du
Laboratoire de Phonétique (qui dispose d'une bonne infrastructure),
du choix de l'appareillage et des logiciels spécifiques, etc.

Prof. G. Konopczynski
Directeur du département LSL le 6/9/2001, profil confirmé
en septembre 2002 et le 1/03/03

Professeur émérite Gabrielle KONOPCZYNSKI
Directeur du Laboratoire de Phonétique
Faculté des Lettres
30, rue Mégevand
F 25030 BESANCON-Cedex
tél.33.3.81.66.53.96
Fax 33.3. 81.66.53.00
gkonop@niv-fcomte.fr
http://granvelle.univ-fcomte.fr/~gkonop

************************************************

G. Humour ?
Le Monde appartient-il à ceux qui ont le veto ?

****************************************************************

**************************************************
**************************************************
Rudolph Sock
Institut de Phonetique de Strasbourg
IPS - Equipe d'Accueil 3403
Universite Marc Bloch
22, rue Descartes
67084 Strasbourg
FRANCE
Tel. + (33) 3 88 41 73 68
Fax + (33) 3 88 41 73 69
+++++++++++++++++++++++++++++++++++++++++
Home: 23, rue de l'Ancienne Eglise
67076 Gambsheim
Tel + (33) 3 88 96 97 67