Analyse formelle et implémentation phonétique de l’intonation du parler russe spontané en vue d’une application à la synthèse vocale.

Résumé:
L’objectif de notre thèse est de recueillir des
données (à partir d’un corpus oral) et de développer
une approche théorique et méthodologique adaptée à la
description formelle de l’intonation du parler russe
spontané. Cette description s’inscrit dans la
perspective d’une application dans un système de
synthèse vocale fondé sur une « double sélection
d’unités » (modèle développé par van Santen et al.
2005).
Dans ce travail, nous défendons l’idée qu’une
entreprise de formalisation d’un système prosodique
se doit de conjuguer l’étude de la dimension tonale et
celle du phrasé prosodique. Deux objectifs
complémentaires découlent de cette prise de position,
qui se rapportent respectivement :
a) à la nécessité de décrire et de modéliser le
phrasé prosodique dans ses interactions avec d’autres
niveaux de la description linguistique, avant
d’entreprendre la modélisation acoustique de ce phrasé
;
b) à la détermination des formalismes qui permettront
d’appréhender le lien entre les représentations
formelle et fonctionnelle des phénomènes prosodiques.
Les études empiriques conduites dans cette thèse se
fondent sur deux types de données : l’analyse d’un
corpus de parole spontanée et les données issues d’une
étude perceptive. Dans l’expérience de perception, une
tâche d’annotation prosodique (en unités intonatives)
a été proposée aux auditeurs experts qui ont été
soumis à trois conditions expérimentales. Cette
démarche a été adoptée afin d’obtenir des précisions
sur l’articulation de l’interface « prosodie ~ syntaxe
».
Dans une étape ultérieure de notre travail, nous
analysons :
i) l’accord entre les auditeurs dans la tâche
d’annotation ;
ii) les propriétés rythmico-temporelles des unités
intonatives perçues ;
iii) par référence au phrasé prosodique perçu, le
rôle, la force prédictive et la valeur hiérarchique
des contraintes AlignXP,R et Wrap-XP, issues de la
théorie de l’optimalité. À partir des données
recueillies, nous proposons une modélisation
acoustique des frontières et nous procédons à
l’évaluation statistique de la qualité de la démarche
prédictive.
Nous nous appuyons sur le formalisme INTSINT (Hirst et
al. 2000) dans l’annotation de l’organisation tonale.
Cette annotation étant (semi)-automatique, nous
évaluons sa performance dans le corpus de parole
spontanée en langue russe. Dans un deuxième temps, en
nous fondant sur l’annotation symbolique obtenue, nous
proposons une méthodologie d’analyse objective de
l’articulation « forme ~ fonction », en privilégiant
dans cette démarche l’approche probabiliste.
Au cours de notre thèse, nous avons essayé de
construire une réflexion épistémologique sur les
méthodologies à mettre en place afin de s’assurer de
l’objectivité des démarches et des conclusions. Au
terme de ce travail, nous estimons avoir démontré
l’intérêt qu’il y a à mener une étude de la
formalisation de l’intonation et de l’organisation
prosodique en général à partir des corpus oraux.