Session JEP orale - O7
Synthèse et prosodie
Vendredi 13 Juin - 14h00 16h00
-
papier 1562
Calcul rythmique et quantification de la vitesse d'élocution
- Michela Russo ( Université Paris 8 / UMR 7023, CNRS)
- William-John Barry ( Universitaet des Saarlandes)
- Résumé : A comparison of Italian and German is carried out using acoustic measures related to structural properties: Vowel-interval and consonantal inter-vowel-interval durations are used to obtain rhythmic measures based on a number of approach. The resulting distributions of rhythm scores for the two languages revealed a strong overlap. These fluctuations in measurement can be shown to relate to the lexical and intonational structure of the individual utterances, thus placing the concept of rhythm typology in the same sphere as other perceptually based generalisations on human behaviour. Statistical analysis shows, however, that the factor ‘language' is still a significant differentiator.
- article
-
papier 1569
Introduction d'éléments paralinguistiques en synthèse vocale
- Lionel Segalen ( Télécom Bretagne)
- Didier Cadic ( Orange Labs - Lannion)
- Résumé : Les restitutions vocales des systèmes actuels de synthèse par corpus, bien que très naturelles, restent cantonnées à un style prosodique assez neutre. Parmi les traits d'expressivité que l'on souhaite ajouter figurent les éléments paralinguistiques. Nous proposons ici une méthode d'introduction des rires et hésitations dans la synthèse qui, après une courte phase d'enregistrements, permet de restituer avantageusement la transition entre la parole et l'élément paralinguistique.
- article
-
papier 1576
Modélisation HMM de la variabilité intonative pour la synthèse de parole
- Cédric Boidin ( Orange Labs)
- Olivier Boeffard ( IRISA / Université de Rennes 1)
- Résumé : This paper proposes a statistical intonation model designed to deal with intrinsic variability in speech. In combining the advantages of two well-known statistical algorithms, CART and HMM, the proposed model takes advantage of available linguistic information and successfully tackles the issue of missing para-linguistic information. Promising results of the training process are shown and analyzed.
- article
-
papier 1619
Aspects prosodiques des constructions coordonnées du français
- François Mouret ( CNRS, UMR 7110 / Laboratoire de Linguistique Formelle, Paris 7)
- Anne Abeillé ( Université de Paris 7, UMR 7110 / Laboratoire de Linguistique Formelle)
- Elisabeth Delais-Roussarie ( CNRS, UMR 7110 / Laboratoire de Linguistique Formelle, Paris 7)
- Jean-Marie Marandin ( CNRS, UMR 7110 / Laboratoire de linguistique formelle, Paris 7)
- Hiyon Yoo ( Université de Paris 7, ARP / Atelier de Recherche sur la parole)
- Résumé : Dans ce papier, nous comparons la prosodie de trois types de constructions coordonnées en français : la coordination simple (X, Y et Z), la coordination à conjonction redoublée (et X et Y et Z) et la juxtaposition. Notre description se base sur l'analyse d'un corpus de 126 énoncés enregistrés par 7 locuteurs. Chaque phrase contient une coordination de GN ou de GP. Bien qu'il n'existe pas de relation un à un entre patron prosodique et type de coordination, chaque construction présente un comportement particulier soit en terme de phrasé, soit en terme d'accentuation initiale, soit en terme de choix des contours intonatifs.
- article
-
papier 1621
Étude diachronique de l'accent initial au travers d'archives audio
- Philippe Boula-de-Mareüil ( LIMSI-CNRS)
- Albert Rilliard ( LIMSI-CNRS)
- Alexandre Allauzen ( LIMSI-CNRS & Univ. Paris-Sud)
- Résumé : Cette étude tire profit des avancées en traitement automatique de la parole pour analyser des archives audiovisuelles françaises. Un corpus de 10 heures couvrant plus de cinq décennies de bulletins d'information est examiné sous l'angle de l'évolution de la prosodie. Cet article se focalise sur l'accent initial, qui peut donner une impression de style emphatique. Nos mesures suggèrent que les paramètres suivants, de même que le pitch moyen, ont diminué depuis les années 1940 : la montée mélodique et la durée vocalique associées à l'accent initial. Dans le même temps, l'attaque des syllabes initiales supposées accentuées s'est allongée tandis que le débit de parole n'a pas changé. Ce résultat intrigant pose d'intéressantes questions pour la recherche sur la prosodie du français.
- article
-
papier 1632
Mots fréquents homophones en français : analyse acoustique et classification automatique par fouille de données
- Rena Nemoto ( LIMSI-CNRS)
- Ioana Vasilescu ( LIMSI-CNRS)
- Martine Adda-Decker ( LIMSI-CNRS)
- Résumé : De nombreuses erreurs de mots par la transcription automatique de parole concernent des mots fréquents homophones. Le but de cet article est de vérifier si les attributs acoustico-prosodique peuvent aider à discriminer des homophones sans information linguistique au niveau supérieur. Nous avons choisi deux paire de mots homophones >à/a> et >et/est> à partir de deux différents styles de corpus (préparés vs. spontanés). Les analyses acoustiques montrent des différences des homophones à travers le taux de voisement et la durée entre les verbes et la conjonction/préposition. 62 attributs acoustico-prosodiques ont été définis pour la classification combinaisant les mesures de fréquence fondamentale, formants, intensité, durée, taux de voisement et cooccurrences de pauses. Les taux moyennes d'identification étaient entre 60 et 77%. Les attributs pertients sont de nature prosodique et contextuelle inter-phonémique.
- article