Accents régionaux en français : perception, analyse et modélisation à partir de grands corpus

Résumé :
Cette thèse est consacrée à l’étude d’accents régionaux en français, à partir de deux grands corpus de parole face à face (PFC) et de parole téléphonique. Nous avons étudié la perception humaine et les caractéristiques acoustiques de différentes variétés de français (français standard, français du sud de la France, d’Alsace, de Belgique et de Suisse) afin de les modéliser dans leurs aspects segmentaux (articulation des phonèmes) et prosodiques (accentuation et intonation). Dans un premier temps, des tests perceptifs ont permis d’évaluer quels accents sont distingués par des auditeurs français. Les résultats ont été analysés par des techniques de clustering et de scaling. Dans un second temps, nous avons mesuré des paramètres acoustiques (formants, fréquence fondamentale, durée et intensité) en nous appuyant sur les frontières temporelles des segments phonémiques fournies par un système d’alignement standard, ce qui nous a également permis de dégager certains patrons prosodiques spécifiques. Nous avons en outre introduit des variantes dans le dictionnaire de prononciation utilisé pour l’alignement, afin d’observer les variantes choisies par le système. Ces deux méthodes ont permis de mettre en évidence un certain nombre de traits pertinents concernant la réalisation des voyelles nasales, l’antériorisation du /O/, le dévoisement des consonnes sonores et l’accentuation initiale. Finalement, nous avons appliqué des techniques de classification automatique (arbres de décision et SVM) sur nos données : les indices extraits, motivés linguistiquement, ont permis d’obtenir des taux d’identification corrects allant jusqu’à 80% sur des échantillons de quelques minutes de parole.