Etude phonétique des dialectes modernes de l’anglais des Iles Britanniques : vers l’identification automatique du dialecte.

Résumé :
Parmi les phénomènes qui affectent la manière dont nous parlons, l’accent est une des composantes principales de la variation observée. La prononciation d’un locuteur peut en effet nous renseigner sur son origine, géographique et sociale. La description des caractéristiques phonétiques qui sous-tendent les différences d’accent perçues constitue donc un intérêt scientifique particulier. De plus, la recherche dans le domaine des accents contribue à l’amélioration d’applications technologiques telles que la reconnaissance de la parole ou l’indexation du locuteur.

Cette thèse propose une étude phonétique acoustique d’enregistrements de 13 accents (264 locuteurs) tirés du corpus Accents of the British Isles (ABI). Nous abordons dans un premier temps les caractéristiques essentielles à une meilleure compréhension de la variation induite par des facteurs tels que le dialecte, les spécificités physiologiques du locuteur et le contenu informationnel. Nous définissons la variation dialectale à travers les concepts d’ensembles lexicaux, de scissions et convergences phonémiques, de changements en chaîne, et mentionnons également, entre autres, les phénomènes d’hypercorrection et de « quasi convergences ». De plus, certaines études traitant de questions connexes, comme l’identification du dialecte par des auditeurs ou le nivellement dialectal, sont passées en revue, et les traits phonético-phonologiques les plus saillants de chaque dialecte du corpus sont listés. Les aspects physiologiques sont abordés en référence à la question de la normalisation du locuteur ; une solution à ce problème est suggérée à la fin de la thèse. La variation induite par le contexte informationnel est analysée par le biais de la théorie H&H de Lindblom et de la Smooth Signal Redundancy Hypothesis de Aylett ; ce point permet de justifier l’utilisation de mots à structure /hVd/ dans notre étude. Nous posons en outre les bases d’un cadre théorique décrivant les relations entre la phonétique et les représentations phonologiques prototypiques, et l’interprétation de la distance phonétique entre locuteurs comme un degré d’appartenance à des catégories de prototypes dialectaux. La section empirique de nos travaux peut-être divisée en trois parties :

1. Rythme de la parole ;
2. Description phonétique des systèmes vocaliques ;
3. Classification automatique et représentations multidimensionnelles.

Dans la première partie, des procédures classiques dans l’étude du rythme – basées sur des mesures de durée – sont appliquées au passage lu du corpus ABI. Nous introduisons en outre une nouvelle mesure qui prend en compte l’intensité. Une série d’analyses discriminantes montrent que ces paramètres ne permettent pas une bonne « séparabilité » entre les dialectes ; cependant, notre mesure d’intensité semble présenter un potentiel discriminant supérieur à celui des mesures courantes. Les résultats suggèrent également que, au vu de la grande variabilité du débit de parole, et malgré l’utilisation d’indices dits « normalisés », la faisabilité de telles études à partir de données non contrôlées est douteuse. Néanmoins, le potentiel discriminant du rythme, tel que nous le mesurons, semble varier d’un dialecte à l’autre.

Dans la deuxième partie, les systèmes vocaliques sont décrits à partir de F1, F2 et de la durée. Les données sont composées de 19 voyelles présentées dans un contexte consonantique /h d/ ; une discussion des avantages et des inconvénients de ces mots-test est proposée au début de la thèse. Les formants ont été extraits automatiquement avec le logiciel Praat. étant donné le peu de fiabilité de l’estimation de formants, les mesures ont été ensuite traitées par le biais de la régression linéaire et polynomiale afin de lisser les trajectoires formantiques et d’écarter les valeurs déviantes. Pour chaque dialecte, nous représentons graphiquement les monophtongues et les diphtongues, et nous nous concentrons sur les paires de voyelles qui sont particulièrement proches. La variation intra dialectale est illustrée au moyen de spectrogrammes individuels.

La troisième partie aborde la classification automatique de locuteurs en fonction du dialecte, partant de l’idée selon laquelle les accents – tels qu’ils sont mesurés à travers le système vocalique des individus – sont mieux représentés, et mieux préservés de la variation individuelle d’ordre physiologique, lorsqu’on utilise les coordonnées relatives des voyelles dans l’espace acoustique plutôt que les valeurs absolues comparées à une norme. Notre méthode permet d’atteindre un peu plus de 90% de classification correcte dans une tâche à 13 dialectes. Nous démontrons ensuite l’intérêt de techniques d’analyse multivariée pour la projection de données de l’espace des Mel-Frequency Cepstral Coefficients dans un espace favorisant l’interprétation phonétique. Les résultats offrent un nouvel éclairage sur les systèmes vocaliques et montrent que le regroupement des dialectes est en accord avec nos prédictions.