José-Anibal Arias-Aguilar
Université Paul Sabatier
Session JEP orale O5 Corpus Jeudi 12 Juin - 16h30 17h30
-
papier 1672
Représentations de séquences de parole en espaces de faible dimensionalité
- José-Anibal Arias-Aguilar ( Université Paul Sabatier)
- Régine André-Obrecht ( Université Paul Sabatier)
- Jérôme Farinas ( Université Paul Sabatier)
- Résumé : Dans cet article nous étudions des représentations de séquences de parole en faible dimensionalité. Nous utilisons une modélisation par mélange de lois gaussiennes (GMM) pour caractériser les paramètres cepstraux d'une séquence de parole. Cette modélisation est utilisée de divers manières. Dans un premier système, la divergence symétrique de Kullback-Leibler entre modèles est calculée et donnée comme point de départ à l'algorithme d'échelle multidimensionnelle, qui trouve une représentation 3D de chaque GMM. Dans une deuxième approche, les GMM sont entrainés à partir de composantes stationnaires des séquences de parole. Dans un dernier système les modèles GMM sont issus d'une adaptation d'un modèle GMM universel. Chaque GMM est caractérisé par un supervecteur issu de la concaténation des vecteurs des moyennes. Une analyse en composantes principales permet de visualiser ces vecteurs. Les propriétés des résultats obtenus sont analysées à l'aide de l'algorithme de regroupement spectral.
- article