Régine André-Obrecht
IRIT-Université Paul Sabatier
Session JEP orale O4 Reconnaissance de la parole et du locuteur Jeudi 12 Juin - 14h00 16h00
-
papier 1636
Etude de la cohabitation entre la bande large et la bande étroite en reconnaissance automatique de la parole
- Mohamed-Ali Ben-Salah ( Orange Labs)
- Jean Monné ( Orange Labs)
- Denis Jouvet ( Orange Labs)
- Régine André-Obrecht ( IRIT-Université Paul Sabatier)
- Résumé : dans cet article nous traitons la question de la cohabitation entre la bande large et la bande étroite en reconnaissance automatique de dans le but de garantir une réponse optimale des ASR face aux divers types de données parole échantillonnées à 8 kHz (bande étroite), 16 kHz (bande large) et surtout les données en fausse bande large ou où les données présentées comme des données WB sont en réalité issues d'un codage ou un transcodage bande étroite.
- article
Session JEP orale O5 Corpus Jeudi 12 Juin - 16h30 17h30
-
papier 1672
Représentations de séquences de parole en espaces de faible dimensionalité
- José-Anibal Arias-Aguilar ( Université Paul Sabatier)
- Régine André-Obrecht ( Université Paul Sabatier)
- Jérôme Farinas ( Université Paul Sabatier)
- Résumé : Dans cet article nous étudions des représentations de séquences de parole en faible dimensionalité. Nous utilisons une modélisation par mélange de lois gaussiennes (GMM) pour caractériser les paramètres cepstraux d'une séquence de parole. Cette modélisation est utilisée de divers manières. Dans un premier système, la divergence symétrique de Kullback-Leibler entre modèles est calculée et donnée comme point de départ à l'algorithme d'échelle multidimensionnelle, qui trouve une représentation 3D de chaque GMM. Dans une deuxième approche, les GMM sont entrainés à partir de composantes stationnaires des séquences de parole. Dans un dernier système les modèles GMM sont issus d'une adaptation d'un modèle GMM universel. Chaque GMM est caractérisé par un supervecteur issu de la concaténation des vecteurs des moyennes. Une analyse en composantes principales permet de visualiser ces vecteurs. Les propriétés des résultats obtenus sont analysées à l'aide de l'algorithme de regroupement spectral.
- article