Correction centralisée des distorsions spectrales de la parole sur les réseaux téléphoniques. - Association Francophone de la Communication Parlée

Résumé:

Ces travaux ont pour objet la correction des distorsions spectrales subies par la parole sur les réseaux téléphoniques, en premier lieu le réseau fixe (terrestre) dans sa partie analogique. Ces distorsions sont dues aux fonctions de transfert des terminaux téléphoniques en émission et en réception, et aux lignes téléphoniques analogiques correspondantes. Le but est de restaurer, en aveugle, un « timbre » le plus proche possible de la voix originale du locuteur, au moyen d’un traitement du signal centralisé dans un équipement du réseau.

Nous proposons un algorithme d’égalisation spectrale aveugle consistant à aligner, sur une bande de fréquences limitée (200-3150 Hz), le spectre à long terme du signal traité sur un spectre de référence (spectre de la recommandation P.50 de l’UIT-T). Des évaluations subjectives mettent en évidence une restauration satisfaisante du timbre original des locuteurs, dans la limite de la bande d’égalisation choisie.

Il apparaît toutefois que la quantification en loi A des échantillons de sortie de l’égaliseur induit un bruit gênant en réception. Deux approches sont donc proposées pour masquer perceptivement ce bruit par un reformage spectral. L’une est fondée sur la réinjection à l’entrée du quantificateur de l’erreur de quantification filtrée. L’autre explore selon un algorithme de type Viterbi les séquences temporelles des niveaux de quantification possibles, de manière à maximiser un critère probabiliste de masquage du bruit. Une évaluation subjective montre finalement d’une part que le bruit non reformé est préféré au bruit reformé, plus sporadique mais plus « rauque », d’autre part qu’une voix dont le timbre a été corrigé, au prix de ce bruit de quantification, est préférée à la même voix en réception d’une liaison téléphonique sans correction de timbre (et non bruitée).

Afin d’améliorer l’adéquation du spectre de référence de l’égaliseur aux différents locuteurs, une classification des locuteurs selon leur spectre, en deux ou quatre classes, est étudiée, et des critères de classement robustes aux distorsions de la liaison téléphonique sont définis. Cette classification permet d’utiliser non plus un spectre de référence unique, mais un spectre de référence par classe. Il en résulte une réduction de la distorsion spectrale induite par l’égaliseur, ce qui se traduit, pour certains locuteurs, par une amélioration significative de la correction de timbre.

Mots-clés : égalisation spectrale, débruitage, masquage du bruit, algorithme de Viterbi, classification des locuteurs, perception du timbre et du bruit.