Nouvelles méthodes multiéchelles pour l’analyse non-linéaire de la parole

Résumé :
Cette thèse présente une recherche exploratoire sur l’application du Formalisme Microcanonique Multiéchelles (FMM) à l’analyse de la parole. Dérivé de principes issus en physique statistique, le FMM peut permettre une analyse géométrique précise de la dynamique nonlinéaire des signaux complexes. Il est fondé sur l’estimation des paramètres géométriques locaux, appelés les exposants de singularité, qui quantifient le degré de prédictibilité à chaque point du domaine du signal. Si correctement définis est estimés, ils fournissent des informations précieuses sur la dynamique locale de signaux complexes et ont été utilisés dans plusieurs applications allant de la représentation des signaux à l’inférence ou la prédiction.
Nous démontrons la pertinence du FMM en analyse de la parole et développons plusieurs applications qui montrent le potentiel et l’efficacité du FMM dans ce domaine. Ainsi, dans cette thèse, nous introduisons: un nouvel algorithme performant pour la segmentation phonétique indépendante du texte, un nouveau codeur du signal de parole, un algorithme robuste pour la détection précise des instants de fermeture glottale, un algorithme rapide pour l’analyse par prédiction linéaire parcimonieuse et une solution efficace pour l’approximation multipulse du signal source d’excitation.