Synthèse des voix pathologiques - Association Francophone de la Communication Parlée

Synthèse des voix pathologiques

Résumé :
L’objectif de la thèse est le développement et la validation d’un synthétiseur des voix pathologiques. Peu d’études ont été consacrées à la synthèse des voix avec des dyspériodicités vocales malgré les nombreux arguments en faveur du développement et de l’amélioration des simulateurs des voix dysphoniques. Dans le cadre de ce travail, nous avons mis en œuvre un synthétiseur permettant de contrôler l’excitation glottique d’une manière fine et par conséquent de simuler efficacement les différentes catégories des dysphonies.

Les troubles simulés sont la gigue vocale, le tremblement vocal, la biphonation, la diplophonie et les vibrations aléatoires. Le shimmy vocal résulte de la distorsion de modulation dans le conduit vocal qui transforme la gigue en shimmy vocal. Le souffle est synthétisé par la modulation d’un bruit Brownien.

Des expériences préliminaires ont montré la capacité du synthétiseur à produire différentes catégories de voyelles. Pour la validation, nous avons utilisé des modèles de troubles simulés. Les résultats des expériences d’évaluations perceptives, portant sur des corpus de stimuli synthétiques ou humains, modales ou dysphoniques, sont encourageants et montrent la capacité du synthétiseur à produire des voix aussi bien modales que troublées avec des timbres indiscernables des humains. Enfin, les résultats d’une expérience d’exploitation concernant la classification des stimuli synthétiques selon les échelles ordinales GRB suggèrent que troubles simulés et évaluations perceptives concordent. Aussi, les scores perceptifs prédits à partir des paramètres de contrôle du synthétiseur et les scores attribués par des experts sont fortement corrélés.