Résume :
Cette thèse traite de la mise en oeuvre d’un système de synthèse 3D de parole audiovisuelle capable, à partir d’une simple chaîne phonétique, de générer un signal audio synthétique, les mouvements du visage correspondant ainsi que les mouvements de la main reproduisant les gestes de la Langue française Parlée Complétée (LPC).
Nous avons enregistré les mouvements faciaux et manuels d’une codeuse LPC par une technique de motion capture, ainsi que le signal audio correspondant, lors de la production d’un corpus de 238 phrases couvrant l’ensemble des diphones du français. Après traitements et analyses des données,
nous avons implémenté un système de synthèse par concaténation d’unités en deux étapes capable de générer de la parole codée. Enfin, nous avons évalué notre système tant au niveau de l’intelligibilité segmentale qu’au niveau de la compréhension. Les résultats sont prometteurs et montrent clairement un apport d’information du code de synthèse.