Liste des thèses francophones traitant de la communication parlée.
Vous trouverez les plus récentes au format pdf ou ps compressés, ainsi que leur résumé.
Vous pouvez soumettre un manuscrit de thèse à l’aide de ce formulaire.

Structuration de l’espace acoustique par le modèle générique pour la vérification du locuteur

Résumé : La Vérification Automatique du Locuteur (VAL) consiste à confirmer ou infirmer par sa voix l’identité proclamée d’un individu. Pour cette tâche, il est nécessaire d’estimer la probabilité pour qu’un locuteur ne corresponde pas à l’identité qui a été proclamée. Dans le paradigme de modélisation par GMM, un modèle générique (ou modèle du monde) […]

Résumé automatique de parole pour un accès efficace aux bases

Résumé : L’avènement du numérique permet de stocker de grandes quantités de parole à moindre coût. Malgré les récentes avancées en recherche documentaire audio, il reste difficile d’exploiter les documents à cause du temps nécessaire pour les écouter. Nous tentons d’atténuer cet inconvénient en produisant un résumé automatique parlé à partir des informations les plus […]

Analyse formelle et implémentation phonétique de l’intonation du parler russe spontané en vue d’une application à la synthèse vocale.

Résumé: L’objectif de notre thèse est de recueillir des données (à partir d’un corpus oral) et de développer une approche théorique et méthodologique adaptée à la description formelle de l’intonation du parler russe spontané. Cette description s’inscrit dans la perspective d’une application dans un système de synthèse vocale fondé sur une « double sélection d’unités […]

Mesures de confiance en traitement automatique de la parole et applications.

Résumé : Ce travail de thèse se place dans le contexte de la campagne d’évaluation ESTER (Evaluation des Systèmes de Transcription enrichie d’Emissions Radiophonique). L’objectif de ce travail de thèse consiste dans un premier temps à proposer des indicateurs ou mesures de confiance permettant de distinguer les zones correctes ou erronées au sein des hypothèses […]

La bimodalité de la parole au secours de la séparation de sources.

Résumé : Cette thèse est dédiée à la modélisation conjointe des modalités audio et vidéo de la parole et à son exploitation pour la séparation de sources. Tout d’abord, une modélisation probabiliste bimodale de la parole audiovisuelle à base de mélange de noyaux est proposée. Cette modélisation est ensuite exploitée pour la détection des silences. […]

Analyse formelle et implémentation phonétique de l’intonation du parler russe spontané en vue d’une application à la synthèse vocale.

Résumé: L’objectif de notre thèse est de recueillir des données (à partir d’un corpus oral) et de développer une approche théorique et méthodologique adaptée à la description formelle de l’intonation du parler russe spontané. Cette description s’inscrit dans la perspective d’une application dans un système de synthèse vocale fondé sur une « double sélection d’unités […]

Le rôle de la prosodie dans le traitement syntaxique adulte et l’acquisition de la syntaxe

Résumé : Ce travail de thèse a développé et testé une hypothèse de recherche permettant de rendre compte du traitement syntaxique adulte et de l’acquisition de la syntaxe. Elle repose sur les modèles d’initialisation phonologique qui postulent qu’une analyse phonologique du signal de parole pourrait apporter, entre autres, de nombreuses informations sur la syntaxe de […]

Transcription enrichie de documents dans un monde multilingue et multimodal

Résumé : Pour pouvoir envisager un accès selon le contenu dans de grandes bases de données multimédia, ces données doivent être automatiquement annotées. Dans mes activités de recherche, je m’intéresse plus particulièrement aux documents audio ou au canal audio d’un document vidéo. Un domaine de recherche central ici est la reconnaissance automatique de la parole […]

Noyaux de séquences pour la vérification du locuteur par Machines à Vecteurs de Support

Résumé : Cette thèse est consacrée à l’application des Séparateurs à Vaste Marge (SVM) pour la Vérification Automatique du Locuteur (VAL) en mode « indépendant du texte ». Cette tâche consiste à déterminer si un énoncé de parole a été prononcé ou non par un locuteur cible, sans aucune contrainte sur le contenu du message […]

Modèles acoustiques compacts pour les systèmes embarqués

Résumé : Depuis le lancement des téléphones portables au milieu des années 90, leurs ventes n’ont cessé de progresser. Leur taille, comme celle de l’ensemble des systèmes embarqués (téléphone, GPS, PDA…), a constamment été réduite, quand, dans le même temps, le nombre de services offerts n’a fait qu’augmenter. D’une manière générale, la plupart des systèmes […]