Approche probabiliste par arbres de décision pour la vérification automatique du locuteur sur architectures embarquées.

Résumé:

La vérification du locuteur consiste à déterminer automatiquement l’identité d’une personne à partir de sa voix. Actuellement, ses perspectives de mise en oeuvre se situent essentiellement dans le domaine de la sécurisation d’accès à des services, des locaux ou de transactions bancaires téléphoniques. Si les outils qu’elle utilise sont souvent issus des recherches et bénéficient des progrès généraux des différentes branches du traitement automatique de la parole, ses caractéristiques techniques et applicatives en font une technologie de l’identification humaine automatique (biométrie) particulièrement intéressante. Les travaux présentés dans cette thèse ont été effectués dans le cadre d’une convention de recherche entre l’équipe CP8 de SCHLUMBERGER-SEMA (ex BULL-CP8) et le projet METISS de l’IRISA. L’objet de cette collaboration est de mettre en oeuvre un système de vérification automatique du locuteur dont tout ou partie des traitements sont effectués sur une carte à microprocesseur.

Dans ce but, nous avons tout d’abord cherché à mettre en place et à améliorer un système de vérification automatique du locuteur (VAL) suivant les caractéristiques de l’état-de-l’art, puis nous nous sommes efforcés de réduire autant que possible la quantité de mémoire et la puissance de calcul nécessaires au fonctionnement d’une plateforme de VAL. Dans un premier temps, nos travaux ont donc concerné le développement d’une méthode d’estimation suivant le critère du Maximum A Posteriori (MAP) des paramètres des modèles de mélanges de gaussiennes (GMM) ainsi que celui d’une technique originale pour la normalisation du rapport de vraisemblance. Dans un second temps, nous avons développé un système de VAL basé sur les arbres de décision et dont le principe est d’estimer, directement lors de la phase d’apprentissage, le score de décision associé à chaque point de l’espace des paramètres. Une première implémentation de la technique utilise des critères de partition classiquement associés à la construction d’arbres de décision (type critère de Gini et entropie). Une seconde utilise, quant à elle, un critère plus original dans ce domaine et dont la mise en place a permis de fortement augmenter les performances. Enfin, une troisième mise en oeuvre de la méthode est basée sur une représentation additive de plusieurs arbres par locuteur. Les expériences réalisées montrent que si la méthode proposée entraîne une diminution des performances par rapport aux meilleurs systèmes GMM, elle conduit à une réduction considérable des quantités de mémoire et de la puissance de calcul nécessaires à la mise en place d’un système de VAL. Ce travail offre de nombreuses perspectives, qu’il s’agisse de la ré-utilisation de la technique dans d’autres domaines de la biométrie ou des différentes pistes devant permettre son amélioration. Parmi celles-ci, l’incorporation de connaissances a priori pour l’apprentissage des arbres de décision, à l’instar du critère MAP utilisé avec les GMM, semble être la plus prometteuse.

Mots clefs Biométrie, arbres de décision, vérification automatique du locuteur, architecture embarquée, carte à microprocesseur.