Détection de motifs audio pour la séparation de sources guidée. Application aux bandes-son de films.

Résumé :
Lorsque l’on manipule un signal audio, il est généralement utile d’opérer un isolement du ou des éléments sonores que l’on cherche à traiter. Cette étape est couramment appelée séparation de sources audio. Il existe de nombreuses techniques pour estimer ces sources et plus on prend en compte d’informations à leur sujet plus la séparation a des chances d’être réussie. Une façon d’incorporer des informations sur une source est l’utilisation d’un signal de référence qui va donner une première approximation de cette source. Cette thèse s’attache à explorer les aspects théoriques et appliqués de la séparation de sources audio guidée par signal de référence. La nouvelle approche proposée appelée SPOtted REference based Separation (SPORES) examine le cas particulier où les références sont obtenues automatiquement par détection de motif, c’est-à-dire par une recherche de contenu similaire. Pour qu’une telle approche soit utile, le contenu traité doit comporter une certaine redondance
ou bien une large base de données doit être disponible. Heureusement, le contexte actuel nous permet bien souvent d’être dans une des deux situations et ainsi de retrouver ailleurs des motifs similaires. L’objectif premier de ce travail est de fournir un cadre théorique large qui une fois établi facilitera la mise au point efficace d’outils de traitement de contenus audio variés. Le second objectif est l’utilisation spécifique de cette approche au traitement de bandes-son de films avec par exemple comme application leur conversion en format surround 5.1 adapté aux systèmes home cinema.