Mathieu Ramona

RTL (Ediradio) & TELECOM ParisTech / LTCI-CNRS

Session JEP poster P1 Lundi 9 Juin - 16h00 18h00

papier 1605 Segmentation parole/musique par Machines à Vecteurs de Support

Mathieu Ramona ( RTL (Ediradio) & TELECOM ParisTech / LTCI-CNRS)

Gaël Richard ( TELECOM ParisTech / LTCI-CNRS)

Résumé : Nous comparons dans cet article différentes approches hiérarchiques et multiclasses pour la tâche de segmentation parole/musique, basées sur des Machines à Vecteurs de Support combinées à un post-traitement par filtrage médian. Nous montrons l'avantage des approches multiclasses sur les taxonomies hiérarchiques évaluées. Les performances dépassent notablement les résultats réunis par la campagne d'évaluation ESTER, avec une F-mesure globale de plus de 96%. Nous montrons en outre la pertinence des SVM dans ce cadre, pour des vecteurs d'attributs de très faible dimension.

article