Mathieu Ramona
RTL (Ediradio) & TELECOM ParisTech / LTCI-CNRS
Session JEP poster P1 Lundi 9 Juin - 16h00 18h00
-
papier 1605
Segmentation parole/musique par Machines à Vecteurs de Support
- Mathieu Ramona ( RTL (Ediradio) & TELECOM ParisTech / LTCI-CNRS)
- Gaël Richard ( TELECOM ParisTech / LTCI-CNRS)
- Résumé : Nous comparons dans cet article différentes approches hiérarchiques et multiclasses pour la tâche de segmentation parole/musique, basées sur des Machines à Vecteurs de Support combinées à un post-traitement par filtrage médian. Nous montrons l'avantage des approches multiclasses sur les taxonomies hiérarchiques évaluées. Les performances dépassent notablement les résultats réunis par la campagne d'évaluation ESTER, avec une F-mesure globale de plus de 96%. Nous montrons en outre la pertinence des SVM dans ce cadre, pour des vecteurs d'attributs de très faible dimension.
- article