Bob : un outil de traitement de signal et d’apprentissage automatique

Bob est un outil de traitement de signal et d’apprentissage automatique. Il est développé par le groupe Biometrics (http://www.idiap.ch/~marcel/professional/Welcome.html) de l’Idiap en Suisse. Bob offre une implémentation efficace d’un grand nombre d’algorithmes d’apprentissage. Il constitue un environnement idéal aidant les chercheurs à publier leur recherche reproductible. Bob est codé sous Github, et est distribué librement […]

SPPAS : Automatic Phonetic Annotation of Speech

SPPAS est un logiciel pour la segmentation automatique, à partir d’un enregistrement audio et de sa transcription. En 2012, les langues traitées sont : français, italien, anglais, chinois simplifié, mais il est possible de rajouter facilement d’autres langues. SPPAS est distribué sous licence GPL, et fonctionne sous Linux, MacOS et Windows.

ROCme!: nouveau logiciel gratuit pour l’enregistrement et la gestion de corpus audio

Le logiciel ROCme! permet une gestion rationalisée, autonome et dématérialisée de l’enregistrement de corpus lus. Caractéristiques clés : – gratuit – compatible Windows et Mac – interface paramétrable pour le recueil de métadonnées sur les locuteurs – le locuteur fait défiler les phrases à l’écran et les enregistre de façon autonome – format audio paramétrable […]

PERCEVAL, station de tests de perception auditive

PERCEVAL est une station automatisée de tests de perception auditive et visuelle développée au laboratoire « Parole et Langage ». Elle fournit un environnement complet pour la préparation, la configuration, la passation et le recueil des données de l’expérience. Le dispositif est spécialement adapté pour l’étude de la perception de la parole et du langage. Il fonctionne […]

Le projet Structuration, Analyse, MOdélisation de la Video et de l’Audio à l’IRIT

Package description : This package contains a set of 6 multilingual phonetic decoders (English, German, Hindi, Japanese, Mandarin and Spanish). Each decoder was trained on the Oregon Graduate Institute-Multi Language Telephone Speech Corpus. The models are based on Hidden Model Markov. 10 Gaussians were used for each state. 12 PLP, the energy and their derivative […]

La contribution de Guig

Guillaume Gravier, chercheur CNRS à l’IRISA, maintient une page avec l’ensemble des outils qu’il a développé ou auxquels il a participé.

SPro

The Speech Signal Processing (SPro) toolkit provides the standard speech signal analysis routines. It is intended to be used as a front-end signal analysis to any automatic speech processing system and therefore work mostly in batch mode. Informations et chargement : http://www.irisa.fr/metiss/gravier/spro.html