Steps towards end-to-end neural speaker diarization

La tâche de segmentation et de regroupement en locuteurs (speaker diarization) consiste à identifier “qui parle quand” dans un flux audio. Plus précisément, il s’agit d’un processus non supervisé qui a pour objectif d’identifier les différents locuteurs d’un flux audio et de déterminer quel locuteur est actif à chaque instant. Le plus souvent, le nombre […]

LIG-AIKUMA

Application android pour la collecte de corpus oraux : https://lig-aikuma.imag.fr/