Apprentissage de représentation en continu pour la langue écrite et parlée

Bien que l’apprentissage automatique ait récemment connu des avancées majeures, les modèles actuels sont le plus souvent entraînés une fois pour toutes sur une tâche cible, puis déployés dans l’environnement de production, et leurs paramètres sont rarement (voire jamais) révisés. Cette approche affecte les performances dans le nouvel environnement, car les données et les spécifications […]

Deep Learning Approaches to Assess Speech Intelligibility of Head and Neck Cancer

La perte d’intelligibilité de la parole est souvent constatée après le traitement de maladies qui affectent les voies aérodigestives, comme les cancers ORL. Les évaluations perceptives restent la méthode la plus utilisée pour évaluer cliniquement l’intelligibilité de la parole. Cependant, ces appréciations sont connues pour être hautement subjectives, biaisées et longues puisque l’évaluation peut être […]

Des données aux systèmes : Étude des liens entre données d’apprentissage et biais de performance genrés dans les systèmes de reconnaissance automatique de la parole

Certains systèmes issus de l’apprentissage machine, de par leurs données et les impensés qu’ils encapsulent, contribuent à reproduire des inégalités sociales, alimentant un discours sur les « biais de l’intelligence artificielle ». Ce travail de thèse se propose de contribuer à la réflexion collective sur les biais des systèmes automatiques en questionnant l’existence de biais de genre […]

Etude de la corrélation entre l’organisation des patterns respiratoires et la production de la parole chez les enfants porteurs de fentes palatines

Cette thèse porte sur l’étude des patterns respiratoires en parole chez l’enfant, et leur « résistivité » face aux perturbations conséquentes aux divisions palatines. L’objectif de ce travail est d’examiner les stratégies compensatoires mises en place au niveau thoraco-abdominal pour pallier les déficits supra-glottiques. 19 locuteurs témoins et 25 enfants porteurs de fentes palatines ont […]

Apports des approches d’évaluation perceptive, acoustique et cognitive des locuteurs présentant une apraxie de la parole et/ou une dysarthrie

Cette thèse examine les apports d’approches d’évaluation perceptive globale, acoustique et cognitive, pour le diagnostic et la caractérisation de la parole des locuteurs présentant un trouble moteur acquis de la parole (MSD), dysarthrie et/ou apraxie de la parole (AoS). Pour cela, trois études ont été menées chez quatre groupes de locuteurs: neurotypiques, pathologiques présentant une […]

Interspeaker variations in V-to-V coarticulation: effects of Motor Speech Disorders, age, speech tempo changes, and boundary type

Anticipatory coarticulation refers to the anticipation of articulatory movements for the achievement of forthcoming speech segments and can be considered an index of planning in speech. Indeed, despite the accounts of speech production differ in modeling coarticulation, it can be taken as a starting assumption that if a segment is anticipated into a preceding one, […]

Behavioral and electrophysiological markers of partner-adaptation in joint language production

L’interaction linguistique est une forme d’action conjointe dans laquelle les individus coordonnent leur comportement verbal et non verbal pour communiquer avec succès. Pour ce faire, les interlocuteurs en viennent à se représenter mutuellement dans de multiples dimensions du langage, de la conceptualisation à la sélection lexicale et à la représentation phonologique. Ils en viennent également […]

Une analyse temporelle et pragmatique de l’association geste-parole : Une approche basée sur un corpus utilisant le nouveau système d’annotation MultiModal MultiDimensionnel (M3D)

Le langage est essentiellement multimodal. En effet, des études récentes ont montré à la fois la forte relation temporelle entre les gestes co-verbaux et la proéminence prosodique et leur pertinence pragmatique. Cependant, ces études ont eu tendance à se concentrer sur le rôle de la proéminence prosodique en tant qu’attracteur principal pour la production de […]

Human Beatboxing: pushing the boundaries of human voice production (Le Human Beatbox : aux limites des frontières de la production vocale humaine)

Le Human Beatbox (HBB) est un art vocal relativement jeune et en pleine évolution : les beatboxeurs utilisent leurs organes vocaux pour imiter et créer des sons afin de faire de la musique. Si le HBB est né en milieu défavorisé comme substitut gratuit aux instruments de musique trop coûteux (les « beat boxes » ou boîtes […]

Production de parole chez l’enfant sourd: bénéfices de l’exposition à la Langue française Parlée Complétée associée à l’implantation cochléaire

Bien que l’implant cochléaire (CI) améliore la perception de la parole chez les enfants sourds, la perception de certains traits acoustiques peut être altérée, le développement du langage oral impacté et les compétences phonologiques limitées. En complément des informations phonologiques manquantes, les gestes manuels de la Langue française Parlée Complétée (LfPC) peuvent être utilisés simultanément […]