Coopération syntaxe-sémantique pour la compréhension de la parole spontanée.

Résumé:

L’objectif de cette recherche concerne l’analyse structurelle de la parole spontanée, dans la perspective d’un dialogue personne – machine finalisé. Ce travail s’inscrit dans la problématique plus générale du projet MICRO, qui vise la réalisation d’un système de compréhension automatique de la parole présentant de bonnes capacités adaptatives. Dans cette perspective, nous avons adopté une approche cognitive consistant à caractériser les propriétés qui sont essentielles à l’émergence des remarquables capacités adaptatives de l’être humain. La première partie de ce mémoire rend compte de cette démarche.

Dans un premier chapitre, nous détaillons les caractéristiques cognitives modélisées dans le système MICRO, à savoir la modularité, l’interactivité, et surtout l’existence d’une vicariance (i.e. coopération) entre processus analytiques et holistiques.

Le second chapitre présente ensuite l’architecture fonctionnelle qui découle de cette modélisation. MICRO est ainsi un système multi-agents qui est divisé en une voie analytique classique et une voie hoslistique reposant sur l’analyse de la prosodie. Cette modélisation cognitive reste sous-jacente dans le champ d’investigation prinicipal de ma recherche, qui concerne le niveau d’analyse linguistique de MICRO. Ces travaux, qui constituent la seconde partie du mémoire, ont pour finalité une prise en compte tolérante du langage parlé, afin de permettre une expression relativement libre du locuteur.

Ainsi, le troisième chapitre est consacré à l’etude des variétés structurelles du francais parlé, que ce soit en communication inter-individus qu’en dialogue personne-machine (comportement langagier induit par la machine).

Le chapitre suivant pose la question de l’analayse de la parole spontanée par les méthodes actuelles d’analyse : d’un côté, les méthodes syntaxiques (TALN) ne peuvent surmonter les problèmes d’agrammaticalité, tandis que de l’autre, les analyses guidées par le remplissage de schémas sémantiques se straduisent par une pauvreté structurelle et informative. Etudiant l’évolution des formalismes d’analyse employés en TALN au cours des trente dernières années, nous en concluons à une revalorisation du rôle de la sémantique dans le processus d’analyse structurelle. Nous proposons alors de mettre en oeuvre une strategie coopérative entre un analyseur sémantique possedant un fort pouvoir structurel, et un analyseur syntaxique dont le rôle est limité au filtrage éventuel des hypothèses proposées par la syntaxe. Ainsi, cette solution se démarque des schemas coopératifs adoptés au cours de ces dernières années : c’est bien la sémantique qui se voit accorder ici un rôle préeminent dès l’étape d’analyse structurelle.

La clef de voûte de la stratégie coopérative repose donc sur la réalisation d’un analyseur capable d’extraire seul une structure sémantique de phrase. Les chapitres 5 et 6 sont consacrés à la présentation du module d’analyse sémantique realisé. Dans un premier temps, nous nous attardons sur le lexique sémantique de l’application, qui repose sur une taxonomie de disjonctions semiques (paradigme componentiel differentiel). De plus, nous attachons à chaque lexème une structure prédicative qui décrit, au niveau sémantique, le comportement relationnel de ce dernier. Ces relations conceptuelles sont représentées par un ensemble de cas sémantiques. Conscients des insuffisances du modèle casuel proposé par Fillmore, nous proposons un système de cas qui ne repose sur aucune considération référentielle (les cas utilisés dans MICRO ne decrivent plus, comme chez Fillmore, le rôle du référent associé au lexème dans l’action décrite par la phrase) et qui permettent la description de l’ensemble des relations sémantiques (déterminants, adjectifs, adverbes…).

Le chapitre 6 présente alors le module sémantique, qui effectue une analyse predictive destinée à fournir des contraintes descendantes au processus d’accès lexical. Cette analyse s’appuie sur un processus d’amorçage sémantique qui est réalisé par la propagation d’activités dans un reseau incremental multi-couches. Nous décrivons le fonctionnement de l’amorçage ainsi qu’un ensemble de mécanismes additionnels qui permettent une analyse structurelle complète. Ceux-ci gèrent en particulier les phénomènes d’amorçage arrière, de marquage casuel (prépositions, conjonctions de coordinations) et de coordination (limitée à l’intervention des connecteurs logiques). Nous exposons enfin un exemple d’analyse qui montre les capacités structurelles de cet analyseur.

Le chapitre 7 est consacré à la presentation de l’analyseur syntaxique et de la stratégie coopérative. Le système MICRO reprend, en l’adaptant, l’analyseur LN2_3 à grammaires lexicales-fonctionnelles (LFG) qui a été développé au laboratoire DIAM (INSERM). La LFG élabore une f-structure tres proche de la structure qui a été parallèlement construite par l’analyseur sémantique. La coopération repose ainsi sur la comparaison de ces structures, à partir de schemas lexicaux decrivant les correspondances entre fonctions syntaxiques et cas sémantiques. La strategie cooperative accorde une certaine préeminence à la sémantique. Ainsi, l’analyseur sémantique, qui est à même de surmonter les problèmes d agrammaticalité, poursuit seul l’analyse lorsque la syntaxe se trouve dans une impasse.

Le chapitre huit présente divers résultats concernant la courverture linguistique de l’analyseur sémantique,sa tolérance aux variations d’expression, ainsi enfin que la réduction de la combinatoire de recherche induite par la coopération avec la syntaxe. Nous concluons enfin en nous interrogeant plus particulierement sur le rôle des deux composantes syntaxiques et sémantiques dans le processus d’analyse linguistique.