Rôle de la syllable dans la perception de la parole.

Résumé:

Comment notre cerveau identifie-t-il un mot, quand celui-ci peut-être prononcé par des locuteurs différents, et dans des contextes différents ? Toutes les théories contemporaines supposent que le système perceptif fournit une représentation qui est comparée avec des descriptions de chaque mot mémorisées par le cerveau. Les avis sont plus partagés quant au format précis de cette représentation. Classiquement, elle est envisagée comme une suite de phonèmes, voire comme une matrice de traits distinctifs. Une difficulté pour ce point de vue est qu’on n’est pas encore parvenu à identifier des invariants acoustiques caractéristiques de chaque phonème ou trait distinctif.

Certains modèles actuels ont raffiné la conception classique en supposant que les traits ou les phonèmes pouvaient prendre des valeurs continues, et que le cerveau trouverait le meilleur appariement (« best-fit ») parmi les mots du lexique [Elman86,Marslen-Wilson87]. D’autres auteurs proposent d’abandonner complètement les descriptions d’inspiration linguistique et suggèrent que le cerveau effectue une comparaison « directe » avec l’acoustique [Klatt80,Goldinger92,Pisoni92]. Pour d’autres, la représentation élaborée par le système perceptif est une suite de syllabes [Massaro72,Massaro87,Segui84,Mehler90a].

Dans cette thèse, nous explorons la représentation perceptive de la parole et il apparaît clairement que la structure syllabique des stimuli influence les réponses des sujets. Premièrement, dans une tâche d’interférence de Garner, les sujets qui doivent classer un phonème cible, sont plus génés par une variation phonémique à l’intérieur de la syllabe contenant la cible, que par une variation à l’extérieur de celle-ci. Deuxièmement, nous montrons que dans une tâche de détection de phonème généralisée, les sujets peuvent focaliser leur attention sur un phonème placé dans une position syllabique précise, mais pas sur une position phonémique définie séquentiellement [Pallier93].

Ces résultats sont importants car ils démontrent que la représentation perceptive spécifie les frontières syllabiques, ce que la plupart des modèles de perception de la parole ne prenaient pas en compte ; toutefois, ils n’impliquent pas que cette représentation soit une simple séquence de syllabes inanalysées, ni que les syllabes soient reconnues avant les traits distinctifs ou les phonèmes. En fait, dans des expériences originales d’amorçage de la réponse motrice (inspirées de [Miller82]), nous observons une facilitation entre des syllabes qui partagent un trait phonétique. Ces résultats suggèrent que la représentation de la parole stipule également les traits distinctifs, mais ne révèlent pas s’ils sont reconnus avant ou après la syllabe. Nos résultats nous conduisent à proposer que la perception de la parole est effectuée par un « parseur phonologique » [Church87] qui élaborerait en continu une représentation linguistique structurée [Frazier87], où la syllabe jouerait un rôle d’unité d’organisation des traits distinctifs.

Un aspect important des recherches présentées (12 expériences effectuées sur plus de 200 sujets français, américains et espagnols) est de souligner l’omniprésence des processus décisionnels dans les tâches psycholinguistiques, et de proposer de les utiliser positivement plutôt que de chercher à en atténuer l’influence. Notre travail suggère que les méthodes de manipulation de l’attention sont particulièrement bien adaptées pour déterminer si telle ou telle information est calculée par le cerveau. L’idée est qu’une information présente dans une représentation mentale doit pouvoir servir à « accrocher » l’attention.

Finalement, la plupart des théories en reconnaissance des mots prennent pour acquis une certaine représentation de l' »entrée », justifiée la plupart du temps par des considérations ou bien linguistiques, ou bien acoustiques. Nos expériences sont un premier pas pour explorer expérimentalement le format réellement utilisé par le cerveau. A l’avenir, il serait souhaitable d’obtenir des preuves convergentes en utilisant d’autres techniques expérimentales, comme les potentiels évoqués cérébraux. Parmi les questions qui méritent également d’être approfondies, figure celle de savoir si et comment sont représentées les informations suprasegmentales telles que l’accent, et ceci dans des langues qui font des utilisations différentes de ces informations.