Inventaire et classement des constructions verbales dans un corpus de français parlé dans l’Allier.

Résumé :

Effectuée entre 2000 et 2004, cette thèse s’articule autour de deux parties : la première explique la manière dont nous avons recueilli puis traité le corpus, constitué durant la première année de ce travail ; la seconde, après avoir délimité ce que nous nommons construction verbale (désormais CV), introduit et présente la base de données classées des CV que nous avons constituée à partir du corpus, et qui figure en annexe.

Le corpus a été constitué et présenté de telle sorte que l’on peut suivre l’entretien et lire la transcription de manière simultanée. En effet, les 7 heures d’enregistrements transcrits sont disponibles à la fois en fichiers audios et en fichiers textes. La transcription a été réalisée en orthographe normée, selon les conventions utilisées autrefois par le Groupe Aixois de Recherche en Syntaxe. Les locuteurs sont résidents des trois agglomérations urbaines les plus importantes du département : Vichy, Montluçon et Moulins ; ils ont entre 18 et 92 ans au moment de l’entretien, et sont issus de catégories socioprofessionnelles variées. Pour chaque entretien, d’une durée d’environ 30 minutes, 15 minutes sont transcrites. Ainsi, le corpus comporte environ 100 000 mots.

L’inventaire et le classement des constructions verbales apparaissant dans ce corpus sont explicités durant la deuxième partie de la thèse. Après avoir défini les principales notions utilisées dans ce travail (CV, élément construit, pronom, etc.), nous présentons les verbes présents dans le corpus et les propriétés du classement. Ainsi, pour 352 verbes dépouillés, nous avons analysé et classé 7 000 CV en fonction de leur verbe constructeur, de leurs propriétés lexicales et grammaticales, et constaté qu’il n’existe pas deux verbes français identifiés exactement par la même construction, puisque nous obtenons une moyenne de 1,8 construction par verbe étudié.

Ce travail n’est pas ici considéré comme un aboutissement ; au contraire, nous l’envisageons comme un point de départ vers d’autres types de recherches. En effet, ce classement peut servir de base de travail dans divers domaines, qu’il s’agisse par exemple d’analyse de discours, d’enseignement du français, ou encore de traitement automatique. Le fait que les tables des constructions verbales traitées apparaissent en liaison avec les contextes du corpus d’où elles sont extraites permettra au chercheur d’ajouter ou de supprimer les propriétés qu’il juge pertinentes pour sa ou ses requêtes, et ainsi de faire évoluer cet outil en fonction de ses besoins.