Le développement de projets pluri- et interdisciplinaires en humanités numériques et l'importance des sources littéraires mises à disposition par la numérisation massive d'archives invitent, ces dernières années, à interroger les méthodes pour leur exploration outillée. Les éditions numériques enrichies et l'annotation variée des ressources littéraires posent en particulier la question de leur spécificité auctoriale et générique lorsqu'elles sont préparées et interrogées dans un environnement numérique.
Ainsi, les données linguistiques extraites d'oeuvres littéraires à l'aide de divers outils numériques demandent à être appréhendées dans leurs spécificités linguistiques et stylistiques (patrons lexico-syntaxiques, fonctions discursives). Progressant dans le sens de ce que Rastier (2011) nomme la « reconquête de l'expression », l'enrichissement du texte par le traitement informatique ouvre la voie à de nouveaux objets d'étude et faits observables et, par conséquent, à une théorie à construire.
C'est dans cette perspective qu'émergent de nouvelles disciplines telle la stylistique outillée (Digital Stylistics). Cette dernière est conçue comme méthodologiquement proche des autres disciplines numériques, par l'annotation et, plus largement, par sa conception de l'artefact scientifique pour le traitement quantitatif, et surtout statistique, emprunté à la lexicométrie et à la linguistique de corpus. Ainsi, l'approche des genres par leur contenu et par la génétique des textes demande à être complétée par une approche fondée sur les outils de la linguistique
et de la stylistique de corpus permettant d'extraire de grandes masses de données langagières.


Objectif :

  • enrichir les corpus de la PhraseoBase par un corpus romanesque du XIXe s.;
  • extraire de manière automatique les motifs textuels spécifiques à un genre ou à un auteur ;
  • inventorier les motifs dont la fréquence augmente ou diminue au cours de la campagne de révision d'une oeuvre. Ce serait une manière novatrice d'entrer dans l'histoire des pratiques rédactionnelles littéraires à partir des transformations d'une même oeuvre au fil du temps ;
  • analyser l'évolution des patrons lexico-grammaticaux formant des motifs dans une sélection d'oeuvres et d'auteurs en alliant nos méthodologies (changement esthétique de la norme stylistique, mutations historiques et sociales menant à de nouvelles pratiques rédactionnelles).
  • mise en commun des méthodologies et des outils utilisés dans la Base de données Variance de l’Université de Lausanne et ceux implémentés dans le Lexicoscope (Lidilem) afin de comparer d’une part, des observables linguistiques extraites automatiquement à partir de différentes éditions d’œuvres de Balzac, Flaubert, Zola et, d’autre part, d’identifier les moyens lexico-syntaxiques statistiquement spécifiques comparés aux données issues d’un corpus de contraste du XIXème siècle, constitué pour les besoins du projet.

Intérêt de relever ce défi scientifique :

retombées théoriques (linguistique descriptive, humanités numériques, stylistique) et appliquées (TAL, traductologie)
 

Financeur :

Logo - www.auvergnerhonealpes.fr
Région Auvergne Rhône Alpes – Pack Ambition International
 
Mis à jour le 6 octobre 2021