Colloque

La constitution de corpus en diachronie longue : méthodologies, objectifs et exploitations linguistiques et stylistiques

13 octobre 2022 - 14 octobre 2022

Depuis plusieurs décennies, la numérisation des textes anciens et les progrès du TAL pour les traiter et les interroger ont largement modifié nos habitudes de travail. Il est désormais possible d’obtenir des données quantitatives massives qui affinent notre perception des phénomènes linguistiques ou stylistiques pour des corpus écrits dans des états de langue anciens. Les corpus numériques créés depuis maintenant près d’un quart de siècle permettent d’envisager plus facilement la dynamique du français en diachronie longue dont l’aboutissement, après de nombreuses années de travail, de la Grande Grammaire Historique du Français (Marchello-Nizia et alii, 2020) constitue un bel exemple. Nous définissons un corpus en diachronie longue comme un corpus périodisé, regroupant des textes choisis pour leur caractère représentatif des états de langue (de l’ancien français au français contemporain) des périodes couvertes par le corpus.

 

Crédits: Iris Fabry

 

Les axes de recherche que nous proposons peuvent se situer dans une perspective à la fois rétrospective (quel a été l’apport des corpus diachroniques ? comment valoriser les corpus constitués au cours des dernières décennies ?) et prospective (quels sont les défis théoriques et méthodologiques qui attendent la recherche en diachronie à l’ère des humanités numériques et des corpus outillés ?). Les réflexions pourront s’appuyer sur des corpus en langue française ou en langue étrangère.

Mis à jour le 4 avril 2022