Aller au contenu principal

Phraséotext

La composition du corpus littéraire français s’inspire de la classification adoptée par le Brown Corpus entre « belles lettres » (la littérature reconnue comme telle) et « general fiction » (l’étiquette désignant une production romanesque contemporaine moins considérée par la critique). S’y ajoute une deuxième distinction entre ce corpus littéraire et un corpus paralittéraire classifié selon des critères génériques éditoriaux (maisons d’éditions spécifiques et, à l’intérieur de celles-ci, collections spécifiques ; romans de science-fiction, policiers, sentimentaux). Les métadonnées permettent de partitionner le corpus en fonction de ces critères.

Les corpus latins analysés sont composés de deux genres littéraires en prose, unis par leur caractère oratoire (les rhéteurs Cicéron et Sénèque le Père ; les historiens Salluste, César, Tite-Live et Tacite). Les 80 textes latins représentent plus de 3 millions de mots.

Le corpus est librement consultable (après inscription).

Publié le 23 décembre 2018

Mis à jour le 23 novembre 2023