Ce corpus a pour but de permettre des analyses sur les compétences rédactionnelles en français langue maternelle à un niveau avancé et peut également servir de ressource didactique pour la formation à l’écrit.

Ce corpus a été constitué à partir d’écrits d’étudiants de la licence première année au master deuxième année (écrits universitaires comme des mémoires ou des fiches de lecture et écrits professionnels comme des lettres de motivation et comptes-rendus).

Les disciplines sont pour l’essentiel sciences du langage, didactique du français, sciences de l’éducation ; sont notamment représentés des écrits de futurs enseignants de français.

Composition

Le corpus est constitué de 11 sous-corpus répondant aux critères suivants : au moins 10 textes relevant des mêmes conditions de production, c’est-à-dire même genre de texte, même discipline, même consigne donnée aux étudiants, même niveau (mais pas nécessairement la même promotion d’étudiants : on peut avoir par exemple deux promos consécutives).  

Téléchargements

Chaque archive contient le sous-corpus en 4 versions* :
- format doc,
- format pdf,
- format txt,
- format xml : un en-tête de type TeiHeader, contenant les méta-données qui décrivent le sous-corpus (date, licence, niveau d’étude, etc.) + un balisage structurel du texte

* certains sous-corpus ne sont actuellement disponibles qu’aux formats txt et xml.

  • Dossiers L2
  • Rapports L3
  • Lettres motivation M1
  • Comptes-rendus M1
  • Analyses M1
  • TER M1
  • TER M1 (PDF)
  • Comptes-rendus M2 (professionnels)
  • Comptes-rendus M2 (articles)
  • Synthèses M2
  • Parties théoriques de mémoires M1
  • Mémoires M2


Les corpus sont disponibles aussi via Ortolang que nous remercions pour leur aide.

L’ensemble du corpus est libre de droits, disponible sous licence CC BY-NC-SA
Pour une éventuelle utilisation commerciale, nous consulter.

Mis à jour le 8 novembre 2019