Composé d'un corpus et d'outils logiciels, Scientext est une base de données textuelles permettant d'effectuer une étude linguistique du positionnement et du raisonnement dans les écrits scientifiques, grâce à des requêtes linguistiques et statistiques.
Scientext comporte plusieurs sous-corpus :
Corpus anglais d’écrits scientifiques,
Corpus français d’écrits scientifiques,
Corpus d’évaluation de communications,
Corpus d’écrits universitaires en anglais langue étrangère.
De nouvelles disciplines et de nouveaux sous-genres seront bientôt intégrés dans le corpus.