En 2005, l’objectif initial du projet « Multimodalité » est de contribuer à une meilleure connaissance du développement tardif de la parole dans ses aspects pragmatiques, discursifs et gestuels, chez l’enfant au développement typique comme chez l’enfant au développement atypique, tout en appréciant l’impact de la langue et de la culture d’origine sur ce développement.
Le corpus Emolex est un corpus comportant des textes journalistiques (environ 75%) et littéraires (environ 25%) en 5 langues : allemand, anglais, espagnol, français et russe.
Ce corpus a pour but de permettre des analyses sur les compétences rédactionnelles en français langue maternelle à un niveau avancé et peut également servir de ressource didactique pour la formation à l’écrit.
La recherche Scoledit a pour objectif de procéder à la collecte, à l’annotation et à l’édition d’un grand corpus numérique longitudinal de textes narratifs et descriptifs.
Composé d'un corpus et d'outils logiciels, Scientext est une base de données textuelles permettant d'effectuer une étude linguistique du positionnement et du raisonnement dans les écrits scientifiques, grâce à des requêtes linguistiques et statistiques.