Programme 1 - Syntaxe, sémantique, pragmatique

Resp. : I. Novakova (PR), L. Vincent-Durroux (PR)

Les recherches du programme « Syntaxe, sémantique, pragmatique » portent sur des thématiques, situées à l’interface entre la syntaxe, la sémantique et l’analyse discursive, notamment la syntaxe et la sémantique des prédicats causatifs, la combinatoire syntaxique et lexicale. Le niveau pragmatique est présent en particulier à travers l’ancrage discursif (prise en compte des genres de discours), à travers les aspects liés à la multimodalité (langues gestuelles, oral ou écrit) ainsi que dans la prise en compte de la dimension énonciative. Les travaux menés sur l’écrit scientifique, en particulier, cherchent à articuler un modèle lexical du sens avec les aspects énonciatifs, rhétoriques, pragmatiques et textuels. Un premier volet des recherches, développé en particulier au sein de l’ANR EMOLEX s’attache à décrire le lexique des émotions dans une perspective interlinguistique. Un second volet poursuit les travaux menés à partir de la base SCIENTEXT sur la phraséologie des écrits scientifiques. Dans ces deux premiers volets, la description du profil discursif des lexies (leur rôle dans la structuration de la phrase et du texte, leur appartenance à des scénarios, à des schémas argumentatifs) vise à élargir l’analyse de la combinatoire vers le niveau textuel.

 

Programme 2 - Traitement Automatique des Langues

Resp. Olivier Kraif (MCF)

Les recherches du programme TAL s’articulent autour d’un objet central, partagé avec le programme 1 : les corpus électroniques (principalement écrits). Ces corpus peuvent être envisagés de deux manières : d’une part, comme ressource pour le TAL (pour le développement et l’évaluation des outils d’analyse morphosyntaxique, d’analyse sémantique, de traduction, de classification, etc.) ; d’autre part, ils constituent un objet d’étude pour l’observation (en linguistique, en lexicographie, en terminologie, en didactique des langues, dans le domaine des humanités numériques, etc.). Dans cette deuxième perspective, le TAL intervient à différentes étapes de la chaine de traitement : reformatage et mise en oeuvre des normes d’encodage, annotation morphologique, syntaxique et sémantique, indexation, recherche, développement d’interfaces d’interrogation, extraction de statistiques et de données langagières, etc. Les projets liés à ce programme, très divers dans leurs objectifs, concernent ces différentes perspectives, à partir de corpus de types variés : corpus de manuscrits et d’annotations d’auteurs, corpus spécialisés de SMS et de tweets, corpus multilingues parallèles et comparables, corpus d’écrits scientifiques, etc.

Mis à jour le 7 janvier 2019