Les objectifs de cette action sont de mettre en œuvre des techniques d'alignements à différents niveaux de granularité (textes, phrases, syntagmes, unités lexicales), afin de dégager des observations 1/ pour l'étude contrastive (phraséologie, lexique) 2/ pour l'étude de la traduction. L'action vise ainsi à valoriser les corpus multilingues parallèles élaborés au Lidilem ces dernières années.

Plusieurs chantiers sont envisagés :

  • Le corpus d'articles scientifiques parallèles anglais-français du projet LaST sera annoté, au niveau du Lexique scientifique transdisciplinaire (LST) et sera publié sur une plateforme d'interrogation en ligne. Une ressource lexicale bilingue sera construite à partir de ces annotations. Ces développements seront effectués en lien avec l'action "Corpus académiques, lexique scientifique transdisciplinaire et phraséologie" menée par Agnès Tutin.
  • Les différentes versions du corpus "Présence de l'étranger" seront également mises en ligne avec les annotations permettant de visualiser la stabilité des mots dans le processus de rétrotraduction.
  • Au plan des développements TAL, un outil de récolte de corpus parallèles viendra compléter les outils actuellement mis en ligne avec le WebAlignToolkit.
  • Enfin, nous envisageons la rédaction d'un article de synthèse (survey) concernant l'utilisation didactique des corpus parallèles.

Cette action permettra de valoriser les corpus parallèles déjà élaborés, et d'apporter une dimension contrastive aux études sur le LST. Les outils et corpus en ligne (autour du WebAlignToolkit etdu Lexicoscope) permettront d'offrir une plus grande visibilité aux ressources produites par le laboratoire. Dans l'application des technologies du TAL à la linguistique de corpus, cette action concerne la thématique transversale 1 : interaction langage/numérique.

Partenariats :

Mis à jour le 11 février 2020