Une expérience de post-édition collaborative pour le domaine du TAL

Nous organisons une expérience visant à collecter des révisions de traductions produites dans des conditions réalistes par des spécialistes du domaine du TAL (Traitement des Automatique des Langues, entendu dans une acception large, incluant le traitement de la parole, de documents écrits ou signés, la recherche d’information, etc). Ces données seront collectées depuis l’application disponible à l’adresse https://postedition.anr-matos.fr. Des informations complémentaires sont données ci-dessous.

Quel est le but de cette recherche ?

Le but principal de cette recherche est de préparer une étude à grande échelle qui sera conduite en 2024 sur la plateforme HAL. Cette étude pilote vise principalement à évaluer la qualité actuelle des systèmes de traduction automatique pour des traductions de textes scientifiques et à mesurer l’effort qui serait nécessaire à des spécialistes du domaine pour réviser ces traductions automatiques de manière à les rendre publiables. Elle permettra en second lieu de comparer objectivement plusieurs systèmes de traduction automatique.

Quel est le calendrier de la recherche ?

La durée prévisionnelle de la recherche est d’environ 1 mois, pendant lequel il sera possible d’accéder à la plate-forme expérimentale et de post-éditer des traductions automatiques. La date d’ouverture de la plateforme est le 8 juin 2023.

Qui peut participer à l’étude ?

La seule condition pour participer est une expertise avérée dans le domaine du TAL, correspondant à l’achèvement d’un Master 2 dans le domaine, ainsi qu’une bonne maitrise de la langue française, suffisante pour rédiger de manière autonome un résumé d’article en français.

Comment sont traitées les données recueillies ?

Dans le cadre de cette recherche, les participant-e-s doivent se créer un compte; puis sont invités à effectuer des révisions (ou post-éditions) de traductions automatiques de résumés d’articles dans le domaine du TAL. Les révisions serviront à améliorer les versions françaises de traductions réalisées depuis l’anglais.

Durant la procédure d’inscription, les participant-e-s doivent répondre à quelques questions relatives à leur connaissance du domaine et leur maitrise de la langue française, puis consentir à l’exploitation future des traductions produites. Aucune information personnelle identifiante n’est collectée durant cette étape.

Les sessions de révisions se déroulent sur une plateforme dédiée. Chaque session correspond à la correction d’une unique traduction d’un résumé d’article, à choisir dans une liste. Au terme de chaque session, seuls sont enregistrés (1) le texte révisé, et (2) la durée de la session. Aucune information personnelle identifiante n’est collectée durant cette étape.

Quels sont les droits des participant-e-s ?

La participation à cette recherche est entièrement libre et volontaire.

Il est possible, tout au long de la recherche et à son issue, de demander des informations des explications sur le déroulement de la recherche au responsable scientifique de l’étude.

Il est possible de se retirer à tout moment de la recherche sans justification, et demander que toutes les traductions qui ont été révisées soient supprimées de la base de données.