Vers la traduction de documents scientifiques complets
Le projet ANR MaTOS (Machine Translation for Open Science)n menĂ© par l’ISIR (MLIA), Inria (ALMAnaCH), UniversitĂ© Paris-CitĂ© (CLILLAC-ARP) et CNRS (INIST), vise Ă dĂ©velopper de nouvelles mĂ©thodes pour la traduction automatique (TA) intĂ©grale de documents scientifiques, ainsi que des mĂ©triques automatiques pour Ă©valuer la qualitĂ© des traductions produites.
Notre principale cible applicative est la traduction d’articles scientifiques entre le français et l’anglais, pour laquelle des ressources linguistiques peuvent être exploitées pour obtenir des traductions plus fiables, aussi bien dans une optique d’aide à la publication que pour des besoins de lecture ou de fouille de textes.
Le projet vise Ă contribuer de plusieurs façons Ă l’automsaisation du traitement d’articles scientifiques : (a) en dĂ©veloppant de nouvelles ressources ouvertes pour la TA spĂ©cialisĂ©e; (b) en amĂ©liorant, par l’étude des variations terminologiques, la description des marqueurs de cohĂ©rence textuelle pour les articles scientifiques; (c) en Ă©tudiant de nouvelles mĂ©thodes de traitement multilingue pour ces documents ; (d) en proposant des mĂ©triques dĂ©diĂ©es Ă la mesure des progrès pour ce type de tâches. Le rĂ©sultat final permettra, par une traduction amĂ©liorĂ©e, de fluidifier la circulation et la diffusion des savoirs et connaissances scientifiques.