đť•„aTOS

đť•„aTOS

Traduction Automatique pour Ouvrir la Science


L’équipe MLIA de l'ISIR mène des recherches centrées sur les thématiques de l’apprentissage statistique (Machine Learning) avec un accent sur les aspects algorithmiques et sur les applications. Elle étudie l’apprentissage profond dans différents domaines, avec un accent particulier sur la vision par ordinateur, le traitement du langage naturel et l’apprentissage profond basé sur la physique. Concernant les applications en traitement des langues, citons : (i) la RI interactive, les systèmes conversationnels ou les systèmes de recherche axés sur les tâches, la génération de texte, le résumé abstractif, l’extraction d’information, la reconnaissance d’entités nommées et la traduction automatique.

François Yvon
Directeur de recherche
Ziqian Peng
Doctorante
Paul Lerner
Post-doctorant

L'équipe ALMAnaCH (Automatic Language Modelling and Analysis & Computational Humanities) est spécialisé dans le traitement automatique des langues (TAL) et les humanités numériques, à l'interface entre l'informatique théorique, l'apprentissage automatique et la linguistique. Le travail de l'équipe couvre une variété de sujets liés à la variation linguistique, à la fois dans un sens historique et entre les états de langue contemporains (développement de systèmes de TAL robustes pour le contenu web bruité et les variétés dialectales de la langue, par exemple). Nos intérêts s'étendent également au pré-entraînement des réseaux neuronaux (par exemple le modèle CamemBERT), à l'interprétabilité des approches neuronales, au développement de ressources linguistiques (par exemple le corpus OSCAR, les corpus arborés, les corpus parallèles, les lexiques, mais également les corpus historiques construits à l'aide d'OCR et d'HTR appliqués aux documents d'archives et autres documents historiques), à l'évaluation et à l'extraction et la récupération d'informations (en particulier à partir de corpus spécialisés et de documents historiques).

Rachel Bawden
Chargée de recherche
Éric de la Clergerie
Chargé de recherche
Laurent Romary
Directeur de recherche
Nicolas Dahan
Doctorant
Panagiotis Tsolakis
Ingénieur de Recherche

L’unité de recherche 3967 CLILLAC-ARP, Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus-Atelier de Recherche sur la Parole est une unité de l'Université Paris-Cité rattachée à l’École Doctorale de Sciences du langage et adossée à trois UFR. Dans le cadre de MaTOS, le CLILLAC-ARP apporte en particulier son expertise sur la terminologie en discours et sa variation, la néologie, la linguistique de corpus, l'analyse contrastive des discours scientifiques bilingues, la traduction spécialisée et la post-édition, ainsi que l'évaluation humaine de la traduction automatique et de la post-édition.

Natalie KĂĽbler
Professeur
Alexandra Mestivier
Maître de conférences
Lichao Zhu
Maître de conférences
Maud BĂ©nard
Doctorante
José Cornejo Cárcamo
Doctorant
Joachim Minder
Doctorant

L’Institut de l’Information Scientifique et Technique (Inist) est une unité d’appui et de recherche (UAR) du CNRS spécialisée en information scientifique et technique (IST). La mission de l’Inist est de fournir, aux unités de recherche et aux services d’appui à la recherche, des outils et des services permettant l’accès, la diffusion, la valorisation, l’analyse, la fouille ou l’enrichissement des données scientifiques au sens le plus large (ensemble des informations produites par la recherche comprenant des textes, documents, logiciels ou publications). L’Inist déploie ses activités autour de 3 axes «accès à l’information scientifique», «valorisation des données de la recherche», «analyse et fouille de l’information» . Son projet d’unité s’inscrit dans le contexte de politique institutionnelle et nationale de science ouverte.

Jean-François Nominé
Ingénieur de recherche
Mathilde Huguin
Ingénieure de recherche
Manon Delorme
Chargée de projet