Equipes participantes

Sorbonne-Université (ISIR - MLIA)

L’équipe MLIA de l'ISIR mène des recherches centrées sur les thématiques de l’apprentissage statistique (Machine Learning) avec un accent sur les aspects algorithmiques et sur les applications. Elle étudie l’apprentissage profond dans différents domaines, avec un accent particulier sur la vision par ordinateur, le traitement du langage naturel et l’apprentissage profond basé sur la physique. Concernant les applications en traitement des langues, citons : (i) la RI interactive, les systèmes conversationnels ou les systèmes de recherche axés sur les tâches, la génération de texte, le résumé abstractif, l’extraction d’information, la reconnaissance d’entités nommées et la traduction automatique.

François Yvon

Directeur de recherche

Ziqian Peng

Doctorante

Paul Lerner

Post-doctorant

Inria Paris (ALMAnaCH)

L'équipe ALMAnaCH (Automatic Language Modelling and Analysis & Computational Humanities) est spécialisé dans le traitement automatique des langues (TAL) et les humanités numériques, à l'interface entre l'informatique théorique, l'apprentissage automatique et la linguistique. Le travail de l'équipe couvre une variété de sujets liés à la variation linguistique, à la fois dans un sens historique et entre les états de langue contemporains (développement de systèmes de TAL robustes pour le contenu web bruité et les variétés dialectales de la langue, par exemple). Nos intérêts s'étendent également au pré-entraînement des réseaux neuronaux (par exemple le modèle CamemBERT), à l'interprétabilité des approches neuronales, au développement de ressources linguistiques (par exemple le corpus OSCAR, les corpus arborés, les corpus parallèles, les lexiques, mais également les corpus historiques construits à l'aide d'OCR et d'HTR appliqués aux documents d'archives et autres documents historiques), à l'évaluation et à l'extraction et la récupération d'informations (en particulier à partir de corpus spécialisés et de documents historiques).

Rachel Bawden

Chargée de recherche

Éric de la Clergerie

Chargé de recherche

Laurent Romary

Directeur de recherche

Nicolas Dahan

Doctorant

Panagiotis Tsolakis

Ingénieur de Recherche

Université Paris-Cité (CLILLAC-ARP)

L’unité de recherche 3967 CLILLAC-ARP, Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus-Atelier de Recherche sur la Parole est une unité de l'Université Paris-Cité rattachée à l’École Doctorale de Sciences du langage et adossée à trois UFR. Dans le cadre de MaTOS, le CLILLAC-ARP apporte en particulier son expertise sur la terminologie en discours et sa variation, la néologie, la linguistique de corpus, l'analyse contrastive des discours scientifiques bilingues, la traduction spécialisée et la post-édition, ainsi que l'évaluation humaine de la traduction automatique et de la post-édition.

Natalie Kübler

Professeur

Alexandra Mestivier

Maître de conférences

Lichao Zhu

Maître de conférences

Maud Bénard

Docteure

José Cornejo Cárcamo

Doctorant

Joachim Minder

Doctorant

Franka Wurps

Ingénieur de recherche

CNRS (INIST)

L’Institut de l’Information Scientifique et Technique (Inist) est une unité d’appui et de recherche (UAR) du CNRS spécialisée en information scientifique et technique (IST). La mission de l’Inist est de fournir, aux unités de recherche et aux services d’appui à la recherche, des outils et des services permettant l’accès, la diffusion, la valorisation, l’analyse, la fouille ou l’enrichissement des données scientifiques au sens le plus large (ensemble des informations produites par la recherche comprenant des textes, documents, logiciels ou publications). L’Inist déploie ses activités autour de 3 axes «accès à l’information scientifique», «valorisation des données de la recherche», «analyse et fouille de l’information» . Son projet d’unité s’inscrit dans le contexte de politique institutionnelle et nationale de science ouverte.

Jean-François Nominé

Ingénieur de recherche

Mathilde Huguin

Ingénieure de recherche

Manon Delorme

Chargée de projet