Histoire numérique

Projet de recherche

L’HTR appliquée aux grands corpus médiévaux: les relations entre universitaires et population urbaine à Paris à la fin du Moyen Âge


Le projet s’attache à étudier les processus d’adaptation de modèles de transcription automatique de textes manuscrits (Handwritten Text Recognition – HTR) dans le cadre de l’analyse d’un corpus médiéval. Les sources observées sont les registres de plaidoiries du Parlement civil de Paris conservés aux Archives Nationales (Série X). Ces registres sont une source importante d’informations pour l’histoire juridique et urbaine de la capitale française au cours des XIVe et XVe siècles. Il s’agit concrètement d’analyser les relations entretenues par les universitaires, catégorie privilégiée, avec le reste de la population urbaine. La période est traversée par de nombreux moments de crises politiques, ecclésiologiques ou diplomatiques qui influent sur les mobilités universitaires et la capacité des étudiants, notamment étrangers, à passer leurs grades dans la capitale française. L’altérité de ces étudiants est au cœur du processus de leur intégration dans une société au sein de laquelle ils passent de nombreuses années, si ce n’est leur vie entière. Ce travail touche ainsi à la problématique plus large des populations qui voyagent au Moyen Âge, au multilinguisme ou encore à la coexistence de plusieurs cultures au sein d’une société.

Dans le domaine des méthodes numériques, le focus se concentre sur l’adaptation de techniques HTR sur de grands corpus textuels, un procédé qui pose de nombreuses problématiques. Parmi elles, on trouve celles liées à l’évolution des sources au fil du temps, celle de la variabilité de la langue médiévale, de même que des biais introduits dans l’analyse scientifique ou de l’efficacité du modèle de transcription de textes produit pour la question historique.

Le projet travaille en particulier sur les conditions d’utilisation d’une transcription bruitée, c’est-à-dire non-corrigée, pour une analyse historique sérielle et qualitative. Pour cela, plusieurs usages et plateformes de transcription automatiques de textes manuscrits sont testées et analysées. Le projet contribue ainsi à l’objet de la critique des outils numériques (digital tool criticism) et donc à la réflexion théorique et pratique d’une herméneutique numérique dans les sciences historiques.

Crédit photo: Conflit entre le maître Paul Nicolas et l’Université de Paris, X/1a/4795, fol. 33, Archives Nationales, https://www.siv.archives-nationales.culture.gouv.fr/siv/media/FRAN_IR_057043/d_1_1_4_12/FRAN_0354_005500_L, Public Domain.