
Conférence de Dominique Stutzmann (IRHT/Humboldt-univ.) dans le cadre de la journée d’études »De la source au texte intégral. L’utilisation de la reconnaissance automatique des caractères (ATR)«
Cette conférence s’adresse aux jeunes historiennes et historiens désireux de mettre en œuvre la reconnaissance automatique de texte (ATR), et ce, pour mieux en comprendre l’évolution et l’impact sur le domaine de l’histoire. Il sera d’abord question du développement de la reconnaissance optique des caractères (OCR) et des défis relevés par l’indexation et la transcription manuscrite (HTR) qui ont considérablement amélioré l’accessibilité et l’exploitation des sources historiques. L’accent sera mis sur les entreprises récentes, en particulier celles en lien avec les projets de recherche de l’IRHT (Himanis, Horae, Home) et du cluster 3 de Biblissima+ (Intelligence artificielle et la reconnaissance de formes et d’écritures manuscrites), en soulignant leur interconnexion avec d’autres tâches pertinentes dans le domaine paléographique et linguistique. Cela inclura la reconnaissance de scripteurs, la datation, l’expertise, la reconnaissance d’entités nommées (NER), la liaison d’entités nommées (NEL) et la stylométrie.
Dans sa conférence, Dominique Stutzmann montrera ainsi comment ces avancées transforment radicalement la manière dont les historiennes et les historiens abordent leurs sources. Il montrera comment ces tâches complémentaires permettent de créer une approche holistique pour analyser et contextualiser les sources historiques de manière plus précise et approfondie. Plus spécifiquement, il s’agira de voir comment les concepts de »distant editing« et d’»artificial edition« peuvent trouver leur incarnation dans l’utilisation de modèles de langage avancés tels que GPT, qui ont ouvert de nouvelles perspectives en matière d’analyse et de compréhension des documents historiques.
Inscription pour une participation en ligne: Zoom
Crédit photo: Capture d'écran du site du projet de recherche Himanis de l’IRHT.