Appel à candidature pour la participation à l’atelier pratique. L’atelier pratique des 7 et 8 septembre 2023 a pour but de former les chercheuses et les chercheurs à l’évaluation de leurs besoins et à la mise en pratique des techniques d’ATR sur des numérisations de sources textuelles pour leurs projets de recherche. Nous présenterons les principales étapes de travail à mettre en œuvre et les mettrons également en pratique.
Qu’elles aient été photographiées lors d’une visite en dépôt d’archives ou trouvées sur le catalogue en ligne d’une institution patrimoniale, les images de sources textuelles constituent la base du travail scientifique pour de nombreux chercheurs et chercheuses en sciences humaines. Trouver, créer et collecter des images sur son ordinateur personnel ne reste néanmoins que la première étape du processus de recherche, et peut-être la plus simple maintenant qu’elle est facilitée par les progrès de la numérisation. L’étape suivante consiste à déchiffrer le texte figurant sur les images, à le lire ou à le transcrire, puis à l’enregistrer de manière à pouvoir travailler avec. Plus le nombre d’images est important et la transcription difficile, plus l’on souhaiterait que la technologie nous assiste dans le processus de transformation des images en textes exploitables par une machine. La bonne nouvelle, c’est que celle-ci existe et qu’elle est accessible non seulement aux grands projets, mais aussi aux chercheuses et chercheurs individuels, même pour celles et ceux qui ne sont pas familiers ou ne se sentent pas à l’aise avec les outils numériques.
L’appellation Automated Text Recognition (ATR) est utilisée de manière générique pour désigner la reconnaissance de textes imprimés par Optical Character Recognition (OCR) et la reconnaissance de textes manuscrits et tapuscrits par Handwritten Text Recognition (HTR).
Objectifs de l’atelier
L’atelier pratique des 7 et 8 septembre 2023 a pour but de former les chercheuses et les chercheurs à l’évaluation de leurs besoins et à la mise en pratique des techniques d’ATR sur des numérisations de sources textuelles pour leurs projets de recherche. Nous présenterons les principales étapes de travail à mettre en œuvre et les mettrons également en pratique. On abordera ainsi l’acquisition et l’optimisation des images, l’analyse de la mise en page, la reconnaissance et la correction du texte, le choix du format de sortie et la réutilisation des données produites. Outre la transmission de connaissances théoriques et pratiques dans le domaine de l’ATR, il s’agira également d’initier les chercheuses et les chercheurs à la logique des méthodes numériques, de leur présenter les supports méthodologiques existants, et de leur ouvrir ainsi de nouveaux horizons de recherche. La réutilisation des images, des textes et des méthodes sera au cœur du dispositif proposé.
À qui s’adresse l’atelier?
Nous souhaitons, à travers cet atelier, mettre en contact des chercheuses et chercheurs issus de disciplines historiques originaires de pays francophones et germanophones. L’atelier s’adresse donc en premier lieu aux doctorantes et doctorants ainsi qu’aux post-doctorantes et post-doctorants de toutes les disciplines des sciences humaines qui travaillent sur des sources historiques allemandes et/ou françaises, quelle que soit l’époque. Les étudiantes et étudiants en master sont également les bienvenus si leur travail de master implique la conversion d’images en texte numérique, ainsi que les personnels d’appui à la recherche scientifique impliqués dans des projets mettant en œuvre ce type de corpus.
Inscription et bourses de mobilité
Veuillez envoyer votre candidature par e-mail à l’adresse DH@dhi-paris.fr avant le 26 juin 2023, accompagnée d’une lettre de motivation (2 pages maximum) contenant une brève esquisse de votre projet et de vos attentes concernant l’atelier, ainsi qu’un bref CV (1 page maximum), le tout dans un seul fichier PDF. Si votre candidature est sélectionnée, vous pourrez bénéficier d’une prise en charge forfaitaire de vos frais de voyage et d’hébergement dans la limite de 200 euros (pour l’Allemagne et la Suisse) et de 100 euros (pour la France) par personne.
Les langues de travail sont le français, l’allemand et l’anglais.
Date: 7 septembre (14h) – 8 septembre (17h) 2023
Lieu: Institut historique allemand, Paris
Date limite de dépôt des candidatures: 26 juin 2023
Atelier gratuit, bourse de mobilité possible (voir ci-dessus)
Contact: Mareike König
Organisé par: Anne Baillot (Le Mans univ.), Floriane Chiffoleau (Inria-Paris/Le Mans univ.), Mareike König (IHA), Pauline Spychala (IHA), Olivier Richard (univ. Fribourg)
Avec le soutien financier de : IHA, ALMAnaCH/INRIA, Département d’histoire de l’université de Fribourg