07.09.2023

Online und vor Ort: Automatische Texterkennung (ATR)

Neue Möglichkeiten für Historikerinnen und Historiker

  • Vortrag Digitale Geschichtswissenschaft
  • 18:00 Uhr (07.09.) - 20:00 Uhr (07.09.)
  • Online/DHIP

Vortrag von Dominique Stutzmann (IRHT/Humboldt-Univ.) im Rahmen des Workshops »Von der historischen Quelle zum Volltext: Anwendung automatisierter Schrifterkennung (ATR)«

Dieser Vortrag zielt darauf, jungen Historikerinnen und Historiker die Entwicklung und Auswirkungen von automatischer Texterkennung (ATR) auf die Geschichtswissenschaft näher zu bringen. Zunächst werden die Entwicklung bei der Texterkennung durch Optical Character Recognition (OCR) und die Herausforderungen bei der Indexierung und Transkription von Handschriften (HTR) erörtert, die den Zugang zu und die Nutzung von historischen Quellen erheblich verbessert haben. Der Schwerpunkt wird auf neuere Vorhaben gelegt, insbesondere auf die Forschungsprojekte des Institut de recherche et d'histoire des textes (Himanis, Horae, Home) und des Clusters 3 von Biblissima+ (Künstliche Intelligenz und Handschriften- und Mustererkennung). Hervorgehoben wird ihre Vernetzung mit anderen relevanten Aufgaben aus dem paläographischen und linguistischen Bereich, darunter Identifizierung von Schreibern, Datierung, Begutachtung, Named Entity Recognition (NER) und Stilometrie.

In seinem Vortrag zeigt Dominique Stutzmann, wie diese Entwicklungen die Art und Weise grundlegend verändern, in der Historikerinnen und Historiker mit ihren Quellen umgehen. Aus den komplementären Aufgaben kann ein ganzheitlicher Ansatz entstehen, um historische Quellen genauer und gründlicher zu analysieren und zu kontextualisieren. Konkret wird es darum gehen, wie die Konzepte des »distant editing« und der »artificial edition« ihre Verkörperung in der Verwendung fortgeschrittener Sprachmodelle wie GPT finden können, die neue Perspektiven für die Analyse und das Verständnis von historischen Dokumenten eröffnet haben.


Anmeldung für eine Online-Teilnahme: Zoom

Bildnachweis: Screenshot der Webseite des Forschungsprojekts Himanis am IRHT.