Kopfzerbrechen Nr. 5: Dokumente, Transkripte und aus ihnen bezogenen Informationen zusammenhalten

Wikisource Screenshot mit Bilddatei und Bearbeitungsfenster für das Transkript im Original
Das ist die mühsame Arbeit des Historikers wie des Hobby-Forschers, der etwa Kirchenbücher auf den Spuren seiner Familie auswertet: Man hat ein Dokument. Wenn es älter ist, entziffert man es, indem man es nebenbei notdürftig transkribiert. Mitunter muss man es nebenbei in eine lebende Sprache übersetzen, bevor man im letzten Schritt Informationen aus dem Dokument zieht (und sich notiert, wie man die Information nachher zitiert).

Sollten wir das Projekt der Illuminatenakten Online in einer größeren Kooperation mit den zu beteiligenden Partnern zuwege bringen, werden wir zu alledem noch die Scans der einzelnen Dokumentenseiten zu verwalten haben. Was wäre praktischer für deren Verwaltung als die bereits benutzte Datenbank? Eigene Wikis aufsetzen mit der Wikisource-extension, die es erlaubt, einen Scan neben einem Transkriptionsfenster zu sehen, hieße die Plattformen planlos zu vermehren.

Interessant ist die all-in-one-solution. Sie öffnet den Weg in die Volltextsuche; vor allem aber behält man mit ihr stets die Arbeitsschritte beieinander. Im raschen Zugriff lässt sich erfassen, welche Informationen aus welcher Datenlage gezogen wurden. Beim seltsamen Befund ist man schnell an der Quelle, die falsch gelesen oder fehlinterpretiert worden sein muss. Die Metadaten zum Objekt, die man vor allem mit der Datenbank verwalten möchte, bleiben dicht bei der Objektbearbeitung.

Vielleicht würde man mit Sichtfenstern arbeiten wollen, die man in verschiedenen Tabs, mitunter auch auf zwei Bildschirmen, nebeneinander nach eigenen Wünschen anordnen könnte. Angenehm wäre es, wenn man die Information von anderen Datenbanken einbinden könnte: Oft wünscht man sich eine Funktion, um eine bereits vorhandene Texterkennung – sie läuft bei Google Books und Archive.org im Hintergrund der Scans mit – einfacher bei der eigenen Arbeit benutzen zu können. Man korrigiert schneller als man selbst schreibt.

Screenshot aus Google Books: Man kommt an die OCR zu einzelnen Textpassagen, kann sie aber nicht bearbeiten. Vergrößern / Google Books

Das sind gleich mehrere Baustellen für ein längeres Kopfzerbrechen.

Leave a Reply

Your email address will not be published. Required fields are marked *