Korrespondierende digitale Datenschätze und Wissensressourcen (am Beispiel von Wienerischem DIGITARIUM und Wien Geschichte WIKI)
Das Projekt TIME MACHINE WIEN: Korrespondierende digitale Datenschätze und Wissensressourcen setzt zwei – für die Stadt Wien besonders relevante – digitale Portale in Beziehung: Das DIGITARIUM, eine Online-Edition von mehreren hundert Ausgaben der historischen “Wiener Zeitung”, soll mit Informationen der historischen Wissensplattform Wien Geschichte WIKI semantisch angereichert werden.
Um die zahlreichen Nennungen von Personen, Orten, Institutionen und Ereignissen aus den historischen Zeitungsausgaben mit den digitalen Einträgen des Wien Geschichte WIKI künftig weitgehend automatisch verlinken zu können, werden folgende drei Methoden getestet:
-
Automatischer Abgleich von Zeichenketten (unter Berücksichtigung der historischen Schreibvarianz)
-
Anwendung von Machine Learning-Ansätzen, welche die Identifikation von Kandidatenpaaren unterstützen
-
Informationsextraktion durch trainierte Tagger zur Named Entity Recognition
Die Ergebnisse dieser aussichtsreich erscheinenden Zugänge sollen nicht nur verglichen, sondern auch miteinander kombiniert werden.
Der Mehrwert einer solchen semantischen Anreicherung besteht darin, dass Nutzer*innen des DIGITARIUMs bei der Lektüre zu jenen weiterführenden, verlässlich geprüften Informationen gelangen, die das Wien Geschichte WIKI bereits bietet (u.a. den integrierten digitalen Kulturstadtplan oder weiterführende Literaturhinweise). Im Licht der europäischen Initiative Time Machine, an der das ACDH-CH maßgeblich beteiligt ist, wird die Kontextualisierbarkeit der historischen Zeitungsausgaben mit weiteren bestehenden digitalen Portalen, Datensammlungen und Wissensressourcen, die sich auf die Stadt Wien beziehen und zur Referenzierung geeignet sind, mittels Konvergenztests geprüft. Auf Basis dessen wird eine Diskussion initiiert, wie man die an verschiedenen Institutionen und Forschungseinrichtungen vorhandenen Daten zu Wiens kulturellem Erbe in einem digitalen Informationssystem zusammenführen und zum Aufbau einer “Time Machine Wien” nachnutzbar machen könnte, um unser historisches Wissen über die Stadt Wien zu sichern und zu vertiefen.