Datenmigration & Weiterleitung von 'alten' auf 'neue' URLs


#1

An der ZLB haben wir verschiedentlich den Fall, dass wir schon veröffentlichte Daten umarbeiten (z.B. zu Bänden zusammenfassen) oder mit neuen Datensatznummern (und damit URLs) versehen. Dabei achten wir darauf, bestehende URNs zu erhalten, wollen darüber hinaus jedoch auch die ‘alten’ URLs, die doch von vielen Nutzer*innen verwendet werden, z.B. in Blogs oder Wikipedia, weiter unterstützen - wenn möglich auch auf Seitenebene.

Nach Rückmeldung von Intranda nutzen wir hier das Apache-Modul “mod_rewrite”, das einfache Umleitungen unterstützt, aber auch Bestandteile aus der ‘alten’ URL herausnehmen und gezielt in die ‘neue’ URL einsetzen kann. So können wir z.B. mit der folgenden Regel sowohl den Ansichtsmodus (in $1) als auch die Bildnummer ($2) in die ‘neue’ URL überführen:

RewriteRule ^/viewer/(image|metadata|readingmode)/19305605_1799/([0-9]*)/.*$ https://digital.zlb.de/viewer/$1/34111531/$2 [L,R=301]

die ‘alten’ URLs
https://digital.zlb.de/viewer/metadata/19305605_1799/1/LOG_0003/
https://digital.zlb.de/viewer/image/19305605_1799/12
https://digital.zlb.de/viewer/readingmode/34111531/123/

werden gezielt auf den jeweiligen Ansichtsmodus und die korrekten Bilder mit den ‘neuen’ URLs überführt:
https://digital.zlb.de/viewer/metadata/34111531/1/
https://digital.zlb.de/viewer/image/34111531/12/
https://digital.zlb.de/viewer/readingmode/34111531/123/

Dazu erstellen wir eine Datei mit den Regeln (in der Regel für jeden Band) und fügen diese in /etc/apache2/sites-enabled/ hinzu. Wer hier mehr über die technischen Details wissen mag, einfach melden!


#2

Ergänzung:

Wir pflegen im Rahmen der Wartung an dieser Stelle auch immer gerne noch ein paar Checks in das Monitoring ein, damit diese Weiterleitungen ständig im Blick behalten werden und nicht aufgrund eines Konfigurationsfehlers oder bei einem Serverumzug ein Teil vergessen wird.


#3

Mich würde in diesem Zusammenhang interessieren, was Sie (in den verschiendenen Anwendungsfällen) beachten, um die URN nicht zu verändern. Bei uns kommt es vor, dass wir nach dem Export bemerken, dass für ein Digitalisat der falsche Katalogdatensatz importiert oder dass der Lauzettel vertauscht wurde. Ich habe dann teilweise die PPN und ggf. die Metadaten im METS-Editor korrigiert, das Digitalisat aus dem Viewer löschen lassen und neu exportiert. Davon wurde mir aber abgeraten, so dass wir jetzt in diesen Fällen den Vorgang komplett aus Goobi löschen und neu anlegen. Dabei wird dann leider eine neue URN generiert.


#4

Sobald sich die PPN ändert, beziehungsweise konkreter “der Identifier, der in Goobi workflow im Metadatum CatalogIdDigital des Regelsatzes gespeichert ist”, muss das als gesonderter Einzelfall geprüft werden, damit die URN übernommen wird.


#5

Was bedeutet “als Einzelfall prüfen”?


#6

Das bedeutet, dass jedes Mal wenn der Fall vorkommt gesondert manuell geprüft wird und es keine automatische Routine dafür gibt.