Ich glaube mich vage zu erinnern, dass es die Möglichkeit in Goobi Workflow gibt, die möglichen Werte von Metadatenfeldern bezüglich ihrer Form mit Regulären Ausdrücken zu spezifizieren.
Nur leider finde ich das in der Dokumentation grad nicht.
Hat da jemand einen Tipp vielleicht?
Oder erinnere ich mich da falsch?
Hallo @michael_zlb_berlin,
in der UGH Dokumentation und auch in dem Goobi workflow Handbuch habe ich dazu auch nichts gefunden.
Du findest aber Beispiele im Regelsatz der im Goobi workflow Repository liegt, zum Beispiel dieses hier:
<MetadataType>
<Name>DocLanguage</Name>
<language name="de">Sprache</language>
<language name="en">Language</language>
<language name="es">Idioma</language>
<validationExpression>[a-z]{3}</validationExpression>
</MetadataType>
Such in der folgenden Datei einfach nach validationExpression
:
Beste Grüße von
Jan
Hey Ihr,
ich habe das jetzt mal in der UGH Doku nachgepflegt:
https://docs.goobi.io/ugh-de/3/3.1
Liebe Grüße,
Steffen
Wäre es nicht sinnvoll, auch die Felder für die Einträge der GND-ID bei Personen und Körperschaften mittels eines regulären Ausdrucks zu validieren, so dass da z.B. keine Leerzeichen (meinen Kolleg*innen passiert das beim Kopieren oft nach den GND-ID) am Ende stehen? Hier im Feld “goobi:authorityValue”.
Geht das mit dem aktuellen Werkzeug in den Regelsätzen denn schon und ich weiß nur nicht, wie?
<goobi:metadata name="Author" type="person"> <goobi:lastName>Akkerman</goobi:lastName> <goobi:firstName>Olly</goobi:firstName> <goobi:authorityID>gnd</goobi:authorityID> <goobi:authorityURI>http://d-nb.info/gnd/</goobi:authorityURI> <goobi:authorityValue>1134992912</goobi:authorityValue> <goobi:displayName>Akkerman, Olly</goobi:displayName> </goobi:metadata>
statt Validierung mit RegEx für Authority-IDs wäre ein
trim()
beim Speichern derselben in der meta.xml noch praktischer. Das passiert mir auch regelmässig, dass ein führendes Leerzeichen in der GND-ID dann den Indexer zum Sterben bringt. Aber Achtung: Das ist wahrscheinlich ein Feature
kein Bug
.
Bringt mir die Authority-ID mit führendem oder schliessendem Spatium!
Wer schon einmal mit marc zu tun hatte, wo die fünf führenden Leerzeichen im leader eine Bedeutung haben oder mit ACTApro Identifiern arbeiten muss, die exakt 4 und nicht ein Leerzeichen haben, weiß, wie nervtötend automatische Optimierungen und Formatierungen von Browsern, Chat-Programmen oder Mailprogrammen sein können.
Daher versuchen wir, automatische Manipulationen an Eingabewerten soweit wie möglich zu vermeiden. Denn nur weil die GND keine Leerzeichen in Identifiern kennt, muss das nicht für alle Datenbanken gelten.
Das vorweg gesagt, entfernen wir aber mittlerweile führende und endende Leerzeichen und Zeilenumbrüche. Wiederholte Leerzeichen innerhalb des Texts bleiben aber bestehen.
ich hab ja eh geschrieben das ist ein super feature
also nicht gleich die Fassung verlieren.