Sammlungen beschriften

gstoll · 23. November 2019 um 19:01

Hallo,

vielleicht erst kurz zur Vortsellung. Ich heiße Gerhard Stoll und bin im Verein für Computergenealogie e. V. (CompGen) tätig. Wir haben vor einiger Zeit einen Goobi Server installiert bekommen. Damit soll unsere Digitale Bibliothek eine neue modere Oberfläche bekommen. Zum testen nutze ich hier Goobi2Go.

Aktuell scheitere ich daran, dass im Viewer die Beschriftung der Sammulngen nicht funktioniert.

Verstanden habe ich bis jetzt das in der goobi_digitalCollections.xml die Sammungen eingetragen werden. Desweiteren kommt auch für das Projekt die Sammlungen in die goobi_metadataDisplayRules.xml. Ich habe nun in alle Dateien mit dem Namen messages_de.properties einen Eintrag gestellt.

Die Konfig sieht so aus:

goobi_digitalCollections.xml: <DigitalCollection>Mathematics_Test</DigitalCollection>

goobi_metadataDisplayRules.xml
<item selected=“false”>
<label>Mathematics_label</label>
<value>Mathematics_value</value>
</item>

messages_de.properties: Mathematics_value=Mathematik Test

Angezeigt wird im Viewer immer “mathematicsvalue”.

Ich hoffe die Frage langweilt niemand. Ich bin halt erst am Anfang mit Goobi.

Gruß, Gerhard (Stoll)

Schlueter_HAAB · 23. November 2019 um 22:23

Hallo Herr Stoll, willkommen “an Bord”

tragen Sie bitte in die messages_de.properties mal diesen Wert ein: mathematicsvalue=Mathematik Test

Klappt es damit?

Beste Grüße, Andreas Schlüter

gstoll · 24. November 2019 um 13:45

Hallo Herr Schlüter,

Ja, damit geht es. Auf die einfachsten Lösungen kommt man nicht. Danke.

Nur Frage ich mich warum der Viewer das macht. Liegt das daran das in den Metadaten ein
<mods:classification authority=“ivdcc”>Mathematics_value</mods:classification>
steht und durch das ivdcc diese Wandlung erfolgt?

Muss ich wohl noch einiges über Metadaten lernen.

Gruß, Gerhard (Stoll)

Schlueter_HAAB · 24. November 2019 um 17:45

IVDCC bedeutet eigentlich nur “intranda viewer digital collection classification” . Die Digitalen Sammlungen werden schon “korrekt” in der MODS-Datei abgelegt, incl. Sonderzeichen, Großbuchstaben, Leerzeichen etc.

Warum die Umsetzung im Viewer dann nicht genau so erfolgt… Gute Frage!

jan · 25. November 2019 um 08:04

An der Stelle springe ich gerne ein. Das ganze hat mit der Kombination aus den vorhandenen Funktionen und der Datenspeicherung zu tun.

Folgende Funktionen sollen bei den Sammlungen abgebildet werden können:

Ein Werk soll einer oder mehrerer digitaler Sammlungen zugehören können
Digitale Sammlungen sollen Unterkollekektionen enthalten können
Digitale Sammlungen sollen in verschiedenen Sprachen unterschiedliche Übersetzungen haben können.

Zu 1:
Damit das erreicht wird muss sichergestellt sein, dass im Solr Suchindex, in dem die Daten gespeichert werden, jede Kollektion die angegeben wurde als ein Wert auftaucht. Das Feld in dem die Sammlungen enthalten sind soll mehrere Werte erlauben, es muss ein sogenanntes MultiValuedField sein. Solr selbst splittet intern die Werte in mehrere Token auf. Das würde bei der Sammlungsanzeige zu Problemen führen. Deswegen muss sichergestellt werden, dass ein Wert für eine Sammlung nur einen Token hat.

In der Konfigurationsdatei des Goobi viewer Indexers wird deswegen das Feld DC (steht für DigitalCollections) so konfiguriert, das alles als ein Token geschrieben wird (<onetoken>true</onetoken> / Beispiel). Intern bedeutet das, dass alles zu Kleinbuchstaben gemacht wird und alles was NICHT [a-z] entspricht gelöscht wird. Aus dem Wert Schöner Sammlungsname wird dementsprechend schnersammlungsname.

Zu 2:
Damit Unterkollektionen erlaubt sind wurde sich vor 10 Jahren als Trennzeichen die Raute (#) ausgedacht. Es war wichtig, dass das Zeichen so gut wie nie in regulären Sammlungsnamen auftaucht damit es dabei nicht zu Problemen kommt. Auch lässt sich die Raute gut visuell erfassen und ist deswegen von Menschen in dem Kontext gut les- und schreibbar.

Es besteht nun aber das Problem, dass Solr an einer Raute auftrennt und verschiedene Token daraus erzeugt. Deswegen ist für das Feld DC in der Goobi viewer Indexer Konfiguration auch konfiguriert, dass die Raute als Trennzeichen für Untersammlungen fungiert (<splittingCharacter>#</splittingCharacter> / Beispiel). Dieses Zeichen wird dann gegen einen Punkt ersetzt. Solr trennt nämlich Zeichenketten an einem Punkt nicht automatisch auf. Es verbleibt bei einem Token. Aus dem Wert Schöner Sammlungsname#Erste Unterkollektion wird dementsprechend schnersammlungsname.ersteunterkollektion.

Zu 3:
Da wir pro Sammlung eindeutige Token ohne Sonderzeichen haben (siehe 1) und sich Unterkollektionen anhand von Punkten im Sammlungsnamen dekodieren lassen (siehe 2) können wir nun im Goobi viewer relativ einfach Sammlungen und Untersammlungen anzeigen und auch in unterschiedlichen Sprachen angepasst übersetzen. Der Goobi viewer muss nun nur noch wissen, dass er die Untersammlungen anhand der Punkte auftrennen muss (<splittingCharacter>.</splittingCharacter> / Beispiel) und dann können die Sammlungen in den messages Dateien übersetzt werden. Dabei gilt die Übersetzung immer für den Teil hinter dem letzten Punkt. Beispiel:

messages_de.properties

schnersammlungsname=Sch\u00F6ner Sammlungsname
schnersammlungsname.ersteunterkollektion=Erste Unterkollektion

messages_en.properties

schnersammlungsname=Nice collection name
schnersammlungsname.ersteunterkollektion=First sub collection

Frage am Ende: WO in der Dokumentation würden diese Ausführungen WIE erwartet werden, damit das in der Zukunft klarer ist?

Schlueter_HAAB · 25. November 2019 um 08:18

Hallo Jan, vielen Dank für die ausführliche Erklärung. Dafür gäbe es ja den bereich https://docs.intranda.com/goobi-viewer-de/2/2.18 .

gstoll · 25. November 2019 um 19:39

Danke für die Ausführung. Musste es zwar zweimal lesen, dann habe ich es wohl verstanden.

Das erscheint mir hier das wichtigeste. Sprich am gibt es gleich so ein, damit man nicht unnötig umdenken muss.

https://docs.intranda.com/goobi-viewer-de/2/2.18/2.18.1

Würde ich auch so vorschlagen. Mit einem Hinweis das es dabei um die singleDigCollection in der goobi_metadataDisplayRules.xml

Also sowas in die Richtung:
Die Kollektionen werden im Workflow in der goobi_metadataDisplayRules.xml im Abschnitt singleDigCollection definiert. Dabei wird intern im Viewer der ( value ) zu Kleinbuchstaben gemacht und alles was NICHT [a-z] entspricht gelöscht.

Zu meinem Glück fehlt mir jetzt noch wie ich es anstelle ein Werk in eine Hierarchiestufen einzubinden.
Ich hätte gerne “Personenverzeichnisse.Adressbuecher”. In goobi_metadataDisplayRules habe diese beide eingetragen. Das Werk hat auch beide Sammlungen erhalten.
Oder müsste ich jetzt in goobi_metadataDisplayRules.xml eine singleDigCollection mit genau der Struktur angeben?

Gruß, Gerhard

Schlueter_HAAB · 26. November 2019 um 03:49

Für die Hierarchiestufen hilft eventuell auch das hier weiter:
https://docs.intranda.com/goobi-workflow-de/admin/7/7.1

jan · 26. November 2019 um 07:45

Hallo @gstoll,

das mit dem Hinweis auf die goobi_digitalCollections.xml und goobi_metadataDisplayRules.xml ist berechtigt, aber ja nur wenn die Daten im Goobi viewer METS/MODS Daten aus Goobi workflow sind. Der Goobi viewer nimmt ja aber auch Daten in anderen Formaten und aus anderen Systemen entgegen.

Ich überlege einmal wie ich aber bei 2.18.1 am besten einen Hinweis in Richtung Konfiguration des Goobi viewer Indexers unterbringe, damit das mit den Kleinbuchstaben und Sonderzeichen schneller ersichtlich ist.

Viele Grüße von

Jan

gstoll · 2. Dezember 2019 um 19:28

Danke für den Hinweis das funktioniert.

Das folgende gehört zwar mehr zum Workflow und ich merke das ich zutief drin bin.

Denn wenn ich feststellen muss das in der goobi_metadataDisplayRules.xml beim <label> das “,” per Escape-Sequenz eingebaut werden muss, sonst verschluckt der Metadateneditor den Rest der Zeichenkette, dann weiss ich nicht ob ich nicht zu tief grabe.

<item selected="false">
    <label>Geografie\, Kartographie\, Topographie etc#Topographien</label>
    <value>geografiekartographietopographie#topographien</value>
 </item>

Gruß, Gerhard

Schlueter_HAAB · 2. Dezember 2019 um 19:32

Deswegen mag ich Goobi2Go. Man kann viel probieren, ernste Konsequenzen hat es nicht. Und die Auswirkungen sieht man relativ zügig.

Schlueter_HAAB · 2. Dezember 2019 um 19:33

@jan
Hallo Jan, wann stellt Ihr eigentlich eine aktuelle Version von G2G bereit?

Viele Grüße, Andreas

jan · 4. Dezember 2019 um 07:02

Ich arbeite daran. Ich bekomme immer noch Fehlermeldungen wenn ich versuche den Goobi viewer Indexer im Goobi to Go zu aktualisieren. Das muss ich erst lösen, denn ansonsten kann ich den Core auch nicht aktualisieren.

Ist Work in Progress

jan · 6. Dezember 2019 um 15:26

Statusupdate: Die Fehler wurden behoben. Anfang nächster Woche testen wir das dann noch einmal auf den drei Betriebssystemen Linux, Mac und Windows und informieren dann hier im Forum über einen neuen Link

Schlueter_HAAB · 6. Dezember 2019 um 21:14

Super! Wenn Ihr externe Beta-Tester braucht, sag Bescheid.