Goobi Filtersyntax

Hallo,

ich bin auf der Suche nach einer Erklärung der Syntax, um innerhalb von Goobi workflow Vorgänge und Aufgaben finden zu können. Wer kann mir hierzu weiterhelfen?

Vielen Dank!

Die Filter in Goobi workflow sind eigentlich ganz einfach zu bedienen. Am häufigsten sucht man ja einen Vorgang. Dazu trägt man lediglich einen Teil des Vorgangstitels in das Filterfeld und führt die Suche aus. Wenn wenn der eingegebene Text in dem Namen vorkommt, wird der Vorgang mit aufgelistet.

buch

Neben der Suche nach Vorgangstiteln gibt es aber noch viele weitere Filter. So z.B. eine Suche nach allen Vorgängen, die in einem bestimmten Projekt sind:

project:Monografien_19_Jhd

Dabei muss man aufpassen, dass Leerzeichen innerhalb von Anführungszeichen aufgeführt sind, also etwa so:

“project:Monografien im 19 Jhd”

Auch die Suche nach einem Kriterium einzelnder Aufgaben ist möglich wie z.B. hier die Suche nach allen Vorgängen, wo der Export bereits erfolgt ist:

stepdone:Export

Oder auch:

stepopen:Scanning

Und solche Filter lassen sich dann einfach kombinieren miteinander:

buch “project:Monografien im 19 Jhd” stepdone:Export

Das sind soweit schon einmal ganz gute Beispiele. Noch mehr findet sich übrigens im Handbuch von Goobi workflow:

https://docs.intranda.com/goobi-workflow-de/5/5.6/5.6.1

1 Like

Ach, die Dokumentation ist jetzt umgezogen? Danke für den Link!

Oh, noch eine Frage:
Mir scheint, dass nicht zwischen Groß- und Kleinschreibung bei den Filtern unterschieden wird.
So erhalte ich dieselben Treffer für “meta:Ressourcentyp:text” und “meta:Ressourcentyp:Text”, wenn ich aber doch gerade die groß-geschriebenen Werte mittels Goobi-Script und metadataReplace verändern möchte.
Gibt es hier eine Lösung für mein Problem?
(hier nochmal die Filtersyntax verlinkt: https://docs.intranda.com/goobi-workflow-de/manager/7/7.1)

Hallo Michael,

die Suche ist case-insensitive, da die String-Vergleiche in der Goobi Datenbank (MySQL) per default auch case-insensitive sind. Siehe dazu auch die MySQL Dokumentation: https://dev.mysql.com/doc/refman/8.0/en/case-sensitivity.html

Man kann die Tabellen, wenn man sie case-sensitive durchsuchen möchte, auf BINARY umstellen, dafür müssten dann aber die gesamte Suchanfrage-Erstellung angepasst werden.

Eine Alternative für dich wäre, direkt in der Datenbank zu suchen und dir dort die Prozess-IDs rausgeben zu lassen. Du könntest dann folgende Suchquery in Goobi nutzen:

"id:1 3 345 687"

Und noch eine Frage: Irgendwie gelingt mir die Filtersuche nach einer Vorgangs-Eigenschaft “Schrifttyp” mit dem Wert “Fraktur” nicht mit den Hinweisen in https://docs.intranda.com/goobi-workflow-de/manager/7/7.1
Hat hier jemand einen Tipp?

So sieht die Logdatei dazu aus:

property propertyIdentifier=“Schrifttyp” value="Antiqua
label>Schrifttyp</label
/property

Hast Du es mal so probiert:

“processproperty:Schrifttyp:fra” für Fraktur

bzw.

“processproperty:Schrifttyp:ant” für Antiqua

Ja super, das ist des Rätsels Lösung.
Ich hab den Ausdruck ‘processproperty’ hier: https://docs.intranda.com/goobi-workflow-de/manager/7/7.1 nicht wirklich gefunden, da kann er also da gut ergänzt werden, schön!

Einen großen Dank und viele Blumen!
Michael

2 Likes

Was ich nicht probiert habe, ist die Abfrage für “Keine OCR”.

Ja hast recht. Ich ergänze die Doku dazu mal morgen, wenn ich dran denke.

1 Like

Ich habe das von @Schlueter_HAAB gegebene Beispiel processproperty:Schrifttyp:fra in der Dokumentation Kapitel 7.1 wie von @michael_zlb_berlin vorgeschlagen ergänzt.

2 Likes

Ich habe eben die Filter-Doku auch noch einmal erweitert. Da ist jetzt auch die Oder-Suche mit aufgeführt. Das ganze ist in deutsch und englisch aktuell.

2 Likes

Interessant finde ich auch den Filter " “steperror:” " . Damit werden alle Vorgänge angezeigt, die sich gerade im Fehlerstatus befinden.

1 Like

Beim Aufbereiten der Daten für die DDB ist mir schmerzlich aufgefallen, dass ich nicht weiß, wie ich nur nach Metadaten des Bandes (d.h. ohne Berücksichtigung der Metadaten des zugehörigen Anchor-Werks) filtern kann.
D.h. wenn ich nach einem Metadaten-Wert filtere, dann kann dieser im Anchor-Werk (z.B. der Zeitschrift) und im Band auftreten.
Eine Unterscheidung nach Auftreten in Anchor-Werk und Band ist hier gerade nicht möglich, oder?

Handelt es sich bei den anchorn um Zeitschriften oder um mehrbändige Werke?

Ja, die anchor-Datensätze können z.B. Zeitschriften oder mehrbändige Werke sein.

Die Suche findet alle Datensätze, in denen dein Metadatum vorkommt. Es kann nicht geprüft werden, an welcher Stelle dein Metadatum steht. Das müsstest du direkt innerhalb der METS Dateien machen.

Aber du kannst die Suche erst mal nutzen, um das Trefferset zu reduzieren und anschließend über die verbliebenen meta.xml bzw meta_anchor.xml mit grep zu gehen