Goobi2Go: Bild-Upload

hochgeladene Bilder können nicht weiter bearbeitet werden:

ich habe als user “goobi” mit der Produktionsvorlage “Sample_workflow” einen neuen Vorgang angelegt.
Danach habe ich den “Vorgang bearbeitet” und bei “Data import” manuell Daten eingegeben und dann das Plugin “Scanning” ausgeführt.

In diesem Schritt habe ich die Scandateien, die als JPG vorliegen (also kein TIF), erfolgreich hochgeladen (s. Screenshot).

Im Vorgangslog sind die Ereignisse zu sehen. Ich kann ebenfalls im Vorgangslog die Datei herunterladen.

Problem: Wenn ich nun den nächsten Schritt “Quality control” ausführe, sind keine Bilder zu sehen. Ich bekomme nur die Meldung “Es wurden keine Objekte für die Anzeige gefunden.”

Es kann natürlich sein, dass mein Vorgehen dem normalen Vorgehen (wie in der Dokumentation beschrieben) widerspricht. In der Dokumentation ist ja das Arbeiten mit verschiedenen Benutzerrollen und explizit mit dem Aufgaben-Dashboard beschrieben.

Ich benutze in Goobi2Go nur den Login “goobi” (Admin) und habe hier ja auch die Möglichkeit (wie beschrieben) die Plugins/Schritte auszuführen…

Fragen wären also:

  1. Warum erkennt “Quality control” keine Objekte/Bilder?
  2. Wo speichert Goobi2Go eigentlich die hochgeladenen Bilder?
  3. Kann man als Administrator bei der Bearbeitung des Vorgangs überhaupt alle Schritte korrekt ausführen?

Laut Doku https://docs.goobi.io/goobi-workflow-de/user/3/3.1 gibt es für Scanoperatoren ja jeweils eigene Folder:

“Nach der Annahme einer Aufgabe durch den Scanoperateur stellt Goobi in dem Arbeitsverzeichnis des Scanoperateurs ein Verzeichnis bereit, in dem der Scanoperateur seine Digitalisate speichern soll. Dieses Verzeichnis ist üblicherweise je nach Installation und Konfiguration auf dem lokalen Arbeitsplatzrechner des Benutzers als eine Festplatte in Form eines Netzlaufwerkes eingebunden. Nach der Übernahme einer Aufgabe befindet sich dort ein zusätzlicher Ordner, in den der Scanoperateur üblicherweise direkt hinein scannt.”

Wäre es also besser, nach Anlage eines Vorgangs sich als “goobi” auszuloggen und mit jeweils der passenderen Rollen “testscanning” und dann “testqc” zu arbeiten? Was wäre das Upload-Verzeichnis des benutzers “testscanning” (und des Benutzers “goobi”) bei Goobi2Go?

ok, den Speicherort der Bilder habe ich inzwischen gefunden:

/home/ralf/Downloads/g2g/goobi/metadata/6/images/walden_master/

(Die obigen Fragen beantwortet das aber leider noch nicht.)

und hier liegen sie nochmal:

/home/ralf/Downloads/g2g/goobi/metadata/6/intern/ und
/home/ralf/Downloads/g2g/goobi/metadata/6/images/walden_media/

Nach Einblenden der Spalte “ID” bei der Vorgangstabelle (Vorgang “6”) und dieser Doku: https://docs.goobi.io/goobi-workflow-de/admin/2/2.1/2.1.3 war dies im Nachhinein dann auch erklärbar.

hier das Vorgangsverzeichnis:

ls -al /home/ralf/Downloads/g2g/goobi/metadata/6
insgesamt 28
drwxr-xr-x 4 ralf ralf  4096 Mai  1 22:12 .
drwxr-xr-x 6 ralf ralf  4096 Mai  1 22:12 ..
drwxr-xr-x 4 ralf ralf  4096 Mai  1 22:15 images
drwxr-xr-x 2 ralf ralf 12288 Mai  1 22:12 intern
-rw-r--r-- 1 ralf ralf  3201 Mai  1 22:12 meta.xml

Hallo,

vermutlich wurden keine Derivate erzeugt? Welche Version von G2G nutzt Du? Und ja, besser wäre es wohl, immer in der passenden Rolle zu arbeiten, bzw. die einzelnen Schritte der Reihe nach im Workflow anzunehmen und abzuschließen. Du kannst Dir natürlich auch einen “Superuser” mit allen Rollen/ Rechten anlegen. Das spart den ständigen Wechsel zwischen Benutzern.

Die neueste 21.03.2 (gestern runtergeladen von https://g2g.goobi.io).
“goobi” ist ja eigentlich der Superuser, hat aber “nur” admin-rolle. ich habe ihm nun noch die Benutzergruppe "Quality control officers " verpasst, mich neu eingeloggt und sehe nun die Aufgabe “Quality control” für den Vorgang. Wenn ich dann die Aufgabe übernehme und bei möglichen Aktionen “Aufgabe ausführen: Plugin Bildkontrolle” anklicke, steht auf der nächsten Seite wieder “Es wurden keine Objekte für die Anzeige gefunden.” :frowning:

Irgendwie ist da wohl ganz am Anfang was schiefgelaufen? Funktioniert etwa das Vorgehen nicht, die Scan-Bilder (als Admin “goobi”, der ja eigentlich kein Scanoperator ist) über die Weboberfläche hochzuladen (also ohne Scanoperator-Verzeichnis)? Wird der Workflow dann nicht erfolgreich “weitergeschoben” (also das, was Du z.B. meinst, dass keine Derivate erzeugt werden, wenn man es so macht)…

Ich lade mir die Version mal runter und versuche, das nachzubauen. Ich bin mir gerade nicht sicher, in welchem Schritt die jeweiligen Bildverzeichnisse angelegt werden. Ich hatte erst den Verdacht, dass der Fehler auch beim gewählten Dateinamen liegen kann.

noch ein Hinweis, bzw Unsicherheit, wo ich etwas verkehrt gemacht haben könnte:
Beim ersten Schritt “Data import” habe ich alles manuell eingegeben und habe (weil ich es nicht besser wusste und es dazu auch keinen Hinweis gab, ob dafür bestimmte Regeln zu beachten sind) in den beiden Feldern:

  • Identifier digital (a): 00000001
  • Identifier analogue (a): aj-walden

eingegeben.

Besteht hier eine feste Regel zur Vergabe und müssen sich die Dateinamen danach “richten”?

ich habe vermutlich die Lösung:
aus dem Screenshot des Quality-Plugins hier https://docs.goobi.io/goobi-workflow-plugins-de/step/intranda_step_imageqa#arbeitsweise-und-bedienung-des-plugins konnte ich sehen, dass die Dateien dort achtstellig numerisch benannt sind.

nachdem ich eine datei im master-ordner umbenannt habe nach 00000001.jpg taucht diese (als einzige) dann tatsächlich bei der qualitätskontrolle auf!

Ich versuche mal die Stelle der Doku zu finden, wo das beschrieben ist… (vielleicht hatte ich es überlesen oder der Hinweis fehlt)

Dann war mein Verdacht bzgl. der Dateinamen scheinbar korrekt. Diese Syntax lässt sich natürlich anpassen.

@steffen: Könnt Ihr in G2G diese sehr strenge Vorgabe bzgl. der Dateinamen mal aufweichen? Ich stolpere da auch immer wieder drüber.

Ja, es gibt eine Regel (siehe unten). Das ist aber konfigurierbar. Und nein, Dateiname und die Identifier hängen nicht zwingend zusammen. Beides kann einem voneinander unabhängigen Muster folgen.

wo kann man das konfigurieren?

Ich würde es besser finden, wenn beim Upload die Dateinamen entsprechend so umbenannt werden, wie es erwartet wird (evtl nicht im master sondern nur auf den arbeitskopien (gibt es die, oder wird immer auf “master” gearbeitet?) für die nachfolgenden schritte?)

Vielleicht mit diesem Zusatzschritt?
https://docs.goobi.io/goobi-workflow-plugins-de/step/intranda_step-rename-files

Und ich denke, ich habe die Stelle gefunden, wo das Pattern für die Dateinamen konfiguriert ist:
/home/ralf/Downloads/g2g/goobi/config/plugin_intranda_validation_filename.xml

<?xml version="1.0" encoding="UTF-8"?>
<config_plugin>
	<validation>
    <!-- file name must match against one of the patterns -->
		<pattern>\w+_\d{4}</pattern>
		<pattern>\d{8}</pattern>
	</validation>
	<validateMasterFolder>true</validateMasterFolder>
	<validateMediaFolder>false</validateMediaFolder>
	<validateOrder>true</validateOrder>
</config_plugin>

Es gibt Derivate, ja. Und in der Regel werden in den weiteren Schritten, zB der Metadatenerschließung, auch die Dateien aus diesem Ordner angezeigt.

Der Derivate-Folder ist der “media”-Folder?

@steffen : ich denke die Doku sollte ergänzt werden bzgl. der Dateinamenskonventionen / Konfiguration bzw. ein Hinweis in der Oberfläche zu den möglichen Dateinamen beim Datei-Upload kommen?

(Bei der Gelegenheit: die Doku ist super :+1: und ich hoffe ich kann durch meine Fragen etwas dazu beitragen, dass sie an der ein oder anderen Stelle noch ein bisschen besser wird.)

1 „Gefällt mir“

Genau so ist es. Dateiformat/ Kompressionsrate müßten konfigurierbar sein.

ok, danke. ist wohl ein anderes kapitel.

ich habe inzwischen ein pattern für meine dateinamen konfiguriert:

/home/ralf/Downloads/g2g/goobi/config/plugin_intranda_validation_filename.xml

<!-- file name must match against one of the patterns -->
		<pattern>\w+_\d{4}</pattern>
		<pattern>\d{8}</pattern>
		<pattern>image-\d{5}</pattern>

und Goobi2Go gekillt und nochmals gestartet. Hat leider nicht dazu geführt, dass die images bei der Bildkontrolle erscheinen…
bleibt wohl vorerst nur das umbenennen meiner Dateien im master-ordner…

@steffen: Ein Eintrag im Logfile wäre auch sinnvoll, wenn der Vorgang wegen eines “fehlerhaften” Dateinamens hängenbleibt. Das würde die Fehlersuche erleichtern.

Hey Ralf

Zeig doch mal bitte den Inhalt vom Master-Ordner (via „tree“).

Deine Anpassung in der Config der Validierung hat da nicht den gewünschten Effekt. Ich glaube ja auch, dass du in der Benutzung von Goobi noch etwas anders vorgehst als Goobi es erwartet. Dass es funktioniert, solltest du am einfachsten sicherstellen können, wenn du mal wirklich mit den Aufgaben arbeitest, nicht aus der Vorgangsliste.

Mach daher bitte mal folgendes (am besten ohne weitere Konfiganpassungen erstmal):

  • pack den Nutzer goobi in alle Nutzergruppen (vor allem Scannen, Qualitätskontrolle, Metadaten)
  • lege einen neuen Vorgang an
  • arbeite dann nur noch über „Meine Aufgaben“

Jetzt sollte alles klappen. Die Dateien landen im Masterordner. Und das QA-Plugin sieht die Dateien auch. Sollten sie jedoch nicht angezeigt werden, liegt es ganz ganz sicher an den Dateinamen. Nimm im ersten Versuch am besten Dateinamen wie 000000001.tif und dann lass mal hören wie es läuft. Und im zweiten Schritt lass dir doch mal flink von mir live zeigen, wie Goobi „denkt“, eh du dir da die Zähne ausbeißt, wenn es noch immer Sorgen macht. Das wird dir Nerven sparen, denke ich. :grinning:

Liebe Grüße
Steffen

Hallo Steffen,

ja, ich weiß nun, dass das Herangehen sehr “explorativ” war. Eigentlich hatte ich mit dem Project-manager zu testen angefangen, bekam aber dann den Tipp alles mit Admin “goobi” zu machen, der alles darf. Das stimmt leider nicht, da er (richtigerweise) nur Admin ist und kein Scanoperator, etc… Daher sah ich keine Aufgaben und habe die Vorgänge durch “Bearbeiten” benutzt. Daher die Verwirrung. Nachdem ich dem Admin alle Benutzergruppen zugewiesen hatte, sah ich alle Aufgaben. Das ist für eine erste Evaluierung zwar bequem, aber natürlich falsch. In der Realität wird jeder seine speziellen Rollen haben und nur mit Aufgaben arbeiten.

Ansonsten hatte ich “nur” das Problem, dass meine Dateien (die ich per Weboberfläche hochgeladen hatte) nicht der Namenskonvention entsprachen ("\d{8}"). Da wäre ein Hinweis bzw. eine Ergänzung in der Doku gut. Nach dem Umbenennen konnte ich weiter arbeiten.

Ich benutze jetzt “Meine Aufgaben”, nachdem ich hier nun (als “Superuser” mit allen Benutzergruppen) tatsächlich alles sehen kann. Inzwischen habe ich Paginierung für mein Testbuch fertig und bin auch bei den Strukturdaten schon dabei. Klappt jetzt alles sehr gut und ich habe das Vorgehen soweit durchschaut. Auch die Doku hier “https://goobi.io/community/workshops/archiving2019/” habe ich gerade entdeckt und hilft auch.

Danke allen.
(Ich werde mich bei Gelegenheit auch mal außerhalb des Forums melden)

1 „Gefällt mir“