Was ist gute Praxis beim Design seiner Produktionsvorlagen, wenn man nur selten ALTO-Daten hat?
Macht Ihr a) eine eigene Vorlage mit OCR-Schritten oder integriert Ihr b) die OCR-Schritte in eine allgemeine Vorlage?
Wenn es b) ist und in einem Vorgang keine ALTO-Daten vorhanden sind: Lasst Ihr i) die OCR-Schritte auf “Rot” um anzuzeigen, dass es keine gab oder setzt Ihr die ii) auf Grün, weil ja nichts zu tun auch irgendwie erledigt ist?
zuerst sollten wir bei der Terminologie unterschieden zwischen “OCR durchführen” und “ALTO-Dateien einspielen”.
Ein OCR-Schritt bedeutet normalerweise, dass ein externer Dienst angefragt, Bilder hochgeladen und dann OCR Ergebnisse heruntergeladen werden.
Ein ALTO-Dateien einspielen Schritt bedeutet, dass zu Bildern bereits ALTO Dateien vorliegen, diese einfach mit hochgeladen werden und dann in den richtigen Ordner einsortiert werden soll.
Was den OCR Schritt angeht gibt es keinen präferierten Weg. Die einen wollen beim Anlegen eines Vorgangs entscheiden ob mit oder OCR und haben dementsprechend zwei Produktionsvorlagen. Die anderen haben nur eine Produktionsvorlage inklusive OCR und entscheiden über eine Vorgangseigenschaft ob die OCR durchgeführt werden soll oder nicht.
Bei einem ALTO-Dateien einspielen Schritt, den man ja als automatischen Skriptschritt konfigurieren kann, würde ich immer so nutzerfreundlich wie möglich denken. Damit meine ich konkret: Den Skriptschritt in die Standard-Produktionsvorlage einpflegen und so gestalten, dass er nicht fehlschlägt wenn keine ALTO Dateien vorliegen. So kann man immer dieselbe Produktionsvorlage verwenden und wenn man ALTO Dateien mit hochlädt werden die automatisch verschoben, wenn nicht dann nicht…
Ich würde den Schritt dann in etwa so nennen:
automatisches prüfen auf ALTO Dateien und verschieben sofern vorhanden
Ich mag es, wenn ich in der Vorgangssuche alle automatischen Schritte im DropDown Menü beisammen habe. Darum benenne ich gerne alle automatischen Schritte mit dem automatisch Präfix. Die Visualisierung mit den Zahnrädchen in der Oberfläche steht dort ja nicht zur Verfügung. Außerdem würde ich explizit von ALTO Dateien sprechen, denn damit ist klar, dass zum Beispiel ABBYY-XML, Plaintextdateien oder ähnliches nicht bedacht sind. Die müssten nämlich in andere Ordner ;-). Mit dem verschieben sofern vorhanden ist dann auch gleich dokumentiert, dass der Schritt nicht fehlschlägt wenn es keine Dateien gibt. Er ist eigentlich am Ende immer grün: Wenn Dateien verschoben wurden und wenn keine Dateien verschoben wurden.
Für eine bessere Dokumentation könnte man den Skriptschritt so gestalten, dass er eine Meldung in das Journal hinzufügt wenn wirklich Dateien verschoben wurden und ansonsten nicht. Aber das ist nur nice-to-have.