Änderungen in config_indexer.xml

Hallo in die Runde,
im Backend vom Goobi viewer kann ich, entsprechende Rechte vorausgesetzt, Änderungen an der config_indexer.xml vornehmen. Diese Änderungen werden aber erst dann wirksam, wenn der Indexer auch neu gestartet wird?

In vielen Einrichtungen dürfte es so sein, dass die Rechte zur Änderung der config_indexer.xml nicht bei der Person liegen, die auch die (virtuellen) Server/ Dienste administriert.

Lässt sich der Neustart des Indexers als “regelmäßige Aufgabe” konfigurieren? Einmal täglich würde ausreichen. Das könnte wie bei den anderen regelmäßigen Aufgaben (z.B. Update der sitemap) auch in den Randstunden geschehen.

Beste Grüße
Andreas

Änderungen innerhalb der <fields /> Sektion werden ohne Neustart übernommen. Nur für globale Änderungen außerhalb des Abschnitts ist ein Neustart des Dienstes notwendig.

Ein Neustart des Indexers ließe sich in der Tat als Cronjob konfigurieren. Ich weiß aber nicht ob das sinnvoll ist. Für einen “reibungslosen” Betrieb würde ich eher eine andere, programmatische Lösung vorziehen…

1 „Gefällt mir“

Wäre ein “Neustart Indexer” - Button irgendwo im Backend des viewers möglich? Wir bräuchten eine Lösung, für die nicht auf der Kommandozeile oder in den Untiefen der Serveradministration gearbeitet werden muss.

Oder hättest Du eine andere Idee?

Ja, das ist möglich. Wir müssten das halt implementieren irgendwie. Aber sag mir doch mal was Ihr genau da außerhalb der <fields /> Sektion ändern möchtet im laufenden Betrieb?!

Die Herausforderung ist mit den Edge-Cases umzugehen die hier mitgedacht werden müssen:

  • Indexierung eines Werkes dauert lange (z.B. 20min)
  • Es sind sehr viele Werke in der Queue (z.B. 60.000)

Dabei darf nichts “kaputt” gehen, wenn man im Backend auf den Neustart Button klickt.

1 „Gefällt mir“

Hinzugefügt habe ich:

<MD_HOST>
            <list>
                <item>
                    <xpath>mets:xmlData/mods:mods/mods:name[@type="personal"][mods:role/mods:roleTerm="hst"[@authority='marcrelator'][@type='code']]/mods:displayForm
							</xpath>
                    <onefield>false</onefield>
                    <replace char="152"/>
                    <replace char="156"/>
                    <groupEntity type="PERSON">
                        <field name="MD_VALUE">mods:displayForm</field>
                        <field name="MD_LINK">@xlink:href</field>
                        <field name="MD_CORPORATION">mods:namePart[not(@type)]</field>
                        <field name="MD_LASTNAME">mods:namePart[@type="family"]</field>
                        <field name="MD_FIRSTNAME">mods:namePart[@type="given"]</field>
                        <field name="MD_LIFEPERIOD">mods:namePart[@type="date"]</field>
                        <field name="MD_TERMSOFADDRESS">mods:namePart[@type="termsOfAddress"]</field>
                    </groupEntity>
                </item>
            </list>
        </MD_HOST>

… um aus https://haab-digital.klassik-stiftung.de/viewer/sourcefile?id=4738289527
dieses Metadatum anzeigen zu lassen:

<mods:name authority="gnd" authorityURI="http://d-nb.info/gnd/" type="personal" valueURI="http://d-nb.info/gnd/1026077400">
<mods:role>
<mods:roleTerm authority="marcrelator" type="code">hst</mods:roleTerm>
</mods:role>
<mods:namePart type="family">Laube</mods:namePart>
<mods:namePart type="given">Reinhard</mods:namePart>
<mods:displayForm>Laube, Reinhard</mods:displayForm>
</mods:name>

und? ist doch alles richtig und steht so im Index?! :wink:

Naja, die neue Rolle wird in genau einem Vorgang verwendet: https://haab-digital.klassik-stiftung.de/viewer/!metadata/4738289527/3/-/

Und da wirft der Indexer beim Export des Vorganges aus Goobi workflow einen Fehler: 4738289527.xml: Indexing failed…

Oder ist das nicht zwingend ein Fehler im Indexer selbst, sondern schon in Goobi workflow?

Die Rolle wird doch im Goob viewer angezeigt? Ohne die genaue Fehlermeldung nach “Indexing failed” kann ich auch nichts weiter dazu sagen…

Der Fehler ist nicht gezielt reproduzierbar. Ich habe den Vorgang jetzt mehrmals aus goobi workflow exportiert. Das war mal erfolgreich, mal nicht.

Kann es einen Zusammenhang mit der Auslastung des Systems geben ( siehe dazu auch KI-Bots und unser Umgang damit )?

Ich habe in Goobi workflow im Journal für den Vorgang keinen fehlschlagenden Export gefunden. Im error_mets Ordner vom Indexer kann ich einen Fehler vom 21. Juli finden, der auf einen falschen XPATH Ausdruck in der config_indexer.xml hindeutet:

root@svdmzgoobiweb01:/opt/digiverso/viewer/error_mets# cat 4738289527.log
Unable to compile 'mets:xmlData/mods:mods/mods:name[@type="personal"][mods:role/mods:roleTerm="hst"[@authority='marcrelator'][@type='code']]i'. See Cause.
root@svdmzgoobiweb01:/opt/digiverso/viewer/error_mets#

Ich kann auch über die indexer.log ansonsten keine fehlgeschlagenen Indexierversuche finden. Ergo: Ich kann den Fehler nicht nachstellen, nicht verstehen, alles wird richtig angezeigt und ich sehe aktuell auch keine Notwendigkeit für einen Indexer-Neu-Starten-Button via Backend.

Grundsätzlich habe ich aber immer noch den Wunsch den Indexer langfristig eher als Hintergrundaufgabe oder vergleichbar laufen zu lassen… :wink:

2 „Gefällt mir“

Hallo Jan, vielen Dank. Ich habe zu dem Fehler in der config_indexer.xml mal ein Ticket aufgemacht.

und ich habs beantwortet :wink:

1 „Gefällt mir“