Ergebnisse des Crowdsourcing Treffens im Anschluss an das Anwendertreffen

Im Anschluss an das Goobi Anwendertreffen hat wie angekündigt am Freitag ein Treffen zur Weiterentwicklung des Crowdsourcings im Goobi viewer stattgefunden.

Teilgenommen haben:

  • Bruno Blüggel (Universitätsbibliothek Greifswald) - @Bruno
  • Romy Schneider-Hirsch (Universitätsbibliothek Greifswald)
  • Stefan Farrenkopf (Universitätsbibliothek Kiel) - @sfk
  • Andreas Schlüter (Klassik Stiftung Weimar) - @Schlueter_HAAB
  • Michael Voß (Universitätsbibliothek der Humboldt Universität Berlin) - @mvoss
  • Florian Alpers (intranda GmbH) - @florian.alpers
  • Jan Vonde (intranda GmbH) - @jan

Das folgende Gedächnisprotokoll stellt grob den Diskussionsverlauf dar.


Alle:

  • Kurze Einführung in das Thema.

Klassik Stiftung Weimar:

  • Besteht die Möglichkeit auch einen Zeitraum “von - bis” anzugeben und danach zu suchen?
  • FEATURE ANREGUNG: Erstellen eines neuen Fragentyps: “Zeitraum (von - bis)”
  • Die Diskussion ging dann von dem Erfassen von Zeiträumen hin zur Suche selbiger und den Herausforderungen von Label (Kreidezeit) versus Werte (mehrere Millionen Jahre).

Universitätsbibliothek Kiel:

  • FEATURE ANREGUNG: Erstellen eines neuen Fragentyps: “Auswahlliste”
  • Weiter wurde die Frage gestellt warum in einer Kampagne “Fragen” definiert werden und nicht “Aufgaben”.
  • FEATURE ANREGUNG: Umbenennung von “Fragen” zu “Aufgaben”

Universitätsbibliothek Greifswald:

  • FEATURE ANREGUNG: Erstellen eines neuen Fragentyps "Auswahlliste Name/Wert) bei dem ein angezeigtes Label und der dafür zu verwendende internen Wert definiert werden kann.

Klassik Stiftung Weimar:

  • FEATURE ANREGUNG: Erstellen eines neuen Fragentyps “Normdaten” bei dem eine Normdatenbank wie zum Beispiel GND oder Geonames hinterlegt werden kann

Humboldt Universität Berlin:

  • FEATURE ANREGUNG: Erstellen eines neuen Fragentyps "Normdaten (vorselektiert) bei dem der Kurator einer Kampagne eine Liste an Normdatensätzen zum Beispiel aus der GND oder Geonames vorselektieren und hinterlegen kann, die dann zur Auswahl stehen.

Universitätsbibliothek Kiel:

  • Es wird angemerkt, dass nicht alle Normdatenbanken auch Start- und Endzeiten haben wie sie für das Beispiel mit Kreidezeit notwendig wären. Die GND hat diese Daten nicht, Wikidata aber zum Beispiel schon.

intranda GmbH:

  • Grundsätzlich wird auf die Herausforderung verwiesen, dass Crowdsourcing Tools oft projektspezifisch sind, der Goobi viewer aber die Anforderung hat im Backend und im Datenmodell stets generisch zu sein, dann aber in der Oberfläche Spezialfragen beantworten können soll.
  • FEATURE ANREGUNG: Sicherstellen, dass Auswahllisten auch hierarchische Strukturen abbilden können…

Klassik Stiftung Weimar:

  • Plädoyer für Normdaten in Crowdsourcing um die Vernetzung der Daten untereinander zu gewährleisten.

Humboldt Universität Berlin:

  • Es werden verschiedene Anwendungsszenarien aufgezeigt für die ein Interesse im Kontext Crowdsourcing besteht. Dieses sind:
    • FEATURE ANREGUNG: Freigabe von OCR für die Korrektur
    • FEATURE ANREGUNG: Freigabe von bestimmten Struktur- und Metadaten für die Erfassung, zum Beispiel Bildunterschriften oder Bildbeschreibungen
    • FEATURE ANREGUNG: Freigabe von Metadaten für die Korrektur
  • FEATURE ANREGUNG: Es wird auf die Notwendigkeit eines Redaktionssystems für besagte Anwendungsszenarien hingewiesen, da im optimalen Fall die Daten in Primärsysteme zurückfließen sollen.
  • FEATURE ANREGUNG: Ein Rückfluss der erzeugten Daten zu Goobi workflow soll sichergestellt sein.

Universitätsbibliothek Kiel:

  • Bei einer Anwenderbefragung zum Crowdsourcing gab es verschiedene Rückmeldungen. Ein wichtiger Punkt ist die Versionierung. Dieses betrifft vor allem die Transkription von Dokumenten, wäre dann aber analog auch auf die Erschließung von Beständen anzuwenden.
  • FEATURE ANREGUNG: Versionierung von Arbeiten um auf frühere Versionsstände zurückspringen zu können

Allgemein:

  • Es entwickelt sich eine grundsätzliche Diskussion über die in dem Kontext gewünschte Funktionalität.
  • Im Ergebnis ist Konsens, dass das Optimum wäre die Information zu erfassen: "WER hat WANN WAS gemacht?
  • Es kommt der Vorschlag auf für diese Funktionalität auf Git zurückzugreifen.
  • Es wird angemerkt, dass eventuell das “WER” ausgeklammert werden muss, Stichwort “DSGVO”
  • Es wird vorgeschlagen, dass nach Möglichkeit bei dem Erstellen einer Kampagne ausgewählt werden kann ob ein “WER” mit gespeichert wird.

Universitätsbibliothek Kiel:

  • Es wird allgemein angemerkt, dass die Bedienbarkeit der aktuellen OCR Korrektur nicht optimal ist, aber auch kein besserer Vorschlag dafür existieren würde.

Universitätsbibliothek Greifswald:

  • Für die Verbesserung der Bedienbarkeit wird eine Anzeige von “Bild oben, OCR Korrektur unten” auf Zeilenbasis angeregt. Dabei soll im Bild hervorgehoben werden wo man sich gerade befindet.

Universitätsbibliothek Kiel:

  • Es wird der Wunsch geäußert während der Entwicklung die Nutzer mit einzubeziehen um nicht “an der Praxis vorbei” zu entwickeln.

Klassik Stiftung Weimar:

  • Es wird angeregt in die monatlichen Digests einen “Coming soon…” mit aufzunehmen

Universitätsbibliothek Greifswald:

  • Es wird berichtet, dass Nutzer teilweise sehr lange nachdenken bevor sie tippen. Deswegen sollte der Zwischenstand möglichst automatisch gespeichert werden, die Session timeouts sich im Crowdsourcing anders verhalten als im restlichen Backend oder zumindest konfigurierbar sein.
  • Beim Transkribieren wird vorgeschlagen Sonderzeichen als Copy&Paste Vorlage projektbezogen anzeigen zu können.

intranda GmbH:

  • FEATURE ANREGUNG: Frage/Aufgabenstellung als HTML erlauben um Sonderzeichen oder Kopiervorlagen besser vorgeben zu können.

Universitätsbibliothek Greifswald:

  • Es wird über das Problem berichtet, dass gesperrte Überschriften in der OCR oft falsch erkannt werden. Dabei ist jeder Buchstabe ein eigenes Wort.
  • FEATURE ANREGUNG: Markieren von mehreren Wörtern im Bild um diese entweder zusammenzufassen oder lösche zu können.

Universitätsbibliotheken Greifswald und Kiel:

  • FEATURE ANREGUNG: Wenn man einen Suchtreffer hat, der auf einem Seitenbereich basiert, dann soll beim öffnen des Treffers auch direkt zu diesem Seitenbereich gezoomt werden.

Allgemein:

  • Es wird ein Szenario dargestellt, in dem verschiedene IIIF Manifeste aus unterschiedlichen Einrichtungen innerhalb einer lokalen Crowdsourcing Kampagne bearbeitet werden sollen. Es entsteht eine Diskussion darüber wie das realisiert werden kann.
  • FEATURE ANREGUNG: Erweiterung der Merklisten Funktionalität um neben einer Solr-Query auch ein fixes Set an Werken für eine Kampagne zu erstellen
  • FEATURE ANREGUNG: Erweiterung der Merklisten Funktionalität um neben Werken auch einzelne Bilder speichern zu können
  • FEATURE ANREGUNG: Erweiterung der Merklisten Funktionalität um IIIF Manifeste von externen Quellen zu speichern
  • Die Fragestellung der Suche wird erörtert. Dafür müssen die Werke ja indexiert werden. Damit die externen Werke nicht im allgemeinen Datenbestand auftauchen müsste das in einem eigenen Suchindex passieren. Die Problemstellung hierbei ist, dass die Metadaten in den Manifesten nicht standardisiert sind. Auf einen entsprechenden Vortrag der BSB während der IIIF Konferenz wurde in diesem Kontext hingewiesen.

Universitätsbibliothek Kiel:

  • Es wird allgemein das Thema angesprochen, ob es denkbar ist den Goobi viewer als eine kleine virtuelle Forschungsumgebung für Textquellen oder für die Bearbeitung und Präsentation von Editionen weiterzuentwickeln und einzusetzen. Es wird gefragt, ob es möglich ist das Ergebnis einer Kampagne als Edition zu präsentieren ohne dafür eine eigene Installation zu haben. In diesem Kontext wird dann noch über die Möglichkeiten des CMS und individuelle Templates + Styling sowie Karten gesprochen.

intranda GmbH:

  • FEATURE ANREGUNG: Sauber konzipierte und dokumentierte REST API für den Goobi viewer

Universitätsbibliothek Greifswald:

  • Wichtig ist die Beständigkeit und Nachnutzbarkeit der Daten. Das greift bereits heute und ist auch für die Zukunft wichtig.
  • FEATURE ANREGUNG: Verortung von Geokoordinaten, Karteneinstieg in der Suche

Klassik Stiftung Weimar und Universitätsbibliothek Kiel:

  • Es wird bemängelt, dass im Konzept bisher kein Grund für das Ablehnen eines Reviews angegeben werden kann. Deswegen wird ein Vorgangslog angeregt in dem Annotationen oder Zurückweisungen begründet werden können.

Humboldt Universität Berlin:

  • Es wird angemerkt, dass gerade in virtuellen Forschungsumgebungen nicht nur das Ergebnis, sondern auch der Weg dahin wichtig ist. Allerdings ist bei anderen Fragestellungen, wo zum Beispiel durch klassisches Crowdsourcing fehlende lokale Ressourcen aufgefüllt werden sollen nur das Endergebnis von Priorität.

Allgemein:

  • Es entsteht eine Diskussion ob auch ein Vorgangslog am Ende mit in der Oberfläche angezeigt werden soll.

Universitätsbibliothek Kiel:

  • Der Begriff des “ExpertSourcing” wird erörtert. Dabei wird an Wissenschaftler gedacht, die zum Beispiel Material sichten, annotieren und das als Vorbereitung für einen Antrag nutzen. Dabei ist die Versionierung sehr wichtig. Die Ergebnisse sollen aber nur einer eingeschränkten Gruppe zuständig sein. Zu einem späteren Zeitpunkt soll es möglich sein die Ergebnisse allen zugänglich zu machen.

Humboldt Universität Berlin:

  • Es wird angeregt für diese Fragestellungen die Wissenschaftler eventuell in einem dedizierten Goobi viewer ohne große Designanpassungen arbeiten zu lassen und am Ende die Ergebnisse dann zu exportieren und gegebenenfalls in der allgemein zugänglichen Goobi viewer Instanz zu importieren

Klassik Stiftung Weimar:

  • Es wird gefragt ob der Review Modus optional ist oder optional gemacht werden kann.

intranda GmbH:

  • FEATURE ANREGUNG: Die Einschränkungen für Kampagnen nicht in der Kampagnenansicht selbst machen

Klassik Stiftung Weimar:

  • Es wird gefragt, ob konfiguriert werden kann, dass der Review auch von mehr als einer Person durchgeführt werden muss (Antwort: bisher nicht). Außerdem wird das Thema dynamische Kampagnen angesprochen. Diese sind heute bereits möglich, so dass alle Werke die zum Beispiel ein entsprechendes Schlagwort enthalten Teil einer Kampagne sind.
  • FEATURE ANREGUNG: Prüfen wie das mit dynamischen Kampagnen und Statistiken ist.
  • Es wird gewünscht zu einem bestimmten Zeitpunkt das automatische hinzufügen von Werken zu einer dynamischen Kampagnen zu beenden.
  • FEATURE ANREGUNG: Aus allen Werken einer Solr-Query eine Merkliste erstellen.

Universitätsbibliothek Kiel:

  • Im ExpertSourcing wird kein “Bestätigen und abschließen” benötigt, sondern nur ein “Speichern”.

Universitätsbibliothek Greifswald:

  • Leute dürfen durch Technik nicht entmutigt werden

Universitätsbibliothek Kiel:

  • Am Ende ergibt sich noch eine Diskussion über TEI. Es wird gewünscht einen TEI Export zu haben, der eine HEAD mit Metadaten und BODY mit den Volltexten erzeugt. Später sollen auch Strukturinformationen mit aufgenommen werden, wohl wissend, dass es eine gewisse Unschärfe gibt wenn ein Strukturelement auf der Mitte der Seite beginnt.

Das Meeting war dann zu Ende. Es wurde verabredet das Protokoll auf dem Goobi Community Forum zu veröffentlichen.

1 „Gefällt mir“