Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis

Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis

  • Loggen Sie sich ein, um Kommentare anzuzeigen.

  • Gehören Sie zu den Ersten, denen das gefällt!

Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis

  1. 1. Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis Elias Kreyenbühl (Universitätsbibliothek Basel) & Oliver Paetzel (intranda GmbH) Goobi-Tage2018, 20.9.2018
  2. 2. Wie alles begann… Erfahrungsbericht Goobi-Tage 2017: Präsentation eines Prototyps Titel Vortrag, Autor, DD.MM.YY Universität Basel 2
  3. 3. Herausforderung Impresso-Projekt Digital Humanities Laboratory (DHLAB) at the Swiss Federal Institute of Technology in Lausanne Institute of Computational Linguistics, Universität Zürich Luxembourg Centre for Contemporary and Digital History Associate Partners: Swiss National Library, Bibliothèque nationale de Luxembourg, Le Temps, NZZ, Schweizerisches Wirtschaftsarchiv (SWA), Staatsarchiv Wallis Titel Vortrag, Autor, DD.MM.YY Universität Basel 3
  4. 4. Impresso Projekt Titel Vortrag, Autor, DD.MM.YY Universität Basel 4
  5. 5. Herausforderung Impresso-Projekt Titel Vortrag, Autor, DD.MM.YY Universität Basel 5
  6. 6. Wie sind wir vorgegangen? • Erster Kontakt mit Intranda • Installation neue Goobi-Version • Wir waren schon am Scannen • Vorgangsvorlagen anpassen • Bugfixing (Vergrösserungsfeature) • experimentell produktiv innerhalb von drei Wochen Titel Vortrag, Autor, DD.MM.YY Universität Basel 6
  7. 7. Titel Vortrag, Autor, DD.MM.YY Universität Basel 7
  8. 8. Anfangen und trainieren Allgemeines Trainingsset 5 Bände korrigiert Erstes Modell mit Basler Titeln Zweites Modell mit Basler Titeln Dann kommt schon wieder die nächste Zeitschrift/Zeitung Titel Vortrag, Autor, DD.MM.YY Universität Basel 8
  9. 9. Live Demo Titel Vortrag, Autor, DD.MM.YY Universität Basel 9
  10. 10. Fazit aus Sicht UB Basel • Das Tool ist äusserst hilfreich und effizient. • Wir können Sachen machen, für die wir sonst die zeitlichen Ressourcen nicht hätten. • Das User Interface ist das Beste an der ganzen Sache: im Prinzip wäre das eine Katalogisierungsaufgabe, aber es konnte dank der Usability von einer studentischen Hilfskraft gemacht werden. • Die Ausgabenerschliessung ging in einem Rutsch mit der regulären Qualitätskontrolle. • Eine reguläre QK vorneweg hat auch ihre Vorteile: wenn was nicht stimmt, muss es nicht wieder «hoch» geschickt werden • wünschenswert: schnellere Anzeige (schnellere NAS Verbindung oder IIIF) Titel Vortrag, Autor, DD.MM.YY Universität Basel 10
  11. 11. Kennzahlen zum Neuronalen Netz ● Gesamtanzahl Bilder im Trainingsset: 35243 ● Anzahl Bilder Klasse “title”: 17288 ● Anzahl Bilder Klasse “other”: 17955 ● Bilder benutzt zum Nachtrainieren des 1. Modells: 1713 ● Bilder benutzt zum Nachtrainieren des 2. Modells: 2677 11
  12. 12. Pläne für den weiteren Ausbau ● Kleines Widget zur Abfrage des Wochentags ● Granularere Auswahl der Ausgabenregeln (mehrere Ausgaben pro Tag) ● Nachladen der weiteren Ausgaben beim scrollen ● Thumbnail-Liste als CSS-Grid umsetzen 12

×