Diese Präsentation wurde erfolgreich gemeldet.

Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis

0

Teilen

1 von 12
1 von 12

Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis

0

Teilen

Herunterladen, um offline zu lesen

Beschreibung

Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis

Transkript

  1. 1. Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis Elias Kreyenbühl (Universitätsbibliothek Basel) & Oliver Paetzel (intranda GmbH) Goobi-Tage2018, 20.9.2018
  2. 2. Wie alles begann… Erfahrungsbericht Goobi-Tage 2017: Präsentation eines Prototyps Titel Vortrag, Autor, DD.MM.YY Universität Basel 2
  3. 3. Herausforderung Impresso-Projekt Digital Humanities Laboratory (DHLAB) at the Swiss Federal Institute of Technology in Lausanne Institute of Computational Linguistics, Universität Zürich Luxembourg Centre for Contemporary and Digital History Associate Partners: Swiss National Library, Bibliothèque nationale de Luxembourg, Le Temps, NZZ, Schweizerisches Wirtschaftsarchiv (SWA), Staatsarchiv Wallis Titel Vortrag, Autor, DD.MM.YY Universität Basel 3
  4. 4. Impresso Projekt Titel Vortrag, Autor, DD.MM.YY Universität Basel 4
  5. 5. Herausforderung Impresso-Projekt Titel Vortrag, Autor, DD.MM.YY Universität Basel 5
  6. 6. Wie sind wir vorgegangen? • Erster Kontakt mit Intranda • Installation neue Goobi-Version • Wir waren schon am Scannen • Vorgangsvorlagen anpassen • Bugfixing (Vergrösserungsfeature) • experimentell produktiv innerhalb von drei Wochen Titel Vortrag, Autor, DD.MM.YY Universität Basel 6
  7. 7. Titel Vortrag, Autor, DD.MM.YY Universität Basel 7
  8. 8. Anfangen und trainieren Allgemeines Trainingsset 5 Bände korrigiert Erstes Modell mit Basler Titeln Zweites Modell mit Basler Titeln Dann kommt schon wieder die nächste Zeitschrift/Zeitung Titel Vortrag, Autor, DD.MM.YY Universität Basel 8
  9. 9. Live Demo Titel Vortrag, Autor, DD.MM.YY Universität Basel 9
  10. 10. Fazit aus Sicht UB Basel • Das Tool ist äusserst hilfreich und effizient. • Wir können Sachen machen, für die wir sonst die zeitlichen Ressourcen nicht hätten. • Das User Interface ist das Beste an der ganzen Sache: im Prinzip wäre das eine Katalogisierungsaufgabe, aber es konnte dank der Usability von einer studentischen Hilfskraft gemacht werden. • Die Ausgabenerschliessung ging in einem Rutsch mit der regulären Qualitätskontrolle. • Eine reguläre QK vorneweg hat auch ihre Vorteile: wenn was nicht stimmt, muss es nicht wieder «hoch» geschickt werden • wünschenswert: schnellere Anzeige (schnellere NAS Verbindung oder IIIF) Titel Vortrag, Autor, DD.MM.YY Universität Basel 10
  11. 11. Kennzahlen zum Neuronalen Netz ● Gesamtanzahl Bilder im Trainingsset: 35243 ● Anzahl Bilder Klasse “title”: 17288 ● Anzahl Bilder Klasse “other”: 17955 ● Bilder benutzt zum Nachtrainieren des 1. Modells: 1713 ● Bilder benutzt zum Nachtrainieren des 2. Modells: 2677 11
  12. 12. Pläne für den weiteren Ausbau ● Kleines Widget zur Abfrage des Wochentags ● Granularere Auswahl der Ausgabenregeln (mehrere Ausgaben pro Tag) ● Nachladen der weiteren Ausgaben beim scrollen ● Thumbnail-Liste als CSS-Grid umsetzen 12

Beschreibung

Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis

Transkript

  1. 1. Automatisierte Ausgabenerkennung von Zeitschriften in der Praxis Elias Kreyenbühl (Universitätsbibliothek Basel) & Oliver Paetzel (intranda GmbH) Goobi-Tage2018, 20.9.2018
  2. 2. Wie alles begann… Erfahrungsbericht Goobi-Tage 2017: Präsentation eines Prototyps Titel Vortrag, Autor, DD.MM.YY Universität Basel 2
  3. 3. Herausforderung Impresso-Projekt Digital Humanities Laboratory (DHLAB) at the Swiss Federal Institute of Technology in Lausanne Institute of Computational Linguistics, Universität Zürich Luxembourg Centre for Contemporary and Digital History Associate Partners: Swiss National Library, Bibliothèque nationale de Luxembourg, Le Temps, NZZ, Schweizerisches Wirtschaftsarchiv (SWA), Staatsarchiv Wallis Titel Vortrag, Autor, DD.MM.YY Universität Basel 3
  4. 4. Impresso Projekt Titel Vortrag, Autor, DD.MM.YY Universität Basel 4
  5. 5. Herausforderung Impresso-Projekt Titel Vortrag, Autor, DD.MM.YY Universität Basel 5
  6. 6. Wie sind wir vorgegangen? • Erster Kontakt mit Intranda • Installation neue Goobi-Version • Wir waren schon am Scannen • Vorgangsvorlagen anpassen • Bugfixing (Vergrösserungsfeature) • experimentell produktiv innerhalb von drei Wochen Titel Vortrag, Autor, DD.MM.YY Universität Basel 6
  7. 7. Titel Vortrag, Autor, DD.MM.YY Universität Basel 7
  8. 8. Anfangen und trainieren Allgemeines Trainingsset 5 Bände korrigiert Erstes Modell mit Basler Titeln Zweites Modell mit Basler Titeln Dann kommt schon wieder die nächste Zeitschrift/Zeitung Titel Vortrag, Autor, DD.MM.YY Universität Basel 8
  9. 9. Live Demo Titel Vortrag, Autor, DD.MM.YY Universität Basel 9
  10. 10. Fazit aus Sicht UB Basel • Das Tool ist äusserst hilfreich und effizient. • Wir können Sachen machen, für die wir sonst die zeitlichen Ressourcen nicht hätten. • Das User Interface ist das Beste an der ganzen Sache: im Prinzip wäre das eine Katalogisierungsaufgabe, aber es konnte dank der Usability von einer studentischen Hilfskraft gemacht werden. • Die Ausgabenerschliessung ging in einem Rutsch mit der regulären Qualitätskontrolle. • Eine reguläre QK vorneweg hat auch ihre Vorteile: wenn was nicht stimmt, muss es nicht wieder «hoch» geschickt werden • wünschenswert: schnellere Anzeige (schnellere NAS Verbindung oder IIIF) Titel Vortrag, Autor, DD.MM.YY Universität Basel 10
  11. 11. Kennzahlen zum Neuronalen Netz ● Gesamtanzahl Bilder im Trainingsset: 35243 ● Anzahl Bilder Klasse “title”: 17288 ● Anzahl Bilder Klasse “other”: 17955 ● Bilder benutzt zum Nachtrainieren des 1. Modells: 1713 ● Bilder benutzt zum Nachtrainieren des 2. Modells: 2677 11
  12. 12. Pläne für den weiteren Ausbau ● Kleines Widget zur Abfrage des Wochentags ● Granularere Auswahl der Ausgabenregeln (mehrere Ausgaben pro Tag) ● Nachladen der weiteren Ausgaben beim scrollen ● Thumbnail-Liste als CSS-Grid umsetzen 12

Weitere Verwandte Inhalte

Ähnliche Bücher

Kostenlos mit einer 30-tägigen Testversion von Scribd

Alle anzeigen

Ähnliche Hörbücher

Kostenlos mit einer 30-tägigen Testversion von Scribd

Alle anzeigen

×