Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.
Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung Ralf Stockmann < [email_address] >
GDZ: Laufende Projekte (Auszug) <ul><li>SSG Digitalisierung (Mathematik) </li></ul><ul><li>VD17 / VD18 (seit heute 6:00: V...
Anforderungen an Massendigitalisierung <ul><li>Workflow-Steuerung </li></ul><ul><li>Computing-Kapazität </li></ul><ul><ul>...
Strategische Ziele <ul><li>Kein eigenes „Blech“ warten (Outsourcing des Betriebs in Rechenzentren) </li></ul><ul><li>Angeb...
D rei Schritte: ?
1. Schritt Volltexterkennung (OCR) <ul><li>Grundlage: ABBYY Finereader Recognition Server </li></ul><ul><li>16 Kerne </li>...
OCR <ul><li>Zielsetzung </li></ul><ul><li>Auswahl des Materials </li></ul><ul><li>Benchmarking / Standards </li></ul><ul><...
Seitenpreis: ca. 1 Cent ✗ ✔
2. Schritt Storage <ul><li>Produktionsstorage für die Wochenproduktion </li></ul><ul><li>Hintergelagerter Archivstorage fü...
3. Schritt Goobi-Hosting <ul><li>Apache, MySQL, PHP, JAVA, Tomcat, Lucéne, TYPO3, OAI, RSS, WebDAV, PDF-Renderer, ... </li...
D rei Schritte: Massendigitalisierung für jede Einrichtung <ul><li>Volltexterkennung (OCR) </li></ul><ul><li>Storage-Hosti...
Vielen Dank... ...Fragen? Ralf Stockmann (stockmann@sub.uni-goettingen.de)
Nächste SlideShare
Wird geladen in …5
×

Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung

1.073 Aufrufe

Veröffentlicht am

Veröffentlicht in: Bildung
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung

  1. 1. Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung Ralf Stockmann < [email_address] >
  2. 2. GDZ: Laufende Projekte (Auszug) <ul><li>SSG Digitalisierung (Mathematik) </li></ul><ul><li>VD17 / VD18 (seit heute 6:00: Vollasttest) </li></ul><ul><li>EZOOLO 2 </li></ul><ul><li>Rezensionszeitschriften </li></ul><ul><li>DigiWunschbuch </li></ul><ul><li>> 7 Mio. Seiten </li></ul><ul><li>Unterschiedliche Erschließung </li></ul>
  3. 3. Anforderungen an Massendigitalisierung <ul><li>Workflow-Steuerung </li></ul><ul><li>Computing-Kapazität </li></ul><ul><ul><li>Suchindex, Rendering, ... </li></ul></ul><ul><li>Storage </li></ul><ul><li>Verlässlichkeit </li></ul><ul><li>Ansprechpartner die „unsere Sprache“ verstehen </li></ul>
  4. 4. Strategische Ziele <ul><li>Kein eigenes „Blech“ warten (Outsourcing des Betriebs in Rechenzentren) </li></ul><ul><li>Angebot „von der Stange“ das an die Projektbedürfnisse angepasst werden kann (Design, spezialisiertes Retrieval) </li></ul><ul><li>Garantierte Kompatibilität zu DFG-Richtlinien (METS, TIFF, PDF, DFG-Viewer, TEI-Volltext) </li></ul><ul><li>Skalierbare Lösungen, auch für kleine Standorte sinnvoll nutzbar </li></ul><ul><li>Partner der „unsere Sprache“ versteht </li></ul>
  5. 5. D rei Schritte: ?
  6. 6. 1. Schritt Volltexterkennung (OCR) <ul><li>Grundlage: ABBYY Finereader Recognition Server </li></ul><ul><li>16 Kerne </li></ul><ul><li>80 Seiten pro Minute </li></ul><ul><li>Konvertierung des Finereader-XML Outputs in TEI P5 </li></ul><ul><li>Wortkoordinaten für Image-Highlighting </li></ul><ul><li>Derzeit nicht: Fraktur </li></ul><ul><li>In Arbeit: Fehlerrobuste Übergabe aus Goobi heraus, für Anwender transparent </li></ul>
  7. 7. OCR <ul><li>Zielsetzung </li></ul><ul><li>Auswahl des Materials </li></ul><ul><li>Benchmarking / Standards </li></ul><ul><li>Produktionsorganisation / Logistik </li></ul><ul><li>Arbeitsvorbereitungen (AV) </li></ul><ul><li>Digitalisierung </li></ul><ul><li>Qualitätskontrolle (QK) </li></ul><ul><li>Bildoptimierung / Verarbeitung </li></ul><ul><li>Metadatengenerierung </li></ul><ul><li>Präsentation / Verwertung </li></ul><ul><li>Zugang / Evaluation </li></ul><ul><li>(Langzeit) Archivierung </li></ul>OCR
  8. 8. Seitenpreis: ca. 1 Cent ✗ ✔
  9. 9. 2. Schritt Storage <ul><li>Produktionsstorage für die Wochenproduktion </li></ul><ul><li>Hintergelagerter Archivstorage für die Master-Files </li></ul><ul><li>Schneller Storage für die Präsentationsexemplare </li></ul><ul><li>Im Einzelfall zu klären: </li></ul><ul><ul><li>Datentransport </li></ul></ul><ul><ul><li>Sogar Scannen über das Netz möglich? </li></ul></ul><ul><li>Preis: im Einzelfall zu errechnen </li></ul>
  10. 10. 3. Schritt Goobi-Hosting <ul><li>Apache, MySQL, PHP, JAVA, Tomcat, Lucéne, TYPO3, OAI, RSS, WebDAV, PDF-Renderer, ... </li></ul><ul><li>Server-Bereitstellung sowohl der Produktions- als auch der Präsentationsumgebung </li></ul><ul><li>Wartung und Updates durch verschiedene Dienstleister (eventuell auch GBV selbst) </li></ul><ul><li>Vorgefertigte Layouts und Workflow-Vorlagen </li></ul><ul><li>Verfügbarkeit und Preis noch zu klären </li></ul>
  11. 11. D rei Schritte: Massendigitalisierung für jede Einrichtung <ul><li>Volltexterkennung (OCR) </li></ul><ul><li>Storage-Hosting </li></ul><ul><li>Hosting der Produktions- und Präsentations-umgebung (Goobi) </li></ul>
  12. 12. Vielen Dank... ...Fragen? Ralf Stockmann (stockmann@sub.uni-goettingen.de)

×