Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung Ralf Stockmann < [email_address] >
GDZ: Laufende Projekte (Auszug) <ul><li>SSG Digitalisierung (Mathematik) </li></ul><ul><li>VD17 / VD18 (seit heute 6:00: V...
Anforderungen an Massendigitalisierung <ul><li>Workflow-Steuerung </li></ul><ul><li>Computing-Kapazität </li></ul><ul><ul>...
Strategische Ziele <ul><li>Kein eigenes „Blech“ warten (Outsourcing des Betriebs in Rechenzentren) </li></ul><ul><li>Angeb...
D rei Schritte: ?
1. Schritt Volltexterkennung (OCR) <ul><li>Grundlage: ABBYY Finereader Recognition Server </li></ul><ul><li>16 Kerne </li>...
OCR <ul><li>Zielsetzung </li></ul><ul><li>Auswahl des Materials </li></ul><ul><li>Benchmarking / Standards </li></ul><ul><...
Seitenpreis: ca. 1 Cent ✗ ✔
2. Schritt Storage <ul><li>Produktionsstorage für die Wochenproduktion </li></ul><ul><li>Hintergelagerter Archivstorage fü...
3. Schritt Goobi-Hosting <ul><li>Apache, MySQL, PHP, JAVA, Tomcat, Lucéne, TYPO3, OAI, RSS, WebDAV, PDF-Renderer, ... </li...
D rei Schritte: Massendigitalisierung für jede Einrichtung <ul><li>Volltexterkennung (OCR) </li></ul><ul><li>Storage-Hosti...
Vielen Dank... ...Fragen? Ralf Stockmann (stockmann@sub.uni-goettingen.de)
Nächste SlideShare
Wird geladen in …5
×

Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung

980 Aufrufe

Veröffentlicht am

Veröffentlicht in: Bildung
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
980
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
11
Aktionen
Geteilt
0
Downloads
3
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung

  1. 1. Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung Ralf Stockmann < [email_address] >
  2. 2. GDZ: Laufende Projekte (Auszug) <ul><li>SSG Digitalisierung (Mathematik) </li></ul><ul><li>VD17 / VD18 (seit heute 6:00: Vollasttest) </li></ul><ul><li>EZOOLO 2 </li></ul><ul><li>Rezensionszeitschriften </li></ul><ul><li>DigiWunschbuch </li></ul><ul><li>> 7 Mio. Seiten </li></ul><ul><li>Unterschiedliche Erschließung </li></ul>
  3. 3. Anforderungen an Massendigitalisierung <ul><li>Workflow-Steuerung </li></ul><ul><li>Computing-Kapazität </li></ul><ul><ul><li>Suchindex, Rendering, ... </li></ul></ul><ul><li>Storage </li></ul><ul><li>Verlässlichkeit </li></ul><ul><li>Ansprechpartner die „unsere Sprache“ verstehen </li></ul>
  4. 4. Strategische Ziele <ul><li>Kein eigenes „Blech“ warten (Outsourcing des Betriebs in Rechenzentren) </li></ul><ul><li>Angebot „von der Stange“ das an die Projektbedürfnisse angepasst werden kann (Design, spezialisiertes Retrieval) </li></ul><ul><li>Garantierte Kompatibilität zu DFG-Richtlinien (METS, TIFF, PDF, DFG-Viewer, TEI-Volltext) </li></ul><ul><li>Skalierbare Lösungen, auch für kleine Standorte sinnvoll nutzbar </li></ul><ul><li>Partner der „unsere Sprache“ versteht </li></ul>
  5. 5. D rei Schritte: ?
  6. 6. 1. Schritt Volltexterkennung (OCR) <ul><li>Grundlage: ABBYY Finereader Recognition Server </li></ul><ul><li>16 Kerne </li></ul><ul><li>80 Seiten pro Minute </li></ul><ul><li>Konvertierung des Finereader-XML Outputs in TEI P5 </li></ul><ul><li>Wortkoordinaten für Image-Highlighting </li></ul><ul><li>Derzeit nicht: Fraktur </li></ul><ul><li>In Arbeit: Fehlerrobuste Übergabe aus Goobi heraus, für Anwender transparent </li></ul>
  7. 7. OCR <ul><li>Zielsetzung </li></ul><ul><li>Auswahl des Materials </li></ul><ul><li>Benchmarking / Standards </li></ul><ul><li>Produktionsorganisation / Logistik </li></ul><ul><li>Arbeitsvorbereitungen (AV) </li></ul><ul><li>Digitalisierung </li></ul><ul><li>Qualitätskontrolle (QK) </li></ul><ul><li>Bildoptimierung / Verarbeitung </li></ul><ul><li>Metadatengenerierung </li></ul><ul><li>Präsentation / Verwertung </li></ul><ul><li>Zugang / Evaluation </li></ul><ul><li>(Langzeit) Archivierung </li></ul>OCR
  8. 8. Seitenpreis: ca. 1 Cent ✗ ✔
  9. 9. 2. Schritt Storage <ul><li>Produktionsstorage für die Wochenproduktion </li></ul><ul><li>Hintergelagerter Archivstorage für die Master-Files </li></ul><ul><li>Schneller Storage für die Präsentationsexemplare </li></ul><ul><li>Im Einzelfall zu klären: </li></ul><ul><ul><li>Datentransport </li></ul></ul><ul><ul><li>Sogar Scannen über das Netz möglich? </li></ul></ul><ul><li>Preis: im Einzelfall zu errechnen </li></ul>
  10. 10. 3. Schritt Goobi-Hosting <ul><li>Apache, MySQL, PHP, JAVA, Tomcat, Lucéne, TYPO3, OAI, RSS, WebDAV, PDF-Renderer, ... </li></ul><ul><li>Server-Bereitstellung sowohl der Produktions- als auch der Präsentationsumgebung </li></ul><ul><li>Wartung und Updates durch verschiedene Dienstleister (eventuell auch GBV selbst) </li></ul><ul><li>Vorgefertigte Layouts und Workflow-Vorlagen </li></ul><ul><li>Verfügbarkeit und Preis noch zu klären </li></ul>
  11. 11. D rei Schritte: Massendigitalisierung für jede Einrichtung <ul><li>Volltexterkennung (OCR) </li></ul><ul><li>Storage-Hosting </li></ul><ul><li>Hosting der Produktions- und Präsentations-umgebung (Goobi) </li></ul>
  12. 12. Vielen Dank... ...Fragen? Ralf Stockmann (stockmann@sub.uni-goettingen.de)

×