Erfahrungsbericht:ZeitungsdigitalisierungsprojekteHistorische Dokumente auf dem Weg zum digitalen Volltext© Fraunhofer-Ins...
Projekt Neue Zürcher ZeitungAuftraggeber:  Neue Zürcher Zeitung  2004-2006Projektinhalt:  Digitalisierung und automatische...
Ausgangslage1503 Mikrofilme (35mm, 50m)1300 Zeitungsseiten pro Film→ 2 Mio. SeitenSchwankende Verfilmungsqualität,  Verzer...
Archivanwendung       Suchbeispiel:       Gotthardtunnel© Fraunhofer-Institut für Intelligente  Analyse- und Informationss...
Archivanwendung       Suchbeispiel:       Gotthardtunnel© Fraunhofer-Institut für Intelligente  Analyse- und Informationss...
Archivanwendung       Suchbeispiel:       Gotthardtunnel© Fraunhofer-Institut für Intelligente  Analyse- und Informationss...
Projekt DonaukurierAuftraggeber:  Donaukurier  2006-2007Projektinhalt:  Digitalisierung und automa-  tische Analyse von 1,...
Ergebnis: Archivanwendung© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Ergebnis: USB-Stick-Anwendung© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Projekt Liechtensteiner VolksblattAuftraggeber:      GMG, AlosProjektinhalt:      automatische      Artikelseparierung    ...
Verwendete Techniken© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Digitalisierung von MikrofilmenDigitalisierung wird von ScanPlex in   Bocholt durchgeführtSystem: FlexScan der Firma NextS...
NextScan Auditor© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Freistellung der Seiten© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Schärfung von MikrofilmdigitalisatenSchärfung der Bilder durch eine Unsharp-Mask (nur bei Mikrofilm)© Fraunhofer-Institut ...
Fontverbesserung für BleisatzVorher:Nachher:Fehlerreduktion: 35% relativ© Fraunhofer-Institut für Intelligente  Analyse- u...
IndexerstellungTitelseitenerkennung                      Vorteile:Erkennung von Datum, Ausgabe, Rubrik      • Kostengünsti...
OCR1. Seitensegmentierung: Entwicklung von IAIS2. Zeichenerkennung (OCR): Abbyy Finereader SDK3. XML-Ausgabe: eigenes Form...
Artikelsegmentierung       Zerlegung einer Seite       Basierend auf Layoutanalyse       Unabhängig von Abbyy       Finere...
Vergleich Mikrofilm – Papier© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Vergleich von Mikrofilmen  Zeitung 1                               Zeitung 2     Verkleinerungsfaktor 22:1             Ver...
Vergleich von Digitalisaten von PapierDienstleister 1                           Dienstleister 2© Fraunhofer-Institut für I...
Vergleich Mikrofilm – Papier  Mikrofilm                               Papier  + Geringe Digitalisierungskosten        – ho...
Seiten pro Jahrgang© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Zeitschriftendigitalisierung© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
EMMAdigitalSicherer Online-Zugriff auf das komplette EMMA-Archiv     Alle Emma-Ausgaben ab der Erstausgabe     1977 digita...
© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Vielen Dank für Ihre Aufmerksamkeit© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Anhang© Fraunhofer-Institut für Intelligente  Analyse- und Informationssysteme IAIS
Vorverarbeitung – Entzerrung              Vorteil:                                           Vorlagen von schlechter      ...
Artikelsegmentierung Kombination von drei Verfahren:         Regelbasiert, Reading-Order und Probabilistischinitial graph ...
Nächste SlideShare
Wird geladen in …5
×

Digitalisierungspraxis - Eickeler - Zeitungsdigitalisierung

949 Aufrufe

Veröffentlicht am

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
949
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
319
Aktionen
Geteilt
0
Downloads
6
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Digitalisierungspraxis - Eickeler - Zeitungsdigitalisierung

  1. 1. Erfahrungsbericht:ZeitungsdigitalisierungsprojekteHistorische Dokumente auf dem Weg zum digitalen Volltext© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  2. 2. Projekt Neue Zürcher ZeitungAuftraggeber: Neue Zürcher Zeitung 2004-2006Projektinhalt: Digitalisierung und automatische Analyse von 2 Million Zeitungsseiten 1780-2005 (70 Terabyte) Web-basierte ArchivanwendungAuszeichnung: Computer World Honors Program (USA)© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  3. 3. Ausgangslage1503 Mikrofilme (35mm, 50m)1300 Zeitungsseiten pro Film→ 2 Mio. SeitenSchwankende Verfilmungsqualität, VerzerrungenBis 1946 Frakturschrift, danach AntiquaWechselndes Layout in den ersten Jahren© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  4. 4. Archivanwendung Suchbeispiel: Gotthardtunnel© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  5. 5. Archivanwendung Suchbeispiel: Gotthardtunnel© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  6. 6. Archivanwendung Suchbeispiel: Gotthardtunnel© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  7. 7. Projekt DonaukurierAuftraggeber: Donaukurier 2006-2007Projektinhalt: Digitalisierung und automa- tische Analyse von 1,5 Million Zeitungsseiten ab 1946 5 Regionalausgaben Web-basierte Archivanwendung Stand-alone Anwendung für USB-Stick© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  8. 8. Ergebnis: Archivanwendung© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  9. 9. Ergebnis: USB-Stick-Anwendung© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  10. 10. Projekt Liechtensteiner VolksblattAuftraggeber: GMG, AlosProjektinhalt: automatische Artikelseparierung von Zeitungsseiten (1900-2000) Artikelklassifikation Visualisierungstool Lieferung in XML- Format© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  11. 11. Verwendete Techniken© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  12. 12. Digitalisierung von MikrofilmenDigitalisierung wird von ScanPlex in Bocholt durchgeführtSystem: FlexScan der Firma NextScanCamera 8192 CMOS Pixel Array mit 10 Bit DynamikAuflösung 300 dpi (bezogen auf Originalgröße)TIFF-Dateien: 50 MB, 8 Bit, 256 GraustufenTransfer: LTO-Bänder (Linear Tape Open); 400 GByte pro Band, offene Datenformate© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  13. 13. NextScan Auditor© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  14. 14. Freistellung der Seiten© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  15. 15. Schärfung von MikrofilmdigitalisatenSchärfung der Bilder durch eine Unsharp-Mask (nur bei Mikrofilm)© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  16. 16. Fontverbesserung für BleisatzVorher:Nachher:Fehlerreduktion: 35% relativ© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  17. 17. IndexerstellungTitelseitenerkennung Vorteile:Erkennung von Datum, Ausgabe, Rubrik • Kostengünstige Indexierung durch Mustererkennung • Automatische Kontrolle© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  18. 18. OCR1. Seitensegmentierung: Entwicklung von IAIS2. Zeichenerkennung (OCR): Abbyy Finereader SDK3. XML-Ausgabe: eigenes Format mit spezifischen ExportformatenGute OCR-Qualität für Orts- und Personennamen durch Nutzung eines angepassten Wörterbuchs Wörterbuch der Redaktion (NZZ: 4 Mio. Wörter) Auslesen der aktuellen Ausgaben© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  19. 19. Artikelsegmentierung Zerlegung einer Seite Basierend auf Layoutanalyse Unabhängig von Abbyy Finereader Algorithmus für verschiedene Zeitungen parametrisierbar© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  20. 20. Vergleich Mikrofilm – Papier© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  21. 21. Vergleich von Mikrofilmen Zeitung 1 Zeitung 2 Verkleinerungsfaktor 22:1 Verkleinerungsfaktor 15:1 Steile Gradation Flache Gradation© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  22. 22. Vergleich von Digitalisaten von PapierDienstleister 1 Dienstleister 2© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  23. 23. Vergleich Mikrofilm – Papier Mikrofilm Papier + Geringe Digitalisierungskosten – hohe Digitalisierungskosten – Zusätzliche Abbildung – Hoher Aufwand für den verschlechtert Gesamtqualität Transport der Medien + Geringere Alterung des + Bessere Qualität erreichbar Mikrofilms als von Mikrofilm – Häufig heterogene Verfilmung + Farbscans sind möglich – Teilweise nur Duplikatfilme aus Ausleihe verfügbar© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  24. 24. Seiten pro Jahrgang© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  25. 25. Zeitschriftendigitalisierung© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  26. 26. EMMAdigitalSicherer Online-Zugriff auf das komplette EMMA-Archiv Alle Emma-Ausgaben ab der Erstausgabe 1977 digitalisiert Alle Ausgabe auf Artikelebene strukturiert erschlossen Elektronischer Lesesaal „MyBib eRoom“ erlaubt den sicheren und schnellen Online- Zugriff über das Internet Volltextsuche und kostenloser Zugriff auf 25.348 Seiten des Magazins http://emmadigital.hbz-nrw.de/© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  27. 27. © Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  28. 28. © Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  29. 29. Vielen Dank für Ihre Aufmerksamkeit© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  30. 30. Anhang© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  31. 31. Vorverarbeitung – Entzerrung Vorteil: Vorlagen von schlechter Qualität können automatisch verarbeitetVerzerrung durch Buchbindung werden.© Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
  32. 32. Artikelsegmentierung Kombination von drei Verfahren: Regelbasiert, Reading-Order und Probabilistischinitial graph MST initial articles merged articles © Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS

×