Vortrag von Florian Alpers über die Unterschiede der verschiedenen Bildformate, deren Stärken und Schwächen sowie deren Tauglichkeit für den Einsatz in Digitalisierungsprojekten
3. 07.10.2015JanVonde,intrandaGmbH
3
Fagestellungen
● Welche Bildformate werden im
Digitalisierungsworkflow erzeugt, und zu welchem
Zweck?
● Gibt es sinnvolle Alternativen?
● Was ist Jpeg2000 und welche Rolle kann es in der
Digitalisierung spielen?
● Wie biete ich effektiv Bildinhalte in einer
Präsentationsoberfläche an?
4. 07.10.2015JanVonde,intrandaGmbH
4
Übersicht
● Übersicht über die wichtigsten Bildformate
– TIFF
– PNG
– JPEG
– JPEG2000
● Das Bild im Digitalisierungsworkflow
– Archvierung
– Texterkennung
– Präsentation
● Bildformate im Vergleich
– Datenkompression
– Zugriffsgeschwindigkeit
6. 07.10.2015JanVonde,intrandaGmbH
6
TIFF (Tagged ImageFileFormat) -
Baseline
● Verbreitetes, bewährtes Format
● Spezifikation unter Adobe-Copyright, aber viele
quelloffene Implementierungen
● Schneller Zugriff
● Der TIFF-Standard ist komplex (erlaubt z.B.
verschiedene Kompressionsmethoden)
● Keine oder nur minimale Kompression in der
Baseline-Spezifikation
● Nicht für die Anzeige in Web-Browsern geeignet
● Unterstützt viele Farbräume und Farbprofile
8. 07.10.2015JanVonde,intrandaGmbH
8
TIFF (Tagged ImageFileFormat) JPEG-
Kompression
● Bilddaten sind mit der Jpeg-Kompression (DCT)
komprimiert
● Gute, aber verlustbehaftete Kompression
● Kein Jpeg!
– Teilt nicht die Einschränkungen des Jpeg-
Formates, z.B Alpha-Kanal erlaubt
– Etwas größer als ein vergleichbares Jpeg
– Andere Ladezeiten als ein Jpeg
– Tiff Metadaten-Format
9. 07.10.2015JanVonde,intrandaGmbH
9
PNG (PortableNetworksGraphics)
● Offenes, einfaches Format
● Verlustfreie Kompression
● Geringe Kompressionsrate bei typischen Scans
– Gute Kompression bei bitonalen Bildern
● Kann direkt im Browser angezeigt werden
● Sehr langsamer Zugriff
● Eigenes Metadatenformat (nicht Exif oder IPTC)
● Unterstützt nicht alle Farbräume (kein CMYK)
10. 07.10.2015JanVonde,intrandaGmbH
10
JPEG/JFIF (JPEG File Interchange
Format)
● Sehr verbreitetes, inzwischen patentfreies Format
● Der JPEG-Standard definiert verschiedene
Kompressionsmethoden, auch verlustfreie.
Unterstützt wird jedoch in der Regel die
verlustbehaftete DCT-Kompression
● Gute Kompressionsrate für typische Fotos oder
Scans
● Kann direkt im Browser angezeigt werden
● Schneller Zugriff
● Unterstützt keinen Alpha-Kanal (Transparenz)
● Begrenzte Farbtiefe
11. 07.10.2015JanVonde,intrandaGmbH
11
JPEG2000 – Part 1 (JP2)
● JPEG2000 ist ein Coding-Standard, der
verschiedene Bild- und Viedoformate
unterstützt.
– JP2: Basis-Bildformat: Sollte keine
gebührenpflichtigen Patente beinhalten
– JPX: Erweitertes Bildformat
– MJ2: Videoformat
– JP3D: 3D-Bildformat
– JPM: Format für Bildgruppen
12. 07.10.2015JanVonde,intrandaGmbH
12
JPEG2000 – Part 1(JP2)
Vorteile
● Hohe Kompressionsrate bei geringen
optischen Verlusten
● Möglichkeit für verlustfreie
Kompression
● Mehrere Qualitäts- und
Auflösungsebenen für schnellen
Zugriff
● Bessere Fehlerbeständigkeit als
JPEG oder TIFF
● Große Farbtiefe
● Keine Größenbeschränkung
● Erweiterte Kodierungsoptionen, z.B.
– Höherauflösende Regionen
– Verschiedene Kompressionsmodi
für optimierten Zugriff oder bessere
Bildqualität
Nachteile
● Künftige Patentansprüche
können nicht ausgeschlossen
werden
● Aufwändige Komprimierung und
Dekomprimierung
● Geringe Softwareunterstützung
● Feine Unterschiede in der
Implementierung des Standards
● Limitierte Unterstützung für
Farbprofile
19. 07.10.2015JanVonde,intrandaGmbH
19
OCR: Wasbrauchen wir?
● Geringes Datenvolumen
– Daten werden mehrfach über Internetverbindungen
verschickt und auf externen Servern
zwischengespeichert
– Komprimierte Bilder
● Korrekte Angabe der Bildauflösung (dpi)
– Zu geringe Auflösung führt zu mehrfach berechneten
OCR-Seiten
– Zu große Auflösung kann zu schlechter
Schrifterkennung führen
20. 07.10.2015JanVonde,intrandaGmbH
20
Presentation: Wasbrauchen wir?
● Hinreichend gute Qualität für die Browserdarstellung
– Bilder dürfen komprimiert sein. Die benötigte Qualität richtet
sich nach der Darstellung im Browser
– Browser unterstützen nur bestimmte Bildformate: Bitmap, Png,
Jpeg, Gif
● Schnelle Auslieferung der Daten
– Schnell lesbares Dateiformat – keine Aufwändige
Dekomprimierung
– Geringes Datenvolumen
– Caching
● Geringer Speicherverbrauch
– Komprimierung
– Geringere Auflösung
31. 07.10.2015JanVonde,intrandaGmbH
31
Subsampling
Zum schnelleren Lesen einer Datei werden in regelmäßigen
Abständen Pixel übersprungen
→ erhebliche Zeitersparnis beim Einlesen und Skalieren
→ Erzeugt deutliche Artefakte
Quelle: Die digitale Landesbibliothek Oberösterreich, http://digi.landesbibliothek.at/viewer/
33. 07.10.2015JanVonde,intrandaGmbH
33
Archivierung: Perspektiven für Jpeg2000
und möglicheAlternativen
● TIFF bleibt das verlässlichste Archivierungsformat, wenn
Speicherbeschränkung keine wesentliche Rolle spielt
● Jpeg2000 bietet effektive Möglichkeiten
– Zur Datenkompression
– Zum Datenzugriff
● Jpeg2000 hat wesentliche Einschränkungen
– Mangel an verlässlichen offenen Implementierungen
– Komplexität des Standards und der Implementierung
● Ist verlustbehaftete Kompression eine Alternative bei teurem
Speicherplatz in der Langzeitarchivierung?
● PNG bietet ein offenes und verbreitetes Format mit verlustfreier
Kompression. Ist dies eine Alternative zum unkomprimierten
TIFF?
34. 07.10.2015JanVonde,intrandaGmbH
34
Präsentation: DieInhaltebestimmen das
geeigneteFormat
● TIFF/JPEG bietet insgesamt den besten Zugriff auf Inhalte
● JPEG oder PNG können als schnelle Darstellungsformate für
bestimmte Inhalte dienen
– Bitonale Bilder: PNG
– Thumbnails: JPEG
● Techniken wie Kachelung und Subsampling können die Zugriff
auf Inhalte beschleunigen
● Jpeg2000 bietet großes Potential für
– Datenkompression
– Zugriffsgeschwindigkeit
– Bildqualität
● Aktuelle offene Implementierungen können dieses Potential noch
nicht effektiv nutzen
37. 07.10.2015JanVonde,intrandaGmbH
37
Quellen
1) Adobe: Developer/TIFF
http://partners.adobe.com/public/developer/tiff/index.html
2) Aware Systems: TIFF, Tag Image File Format, FAQ
http://www.awaresystems.be/imaging/tiff/faq.html
3) Aleks Jakulin: Baseline JPEG and JPEG2000 Artifacts Illustrated
http://www.stat.columbia.edu/~jakulin/jpeg/artifacts.htm
4) Johan van der Knijff: Ensuring the suitability of JPEG 2000 for preservation, 2010
http://blog.wellcomelibrary.org/2010/12/guest-post-ensuring-the-suitability-of-jpeg-2000-for-preservation/
5) Johan van der Knijff: ICC profiles and resolution in JP2: update on 2011 D-Lib paper, 2013
http://openpreservation.org/blog/2013/07/01/icc-profiles-and-resolution-jp2-update-2011-d-lib-paper/
6) Joint Photographic Experts Group: Overview of JPEG 2000
https://jpeg.org/jpeg2000/index.html
7) Paolo Buonora/Franco Liberati: A Format for Digital Preservation of Images - A Study on JPEG 2000
File Robustness
http://www.dlib.org/dlib/july08/buonora/07buonora.html
8) Joint Photographic Experts Group: Overview of JPEG
http://jpeg.org/jpeg/
9) Eric Hamilton: JPEG File Interchange Format, 1992
http://www.w3.org/Graphics/JPEG/jfif3.pdf
10)Wikipedia: Portable Network Graphics
http://en.wikipedia.org/wiki/Portable_Network_Graphics