Komprimierung
Digitaler Grössenwahn


1. Juli 2001
„Der Digitale Alltag - Praxiswissen Informatik“               Jens Ober...
Digitale Datenreduktion

• verlustfrei
  – ungleichmässige Häufigkeitsverteilung
  – Redundante Muster
  – Exakte Wiederhe...
Übertragung von Nachrichten

• im Jahr 1837
• Buchstaben kodierte über
  elektrische Leitungen
• Bedeutung der Signal-Paus...
Morse-Alphabet

• häufige Buchstaben erhalten kurzen Code
• unterschiedliche Länge
                                      M...
Telefonnummern-Erkennung

• Ziffern werden nacheinander gewählt
                                      1
• unterschiedliche...
Länge der Kodierungen

• Flexibel
  – Kodierungslänge implizit festgelegt
  – wird beim Einlesen erkannt
    ermöglicht kü...
Huffmann-Kodierung

• 1. Schritt
  Nachricht wird analysiert
   IEEEPASSAU
  Häufigkeitswerte werden berechnet




       ...
Huffmann-Kodierung (II)

• 2. Schritt
  Graph wird erstellt
  unter Verwendung der Häufigkeitstabelle




 häufige Zeichen...
Huffmann-Kodierung (III)

• 3. Schritt
  Nachricht wird kodiert




                           9
Huffmann-Komprimierung

• Erfolgsrezept
  – bei wenigen Symbole ⇒ Tiefe des Baumes
  – ungleichmässige Häufigkeitsverteilu...
Adaptive Komprimierung

• Familie von Algorithmen auf
  Basis von Lempel und Ziv
• Erlernen häufige Muster
• Algorithmus e...
LZW



          Ausgabe        Eingabe

  E E F I (2,2)            EF
                    (Abstand:3,Länge:2)




       ...
Lempel / Ziff / Welch

• Schnelle Algorithmen
  durchsuchen die Historie
• passt sich den Daten an
• weitverbreitetes Verf...
Weiterverarbeitung

Quelle   digitalisieren

                 Digitale
                            “wahrnehmen”
          ...
Grafiken

• zweidimensionale Pixelmenge
• jeder Pixel enthält eine Farbinformation
• Restaurierung einer
  ähnlichen Abbil...
Vorhersage

• Vorhersage von neuen Farbwerten
  aus bereits gelesenen Daten




• Differenz wird abgespeichert
  Werte in ...
Farbmodelle

• Wahrnehmungs-geprägt
• Drucktechnisch
• Additiv

           RGB      YMCK        YUV
         Rot/      Yel...
Das menschliche Auge

• Sehr detailierte
  Helligkeits-
  wahrnehmung
• Gröberes
  Farbempfinden




                     ...
JPEG Komprimierung

• Joint Picture
  Expert Group




                     19
Diskrete Cosinus Transformation

• Folge bestimmt eine periodische Funktion
• Darstellung in
  Frequenzbändern




       ...
Quantisierung

• Nicht alle Frequenzbereich
  gleich wahrnehmbar:
  – Ungenauigkeiten hoher
    Frequenzen
    bleiben unb...
Zig-Zag-Coding

• Belegte
  haupstächlich
  Werte in der
  rechten oberen
  Ecke
⇒ Null-Werte
  werden nicht
  unterbroche...
Artefakte an Segment-Grenzen

• Bruch zwischen den 8x8 Blöcken
• Lösung: Wavelets
  (verwendet in JPEG-2000)




         ...
Wavelets

• Progressivität
• Multiskalenanalyse
  Verringerung der Bild-Auflösung




                                    ...
Wavelets (II)


                Schrittweise
                Approximation




                            25
Audiokompression mit MP3

• Gezieltes Vernachlässigen
  von Details
• psychoakustisches Modell
  – verdeckte Frequenzen
  ...
Fraktale

• Selbstähnlichkeit
• Sirpinski-Dreieck
• Aus wenig Information
  entstehen detailierte Daten
• Iterierte Funkti...
Inverses Problem

• Finde ein IFS und eine
  Quelle, die wenig vom
  Zielbild abweichen
• wenn gefunden:
  Kompressionsrat...
Umbau der Daten

• Idee: vorheriges Umformen der Daten
  in eine gut komprimierbare Form
• Burrows-Wheeler-Transformation ...
BWT

• 1. Schritt:
  Für jede Position
  eine Zeile mit allen folgenden Daten




                                        ...
BWT

• 2. Schritt:
  Sortieren durch Zeilen-Vertauschung
  nach lexikalischer Ordnung




                                ...
BWT

• 3. Schritt
  Wiederherstellung der ursprünglichen
  Reihenfolge: S0, S1, ..., S7




                              ...
BWT

• Reihenfolge nur aus den Spalten restaurierbar
  – First-Spalte
  – Last-Spalte ist Prefix von F




               ...
BWT

• Für ein L-Feld:
  Suche nach dem ersten gleichen F-Feld




                                          34
BWT

• Transformationsvektor wird restauriert aus
  Startposition und der L-Spalte
  (F-Spalte wird durch Sortieren herges...
BWT

• Transformierten Daten enthalten
  mehr Redundanz
• grössere Datenmenge
  ⇒ bessere
  Komprimierungsrate




       ...
Vorgestellte Verfahren

•   Huffmann-Kodierung
•   LZW
•   JPEG
•   Wavelets
•   MP3
•   Fraktale Komprimierung
•   Burrow...
Nächste SlideShare
Wird geladen in …5
×

Verlustbehaftete Komprimierung

1.501 Aufrufe

Veröffentlicht am

Veröffentlicht in: Technologie, Kunst & Fotos
0 Kommentare
1 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.501
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
6
Aktionen
Geteilt
0
Downloads
10
Kommentare
0
Gefällt mir
1
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Verlustbehaftete Komprimierung

  1. 1. Komprimierung Digitaler Grössenwahn 1. Juli 2001 „Der Digitale Alltag - Praxiswissen Informatik“ Jens Oberender IEEE Student Branch jens.oberender@computer.org Universität Passau http://www.joooo.de
  2. 2. Digitale Datenreduktion • verlustfrei – ungleichmässige Häufigkeitsverteilung – Redundante Muster – Exakte Wiederherstellung • verlustbehaftet – Entfernen von unsichtbaren Details – Ähnliche Reproduktion 2
  3. 3. Übertragung von Nachrichten • im Jahr 1837 • Buchstaben kodierte über elektrische Leitungen • Bedeutung der Signal-Pausen – kurz: Punkt – lang: Strich ... --- ... Samuel F. B. Morse (1791–1872) 3
  4. 4. Morse-Alphabet • häufige Buchstaben erhalten kurzen Code • unterschiedliche Länge Morse-Code A .- B -... C -.-. D -.. E . F ..-. G --. H .... I .. J .--- K -.- 4
  5. 5. Telefonnummern-Erkennung • Ziffern werden nacheinander gewählt 1 • unterschiedliche Länge • Wann ist die Ziffernfolge 1 zu einem Anschluss komplett? 028 • greedy match ⇒ Länge durch 38 110 die Ziffernfolge 30 112 bestimmt 11833 11880 5
  6. 6. Länge der Kodierungen • Flexibel – Kodierungslänge implizit festgelegt – wird beim Einlesen erkannt ermöglicht kürzere Darstellung • Konstant – 8 Bit 6
  7. 7. Huffmann-Kodierung • 1. Schritt Nachricht wird analysiert IEEEPASSAU Häufigkeitswerte werden berechnet 7
  8. 8. Huffmann-Kodierung (II) • 2. Schritt Graph wird erstellt unter Verwendung der Häufigkeitstabelle häufige Zeichen stehen nahe an der Wurzel 8
  9. 9. Huffmann-Kodierung (III) • 3. Schritt Nachricht wird kodiert 9
  10. 10. Huffmann-Komprimierung • Erfolgsrezept – bei wenigen Symbole ⇒ Tiefe des Baumes – ungleichmässige Häufigkeitsverteilung • einfach zu implementieren • vorherige Analyse der Daten notwendig • nur Muster der Länge 1 werden erkannt 10
  11. 11. Adaptive Komprimierung • Familie von Algorithmen auf Basis von Lempel und Ziv • Erlernen häufige Muster • Algorithmus erinnert sich Ziv Lempel an bereits verarbeitete Daten 11
  12. 12. LZW Ausgabe Eingabe E E F I (2,2) EF (Abstand:3,Länge:2) 12
  13. 13. Lempel / Ziff / Welch • Schnelle Algorithmen durchsuchen die Historie • passt sich den Daten an • weitverbreitetes Verfahren • One-Pass Verfahren 13
  14. 14. Weiterverarbeitung Quelle digitalisieren Digitale “wahrnehmen” Form elektro- chemische Sinnesverarbeitung Aufnahme menschliche Sinne: Eindruck Sehen, Hören Interpretation: “Gedanke” 14
  15. 15. Grafiken • zweidimensionale Pixelmenge • jeder Pixel enthält eine Farbinformation • Restaurierung einer ähnlichen Abbildung ausreichend • lokale Redundanz 15
  16. 16. Vorhersage • Vorhersage von neuen Farbwerten aus bereits gelesenen Daten • Differenz wird abgespeichert Werte in der Nähe von Null: ⇒ Darstellung in wenigen Bits 16
  17. 17. Farbmodelle • Wahrnehmungs-geprägt • Drucktechnisch • Additiv RGB YMCK YUV Rot/ Yellow/ Luminanz/ Grün/ Magenta/ Diff-Rot/ Blau Cyan/ Diff-Blau Black 17
  18. 18. Das menschliche Auge • Sehr detailierte Helligkeits- wahrnehmung • Gröberes Farbempfinden 18
  19. 19. JPEG Komprimierung • Joint Picture Expert Group 19
  20. 20. Diskrete Cosinus Transformation • Folge bestimmt eine periodische Funktion • Darstellung in Frequenzbändern 20
  21. 21. Quantisierung • Nicht alle Frequenzbereich gleich wahrnehmbar: – Ungenauigkeiten hoher Frequenzen bleiben unbemerkt – Bitbreite flexibel 21
  22. 22. Zig-Zag-Coding • Belegte haupstächlich Werte in der rechten oberen Ecke ⇒ Null-Werte werden nicht unterbrochen 22
  23. 23. Artefakte an Segment-Grenzen • Bruch zwischen den 8x8 Blöcken • Lösung: Wavelets (verwendet in JPEG-2000) 23
  24. 24. Wavelets • Progressivität • Multiskalenanalyse Verringerung der Bild-Auflösung 24
  25. 25. Wavelets (II) Schrittweise Approximation 25
  26. 26. Audiokompression mit MP3 • Gezieltes Vernachlässigen von Details • psychoakustisches Modell – verdeckte Frequenzen – zeitliche Maskierung 26
  27. 27. Fraktale • Selbstähnlichkeit • Sirpinski-Dreieck • Aus wenig Information entstehen detailierte Daten • Iterierte Funktions Systeme (IFS) „Kopierer mit vielen Linsen“ 27
  28. 28. Inverses Problem • Finde ein IFS und eine Quelle, die wenig vom Zielbild abweichen • wenn gefunden: Kompressionsrate > 1:1000 • aber: sehr schwer zu finden 28
  29. 29. Umbau der Daten • Idee: vorheriges Umformen der Daten in eine gut komprimierbare Form • Burrows-Wheeler-Transformation (BWT) Paper, Mai 1994: DEC SBPASSAU 29
  30. 30. BWT • 1. Schritt: Für jede Position eine Zeile mit allen folgenden Daten 30
  31. 31. BWT • 2. Schritt: Sortieren durch Zeilen-Vertauschung nach lexikalischer Ordnung 31
  32. 32. BWT • 3. Schritt Wiederherstellung der ursprünglichen Reihenfolge: S0, S1, ..., S7 32
  33. 33. BWT • Reihenfolge nur aus den Spalten restaurierbar – First-Spalte – Last-Spalte ist Prefix von F 33
  34. 34. BWT • Für ein L-Feld: Suche nach dem ersten gleichen F-Feld 34
  35. 35. BWT • Transformationsvektor wird restauriert aus Startposition und der L-Spalte (F-Spalte wird durch Sortieren hergestellt) 35
  36. 36. BWT • Transformierten Daten enthalten mehr Redundanz • grössere Datenmenge ⇒ bessere Komprimierungsrate 36
  37. 37. Vorgestellte Verfahren • Huffmann-Kodierung • LZW • JPEG • Wavelets • MP3 • Fraktale Komprimierung • Burrows-Wheeler-Transformation 37

×