Verlustbehaftete Komprimierung

1.505 Aufrufe

Veröffentlicht am

Veröffentlicht in: Technologie, Kunst & Fotos
0 Kommentare
1 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.505
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
7
Aktionen
Geteilt
0
Downloads
10
Kommentare
0
Gefällt mir
1
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Verlustbehaftete Komprimierung

  1. 1. Komprimierung Digitaler Grössenwahn 1. Juli 2001 „Der Digitale Alltag - Praxiswissen Informatik“ Jens Oberender IEEE Student Branch jens.oberender@computer.org Universität Passau http://www.joooo.de
  2. 2. Digitale Datenreduktion • verlustfrei – ungleichmässige Häufigkeitsverteilung – Redundante Muster – Exakte Wiederherstellung • verlustbehaftet – Entfernen von unsichtbaren Details – Ähnliche Reproduktion 2
  3. 3. Übertragung von Nachrichten • im Jahr 1837 • Buchstaben kodierte über elektrische Leitungen • Bedeutung der Signal-Pausen – kurz: Punkt – lang: Strich ... --- ... Samuel F. B. Morse (1791–1872) 3
  4. 4. Morse-Alphabet • häufige Buchstaben erhalten kurzen Code • unterschiedliche Länge Morse-Code A .- B -... C -.-. D -.. E . F ..-. G --. H .... I .. J .--- K -.- 4
  5. 5. Telefonnummern-Erkennung • Ziffern werden nacheinander gewählt 1 • unterschiedliche Länge • Wann ist die Ziffernfolge 1 zu einem Anschluss komplett? 028 • greedy match ⇒ Länge durch 38 110 die Ziffernfolge 30 112 bestimmt 11833 11880 5
  6. 6. Länge der Kodierungen • Flexibel – Kodierungslänge implizit festgelegt – wird beim Einlesen erkannt ermöglicht kürzere Darstellung • Konstant – 8 Bit 6
  7. 7. Huffmann-Kodierung • 1. Schritt Nachricht wird analysiert IEEEPASSAU Häufigkeitswerte werden berechnet 7
  8. 8. Huffmann-Kodierung (II) • 2. Schritt Graph wird erstellt unter Verwendung der Häufigkeitstabelle häufige Zeichen stehen nahe an der Wurzel 8
  9. 9. Huffmann-Kodierung (III) • 3. Schritt Nachricht wird kodiert 9
  10. 10. Huffmann-Komprimierung • Erfolgsrezept – bei wenigen Symbole ⇒ Tiefe des Baumes – ungleichmässige Häufigkeitsverteilung • einfach zu implementieren • vorherige Analyse der Daten notwendig • nur Muster der Länge 1 werden erkannt 10
  11. 11. Adaptive Komprimierung • Familie von Algorithmen auf Basis von Lempel und Ziv • Erlernen häufige Muster • Algorithmus erinnert sich Ziv Lempel an bereits verarbeitete Daten 11
  12. 12. LZW Ausgabe Eingabe E E F I (2,2) EF (Abstand:3,Länge:2) 12
  13. 13. Lempel / Ziff / Welch • Schnelle Algorithmen durchsuchen die Historie • passt sich den Daten an • weitverbreitetes Verfahren • One-Pass Verfahren 13
  14. 14. Weiterverarbeitung Quelle digitalisieren Digitale “wahrnehmen” Form elektro- chemische Sinnesverarbeitung Aufnahme menschliche Sinne: Eindruck Sehen, Hören Interpretation: “Gedanke” 14
  15. 15. Grafiken • zweidimensionale Pixelmenge • jeder Pixel enthält eine Farbinformation • Restaurierung einer ähnlichen Abbildung ausreichend • lokale Redundanz 15
  16. 16. Vorhersage • Vorhersage von neuen Farbwerten aus bereits gelesenen Daten • Differenz wird abgespeichert Werte in der Nähe von Null: ⇒ Darstellung in wenigen Bits 16
  17. 17. Farbmodelle • Wahrnehmungs-geprägt • Drucktechnisch • Additiv RGB YMCK YUV Rot/ Yellow/ Luminanz/ Grün/ Magenta/ Diff-Rot/ Blau Cyan/ Diff-Blau Black 17
  18. 18. Das menschliche Auge • Sehr detailierte Helligkeits- wahrnehmung • Gröberes Farbempfinden 18
  19. 19. JPEG Komprimierung • Joint Picture Expert Group 19
  20. 20. Diskrete Cosinus Transformation • Folge bestimmt eine periodische Funktion • Darstellung in Frequenzbändern 20
  21. 21. Quantisierung • Nicht alle Frequenzbereich gleich wahrnehmbar: – Ungenauigkeiten hoher Frequenzen bleiben unbemerkt – Bitbreite flexibel 21
  22. 22. Zig-Zag-Coding • Belegte haupstächlich Werte in der rechten oberen Ecke ⇒ Null-Werte werden nicht unterbrochen 22
  23. 23. Artefakte an Segment-Grenzen • Bruch zwischen den 8x8 Blöcken • Lösung: Wavelets (verwendet in JPEG-2000) 23
  24. 24. Wavelets • Progressivität • Multiskalenanalyse Verringerung der Bild-Auflösung 24
  25. 25. Wavelets (II) Schrittweise Approximation 25
  26. 26. Audiokompression mit MP3 • Gezieltes Vernachlässigen von Details • psychoakustisches Modell – verdeckte Frequenzen – zeitliche Maskierung 26
  27. 27. Fraktale • Selbstähnlichkeit • Sirpinski-Dreieck • Aus wenig Information entstehen detailierte Daten • Iterierte Funktions Systeme (IFS) „Kopierer mit vielen Linsen“ 27
  28. 28. Inverses Problem • Finde ein IFS und eine Quelle, die wenig vom Zielbild abweichen • wenn gefunden: Kompressionsrate > 1:1000 • aber: sehr schwer zu finden 28
  29. 29. Umbau der Daten • Idee: vorheriges Umformen der Daten in eine gut komprimierbare Form • Burrows-Wheeler-Transformation (BWT) Paper, Mai 1994: DEC SBPASSAU 29
  30. 30. BWT • 1. Schritt: Für jede Position eine Zeile mit allen folgenden Daten 30
  31. 31. BWT • 2. Schritt: Sortieren durch Zeilen-Vertauschung nach lexikalischer Ordnung 31
  32. 32. BWT • 3. Schritt Wiederherstellung der ursprünglichen Reihenfolge: S0, S1, ..., S7 32
  33. 33. BWT • Reihenfolge nur aus den Spalten restaurierbar – First-Spalte – Last-Spalte ist Prefix von F 33
  34. 34. BWT • Für ein L-Feld: Suche nach dem ersten gleichen F-Feld 34
  35. 35. BWT • Transformationsvektor wird restauriert aus Startposition und der L-Spalte (F-Spalte wird durch Sortieren hergestellt) 35
  36. 36. BWT • Transformierten Daten enthalten mehr Redundanz • grössere Datenmenge ⇒ bessere Komprimierungsrate 36
  37. 37. Vorgestellte Verfahren • Huffmann-Kodierung • LZW • JPEG • Wavelets • MP3 • Fraktale Komprimierung • Burrows-Wheeler-Transformation 37

×