Universität zu Köln. Historisch-Kulturwissenschaftliche InformationsverarbeitungJan G. Wieners // jan.wieners@uni-koeln.de...
Video Container Matroska MP4 Codecs DivX Xvid H.264 Verfahren der Videokompression Intra-coding Vektorquantisier...
VideoContainer und Codecs
Bildnachweis: „Kill Bill“ (2003)
Bildnachweis: „Kill Bill“ (2003)Bitraten (37 sec.):◦ 1 Mbps (~5 MB)◦ 500 Kbps (~3 MB)◦ 100 Kbps (~1,6 MB)Konstante Bitrate...
 ~25 Bilder pro Sekunde  25 fps (frames per second) Auflösung Farbtiefe (Quantisierung) z.B. 24 Bit pro Pixel Rechene...
DVD & Co.Quelle: http://www.bluray-disc.de/faq/was-ist-der-unterschied-zwischen-blu-ray-und-der-dvd
ContainerCodecs  Von den Begriffen Compressor und Decompressor• Codecs: Mathematische Algorithmen, mit deren Hilfe Video-...
MKV: Matroska Media Containerhttp://matroska.org/technical/whatis/index.html
Matroska Media ContainerMatroska• Unterstützt Videocodecs:• MPEG-1, MPEG-2, MPEG-4• H.264• RealVideo, WMV, Theora, Dirac• ...
Container: mp4Mp4 Von der Moving Picture Expert Group (MPEG) (gegründet 1988) beschränkt auffolgende Formate: Video: MPE...
MPEG: Standards
Codec: DivXDivX <= DivX ;-) 3.11 (1999): Veränderter MS MPEG 4 Codec: u.a.: Erhöhung der maximalen Bitrate MS MPEG 4: 2...
Coded: XvidXvid Freie MPEG-4 Implementierung (GNU GeneralPublic License), basierend auf OpenDivXQuelltext Techniken: B-...
Codec: H.264H.264• 2003 als Standard verabschiedet: MPEG-4 Part 10oder auch AVC (Advanced Video Coding) Zehnter Teil des ...
H.264Variable block-size motion compensation (VBSMC) with block sizes as large as 16×16 aas small as 4×4, enabling precise...
Videokompression: Möglichkeiten in der Beseitigung von RedundanzenVideokompression???
Wie ließe sich diese Videosequenz komprimieren?http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg
Videokompression: Möglichkeiten in der Beseitigung von RedundanzenVideokompressionBild- bzw. Framedimensionen (Höhe und Br...
Welche der beiden Videosequenzen lässt sich besser /stärker komprimieren? Warum?http://skateboarding.ru/gallery/data/media...
Unterscheidung: Intra-coding (auch: spatial coding): Redundanz auseinem Frame entfernen (räumliche Redundanz),Kompression...
Idee und Verfahrensweise: Aufteilung des Frames in Blöcke (4x4, 8x8, etc.) Suche nach ähnlichen Blöcken Ähnliche Blöcke...
Idee und Verfahrensweise: Trennung in Textur und Kontur Konturen beschreiben (z.B.) durch Bézier-Kurven Texturen kodier...
Inter-coding
Bildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdft = 1 t = 2 t = 3…Kompression…?
t = 1Frame vollständig gespeichert I-Framet = 2Aus dem vorhergehendenFrame berechnetes Frame P-Frame…Kompression!t = 3Au...
Speichern der Differenzen zwischen Start- undFolgeframe, z.B. pixelweiseDifferenzcodierungBildnachweis: Malaka, Butz, Hußm...
Intra- vs. Predicted- vs. Bidirectional Frames: Das Intra-Frame (I-Frame, auch: Key Frame / Schlüsselbild)wird nur unter ...
Verfahrensweise Startframe und spätere I-Frames intracodiertübertragen Unterschiede zum Folgeframe bestimmen, als Bildin...
Verfahrensweise: Objektbewegungen zwischen Frames identifizieren Speicherung der Veränderungen als Bewegungsvektoren(mot...
Blockbasierte Bewegungskompensation Verwendung u.a. im MPEG-2 StandardGrob: Jedes Frame des Videomaterials wird in n*m g...
Video Container Matroska MP4 Codecs DivX Xvid H.264 Verfahren der Videokompression Intra-coding Vektorquantisier...
Audiokompression
Hörbeispiel
Akustische Signale = zumeist periodische SignaleAudio: Basics AmplitudeMaximalwert eines Signalsinnerhalb einer Phase Sc...
Von analog nach digital:Sampling  Digitalisierung vonAudiodatenGrundfragen Sampling:1. Wahl der geeignetenAbtastrate (Sam...
Je häufiger die Schallwelle auf ihren Druckabgetastet wird, desto besser wird der originaleTon digital repräsentiert.Zu we...
Wahl der Abtastrate auf Basis des Nyquist-Shannon-Abtasttheorems. „Wenn ein kontinuierliches Signal miteiner oberen Grenzf...
Bekanntestes (und einfachstes) Abtastverfahren:PCM (Pulse Code Modulation)  Für jedenAbtastzeitpunkt: Messung eines Signa...
Quantisierung: Abtasttiefe
Wie groß ist der Speicherplatzbedarf (unkomprimiert) einerklassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit60-minüt...
Wie groß ist der Speicherplatzbedarf (unkomprimiert) einerklassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit60-minüt...
HörschwellenmaskierungSignale werden aus Frequenzspektrum entfernt,die jenseits der (menschlichen) HörschwelleliegenFrequ...
Temporale Maskierung Auch zeitliche Abstände zwischen Tönen habeneinen Einfluss auf die Hörbarkeit: Geht einem starken T...
/
Aufgabe 1 (1 Punkt)Welche Arten von Redundanz werden bei der Videokompression beseitigt? ErläuternSie in diesem Kontext di...
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren
Nächste SlideShare
Wird geladen in …5
×

SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren

936 Aufrufe

Veröffentlicht am

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
936
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
266
Aktionen
Geteilt
0
Downloads
1
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

SoSe 2013 | Basisinformationstechnologie II - 07_Video / Audio: Kompressionsverfahren

  1. 1. Universität zu Köln. Historisch-Kulturwissenschaftliche InformationsverarbeitungJan G. Wieners // jan.wieners@uni-koeln.deBasisinformationstechnologie IISommersemester 201319. Juni 2013 – Audio / Video: Kompressionsverfahren
  2. 2. Video Container Matroska MP4 Codecs DivX Xvid H.264 Verfahren der Videokompression Intra-coding Vektorquantisierung Konturbasierte Codierung Inter-coding Differenzcodierung BewegungskompensationAudio Sampling KompressionThemenüberblick
  3. 3. VideoContainer und Codecs
  4. 4. Bildnachweis: „Kill Bill“ (2003)
  5. 5. Bildnachweis: „Kill Bill“ (2003)Bitraten (37 sec.):◦ 1 Mbps (~5 MB)◦ 500 Kbps (~3 MB)◦ 100 Kbps (~1,6 MB)Konstante Bitrate (CBR)vs.Variable Bitrate (VBR)
  6. 6.  ~25 Bilder pro Sekunde  25 fps (frames per second) Auflösung Farbtiefe (Quantisierung) z.B. 24 Bit pro Pixel Rechenexempel unkomprimiertes Video: 720 * 576 * 24 = 9.953.280 Bit pro Frame = ~1,2 MB / Frame(9.953.280 / 8 / 1024) 1,2 MB * 25 Frames = 30 MB/ sec. 30 MB * 60 sec. = 1.800 MB / min. 1,8 GB * 60 min. = 108 GB / std.Speicherplatzbedarf von Videomaterial
  7. 7. DVD & Co.Quelle: http://www.bluray-disc.de/faq/was-ist-der-unterschied-zwischen-blu-ray-und-der-dvd
  8. 8. ContainerCodecs  Von den Begriffen Compressor und Decompressor• Codecs: Mathematische Algorithmen, mit deren Hilfe Video- und Audiodaten reduziert werden.• Hardware-Codecs: Hardwarebausteine, die die Kompression in Echtzeit durchführen.• Software-Codecs
  9. 9. MKV: Matroska Media Containerhttp://matroska.org/technical/whatis/index.html
  10. 10. Matroska Media ContainerMatroska• Unterstützt Videocodecs:• MPEG-1, MPEG-2, MPEG-4• H.264• RealVideo, WMV, Theora, Dirac• …• Unterstützt Audiocodecs:• MP3• AAC, AC3, DTS, WAV, Vorbis, FLAC
  11. 11. Container: mp4Mp4 Von der Moving Picture Expert Group (MPEG) (gegründet 1988) beschränkt auffolgende Formate: Video: MPEG-4 (Part 2, Part 10 (AVC/H.264)), MPEG-2 und MPEG-1 Audio: AAC, MP3, MP2, MP1, AC-3 Bilder: JPEG, PNG Grafik und Text: BIFS (z. B. können Untertitel in dieses Formatumgewandelt werden) Dateiendungen: .m4v, .mp4v: Video (MPEG-4-Videoströme) .m4a: nur für Audio .m4b: (Audiobook): Hörbücher, in die Lesezeichen gesetzt werden können .m4p: (Protected): DRM-geschützte AAC-Audiodateien .m4r: (Ringtone): Klingeltöne für iPhone
  12. 12. MPEG: Standards
  13. 13. Codec: DivXDivX <= DivX ;-) 3.11 (1999): Veränderter MS MPEG 4 Codec: u.a.: Erhöhung der maximalen Bitrate MS MPEG 4: 256 kbps DivX: bis 6 mbps Erzeugt kein ISO-konformes MPEG 4 Video > DivX ;-) 3.11: Neuentwicklung, patentierter Codec Unterstützt u.a.: Multipass Encoding (variable Bitrate) Komplexe Szenen erhalten eine höhere Bitrate zugewiesen, langsame Szenen eineniedrigere Bitrate 2000: Gründung der Firma DivXNetworks  Open Source Projekt OpenDivX, basierend auf der MPEG-4 Referenzimplementierung des EU-Projektes „MoMuSys“ (Mobile Multimedia Systems) Nach Veröffentlichung von DivX 4.0 (August 2001): Fokus auf kommerzielle Interessen, dieEntwicklungsarbeiten an OpenDivX werden eingestellt Kodiereffizienz schlechter als bei DivX ;-) DivX 5: Erstes kommerzielles Produkt …DivX 9.1.2 (2013-05)Linktipp: http://www.heise.de/ct/artikel/DivX-im-Griff-288448.html
  14. 14. Coded: XvidXvid Freie MPEG-4 Implementierung (GNU GeneralPublic License), basierend auf OpenDivXQuelltext Techniken: B-Frames Quarter Pixel Compensation …
  15. 15. Codec: H.264H.264• 2003 als Standard verabschiedet: MPEG-4 Part 10oder auch AVC (Advanced Video Coding) Zehnter Teil des MPEG-4 Standards (MPEG-4/Part 10, ISO/IEC 14496-10)• Datei-/Containerformat: mp4• Verwendung:• HDTV / Blu-Ray• Freier, quelloffener Encoder: x264(http://www.videolan.org/developers/x264.html)
  16. 16. H.264Variable block-size motion compensation (VBSMC) with block sizes as large as 16×16 aas small as 4×4, enabling precise segmentation of moving regions.
  17. 17. Videokompression: Möglichkeiten in der Beseitigung von RedundanzenVideokompression???
  18. 18. Wie ließe sich diese Videosequenz komprimieren?http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg
  19. 19. Videokompression: Möglichkeiten in der Beseitigung von RedundanzenVideokompressionBild- bzw. Framedimensionen (Höhe und Breite)- Eigenschaften der Pixel (Helligkeit, Farbe)- Eigenschaften des jeweils betrachteten FramesZeitliche Dimension
  20. 20. Welche der beiden Videosequenzen lässt sich besser /stärker komprimieren? Warum?http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg / http://mamboaustralia.com/isfucked/wp-content/uploads/2011/05/CHEADLE_CULBURRA_SEQUENCE1.jpg
  21. 21. Unterscheidung: Intra-coding (auch: spatial coding): Redundanz auseinem Frame entfernen (räumliche Redundanz),Kompression teilweise analog zu JPEG Vektorquantisierung Konturbasierte Codierungvs. Inter-coding (auch: temporal coding): Redundanzzwischen Frames entfernen (temporale Redundanz) Differenzkodierung (frame differencing) BewegungskompensationVideokompression
  22. 22. Idee und Verfahrensweise: Aufteilung des Frames in Blöcke (4x4, 8x8, etc.) Suche nach ähnlichen Blöcken Ähnliche Blöcke im Bild ersetzen durch „Durchschnittsblock“ Zwei Schritte: Training: Erstellung der Tabelle (Codebuch) mit häufig vorkommenden Blöcken Häufig verwendet: Linde–Buzo–Gray Algorithmus Berücksichtigung der Ähnlichkeit der notierten Blöcke Dekoder muss über das gleiche Codebuch verfügenVorteile: Schnelle Decodierung Gute Kompression bei vielen ähnlichen BlöckenNachteile: Codierung aufwändig, da ähnliche Blöcke gesucht werden müssenPraxis: Verwendung in Codecs: Indeo, CinepakIntra-Coding: Vektorquantisierung
  23. 23. Idee und Verfahrensweise: Trennung in Textur und Kontur Konturen beschreiben (z.B.) durch Bézier-Kurven Texturen kodieren (z.B. mit DCT)Praxis: Verwendung ansatzweise in MPEG-4Knackpunkt: ObjekterkennungIntra-Coding: Konturbasierte Codierung
  24. 24. Inter-coding
  25. 25. Bildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdft = 1 t = 2 t = 3…Kompression…?
  26. 26. t = 1Frame vollständig gespeichert I-Framet = 2Aus dem vorhergehendenFrame berechnetes Frame P-Frame…Kompression!t = 3Aus dem vorhergehendenFrame berechnetes Frame P-FrameBildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdf
  27. 27. Speichern der Differenzen zwischen Start- undFolgeframe, z.B. pixelweiseDifferenzcodierungBildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
  28. 28. Intra- vs. Predicted- vs. Bidirectional Frames: Das Intra-Frame (I-Frame, auch: Key Frame / Schlüsselbild)wird nur unter Berücksichtigung der eigenen Bildinformationkodiert Predicted Frames (P-Frames) werden aus denvorhergehenden I-Frames berechnet. Bidirectional Frames beziehen sich sowohl auf die vorhergehenden I- und P-Framesals auch auf die folgenden I- und P-Frames.Praxis MPEG-1 / -2: Ein I-Frame pro ½ Sek. MPEG-4: Ein I-Frame ~ alle 10 Sek.Unterscheidung I: Frame-Typen (in MPEG)
  29. 29. Verfahrensweise Startframe und spätere I-Frames intracodiertübertragen Unterschiede zum Folgeframe bestimmen, als Bildinterpretieren und dieses Bild komprimierenDifferenzcodierungBildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
  30. 30. Verfahrensweise: Objektbewegungen zwischen Frames identifizieren Speicherung der Veränderungen als Bewegungsvektoren(motion vector) Zu übertragen: Differenzbild BewegungsvektorenBewegungskompensation (Motion Compensation)Bildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 182.
  31. 31. Blockbasierte Bewegungskompensation Verwendung u.a. im MPEG-2 StandardGrob: Jedes Frame des Videomaterials wird in n*m großePixelblöcke unterteilt Um die Bewegungskompensation zu leisten, werdendie Pixelblöcke von Frame zu Frame miteinanderverglichen Ähneln sich die Pixelblöcke (z.B. Kreuzkorrelation), sowird nur der Verschiebungsvektor gespeichert, umden sich der Block verschiebtBewegungskompensation
  32. 32. Video Container Matroska MP4 Codecs DivX Xvid H.264 Verfahren der Videokompression Intra-coding Vektorquantisierung Konturbasierte Codierung Interframe-coding Differenzcodierung BewegungskompensationThemenüberblick
  33. 33. Audiokompression
  34. 34. Hörbeispiel
  35. 35. Akustische Signale = zumeist periodische SignaleAudio: Basics AmplitudeMaximalwert eines Signalsinnerhalb einer Phase SchwingungsdauerZeit, bis eine Schwingungwieder ihrenAusgangszustand erreicht WellenlängeFrequenz, ausgedrückt inHertz (Hz, 1Hz = 1Schwingung pro Sekunde)AmplitudeSchwingungsdauer
  36. 36. Von analog nach digital:Sampling  Digitalisierung vonAudiodatenGrundfragen Sampling:1. Wahl der geeignetenAbtastrate (Sampling Rate)2. Wahl der geeignetenAuflösungEine Problemstellung: Sampling
  37. 37. Je häufiger die Schallwelle auf ihren Druckabgetastet wird, desto besser wird der originaleTon digital repräsentiert.Zu wenige Abtastpunkte führen zu geradenLinien, zu langen Wellen oder zu gezacktenKurven.Abtastrate (Sampling Rate)
  38. 38. Wahl der Abtastrate auf Basis des Nyquist-Shannon-Abtasttheorems. „Wenn ein kontinuierliches Signal miteiner oberen Grenzfrequenz von fmax mit einerAbtastrate von mehr als 2*fmax abgetastet wird, kannman das Ursprungssignal ohne Informationsverlust ausdem abgetasteten Signal rekonstruieren.“(Malaka, Butz, Hußmann: Medieninformatik. München: Pearson, 2009, S. 63.)Das Abtasttheorem und die Praxis: Da menschlicheOhren Schallwellen von maximal 22.000 Hz (= 22 kHz)wahrnehmen können, liegt die erforderliche Nyquist-Rate bei 44.000 Hz. Qualitativ hochwertige Audio-Digitalisate haben darum eineAbtastrate von 44.100 Hz.Shannon-Nyquist
  39. 39. Bekanntestes (und einfachstes) Abtastverfahren:PCM (Pulse Code Modulation)  Für jedenAbtastzeitpunkt: Messung eines SignalwertesBekannte Audio-Formate, die PCM verwenden:WAV, AIFFPulse Code Modulation
  40. 40. Quantisierung: Abtasttiefe
  41. 41. Wie groß ist der Speicherplatzbedarf (unkomprimiert) einerklassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit60-minütiger Laufzeit?Speicherplatzbedarf
  42. 42. Wie groß ist der Speicherplatzbedarf (unkomprimiert) einerklassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit60-minütiger Laufzeit?Lösung Das Audiosignal wird standardmäßig mit 44,1 KHz abgetastet. Die Abtasttiefe liegt bei 16 Bit. Daraus folgt:44,1kHz * 2 * 16bit * 60 min * 60 s = 635 MegabyteSpeicherplatzbedarf
  43. 43. HörschwellenmaskierungSignale werden aus Frequenzspektrum entfernt,die jenseits der (menschlichen) HörschwelleliegenFrequenzmaskierung Entfernung von Signalen, die von Signalen miteiner anderen Frequenz übertönt werdenKompression: Psychoakkustische AspekteBildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:24h_wecker.jpg&filetimestamp=20090809180759
  44. 44. Temporale Maskierung Auch zeitliche Abstände zwischen Tönen habeneinen Einfluss auf die Hörbarkeit: Geht einem starken Ton A ein schwächerer Ton B inähnlicher oder gleicher Frequenz voraus oder folgt ihm,so gibt es zeitliche Abstände von bestimmter Dauer, indenen Ton B nicht zu hören ist.Kompression: Psychoakkustische AspekteBildnachweis: http://www.itwissen.info/definition/lexikon/Maskierung-masking.html
  45. 45. /
  46. 46. Aufgabe 1 (1 Punkt)Welche Arten von Redundanz werden bei der Videokompression beseitigt? ErläuternSie in diesem Kontext die Begriffe Intra- und Inter-Coding und beschreiben Sie diegrundlegende Funktionsweise des Verfahrens „Motion Compensation“.Aufgabe 2 (1 Punkt)Beschreiben Sie die Vorgehensweise bei der Digitalisierung von Audiosignalen.Beschreiben Sie in diesem Zusammenhang die folgenden Begriffe: Abtastrate (Sampling Rate) PCM Abtasttiefe (Quantisierung)Aufgabe 3 (1 Punkt)Welche Phänomene menschlicher Wahrnehmung (Stichwort: „Maskierung“) machtman sich bei der Audiodaten-kompression zunutze?Aufgabe 4 (1 Punkt)Informieren Sie sich im WWW über das mp3-Format. In welchem Zusammenhangsteht mp3 mit der Moving Picture Experts Group?Hausaufgaben

×