SlideShare ist ein Scribd-Unternehmen logo
1 von 58
Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Dr. Jan G. Wieners // jan.wieners@uni-koeln.de
Basisinformationstechnologie II
Sommersemester 2015
10. Juni 2015 – Video und Audio: Container, Codecs und Kompressionsverfahren
Video
 Container
 Matroska
 MP4
 Codecs
 DivX
 Xvid
 H.264
 Verfahren der Videokompression
 Intra-coding
 Vektorquantisierung
 Konturbasierte Codierung
 Inter-coding
 Differenzcodierung
 Bewegungskompensation
Audio
 Sampling
 Kompression
Themenüberblick
Video
Container und Codecs
Bildnachweis: „Kill Bill“ (2003)
Bitraten (37 sec.):
◦ 1 Mbps (~5 MB)
◦ 500 Kbps (~3 MB)
◦ 100 Kbps (~1,6 MB)
Konstante Bitrate (CBR)
vs.
Variable Bitrate (VBR)
 ~25 Bilder pro Sekunde  25 fps (frames per second)
 Auflösung
 Farbtiefe (Quantisierung) z.B. 24 Bit pro Pixel
 Rechenexempel unkomprimiertes Video:
 720 * 576 * 24 = 9.953.280 Bit pro Frame = ~1,2 MB / Frame
(9.953.280 / 8 / 1024)
 1,2 MB * 25 Frames = 30 MB/ sec.
 30 MB * 60 sec. = 1.800 MB / min.
 1,8 GB * 60 min. = 108 GB / std.
Speicherplatzbedarf von Videomaterial
Quelle: http://www.bluray-disc.de/faq/was-ist-der-unterschied-zwischen-blu-ray-und-der-dvd
Container
Codecs  Von den Begriffen Compressor und Decompressor
• Codecs: Mathematische Algorithmen, mit deren Hilfe Video- und Audiodaten reduziert werden.
• Hardware-Codecs: Hardwarebausteine, die die Kompression in Echtzeit durchführen.
• Software-Codecs
Quelle: http://de.wikipedia.org/wiki/Containerdatei#/media/File:Informatik-Containerformate-Beispiele.svg
http://matroska.org/technical/whatis/index.html
Matroska
• Unterstützt Videocodecs:
• MPEG-1, MPEG-2, MPEG-4
• H.264
• RealVideo, WMV, Theora, Dirac
• …
• Unterstützt Audiocodecs:
• MP3
• AAC, AC3, DTS, WAV, Vorbis, FLAC
Container: mp4
Mp4
 Von der Moving Picture Expert Group (MPEG) (gegründet 1988) beschränkt auf
folgende Formate:
 Video: MPEG-4 (Part 2, Part 10 (AVC/H.264)), MPEG-2 und MPEG-1
 Audio: AAC, MP3, MP2, MP1, AC-3
 Bilder: JPEG, PNG
 Grafik und Text: BIFS (z. B. können Untertitel in dieses Format
umgewandelt werden)
 Dateiendungen:
 .m4v, .mp4v: Video (MPEG-4-Videoströme)
 .m4a: nur für Audio
 .m4b: (Audiobook): Hörbücher, in die Lesezeichen gesetzt werden können
 .m4p: (Protected): DRM-geschützte AAC-Audiodateien
 .m4r: (Ringtone): Klingeltöne für iPhone
MPEG: Standards
Quelle: http://de.wikipedia.org/wiki/Containerdatei#/media/File:Informatik-Containerformate-Beispiele.svg
Codec!
Codec: DivX
DivX
 <= DivX ;-) 3.11 (1999): Veränderter MS MPEG 4 Codec:
 u.a.: Erhöhung der maximalen Bitrate
 MS MPEG 4: 256 kbps
 DivX: bis 6 mbps
 Erzeugt kein ISO-konformes MPEG 4 Video
 > DivX ;-) 3.11: Neuentwicklung, patentierter Codec
 Unterstützt u.a.:
 Multipass Encoding (variable Bitrate)
 Komplexe Szenen erhalten eine höhere Bitrate zugewiesen, langsame Szenen eine
niedrigere Bitrate
 2000: Gründung der Firma DivXNetworks
  Open Source Projekt OpenDivX, basierend auf der MPEG-4 Referenzimplementierung des EU-
Projektes „MoMuSys“ (Mobile Multimedia Systems)
 Nach Veröffentlichung von DivX 4.0 (August 2001): Fokus auf kommerzielle Interessen, die
Entwicklungsarbeiten an OpenDivX werden eingestellt
 Kodiereffizienz schlechter als bei DivX ;-)
 DivX 5: Erstes kommerzielles Produkt
 …DivX 9.1.2 (2013-05)
Linktipp: http://www.heise.de/ct/artikel/DivX-im-Griff-288448.html
Coded: Xvid
Xvid
 Freie MPEG-4 Implementierung (GNU General
Public License), basierend auf OpenDivX
Quelltext
 Techniken:
 B-Frames
 Quarter Pixel Compensation
 …
Codec: H.264
H.264 (H.264/MPEG-4 AVC)
• 2003 als Standard verabschiedet: MPEG-4 Part 10
oder auch AVC (Advanced Video Coding)
 Zehnter Teil des MPEG-4 Standards (MPEG-4/Part
10, ISO/IEC 14496-10)
• Datei-/Containerformat: mp4
• Verwendung:
• HDTV / Blu-Ray
• Freier, quelloffener Encoder: x264
(http://www.videolan.org/developers/x264.html)
H.264
Variable block-size motion compensation (VBSMC) with block sizes as large as 16×16 a
as small as 4×4, enabling precise segmentation of moving regions.
vs. H.265
Kompressionsverfahren
Wie ließe sich diese Videosequenz komprimieren?
http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg
Videokompression: Möglichkeiten in der Beseitigung von Redundanzen
Bild- bzw. Framedimensionen (Höhe und Breite)
- Eigenschaften der Pixel (Helligkeit, Farbe)
- Eigenschaften des jeweils betrachteten Frames
Zeitliche Dimension
http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg / http://mamboaustralia.com/isfucked/wp-content/uploads/2011/05/CHEADLE_CULBURRA_SEQUENCE1.jpg
Unterscheidung:
 Intra-coding (auch: spatial coding): Redundanz aus
einem Frame entfernen (räumliche Redundanz),
Kompression teilweise analog zu JPEG
 Vektorquantisierung
 Konturbasierte Codierung
vs.
 Inter-coding (auch: temporal coding): Redundanz
zwischen Frames entfernen (temporale Redundanz)
 Differenzkodierung (frame differencing)
 Bewegungskompensation
Videokompression
Idee und Verfahrensweise:
 Aufteilung des Frames in Blöcke (4x4, 8x8, etc.)
 Suche nach ähnlichen Blöcken
 Ähnliche Blöcke im Bild ersetzen durch „Durchschnittsblock“
 Zwei Schritte:
 Training: Erstellung der Tabelle (Codebuch) mit häufig vorkommenden Blöcken 
Häufig verwendet: Linde–Buzo–Gray Algorithmus
 Berücksichtigung der Ähnlichkeit der notierten Blöcke
Dekoder muss über das gleiche Codebuch verfügen
Vorteile:
 Schnelle Decodierung
 Gute Kompression bei vielen ähnlichen Blöcken
Nachteile:
 Codierung aufwändig, da ähnliche Blöcke gesucht werden müssen
Praxis: Verwendung in Codecs: Indeo, Cinepak
Intra-Coding: Vektorquantisierung
Idee und Verfahrensweise:
 Trennung in Textur und Kontur
 Konturen beschreiben (z.B.) durch Bézier-Kurven
 Texturen kodieren (z.B. mit DCT)
Praxis: Verwendung ansatzweise in MPEG-4
Knackpunkt: Objekterkennung
Intra-Coding: Konturbasierte Codierung
Inter-coding
Bildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdf
t = 1 t = 2 t = 3
…Kompression…?
t = 1
Frame vollständig gespeichert
 I-Frame
t = 2
Aus dem vorhergehenden
Frame berechnetes Frame
 P-Frame
…Kompression!
t = 3
Aus dem vorhergehenden
Frame berechnetes Frame
 P-Frame
Bildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdf
Speichern der Differenzen zwischen Start- und
Folgeframe, z.B. pixelweise
Differenzcodierung
Bildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
Intra- vs. Predicted- vs. Bidirectional Frames:
 Das Intra-Frame (I-Frame, auch: Key Frame / Schlüsselbild)
wird nur unter Berücksichtigung der eigenen Bildinformation
kodiert
 Predicted Frames (P-Frames) werden aus den
vorhergehenden I-Frames berechnet.
 Bidirectional Frames beziehen sich sowohl
 auf die vorhergehenden I- und P-Frames
als auch
 auf die folgenden I- und P-Frames.
Praxis
 MPEG-1 / -2: Ein I-Frame pro ½ Sek.
 MPEG-4: Ein I-Frame ~ alle 10 Sek.
Unterscheidung I: Frame-Typen (in MPEG)
Verfahrensweise
 Startframe und spätere I-Frames intracodiert
übertragen
 Unterschiede zum Folgeframe bestimmen, als Bild
interpretieren und dieses Bild komprimieren
Differenzcodierung
Bildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
Verfahrensweise:
 Objektbewegungen zwischen Frames identifizieren
 Speicherung der Veränderungen als Bewegungsvektoren
(motion vector)
 Zu übertragen:
 Differenzbild
 Bewegungsvektoren
Bewegungskompensation (Motion Compensation)
Bildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 182.
Audio
Longitudinalwelle
Ausbreitungsrichtung
Schwingungsrichtung
Bildnachweis: http://www.acs.psu.edu/drussell/Demos/waves/wavemotion.html
 Amplitude (vertikale Ausdehnung) → Lautstärke
 Frequenz (Wiederholungsrate) → Tonhöhe
 Angabe in Hertz: 1 Hz = 1 Wiederholung pro Sekunde
Schallwellen
Bildnachweis: http://commons.wikimedia.org/wiki/File:Sine_one_period.svg (modifiziert)
 Analoge Daten: kontinuierlich (fortlaufend)
 Digitale Daten: diskret (trennbar, abzählbar)
 Analog → Digital: Abtasten des analogen Signals
via A/D-Wandler
 Grundfragen Sampling:
1. Wahl der geeigneten Abtastrate (Sampling Rate)
2. Wahl der geeigneten Auflösung
Analoge vs. Digitale Daten
Kontinuierlich vs. Diskret
Bildnachweis: https://commons.wikimedia.org/wiki/File:Digital.signal.discret.svg
samplingresolution=8
(Abtasttiefe)
sampling rate = 1/t
(Abtastrate)
Kontinuierlich vs. Diskret
Bildnachweis: https://commons.wikimedia.org/wiki/File:Digital.signal.discret.svg
samplingresolution=8
sampling rate = 1/t
4 5 4 3 4 6 7 5 3 3 4 4 3
100 101 100 011 100 110 111 101 011 011 100 100 011
Kontinuierlich vs. Diskret
Bildnachweis: https://commons.wikimedia.org/wiki/File:Digital.signal.svg
samplingresolution=8
(Abtasttiefe)
sampling rate = 1/t
(Abtastrate)
Sampling Rate: Aliasing
 Problem: Beliebig viele Wellen lassen sich auf die
Abtastpunkte mappen
 Lösung: Welle mit niedrigster Frequenz wählen
Bildnachweis: http://commons.wikimedia.org/wiki/File:AliasingSines.svg
𝑓𝑠𝑎𝑚𝑝𝑙𝑖𝑛𝑔 𝑟𝑎𝑡𝑒 ≥ 2 ⋅ 𝑓𝑚𝑎𝑥
Ein Signal mit einer maximalen Frequenz von 𝑓𝑚𝑎𝑥 muss
mindestens mit der doppelten Frequenz von 𝑓𝑚𝑎𝑥
abgetastet werden um es aus dem zeitdiskreten Signal
fehlerfrei rekonstruieren zu können.
praxis: Da menschliche Ohren Schallwellen von
maximal 22.000 Hz (= 22 kHz) wahrnehmen können,
liegt die erforderliche Nyquist-Rate bei 44.000 Hz.
 Qualitativ hochwertige Audio-Digitalisate haben darum eine
Abtastrate von 44.100 Hz.
Das Nyquist-Shannon-Abtasttheorem
 Drei Kategorien
 Unkomprimiert (bspw. WAV, AIFF)
 Verlustfrei komprimiert (bspw. FLAC)
 Verlustbehaftet komprimiert (bspw. mp3)
Verschiedene Audioformate
 Header
 ChunkID: „RIFF“ um Datei als Resource Interchange File
Format kenntlich zu machen
 ChunkSize: Größe der Datei minus ChunkID und
ChunkSize
 Format: „WAVE“
 fmt-Chunk: beschreibt das Format der Nutzdaten
 NumChannels: 1 – Mono, 2 – Stereo, etc
 SampleRate: 44100 für CD-Qualität
 BitsPerSample: Sampling Resolution, üblicherweise 16
 …
 data-Chunk: enthält die eigentlichen Daten (die
Welle)
Das WAVE-Format
 Sampling rate: 44100 Hz
 Sampling resolution: 16 Bit → 65536 mögliche
Werte
 1 s WAV-Datei → 88200 Byte + Header
 3 min 20 s WAV-Datei → ~16,8 Mbyte
Wie groß ist der Speicherplatzbedarf
(unkomprimiert) einer klassischen Aufnahme in
CD Qualität (Stereo, 16 Bit) mit 60-minütiger
Laufzeit?
Audio-CD
Wie groß ist der Speicherplatzbedarf (unkomprimiert) einer
klassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit
60-minütiger Laufzeit?
Lösung
 Das Audiosignal wird standardmäßig mit 44,1 KHz abgetastet.
 Die Abtasttiefe liegt bei 16 Bit.
 Daraus folgt:
44,1kHz * 2 * 16bit * 60 min * 60 s = 635 Megabyte
Speicherplatzbedarf
 WAV, AIFF, uvm. enthalten eine diskrete Abbildung
einer Schallwelle
 Diese Formate bilden die Basis der digitalen Seite
einer Schnittstelle zur Außenwelt
 Eine Soundkarte sendet elektrische Impulse die einer
Schallwelle entsprechen
 Ein Lautsprecher erzeugt aus diesen Impulsen
Schallwellen
 (Umgekehrt für Mikrofon)
 Andere Formate wie bspw. mp3 müssen vor der
Wiedergabe decodiert werden um in eine WAV-
ähnliche Form gebracht zu werden
Unkomprimierte Audioformate
 Menschliche Wahrnehmungsgrenzen verwenden
 Töne die nicht vom Menschen wahrgenommen
werden können, werden nicht mit kodiert
 Geschieht in WAV auch: Samplingrate von 44100
Hz bedingt eine Maximalfrequenz von 22050 Hz.
Das menschliche Ohr nimmt Töne im Bereich von
ca. 20 Hz bis 22 kHz wahr. Alles darüber kann
vernachlässigt werden.
 Bei mp3 werden aber auch andere Daten nicht
gespeichert →
Psychoakustische Kompressionsverfahren
Bildnachweis: http://commons.wikimedia.org/wiki/File:Hoerflaeche.svg
 Töne unterschiedlicher Frequenz werden vom
Menschen unterschiedlich Laut wahrgenommen (1
kHz bis 5 kHz am lautesten)
Psychoakustische Kompressionsverfahren
 Töne unterschiedlicher Frequenz werden vom
Menschen unterschiedlich Laut wahrgenommen (1
kHz bis 5 kHz am lautesten)
 Laute Töne „verdecken“ leise Töne, die eine
ähnliche Tonhöhe haben und etwa zeitgleich
stattfinden.
Psychoakustische Kompressionsverfahren
Quelle: http://www.itwissen.info/definition/lexikon/Maskierung-masking.html
 Zusammen mit der auch sonst gegebenen
frequenzabhängigen Hörschwelle bildet sich so
eine neue Hörschwelle
 Töne unterhalb dieser Schwelle werden nicht
kodiert
Psychoakustische Kompressionsverfahren
Quelle: http://www.itwissen.info/definition/lexikon/Maskierung-masking.html
Hörschwellenmaskierung
 Signale werden aus Frequenzspektrum entfernt, die jenseits
der (menschlichen) Hörschwelle liegen
Frequenzmaskierung
 Entfernung von Signalen, die von Signalen mit einer anderen
Frequenz übertönt werden
Temporale Maskierung
 Auch zeitliche Abstände zwischen Tönen haben einen
Einfluss auf die Hörbarkeit:
 Geht einem starken Ton A ein schwächerer
Ton B in ähnlicher oder gleicher Frequenz
voraus oder folgt ihm, so gibt es zeitliche
Abstände von bestimmter Dauer, in denen Ton
B nicht zu hören ist.
Kompression: Psychoakkustische Aspekte
Bildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:24h_wecker.jpg&filetimestamp=20090809180759
/

Weitere ähnliche Inhalte

Andere mochten auch

Bayerische autos auf deutsch
Bayerische autos auf deutschBayerische autos auf deutsch
Bayerische autos auf deutschLisa Rhoads
 
Kooperation in der ländlichen Entwicklung: Erfolgsfaktoren und Stolpersteine
Kooperation in der ländlichen Entwicklung: Erfolgsfaktoren und StolpersteineKooperation in der ländlichen Entwicklung: Erfolgsfaktoren und Stolpersteine
Kooperation in der ländlichen Entwicklung: Erfolgsfaktoren und Stolpersteineregiosuisse
 
victor CRM Datenbankanreicherung
victor CRM Datenbankanreicherungvictor CRM Datenbankanreicherung
victor CRM Datenbankanreicherungemotion banking
 
presentación con adjetivos
presentación con adjetivospresentación con adjetivos
presentación con adjetivosMaru Domenech
 
Yyyyyyyyyyy
YyyyyyyyyyyYyyyyyyyyyy
Yyyyyyyyyyytyghj
 

Andere mochten auch (9)

Firmenpräsentation lange Fassung
Firmenpräsentation lange FassungFirmenpräsentation lange Fassung
Firmenpräsentation lange Fassung
 
Bayerische autos auf deutsch
Bayerische autos auf deutschBayerische autos auf deutsch
Bayerische autos auf deutsch
 
Ronald Schild: Aus der MVB
Ronald Schild: Aus der MVBRonald Schild: Aus der MVB
Ronald Schild: Aus der MVB
 
Kooperation in der ländlichen Entwicklung: Erfolgsfaktoren und Stolpersteine
Kooperation in der ländlichen Entwicklung: Erfolgsfaktoren und StolpersteineKooperation in der ländlichen Entwicklung: Erfolgsfaktoren und Stolpersteine
Kooperation in der ländlichen Entwicklung: Erfolgsfaktoren und Stolpersteine
 
victor CRM Datenbankanreicherung
victor CRM Datenbankanreicherungvictor CRM Datenbankanreicherung
victor CRM Datenbankanreicherung
 
presentación con adjetivos
presentación con adjetivospresentación con adjetivos
presentación con adjetivos
 
Pp3b
Pp3bPp3b
Pp3b
 
Presentac[1]..
Presentac[1]..Presentac[1]..
Presentac[1]..
 
Yyyyyyyyyyy
YyyyyyyyyyyYyyyyyyyyyy
Yyyyyyyyyyy
 

Ähnlich wie BIT II SoSem 2015 | Basisinformationstechnologie II - 08_Video und Audio

Begriffe aus der Videotranskodierung erklärt
Begriffe aus der Videotranskodierung erklärtBegriffe aus der Videotranskodierung erklärt
Begriffe aus der Videotranskodierung erklärtnerodude
 
Videokompression
VideokompressionVideokompression
Videokompressionhcycon
 
The Dirac Video CoDec
The Dirac Video CoDecThe Dirac Video CoDec
The Dirac Video CoDecMarc Seeger
 
IMAI HD Video 2011 - Excerpt
IMAI HD Video 2011 - ExcerptIMAI HD Video 2011 - Excerpt
IMAI HD Video 2011 - ExcerptJürgen Enge
 
OSG Volume Rendering - Presentation
OSG Volume Rendering - PresentationOSG Volume Rendering - Presentation
OSG Volume Rendering - PresentationRoland Bruggmann
 
Barco NRC & ClickShare: Live Demo
Barco NRC & ClickShare: Live DemoBarco NRC & ClickShare: Live Demo
Barco NRC & ClickShare: Live DemorAVe [PUBS]
 
Grundlagen digitaler bildbearbeitung dominik bloes
Grundlagen digitaler bildbearbeitung dominik bloesGrundlagen digitaler bildbearbeitung dominik bloes
Grundlagen digitaler bildbearbeitung dominik bloesWGS
 
Netzwerktechnik - VHS Braunschweig (Okt 2017)
Netzwerktechnik - VHS Braunschweig (Okt 2017)Netzwerktechnik - VHS Braunschweig (Okt 2017)
Netzwerktechnik - VHS Braunschweig (Okt 2017)Joe Brandes
 
20111006 roadshow-sandy-bridge
20111006 roadshow-sandy-bridge20111006 roadshow-sandy-bridge
20111006 roadshow-sandy-bridgeWerner Fischer
 
State of TV - Stand der Vortragsaufzeichnung 11/2017
State of TV - Stand der Vortragsaufzeichnung 11/2017State of TV - Stand der Vortragsaufzeichnung 11/2017
State of TV - Stand der Vortragsaufzeichnung 11/2017frankstaude
 
Digitale Bilder
Digitale BilderDigitale Bilder
Digitale Bilderhcycon
 
Grundlage Pixelgrafik
Grundlage PixelgrafikGrundlage Pixelgrafik
Grundlage Pixelgrafikhabasch
 
Internet und Webdesign (Historisches Dokument)
Internet und Webdesign (Historisches Dokument)Internet und Webdesign (Historisches Dokument)
Internet und Webdesign (Historisches Dokument)Eric Eggert
 

Ähnlich wie BIT II SoSem 2015 | Basisinformationstechnologie II - 08_Video und Audio (18)

Begriffe aus der Videotranskodierung erklärt
Begriffe aus der Videotranskodierung erklärtBegriffe aus der Videotranskodierung erklärt
Begriffe aus der Videotranskodierung erklärt
 
Mpeg7 und Mpeg21
Mpeg7 und Mpeg21Mpeg7 und Mpeg21
Mpeg7 und Mpeg21
 
Videokompression
VideokompressionVideokompression
Videokompression
 
The Dirac Video CoDec
The Dirac Video CoDecThe Dirac Video CoDec
The Dirac Video CoDec
 
IMAI HD Video 2011 - Excerpt
IMAI HD Video 2011 - ExcerptIMAI HD Video 2011 - Excerpt
IMAI HD Video 2011 - Excerpt
 
OSG Volume Rendering - Presentation
OSG Volume Rendering - PresentationOSG Volume Rendering - Presentation
OSG Volume Rendering - Presentation
 
Barco NRC & ClickShare: Live Demo
Barco NRC & ClickShare: Live DemoBarco NRC & ClickShare: Live Demo
Barco NRC & ClickShare: Live Demo
 
ScienceWednesday: Projekte des igdv und des Fb Media
ScienceWednesday: Projekte des igdv und des Fb MediaScienceWednesday: Projekte des igdv und des Fb Media
ScienceWednesday: Projekte des igdv und des Fb Media
 
Grundlagen digitaler bildbearbeitung dominik bloes
Grundlagen digitaler bildbearbeitung dominik bloesGrundlagen digitaler bildbearbeitung dominik bloes
Grundlagen digitaler bildbearbeitung dominik bloes
 
Medienverwaltung ZKI-Hamburg
Medienverwaltung ZKI-HamburgMedienverwaltung ZKI-Hamburg
Medienverwaltung ZKI-Hamburg
 
Netzwerktechnik - VHS Braunschweig (Okt 2017)
Netzwerktechnik - VHS Braunschweig (Okt 2017)Netzwerktechnik - VHS Braunschweig (Okt 2017)
Netzwerktechnik - VHS Braunschweig (Okt 2017)
 
20111006 roadshow-sandy-bridge
20111006 roadshow-sandy-bridge20111006 roadshow-sandy-bridge
20111006 roadshow-sandy-bridge
 
State of TV - Stand der Vortragsaufzeichnung 11/2017
State of TV - Stand der Vortragsaufzeichnung 11/2017State of TV - Stand der Vortragsaufzeichnung 11/2017
State of TV - Stand der Vortragsaufzeichnung 11/2017
 
VIT 1-2014
VIT 1-2014VIT 1-2014
VIT 1-2014
 
Digitale Bilder
Digitale BilderDigitale Bilder
Digitale Bilder
 
Grundlage Pixelgrafik
Grundlage PixelgrafikGrundlage Pixelgrafik
Grundlage Pixelgrafik
 
Internet und Webdesign (Historisches Dokument)
Internet und Webdesign (Historisches Dokument)Internet und Webdesign (Historisches Dokument)
Internet und Webdesign (Historisches Dokument)
 
Lexikon Der Videoformate
Lexikon Der VideoformateLexikon Der Videoformate
Lexikon Der Videoformate
 

Mehr von Institute for Digital Humanities, University of Cologne

Mehr von Institute for Digital Humanities, University of Cologne (20)

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
 
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
 
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Bit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-gamesBit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-games
 
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-visionBit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
 
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filterBit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
 
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationenBit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
 
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompressionBit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
 
Bit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-webBit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-web
 
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-iiBit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
 
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikationBit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
 
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conwayBit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
 
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatikBit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
 
Bit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmenBit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmen
 
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturenBit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
 
Bit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischungBit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischung
 
Bit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblickBit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblick
 
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung IIBit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
 

BIT II SoSem 2015 | Basisinformationstechnologie II - 08_Video und Audio

  • 1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Dr. Jan G. Wieners // jan.wieners@uni-koeln.de Basisinformationstechnologie II Sommersemester 2015 10. Juni 2015 – Video und Audio: Container, Codecs und Kompressionsverfahren
  • 2. Video  Container  Matroska  MP4  Codecs  DivX  Xvid  H.264  Verfahren der Videokompression  Intra-coding  Vektorquantisierung  Konturbasierte Codierung  Inter-coding  Differenzcodierung  Bewegungskompensation Audio  Sampling  Kompression Themenüberblick
  • 4. Bildnachweis: „Kill Bill“ (2003) Bitraten (37 sec.): ◦ 1 Mbps (~5 MB) ◦ 500 Kbps (~3 MB) ◦ 100 Kbps (~1,6 MB) Konstante Bitrate (CBR) vs. Variable Bitrate (VBR)
  • 5.  ~25 Bilder pro Sekunde  25 fps (frames per second)  Auflösung  Farbtiefe (Quantisierung) z.B. 24 Bit pro Pixel  Rechenexempel unkomprimiertes Video:  720 * 576 * 24 = 9.953.280 Bit pro Frame = ~1,2 MB / Frame (9.953.280 / 8 / 1024)  1,2 MB * 25 Frames = 30 MB/ sec.  30 MB * 60 sec. = 1.800 MB / min.  1,8 GB * 60 min. = 108 GB / std. Speicherplatzbedarf von Videomaterial
  • 7.
  • 8. Container Codecs  Von den Begriffen Compressor und Decompressor • Codecs: Mathematische Algorithmen, mit deren Hilfe Video- und Audiodaten reduziert werden. • Hardware-Codecs: Hardwarebausteine, die die Kompression in Echtzeit durchführen. • Software-Codecs
  • 11. Matroska • Unterstützt Videocodecs: • MPEG-1, MPEG-2, MPEG-4 • H.264 • RealVideo, WMV, Theora, Dirac • … • Unterstützt Audiocodecs: • MP3 • AAC, AC3, DTS, WAV, Vorbis, FLAC
  • 12. Container: mp4 Mp4  Von der Moving Picture Expert Group (MPEG) (gegründet 1988) beschränkt auf folgende Formate:  Video: MPEG-4 (Part 2, Part 10 (AVC/H.264)), MPEG-2 und MPEG-1  Audio: AAC, MP3, MP2, MP1, AC-3  Bilder: JPEG, PNG  Grafik und Text: BIFS (z. B. können Untertitel in dieses Format umgewandelt werden)  Dateiendungen:  .m4v, .mp4v: Video (MPEG-4-Videoströme)  .m4a: nur für Audio  .m4b: (Audiobook): Hörbücher, in die Lesezeichen gesetzt werden können  .m4p: (Protected): DRM-geschützte AAC-Audiodateien  .m4r: (Ringtone): Klingeltöne für iPhone
  • 14.
  • 16. Codec: DivX DivX  <= DivX ;-) 3.11 (1999): Veränderter MS MPEG 4 Codec:  u.a.: Erhöhung der maximalen Bitrate  MS MPEG 4: 256 kbps  DivX: bis 6 mbps  Erzeugt kein ISO-konformes MPEG 4 Video  > DivX ;-) 3.11: Neuentwicklung, patentierter Codec  Unterstützt u.a.:  Multipass Encoding (variable Bitrate)  Komplexe Szenen erhalten eine höhere Bitrate zugewiesen, langsame Szenen eine niedrigere Bitrate  2000: Gründung der Firma DivXNetworks   Open Source Projekt OpenDivX, basierend auf der MPEG-4 Referenzimplementierung des EU- Projektes „MoMuSys“ (Mobile Multimedia Systems)  Nach Veröffentlichung von DivX 4.0 (August 2001): Fokus auf kommerzielle Interessen, die Entwicklungsarbeiten an OpenDivX werden eingestellt  Kodiereffizienz schlechter als bei DivX ;-)  DivX 5: Erstes kommerzielles Produkt  …DivX 9.1.2 (2013-05) Linktipp: http://www.heise.de/ct/artikel/DivX-im-Griff-288448.html
  • 17. Coded: Xvid Xvid  Freie MPEG-4 Implementierung (GNU General Public License), basierend auf OpenDivX Quelltext  Techniken:  B-Frames  Quarter Pixel Compensation  …
  • 18. Codec: H.264 H.264 (H.264/MPEG-4 AVC) • 2003 als Standard verabschiedet: MPEG-4 Part 10 oder auch AVC (Advanced Video Coding)  Zehnter Teil des MPEG-4 Standards (MPEG-4/Part 10, ISO/IEC 14496-10) • Datei-/Containerformat: mp4 • Verwendung: • HDTV / Blu-Ray • Freier, quelloffener Encoder: x264 (http://www.videolan.org/developers/x264.html)
  • 19. H.264 Variable block-size motion compensation (VBSMC) with block sizes as large as 16×16 a as small as 4×4, enabling precise segmentation of moving regions.
  • 22. Wie ließe sich diese Videosequenz komprimieren? http://skateboarding.ru/gallery/data/media/81/sequence_mini.jpg
  • 23. Videokompression: Möglichkeiten in der Beseitigung von Redundanzen Bild- bzw. Framedimensionen (Höhe und Breite) - Eigenschaften der Pixel (Helligkeit, Farbe) - Eigenschaften des jeweils betrachteten Frames Zeitliche Dimension
  • 25. Unterscheidung:  Intra-coding (auch: spatial coding): Redundanz aus einem Frame entfernen (räumliche Redundanz), Kompression teilweise analog zu JPEG  Vektorquantisierung  Konturbasierte Codierung vs.  Inter-coding (auch: temporal coding): Redundanz zwischen Frames entfernen (temporale Redundanz)  Differenzkodierung (frame differencing)  Bewegungskompensation Videokompression
  • 26. Idee und Verfahrensweise:  Aufteilung des Frames in Blöcke (4x4, 8x8, etc.)  Suche nach ähnlichen Blöcken  Ähnliche Blöcke im Bild ersetzen durch „Durchschnittsblock“  Zwei Schritte:  Training: Erstellung der Tabelle (Codebuch) mit häufig vorkommenden Blöcken  Häufig verwendet: Linde–Buzo–Gray Algorithmus  Berücksichtigung der Ähnlichkeit der notierten Blöcke Dekoder muss über das gleiche Codebuch verfügen Vorteile:  Schnelle Decodierung  Gute Kompression bei vielen ähnlichen Blöcken Nachteile:  Codierung aufwändig, da ähnliche Blöcke gesucht werden müssen Praxis: Verwendung in Codecs: Indeo, Cinepak Intra-Coding: Vektorquantisierung
  • 27.
  • 28. Idee und Verfahrensweise:  Trennung in Textur und Kontur  Konturen beschreiben (z.B.) durch Bézier-Kurven  Texturen kodieren (z.B. mit DCT) Praxis: Verwendung ansatzweise in MPEG-4 Knackpunkt: Objekterkennung Intra-Coding: Konturbasierte Codierung
  • 31. t = 1 Frame vollständig gespeichert  I-Frame t = 2 Aus dem vorhergehenden Frame berechnetes Frame  P-Frame …Kompression! t = 3 Aus dem vorhergehenden Frame berechnetes Frame  P-Frame Bildnachweis: http://www.ipway.rs/h264/Doc/wp_h264_31669_en_0803_lo.pdf
  • 32. Speichern der Differenzen zwischen Start- und Folgeframe, z.B. pixelweise Differenzcodierung Bildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
  • 33. Intra- vs. Predicted- vs. Bidirectional Frames:  Das Intra-Frame (I-Frame, auch: Key Frame / Schlüsselbild) wird nur unter Berücksichtigung der eigenen Bildinformation kodiert  Predicted Frames (P-Frames) werden aus den vorhergehenden I-Frames berechnet.  Bidirectional Frames beziehen sich sowohl  auf die vorhergehenden I- und P-Frames als auch  auf die folgenden I- und P-Frames. Praxis  MPEG-1 / -2: Ein I-Frame pro ½ Sek.  MPEG-4: Ein I-Frame ~ alle 10 Sek. Unterscheidung I: Frame-Typen (in MPEG)
  • 34. Verfahrensweise  Startframe und spätere I-Frames intracodiert übertragen  Unterschiede zum Folgeframe bestimmen, als Bild interpretieren und dieses Bild komprimieren Differenzcodierung Bildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 180.
  • 35. Verfahrensweise:  Objektbewegungen zwischen Frames identifizieren  Speicherung der Veränderungen als Bewegungsvektoren (motion vector)  Zu übertragen:  Differenzbild  Bewegungsvektoren Bewegungskompensation (Motion Compensation) Bildnachweis: Malaka, Butz, Hußmann: Medieninformatik. München: Pearson Studium, 2009. S. 182.
  • 36.
  • 37. Audio
  • 38.
  • 40.  Amplitude (vertikale Ausdehnung) → Lautstärke  Frequenz (Wiederholungsrate) → Tonhöhe  Angabe in Hertz: 1 Hz = 1 Wiederholung pro Sekunde Schallwellen Bildnachweis: http://commons.wikimedia.org/wiki/File:Sine_one_period.svg (modifiziert)
  • 41.  Analoge Daten: kontinuierlich (fortlaufend)  Digitale Daten: diskret (trennbar, abzählbar)  Analog → Digital: Abtasten des analogen Signals via A/D-Wandler  Grundfragen Sampling: 1. Wahl der geeigneten Abtastrate (Sampling Rate) 2. Wahl der geeigneten Auflösung Analoge vs. Digitale Daten
  • 42. Kontinuierlich vs. Diskret Bildnachweis: https://commons.wikimedia.org/wiki/File:Digital.signal.discret.svg samplingresolution=8 (Abtasttiefe) sampling rate = 1/t (Abtastrate)
  • 43. Kontinuierlich vs. Diskret Bildnachweis: https://commons.wikimedia.org/wiki/File:Digital.signal.discret.svg samplingresolution=8 sampling rate = 1/t 4 5 4 3 4 6 7 5 3 3 4 4 3 100 101 100 011 100 110 111 101 011 011 100 100 011
  • 44. Kontinuierlich vs. Diskret Bildnachweis: https://commons.wikimedia.org/wiki/File:Digital.signal.svg samplingresolution=8 (Abtasttiefe) sampling rate = 1/t (Abtastrate)
  • 45. Sampling Rate: Aliasing  Problem: Beliebig viele Wellen lassen sich auf die Abtastpunkte mappen  Lösung: Welle mit niedrigster Frequenz wählen Bildnachweis: http://commons.wikimedia.org/wiki/File:AliasingSines.svg
  • 46. 𝑓𝑠𝑎𝑚𝑝𝑙𝑖𝑛𝑔 𝑟𝑎𝑡𝑒 ≥ 2 ⋅ 𝑓𝑚𝑎𝑥 Ein Signal mit einer maximalen Frequenz von 𝑓𝑚𝑎𝑥 muss mindestens mit der doppelten Frequenz von 𝑓𝑚𝑎𝑥 abgetastet werden um es aus dem zeitdiskreten Signal fehlerfrei rekonstruieren zu können. praxis: Da menschliche Ohren Schallwellen von maximal 22.000 Hz (= 22 kHz) wahrnehmen können, liegt die erforderliche Nyquist-Rate bei 44.000 Hz.  Qualitativ hochwertige Audio-Digitalisate haben darum eine Abtastrate von 44.100 Hz. Das Nyquist-Shannon-Abtasttheorem
  • 47.  Drei Kategorien  Unkomprimiert (bspw. WAV, AIFF)  Verlustfrei komprimiert (bspw. FLAC)  Verlustbehaftet komprimiert (bspw. mp3) Verschiedene Audioformate
  • 48.  Header  ChunkID: „RIFF“ um Datei als Resource Interchange File Format kenntlich zu machen  ChunkSize: Größe der Datei minus ChunkID und ChunkSize  Format: „WAVE“  fmt-Chunk: beschreibt das Format der Nutzdaten  NumChannels: 1 – Mono, 2 – Stereo, etc  SampleRate: 44100 für CD-Qualität  BitsPerSample: Sampling Resolution, üblicherweise 16  …  data-Chunk: enthält die eigentlichen Daten (die Welle) Das WAVE-Format
  • 49.  Sampling rate: 44100 Hz  Sampling resolution: 16 Bit → 65536 mögliche Werte  1 s WAV-Datei → 88200 Byte + Header  3 min 20 s WAV-Datei → ~16,8 Mbyte Wie groß ist der Speicherplatzbedarf (unkomprimiert) einer klassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit 60-minütiger Laufzeit? Audio-CD
  • 50. Wie groß ist der Speicherplatzbedarf (unkomprimiert) einer klassischen Aufnahme in CD Qualität (Stereo, 16 Bit) mit 60-minütiger Laufzeit? Lösung  Das Audiosignal wird standardmäßig mit 44,1 KHz abgetastet.  Die Abtasttiefe liegt bei 16 Bit.  Daraus folgt: 44,1kHz * 2 * 16bit * 60 min * 60 s = 635 Megabyte Speicherplatzbedarf
  • 51.  WAV, AIFF, uvm. enthalten eine diskrete Abbildung einer Schallwelle  Diese Formate bilden die Basis der digitalen Seite einer Schnittstelle zur Außenwelt  Eine Soundkarte sendet elektrische Impulse die einer Schallwelle entsprechen  Ein Lautsprecher erzeugt aus diesen Impulsen Schallwellen  (Umgekehrt für Mikrofon)  Andere Formate wie bspw. mp3 müssen vor der Wiedergabe decodiert werden um in eine WAV- ähnliche Form gebracht zu werden Unkomprimierte Audioformate
  • 52.  Menschliche Wahrnehmungsgrenzen verwenden  Töne die nicht vom Menschen wahrgenommen werden können, werden nicht mit kodiert  Geschieht in WAV auch: Samplingrate von 44100 Hz bedingt eine Maximalfrequenz von 22050 Hz. Das menschliche Ohr nimmt Töne im Bereich von ca. 20 Hz bis 22 kHz wahr. Alles darüber kann vernachlässigt werden.  Bei mp3 werden aber auch andere Daten nicht gespeichert → Psychoakustische Kompressionsverfahren
  • 54.  Töne unterschiedlicher Frequenz werden vom Menschen unterschiedlich Laut wahrgenommen (1 kHz bis 5 kHz am lautesten) Psychoakustische Kompressionsverfahren
  • 55.  Töne unterschiedlicher Frequenz werden vom Menschen unterschiedlich Laut wahrgenommen (1 kHz bis 5 kHz am lautesten)  Laute Töne „verdecken“ leise Töne, die eine ähnliche Tonhöhe haben und etwa zeitgleich stattfinden. Psychoakustische Kompressionsverfahren Quelle: http://www.itwissen.info/definition/lexikon/Maskierung-masking.html
  • 56.  Zusammen mit der auch sonst gegebenen frequenzabhängigen Hörschwelle bildet sich so eine neue Hörschwelle  Töne unterhalb dieser Schwelle werden nicht kodiert Psychoakustische Kompressionsverfahren Quelle: http://www.itwissen.info/definition/lexikon/Maskierung-masking.html
  • 57. Hörschwellenmaskierung  Signale werden aus Frequenzspektrum entfernt, die jenseits der (menschlichen) Hörschwelle liegen Frequenzmaskierung  Entfernung von Signalen, die von Signalen mit einer anderen Frequenz übertönt werden Temporale Maskierung  Auch zeitliche Abstände zwischen Tönen haben einen Einfluss auf die Hörbarkeit:  Geht einem starken Ton A ein schwächerer Ton B in ähnlicher oder gleicher Frequenz voraus oder folgt ihm, so gibt es zeitliche Abstände von bestimmter Dauer, in denen Ton B nicht zu hören ist. Kompression: Psychoakkustische Aspekte Bildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:24h_wecker.jpg&filetimestamp=20090809180759
  • 58. /

Hinweis der Redaktion

  1. DVD: 4,7 GB
  2. Matroska Media Container
  3. High Efficiency Video Coding (HEVC), auch bekannt als H.265 bzw. MPEG-H Teil 2, ist ein Standard zum Kodieren von Videoinhalten. Er ist Nachfolger des H.264/MPEG-4-AVC-Standards und konkurriert mit VP9. H.265/HEVC ist eine gemeinsame Entwicklung der ISO/IEC Moving Picture Experts Group (MPEG) und der ITU-T Video Coding Experts Group (VCEG). Ziel war eine im Vergleich zu H.264/MPEG-4 AVC doppelt so starke Kompression bei gleichbleibender Qualität. Zusätzlich kann H.265/HEVC von 320 × 240 Pixel bis zu 8192 × 4320 Pixel (4320p) skalieren.[3][4]
  4. Welche der beiden Videosequenzen lässt sich besser / stärker komprimieren? Warum?
  5. Blockbasierte Bewegungskompensation Verwendung u.a. im MPEG-2 Standard Grob: Jedes Frame des Videomaterials wird in n*m große Pixelblöcke unterteilt Um die Bewegungskompensation zu leisten, werden die Pixelblöcke von Frame zu Frame miteinander verglichen Ähneln sich die Pixelblöcke (z.B. Kreuzkorrelation), so wird nur der Verschiebungsvektor gespeichert, um den sich der Block verschiebt
  6. Schall: Druckschwankung in einem Übertragungsmedium, die sich im Raum mit der Zeit ausbreitet
  7. Schallwelle als Ausgangspunkt für die zu kodierenden Daten
  8. 1 pro t Je häufiger die Schallwelle auf ihren Druck abgetastet wird, desto besser wird der originale Ton digital repräsentiert. Zu wenige Abtastpunkte führen zu geraden Linien, zu langen Wellen oder zu gezackten Kurven.
  9. Psychoakustische Kompressionsverfahren: Hörschwelle des menschlichen Ohrs
  10. Auf diese Weise wird die zu kodierende Datenmenge reduziert
  11. Töne unterschiedlicher Frequenz werden vom Menschen unterschiedlich Laut wahrgenommen (1 kHz bis 5 kHz am lautesten) Laute Töne „verdecken“ leise Töne, die eine ähnliche Tonhöhe haben und etwa zeitgleich stattfinden.