1. Procesamiento Digital
de Imágenes 5
Profesor: Andrés Flores
Compresión de Imágenes
Se refiere también como Codificación de
Imágenes (Image Coding)
El objetivo de la compresión de imágenes es
el reducir el número de bits que son
necesarios para reproducir una imagen
fielmente.
Esto se refleja en la minimización del espacio
de almacenamiento, la reducción del ancho
de banda y la reducción del tiempo de
transferencia de la información.
1
2. Utilidad de la compresión de
imágenes
Reducción del volumen de datos a ser
transmitidos.
Texto, FAX, fotografías, vídeo
Reducción de ancho de banda del medio de
transmisión.
Redundancias
La compresión de imágenes se consigue
aprovechando las redundancias que
generalmente se dan en una imagen.
2
3. Existen 3 tipos de
redundancias
Redundancia en la codificación (datos)
Se refiere a la cantidad de bits usado para representar la
información.
Redundancia interpíxel
Se refiere a aprovechar la alta correlación que se da entre
píxeles vecinos en una imagen
Redundancia psicovisual
Se refiere a aprovechar a reducir la información que no es
perceptible por el sistema de visión del ser humano.
Redundancia temporal
Para el caso de señales de vídeo en los cuales los cuadros
consecutivos están muy correlacionados.
Tipos de Compresión
Compresión sin pérdidas
Se refiere a que la imagen decodificada es exactamente la
misma que la imagen original, píxel por píxel.
Solamente aprovechan la redundancia de codificación.
Compresión con pérdidas
Se refiera a que la imagen decodificada no corresponde a
la imagen original píxel a píxel, pero para efectos
visualización es sensiblemente parecida.
Se obtienen mayor compresión comparados con los de sin
pérdidas.
3
4. Entropía
Se emplea el concepto de entropía para evaluar el
límite de reducción de la redundancia y del
rendimiento de la codificación.
S= conjunto de variables aleatorias independientes
S = { a1,a2,……..an } ai={0,1}
pi = probabilidad de ocurrencia de ai
En bits
Compresión sin pérdidas
Aprovechan tan sólo la redundancia de los
datos. Se consigue compresión del orden de
3:1
Run-length Coding es un esquema de
codificación sencilla:
eeeeeeetnnnnnnnn 17 datos
@e7t@n8 7 datos
4
5. Códigos de longitud variable
Generalmente una imagen se representa con
píxeles de un byte (8 bits) y son longitud fija.
Se busca un código óptimo para representar
los datos.
Código Huffman
Código Aritmético
Lempel-Ziv-Welch (LZW)
Código Huffman
5
7. Compresión con pérdidas
Aprovecha todas las redundancias que
presentan las imágenes.
Redundancia PsicoVisual
El ojo humano es menos sensible :
al color en comparación con la luminosidad.
a las componentes de alta frecuencia espacial
a la distorsión de cuantización en los niveles altos
de luminosidad.
Estándar JPEG
Joint Photographic Experts Group es la
entidad encargada de establecer el estándar.
Combina todas las redundancias para crear
una compresión de 15:1.
Establece mejor compresión para imágenes
naturales: escenas, fotografías.
No funciona bien para imágenes que
contienen textos o dibujos artificiales.
7
8. Esquema de codificación
JPEG
Transformación de Modelo de
Color
Debido a que el ojo humano es menos sensible al
color relativo a la luminancia se realiza el cambio de
modelo de RGB a YCrCb
Y es Luminancia
Cr y Cb son las capas croma (referentes al color)
(chrominance)
Estas dos capas se
deciman por 2 para
reducir el efecto del
color
8
9. Procesado por bloques
Se divide la imagen en bloques de píxeles de
tamaño 8x8.
Según se va encontrando cada bloque o
subimagen de 8x8, se cambian los niveles de
sus 64 píxeles, sustrayendo de los mismos la
cantidad 2n-1, siendo 2n, el máximo número
de niveles de gris.
Esto es, para las imágenes de 8 bits se resta
128 de cada píxel.
Transformada de Cosenos
Se calcula la Transformada Discreta del
Coseno bidimensional del bloque,
produciendo un conjunto de 64 valores
conocidos como coeficientes de la DCT.
En este dominio es donde se aprovecha la
redundancia psicovisual
9
10. Cuantificación de los
coeficientes de la DCT
Los 64 coeficientes son cuantificados,
produciendo en algunos de ellos su
reducción a cero.
Los coeficientes son codificados en umbral,
usando una matriz de cuantificación y son
preparados para la codificación de entropía
convirtiéndolos en una cadena
unidimensional de 64 coeficientes en orden
cuasi ascendente de los componentes de
frecuencia.
Cadena unidimensional
10
13. Importancia de la codificación de
video
En la actualidad se requiere codificar video
para diversas aplicaciones:
Broadcast (TV, HDTV, CATV)
Almacenamiento, Entretenimiento. (DVD)
Servicios de comunicación personal
conversacional sobre Ethernet, WiFi, etc.
Video en demanda, (streaming video) por
internet.
Mensajería multimedia.
Aplicaciones futuras.
Muchos estándares
13
14. ITU-T
H.261
p x 64Kbit/s para ISDN.
Orientado a aplicaciones de videoconferencia,
videófonos.
Uso de movimiento compensado.
Soporta sólo dos resoluciones CIF, QCIF.
H.263
Mejora en calidad.
Soporta otras resoluciones adicionales: SQCIF,
4CIF y 16CIF.
H.263
14
15. MPEG
Moving Picture Experts Group (1988)
MPEG-1
Orientado a aplicaciones almacenamiento de
video.
Calidad VHS, 1.5Mbps.
Video CD.
Surge MP3 para audio.
Acceso aleatorio de cuadros.
15
18. MPEG
MPEG-2
“Coding of moving pictures and associated audio
for digital storage media”(1992)
DVD y HDTV
H.264/AVC, ITU-T y MPEG
18
19. Aplicaciones para H.264/AVC
Broadcast over cable, satellite, cable modem, DSL,
terrestrial, etc.
Interactive or serial storage on optical and magnetic
devices, DVD, etc.
Conversational services over ISDN, Ethernet, LAN,
DSL, wireless and mobile networks, modems, etc. or
mixtures of these.
Video-on-demand or multimedia streaming services
over ISDN, cable modem, DSL, LAN, wireless
networks, etc.
Multimedia messaging services (MMS) over ISDN,
DSL, ethernet, LAN, wireless and mobile networks,
etc.
19