Este documento describe los conceptos básicos de la compresión de datos, incluyendo la caracterización de la compresión mediante el factor y radio de compresión. Explica que la información puede ser redundante, irrelevante o básica, y que existen diferentes tipos de compresión como sin pérdidas reales, subjetivamente sin pérdidas o subjetivamente con pérdidas. También distingue entre compresión con y sin pérdida, señalando que la compresión con pérdida puede eliminar datos para lograr una mayor compresión a
3. CARACTERIZACIÓN DE LA COMPRESIÓN
La compresión se puede definir por el factor de compresión, es decir,
el número de bits de la imagen comprimida dividido por el número de
bits de la imagen original.
El radio de compresión, que se utiliza con frecuencia, es lo contrario
al factor de compresión; por lo general, se expresa como porcentaje.
Por último, la ganancia de compresión, que también se expresa como
porcentaje, equivale a 1 menos el radio de compresión.
4. TIPOS DE INFORMACIÓN TRANSMITIDA
• Redundante: información repetitiva o predecible.
• Irrelevante: información que no podemos apreciar y
cuya eliminación por tanto no afecta al contenido del
mensaje. Por ejemplo, si las frecuencias que es capaz
de captar el oído humano están entre 16/20 Hz y
16.000/20.000 Hz, serían irrelevantes aquellas
frecuencias que estuvieran por debajo o por encima de
estos valores.
• Básica: la relevante. La que no es ni redundante ni
irrelevante. La que debe ser transmitida para que se
pueda reconstruir la señal.
5. TIPOS DE COMPRESIÓN DE LA
INFORMACIÓN.
Sin pérdidas reales: es decir, transmitiendo toda la entropía del
mensaje (toda la información básica e irrelevante, pero eliminando la
redundante).
Subjetivamente sin pérdidas: es decir, además de eliminar la
información redundante se elimina también la irrelevante.
Subjetivamente con pérdidas: se elimina cierta cantidad de
información básica, por lo que el mensaje se reconstruirá con errores
perceptibles pero tolerables (por ejemplo: la videoconferencia).
6. DIFERENCIAS ENTRE COMPRESIÓN
CON Y SIN PÉRDIDA
Compresión sin pérdida: los datos antes y después de
comprimirlos son exactos en la compresión sin pérdida.
En el caso de la compresión sin pérdida una mayor
compresión solo implica más tiempo de proceso. El
bitrate siempre es variable en la compresión sin
pérdida. Se utiliza principalmente en la compresión de
texto
7. TIPOS DE ERRORES.
Compresión con Pérdida: Un algoritmo de
compresión con pérdida puede eliminar datos para disminuir aún más
el tamaño, con lo que reduce la calidad. En la compresión con pérdida
el bit rate puede ser constante (CBR) o variable (VBR). Una vez
realizada la compresión, no se puede obtener la señal original, aunque
sí una aproximación cuya semejanza con la original dependerá del tipo
de compresión. Este tipo de compresión se da principalmente en
imágenes, videos y sonidos. Además de estas funciones la compresión
permite que los algoritmos usados, para reducir las cadenas del
código, desechen información redundante de la imagen. Uno de los
formatos que permite compensar esta perdida es el JPG a través de
técnicas que suavizan los bordes y áreas que tienen un color similar,
permitiendo que la falta de información sea invisible a simple vista.
Este método permite un alto grado de compresión con pérdidas en la
imagen que, muchas veces, sólo es visible mediante el zoom.