SlideShare ist ein Scribd-Unternehmen logo
1 von 57
Compresión de Audio
Telecomunicaciones III
Ing. Luis Degregori C.
OBJETIVOS
¿Que logramos?
Almacenamiento Eficiente
Usar el Streaming (Se refiere a ver u oír
un archivo directamente en una página
web sin necesidad de descargarlo antes al
ordenador)
Aplicaciones Multimedia Interactivas
Objetivos de la Compresión
Reduccion del Ancho de banda.
Lograr que las señales decodificadas
suenen tan parecidas al original como sea
posible
Complejidad de la Implementación lo mas
pequeña posible.
Robusta y Escalable
¿Como se hace?
La compresión de audio se
hace por medios de algoritmos
Para lograr una mejor reducción de archivo se
utiliza una técnica conocida como PNS
(Norma de Percepción de Ruido) que
aprovechan características del oído humano
para ser la compresión .
La compresión de
audio se hace por
medios de algoritmos
Clases de compresión de audio
 Se tienen basicamente 02 clases:
a) Lossless (Sin Perdidas)
Son formatos que no pierden claridad ni calidad al
comprimirse, pero que ocupan una mayor cantidad de
espacio en el disco duro.
Usos:
Técnicos de sonidos y entusiastas de la calidad
Algunos Tipos:
Free Lossless Audio Codec (FLAC),
Monkey's Audio (APE) y
True Audio (TTA).
b) Lossy (Con Perdidas)
Engloba a aquellos formatos que (al comprimir el audio)
sacrifican algo de calidad
Ocupan poco espacio en el disco.
Usos:
Publico en general.
Tipos:
El formato MPC, OGG, WMA o el MP3
Formato de compresión de audio
Técnicas de Compresión
Voc File Compression (Elimina los
silencios, parecido al RLE)
Linear Predictive Coding (Usado en
discursos, compara el discurso contra un
modelo analítico del tracto vocal: cavidades
faríngea oral y nasal)
Compresión Ley µ y Ley A (Codific.
Logaritmica usados en Telefonía como:
PCM, DPCM o ADPCM)
Psicoacústica
 Estudia la percepcion subjetiva de las cualidades
(características) del SONIDO:
 Intensidad, Tono y Timbre.
 Esto se puede aprovechar, debido a a la “Sensibilidad
del Oido Humano”.
 La percepción acústica humana esta determinada x dos
dimensiones: frecuencia e intensidad.
 El oído humano es capaz de percibir frecuencias en el
rango de los 20 Hz hasta los 20 KHz.
Codificación Perceptual
En cuanto a la intensidad, los humanos perciben un rango
dinámico en torno a los 120 dB.
Sonidos de intensidad superior a los 90 dB. pueden
provocar daños irreversibles.
Características del sonido
La intensidad de un sonido depende de la amplitud de onda.
Para la medición de las intensidades de un sonido, se usa una escala
logarítmica (decibelios)
Donde:
W exist. es la amplitud del sonido que se está midiendo y
W ref
es la amplitud de referencia (la del sonido con el cual se
compara).
En cuanto a la intensidad, los humanos perciben un rango dinámico en
torno a los 120 dB. Sonidos de intensidad superior a los 90 dB. pueden
provocar daños irreversibles.
La intensidad
Características del sonido
Las intensidades de los sonidos que podemos percibir
tienen un rango de más de 15 órdenes de magnitud.
La Amplitud de Referencia (aref
) es: 10 -12
Watts/m2
Por ejemplo tenemos:
La intensidad
Fuentes de Sonido Presión de sonido 
Nivel  dB SPL
Intensidad de Sonido 
W / m 2 
Dentro de una casa en una zona
residencial a las 02:00 a.m.
30.0 10 -9
Watts/m2
Una Aspiradora, a 1.0 metro 70.0 10 -5
Watts/m2
Un Mega Concierto, a 10.0 metros
de los parlantes (Umbral del Dolor)
130.0 10 Watts/m2
Características del sonido
El timbre es el espectro de frecuencias del sonido y este
permite distinguir, por ejm: el sonido de un piano y de una
trompeta con igual duración, intensidad y tono.
Gráficamente, el timbre se caracteriza por la forma de la
onda. Las ondas sinusoidales puras sólo se obtienen
electrónicamente, pero en la naturaleza, los sonidos son
más complejos.
La frecuencia de vibración más grave (frecuencia base) es
la que determina el periodo y la amplitud.
Las restantes frecuencias, que suelen ser múltiplos de la
frecuencia base, son los armónicos.
El timbre
Psicoacústica
Proceso por el cual se aprovecha las
“Imperfecciones” del oido Humano.
El objetivo eliminar informacion
intracendente.
Psicoacústica
 El objetivo es eliminar partes irrelevantes de la
señal de audio.
 El sistema auditivo humano es incapaz de
escuchar el ruido de cuantificación bajo
condiciones de enmascaramiento auditivo.
 El enmascaramiento ocurre siempre que una
señal fuerte envuelve a una vecindad de
señales de audio mas débiles imperceptibles.
Tolerancia al ruido de
Enmascaramiento
 La capacidad de
resolución del oído
humano es funcion
de la frecuencia.
 La tolerancia al ruido
de
enmascaramiento,
depende de la
energía de la señal
en una vecindad a
esa frecuencia.
Señal Tonal
Intensa
Region donde las
otras señales son
enmascaradas
A
M
P
L
I
T
U
D
FRECUENCIA
Ruido de Enmascaramiento
 Analiza la señal de audio y calcula la cobertura del
ruido de enmascaramiento como una función de la
frecuencia.
 El codificador decide la mejor manera de
representar la señal de entrada con un mínimo
número de bits.
El Umbral de Audicion
 Los receptores de sonido, tienen un
comportamiento que varía con la frecuencia. En
el caso del oído humano, sucede lo mismo, ya
que se trata el receptor más complicado y
eficiente que existe.
 El umbral de audición define la mínima presión
requerida para excitar el oído.
El Umbral de Audicion
 El Umbral de Audición, para la media de los
humanos, se fija en 20 µPa (20 micro pascales =
0.000002 pascales), para...
frecuencias entre 2KHz y 4KHz.
Por encima y por debajo de estas frecuencias, la
presión requerida para excitar el oído es mayor.
El Umbral de Audicion
 El siguiente grafico muestra el Umbral de audicion.
El banco de filtros híbrido
 Empleado desde los 80s – Bell Labs.
 Divide la señal de audio (tipicamente) en 32
sub-bandas de frecuencia de anchos de banda
pequeños.
 Los filtros brindan un corte muy definido (aprox.
100 dB/Octava).
 Esto limitara el ruido de cuantizacion.
 Cada banda se codificara independientemente.
El banco de filtros híbrido
Todas las sub-bandas se muestrean por separado.
Sub-banda 0
Sub-banda 1
Sub-banda 2
Sub-banda 31
Pasos básicos
 Para conseguir las sub-bandas:
 Se convierte el audio a una representacion en el
dominio de la frecuencia.
 Se procesan los valores espectrales en sus
componentes tonales y no tonales.
 Se Aplica una función de dispersión.
 Definir una cota inferior para las tolerancias.
 Se definen estas tolerancias para cada sub-
banda.
Esquema de Codificacion Perceptual
Modelo
Psico acústico
Analizador
del banco
de filtros
(Se separa
en sub
bandas)
…
…...
1
3
2
N
Cuantizador
Codificaciones
independientes
Audio IN
Sintetizador
del banco
De filtros Audio OUT
Empleo de menos
bits en la transmisión
Formatos de audio mas comunes
 MPEG Moving Pictures Experts Group
 ADVANCED AUDIO CODING (Codificacion
de Audio Avanzada)
 WAV
 Desarrollado por Microsoft . Grabación por Cd’s.
 AU(audio for unix)
 WMA(Windows media audio)
 MIDI
 para la industria de la música electrónica
Lo utiliza apple para los archivos de audio q reproduce Ipod
MPEG
 Moving Picture Experts Group
Parte de un estándard múltiple para:
 Compresión de video
 Compresión de audio
 Sincronización de Audio, Video y Data para un
bit rate total de 1.5 Mbit/sec
Compresión de Audio MPEG1
 A nivel físico, presenta pérdidas.
 A nivel perceptual sin pérdidas, algoritmo
transparente.
 Explota propiedades perceptuales del oído
humano.
 Modelamiento Psicoacústico.
 MPEG Audio Standard asegura interoperabilidad
define una sintaxis codificada de bit stream,
define el proceso de decodificación y asegura la
precisión del decodificador.
Características del Audio MPEG1
 Eliminación de partes perceptualmente
irrelevantes de la señal de audio.
 Tasas de muestreo de: 32, 44.1 and 48 kHz
(Muestras de hasta 16 bits).
 Ofrece la eleccion de 3 capas independientes.
 Opcionalmente, deteccion de error mediante
Cyclic Redundancy Check (CRC).
 Las 3 capas permiten la implementacion del
decoder (tiempo real) en un solo chip.
Características del Audio MPEG1
 Información adicional puede ser incluida en el bit
stream.
 Características como: acceso aleatorio, avance
rápido y avance en reversa son posibles.
 Cuantificación, la clave para la codificacion de
audio en MPEG.
 Compresiones de audio fieles al original con
ratios como de 6 a 1.
MPEG1 Audio - Capa I
 Es la codificación mas sencilla.
 Bit rates predefinidos en 32 a 448 kbps por
canal.
 Cada frame contiene una cabecera,
opcionalmente bits de chequeo de error (CRC) y
posiblemente información adicional.
 Ejemplo: Philips Digital Compact Cassette
MPEG1 Audio – Capa II
 Complejidad Intermedia
 Bit rates predefinidos en 32 a 384 kbps por
canal.
 Digital Audio Broadcasting (DAB)
 Video y audio sincronizado en CD-ROM.
 Crea frames de 1152 muestras por canal de
audio.
MPEG1 Audio - Capa III: MP3
 Basado en los bancos de filtros híbridos de las
capas I y II .
 Codificación (Entropica) mas compleja.
 La mejor calidad de sonido.
 Bit rates predefinidos en 32 a 320 kbps por
canal.
 Adecuado para transmisión de audio a través de
RDSI.
 Norma ISO/IEC 11172Norma ISO/IEC 11172
MPEG1 Audio Capa III (MP3)
Mejoras de la capa III: MP3
 Reducción del Alias. (Codific. Huffman)
 Elimina mas redundancia.
 Cuantificación no uniforme.
 Optimizacion de factores de escala por c/u de
las sub-bandas.
 Uso de un “reservorio” de bits.
Características por nivel para el
MPEG-1.
CAPA FRECUENCIAS DE
MUESTREO
TASA DE
BITS
(Kbps)
Capa I
32, 44.1 y 48 KHz
De 32 a 448
Capa II De 32 a 384
Capa III De 32 a 320
Mejoras de la capa III: MP3
 Reducción del Alias. (Codific. Huffman)
 El archivo de audio de un CD, usa:
 Frecuencia muestreo: 44.1 KHz,
 Codificación: 16 bits,
 Modo: estéreo
Calculando se tendrá: 1,411,200 bits/s
MPEG en el futuro
 MPEG-1: Video CD and MP3.
 MPEG-2: Televisión Digital y DVD
 MPEG-4: Web(fija y móvil)
 MPEG-7: descripción y búsqueda de contenido
de audio y visual.
 MPEG-21: Multimedia Framework
OTROS FORMATOS DE AUDIO
MÁS COMUNES
Esta es una descripcion de algunos
formatos de compresión de audio los más
usados hoy en día, sus ventajas,
extensiones y principales usos
ANTECEDENTES: WAV
Extensión: wav
Desarrollado por Microsoft e IBM – 1995.
Es el archivo digital del sonido sin
comprimir.
Es 10 a 12 veces mas pesado que el MP3.
Es un estándar para música en CD’s.
Funciona en cualquier aplicación Windows
y en equipos domésticos comunes con
reproductor de CD´s.
ADVANCED AUDIO CODING
(Codificacion de Audio Avanzada)
Extensión: .aacExtensión: .aac
Codificación estándar para audio
reconocida por ISO solo en el patrón
MPEG-2.
Es mas eficiente que el MP3 en el mismo
espacio (Con igual bitrate).
Ocupa menos espacio que el MP3.
(Aproximadamente el 70 %)
No es compatible con el MPEG-1.
ADVANCED AUDIO CODING
(Codificacion de Audio Avanzada)
 Este formato de Audio lo utiliza Apple para los
archivos de audio y que pueden comprarse a
través de Internet.
 También es empleado en el estándar ISDB-T
 Frecuencia de muestreo: 16 KHz, 22.05 KHz , 24
KHz.
 Máxima calidad entre 320 y 384 Kbps (5
canales) a diferencia del MP3 (solo Stereo).
Diagrama de bloques del AAC en MPEG-2
ADVANCED AUDIO CODING
(Codificacion de Audio Avanzada)
Extensión: .ac3Extensión: .ac3
Recibe un streaming de los 06 canales
codificados en PCM (Que emplea 9 bits
por muestra y los muestrea a 48 KHz)
para comprimirlos a 384 Kbps.
Es muy popular y muy eficiente, usa 05
canales + un sexto canal exclusivo para
las bajas frecuencias (120 Hz o menos).
Es empleado en los sistemas ATSC.
AC-3 (DOLBY DIGITAL)
AUDIO AC3:
El Dolby Digital 5.1, llamado
técnicamente AC3.
Nació en los años 90, incorpora 5 o seis
canales independientes de sonido.
Cada canal es independiente para cada
altavoz y reproduce todo tipo de
frecuencias, menos el 6to, que solo se
encarga de las más bajas
AU (Audio for Unix)
Extensión: au
Para archivos de sonido con S.O. Unix de
Sun y de NeXT.
Basado en técnicas PCM y luego en
ADPCM.
Estándar acústico para el lenguaje JAVA.
WMA (Windows Media Audio)
Extensión: wma
Versión de Windows para comprimir
Audio, muy parecido a MP3.
Se adapta a diferentes velocidades de
conexión (Cuando se necesite reproducir en Internet
en Tiempo Real).
MIDI (Musical Instrument Digital
Interface).
 Extensión: midi
 Es un protocolo de communicacion de datos
 Estándar en la INDUSTRIA de la música
ELECTRONICA.
 Muy útil cuando se usan sintetizadores
musicales ó tarjetas de Sonido.
 Los sintetizadores analógicos y que fueron
construidos antes del MIDI, pueden ser
acondicionados para convertir los mensajes
MIDI a voltajes de control analógicos.
MIDI
 Extensión: midi
 Por el tamaño resultante que
ofrece su compresión, este
formato es muy usado para
dispositivos y/o reproductores
que necesitan combinar
archivos de audio y video,
como los karaoke. (Otros
como el: teclado, bateria,
guitarra, flauta, ...).
 Permite intercambiar datos
entre diversos equipos
musicales.
OGG VORBIS
Extensión: ogg
También se utiliza para guardar y
reproducir música digital.
Se diferencia del resto de grupo por que
es libre, abierto y no esta patentado.
Su principal atractivo es la importante
reducción que hace de un archivo de
audio manteniendo una alta calidad.
OGG VORBIS
Extensión: ogg
Gran versatilidad para reproducirse en
cualquier dispositivo y por ocupar muy
poco espacio (Menor respecto al MP3).
Adecuado para enviar musica via internet
por streaming, a diferencia del MP3.
Tipo lossless, comparable con el AAC.
ATRAC
(Adaptive TRansform Acoustic Coding)
 Este formato se utiliza en tecnología (de grabación de disco magneto-
óptico) de compresión y reproducción para minidisc.
 Desarrollado por SONY (Discos de 64 mm).
 Codifican el sonido, a unas tasas de datos del orden del 10% de lo
requerido en un CD.
ATRAC
(Adaptive TRansform Acoustic Coding)
 Divide la señal en tres partes o bandas:
a) Menor a 5,5 kHz
b) Entre 5,5 y 11 kHz
c) Mayor a 11 kHz
Este sistema multicanal utiliza 8
canales codificados mediante esta
codificación, obteniendo un bitrate
global (de todos los canales) de
1168 kbit/s.
ATRAC
(Adaptive TRansform Acoustic Coding)
ATRAC 3 (Nueva versión de ATRAC)
• Divide la señal en 04 canales:
a) Inferior a 2.76 kHz
b) De 2.76 a 5.51 kHz
c) De 5.51 a 11.025 kHz
d) Superior a 11.025 kHz dentro de
las audiofrecuencias
Tiene una calidad similar al AC-3.
Se emplea en el sector de audio y algunos dispositivos
portátiles como PDA, y en teléfonos inteligentes.
El puntaje de opinión significativo (MOS)
es un método directo de la evaluación de
la calidad de voz muy ampliamente
usado.
La prueba MOS concierne solamente al
resultado de la experiencia del usuario,
por lo tanto se llama a los usuarios para
la evaluación.
Mean Opinion Score
Mean Opinion Score
Escala de
Calificación
Puntuación Escala de Esfuerzo para
escuchar
Excelente
(Excellent)
5 No se requiere esfuerzo
Bueno (Good) 4 No se requiere esfuerzo
apreciable
Regular (fair) 3 Se requiere poco esfuerzo
Pobre (Poor) 2 Se requiere considerable
esfuerzo
Malo (Bad) 1 No se entiende aun con un
considerable esfuerzo
57
Resumen de algunos formatos de audio digital
Telefonía3218ADPCM (G.721)
Hi-Fi Internet
Hi-Fi Internet
Audio Hi-Fi
Telefonía GSM
Telefonía Internet
Telefonía/Videoc.
Telefonía
Telefonía
Telefonía Internet
Vídeoconferenc.
Telefonía
Uso
705,6/768244,1/48CD-DA / DAT
192-256 variable232/44,1/48MPEG-1 Layer I
96-128 variable232/44,1/48MPEG-1 Layer II
64 variable232/44,1/48MPEG-1 Layer III (MP3)
32-44 variable5.132/44,1/48MPEG-2 AAC
2,418LPC-10E (FS 1015)
4,818CELP (FS 1016)
13,218RPE-LTP (GSM 06.10)
818CS-ACELP (G.729)
1618LD-CELP (G.728)
16/24/32/4018E-ADPCM (G.727)
16/24/32/4018ADPCM (G.726)
6,3/5,3 variable18MP-MLQ (G.723.1)
48/56/64116SB-ADPCM (G.722)
6418PCM (G.711)
Caudal por canal
(Kb/s)
CanalesFrec. Muestreo
(KHz)
Formato
Elevado
Retardo
(ISO)
Bajo
Retardo
(ITU-T)

Weitere ähnliche Inhalte

Was ist angesagt?

Capacidad de un canal
Capacidad de un canalCapacidad de un canal
Capacidad de un canal
arquitectura5
 

Was ist angesagt? (20)

Modulacion fsk
Modulacion fskModulacion fsk
Modulacion fsk
 
Tipos de Ruido en las telecomunicaciones
Tipos de Ruido en las telecomunicacionesTipos de Ruido en las telecomunicaciones
Tipos de Ruido en las telecomunicaciones
 
Capacidad de un canal
Capacidad de un canalCapacidad de un canal
Capacidad de un canal
 
Códigos
CódigosCódigos
Códigos
 
1 modulación psk
1 modulación psk1 modulación psk
1 modulación psk
 
Tv digital examen
Tv digital examenTv digital examen
Tv digital examen
 
Presentación tema 2 - señales analógicas
Presentación   tema 2 - señales analógicasPresentación   tema 2 - señales analógicas
Presentación tema 2 - señales analógicas
 
4.5 transmision paso_banda
4.5 transmision paso_banda4.5 transmision paso_banda
4.5 transmision paso_banda
 
Modulacion am
Modulacion amModulacion am
Modulacion am
 
4.TDM Multiplexacion por division de tiempo
4.TDM Multiplexacion por division de tiempo4.TDM Multiplexacion por division de tiempo
4.TDM Multiplexacion por division de tiempo
 
TELEVISIÓN DIGITAL
TELEVISIÓNDIGITALTELEVISIÓNDIGITAL
TELEVISIÓN DIGITAL
 
Probabilidad de error en modulación digital
Probabilidad de error en modulación digitalProbabilidad de error en modulación digital
Probabilidad de error en modulación digital
 
Tipos De Modulación
Tipos De ModulaciónTipos De Modulación
Tipos De Modulación
 
Cuantificación
CuantificaciónCuantificación
Cuantificación
 
Modulacion PSK
Modulacion PSKModulacion PSK
Modulacion PSK
 
Capacidad del canal
Capacidad del canalCapacidad del canal
Capacidad del canal
 
Telefonía móvil 2G final
Telefonía móvil 2G finalTelefonía móvil 2G final
Telefonía móvil 2G final
 
Multiplexación tdma fdma cdma
Multiplexación tdma fdma cdmaMultiplexación tdma fdma cdma
Multiplexación tdma fdma cdma
 
Modulación AM
Modulación AMModulación AM
Modulación AM
 
Diagrama del Ojo
Diagrama del OjoDiagrama del Ojo
Diagrama del Ojo
 

Ähnlich wie Compresion de Audio - Telecomunicaciones III

Principios de sonido digital
Principios de sonido digitalPrincipios de sonido digital
Principios de sonido digital
Decaunlz
 
Multimedia sonido (teso chicho-wily- mote)
Multimedia sonido (teso chicho-wily- mote)Multimedia sonido (teso chicho-wily- mote)
Multimedia sonido (teso chicho-wily- mote)
Diego Meneses
 
El sonido y la imagen formatos y exportación
El sonido y la imagen  formatos y exportaciónEl sonido y la imagen  formatos y exportación
El sonido y la imagen formatos y exportación
ireneund
 

Ähnlich wie Compresion de Audio - Telecomunicaciones III (20)

Apuntes audio digital
Apuntes audio digitalApuntes audio digital
Apuntes audio digital
 
David escudero sonido_taller
David escudero sonido_tallerDavid escudero sonido_taller
David escudero sonido_taller
 
Audio Digital
Audio DigitalAudio Digital
Audio Digital
 
Principios de sonido digital
Principios de sonido digitalPrincipios de sonido digital
Principios de sonido digital
 
Multimedia sonido (teso chicho-wily- mote)
Multimedia sonido (teso chicho-wily- mote)Multimedia sonido (teso chicho-wily- mote)
Multimedia sonido (teso chicho-wily- mote)
 
Principios de sonido digital 16 9
Principios de sonido digital 16 9Principios de sonido digital 16 9
Principios de sonido digital 16 9
 
El sonido y la imagen formatos y exportación
El sonido y la imagen  formatos y exportaciónEl sonido y la imagen  formatos y exportación
El sonido y la imagen formatos y exportación
 
AUDIO DIGITAL NUEVATEC-EMA
AUDIO DIGITAL NUEVATEC-EMAAUDIO DIGITAL NUEVATEC-EMA
AUDIO DIGITAL NUEVATEC-EMA
 
Clase 6 audios
Clase 6  audiosClase 6  audios
Clase 6 audios
 
Multimedia audio
Multimedia audioMultimedia audio
Multimedia audio
 
Audio
AudioAudio
Audio
 
Expocicion
ExpocicionExpocicion
Expocicion
 
Semana 17: Compresión de Audio
Semana 17: Compresión de AudioSemana 17: Compresión de Audio
Semana 17: Compresión de Audio
 
Sonido digital
Sonido digitalSonido digital
Sonido digital
 
Sonido Digital
Sonido DigitalSonido Digital
Sonido Digital
 
Sonido Digital
Sonido DigitalSonido Digital
Sonido Digital
 
Sonidooooo
SonidoooooSonidooooo
Sonidooooo
 
Taller de audio
Taller de audioTaller de audio
Taller de audio
 
Iniciacion edicion-audio-digital
Iniciacion edicion-audio-digitalIniciacion edicion-audio-digital
Iniciacion edicion-audio-digital
 
Tema audio
Tema audioTema audio
Tema audio
 

Mehr von Andy Juan Sarango Veliz

Criptología de empleo en el Esquema Nacional de Seguridad
Criptología de empleo en el Esquema Nacional de SeguridadCriptología de empleo en el Esquema Nacional de Seguridad
Criptología de empleo en el Esquema Nacional de Seguridad
Andy Juan Sarango Veliz
 
Alfabetización Informática - 2. Test de Conceptos Básicos
Alfabetización Informática - 2. Test de Conceptos BásicosAlfabetización Informática - 2. Test de Conceptos Básicos
Alfabetización Informática - 2. Test de Conceptos Básicos
Andy Juan Sarango Veliz
 
Software Defined Radio - Capítulo 5: Modulación Digital I
Software Defined Radio - Capítulo 5: Modulación Digital ISoftware Defined Radio - Capítulo 5: Modulación Digital I
Software Defined Radio - Capítulo 5: Modulación Digital I
Andy Juan Sarango Veliz
 
Software Defined Radio - Capítulo 4: Modulación FM
Software Defined Radio - Capítulo 4: Modulación FMSoftware Defined Radio - Capítulo 4: Modulación FM
Software Defined Radio - Capítulo 4: Modulación FM
Andy Juan Sarango Veliz
 
Software Defined Radio - Capítulo 3: Modulación AM
Software Defined Radio - Capítulo 3: Modulación AMSoftware Defined Radio - Capítulo 3: Modulación AM
Software Defined Radio - Capítulo 3: Modulación AM
Andy Juan Sarango Veliz
 
Software Defined Radio - Capítulo 2: GNU Radio Companion
Software Defined Radio - Capítulo 2: GNU Radio CompanionSoftware Defined Radio - Capítulo 2: GNU Radio Companion
Software Defined Radio - Capítulo 2: GNU Radio Companion
Andy Juan Sarango Veliz
 
Software Defined Radio - Capítulo 1: Introducción
Software Defined Radio - Capítulo 1: IntroducciónSoftware Defined Radio - Capítulo 1: Introducción
Software Defined Radio - Capítulo 1: Introducción
Andy Juan Sarango Veliz
 
Los cuatro desafíos de ciberseguridad más críticos de nuestra generación
Los cuatro desafíos de ciberseguridad más críticos de nuestra generaciónLos cuatro desafíos de ciberseguridad más críticos de nuestra generación
Los cuatro desafíos de ciberseguridad más críticos de nuestra generación
Andy Juan Sarango Veliz
 

Mehr von Andy Juan Sarango Veliz (20)

Examen final de CCNA Routing y Switching Academia OW
Examen final de CCNA Routing y Switching  Academia OWExamen final de CCNA Routing y Switching  Academia OW
Examen final de CCNA Routing y Switching Academia OW
 
Criptología de empleo en el Esquema Nacional de Seguridad
Criptología de empleo en el Esquema Nacional de SeguridadCriptología de empleo en el Esquema Nacional de Seguridad
Criptología de empleo en el Esquema Nacional de Seguridad
 
Alfabetización Informática - 3. Navegador Web
Alfabetización Informática - 3. Navegador WebAlfabetización Informática - 3. Navegador Web
Alfabetización Informática - 3. Navegador Web
 
Alfabetización Informática - 2. Test de Conceptos Básicos
Alfabetización Informática - 2. Test de Conceptos BásicosAlfabetización Informática - 2. Test de Conceptos Básicos
Alfabetización Informática - 2. Test de Conceptos Básicos
 
Alfabetización Informática - 1. Conceptos Básicos
Alfabetización Informática - 1. Conceptos BásicosAlfabetización Informática - 1. Conceptos Básicos
Alfabetización Informática - 1. Conceptos Básicos
 
Gestión y Operación de la Ciberseguridad
Gestión y Operación de la CiberseguridadGestión y Operación de la Ciberseguridad
Gestión y Operación de la Ciberseguridad
 
Tecnologías de virtualización y despliegue de servicios
Tecnologías de virtualización y despliegue de serviciosTecnologías de virtualización y despliegue de servicios
Tecnologías de virtualización y despliegue de servicios
 
3. wordpress.org
3. wordpress.org3. wordpress.org
3. wordpress.org
 
2. wordpress.com
2. wordpress.com2. wordpress.com
2. wordpress.com
 
1. Introducción a Wordpress
1. Introducción a Wordpress1. Introducción a Wordpress
1. Introducción a Wordpress
 
Redes de Computadores: Un enfoque descendente 7.° Edición - Capítulo 9
Redes de Computadores: Un enfoque descendente 7.° Edición - Capítulo 9Redes de Computadores: Un enfoque descendente 7.° Edición - Capítulo 9
Redes de Computadores: Un enfoque descendente 7.° Edición - Capítulo 9
 
Análisis e Implementación de una Red "SDN" usando controladores "Open Source"
Análisis e Implementación de una Red "SDN" usando controladores "Open Source"Análisis e Implementación de una Red "SDN" usando controladores "Open Source"
Análisis e Implementación de una Red "SDN" usando controladores "Open Source"
 
Software Defined Radio - Capítulo 5: Modulación Digital I
Software Defined Radio - Capítulo 5: Modulación Digital ISoftware Defined Radio - Capítulo 5: Modulación Digital I
Software Defined Radio - Capítulo 5: Modulación Digital I
 
Software Defined Radio - Capítulo 4: Modulación FM
Software Defined Radio - Capítulo 4: Modulación FMSoftware Defined Radio - Capítulo 4: Modulación FM
Software Defined Radio - Capítulo 4: Modulación FM
 
Software Defined Radio - Capítulo 3: Modulación AM
Software Defined Radio - Capítulo 3: Modulación AMSoftware Defined Radio - Capítulo 3: Modulación AM
Software Defined Radio - Capítulo 3: Modulación AM
 
Software Defined Radio - Capítulo 2: GNU Radio Companion
Software Defined Radio - Capítulo 2: GNU Radio CompanionSoftware Defined Radio - Capítulo 2: GNU Radio Companion
Software Defined Radio - Capítulo 2: GNU Radio Companion
 
Software Defined Radio - Capítulo 1: Introducción
Software Defined Radio - Capítulo 1: IntroducciónSoftware Defined Radio - Capítulo 1: Introducción
Software Defined Radio - Capítulo 1: Introducción
 
MAE-RAV-ROS Introducción a Ruteo Avanzado con MikroTik RouterOS v6.42.5.01
MAE-RAV-ROS Introducción a Ruteo Avanzado con MikroTik RouterOS v6.42.5.01MAE-RAV-ROS Introducción a Ruteo Avanzado con MikroTik RouterOS v6.42.5.01
MAE-RAV-ROS Introducción a Ruteo Avanzado con MikroTik RouterOS v6.42.5.01
 
Los cuatro desafíos de ciberseguridad más críticos de nuestra generación
Los cuatro desafíos de ciberseguridad más críticos de nuestra generaciónLos cuatro desafíos de ciberseguridad más críticos de nuestra generación
Los cuatro desafíos de ciberseguridad más críticos de nuestra generación
 
ITIL Foundation ITIL 4 Edition
ITIL Foundation ITIL 4 EditionITIL Foundation ITIL 4 Edition
ITIL Foundation ITIL 4 Edition
 

Kürzlich hochgeladen

EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
FagnerLisboa3
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
AnnimoUno1
 

Kürzlich hochgeladen (15)

Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
presentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptxpresentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptx
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Presentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmerilPresentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmeril
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 

Compresion de Audio - Telecomunicaciones III

  • 2. OBJETIVOS ¿Que logramos? Almacenamiento Eficiente Usar el Streaming (Se refiere a ver u oír un archivo directamente en una página web sin necesidad de descargarlo antes al ordenador) Aplicaciones Multimedia Interactivas
  • 3. Objetivos de la Compresión Reduccion del Ancho de banda. Lograr que las señales decodificadas suenen tan parecidas al original como sea posible Complejidad de la Implementación lo mas pequeña posible. Robusta y Escalable
  • 4. ¿Como se hace? La compresión de audio se hace por medios de algoritmos Para lograr una mejor reducción de archivo se utiliza una técnica conocida como PNS (Norma de Percepción de Ruido) que aprovechan características del oído humano para ser la compresión . La compresión de audio se hace por medios de algoritmos
  • 5. Clases de compresión de audio  Se tienen basicamente 02 clases: a) Lossless (Sin Perdidas) Son formatos que no pierden claridad ni calidad al comprimirse, pero que ocupan una mayor cantidad de espacio en el disco duro. Usos: Técnicos de sonidos y entusiastas de la calidad Algunos Tipos: Free Lossless Audio Codec (FLAC), Monkey's Audio (APE) y True Audio (TTA).
  • 6. b) Lossy (Con Perdidas) Engloba a aquellos formatos que (al comprimir el audio) sacrifican algo de calidad Ocupan poco espacio en el disco. Usos: Publico en general. Tipos: El formato MPC, OGG, WMA o el MP3 Formato de compresión de audio
  • 7. Técnicas de Compresión Voc File Compression (Elimina los silencios, parecido al RLE) Linear Predictive Coding (Usado en discursos, compara el discurso contra un modelo analítico del tracto vocal: cavidades faríngea oral y nasal) Compresión Ley µ y Ley A (Codific. Logaritmica usados en Telefonía como: PCM, DPCM o ADPCM)
  • 8. Psicoacústica  Estudia la percepcion subjetiva de las cualidades (características) del SONIDO:  Intensidad, Tono y Timbre.  Esto se puede aprovechar, debido a a la “Sensibilidad del Oido Humano”.  La percepción acústica humana esta determinada x dos dimensiones: frecuencia e intensidad.  El oído humano es capaz de percibir frecuencias en el rango de los 20 Hz hasta los 20 KHz.
  • 9. Codificación Perceptual En cuanto a la intensidad, los humanos perciben un rango dinámico en torno a los 120 dB. Sonidos de intensidad superior a los 90 dB. pueden provocar daños irreversibles.
  • 10. Características del sonido La intensidad de un sonido depende de la amplitud de onda. Para la medición de las intensidades de un sonido, se usa una escala logarítmica (decibelios) Donde: W exist. es la amplitud del sonido que se está midiendo y W ref es la amplitud de referencia (la del sonido con el cual se compara). En cuanto a la intensidad, los humanos perciben un rango dinámico en torno a los 120 dB. Sonidos de intensidad superior a los 90 dB. pueden provocar daños irreversibles. La intensidad
  • 11. Características del sonido Las intensidades de los sonidos que podemos percibir tienen un rango de más de 15 órdenes de magnitud. La Amplitud de Referencia (aref ) es: 10 -12 Watts/m2 Por ejemplo tenemos: La intensidad Fuentes de Sonido Presión de sonido  Nivel  dB SPL Intensidad de Sonido  W / m 2  Dentro de una casa en una zona residencial a las 02:00 a.m. 30.0 10 -9 Watts/m2 Una Aspiradora, a 1.0 metro 70.0 10 -5 Watts/m2 Un Mega Concierto, a 10.0 metros de los parlantes (Umbral del Dolor) 130.0 10 Watts/m2
  • 12. Características del sonido El timbre es el espectro de frecuencias del sonido y este permite distinguir, por ejm: el sonido de un piano y de una trompeta con igual duración, intensidad y tono. Gráficamente, el timbre se caracteriza por la forma de la onda. Las ondas sinusoidales puras sólo se obtienen electrónicamente, pero en la naturaleza, los sonidos son más complejos. La frecuencia de vibración más grave (frecuencia base) es la que determina el periodo y la amplitud. Las restantes frecuencias, que suelen ser múltiplos de la frecuencia base, son los armónicos. El timbre
  • 13. Psicoacústica Proceso por el cual se aprovecha las “Imperfecciones” del oido Humano. El objetivo eliminar informacion intracendente.
  • 14. Psicoacústica  El objetivo es eliminar partes irrelevantes de la señal de audio.  El sistema auditivo humano es incapaz de escuchar el ruido de cuantificación bajo condiciones de enmascaramiento auditivo.  El enmascaramiento ocurre siempre que una señal fuerte envuelve a una vecindad de señales de audio mas débiles imperceptibles.
  • 15. Tolerancia al ruido de Enmascaramiento  La capacidad de resolución del oído humano es funcion de la frecuencia.  La tolerancia al ruido de enmascaramiento, depende de la energía de la señal en una vecindad a esa frecuencia. Señal Tonal Intensa Region donde las otras señales son enmascaradas A M P L I T U D FRECUENCIA
  • 16. Ruido de Enmascaramiento  Analiza la señal de audio y calcula la cobertura del ruido de enmascaramiento como una función de la frecuencia.  El codificador decide la mejor manera de representar la señal de entrada con un mínimo número de bits.
  • 17. El Umbral de Audicion  Los receptores de sonido, tienen un comportamiento que varía con la frecuencia. En el caso del oído humano, sucede lo mismo, ya que se trata el receptor más complicado y eficiente que existe.  El umbral de audición define la mínima presión requerida para excitar el oído.
  • 18. El Umbral de Audicion  El Umbral de Audición, para la media de los humanos, se fija en 20 µPa (20 micro pascales = 0.000002 pascales), para... frecuencias entre 2KHz y 4KHz. Por encima y por debajo de estas frecuencias, la presión requerida para excitar el oído es mayor.
  • 19. El Umbral de Audicion  El siguiente grafico muestra el Umbral de audicion.
  • 20. El banco de filtros híbrido  Empleado desde los 80s – Bell Labs.  Divide la señal de audio (tipicamente) en 32 sub-bandas de frecuencia de anchos de banda pequeños.  Los filtros brindan un corte muy definido (aprox. 100 dB/Octava).  Esto limitara el ruido de cuantizacion.  Cada banda se codificara independientemente.
  • 21. El banco de filtros híbrido Todas las sub-bandas se muestrean por separado. Sub-banda 0 Sub-banda 1 Sub-banda 2 Sub-banda 31
  • 22. Pasos básicos  Para conseguir las sub-bandas:  Se convierte el audio a una representacion en el dominio de la frecuencia.  Se procesan los valores espectrales en sus componentes tonales y no tonales.  Se Aplica una función de dispersión.  Definir una cota inferior para las tolerancias.  Se definen estas tolerancias para cada sub- banda.
  • 23. Esquema de Codificacion Perceptual Modelo Psico acústico Analizador del banco de filtros (Se separa en sub bandas) … …... 1 3 2 N Cuantizador Codificaciones independientes Audio IN Sintetizador del banco De filtros Audio OUT Empleo de menos bits en la transmisión
  • 24. Formatos de audio mas comunes  MPEG Moving Pictures Experts Group  ADVANCED AUDIO CODING (Codificacion de Audio Avanzada)  WAV  Desarrollado por Microsoft . Grabación por Cd’s.  AU(audio for unix)  WMA(Windows media audio)  MIDI  para la industria de la música electrónica Lo utiliza apple para los archivos de audio q reproduce Ipod
  • 25. MPEG  Moving Picture Experts Group Parte de un estándard múltiple para:  Compresión de video  Compresión de audio  Sincronización de Audio, Video y Data para un bit rate total de 1.5 Mbit/sec
  • 26. Compresión de Audio MPEG1  A nivel físico, presenta pérdidas.  A nivel perceptual sin pérdidas, algoritmo transparente.  Explota propiedades perceptuales del oído humano.  Modelamiento Psicoacústico.  MPEG Audio Standard asegura interoperabilidad define una sintaxis codificada de bit stream, define el proceso de decodificación y asegura la precisión del decodificador.
  • 27. Características del Audio MPEG1  Eliminación de partes perceptualmente irrelevantes de la señal de audio.  Tasas de muestreo de: 32, 44.1 and 48 kHz (Muestras de hasta 16 bits).  Ofrece la eleccion de 3 capas independientes.  Opcionalmente, deteccion de error mediante Cyclic Redundancy Check (CRC).  Las 3 capas permiten la implementacion del decoder (tiempo real) en un solo chip.
  • 28. Características del Audio MPEG1  Información adicional puede ser incluida en el bit stream.  Características como: acceso aleatorio, avance rápido y avance en reversa son posibles.  Cuantificación, la clave para la codificacion de audio en MPEG.  Compresiones de audio fieles al original con ratios como de 6 a 1.
  • 29.
  • 30. MPEG1 Audio - Capa I  Es la codificación mas sencilla.  Bit rates predefinidos en 32 a 448 kbps por canal.  Cada frame contiene una cabecera, opcionalmente bits de chequeo de error (CRC) y posiblemente información adicional.  Ejemplo: Philips Digital Compact Cassette
  • 31. MPEG1 Audio – Capa II  Complejidad Intermedia  Bit rates predefinidos en 32 a 384 kbps por canal.  Digital Audio Broadcasting (DAB)  Video y audio sincronizado en CD-ROM.  Crea frames de 1152 muestras por canal de audio.
  • 32. MPEG1 Audio - Capa III: MP3  Basado en los bancos de filtros híbridos de las capas I y II .  Codificación (Entropica) mas compleja.  La mejor calidad de sonido.  Bit rates predefinidos en 32 a 320 kbps por canal.  Adecuado para transmisión de audio a través de RDSI.  Norma ISO/IEC 11172Norma ISO/IEC 11172
  • 33. MPEG1 Audio Capa III (MP3)
  • 34. Mejoras de la capa III: MP3  Reducción del Alias. (Codific. Huffman)  Elimina mas redundancia.  Cuantificación no uniforme.  Optimizacion de factores de escala por c/u de las sub-bandas.  Uso de un “reservorio” de bits.
  • 35. Características por nivel para el MPEG-1. CAPA FRECUENCIAS DE MUESTREO TASA DE BITS (Kbps) Capa I 32, 44.1 y 48 KHz De 32 a 448 Capa II De 32 a 384 Capa III De 32 a 320
  • 36. Mejoras de la capa III: MP3  Reducción del Alias. (Codific. Huffman)  El archivo de audio de un CD, usa:  Frecuencia muestreo: 44.1 KHz,  Codificación: 16 bits,  Modo: estéreo Calculando se tendrá: 1,411,200 bits/s
  • 37. MPEG en el futuro  MPEG-1: Video CD and MP3.  MPEG-2: Televisión Digital y DVD  MPEG-4: Web(fija y móvil)  MPEG-7: descripción y búsqueda de contenido de audio y visual.  MPEG-21: Multimedia Framework
  • 38. OTROS FORMATOS DE AUDIO MÁS COMUNES Esta es una descripcion de algunos formatos de compresión de audio los más usados hoy en día, sus ventajas, extensiones y principales usos
  • 39. ANTECEDENTES: WAV Extensión: wav Desarrollado por Microsoft e IBM – 1995. Es el archivo digital del sonido sin comprimir. Es 10 a 12 veces mas pesado que el MP3. Es un estándar para música en CD’s. Funciona en cualquier aplicación Windows y en equipos domésticos comunes con reproductor de CD´s.
  • 40. ADVANCED AUDIO CODING (Codificacion de Audio Avanzada) Extensión: .aacExtensión: .aac Codificación estándar para audio reconocida por ISO solo en el patrón MPEG-2. Es mas eficiente que el MP3 en el mismo espacio (Con igual bitrate). Ocupa menos espacio que el MP3. (Aproximadamente el 70 %) No es compatible con el MPEG-1.
  • 41. ADVANCED AUDIO CODING (Codificacion de Audio Avanzada)  Este formato de Audio lo utiliza Apple para los archivos de audio y que pueden comprarse a través de Internet.  También es empleado en el estándar ISDB-T  Frecuencia de muestreo: 16 KHz, 22.05 KHz , 24 KHz.  Máxima calidad entre 320 y 384 Kbps (5 canales) a diferencia del MP3 (solo Stereo).
  • 42. Diagrama de bloques del AAC en MPEG-2 ADVANCED AUDIO CODING (Codificacion de Audio Avanzada)
  • 43. Extensión: .ac3Extensión: .ac3 Recibe un streaming de los 06 canales codificados en PCM (Que emplea 9 bits por muestra y los muestrea a 48 KHz) para comprimirlos a 384 Kbps. Es muy popular y muy eficiente, usa 05 canales + un sexto canal exclusivo para las bajas frecuencias (120 Hz o menos). Es empleado en los sistemas ATSC. AC-3 (DOLBY DIGITAL)
  • 44. AUDIO AC3: El Dolby Digital 5.1, llamado técnicamente AC3. Nació en los años 90, incorpora 5 o seis canales independientes de sonido. Cada canal es independiente para cada altavoz y reproduce todo tipo de frecuencias, menos el 6to, que solo se encarga de las más bajas
  • 45. AU (Audio for Unix) Extensión: au Para archivos de sonido con S.O. Unix de Sun y de NeXT. Basado en técnicas PCM y luego en ADPCM. Estándar acústico para el lenguaje JAVA.
  • 46. WMA (Windows Media Audio) Extensión: wma Versión de Windows para comprimir Audio, muy parecido a MP3. Se adapta a diferentes velocidades de conexión (Cuando se necesite reproducir en Internet en Tiempo Real).
  • 47. MIDI (Musical Instrument Digital Interface).  Extensión: midi  Es un protocolo de communicacion de datos  Estándar en la INDUSTRIA de la música ELECTRONICA.  Muy útil cuando se usan sintetizadores musicales ó tarjetas de Sonido.  Los sintetizadores analógicos y que fueron construidos antes del MIDI, pueden ser acondicionados para convertir los mensajes MIDI a voltajes de control analógicos.
  • 48. MIDI  Extensión: midi  Por el tamaño resultante que ofrece su compresión, este formato es muy usado para dispositivos y/o reproductores que necesitan combinar archivos de audio y video, como los karaoke. (Otros como el: teclado, bateria, guitarra, flauta, ...).  Permite intercambiar datos entre diversos equipos musicales.
  • 49. OGG VORBIS Extensión: ogg También se utiliza para guardar y reproducir música digital. Se diferencia del resto de grupo por que es libre, abierto y no esta patentado. Su principal atractivo es la importante reducción que hace de un archivo de audio manteniendo una alta calidad.
  • 50. OGG VORBIS Extensión: ogg Gran versatilidad para reproducirse en cualquier dispositivo y por ocupar muy poco espacio (Menor respecto al MP3). Adecuado para enviar musica via internet por streaming, a diferencia del MP3. Tipo lossless, comparable con el AAC.
  • 51. ATRAC (Adaptive TRansform Acoustic Coding)  Este formato se utiliza en tecnología (de grabación de disco magneto- óptico) de compresión y reproducción para minidisc.  Desarrollado por SONY (Discos de 64 mm).  Codifican el sonido, a unas tasas de datos del orden del 10% de lo requerido en un CD.
  • 52. ATRAC (Adaptive TRansform Acoustic Coding)  Divide la señal en tres partes o bandas: a) Menor a 5,5 kHz b) Entre 5,5 y 11 kHz c) Mayor a 11 kHz Este sistema multicanal utiliza 8 canales codificados mediante esta codificación, obteniendo un bitrate global (de todos los canales) de 1168 kbit/s.
  • 54. ATRAC 3 (Nueva versión de ATRAC) • Divide la señal en 04 canales: a) Inferior a 2.76 kHz b) De 2.76 a 5.51 kHz c) De 5.51 a 11.025 kHz d) Superior a 11.025 kHz dentro de las audiofrecuencias Tiene una calidad similar al AC-3. Se emplea en el sector de audio y algunos dispositivos portátiles como PDA, y en teléfonos inteligentes.
  • 55. El puntaje de opinión significativo (MOS) es un método directo de la evaluación de la calidad de voz muy ampliamente usado. La prueba MOS concierne solamente al resultado de la experiencia del usuario, por lo tanto se llama a los usuarios para la evaluación. Mean Opinion Score
  • 56. Mean Opinion Score Escala de Calificación Puntuación Escala de Esfuerzo para escuchar Excelente (Excellent) 5 No se requiere esfuerzo Bueno (Good) 4 No se requiere esfuerzo apreciable Regular (fair) 3 Se requiere poco esfuerzo Pobre (Poor) 2 Se requiere considerable esfuerzo Malo (Bad) 1 No se entiende aun con un considerable esfuerzo
  • 57. 57 Resumen de algunos formatos de audio digital Telefonía3218ADPCM (G.721) Hi-Fi Internet Hi-Fi Internet Audio Hi-Fi Telefonía GSM Telefonía Internet Telefonía/Videoc. Telefonía Telefonía Telefonía Internet Vídeoconferenc. Telefonía Uso 705,6/768244,1/48CD-DA / DAT 192-256 variable232/44,1/48MPEG-1 Layer I 96-128 variable232/44,1/48MPEG-1 Layer II 64 variable232/44,1/48MPEG-1 Layer III (MP3) 32-44 variable5.132/44,1/48MPEG-2 AAC 2,418LPC-10E (FS 1015) 4,818CELP (FS 1016) 13,218RPE-LTP (GSM 06.10) 818CS-ACELP (G.729) 1618LD-CELP (G.728) 16/24/32/4018E-ADPCM (G.727) 16/24/32/4018ADPCM (G.726) 6,3/5,3 variable18MP-MLQ (G.723.1) 48/56/64116SB-ADPCM (G.722) 6418PCM (G.711) Caudal por canal (Kb/s) CanalesFrec. Muestreo (KHz) Formato Elevado Retardo (ISO) Bajo Retardo (ITU-T)

Hinweis der Redaktion

  1. Generalmente cualquier técnica de compresión de audio introduce una cierta merma de calidad respecto al audio no comprimido, aunque en algunos casos dicha merma es difícilmente perceptible. En general a mayor compresión menor calidad. Los diferentes algoritmos de compresión difieren también en su complejidad de cálculo; en general para un mismo caudal las técnicas más complejas obtienen una mayor calidad a costa de emplear más CPU. La mayoría de las técnicas de compresión de audio han sido estandarizadas por la ITU-T en las normas de telefonía G.7xx. La comunicación telefónica es muy sensible a los retardos y al jitter. Los algoritmos de compresión diseñados para telefonía deben introducir un retardo muy pequeño ya que de lo contrario se pierde interactividad y aparecen problemas de ecos y baja calidad del sonido. Esta restricción limita las posibilidades de los algoritmos empleados en los estándares de telefonía. Existen otros algoritmos de compresión de audio que al no contar con esta restricción permiten unas tasas de compresión más elevadas ya que pueden analizar muestras de audio más extensas y emplear un mayor tiempo en su análisis, introduciendo por tanto mayor retardo y jitter. Estos son los algoritmos de audio que forman parte de los estándares MPEG, estandarizados por ISO. Con caudales comparables a los de la telefonía los algoritmos MPEG ofrecen calidades comparables al compact disc. En algunos casos la compresión puede no hacerse en tiempo real y puede ser muy asimétrica. La descompresión siempre ha de hacerse evidentemente en tiempo real.