Canal de comunicación y caos

Aplicación de secuencias caóticas a la identificación del canal
de comunicación
David Arroyo Guardeño
Índice
Índice 1
1. Introducción 2
2. Filtros de Wiener 2
3. Identificación del canal de comunicación v´ıa algoritmo LMS 3
3.1. Algoritmo LMS: formulación y análisis de su estabilidad y convergencia . . . . . . 3
3.2. Aplicación del algoritmo LMS al problema de la identificación del canal de comuni-
cación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3. Codificación caótica de señales de voz . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.4. Identificación ciega del canal de comunicación: algoritmo DBD (Dynamic Based
Deconvolution) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4. Simulaciones y conclusiones 10
4.1. Test del algoritmo LMS con codificación caótica para diferentes valores del parámetro
µ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.1.1. Verificación de las prestaciones de la codificación caótica . . . . . . . . . . . 11
4.1.2. Decisión valor de µ óptimo para el caso de señales de voz codificadas mediante
señales caóticas de media cero: µ constante . . . . . . . . . . . . . . . . . . 11
señales caóticas de media cero: esquema estocástico de iteración . . . . . . . 12
señales caóticas de media cero: esquema búsqueda-convergencia . . . . . . . 12
4.1.5. Decisión entre los tres valores óptimos obtenidos . . . . . . . . . . . . . . . 13
4.2. Test del algoritmo DBD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.2.1. Tasa de aprendizaje constante . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.3. Esquema estocástico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4. Esquema búsqueda-convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.5. Decisión entre los tres valores óptimos . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.6. Test de los algoritmos LMS y DBD en presencia de ruido . . . . . . . . . . . . . . 16
Referencias 18
1

1. Introducción
El objetivo será desarrollar un método para codificar mediante caos las señales de voz, con el
objeto de mejorar las prestaciones del algoritmo LMS (Least Mean Square) a la hora de llevar a
cabo una identificación del canal de comunicación([1]). Asimismo se presenta también un segundo
método basado en el algoritmo DBD -Dynamic Based Deconvolution- ([2],[3]), con el que se lle-
vará a cabo una identificación ciega del canal. Se comenzará presentando someramente los filtros
de Wiener, tanto en cuanto el algoritmo LMS trata de aproximar tal filtro con el propósito de
implementar una realización on-line. Hecha tal presentación, se desarrolla la teor´ıa vinculada con
el algoritmo LMS, especialmente aquellos aspectos de la misma relacionados con la estabilidad y
convergencia del método, ya que son estos factores los que justifican la utilización de la codifi-
cación caótica de señales de voz. Por último, se desarrolla un método que en lugar de partir del
conocimiento de la señal enviada, aprovecha el conocimiento que se tiene respecto de la dinámi-
ca de aquella. Tal método es el DBD, el cual permite llevar a cabo la labor que aqu´ı nos ocupa
sin necesidad de conocer la señal que se env´ıo originalmente y, por ello, se dice que realiza una
identificación ciega del canal.
2. Filtros de Wiener
Esta sección pretende mostrar aquellos aspectos de los filtros de Wiener de interés para el
posterior trabajo. Es decir, la descripción aqu´ı propuesta no es más que una introducción, siendo
recomendable consultar [4] en caso de desear un mayor grado de detalle. Hecha esta primera
puntualización, el análisis comienza presentando el esquema a seguir (Figura 1).
e(n)
d(n)
x(n) Filtro de Wiener
W(z)
Figura 1: Esquema diseño de un filtro de Wiener
El objetivo es minimizar el ´ındice J = E [e(n)e∗
(n)], donde e(n) representa la diferencia entre la
señal deseada -d(n)- y la señal estimada por el filtro de Wiener -dest(n)-. Aquel filtro que minimiza
tal ´ındice se dice que es un filtro óptimo de Wiener. Para lograr el m´ınimo valor posible de J
habr´ıa que trabajar con un filtro IIR no causal, lo cual es muy complejo en la práctica. Es decir,
la solución teórica del problema no es satisfactoria para nuestros intereses, por lo que es preferible
imponer restricciones al filtro a diseñar, de modo que finalmente se desarrollará un método que
lleva a cabo la implementación del filtro de Wiener como un filtro FIR causal (1),
W(z) =
M−1
n=0
wnz−n
, (1)
con lo que la señal estimada por el filtro vendrá dada por (2), mientras que (3) define el ´ındice a
minimizar.
dest(n) =
M−1
i=0
wix(n − i), (2)
J = E | e(n) |2
= E | d(n) − dest(n) |2
. (3)
Dado que se desea minimizar (3), la siguiente operación será diferenciar (3) con respecto a los
coeficientes del filtro a diseñar e igualar a cero. Este proceso lleva a (4), que concreta el principio
de ortogonalidad o teorema de la proyección sobre el cual se construye el filtro de Wiener.
∂J
∂wk
= E 2e(n)
∂e(n)
∂wk
= 0 ⇒ E [e(n)x(n − k)]
e(n) = d(n) −
M−1
i=0
wix(n − i) ⇒
∂e(n)
∂wk
= −x(n − k). (4)
2

En efecto, si expresamos el error e(n) como la diferencia entre la señal deseada y la señal estimada
por el filtro, (4) desemboca en (5):
E d(n) −
M−1
i=0
wix(n − i) x(n − k) = E [d(n)x(n − k)] −
M−1
i=0
wiE [x(n − i)x(n − k)] = 0
rdx(k) −
M−1
i=0
wirx(k − i) = 0, (5)
expresión que, asumiendo d(n) y x(n) son procesos estacionarios en sentido amplio, lleva finalmente
a la conocida como ecuación de Wiener-Hopf (6).
M−1
i=0
wirx(k − i) = rdx(k). (6)
Esta ecuación puede ser expresada matricialmente (7) de forma muy simple asumiendo que x(n)
es un proceso real, lo cual implica que la función de auto-correlación (rx(k) = E [x(n)x(n − k)])
para x(n) es simétrica par respecto del origen (rx(k) = rx(−k)).








rx(0) rx(1) rx(2) · · · rx(M − 1)
rx(1) rx(0) rx(1) · · · rx(M − 2)
...
...
...
...
...
rx(M − 2)
...
...
... rx(1)
rx(M − 1) · · · rx(2) rx(1) rx(0)








⇓
Rx







w0
w1
w2
...
wM−1







⇓
W
=







rdx(0)
rdx(1)
rdx(2)
...
rdx(M − 1)







⇓
rdx
(7)
Es decir, los coeficientes del filtro de Wiener vendrán dados por:
W = R−1
x rdx. (8)
3. Identificación del canal de comunicación v´ıa algoritmo
LMS
3.1. Algoritmo LMS: formulación y análisis de su estabilidad y conver-
gencia
Dado que la solución aportada en el apartado anterior constituye aquella para la cual el ´ındice
J es el m´ınimo posible, cuando el filtro es FIR y causal, parece lógico pensar que el diseño o
búsqueda de un método alternativo no tiene sentido. Sin embargo, la obtención de los coeficientes
del filtro a partir de la ecuación de Wiener-Hopf lleva asociada una gran carga computacional,
tanto en cuanto implica la inversión de la matrix Rx, operación que, desde el punto de vista
computacional, es compleja y cada vez más compleja a medida que crece el número de coeficientes
del filtro a diseñar, ya que dicha matriz suele estar mal condicionada. Por otro lado, a la hora
de obtener la ecuación de Wiener-Hopf se asumió que los procesos aleatorios involucrados eran de
carácter estacionario en sentido amplio. Ahora bien, a la hora de tratar con señales prácticas reales,
como las señales de voz, nos encontramos con que tal hipótesis no es aplicable. En el caso de las
señales de voz se puede pensar en la posibilidad de segmentar la señal de voz, de modo que cada
uno de los segmentos resultantes permitan ser considerados como procesos aleatorios estacionarios
en sentido amplio. No obstante, tal segmentación no es recomendable en general, ya que puede
que los estad´ısticos asociados a la señal original cambien muy rápidamente, factor que obligar´ıa
a disminuir el tamaño de los distintos segmentos (con lo que aumenta el número de segmentos),
circunstancia que puede alterar considerablemente las caracter´ısticas espectrales del proceso. En
definitiva, parece más conveniente plantear un esquema alternativo al sintetizado en la ecuación de
Wiener-Hopf (6), de modo que se llegue a un nuevo método que nos lleva a una solución aceptable
(pero no óptima), y haga posible trabajar con procesos de carácter no estacionario, determinando
los coeficientes del filtro a diseñar on-line y evitando posibles dificultades algebraicas semejantes a
las previamente citadas. El método a desarrollar va a implementar un filtro adaptativo, es decir,
los parámetros libres del filtro se van a adaptar a las variaciones que experimentan los estad´ısticos
3

de las señales que constituyen el medio con el que se va a trabajar. En el caso particular que nos
ocupa, el esquema a seguir aparece en la siguiente figura (Figura 2).
x(n)
e(n)
d(n)
Filtro transversal
Wn
Mecanismo de control
adaptativo de los pesos del filtro
Figura 2: Esquema del algoritmo LMS
El algoritmo LMS se construye a partir de los valores instantáneos de la función de coste o de
penalización:
J(n) = 1/2e2
(n). (9)
La derivada de dicho ´ındice con respecto a los pesos del filtro adaptativo a crear es
∂J(n)
∂W
= e(n)
∂e(n)
∂W
. (10)
El error en cada instante viene dado por
e(n) = d(n) − xT
(n)W(n), (11)
donde (x)(n) = [x(n) x(n − 1) . . . x(n − M + 1)]T
y W(n) = [w0(n)w1(n) . . . wM−1(n)]T
. En
consecuencia, se tiene que
∂J(n)
∂W
= −x(n)e(n), (12)
expresión que constituye una estimación del gradiente de la función de coste. Dicho gradiente deter-
mina un vector cuya dirección indica la dirección en la que J(n) experimenta un mayor crecimiento.
Dado que nuestro objetivo es minimizar J(n), el algoritmo LMS va a actualizar los valores de los
coeficientes del filtro haciendo que en cada instante estos se desplacen una cierta cantidad en la
dirección opuesta a la indicada por (12). De forma anal´ıtica esta idea queda concretada en
W(n + 1) = W(n) + µx(n)e(n), (13)
donde µ es la tasa de aprendizaje. Dado que se lleva a cabo una realimentación de los pesos
(es decir, para calcular los pesos en el instante n + 1 se precisan los pesos en el instante n), el
algoritmo LMS sintetiza un filtro paso bajo en el sentido que tiende a atenuar las componentes
de alta frecuencia del error dejando pasar las de baja frecuencia. Con el objeto de resaltar tal
comportamiento se presenta en la figura 3 el diagrama de flujo asociado al algoritmo LMS, el cual
se obtiene expresando (13) como
W(n + 1) = W(n) + µx(n)[d(n) − xT
(n)W(n)] = [I − µx(n)xT
(n)]WT
(n) + µx(n)d(n), (14)
siendo I la matriz identidad, y teniendo en cuenta que
W(n) = z−1
[W(n + 1)], (15)
donde z−1
es el operador retraso unidad, que lleva ´ımplicito el almacenamiento de valores previos
de pesos.
A la vista del diagrama de flujo, se concluye que µ representa la inversa de la constante de
tiempo asociada al filtrado previamente reseñado, es decir, pequeños valores de µ implican un
proceso adaptativo lento, lo cual implica que una mayor cantidad de la información pasada es
“recordada” por el algoritmo LMS, efecto que en última instancia se traduce en un filtrado de
4

µx(n)d(n)
µx(n)xT
(n)
W(n)
W(n+1)
z-1
I
Figura 3: Actualización de pesos según el algoritmo LMS
mayor precisión. En otras palabras, la inversa de la tasa de aprendizaje es una medida de la
memoria del algoritmo LMS.
La siguiente labor consiste en analizar la convergencia, as´ı como la estabilidad del algoritmo
LMS. Sin embargo, antes de emprender tal tarea es necesario realizar una serie de aclaraciones
respecto del modo en que se actualizan los pesos del filtro objeto de diseño. Dicha actualización
quedó plasmada en (13) y provoca que el vector de pesos W(n) no siga una trayectoria definida en
el espacio de pesos, sino que dicha trayectoria es aleatoria, por lo que se dice que la aproximación
que aqu´ı se realiza del gradiente es de carácter estocástico. A medida que el número de iteraciones
se aproxima al infinito, el algoritmo LMS hace que los pesos calculados mediante (13) definan
una trayectoria aleatoria entorno a la solución de Wiener (Wopt). Pero lo más importante aqu´ı es
que esta aproximación a la solución óptima del problema se realiza sin necesidad de conocer los
estad´ısticos asociados a las señales involucradas. Hechas las oportunas aclaraciones, se emprende
el análisis de la convergencia del algoritmo LMS. De teor´ıa de control se sabe que la estabilidad
de un sistema realimentado está determinada por los parámetros involucrados en el bucle de real-
imentación. Si observamos la figura 3, se comprueba que es el bucle de realimentación inferior el
que permite controlar la convergencia del sistema, tanto en cuanto el bucle superior no presenta
parámetro ajustable alguno. Dos son los elementos que participan en el bucle de realimentación
inferior y que, por consiguiente, definen la transmitancia de dicho bucle: la tasa de aprendizaje µ y
el vector de entradas x(n). Es decir, la convergencia del algoritmo LMS vendrá condicionada tanto
por caracter´ısticas estad´ısticas de la entrada como por el parámetro µ, siendo este último el único
factor controlable para un entorno de trabajo dado. En consecuencia, el objetivo es determinar
aquellos valores de µ que aseguran una buena convergencia. Ahora bien, para hallar tales valores
se ha de decidir cual ha de ser el criterio de convergencia a exigir. Dos son las posibilidades:
Convergencia en media: E[W(n)] → Wopt cuando n → ∞. Este criterio de convergencia no
es de carácter práctico tanto en cuanto cualquier secuencia aleatoria de vectores de media
cero converge en este sentido.
Convergencia en media cuadrática: E[e2
(n)] → valor constante cuando n → ∞. Este es el
verdadero criterio de carácter práctico. El problema es que un análisis en profundidad de la
convergencia del algoritmo LMS en este sentido, encierra una gran complejidad, con lo que
nos vemos abocados a realizar las siguientes hipótesis (teor´ıa de la independencia: Widrow y
otros,1976):
• Las sucesivos vectores de entradas x(1), x(2) . . . son estad´ısticamente independientes.
• Para el instante de tiempo n el vector de entradas x(n) es independiente de todas las
muestras anteriores de respuesta deseada del sistema, esto es, d(1), d(2) . . . , d(n − 1).
• Para el instante de tiempo n la respuesta deseada d(n) es estad´ısticamente independiente
respecto x(n) y respecto de los valores anteriores de la respuesta deseada.
• El vector de entradas x(n) y la respuesta deseada d(n) presentan una función de dis-
tribución gaussiana.
Estas hipótesis permiten expresar la matriz de correlaciones de entradas como Rx = x(n)xT
(n) y
el vector de correlaciones entre entradas y respuestas deseadas como rdx = x(n)d(n). Asimismo
aquellas hipótesis implican que, cuando n tiende a infinito, la solución dada por el algoritmo LMS
5

tiende a la óptima, es decir, la solución dada por Wiener (Wopt). Por tanto, (13) ahora queda como
Wn+1 = (I − µRx)Wn + µrdx, (16)
expresión que, restando en ambos lados la solución óptima de Wiener y con el cambio de variable
Dn = Wn − Wopt, da lugar a
Dn+1 = (I − µRx)Dn. (17)
Por otro lado, la matriz de correlaciones de entradas puede ser descompuesta mediante una
descomposición SVD de modo que
Rx = V Λ V T
, (18)
donde los autovectores que constituyen la matriz V forma una base ortonormal (es decir, V V T
=
I). Como resultado de esto obtenemos
Dn+1 = V (I − µΛ)V T
Dn, (19)
que multiplicando por la izquierda a ambos lados de la igualdad, y haciendo vn = V T
Dn, permite
expresar
vn+1 = (I − µΛ)vn. (20)
Dado que la matriz Λ es diagonal (con elementos iguales a los autovalores de la matriz de correla-
ciones de las entradas), podemos decir que
vn(k) = (1 − µλk)vn(k). (21)
Tras n iteraciones a partir de un cierto valor inicial v0(k), nos queda
vn(k) = (1 − µλk)n
v0(k). (22)
Por tanto el sistema converge siempre que para todo k se cumpla que
| 1 − µλk | < 1. (23)
De este modo, la convergencia del sistema exige la siguiente condición con respecto a la tasa o
parámetro de aprendizaje:
0 < µ <
2
λmax
, (24)
siendo λmax el mayor autovalor de la matriz de correlaciones Rx. Ahora bien, dicho autovalor no
siempre se puede determinar, por lo que, teniendo en cuenta que λmax ≤
M−1
k=0 λk = tr(Rx) =
Traza de la matriz Rx= Suma de los elementos diagonales de Rx=M · rx(0)=suma de los valores
cuadráticos del vector de entradas xn, una condición equivalente, aunque más restrictiva ser´ıa
0 < µ <
2
M · rx(0)
(25)
Por tanto si elegimos µ tal que se cumple (25), el algoritmo presenta convergencia cuadrática y con-
vergencia en media, ya que la primera convergencia implica la segunda, si bien no se da la relación
rec´ıproca. Es decir, un sistema que converge en media puede que no converga cuadráticamente.
Hasta punto se han reseñado las circunstancias que determinan la convergencia del algoritmo LMS,
lo que queda, pues, es determinar la rapidez de tal convergencia. Precisamente este es el principal
problema del algoritmo LMS, ya que, por lo general, se requiere un número de iteraciones cercano
a 10 veces la dimensión del espacio de entradas para alcanzar un régimen estable. El problema se
hace mayor a medida que aumenta la dimensión del vector de entradas (es decir, el número de
coeficientes del filtro adaptativo) y a medida que el número de condición de la matriz Rx aumenta,
siendo el número de condición el cociente entre el autovalor mayor y el autovalor menor de dicha
matriz. Además, la tasa de convergencia del algoritmo LMS es especialmente sensible a los cambios
que el entorno de trabajo provoca en el citado número de condición. Un análisis detallado de la
transcendencia del número de condición de la matriz Rx puede verse en [4],[5].
6

3.2. Aplicación del algoritmo LMS al problema de la identificación del
canal de comunicación
En este punto se pretende establecer un mecanismo de identificación del canal de comunicación
basado en el algoritmo LMS. Para ello se transmite una cierta señal conocida a través del canal de
comunicación, de modo que el receptor recibirá el resultado de la convolución de la señal original
con la respuesta impulsiva del canal, es decir, se asume que el canal es lineal e invariante con
el tiempo. Pues bien, la identificación del canal de comunicación se efectuará diseñando un filtro
adaptativo FIR mediante el algoritmo LMS, de modo que la respuesta de dicho filtro, cuando la
entrada es la señal original enviada a través del canal, sea la señal recibida. Por tanto el modelo a
aplicar será el que aparece en la figura , donde v(n) es un ruido aditivo gaussiano de media cero
(AWGN).
x(n)
v(n)
H(z)
Función transferencia
canal de comunicación
Wn
Adaptación
coeficientes
filtro
Figura 4: Modelo transmisión para identificación del canal de comunicación
De forma genérica tenemos
H(z) =
∞
i=0 aiz−i
1 −
∞
j=1 bjz−j
=
∞
k=0
hkz−k
, (26)
es decir, se asume que el canal es causal. El filtro adaptativo a construir es de orden M − 1, es
decir, hay que determinar M coeficientes, con lo que el esquema propuesto aproxima sólo los M
primeros coeficientes de la respuesta impulsiva del canal. Teniendo en cuenta que la señal deseada
d(n) = hT
x(n) + v(n), donde h = [h0 h1 . . . h∞]T
, y expresando b = [h0 h1 . . . hM−1]T
, tenemos
d(n) = bT
x(n) + ξ(n) + v(n). (27)
De este modo el vector de correlaciones cruzadas entra la señal de entrada y la deseada , teniendo
en cuenta que la señal de entrada y el ruido están incorrelados, vendrá dado por
rdx =





rdx(0)
rdx(1)
...
rdx(M − 1)





=





E xT
(n)h(n) + v(n) x(n)
E xT
(n)h(n) + v(n) x(n − 1)
...
E xT
h(n) + v(n) x(n − M + 1)





=
=





E xT
(n)b(n) + ξ(n) x(n)
E xT
(n)b(n) + ξ(n) x(n − 1)
...
E xT
(n)b(n) + ξ(n) x(n − M + 1)





rdx = Rxb + E [ξ(n)x(n)] . (28)
Expresión que, considerando que M es lo suficientemente grande como para despreciar el efecto
de la correlación entre el término residual ξ(n) y el vector de entradas, queda reducida al primer
sumando, es decir
Wopt ≈ b. (29)
Por su parte la dinámica del algoritmo LMS vendrá determinada por la ecuación (13), donde
e(n) = (WT
(n) − b)x(n) + ξ(n) + v(n) ≈ (WT
(n) − b)x(n) + v(n) (30)
7

3.3. Codificación caótica de señales de voz
En esta sección se presenta un método de codificación de las señales de voz de modo que
la señal resultante posea un espectro plano, ya que, según recoge [5], los autovalores asociados
a la matriz de correlaciones Rx, construida a partir de la señal codificada, están limitados por
los valores máximo y m´ınimo del espectro de potencia de dicha señal. Dicho de otro modo, un
número de condición unitario para la matriz Rx significa un espectro plano para la señal x(n).
Una de las principales caracter´ısticas de las señales caóticas es el “carácter plano” de su espectro
de potencia. Esta circunstancia sugiere que un buen veh´ıculo para lograr una secuencia adecuada
para la identificación del canal de comunicación, es algún tipo de codificación de la señal original
de voz mediante caos. El esquema aqu´ı propuesto codifica la señal de voz escalándola, en primer
lugar, de modo que esté dentro del intervalo [-1,1] y, a continuación, modifica en función de la señal
de voz escalada, el valor del parámetro que controla la dinámica de la secuencia caótica concreta
considerada.
En lo que sigue se trabajará con el mapa log´ıstico. La dinámica del sistema viene dada por
xk+1 = rkxk(1 − xk), (31)
de modo que rk se escoge
rk = r0 + ∆Ik. (32)
Es decir, se busca un valor del parámetro dinámico r0 de modo que el comportamiento del sistema
definido por 31 sea caótico para todo valor de k. Tal y como se comento más arriba, la señal de
información ha de estar normalizada (| Ik |≤ 1 ∀k). Los valores de los parámetros considerados son
r0 = 3.9757 y ∆r = 0.029. A la vista de la figura 5 se concluye que, en efecto, la codificación caótica
esparce el espectro de la señal original de voz, de modo que la diferencia entre el valor máximo y
el m´ınimo del espectro de potencia se ve reducida. Sin embargo, tal y como se observa en la figura
5, la señal codificada caóticamente posee una alta componente de baja frecuencia, debido a que
posee un cierto valor medio. Por tanto, un mecanismo para reducir aún más el esparcimiento de
los autovalores de Rx, consiste en restar a la anterior señal su valor medio. La disminución del
esparcimiento de los autovalores, fruto de la codificación y de la posterior sustracción del valor
medio, se refleja en la tabla 3.3, la cual ha sido obtenida trabajando con la señal de voz de la figura
5.
λmax/λmin
Señal Original 5270
Señal codificada 987.84
Señal cod. media 0 5.1
Tabla 1: Relación entre autovalor máximo y m´ınimo
8

Figura 5: Ensanchamiento de espectro mediante codificación caótica
3.4. Identificación ciega del canal de comunicación: algoritmo DBD (Dy-
namic Based Deconvolution)
El método de identificación del canal de comunicación propuesto en la sección 3.2 part´ıa del
conocimiento de la señal enviada a través del canal. Ahora lo que se trata es de plantear un nuevo
esquema que evite la necesidad de saber qué señal fue enviada a través del canal de comunicación,
motivo por el cual este nuevo método se dice que lleva a cabo la identificación de forma ciega. El
método que se va a utilizar se basa en el conocimiento de la dinámica de la señal transmitida. Por
otro lado, el procedimiento es cuestión va a tratar de hallar la inversa de la función de transferencia
del canal de comunicación. Por estas dos circunstancias, tal esquema de identificación se dice es
un método de deconvolución basado en la dinámica de las señales transmitidas (en inglés dinamic-
based deconvolution o, abreviadamente, DBD).
xk
vk
reck
sk Codificación
caótica
Canal de
comunicación Deconvolución
canal
z-1 Generación
mapa caótico
Figura 6: Esquema de funcionamiento del algoritmo DBD
El esquema a seguir es el presentado en la figura 6. La señal de voz a transmitir es codificada
siguiendo el esquema planteado en el apartado anterior. El canal de comunicación se asume causal,
lineal e invariante en el tiempo y viene representado mediante un modelo AR tal que
H(z) =
1
1 −
p
i=1 biz−i
. (33)
Pues bien, el bloque de deconvolución del canal viene caracterizado por una función de transferencia
G(z), que es un filtro FIR de orden M (es decir, M + 1 coeficientes), siendo M mayor o igual que
p. Se pretende que G(z) sea la inversa de la función de transferencia del canal de comunicación.
Es decir, se desea que
[G(z) ◦ H(z)] = 1, (34)
9

lo cual exige que a0 = 1, ai = −bi i = 1, 2, . . . , p y ai = 0 para i > p, siendo aj los coeficientes que
definen el filtro G(z), esto es
G(z) =
M
i=0
aiz−i
. (35)
Si denominamos xest
k a la salida del filtro en el instante k tenemos que
xest
k − xk = (a0reck − reck) +
p
i=1
(ai + bi)reck−i +
M
i=p+1
aireck−i. (36)
Suponiendo que G(z) realiza de forma adecuada la deconvolución, cabr´ıa esperar que la trayectoria
descrita por la secuencia a la salida de este filtro, sea la misma que describe la secuencia original
xk. Asumiendo que el mapa log´ıstico se utilizó en la codificación, la función de error a emplear en
la búsqueda de los coeficientes de G(z) es
ek = xest
k − rest
xest
k−1(1 − xest
k−1), (37)
donde rest
es una estimación del parámetro de control de la dinámica del mapa caótico o un cierto
valor medio. Dado que dicho parámetro va a estar fluctuando en torno a r0, se considerará que
rest
= r0 = 3.9757. Al igual que se procedió con el algoritmo LMS, las sucesivas actualizaciones de
los pesos del filtro a construir, vienen dadas por desplazamientos en la dirección contraria a la del
gradiente del error cuadrático respecto de los coeficientes del filtro, siendo éste
ak
e2
k = 2ek(reck − rest
reck−1(1 − 2xest
k−1)). (38)
La ley de actualización de pesos será
ak+1 = ak − µek(reck − rest
reck−1(1 − 2xest
k−1)), (39)
siendo µ el parámetro que determina la convergencia del algoritmo: si µ es demasiado pequeño
la convergencia del algoritmo DBD se lleva a cabo de forma lenta, mientras que si es demasiado
grande el sistema se desestabiliza. Para analizar las prestaciones del método propuesto previamente
es preciso establecer cuáles son los pesos óptimos del filtro objeto de diseño, es decir, debemos
determinar la solución óptima de Wiener aopt. Haciendo uso de la ecuación de Wiener-Hopf en
forma matricial (7), teniendo en cuenta que la entrada del sistema xk ahora es reck + vk y que la
señal deseada es dk = xk queda
Rentrada = E (reck + vk)T
(reck + vk) = Rrec + Rv,
rdx(k) = E [xn(recn−k + vn−k)] = E [xnrecn−k] = E recn−krecT
n bext ,
a opt = [R rec + R v]
−1
R rec b ext. (40)
En el análisis práctico se supondrá Rv = 0 (caso ideal sin ruido), con lo que
a opt ≈ b ext, (41)
siendo b ext = [1 − b1 − b2 . . . − bp]
T
.
4. Simulaciones y conclusiones
4.1. Test del algoritmo LMS con codificación caótica para diferentes
valores del parámetro µ
El objetivo de este apartado es el de verificar el comportamiento del algoritmo LMS utilizando
diversos valores para la tasa de convergencia µ. Asimismo se comprobará la mejora experimenta-
da al utilizar codificación caótica. El primer paso consistirá en definir una cierta figura que nos
permita juzgar la precisión del modelo. Una buena figura es la denominada desajuste del modelo
(Model Misadjustment - MM-) respecto a la solución óptima de Wiener . A continuación se anal-
izan diversas situaciones (en todas ellas se considera ausencia de ruido) presentándose las gráficas
que concretan los resultados obtenidos. En dichas gráficas se representa en decibelios la figura
MM normalizada respecto al desajuste del modelo inicial. La respuesta impulsiva del canal de
comunicación viene dada por
hn =
1
2 1 + cos(2π
3 (n − 2)) , n = 1, 2, 3
0 , e.o.c.
,
mientras que el filtro a diseñar presenta 128 coeficientes (M = 128).
10

4.1.1. Verificación de las prestaciones de la codificación caótica
Se pretende mostrar la conveniencia de emplear la codificación caótica como herramienta para
aumentar la tasa de convergencia del algoritmo LMS aplicado a la identificación del canal de
comunicación. Esta circunstancia se aprecia sin más que observar la figura 8. A la vista de dicha
gráfica se concluye que la forma más conveniente de llevar a cabo la identificación del canal es
por medio de codificación caótica con señales de media cero, es decir, antes de enviar la señal a
través del canal conviene substraerle su valor medio, pues de este modo el espectro de la señal
resultante no presenta una delta en el origen, lo que se traduce en un espectro de potencia plano
y, en consecuencia, un número de condición bajo para la matriz Rx.
Amplitud normalizada
Número de muestra
Figura 7: Señal empleada en los experimentos
MM (dBs)
Número de iteraciones
Figura 8: Test LMS para µ = 0.02 sin ruido
señales caóticas de media cero: µ constante
Se pretende determinar un valor adecuado de µ para el caso de codificación caótica con señales
de media cero y siendo µ constante en las sucesivas iteraciones del algoritmo LMS. Los resultados
obtenidos aparecen en la figura 9, a la vista de la cual se concluye que 0.07 es un valor adecuado
para µ.
11

MM (dBs)
Figura 9: Búsqueda de valor óptimo para la tasa de aprendizaje
señales caóticas de media cero: esquema estocástico de iteración
El parámetro µ en cada iteración n viene descrito por
µ(n) =
µ(0)
n
n = 1, 2, . . . (42)
La elección de µ(0) determina la convergencia del algoritmo siendo crucial la elección de un valor
para el mismo no muy pequeño (convergencia lenta) ni demasiado grande (inestabilización del
sistema), tal y como refiere [6]. En el caso que nos ocupa, los resultados más satisfactorios se ob-
tuvieron para µ(0) = 10 (mirar figura 10).
MM (dBs)
Figura 10: Resultados para esquema estocástico de iteración
señales caóticas de media cero: esquema búsqueda-convergencia
En este caso µ es
µ(n) =
µ(0)
1 + (n/τ)
n = 1, 2 . . . , (43)
12

según recoge [6]. A la vista de (43) se concluye que para valores de n pequeños respecto de la
constante de tiempo τ, µ es aproximadamente igual a µ(0). Por consiguiente, eligiendo un valor
elevado para µ(0) hacemos que los pesos del filtro se actualicen de forma que se sitúen cerca de
su valor óptimo, es decir, en esta fase se lleva a cabo una búsqueda del área entorno a la solución
óptima. Cuando el número de iteraciones es considerablemente elevado, µ(n) es aproximadamente
igual a τµ(0)/n . Es en esta fase cuando los pesos del filtro convergen hacia su valor óptimo, de
ah´ı que se hable de fase de convergencia. Para nuestro caso particular los resultados obtenidos para
diversos valores de los parámetros involucrados en (43) aparecen en la figura 11, concluyéndose
que la mejor elección es µ(0) = 0.09 y τ = 4000.
MM (dBs)
Figura 11: Búsqueda del valor óptimo de µ mediante esquema búsqueda-convergencia
4.1.5. Decisión entre los tres valores óptimos obtenidos
Ahora es tiempo de decidir que esquema es el más adecuado a la hora de realizar una iden-
tificación del canal de comunicación v´ıa algoritmo LMS. Para ello representamos conjuntamente
las soluciones óptimas obtenidas más arriba (figura 12), concluyendo que los mejores resulta-
dos se obtienen aplicando codificación caótica son señales de media cero y un esquema de
búsqueda-convergencia para el parámetro µ, ya que, si bien para un número pequeño de itera-
ciones la búsqueda estocástica proporciona los mejores resultados, a medida que crece el número de
iteraciones las prestaciones del método de búsqueda-convergencia supera a las de los otros méto-
dos, siendo especialmente reseñable el caso de la búsqueda estocástica, ya que para número de
iteraciones superior a 1000 la mejora experimentada al seguir iterando es muy pequeña. Es decir,
el algoritmo se “estanca”, incrementándose cada vez más la diferencia entre el MM de este método
y el aportado por el mecanismo de búsqueda-convergencia.
4.2. Test del algoritmo DBD
Se considerará que el canal viene descrito mediante
H(z) =
1
1 − 0.1106z−1 + 0.2309z−2 + 0.5839z−3
(44)
La figura ha utilizar será de nuevo MM y se considera que no hay ruido en el canal. Los valores
iniciales de los pesos del filtro vienen dados por el resultado de aplicar, para un número pequeño de
iteraciones, el algoritmo de identificación del canal basado en el método LMS a una señal caótica
pura generada a partir del mapa log´ıstico para r = 3.9757. De nuevo todos los resultados obtenidos,
que aparecen sintetizados en las siguientes gráficas, se encuentran normalizados respecto al MM
determinado por los pesos iniciales anteriormente citados. Además, el resultado de tal normalización
se expresa en decibelios. El último punto a aclarar antes de mostrar las gráficas es el referido a la
elección del orden del filtro a diseñar. Es decir, en el receptor se ha de suponer un cierto orden
para el filtro a construir, teniendo que ser dicho orden igual o superior al orden del filtro AR que
13

MM (dBs)
Figura 12: Comparación entre valores óptimos de µ
modela el canal. Hechas todas las aclaraciones oportunas, pasamos a analizar el comportamiento
del algoritmo DBD para las 3 implementaciones del parámetro µ presentadas en la sección anterior.
4.2.1. Tasa de aprendizaje constante
Suponiendo que conocemos a ciencia cierta el orden del filtro AR que modela el canal, y que
en este caso es 3 (esto es, el canal tiene 4 coeficientes), se analiza la calidad del método DBD
para diversos valores de µ, siendo éste constante a lo largo de las diversas iteraciones. La primera
consecuencia destacable tras analizar la figura 13, son las oscilaciones que los coeficientes del filtro
construido presentan una vez se ha alcanzado la adaptación. Esto es resultado de que se intenta
aproximar la dinámica de un sistema cáotico, de modo que pequeños cambios en los pesos del
filtro se traducen en “grandes” diferencias entre las trayectorias predichas para dos instantes de
tiempo diferentes (recordar que una de los rasgos principales de un comportamiento caótico era que
trayectorias inicialmente próximas tienden a separarse exponencialmente con el tiempo). Es decir,
en régimen permanente los cambios en los pesos del filtro generado mediante el algoritmo DBD
se ven amplificados. La siguiente conclusión es relativa al valor del parámetro de convergencia. Se
observa que para valores de µ inferiores a 0.01 el sistema es excesivamente lento, mientras que a
medida que µ crece por encima de 0.01 y se acerca a 0.06 las oscilaciones en régimen permanente
son mayores, de modo que para µ mayor que 0.06 el sistema se inestabiliza. En definitiva, parece
que µ = 0.01 da lugar a un comportamiento aceptable.
14

MM (dBs)
Figura 13: Búsqueda de valor óptimo de µ para DBD y esquema de iteración constante
4.3. Esquema estocástico
El valor que da mejores resultados es, teniendo en cuenta la figura 14, µ = 0.3. De dicha gráfi-
ca se desprende, además, que el esquema estocástico para µ hace que en régimen permanente el
sistema no oscile, debido a que para n suficientemente grande µ presenta valores pequeños que
casi no amplifican los cambios experimentados en los pesos del filtro. Por el contrario, la robustez
en cuanto a estabilidad que se gana se traduce en una convergencia más lenta, es decir, existe un
compromiso entre precisión y rapidez.
MM (dBs)
Figura 14: Búsqueda de valor óptimo de µ para DBD y esquema de iteración estocástico
4.4. Esquema búsqueda-convergencia
En los diversos experimentos realizados, algunos de los cuales aparecen representados en la
figura 15, se observó que para un valor de µ(0) superior a 0.08 los pesos del filtro crecen demasiado
para las primeras iteraciones del algoritmo, lo cual no conviene, pues empeora la tasa de con-
vergencia. Por ello se asumió µ(0) = 0.08 como un valor adecuado. A continuación se realizaron
diversos experimentos con µ(0) = 0.08 y τ variable, concluyéndose que, para µ(0) fijo, a medida
que τ aumenta las oscilaciones en régimen permanente se acentúan, debido a que µ(n) mantiene
un valor elevado para un mayor número de iteraciones. Por esta circunstancia se elige τ = 100 y
µ(0) = 0.05 como un conjunto de valores que determinan un comportamiento satisfactorio.
15

MM (dBs)
Figura 15: Búsqueda de valor óptimo de µ para DBD y esquema de iteración búsqueda-convergencia
4.5. Decisión entre los tres valores óptimos
Si representamos las soluciones óptimas obtenidas para cada uno de los esquemas de generación
del parámetro de aprendizaje del algoritmo DBD (figura 16), hemos de elegir como mejor opción
la representada por un diseño de µ según el modelo de búsqueda-convergencia de Moody y Darken,
ya que es para esta situación cuando se alcanza una rápida convergencia y,además, en régimen
permanente las oscilaciones de los pesos del filtro implementado casi no son apreciables.
MM (dBs)
Figura 16: Comparación entre los diversos esquemas iterativos para el algoritmo DBD
4.6. Test de los algoritmos LMS y DBD en presencia de ruido
El canal de comunicación será modelada según (44). Al igual que se hizo en el apartado 4.1, se
supone que el filtro a diseñar mediante el algoritmo LMS posee 128 coeficientes. Las simulaciones
obtenidas aparecen en la figura 17 y la figura 18, habiéndose obtenido ambas según los diseños
“óptimos” para cada algoritmo. La primera gráfica (figura 17) nos lleva a concluir que el algoritmo
DBD presenta un comportamiento aceptable cuando la relación señal a ruido (SNR) es cercana o
superior a 20 dB. Además el comportamiento del algoritmo, en el caso de trabajar en las condiciones
recién reseñadas, es aceptable aún cuando el orden del filtro a diseñar no coincide con el orden de la
16

función de transferencia que modela al canal. Es más, la tasa de convergencia del algoritmo DBD
- tabla 2- para SNR = 20dB es mayor que la presenta el algoritmo LMS - tabla 3 - con señales
caóticas de media cero, si bien se observó que para órdenes del filtro a implementar superiores
o iguales a 8 durante las primeras iteraciones del algoritmo DBD no existe convergencia alguna,
esto es, los pesos del filtro se alejan de la solución óptima, aunque este comportamiento sólo existe
durante un régimen transitorio. Para concluir, es necesario reseñar la importancia de seleccionar
un valor no excesivamente elevado para la tasa de aprendizaje inicial en el caso del algoritmo DBD,
pues a dicha tasa amplifica los efectos perjudiciales del ruido. De este modo, experimentalmente
se comprobó que conven´ıa
µ(0) ≤ 10−7
, τ = 10 para 0 ≤ SNR < 10 dBs (45)
µ(0) ≤ 10−4
, τ = 100 para 10 ≤ SNR ≤ 15 dBs (46)
µ(0) ≤ 0.02, τ = 200 para 15 < SNR ≤ 25 dBs (47)
Tasa de convergencia aproximadas para el algoritmo DBD
orden del filtro 3 4 6 8
SNR<20 dBs 0.11dB/100 iter. 0.09 dB/100 iter. 0.37 dB/100 iter. 0.27dB/100 iter.
SNR≥20 dBs 13 dB/100 iter. 13 dB /100 iter. 6 dB/100 iter. 3 dB/100 iter.
Tabla 2: Convergencia para DBD
MM (dBs)
(a) Orden filtro=3
(b) Orden filtro=4
MM (dBs)
(c) Orden filtro=6
(d) Orden filtro=8
Figura 17: Simulaciones para el algoritmo DBD en presencia de ruido
17

MM (dBs)
Figura 18: Análisis algoritmo LMS en presencia de ruido
Tasa de convergencia aproximada para el algoritmo LMS
SNR < 20 dBs 2 dB/100 iter.
SNR ≥ 20 dBs 4 dB /100 iter.
Tabla 3: Convergencia LMS en presencia de ruido
Referencias
[1] J.M.H. Elmirghani, S.H. Milner, R.A. Cryan, Experimental evaluation of echo path modelling
with chaotic coded speech, IEEE Trans. Signal Processing, vol. 45, pp. 2600-2604, Oct. 1997.
[2] A.Müller, J.M.H. Elmirghani, Blind channel estimation and echo cancellation using chaotic
coded signals, IEEE Communications Letters, vol 3, No. 3, pp. 72-74, Mar. 1999.
[3] A.Müller, J.M.H. Elmirgani, A chaotic spreading code and its application to blind channel es-
timation, Proc. IEEE Global Telecommunications Conference, GLOBECOM’01, San Antonio,
pp. 186-190, Nov. 2001.
[4] S. Haykin, Adaptive Filter Theory, Third Edition, Englewood Cliffs, NJ: Prentice-Hall, Signal
Processing Series, 1985.
[5] B. Widrow, S.D. Stearns, Adaptive signal Processing, Englewood Cliffs, NJ: Prentice-Hall,
Signal Processing Series, 1985.
[6] C. Darken, J. Moody, Towards faster stochastic gradient search, Advances in Neural Informa-
tion Processing Systems, vol. 4, pp. 1009-1016, San Mateo, CA: Morgan Kauffman, 1992.
[7] Miguel Romera, Técnica de los sistemas dinámicos discretos, Consejo Superior de Investiga-
ciones Cient´ıficas, 1997.
[8] C. Fernández Pérez, F.J. Vázquez Hernández, J.M. Vegas Montaner, Ecuaciones diferenciales
y en Diferencias. Sistemas Dinámicos, Thomson, Madrid 2003.
18

Canal de comunicación y caos

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Canal de comunicación y caos

Similar a Canal de comunicación y caos (20)

Más de darg0001

Más de darg0001 (8)

Último

Último (10)

Canal de comunicación y caos