Estadistica para la investigación (sesión5) version mejorable
Covarancia
1. 78 Bioestad´
ıstica: M´todos y Aplicaciones
e
3.3.2. Independencia
Existe un concepto que es radicalmente opuesto a la dependencia funcio-
nal, que es el de independencia. Se dice que dos variables X e Y son inde-
pendientes si la distibuci´n marginal de una de ellas es la misma que la
o
condicionada por cualquier valor de la otra.
Esta es una de entre muchas maneras de expresar el concepto de in-
dependencia, y va a implicar una estructura muy particular de la tabla
bidimensional, en el que todas las filas y todas las columnas van a ser
proporcionales entre s´
ı.
3.4. Covarianza
La covarianza SXY , es una medida que nos hablar´ de la variabilidad
a
conjunta de dos variables num´ricas (cuantitativas). Se define como:
e
n
1
SXY = (xi − x)(yi − y)
n i=1
Una interpretaci´n geom´trica de la covarianza
o e
Consideremos la nube de puntos formadas por las n parejas de datos (xi , yi ).
El centro de gravedad de esta nube de puntos es (x, y), o bien podemos
escribir simplemente (x, y) si los datos no est´n ordenados en una tabla de
a
doble entrada. Trasladamos los ejes XY al nuevo centro de coordenadas
(x, y). Queda as´ dividida la nube de puntos en cuatro cuadrantes como
ı
se observa en la figura 3.1. Los puntos que se encuentran en el primer y
tercer cuadrante contribuyen positivamente al valor de SXY , y los que se
encuentran en el segundo y el cuarto lo hacen negativamente.
De este modo:
Si hay mayor´ de puntos en el tercer y primer cuadrante, ocurrir´ que
ıa a
SXY ≥ 0, lo que se puede interpretar como que la variable Y tiende
a aumentar cuando lo hace X;
2. 3.4. COVARIANZA 79
.
− Y
+ − Y +
(− , −)
x y
(− , −)
x y
X X
+ − + −
Cuando X crece, Y crece Cuando X crece, Y decrece
Casi todos los puntos pertenecen Casi todos los puntos pertenecen
a los cuadrantes primero y tercero a los cuadrantes segundo y cuarto
.
Figura 3.1: Interpretaci´n geom´trica de SXY
o e
Si la mayor´ de puntos est´n repartidos entre el segundo y cuarto
ıa a
cuadrante entonces SXY ≤ 0, es decir, las observaciones Y tienen
tendencia a disminuir cuando las de X aumentan;
Si los puntos se reparten con igual intensidad alrededor de (x, y),
entonces se tendr´ que SXY = 0. V´ase la figura 3.2 como ilustraci´n.
a e o
3. 80 Bioestad´
ıstica: M´todos y Aplicaciones
e
.
Sxy=0
S xy =0
Hay dependencia entre
Las dos variables son
las dos variables, aunque
independientes.
la covarianza sea nula.
.
Figura 3.2: Cuando los puntos se reparte de modo m´s o menos homog´neo
a e
entre los cuadrantes primero y tercero, y segundo y cuarto, se tiene que
SXY ≈ 0. Eso no quiere decir de ning´n modo que no pueda existir ninguna
u
relaci´n entre las dos variables, ya que ´sta puede existir como se aprecia
o e
en la figura de la derecha.
La Covarianza
• Si SXY > 0 las dos variables crecen o decrecen a la vez (nube de
puntos creciente).
• Si SXY < 0 cuando una variable crece, la otra tiene tendencia a
decrecer (nube de puntos decreciente).
• Si los puntos se reparten con igual intensidad alrededor de (x, y),
SXY = 0 (no hay relaci´n lineal).
o