2. Correlación de Pearson
• Función: Asociar 2 variables cuantitativas con distribución
paramétrica
y = a + bx
Variable dependiente
Ordenada al origen
Variable independiente
• Las correlaciones pueden ser positivas o negativas
Correlación positiva: a mayor x mayor y
Correlación negativa: a mayor x menor y
r = coeficiente de correlación de Pearson: < 0.19 : Muy baja > 0.8: Muy alta
0 Ausencia de correlación 0.2 – 0.39 : Baja
-1 Correlación negativa perfecta 0.4 – 0.59 : Moderada
1 Correlación positiva perfecta 0.6 – 0.79 : Alta
Pendiente
3. Correlación de Pearson
Individuos X (edad) Y (colesterol) X*Y X2 Y2
1 33 150 4950 1089 22500
2 45 180 8100 2025 32400
3 56 200 11200 3136 40000
4 56 180 10080 3136 32400
5 27 150 4050 729 22500
6 58 180 10440 3364 32400
7 47 180 8460 2209 32400
Totales 322 1220 57280 15688 214600
Ejemplo: Se desea saber la correlación entre la edad y los niveles de colesterol sérico en una muestra
de individuos mexicanos
4. Fórmula de correlación de Pearson
Coeficiente de correlación de Pearson (r)
• rxy= n Σ x*y - (Σx) (Σy) = 7 * 57280 – 322 *1220 = 0.88
[n Σx2 – (Σx)2] [n Σy2 – (Σy)2 7 * (15688) – (322)2 * 7 * (214600) – (1220)2
rxy= 0.88 grados de libertad
Tr = r n-2 = 4.14 gl = n – 2 = 7 – 2 = 5 4.14 > 2.015, p <0.05
1 – r2
Interpretación: Existe una correlación positiva significativa muy alta entre la edad y los niveles de colesterol
Significancia 0-05 de la
Tabla de T de Student
5. Interpretación del “Tr” o significancia estadística
(tabla de distribución de T student)
• Valor crítico para 5 gl = 2.015
6. Correlación de Pearson (Coeficiente de
determinación)
Coeficiente de determinación o R2 = 0.7744
Interpretación: El 77.44% de la variabilidad de los niveles de colesterol
se explica por la variabilidad de la edad
7. Gráfico de correlación en Excel, con R2 y línea
de tendencia
r = 0.883
R2 = 0.7792
y = 1.3242x + 113.37
9. Coeficiente de correlación de Spearman
• Se utiliza para asociar 2 variables cuantitativas (numéricas) con distribución no paramétrica, al menos en una de
ellas.
Fórmula: Rho (𝜌) = Σ(xi – x) x (yi – y) = Σ(xi – x) x (yi – y)
√ Σ (xi – x)2 x (yi – y)2 √(n-1)(S2
x) x (n-1)(S2
y)
Donde:
xi = cada valor del rango de x
yi = cada valor del rango de y
x = promedio del rango de x
y = promedio del rango de y
10. Correlación de Spearman
Las correlaciones pueden ser positivas o negativas
Correlación positiva: a mayor x mayor y
Correlación negativa: a mayor x menor y
rho (𝜌) = coeficiente de correlación de Spearman: < 0.19 : Muy baja > 0.8: Muy alta
0 Ausencia de correlación 0.2 – 0.39 : Baja
-1 Correlación negativa perfecta 0.4 – 0.59 : Moderada
1 Correlación positiva perfecta 0.6 – 0.79 : Alta
Ejemplo: Se desea saber si existe una asociación entre el precio relativo de los alimentos en 15 diferentes países,
tomando como referencia a Suecia, y el porcentaje de adultos por cada país, quienes refirieron que el precio de los
alimentos influyó mucho para elegir sus alimentos
11. Correlación de Spearman (ejemplo)
País Precio real
(x)
Influencia
del precio
(y)
Rango x Rango y (rxi-rx) (ryi –ry)
1 67 18 3 1.5 (3-8)(1.5-8) =32.5
2 83 18 9 1.5 (9-8)(1.5-8)= -6.5
3 78 29 6 3 10
4 76 30 5 4 12
5 80 34 8 5 0
6 79 36 7 6 2
7 65 38 1.5 7 6.5
8 109 39 15 8 0
9 88 40 10 9 2
10 65 43 1.5 10 -13
11 71 52 4 11 -12
12 95 54 12 12 16
13 89 57 11 13 15
14 100 59 13 14 30
15 106 62 14 15 42
Promedio = 8 Promedio = 8 Sumatoria: 136.5
Desv.. Est: 4.47 Desv. Est.= 4.47
Rho = Σ(xi – x) x (yi – y)
√(n-1)(S2
x) x (n-1)(S2
y)
Rho = 136.5 = 0.49
279.5
gl = n = 15
* La significancia estadística se obtiene
comparando el valor de Rho con el
valor crítico de la tabla de distribución
de Spearman (siguiente diapositiva)
* valor crítico gl =15 = 0.521, 0.49 < 0.521
p > 0.05
Interpretación:
Existe una correlación moderada
entre el precio relativo de los alimentos
en 15 diferentes países analizados y la
proporción de habitantes en los que el
el precio de los alimentos influye mucho
para elegir sus alimentos, sin embargo esta
correlación no es significativa.
12. Tabla de distribución de Spearman
• Valor crítico para 15 gl
y p = 0.05 bilateral : 0.521
13. Gráfico en Excel de correlación de Spearman
rho = 0.49
p = 0.065