Este documento explica los coeficientes de correlación de Pearson y Spearman. El coeficiente de Pearson mide la correlación lineal entre dos variables cuantitativas, mientras que el coeficiente de Spearman mide la correlación entre variables ordinales. Ambos coeficientes varían de -1 a 1, donde valores cercanos a -1 o 1 indican una fuerte correlación negativa o positiva respectivamente, y cero indica ninguna correlación. El documento proporciona fórmulas, ejemplos y directrices para la interpretación de estos coeficientes.
1. Repùblica Bolivariana de Venezuela
Ministerio del Poder Popular Para la Educación Superior
Instituto Universitario Politécnico “Santiago Mariño”
Edo. Anzoátegui
Estadística I “OV”
Coeficientes de Correlación
de Pearson y de Spearman
Alumno:
Luis Bastardo
C.I: 24.232.547
Profesor:
Pedro Beltran
2. Coeficiente de Pearson:
El índice numérico más común usado para medir una correlación
es el “coeficiente de Pearson”. El coeficiente de Pearson (también
llamado coeficiente de correlación del producto-momento), se
representa con el símbolo “ r ” y proporciona una medida numérica de
la correlación entre dos variables.
El coeficiente de correlación de Pearson (r) se mide en una escala
de 0 a 1, tanto en dirección positiva como negativa. Un valor de “0”
indica que no hay relación lineal entre las variables. Un valor de “1” o “–
1” indica, respectivamente, una correlación positiva perfecta o negativa
perfecta entre dos variables. Normalmente, el valor de se ubicará en
alguna parte entre 0 y 1 o entre 0 y –1.
3. El coeficiente de Pearson de correlación:
Valor del
Coeficiente de Pearson
Grado de Correlación
entre las Variables
r = 0 Ninguna correlación
r = 1 Correlación positiva perfecta
0 < r < 1 Correlación positiva
r = -1 Correlación negativa perfecta
-1 < r < 0 Correlación negativa
Nótese que una correlación negativa no es menos fuerte que una
correlación positiva. Así, por ejemplo, un de 0,5 es tan ‘grande’ o fuerte como un de
–0,5. Los signos positivos y negativos sólo indican si el valor de una variable
aumenta o disminuye, respectivamente, con el aumento en el valor de la otra
variable. Como usted sabe, cuando los aumentos (disminuciones) de una variable
producen aumentos (disminuciones) en la otra, la relación es positiva. Es negativa
cuando los aumentos (disminuciones) de una variable producen disminuciones
(aumentos) en la otra.
4. Ejemplo (Correlación positiva perfecta):
Observamos que los datos tipificados (expresados
como puntuaciones z) en las dos columnas de la
derecha tienen los mismos valores en ambas
variables, dado que las posiciones relativas son las
mismas en las variables X e Y.
Si obtenemos los productos de los valores tipificados para cada caso, el resultado
es:
El cociente de dividir la suma de productos (5) por N (hay que tener en cuenta
que N es el número de casos, NO el número de datos) es igual a 1:
5. La correlación de Spearman (rs) es una medida de relación lineal
entre dos variables. Se diferencia de la correlación de Pearson en que
utiliza valores medidos a nivel de una escala ordinal. Si alguna de las
variables está medida a nivel de escala de intervalo/razón deberá
procederse antes de operar el estadístico a su conversión en forma
ordinal.
Este coeficiente se emplea cuando una o ambas escalas de
medidas de las variables son ordinales, es decir, cuando una o ambas
escalas de medida son posiciones. Ejemplo: Orden de llegada en una
carrera y peso
Coeficiente de Spearman:
7. La interpretación del coeficiente rho de Spearman concuerda en valores
próximos a 1; indican una correlación fuerte y positiva. Valores próximos a –1
indican una correlación fuerte y negativa. Valores próximos a cero indican que
no hay correlación lineal. Puede que exista otro tipo de correlación, pero no
lineal. Los signos positivos o negativos solo indican la dirección de la relación;
un signo negativo indica que una variable aumenta a medida que la otra
disminuye o viceversa, y uno positivo que una variable aumenta conforme la
otra también lo haga disminuye, si la otra también lo hace.
Coeficiente de Spearman:
Coeficiente Interpretacion
0 Relación nula
0 – 0,2 Relación muy baja
0,2 – 0,4 Relación baja
0,4 – 0,6 Relación moderada
0,6 – 0,8 Relación alta
0,8 - 1 Relación muy alta
1 Relación perfecta
8. Ejemplo:
Tenemos las siguientes variables:
Talla Peso
1,68 68
1,89 70
1,75 80
1,56 45
1,48 48
Al convertirlas en una escala ordinal,
obtendríamos los resultados:
Talla Peso
3 3
5 4
4 5
2 1
1 2
9. El primer valor de talla (en este caso 1,68) se convierte en 3, porque el 1,68 es
el tercer valor más pequeño de la talla. El valor en peso de 45 se convierte en 1,
porque es el menor. Luego se calculan las diferencias de rangos:
Sustituyendo:
Interpretación:
En la muestra observada los valores de talla y peso tienen una correlación
entre fuerte y perfecta, lo que se traduce que en la medida que aumentan los
valores de la talla también aumentan los del peso y viceversa.
Ejemplo:
3 3
5 4
4 5
2 1
1 2
4
10. El coeficiente de correlación de Spearman es exactamente el mismo que
el coeficiente de correlación de Pearson, calculado sobre el rango de
observaciones. La correlación estimada entre X e Y se halla calculando el
coeficiente de correlación de Pearson para el conjunto de rangos apareados. La
correlación de Spearman puede ser calculada con la fórmula de Pearson, si
antes hemos transformado las puntuaciones en rangos.
Correlación de Pearson y Correlación de Spearman:
11. Coeficiente de correlación de Pearson:
Paramétrico.
Permite medir la correlación o asociación entre dos variablescuando se
trabaja con variables numéricas con distribución normal.
Es calculado en función de las varianzas y la covarianza entre ambas
variables.
Caracteristicas:
Coeficiente de correlación de Spearman:
No Paramétrico.
Es un coeficiente que permite medir la correlación o asociaciónentre dos
variables cuando las mediciones se realizan en una escalaordinal, o cuando
no existe distribución normal.
Se calcula en base a una serie de rangos asignados.
12. Tanto el coeficiente de correlación de Pearson como el de Spearman,
siguen las mismas normas de interpretación:
Solamente toma en cuenta valores entre 1 y -1.
El 0 indica que no existe correlación.
El valor numérico indica la magnitud de la correlación.
El coeficiente de correlación cuantifica la correlación entredos variables,
cuando esta realmente existe.
El hecho de que exista correlación entre las variables noimplica que exista
causalidad o dependencia entre ellas.
El signo indica la dirección de la correlación.
Los valores cercanos a 1 nos indican una correlaciónmuy buena y los cercanos a
cero una correlaciónmínima o nula.
Interpretación: