Este documento describe los coeficientes de correlación de Pearson y Spearman, cómo se calculan y cuándo usar cada uno. El coeficiente de Spearman es no paramétrico y se puede usar cuando las variables están en una escala ordinal o no siguen una distribución normal, mientras que el coeficiente de Pearson requiere que las variables sean continuas y tengan una distribución normal. Ambos coeficientes miden la asociación entre variables y oscilan entre -1 y 1, indicando correlaciones negativas o positivas.
2. •COMO DETERMINAR EL USO DE LOS
COEFICIENTES DE CORRELACION DE
PEARSON Y DE SPEARMAN
3. En estadística, el coeficiente de
correlación de Spearman, ρ (rho)
es una medida de la correlación (la
asociación o interdependencia)
entre dos variables aleatorias
continuas. Para calcular ρ, los datos
son ordenados y reemplazados por
su respectivo orden.
4. El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los
correspondientes estadísticos de orden de x -
y.N es el número de parejas.
Se tiene que considerar la existencia de datos
idénticos a la hora de ordenarlos, aunque si éstos
son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones.
5. podemos utilizar la siguiente aproximación a
la distribución t de Student
La interpretación de coeficiente de Spearman es
igual que la del coeficiente de correlación de
Pearson. Oscila entre -1 y +1, indicándonos
asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación
pero no independencia. La tau de Kendall es un
coeficiente de correlación por rangos, inversiones
entre dos ordenaciones de una distribución normal
bivariante.
7. DESVENTAJAS
• Los coeficientes de correlación más utilizados sólo miden una relación
lineal. Por lo tanto, es perfectamente posible que, si bien existe una
fuerte relación no lineal entre las variables, r está cerca de 0 o igual a 0. En
tal caso, un diagrama de dispersión puede indicar aproximadamente la
existencia o no de una relación no lineal.
• Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría
calcular 'r' entre el número de calzado y la inteligencia de las personas, la
altura y los ingresos. Cualquiera sea el valor de 'r', no tiene sentido y por lo
tanto es llamado correlación de oportunidad o sin sentido.
• 'R' no debe ser utilizado para decir algo sobre la relación entre causa y
efecto. Dicho de otra manera, al examinar el valor de 'r' podríamos concluir
que las variables X e Y están relacionadas. Sin embargo, el mismo valor de
'r no nos dice si X influencia a Y o al revés. La correlación estadística no
debe ser la herramienta principal para estudiar la causalidad, por el
problema con las terceras variables.
8. VENTAJAS
• El coeficiente de Spearman es no paramétrico, (es decir,
es libre de distribución probabilística). Permite medir la
correlación o asociación entre dos variables cuando las
mediciones se realizan en una escala ordinal, o cuando
no existe distribución normal. Se calcula en base a una
serie de rangos asignados. Los supuestos son menos
estrictos. Es robusto a la presencia de outsiders (es decir
permite ciertos desvíos del patrón normal). La
manifestación de una relación causa-efecto es posible
sólo a través de la comprensión de la relación natural que
existe entre las variable y no debe manifestarse sólo por
la existencia de una fuerte correlación.
9. APLICAR USOS DE ENFOQUES PEARSON Y SPEARMAN A
PROBLEMAS ESTADISTICOS
• USOS: Para aplicar el coeficiente de correlación de Spearman se
requiere que las variables estén medidas al menos en escala ordinal,
es decir, de forma que las puntuaciones que las representan puedan
ser colocadas en dos series ordenadas. A veces, este coeficiente es
denominado por la letra griega ρs (rho), aunque cuando nos situamos
en el contexto de la Estadística Descriptiva se emplea la notación rs
La fórmula de cálculo para rs puede derivarse de la utilizada en el
caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a
dos series de puntuaciones ordinales, compuestas cada una de ellas
por la n primeros números naturales A partir de un conjunto de n
puntuaciones
10. • la fórmula que permite el cálculo de la correlación entre dos
variables X e Y, medidas al menos en escala ordinal, es la
siguiente: Donde d es la distancia existente entre los
puestos que ocupan las puntuaciones correspondientes a un
sujeto i cuando estas puntuaciones han sido ordenadas para
X y para Y. El coeficiente de correlación de Spearman se
encuentra siempre comprendido entre los valores -1 y 1. Es
decir, -1 < rs < 1. Cuando todos los sujetos se sitúan en el
mismo puesto para la variable X y para la variable Y, el valor
de rs es 1. Si ocupan valores opuestos, es decir, al primer
sujeto en X le corresponde el último lugar en Y, al segundo
en X le corresponde el penúltimo en Y, etc., entonces el valor
de rs es -1.