el uso de los coeficientes de correlación de Pearson y de Sperman
ventajas y desventajas de cada uno de ellos.
usos de enfoques Pearson y enfoque Sperman a problemas estadísticos
1. REPUBLICA BOLIVARIANA DE VENEZUELA.
INSTITUTO UNIVERSITARIO POLITECNICO.
“SANTIAGO MARIÑO”
SEDE BARCELONA.
DEPARTAMENTO DE INGENIERIA EN MANTENIMIENTO MECANICO.
USO DE KARL PEARSON Y DE SPEARMAN.
VENTAJAS Y DESVENTAJAS. APLICACIÓN DE USOS DE
ENFOQUES EN PROBLEMAS ESTADISTICOS DE PEARSON Y
SPEARMAN.
BACHILLER: SEBASTIAN,
GUERRA
CI: 25.897.581
PROFESOR:
RAMON ARAY
2. En estadística, el coeficiente de correlación de Pearson es una
medida de la relación lineal entre dos variables aleatorias cuantitativas. A
diferencia de la covarianza, la correlación de Pearson es independiente de la
escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de relación
de dos variables siempre y cuando ambas sean cuantitativas.
Dado dos variables, la correlación permite hacer estimaciones del valor de
una de ellas conociendo el valor de la otra variable.
Los coeficientes de correlación son medidas que indican la situación relativa
de los mismos sucesos respecto a las dos variables, es decir, son la
expresión numérica que nos indica el grado de relación existente entre las 2
variables y en qué medida se relacionan. Son números que varían entre
los límites +1 y -1. Su magnitud indica el grado de asociación entre las
variables; el valor r = 0 indica que no existe relación entre las variables; los
valores ( 1 son indicadores de una correlación perfecta positiva (al crecer o
decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o
crece Y).
Coeficiente de correlación de
Pearson:
3. En el caso de que se esté estudiando dos variables aleatorias X y Y sobre
una población, el coeficiente de correlación de Pearson se simboliza con la
letra , siendo la expresión que nos permite calcularlo:
De manera análoga podemos calcular este coeficiente sobre un estadístico
muestral, denotado como a:
4. Interpretación:
Varios grupos de puntos (x, y), con el coeficiente de correlación para cada
grupo. Nótese que la correlación refleja la no linealidad y la dirección de la
relación lineal. En la figura del centro, la varianza de yes nula, por lo que la
correlación es indeterminada.
El valor del índice de correlación varía en el intervalo [-1,1]:
Si r = 1, existe una correlación positiva perfecta. El índice indica una
dependencia total entre las dos variables denominada relación directa: cuando
una de ellas aumenta, la otra también lo hace en proporción constante.
Si 0 < r < 1, existe una correlación positiva.
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las
variables son independientes: pueden existir todavía relaciones no lineales entre
las dos variables.
Si -1 < r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta. El índice indica una
dependencia total entre las dos variables llamada relación inversa: cuando una
de ellas aumenta, la otra disminuye en proporción constante.
6. Usos de enfoques de Pearson en
problemas estadísticos:
En la perspectiva de Pearson, para establecer el nivel de
significación estadística habría que atender al impacto de cada tipo de
error en el objetivo del investigador, y a partir de ahí se decidiría cuál de
ellos es preferible minimizar. Pearson llamaron alfa al error tipo I y beta al
error tipo II; a partir de este último tipo de error, introdujeron el concepto
de “poder de una prueba estadística”, el cual se refiere a su capacidad
para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación
con éste se ha desarrollado el concepto de “tamaño del efecto” que
algunos han propuesto como sustituto de los valores p en los informes de
investigación científica. Las pruebas paramétricas más conocidas y
usadas son la prueba T de Student, la prueba F, llamada así en honor a
Fisher, y el coeficiente de correlación de Pearson, simbolizado por r. Usos
de Enfoques de Pearson a Problemas Estadísticos
7. Ventajas y desventajas de Karl Pearson:
Ventajas:
Cuando en el fenómeno es estudiado las dos variables cuantitativas se usa el
coeficiente de correlaciones de Pearson
Es llamado así en homenaje a Karl Pearson, las dos variables son designadas
por X e Y.
Desventajas:
El valor 0 representa falta de correlación
Cuando las variables x e y son independientes, el numero se anula y el
coeficiente de correlación poblacional tiene el valor cero.
En cambio una correlación nula no implica la independencia de variables
8. Coeficiente de correlación de Spearman
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una
medida de la correlación (la asociación o interdependencia) entre dos variables
aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados
por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden
de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximación a la distribución t de Student
9. La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas respectivamente, 0 cero,
significa no correlación pero no independencia. La tau de Kendall es un
coeficiente de correlación por rangos, inversiones entre dos ordenaciones
de una distribución normal.
El coeficiente de correlación de Spearman es menos sensible que el de
Pearson para los valores muy lejos de lo esperado.
10. Ventajas y desventajas de Spearman:
Ventajas:
Al ser Spearman una técnica no paramétrica es libre de
distribución probabilística (2, 5, 9)
La manifestación de una relación, causa-efecto es posible solo
a través de la compresión de la relación natural que existe
entre las variable y no debe manifestarse solo por la
existencia de una fuerte correlación (1,5)
Desventajas:
indicándonos asociaciones negativas o positivas
respectivamente(0) cero, significa correlación pero no
independencia
La tau de kedall es un coeficiente de correlación por rangos,
inversiones entre dos ordenaciones de una distribución
bivariante.
12. Una generalización del coeficiente de Spearman es útil en la
situación en la cual hay tres o más condiciones, varios individuos son
observados en cada una de ellas, y predecimos que las observaciones
tendrán un orden en particular. Por ejemplo, un conjunto de individuos
pueden tener tres oportunidades para intentar cierta tarea, y predecimos
que su habilidad mejorará de intento en intento. El coeficiente de
correlación de rangos de Spearman debe utilizarse para series de datos
en los que existan valores extremos, pues si calculamos la correlación de
Pearson, los resultados se verán afectados. La interpretación del
resultado del coeficiente de correlación de Spearman se encuentra entre
los valores de -1 y 1. La significación estadística de un coeficiente debe
tenerse en cuenta conjuntamente con la relevancia clínica del fenómeno
que se estudia. Usos de Enfoques de Spearman a Problemas
Estadísticos.
Usos de enfoques de
Spearman en problemas
estadísticos: