O documento descreve o coeficiente de correlação de Spearman (ρ), que mede a intensidade da relação entre variáveis ordinais. Ele usa apenas a ordem das observações, ao contrário do coeficiente de Pearson, e não requer distribuições normais. A fórmula para calcular ρ é dada, juntamente com um exemplo de seu cálculo a partir de dados reais sobre dureza da água e número de juvenis de mosquitos.
Dicionário de Genealogia, autor Gilber Rubim Rangel
Coeficiente de Correlação de Spearman ρ
1. Coeficiente de Correlação Ró de Spearman ― ρ
O coeficiente ρ de Spearman mede a intensidade da relação entre variáveis ordinais. Usa,
em vez do valor observado, apenas a ordem das observações.
Deste modo, este coeficiente não é sensível a assimetrias na distribuição, nem à presença de
outliers, não exigindo portanto que os dados provenham de duas populações normais.
Aplica-se igualmente em variáveis intervalares/rácio como alternativa ao R de Pearson,
quando neste último se viola a normalidade. Nos caso em que os dados não formam uma
nuvem “bem comportada”, com alguns pontos muito afastados dos restantes, ou em que
parece existir uma relação crescente ou decrescente em formato de curva, o coeficiente ρ de
Spearman é mais apropriado.
Uma fórmula fácil para calcular o coeficiente ρ de Spearman é dada por:
n
6
ρ =1−
∑d
i =1
3
2
i
n −n
,
em que n é o número de pares (xi, yi) e
di=(postos de xi dentre os valores de x)- (postos de yi dentre os valores de y).
Se os postos de x são exactamente iguais aos pontos de y, então todos os di serão zero e ρ
será 1.
O coeficiente ρ de Spearman varia entre -1 e 1. Quanto mais próximo estiver destes
extremos, maior será a associação entre as variáveis. O sinal negativo da correlação significa
que as variáveis variam em sentido contrário, isto é, as categorias mais elevadas de uma
variável estão associadas a categorias mais baixas da outra variável.
Exemplo:
Os dados abaixo foram recolhidos em 13 nascentes de rios e em cada nascente foi contado
o número de juvenis de uma certa espécie de mosquito e medida a dureza da água do rio.
2. Dureza da água
17
20
22
28
42
55
75
80
90
145
145
170
Nº de juvenis
42
40
30
7
12
10
7
3
7
5
2
4
Será que as variáveis estão correlacionadas?
Diagrama de dispersão
Diagrama de Dispersão
Nº de juvenis
50
40
30
20
10
0
0
50
100
150
200
Dureza da água
O gráfico indica uma relação negativa, mas uma linha curva descreveria melhor a relação
do que uma linha recta. O coeficiente ρ de Spearman é mais apropriado para medir a
intensidade da associação entre as variáveis.
Cálculo do coeficiente ρ de Spearman
Dureza da água
17
20
22
28
42
55
55
75
80
90
145
145
170
Total
Posto
1
2
3
4
5
6
7
8
9
10
11
12
13
Nº de juvenis
2
3
4
5
7
7
7
8
12
10
30
40
42
Posto
1
2
3
4
5
6
7
8
9
10
11
12
13
di2
(1-13)2=144
(2-12)2=100
(3-11)2=64
(4-5)2=1
(5-9)2=16
(6-10)2=16
(7-8)2=1
(8-6)2=1
(9-2)2=49
(10-7)2=9
(11-4)2=49
(12-1)2=121
(13-3)2=100
671
3. Tem-se que
n
∑d
6
ρ =1−
i =1
3
2
i
n −n
=1−
671
= 1 − 1.84 = −0.84,
133 − 13
ou seja, existe uma associação forte e negativa entre as variáveis.
Alguns exercícios
1. As notas obtidas por 10 estudantes a Análise Matemática e o seu QI (quociente de
inteligência) são apresentadas no quadro seguinte.
Notas
QI
8
70
14
190
18
304
10
100
6,5
42
9
80
14
169
5,2
27
10
105
13
159
Utilize o coeficiente ρ de Spearman para verificar se as variáveis estão associadas e qual o seu
grau de associação.
2. Registaram-se os valores de duas variáveis x e y. Os valores encontram-se registados na
tabela abaixo.
x
y
32
40
33
939 1505 1009
24
39
516 1426
32
37
939 1279
32
33
944 1004
27
659
26
611
29
766
Utilize o coeficiente ρ de Spearman para verificar se as variáveis estão associadas e qual o seu
grau de associação.