Este documento discute tabelas de contingência e testes de hipóteses sobre diferenças de proporções entre variáveis categóricas. Apresenta tabelas de contingência como uma ferramenta de estatística descritiva bivariada e discute os testes qui-quadrado de Pearson, McNemar e Cochran para testar hipóteses sobre a relação entre variáveis categóricas com medidas independentes e medidas repetidas.
2. Conteúdos
2
Estatística descritiva bivariada
Tabela de contingências
Testes de hipóteses sobre diferenças de
proporções de variáveis categoriais:
Medidas independentes (Pearson Chi-Square)
Medidas repetidas (McNemar; Cochran)
Effect size
Célia Sales - UAL
3. Estatística descritiva bivariada
3
Podemos descrever a distribuição de variáveis uma a
uma – Estatística descritiva univariada
Poder-nos-á interessar DESCREVER A RELAÇÃO
entre DUAS VARIÁVEIS - Estatística descritiva
bivariada
Ex: Uma amostra é constituída por homens e mulheres, alguns
dos quais trabalham, outros não.
Pretendemos descrever a relação entre SEXO e
ENQUADRAMENTO PROFISSIONAL (trabalhar ou não
trabalhar).
Célia Sales - UAL
4. Relação entre variáveis categoriais
4
Quando examinamos a relação entre variáveis
categoriais (nominais ou ordinais), analisamos as
frequências e as proporções em cada categoria
Ao cruzar, em quadro, as frequências de duas
variáveis categoriais, obtemos uma tabela de dupla
entrada ou tabela de contingência
(crosstabs ou contingency tables)
Célia Sales - UAL
5. Será que homens e mulheres têm diferente
enquadramento profissional?
5
sex * Exerce actividade profissional Crosstabulati on
Count
Exerce activ idade
prof issional
Exerce Não exerce
activ idade activ idade
prof issional prof issional Total
sex Masculino 106 90 196
Feminino 245 81 326
Total 351 171 522
Mais mulheres que homens
Mais homens que mulheres
Célia Sales - UAL
6. Do total dos
homens, 45,9%
sex * Exerce actividade profissional Crosstabulati on não exerce AP
Exerce activ idade
prof issional
Exerce Não exerce
activ idade activ idade
prof issional prof issional Total
sex Masculino Count 106 90 196 Do total das
% wit hin sex 54,1% 45,9% 100,0% pessoas que
% wit hin Exerce
activ idade prof issional
30,2% 52,6% 37,5% não exercem
% of Total 20,3% 17,2% 37,5% AP, 52,6% são
Feminino Count 245 81 326 homens
% wit hin sex 75,2% 24,8% 100,0%
% wit hin Exerce
69,8% 47,4% 62,5%
activ idade prof issional
% of Total 46,9% 15,5% 62,5%
Total Count 351 171 522
% wit hin sex 67,2% 32,8% 100,0% Do total dos
% wit hin Exerce inquiridos, 17,2%
100,0% 100,0% 100,0%
activ idade prof issional
% of Total 67,2% 32,8% 100,0%
são homens e
não exercem AP
Célia Sales - UAL 6
7. Representação gráfica da relação entre duas
variáveis categoriais
7
Em percentagens
Graphs – Legacy Dialogs - Interactive – Bar 100% Stack
10 0%
Exer ce act ividade pr ofis sio nal
Exerce actividade profissional
Não exerce actividade profissional
75 %
Bars show percents
Perce nt
50 % 20%
47%
25 %
17% 16%
0%
Masc ul in o Fe min in o
se x
Célia Sales - UAL
9. Testes de Hipóteses sobre diferença de proporções
9
Até que ponto a diferença encontrada na amostra é
estatisticamente significativa?
Teste de hipóteses sobre diferença de proporções
Medidas
Medidas Repetidas
Independentes
• Qui-quadrado de • McNemar
Pearson • Cochran
Célia Sales - UAL
10. 10
Para sabermos se
existem diferenças
(ou relação)
estatisticamente
significativas entre
duas variáveis
categoriais,
podemos usar o
teste de hipóteses
qui-quadrado de
Pearson
Karl Pearson (1857-1936)
Tabela de Contingência e
Teste Qui-Quadrado
Célia Sales - UAL
11. Passos do teste Pearson Chi-Square
11
1º PASSO: Estabelecer as hipóteses estatísticas
H0: Homens e mulheres não diferem significativamente
quanto ao enquadramento profissional
H1: Homens e mulheres diferem significativamente quanto
ao enquadramento profissional
2º PASSO: Estabelecer o nível de significância
α = 0.05
Célia Sales - UAL
12. Lógica do teste Pearson Chi-Square
12
3º PASSO: Calcular o valor do teste
Comparar as frequências que observamos em certas
categorias (observed frequencies)
COM
As frequências que obteríamos se não houvesse efeito
(expected frequencies)
Valor da estatística Chi-square
Célia Sales - UAL
13. Cálculo da estatística qui-quadrado
13
2
observed ij expected ij
2
expected ij
total linha i total coluna j
Expected ij
n
Célia Sales - UAL
14. Lógica do teste Pearson Chi-Square
14
4º e 5º PASSO: Calcular p e comparar p e α
Consultar uma tabela de distribuição de probabilidades (distribuição
do qui-quadrado)
Verificar se o valor da estatística Chi-square é maior do que o valor
crítico, para um certo df e um certo α .
df r 1c1
Célia Sales - UAL
15. Teste de Hipóteses Chi-Square: Cálculo no SPSS
15
Analyse – Descriptive statistics – Crosstabs
Coloque uma das variáveis na caixa Row(s) e a
outra variável na caixa Column(s)
Na opção Statistics, seleccione Chi-square
Célia Sales - UAL
16. Output no SPSS
16
Graus de p
Valor do teste
liberdade
Chi-Square Tests
Asy mp. Sig. Exact Sig. Exact Sig.
Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 24,674b 1 ,000
a
Continuity Correction 23,727 1 ,000
Likelihood Ratio 24,338 1 ,000
Fisher's Exact Test ,000 ,000
Linear-by -Linear
24,627 1 ,000
Association
N of Valid Cases 522
a. Computed only f or a 2x2 table
b. 0 cells (,0%) hav e expected count less than 5. The minimum expected count is
64,21.
Atenção aos pressupostos de utilização do qui-quadrado
Célia Sales - UAL
17. Interpretação do Output
17
Na linha Pearson Chi-Square:
se Exact Sig. é MENOR que 0.05, há uma diferença significativa
entre as duas variáveis.
Na nota da tabela:
Não pode fazer a análise se:
houver mais de 20% de células com frequência esperada menor de 5, não pode
fazer a análise
Existir alguma frequência esperada inferior a 1
(Solução: agrupe categorias de resposta ou recolha mais dados)
Na tabela de contingência:
Identifique as células responsáveis pelo efeito
Reporte as proporções, a estatística Chi-quadrado, os graus de
liberdade e p.
Célia Sales - UAL
18. Interpretação do Output
18
Para identificar as células
responsáveis pelo efeito, podem
analisar-se os RESÍDUOS
AJUSTADOS
ESTANDARIZADOS
Células com resíduos
<-2 ou >2
(<-1,96 ou >1,96 para α = 0.05)
The residual for a cell (observed minus expected
value) divided by an estimate of its standard
error. The resulting standardized residual is
expressed in standard deviation units above or
below the mean.
Célia Sales - UAL
19. Effect Size: Medidas de Associação
19
Qualquer teste de hipótese informa-nos da existência de um
efeito na população
homens e mulheres têm enquadramentos profissionais
significativamente diferentes;
ou existe uma relação estatisticamente significativa entre sexo e
enquadramento profissional.
No entanto, não nos informa da MAGNITUDE DO EFEITO
- Qual a importância ou força da relação entre estas duas variáveis?
- Quão diferentes são homens e mulheres, no que respeita ao seu
enquadramento profissional?
Célia Sales - UAL
20. Effect Size: Medidas de Associação
20
Effect Size – Medida objectiva da importância de
um efeito estatístico
É dado por uma medida de associação
Em geral varia entre:
0–1
Não há efeito Efeito máximo
Célia Sales - UAL
21. Effect size no teste qui-quadrado
21
v = 0.10 (small effect):
O efeito explica 1% da
variância total
v = 0.30 (medium effect):
O efeito explica 9% da
Phi is a chi-square-based measure of
variância total
association that involves dividing the chi-
square statistic by the sample size and v = 0.50 (large effect):
taking the square root of the result.
Cramer's V is a measure of association O efeito explica 25% da
based on chi-square. variância
Célia Sales - UAL
22. Medidas Independentes vs. Medidas Repetidas
22
O Teste do Qui-quadrado usa-se em desenhos de
medidas independentes (isto é, cada sujeito é
medido apenas uma vez)
Se tivermos variáveis categoriais em desenhos de
medidas repetidas (por exemplo, cada sujeito é
medido mais do que uma vez e queremos saber se
há diferenças entre os momentos de medição), que
testes podemos usar?
McNemar
Cochran
Célia Sales - UAL
23. McNemar
23
Pode ser usado para comparar as frequências (ou
proporções) de uma variável dicotómica, nos
mesmos casos, em dois pontos no tempo (medida
repetida)
Medidas repetidas 2 x 2
A tabela de contingência cruza a variável no
momento 1 com a variável no momento 2.
No SPSS
Analyse – Nonparametric Tests – 2 related
samples
Seleccionar as duas variáveis que se pretende comparar
e colocar na caixa da direita
Célia Sales - UAL
24. Teste de Cochran (Q)
24
É uma extensão do teste McNemar para
amostras relacionadas
Pode ser usado para comparar as frequências de
uma variável dicotómica nos mesmos casos,em
três ou mais pontos no tempo (medida repetida)
No SPSS
Statistics –Nonparametric Tests – K Related
Samples
Seleccionar as variáveis que se pretende comparar e
colocar na caixa da direita
Célia Sales - UAL