O documento apresenta uma introdução sobre estatística, incluindo conceitos básicos como estatística descritiva e inferencial. Também fornece sugestões bibliográficas e discute os principais métodos estatísticos utilizados em pesquisas científicas na área médica.
1. ANÁLISE ESTATÍSTICA
Parte I
Uma Breve Revisão no GESME
Profa. Rilva Lopes de Sousa-Muñoz
rilva@ccm.ufpb.br
2. ANÁLISE ESTATÍSTICA
Parte II
SPSS – Tutorial
Grupo de Estudos
em
Semiologia Médica
Profa. Rilva Lopes de Sousa-Muñoz
rilva@ccm.ufpb.br
3. Sugestões Bibliográficas
Livros do acervo da BC/UFPB
• CALEGARI-JACQUES, S.M. Bioestatística:
Princípios e aplicações. Porto Alegre: Artmed,
2003.
• CAMPANA, A. O. Investigação científica na
área médica. São Paulo: Manole, 2001.
• DRUMMOND, J. P.; SILVA, E. Medicina
Baseada em Evidências. São Paulo: Atheneu,
2002.
• VIEIRA, S.; WADA, R. Estatística: Introdução
Ilustrada. São Paulo: Atlas, 1998.
4. Breve Revisão sobre
conceitos fundamentais de
BIOESTATÍSTICA
O que é Estatística?
Qual o papel da estatística
na pesquisa científica?
5. O QUE É ESTATÍSTICA?
• Para muitos, a estatística não passa
de conjuntos de tabelas de dados
numéricos e gráficos
A estatística originou-se com a
coleta e construção de tabelas de
dados
A situação evoluiu e esta coleta de
dados representa somente um dos
aspectos da Estatística
6. ESTATÍSTICA
“Estatística é a ciência que
tem por objetivo orientar
a coleta, a análise e a
interpretação dos dados”
CALLEGARI-
CALLEGARI-JACQUES, S. M. Bioestatística: Princípios e aplicação.
Porto Alegre: Artmed, 2003.
Artmed,
7. BIOESTATÍSTICA
Grego: Bio = vida
“Bioestatística é a aplicação
dos métodos estatísticos à
solução de problemas
biológicos”
CALLEGARI-
CALLEGARI-JACQUES, S. M. Bioestatística: Princípios e aplicação.
Porto Alegre: Artmed, 2003.
Artmed,
8.
9. Estatística na Pesquisa Científica
A pesquisa quantitativa
depende da Estatística nos
seguintes aspectos:
Cálculo do tamanho da amostra
Técnicas de amostragem
Análise estatística
Objetivo: encontrar a resposta à
pergunta da pesquisa
10. ESTATÍSTICA
O método estatístico é iniciado com
a pergunta de pesquisa
Classificar a pergunta em uma das 4
principais categorias : a) diagnóstico; b)
tratamento; c) prognóstico; d) fatores de
risco e etiologia
Para cada uma das categorias existe uma
abordagem diferente quanto ao modelo do
estudo, cálculo do tamanho da amostra e à
análise estatística
11. Fases da investigação Científica
• Escolher o tema, delimitar o assunto e revisar a
literatura pertinente
• Formular a pergunta e a hipótese de pesquisa
• Definir o modelo do estudo
• Definir a técnica de pesquisa a ser adotada
• Definir o tipo de amostragem, selecionar a
amostra e designar as variáveis
• Submeter o protocolo a um Comitê de Ética
• Realizar a coleta dos dados
• Processar e analisar os dados
• Interpretar os resultados
• Redigir o relatório e divulgar os resultados
(publicação)
12. Precisamos ser
capazes de avaliar
corretamente
os resultados de
Pesquisas
Precisamos aprender
a reconhecer se uma
evidência estatística
apoia realmente as conclusões
dos autores.
Precisamos ser consumidores inteligentes de
estatísticas, resultados e conclusões de
pesquisas.
14. Estatística Descritiva
Estatística descritiva: organização,
resumo e apresentação de um conjunto de
dados de forma a produzir informação
Análise
descritiva
Dados Informação
brutos objetiva
PORTANTO, os métodos da estatística descritiva
empregam técnicas numéricas descritivas, tabulares e
gráficas para resumir e apresentar os dados de uma
pesquisa
15. Situação hipotética: Um pesquisador deseja
obter informações a respeito da duração da
permanência hospitalar no HULW/UFPB.
Dados brutos
43 32 62 54 49
48 61 50 42 62
39 59 35 76 48
51 49 23 55 40
46 63 62 36 43
46 44 52 46 57
Organizar
Analisar
Resumir Informação
16. Estatística Descritiva vs. Inferencial
Estatística Descritiva
Métodos estatísticos que visam resumir e
descrever os dados;
Apenas se descrevem as características da amostra,
sem buscar comparações ou análises
Estatística Inferencial
Métodos estatísticos que visam inferir sobre
uma população a partir de uma parte dela
(amostra)
Comparação de grupos
Análise de fatos considerando comparações e até
associações causa-efeito (dependendo do modelo da
pesquisa)
17. NÍVEIS DE MENSURAÇÃO DOS DADOS
Qualitativo Quantitativo
Nominal e Contínua ou
Ordinal Discreta
dicotômica intervalar
(classificação) (contagem)
(classificação) (mensuração)
pressão arterial
sexo, etnia, (baixa, normal, alta), Número de quedas, Idade, renda,
região, grupo escolaridade, classe número de peso, pressão
sanguíneo econômica, auto- internações, arterial,
percepção de saúde número de filhos glicemia
18. Por que é importante determinar
o nível de mensuração dos
dados?
O tipo de nível (escala) de
mensuração dos dados
determina que abordagem
estatística será utilizada tanto
na análise descritiva quanto na
análise inferencial da pesquisa
19. Estatística Descritiva
Organização, análise, redução e
apresentação de dados.
• Frequências
• Medidas de posição
• Medidas de dispersão
• Tabelas e gráficos
• Medidas de correlação
20. Medidas descritivas das variáveis
• Distribuição de frequências
– Frequências absoluta e relativa
– Proporções, porcentagens, razões
• Medidas descritivas
– Medidas de tendência central (ou de
posição)
– Medidas de dispersão (ou variabilidade)
– Medidas separatrizes
21. Apresentação dos Dados:
Tabelas e Gráficos
• Forma não discursiva de apresentar
informações: numérica e gráfica
• Formas de fácil assimilação
• Apresenta os dados de modo ordenado,
simples e de fácil interpretação
• Fornece o máximo de informação em
um mínimo de espaço
22. Apresentação de uma tabela
(exemplo)
Tabela 1- Comparação das concentrações plasmáticas de FSH e estradiol (médias
e desvios-padrão) entre os grupos experimental (GE) e controle (GC) antes e após o
tratamento (n=84) em pacientes climatéricas ambulatoriais (Hospital Universitário
Lauro Wanderley, Universidade Federal da Paraíba, João Pessoa, PB)
Variável Grupos VT1 VT3 p
FSH GE 80,7±29,2 73,6±28,9 0,02*
(UI/mL)
GC 73,6±30,3 74,2±25,9 NS
Estradiol GE 13,0±7,1 16,7±9,3 NS
(pg/mL)
GC 14,1±7,6 14,3±8,3 NS
FSH: hormônio folículo-estimulante; VT1: primeira visita de tratamento; VT3: terceira visita de tratamento; GE: grupo
experimental; GC: grupo controle; *Teste t para amostras independentes, p estatisticamente significativo a ≤0,05. NS= Não
significativo
Fonte: SOUSA-MUÑOZ, R. L.; FILIZOLA, R. G. Efficacy of soy isoflavones for depressive symptoms of the climacteric
syndrome. Maturitas, 63 (1):89-93, 2009.
23. Representação
gráfica dos
dados:
Gráfico de
barras/colunas
Gráfico de setores
Histograma
Diagrama de
dispersão
Diagrama de caixas
24. Representação gráfica de
variáveis qualitativas
Gráficos em barras e colunas
•A construção do gráfico em colunas é
semelhante ao em barras, com a diferença
de que os retângulos são sustentados no
eixo horizontal
F re q u ê n c ia re la tiv a (% )
Outros 35
30
25
20
Cirurgia 15
10
5
Médica 0
O b s tr etríc ia
C iru rg ia
M é d ic a
O u tr os
G in ic o lo gia
Pe dia tria
0 5 10 15 20 25 30 35
e
Frequência relativa (%)
Figuras 1 e 2: Internações em estabelecimento de saúde, por tipo de
clínicados hospitais públicos de João Pessoa, PB – Fonte: IBGE 1992.
25. Gráficos para variáveis nominais
Sexo
Gráfico de
setores
M circulares
45% (pizza, torta)
F
55%
26. Gráfico de colunas para variáveis
quantitativas
FONTE: ROSSI, W. B. et al. Pé diabético: tratamento das úlceras plantares com gesso de contato total e
análise dos fatores que interferem no tempo de cicatrização. Rev Bras Ortop 40 (3):89-97, 2005.
27. Diagrama de Caixas
190
180
são Sistólica (mm de Hg)
170
160
150
140
Pressão S
130
120
110
Não (n = 15) Sim (n = 17)
Hábito de Fumar
Figura 1: Valores representativos da pressão arterial sistólica em função do
hábito de fumar de pacientes atendidos no ambulatório de Pneumologia do
Hospital Universitário Lauro Wanderley (n=32) – João Pessoa, PB.
28. Gráficos para variáveis
quantitativas
Diagrama de caixas (Box plot)
Comprimento do RN
50
Valores extremos
45 Valor Máximo
Q3 = 3° Quartil = 39
40
Q2 = 2° Quartil = 38 IIQ = 4
35 Q1 = 1° Quartil = 35
30
Valor Mínimo
29. Diagrama de dispersão
variáveis quantitativas
FONTE: ROSSI, W. B. et al. Pé
diabético: tratamento das
úlceras plantares com gesso de
contato total e análise dos
fatores que interferem no
tempo de cicatrização. Rev
Bras Ortop 40 (3):89-97,
2005.
31. Histogramas
• Gráfico que reflete a forma da distribuição
de frequências da amostra e a estrutura
(forma) da população de onde foi retirada a
amostra
32. Tabelas vs. Gráficos
Tabelas
• Convenientes quando há
necessidade ou relevância em
explicitar os valores
• Quando se deseja que os
parâmetros apresentados sejam
conhecidos de forma mais precisa
33. Tabelas vs. Gráficos
Gráficos
• Grande número de dados
• Quando não é relevante
apresentar os valores precisos
• Quando se deseja avaliar
comportamentos, tendências ou
relação entre duas variáveis: a
apresentação em um único gráfico
permite uma rápida comparação 33
36. É importante utilizar
amostras de tamanho
adequado
Para fins práticos, considerar:
•Amostras grandes: n>100
•Amostras médias: n>30
•Amostras pequenas: n<30
•Amostras muito pequenas: n<12
DORIA-FILHO, U. Introdução à Bioestatística para simples mortais.
São Paulo: Elsevier, 1999
37. Estatística Inferencial
Testes Estatísticos
A aplicação de um teste estatístico
segue um raciocínio lógico que se
baseia em 4 questões que orientam
o pesquisador em suas decisões:
1. Que tipo de variável está sendo estudada?
2. Quantos conjuntos de dados (amostras) estão
sendo avaliados?
3. As amostras são pareadas ou não-pareadas?
38. Amostras
Pareadas / Não-pareadas
Amostras pareadas
–Mesmo indivíduo
– Duas observações em um mesmo
indivíduo são mais prováveis de
serem similares
Amostras não-pareadas
– Indivíduos são independentes
39. Testes Paramétricos e
Não-Paramétricos
• Testes Paramétricos
– Variáveis intervalares
– Parâmetros: média e desvio-padrão
– Distribuição Normal
• Testes Não-Paramétricos
– Variáveis nominais e ordinais
– Distribuição dos dados não é Normal
(histograma)
40. Testes Estatísticos
Variáveis Quantitativas
Paramétricos Não-Paramétricos
Não-pareadas Pareadas Não pareadas Pareadas
2 amostras 2 amostras 2 amostras 2 amostras
Teste t Teste t Mann-Whitney Wilcoxon
(Student) (Student) X2 (2x2) Mc Nemar
Exato (Fisher)
Mais de 2 Mais de 2 Mais de 2 Mais de 2
ANOVA ANOVA Kruskal Wallis Cochram
X2 (mxn) Friedman
41. Testes Estatísticos
Variáveis Qualitativas
Não-pareadas Pareadas
2 amostras 2 amostras
X2
Teste exato de Teste de McNemar
Fisher
Mais de 2 Mais de 2
X2 Q de Cochran
42. Escolha do teste estatístico -
Exemplo
Critérios para escolha do teste estatístico
“Estudo comparativo entre o controle glicêmico (HBA1c) entre diabéticos ambulatoriais com
baixo apoio social e com apoio social adequado ”
1. Qual o tipo de variável estudada? Quantitativa - ordinal
2. Quantos conjuntos de dados
2 amostras
(amostras) estão sendo avaliados?
3. As amostras são pareadas ou
Não-Pareadas
não-pareadas?
Melhor controle glicêmico
4. Qual o tipo de inferência que se em pacientes com apoio
quer obter a partir do estudo? social adequado
43. SIGNIFICÂNCIA ESTATÍSTICA (P)
• é uma medida estimada do grau em que o
resultado é "verdadeiro" = no sentido de que
seja realmente o que ocorre na população, e
não devido ao acaso
• o nível-p representa a probabilidade de
erro em aceitar o resultado observado como
válido
• a seleção de um nível de significância acima
do qual os resultados serão rejeitados como
inválidos é arbitrária = por convenção.
44. Estatística Inferencial
Nível de Significância
São geralmente adotados como
estatisticamente significativos os níveis p =
0,05 e p = 0,01, ou seja, 5% e 1%
respectivamente.
confiança estatística de 95%
Quando o valor de p é 0,52, por exemplo, isto
é, a probabilidade de que se trate de um
achado ao acaso está acima do limite de 5%
que se arbitra a priori, o resultado não é
estatisticamente significante
45. Estatística Inferencial
Intervalo de Confiança
• Um intervalo de confiança é um intervalo de números
contendo os valores do parâmetro da população
• Corresponde a 95% quando o p > 0,05
• Estimativa intervalar, ao invés de pontual: mais
precisa
46. Estatística Inferencial
Intervalo de Confiança
• Um IC 95% é o intervalo em que há 95%
de probabilidade de conter o valor real da
população
• Um IC de 95% é o intervalo que irá
conter o valor real em 95% das vezes, se
um estudo for repetido várias vezes
utilizando amostras a partir da mesma
população.
47. Estatística Inferencial
Intervalo de Confiança
• IC e valores de p estão intimamente
relacionados
• Valores-p são o resultado do testes de
hipóteses e indicam se os dados da amostra são
evidência suficiente para rejeitar a hipótese
nula – ex. - uma diferença observada entre
dois tratamentos = os dois tratamentos têm
eficácia realmente diferente ou é devido ao
acaso
• IC descreve a precisão do valor estimado
• Ex. p=0,09; IC 95% (95,5-118,9)