ATIVIDADE 2 - DESENVOLVIMENTO E APRENDIZAGEM MOTORA - 52_2024
Estatística Descritiva
1. Paulo Novis Rocha Nefrologista Professor Adjunto do Depto. Medicina FMB-UFBA Professor Colaborador do PPgCS Coordenador da Disciplina de Bioestatística
13. Neto, AMS 2008. Bioestatística Sem Segredos A Estatística pode ser dividida em três partes: Estatística Descritiva Descreve Caracterização dos indivíduos estudados Estatística Analítica Analisa Investigação das relações entre as características estudadas Estatística Inferencial Infere Avaliação da possibilidade de generalização
14. Neto, AMS 2008. Bioestatística Sem Segredos TÉCNICAS MAIS UTILIZADAS NA ESTATÍSTICA DESCRITIVA Cálculo de freqüências simples, simples acumulada, relativa e relativa acumulada Cálculo de medidas de tendência central (moda, média aritmética, média ponderada, mediana) Cálculo de medidas de dispersão (amplitude, desvio médio, variância, desvio padrão, coeficiente de variação) Cálculo de medidas de posição (porcentis) Elaboração de tabelas univariáveis Elaboração de gráficos Avaliação da forma como as frequencias de uma variável se distribuem
15. Neto, AMS 2008. Bioestatística Sem Segredos TÉCNICAS MAIS UTILIZADAS NA ESTATÍSTICA ANALÍTICA Elaboração de diagramas considerando mais de uma variável (ex. diagramas de dispersão) Elaboração de tabelas de contingência bivariáveis ou multivariáveis Cálculo de medidas de associação entre variáveis (razão ou diferença entre prevalências, entre incidências ou risco relativo ou atribuível, entre chances, coeficientes de correlação, coeficientes de regressão) Análise estratificada Análise multivariável
16. Neto, AMS 2008. Bioestatística Sem Segredos TÉCNICAS MAIS UTILIZADAS NA ESTATÍSTICA INFERENCIAL Teste Z para uma ou duas médias Cálculo do índice capa (Teste Z) Teste t para uma ou duas médias Análise de regressão linear (Testes F ou Z) Teste t para amostras emparelhadas Teste exato de Fisher Teste Z para uma ou duas proporções Teste do sinal Teste X 2 para duas ou mais proporções Teste de Wilcoxon Teste X 2 de Mantel e Haenszel Teste da mediana Teste para uma variância Teste de Mann-Whitney Teste F para duas variâncias Teste de Kruskal-Wallis Análise de variância (Teste F) Teste de Friedman Análise de correlação intraclasse (Teste F) Análise de correlação de Spearman Análise de correlação de Pearson (Teste t) Teste de McNemar Cálculo do alfa de Cronbach (Teste F) Elaboração do diagrama de barra de erro
17. Neto, AMS 2008. Bioestatística Sem Segredos TÉCNICAS ESTATÍSTICAS NÃO ABORDADAS Técnicas de análise exploratória de dados Análise de regressão de Weibull Cálculo de medidas de associação (RR, RC, etc...) Análise de regressão de Poisson Cálculo do índice de concordância capa Análise de regressão binomial negativa Cálculo do alfa de Cronbach Análise de regressão log-linear Teste qui-quadrado de Mantel e Haenszel Análise de regressão hierárquica Teste para uma variância Análise discriminante Análise de variância / An álise de correlação intra-classe Análise de variância multinomial (MANOVA) Teste do sinal Análise de correlação de Kendall Teste de Wilcoxon Análise de contingência Teste da mediana Análise de correlação canônica Teste de Mann-Whitney Análise de correlação parcial múltipla Teste de Kruskal-Wallis Análise de escala multidimensional Teste de Friedman Análise de componentes principais Teste de McNemar Análise de fator Análise de correlação de Spearman Análise de correspondência Análise de correlação de Pearson Análise de homogeneidade Análise de regressão linear Análise de agrupamento (“cluster analysis”) Análise de regressão logística Análise por redes neurais artificiais Análise de regressão de Cox
25. CLASSIFICAÇÃO DE VARIÁVEIS V. Quanto à posição no quadro de hipóteses: Variável independente principal Variável independente secundária Variável dependente associação principal Variável interveniente Neto, AMS 2008. Bioestatística Sem Segredos
26. Neto, AMS 2008. Bioestatística Sem Segredos CLASSIFICAÇÃO DAS VARIÁVEIS QUANTO À POSIÇÃO NO QUADRO DE HIPÓTESES Dependente Supõe-se que sua ocorrência depende da influência das variáveis independentes Independente Principal Variável de interesse do estudo Secundárias Podem influenciar a associação principal Interveniente Encontra-se no caminho causal entre a variável independente principal e a variável dependente do estudo
30. Acute Renal Failure after Lung Transplantation: Incidence, Predictors and Impact on Perioperative Morbidity and Mortality. Rocha et al. American Journal of Transplantation 2005; 5: 1469–1476
47. * Não esquecer de checar a veracidade de valores extremos Dica: além das medidas de tendência central, checar máx. e mín. QUANDO UTILIZAR MODA, MÉDIA, MEDIANA MODA Série é unimodal MÉDIA Variável é contínua Série não contém valores extremos MEDIANA Variável é discreta e n é ímpar Série contém valores extremos*
54. MEDIDAS DE DISPERSÃO Amplitude Amplitude interquartil Desvio médio Variância Desvio-padrão Coeficiente de variação
55.
56. Número da criança na pesquisa Valores de altura (metros) 1 1,14 2 0,86 3 1,24 4 1,17 5 0,94 Número da criança na pesquisa Valores de altura (metros) 2 0,86 5 0,94 1 1,14 4 1,17 3 1,24
57.
58.
59.
60. Número da criança na pesquisa Valores de altura (metros) Média de altura Desvio em relação à média Soma dos desvios 1 1,14 1,07 + 0,07 0,00 2 0,86 - 0,21 3 1,24 + 0,17 4 1,17 + 0,10 5 0,94 - 0,13
63. Porque o denominador é 4 (n-1) e não 5? Número da criança na pesquisa Valores de altura (metros) Média de altura Desvio em relação à média Soma dos desvios 1 1,14 1,07 + 0,07 0,00 2 0,86 - 0,21 3 1,24 + 0,17 4 1,17 + 0,10 5 0,94 - 0,13
67. Número da criança na pesquisa Valores de altura (metros) Média de altura Desvio em relação à média Soma dos desvios 1 1,14 1,07 + 0,07 0,00 2 0,86 - 0,21 3 1,24 + 0,17 4 1,17 + 0,10 5 0,94 - 0,13
68.
69.
70. Número da criança na pesquisa Valores de altura (metros) Valores de peso (kg) 1 1,14 20,70 2 0,86 15,40 3 1,24 21,40 4 1,17 21,10 5 0,94 17,45 Média 1,07 19,21 Desvio-padrão 0,17 2,66 Coeficiente de variação 15,89% 13,85%
71.
72.
73.
Notas do Editor
Alternativas: Prova I após aula de amostragem Prova I junta com Prova II Prova I em outra data à combinar
SPSS Level of measurement: scale (intervalar, ratio), ordinal, nominal
Qualitativa: sempre discretas Dicotômica nominal: sexo Policotômica nominal: orientação sexual Policotômica ordinal: grau de instrução Quantitativa: contínua ou discreta Contínua discreta: temperatura Contínua de razão: peso, altura, idade, glicemia Discreta de razão: número de filhos, número de gestações
Ex 1: Hipótese: fumar leva a câncer de pulmão Variável dependente = câncer de pulmão Variável independente principal = hábito de fumar Variável independente secundária = idade Ex 2: Hipótese: condição social se associa a maior mortalidade por pneumonia em crianças Variável dependente = mortalidade por pneumonia Variável independente principal = condição social da família Variável interveniente = peso ao nascer Outros exemplos: Sepse IRA Pneumonia Ventilação mecânica
568 720
Média Ponderada: peso 6x(média das 3 avaliações) + peso 4x(nota prova final); dividi-se este resultado pela soma dos pesos (10).
O quartil 2, ou porcentil 50 = mediana Cálculo: ¼ ou ½ ou ¾ (n +1). Revelará a posição onde se encontram estes quartis. Em seguida, determinar o valor.
Séries podem ser diferentes, mas ter a mesma média (e ou mediana). Dispersão = variabilidade Amplitude = valor máximo – valor mínimo Amplitude interquartil Desvio médio, variância e desvio padrão medem o quanto, em média, os valores da série afastam-se da média aritmética dos valores. Variância é o quadrado do desvio-padrão.
Mede a amplitude de variação dos valores mais centrais da série (enquanto a AMPLITUDE mede os extremos)
Mede-se o quanto cada valor se desviou da média Soma-se o módulo destes valores Divide-se pelo número de indivíduos da série (deveria ser n-1, mas, como não é utilizado para inferência estatística, isso tem pouca importância)
Além de anular o sinal, elevar ao quadrado aumenta a influência dos desvios maiores.
Além de anular o sinal, elevar ao quadrado aumenta a influência dos desvios maiores.
Mede-se o quanto cada valor se desviou da média Soma-se o quadrado destes valores Divide-se pelo número de indivíduos da série MENOS 1 (n-1): 1 indivíduo (ou valor) não teve a chance (liberdade) de variar. Em notações populacionais, pode dividir apenas por N (pois, se a população for muito grande, a subtração de 1 não vai alterar o resultado) O desvio-padrão é a raiz quadrada da variância
COEFICIENTE DE ASSIMETRIA: mede a assimetria de uma distribuição. Se a distribuição for razoavelmente simétrica assumirá um valor entre –1 e +1. Se a distribuição for assimétrica à esquerda, a cauda é mais longa deste lado. Neste caso o coeficiente terá um valor negativo. A assimetria à direita é positiva. CURTOSE: mede o achatamento de uma distribuição. Quanto menor o valor da curtose, mais curta, mais achatada é a distribuição (platicúrtica). Se a curtose for positiva, significa que a distribuição é mais alongada (leptocúrtica). Se a distribuição não for nem chata nem alongada sua curtose será igual a zero (mesocúrtica).