1) O documento discute conceitos básicos de estatística, incluindo definição, tipos de variáveis, amostragem, distribuição de frequência e medidas de tendência central.
2) São apresentados diferentes tipos de variáveis, amostragem, e elementos importantes para construir uma distribuição de frequência como classes, frequências e medidas de tendência central.
3) A média aritmética é descrita como uma medida importante de tendência central que sintetiza os dados em um único valor.
1. Centro Federal de Educação Tecnológica de Química de Nilópolis/RJ ESTATÍSTICA BÁSICA MÉTODOS QUANTITATIVOS TRATAMENTO DE DADOS Profa. Daniela Gomes Email: [email_address]
2.
3. O QUE É ESTATÍSTICA? Inicialmente a Estatística tratava da compilação de dados (nº de habitantes, nº de nascimentos, estimativas das riquezas etc). Quando começa a ter aspecto mais científico esse conjunto de técnicas recebe o nome de estatística por Godofredo Achenwall no século XVIII. Passa da simples catalogação de dados numéricos para ser um estudo mais completo desses dados. O método estatístico trata-se de um conjunto de técnicas para coletar, organizar, descrever, analisar e interpretar dados. Com base nos resultados obtidos, busca-se subsídios para planejar e tomar decisões.
4. A ESTATÍSTICA E A PROBABILIDADE A probabilidade tem origem no século XVII, surgindo bem depois da Estatística, e tem como objetivo resolver questões de jogo de azar. Somente no século XX a probabilidade obteve teoria matemática mais rigorosa fundamentada em axiomas, definições e teoremas. A junção da probabilidade à Estatística permitiu, com base na análise de dados, extrair conclusões mais válidas sobre o fenômeno observado, auxiliando com maior precisão a tomada de decisão.
5.
6.
7.
8.
9.
10. DADOS BRUTOS : dados originais na forma com que foram coletados, refere-se aqueles dados que não foram numericamente organizados ou ordenados. ROL ESTATÍSTICO : dados numéricos arranjados em ordem de grandeza crescente ou decrescente. AMPLITUDE TOTAL : com os dados elaborados pode-se estimar a amplitude total do conjunto de dados ( A ), a partir da diferença entre o maior e menor valor observados no conjunto. A = X n – X 1 = MAIOR VALOR – MENOR VALOR VARIÁVEL : característica dos elementos observados. CENSO : estudo realizado com todos os elementos de uma população. PESQUISA : estudo realizado a partir de uma amostra. CONCEITOS BÁSICOS
11. Exemplo de dados brutos : Estatura (cm) de 40 alunos do curso de Estatística. Exemplo de rol estatístico : Estatura (cm) de 40 alunos do curso de Estatística.
12. DADOS BRUTOS : dados originais na forma com que foram coletados, refere-se aqueles dados que não foram numericamente organizados ou ordenados. ROL ESTATÍSTICO : dados numéricos arranjados em ordem de grandeza crescente ou decrescente. AMPLITUDE TOTAL : com os dados elaborados pode-se estimar a amplitude total do conjunto de dados ( A ), a partir da diferença entre o maior e menor valor observados no conjunto. A = X n – X 1 = MAIOR VALOR – MENOR VALOR VARIÁVEL : característica dos elementos observados. CENSO : estudo realizado com todos os elementos de uma população. PESQUISA : estudo realizado a partir de uma amostra. CONCEITOS BÁSICOS
13. Variáveis Qualitativas: Expressam atributos, qualidades dos elementos pesquisados. Exemplos : estado civil, profissão, escolaridade (fundamental, médio, superior), sexo. VARIÁVEIS Variáveis Quantitativas: Implicam em relações de mensuração, medida, contagem. Exemplos : salário, idade, preço, produção, escolaridade (nº de anos na escola), nº de filhos.
14. TIPOS DE VARIÁVEIS Nominal: não é possível fazer nenhuma classificação depois das realizações. Ordinal: é possível atribuir alguma ordem aos indivíduos depois de atribuída a característica. Discreta: valores assumem um conjunto finito de valores possíveis. Contínua: valores pertencem a um intervalo dos número Reais. Variável Qualitativa Quantitativa Nominal Ordinal Contínua Discreta => estado civil, profissão => grau de instrução => nº de habitantes, nº de filhos => peso, estatura de um indivíduo
15. TIPOS DE MENSURAÇÃO Os dados também podem ser classificados quanto ao tipo de mensuração: nominal , ordinal , intervalar e razão . Nominal – trata-se de dados que consistem em nomes, rótulos e categorias. Não é possível realizar nenhum tipo de ordenação e nenhum cálculo com dados do tipo nominal. Ex. respostas do tipo “sim, não, não sei informar”; “partido político do deputados”. Ordinal – refere-se aos dados que podem ser ordenados de algum modo, ainda assim, não faz sentido realizar cálculos. Ex. respostas do tipo “ótimo, bom, ruim, péssimo”. Intervalar – é análogo ao nível ordinal, porém é possível realizar cálculos. Neste caso, não existe um ponto de partida zero, por exemplo, as temperaturas 35,8ºC e 35,3ºC são dados de nível intervalar, porém quando se registra temperatura igual a 0ºC isso não significa ausência de calor (não existe zero absoluto) Razão – é o nível de intervalo incluindo o ponto de partida zero, pois o zero significa nenhuma quantidade presente. Ex. distância em Km percorrida por dois carros em uma prova.
16.
17. DISTRIBUIÇÃO DE FREQÜÊNCIA Sem intervalos de classe Distribuição das famílias segundo o número de filhos Fonte: Hipotética.
18. DISTRIBUIÇÃO DE FREQÜÊNCIA Com intervalos de classe Distribuição da estatura (cm) dos alunos do curso de Estatística Fonte: Hipotética.
19. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA a) Limites inferiores de classe ( ): os menores valores do intervalo de classes; b) Limites inferiores de classe ( ): os maiores valores do intervalo de classes; c) Amplitude de classe: é a diferença entre dois limites inferiores de classe consecutivos; d) Pontos médios de classe ( ): e) Freqüência absoluta ou simples ( ): número de observações correspondente a determinada classe ou categoria ou valor. Desse modo, . f) Freqüência relativa ( ): é a razão entre a freqüência simples e a freqüência total da classe, multiplicada por cem (%): g) Freqüência acumulada ( ): é a soma das freqüências de uma classe e de todas as classes que a antecedem, partindo da freqüência da primeira classe. h) Freqüência acumulada relativa ( ): é a freqüência acumulada de uma classe dividida pela freqüência total da distribuição, multiplicada por cem (%):
20. PASSOS PARA CONSTRUIR UMA DISTRIBUIÇÃO DE FREQÜÊNCIA a) Determinar o número de classes : geralmente o número de classes é escolhido por muitos autores em um valor entre 5 e 20, de uma forma empírica. A familiaridade do pesquisador com os dados é que deve indicar quantas classes devem ser construídas. b) Amplitude de classe : na construção da distribuição de freqüência define-se a amplitude de classe como sendo a diferença entre o maior e o menor valor do rol dividida pelo número de classes. c) Limite inferior da primeira classe ( ): deve-se iniciar o processo de construção das classes determinando o limite inferior da primeira classe a ser formada. A escolha deste valor é feita por muitos autores, como menor valor amostral, ou seja, o menor valor observado no rol estatístico (ponto de partida). d) Determinação dos limites inferiores das demais classes : somar ao valor do limite inferior da primeira classe a amplitude de classe para obter o limite inferior da segunda classe, e, assim, sucessivamente. e) Limite superior ( ): o limite superior da primeira classe será o limite inferior da segunda classe e, assim, sucessivamente, até que o maior valor observado esteja contido na última classe. f) Determinar a freqüência total de cada classe.
21. Exemplo de distribuição de freqüência com intervalos de classes: DISTRIBUIÇÃO DE FREQÜÊNCIA 1. Quantos alunos têm estatura entre 154 e 157 cm? 2. Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm? 3. Quantos alunos têm estatura inferior a 162 cm? 4. Quantos alunos têm estatura superior a 158 cm? Fonte: Hipotética.
22. MEDIDAS DE TENDÊNCIA CENTRAL Corresponde a um valor no centro ou no meio do conjunto de dados, o qual permite traduzir algumas características desse conjunto de dados. Em outra palavras, uma medida de tendência central procura sintetizar as informações da amostra em um único e informativo valor. As principais medidas de tendência central são: a média aritmética ; a mediana e a moda .
23. A MÉDIA ARITMÉTICA A média aritmética é a principal medida de tendência central, sendo utilizada principalmente quando os dados apresentam distribuição simétrica ou aproximadamente simétrica. É o centro do conjunto de dados, ou seja, um ponto de equilíbrio dos mesmos, tratando-se da soma de todas as observações dividida pelo total do número de observações. Observações: 1) A média é um bom estimador quando na série de dados não existem valores atípicos (ou extremos). Quando há valores atípicos no conjunto de dados, a média pode ser bastante afetada tanto por valores extremos mínimos quanto por valores extremos máximos. 2) O que é uma distribuição simétrica ou aproximadamente simétrica? Diz-se que uma distribuição é simétrica quando a metade esquerda de seu histograma é a imagem-espelho da metade direita.
24.
25. PROPRIEDADES DA MÉDIA ARITMÉTICA 1ª) A soma algébrica dos desvios tomados em relação a média é nula. O desvio em relação a média é a diferença entre cada elemento de um conjunto de valores e a média aritmética desse conjunto: . Então, 2ª) Somando-se ou subtraindo-se uma constante c a todos os valores de um conjunto de dados, a média do conjunto fica aumentada ou diminuída dessa constante. Ou seja, , onde, é a média do novo conjunto de dados. 3ª) Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante c , a média do conjunto fica multiplicada ou dividida por essa constante. Desse modo, , é a média do novo conjunto de dados.
26.
27. Mediana para dados agrupados sem intervalos de classe : É necessário determinar as freqüências acumuladas para verificar a posição em que a mediana se encontra. Pois, a mediana será o valor da variável correspondente a freqüência acumulada imediatamente superior à metade da soma das freqüências. Ou seja, Observação: Se , a mediana será , correspondente ao encontrado. A MEDIANA (Md)
28. Mediana para dados agrupados com intervalos de classe : Ao determinar a classe mediana correspondente a freqüência acumulada imediatamente superior a , utiliza-se a seguinte fórmula: - limite inferior da classe mediana - posição (ordem) do valor da mediana - freqüência acumulada da classe anterior à classe mediana - freqüência simples da classe mediana - amplitude do intervalo da classe mediana Observação: caso exista uma freqüência acumulada exatamente igual a , a mediana será o limite superior da classe correspondente. A MEDIANA (Md)
29. PROPRIEDADES DA MEDIANA 1ª) Somando-se ou subtraindo-se uma constante c a todos os valores de um conjunto de dados, a mediana do conjunto também ficará aumentada ou diminuída dessa constante. 2ª) Assim como a média a mediana é influenciada quando o conjunto de dados é multiplicado ou dividido por determinada constante c . Nesse caso, a mediana do conjunto fica multiplicada ou dividida por essa constante.
30.
31. PROPRIEDADES DA MODA 1ª) Também nesse caso, somando-se ou subtraindo-se uma constante c a todos os valores de um conjunto de dados, a moda do conjunto também ficará aumentada ou diminuída dessa constante. 2ª) A moda é influenciada quando o conjunto de dados é multiplicado ou dividido por determinada constante c . Nesse caso, a nova moda do conjunto fica multiplicada ou dividida por essa constante.
32. BIBLIOGRAFIA BUSSAB, W. O. e MORETTIN, P. A. Estatística básica . 5ª edição (8ª tiragem). Ed. Saraiva: São Paulo, SP, 2007. CRESPO, Antônio Arnot. Estatística Básica . 1ª Edição. São Paulo, SP: Saraiva, 1984. MEYER, P.L. Probabilidade, aplicações a estatística . Tradução de Ruy C. B. Lourenço Filho. Rio de Janeiro, RJ, 1984. SPIEGEL, Murray R, et al . Teoria de Problemas de Probabilidade e Estatística . Trad. Sara Ianda Correa Carmona. 2ª Edição. Porto Alegre, RS: Bookman, 2004. (Coleção Shaum) TIOLA, Mário F. Introdução a Estatística . Trad. Alfredo Alves de Farias. 7ª Edição. Rio de Janeiro, RJ: LTC, 1998.