Estatística é a ciência dos dados e envolve coleta, organização, análise e interpretação de dados para tirar conclusões. A estatística descritiva organiza e descreve os dados calculando médias e variâncias, enquanto a estatística indutiva estima parâmetros e testa hipóteses. A amostragem é fundamental para obter os dados de uma população.
1. Estatística básicaEstatística básica
Estatística é a ciência dos dados, envolvendo oEstatística é a ciência dos dados, envolvendo o
desenvolvimento de processos, métodos e técnicas de
coleta classificação organização resumo análise ecoleta, classificação, organização, resumo, análise e
interpretação de dados sobre uma população, e os
é d d i l õ f di õmétodos de tirar conclusões ou fazer predições com
base nesses dados.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
3. Estatística básicaEstatística básica
• A estatística tem a capacidade de sintetizar os dados;A estatística tem a capacidade de sintetizar os dados;
• A amostragem é o ponto de partida (na prática) para• A amostragem é o ponto de partida (na prática) para
todo um Estudo Estatístico. É através da amostragem
b d d d di ã d d i dque obtemos os dados da medição de determinada
característica ou propriedade de um objeto, pessoa ou
coisa;
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
4. Estatística básicaEstatística básica
• População: é a coleção de todas as observaçõesPopulação: é a coleção de todas as observações
potenciais sobre determinado fenômeno;
•Amostra: é o conjunto de dados efetivamente•Amostra: é o conjunto de dados efetivamente
observados, ou extraídos;
População
Amostras
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
5. Estatística básicaEstatística básica
Cada observação individual ou item é denominadaCada observação individual ou item é denominada
como unidade elementar, que pode estar composta
por um ou mais itens medidos propriedadespor um ou mais itens medidos, propriedades,
atributos, etc, denominados como variáveis.
Variável é uma característica, propriedade ou, p p
atributo de uma unidade da população, cujo
l d i t id d dvalor pode variar entre as unidades da
população.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
7. Estatística básicaEstatística básica
•Tipos de variáveisTipos de variáveis
N i l
Qualitativa
Nominal
Variável
Ordinal
Variável
Discreta
Quantitativa
Contínua
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
8. Estatística básicaEstatística básica
• Exemplo: Para uma população de peças produzidos em umExemplo: Para uma população de peças produzidos em um
processo, poderíamos ter:
Variável TipoVariável Tipo
Estado: Perfeita ou defeituosa Qualitativa Nominal
Qualidade: 1ª, 2ª ou 3ª categoria Qualitativa Ordinal
Número de peças defeituosas Quantitativa Discreta
Diâmetro das peças Quantitativa Contínua
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
9. Estatística básicaEstatística básica
Agrupamento de dados e distribuição de frequências
• Quando vamos fazer um levantamento de uma população, um dos
passos é retirar uma amostra dessa população e obter dados relativos
à variável desejada nessa amostra;
• Cabe à Estatística sintetizar tais dados na forma de tabela e gráficos
que contenham além dos valores das variáveis o número deque contenham, além dos valores das variáveis, o número de
elementos correspondentes a cada variável;
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
10. Estatística básicaEstatística básica
Agrupamento de dados e distribuição de frequências
• A esse procedimento está associado o conceito de:
• Dados brutos: é o conjunto de dados numéricos obtidos que ainda
ã f i dnão foram organizados;
• Rol: é o arranjo dos dados brutos em ordem crescente (ou
decrescente);decrescente);
• Amplitude (H): é a diferença entre o maior e o menor dos valores
observados;;
•Frequência absoluta (ni): é o número de vezes que um elemento
aparece na amostra;
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
11. Estatística básicaEstatística básica
Agrupamento de dados e distribuição de frequências
• n : número total de dados da amostra nn
k
i
i =∑1
• k : número de valores diferentes na amostra
k
i =1
• Frequência relativa (fi):
n
n
f i
i = 1
1
=∑=
k
i
if
• Frequência absoluta acumulada (Ni): é a soma da frequência absoluta
do valor da variável i com todas as frequências absolutas anteriores;
• Frequência relativa acumulada (Fi):
N
F i
n
N
F i
i =
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
12. Estatística básica
Agrupamento de dados e distribuição de frequências
• Exemplo: Os seguintes dados foram amostrados do números de negócios
efetuados diariamente por um operador financeiro:
População: Número de negócios efetuados diariamente
Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17,
14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12}, , , , , , , , , , , , , , }
Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14,
14,14, 15,15,15, 16,16, 17}
Amplitude: 17 – 11 = 6Amplitude: 17 – 11 = 6
n = 26 observações
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
15. Estatística básica
Classes
• As classes são um artifício para condensar o número de elementos
diferentes de uma amostra. Imagine construir uma tabela para 200
l dif ld d bl ivalores diferentes, nos moldes do problema anterior.
• Os principais pré‐requisitos para uma boa definição de classes em um
conjunto de dados são:conjunto de dados são:
•a) as classes devem abranger todas as observações;
•b) o extremo superior de uma classe é o extremo inferior da classe
subsequente (simbologia: |⎯, intervalo fechado à esquerda e aberto à
di i )direita);
•c) cada valor absoluto deve enquadrar‐se em apenas uma classe;
•d) k ≤ 25 de modo geral sendo k o número de classes;d) k ≤ 25, de modo geral, sendo k o número de classes;
•e) As unidades das classes devem ser as mesmas dos dados.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
16. Estatística básica
Classes
• Cálculo de k:
Nk l1 (Fórmula de Sturges)Nk 2log1 +=
Nk ≅
2ln
ln
22
n
knn kk
=⇒=⇒≤
Obs.: N é o número de elementos diferentes da amostra e, muitas
vezes, pode ser considerado N = n (no. de observações).
• Intervalo da classe (h): h ≈ H/k
• Ponto médio da classe (xi) : Ponto médio entre o limite inferior e o
limite superior de cada classe.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
17. Estatística básica
• Exemplo: Utilizando os dados do exemplo anterior, temos:
37 ≅≅k 6=H
3
2l
ln
47log1 2
≅=
≅+=
Nk
k
2
3
6
==h
3
2ln
≅k 3
Freq
Faixa de
negócios
Xi
Freq.
Absoluta
Freq.
Relativa
Freq. Absoluta
Acumulada
Freq.
Acumulad
a
11|⎯13 12 7 26,92% 7 26,92%
13|⎯15 14 13 50,00% 20 76,92%
15|⎯17 16 6 23,08% 26 100,00%| , ,
Total 26 100,00%
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
18. Estatística básica
Medidas de Posição
• Mostram o valor representativo em torno do qual os dados tendem a
n
p q
agrupar‐se com maior ou menor frequência.
x
xxxxx
x
n
i
i
n
∑=
=
+++++
= 14321 ...
• Média aritmética:
nn
x ==
∑=
=
++++
=
i
n
i
i
nn
px
pxpxpxpx
x 1332211
.
.......
• Média aritmética ponderada:
∑=
=
++++
= n
i
i
n
p
pppp
x
1
321 ...
pi : peso da amostra xi
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
19. Estatística básica
Medidas de Posição
• Exemplo: Os dados {11, 13, 15, 17, 19} apresenta a seguintep { , , , , } p g
média (n=5, pois temos cinco números) :
1917151311 ++++
15
5
1917151311
=
++++
=x
• Se um aluno obteve as notas {7, 10, 6, 8} com pesos {1, 2, 2,{ } p {
3}, qual será a nota final do aluno:
875,7
8
63
3221
3.82.62.101.7
==
+++
+++
=x
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
21. Estatística básica
Medidas de Posição
• Média aritmética ponderada para dados agrupados em classes:
∑++++ i
n
i
i nx
nxnxnxnx 1332211
.
.......
∑
=
=
++++
++++
= n
i
i
i
n
nn
n
nnnn
nxnxnxnx
x
1
1
321
332211
...
.......
=i 1
∑=
n
inn
n
f i
i =• Sabendo que: ∑=i
i
1 n
fi
n
i
i
inn fxfxfxfxfxx ∑=
=++++=
1
332211 ........
• fi : Frequência de ocorrência da amostra xi
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
23. Estatística básica
Medidas de Posição
• A média pela frequência absoluta é:p q
1237652
1.172.163.157.146.135.122.11
++++++
++++++
=x
5413
352
1237652
≈=
++++++
x
• A média pela frequência relativa é:
54,13
26
≈x
p q
%08,23.13%23,19.12%69,7.11 +++=x
5413
%85,3.17%69,7.16%54,11.15%92,26.14 +++
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
54,13≈x
24. Estatística básica Valor
Medidas de Posição
• Exemplo: Calcule a média da tabela abaixo:
Valor
médio da
classe
p
3626161314712 ++
92,13
26
362
6137
6.1613.147.12
≈=
++
++
=x
•Observe que o resultado apresentou uma pequena diferença do anterior (2,8% maior que 13,54 ). A precisão dos
dados na tabela em classes diminuiu pouco em relação aos dados originais.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
25. Estatística básica
Medidas de Posição
• Mediana: É o valor do meio de um conjunto de dados, quando osj , q
dados estão dispostos em ordem crescente ou decrescente, ou seja, o Rol
de Dados.
termo
n
x
o
⎟
⎠
⎞
⎜
⎝
⎛ +
=
1~
Se n é impar⎟
⎠
⎜
⎝ 2
Se n é impar
1
22~
termo
n
termo
n
x
oo
⎟
⎠
⎞
⎜
⎝
⎛
++⎟
⎠
⎞
⎜
⎝
⎛
Se n é par
2
x ⎠⎝⎠⎝=
p
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
26. Estatística básica
Medidas de Posição
Exemplo: Qual a mediana dos dados abaixo:p
Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13,
14, 13, 15, 16, 12, 12}
Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15,
16,16, 17}
n = 26 observações (par)
513
14131413
1
2
26
2
26
~ ++
⎟
⎠
⎞
⎜
⎝
⎛
++⎟
⎠
⎞
⎜
⎝
⎛
termotermo
termotermo
x
oo
oo
5,13
222
===⎠⎝⎠⎝=x
A mediana dos dados é 13,5.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
27. Estatística básica
Medidas de Posição
• Exemplo: Calcule a mediana dos dados abaixo:p
• A mediana estará na faixa de 13 a 15, pois temos no total 26 observações e mediana
i (13º ) ( i ã i l l édi 13º 14ºencontra‐se no meio (13º termo) (aqui não iremos calcular a média entre o 13º e o 14º ‐
Verique !).
71313 ~
~
−x
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
92,13
720
713
1315
13
13
13
≈⇒
−
−
=
− x
x
28. Estatística básica
Medidas de Posição
• Moda ou classe modal (mo): É o valor que representa a maior( o) q p
frequência em um conjunto de observações individuais. Em alguns casos,
pode haver mais de uma moda.
X Xi ni
0|⎯ 3 1,5 7
3|⎯ 6 4,5 13 ⇒ Classe modal3| 6 ,
6|⎯ 9 7,5 6
9|⎯ 12 10 5 2
⇒ Classe modal
9| 12 10,5 2
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
29. Estatística básica
Medidas de Posição
S í l l d j d b õ
Média
• Sensível a valores extremos de um conjunto de observações
• Usa todos os dados disponíveis
• “Robusta” : Não sofre muito com a presença de alguns valores
Mediana
muito altos ou muito baixos
• Não usa todos os dados disponíveis
• Não é afetada por valores extremos
Moda • Não usa todos os dados disponíveis
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
30. Estatística básica
Medidas de Posição
• Percentil: De forma geral, o percentil de um conjunto de valoresg , p j
postos em ordem crescente é um valor que contém p% das observações
abaixo dele.
Os percentis de ordem 25, 50 e 75 são chamados de quartis. Os decis são
os percentis de ordem 10, 20, ..., 90.
10 −
=
− xp
p 10100 −
=
− n
x1 n 1
1
.100
−
=
n
x
p
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
x1 n 1−n
31. Estatística básica
Medidas de Posição
• Calcular o percentil de ordem 50 (2º Quartil).p ( )
Q50 = mediana (são 50 dados ⇒ o Q50 está no 25º termo)
X n AcumX ni Acum.
1,810|⎯ 1,822 7 7
2139
2125
83418461
834,1
~
−
=
−x
1,822|⎯ 1,834 14 21
2139834,1846,1 −−
48341
~
1,834|⎯ 1,846 18 39
18
4
012,0
834,1
=
−x
1,846|⎯ 1,858 7 46
1 858| 1 870 4 50
837,1
~
=x1,858|⎯ 1,870 4 50
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
32. Estatística básica
As medidas de dispersão possuem a finalidade de verificar quanto os
Medidas de Dispersão ou Variabilidade
valores da série estão distantes da média da série.
O principal meio de calcular a variabilidade é através da variância, que é
l l d l fó l b icalculada pela fórmula abaixo:
( )2
nn
( ) 2
1
2
1
2
2
xxx
n
i
i
n
i
i − ∑∑ 112
x
nn
s ii
−== ==
Onde n é o número de observações, é a média e xi são os valores
individuais. Esta fórmula é valida para população. Para amostra deve‐se
x
individuais. Esta fórmula é valida para população. Para amostra deve se
considerar n‐1 ao invés de n.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
33. Estatística básica
Medidas de Dispersão ou Variabilidade
Exemplo: Os dados {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} apresentam qual média,
variância e desvio padrão ?
A ê i t 10 ú A édi é i l d lA sequência apresenta n=10 números. A média é igual a soma dos valores
dividido pelo número de elementos. A variância e desvio padrão são
calculados na sequência:calculados na sequência:
5,5
10
55
==x
385109...21 2222
1
2
=++++=∑=
x
n
n
i
i
25,85,5
10
385 22
1
2
2
=−=−=
∑=
x
n
x
s
n
i
i
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
87,225,82
=∴=⇒ ss
34. Estatística básica
Para calcular a variância quando os dados estiverem dispostos em classes
Medidas de Dispersão ou Variabilidade
deve‐se utilizar a seguinte fórmula:
( )
k
2
( )
( )∑
∑=
−=
−
=
k
ii
i
ii
fxx
nxx
s
2
1
2
2
.
.
k é o número de classes, ni é a frequência absoluta, n o número de observações e fi a frequência
relativa;
( )∑=in 1
relativa;
•Quando extraímos a raiz quadrada da variância, obtemos o desvio
padrão (s).
• Uma observação importante é que a variância possui as unidades dos
dados individuais elevado ao quadrado enquanto que o desvio padrão edados individuais elevado ao quadrado, enquanto que o desvio padrão e
média possuem mesma unidade.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
35. Estatística básica
Medidas de Dispersão ou Variabilidade
Exemplo: Calcular a variância e desvio padrão dos dados abaixo:
X
Freq.
Absoluta Iremos realizar osAbsoluta
1,810|⎯1,822 7
Iremos realizar os
cálculos na forma de
tabela, porque os dados
1,822|⎯1,834 14
1,834|⎯1,846 18
, p q
ficam mais organizados e
os cálculos mais fáceis de
1,846|⎯1,858 7
1,858|⎯1,870 4
serem entendidos.
1,858| 1,870 4
( ) nxx
k
∑
2
Verifique que as colunas serão organizadas de acordo com a fórmula para
calcular a variância
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
( )
n
nxx
s i
ii∑=
−
= 12
.calcular a variância.
36. Estatística básica
Medidas de Dispersão ou Variabilidade
x xi ni xi‐xm (xi‐xm)2 (xi‐xm)2.nix xi ni xi xm (xi xm) (xi xm) .ni
1,810|⎯1,822 1,816 7 ‐0,0024 0,00058 0,0040
1 822| 1 834 1 828 14 ‐0 012 0 00014 0 00201,822|⎯1,834 1,828 14 ‐0,012 0,00014 0,0020
1,834|⎯1,846 1,840 18 0,000 0,00000 0,0000
1 846|⎯1 858 1,852 7 0,012 0,00014 0,00101,846| 1,858 1,852 7 0,012 0,00014 0,0010
1,858|⎯1,870 1,864 4 0,024 0,00058 0,0023
Soma 9,200 Soma 0,00936
Média (xm) 1,840 s2 0,00187m
0430
043,0
00187,02
=
=
s
s
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
%4,2%100.
840,1
043,0%100. ≈==
x
sCV
37. Estatística básica
Medidas de Dispersão ou Variabilidade
Outra forma de expressar a dispersão dos dados é através do Coeficiente
de Variação (CV), que é dado pela fórmula:
%100.
x
s
CV =
onde s é o desvio padrão, e é a média.x
• O Coeficiente de Variação dá uma indicação de quanto os dados estão
dispersos em torno da média. Quanto maior o valor de CV, maior a
dispersãodispersão.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
38. Estatística básica
Medidas de Dispersão ou Variabilidade
Exemplo: No exemplo de cálculo de variância e desvio padrão, obtivemos
os valores 8,25 e 2,87 respectivamente. A média tinha resultado em 5,5
O l d C fi i t d V i ã áO valor do Coeficiente de Variação será:
872s
Um valor de 52% indica que os dados estão muito dispersos com relação
%52%100.
5,5
87,2
%100. ≈==
x
s
CV
a média.
Por exemplo os dados {5 1; 5 2; 5 3; 5 4; 5 5; 5 6; 5 7; 5 8; 5 9; 6 0}Por exemplo, os dados {5,1; 5,2; 5,3; 5,4; 5,5; 5,6; 5,7; 5,8; 5,9; 6,0}
apresentam média: 5,55; desvio‐padrão: 0,29 e CV = 5% (Confira!)
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
39. Estatística básica
Covariância: Mede a correlação (dependência) linear entre duas
variáveis x e yvariáveis x e y.
É calculada como:É calculada como:
n
( )( )
yxyx
yyxx
yxCov
n
i
ii
..
.
),( 1
−=
−−
=
∑=
yy
n
y ),(
A covariância entre as mesmas variáveis, isto é, Cov(x, x) por
exemplo, é igual a própria variância Var(x) = s2.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
exemplo, é igual a própria variância Var(x) s .
40. Estatística básica
( )( ). xxxx
n
ii −−∑ ( )( )
21
)(),( sxVar
n
xxCov i
===
∑=
• Os seguintes valores de covariância dão uma indicação se osOs seguintes valores de covariância dão uma indicação se os
valores são independentes, ou possuem correlação positiva ou
negativa.
0),( =yxCov Variáveis independentes
negativa.
),( y
0),( >yxCov Correlação linear positiva
0),( <yxCov Correlação linear negativa
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
41. Estatística básica
0),( =yxCov0),( >yxCov 0),( <yxCov
Variáveis
independentes
Correlação
linear positiva
Correlação
linear negativa p
• Na prática quando as variáveis são independentes o valor da covariância
resulta em um valor próximo de 0 (entre ‐3 a 3) mas não sendo estes valoresresulta em um valor próximo de 0 (entre ‐3 a 3), mas não sendo estes valores
fixos e, portanto, é sempre recomendável considerar o gráfico das variáveis x
e y para uma avaliação conjunta.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
42. Estatística básica
Exemplo: Calcular a covariância dos dados abaixo, e verifique se a
correlação é positiva ou negativa.
X Y
10 21
15 15
18 12
12 1812 18
9 20
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
43. Estatística básica
Solução: Sempre esboce o gráfico das variáveis X e Y para confirmar!
X Y X.Y ..),( −= yxyxyxCovX Y X.Y
10 21 210
7610
2,17.8,124,209
..),(
−=
yxyxyxCov
15 15 225
18 12 216
76,10−=
12 18 216
9 20 180
Média 12,8 17,2 209,4Média 12,8 17,2 209,4
A covariância resultou em um valor negativo, indicando uma correlação
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 8126‐2831 horacimar@gmail.com
linear negativa que podemos confirmar pelo gráfico.