O documento apresenta formas de organizar e descrever conjuntos de dados estatísticos, como distribuição de frequência, histogramas, polígonos de frequência e diagramas de tronco e folhas. O objetivo é tornar os dados mais compreensíveis para identificar padrões, médias e variações.
1. Estatística e Probabilidade
Aula 2 – Cap 02
Estatística Descritiva
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
2. Estatística e Probabilidade
Neste capítulo...
estudaremos formas de organizar e
descrever conjuntos de dados. O objetivo
é tornar os dados mais compreensíveis
de modo a enxergar neles tendências,
médias e variações.
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
3. Estatística e Probabilidade
Dados etários da população de
Akhiok-Alasca
0 1 1 1 2 2 2 3 3 4 4 4 5 5 5
6 6 6 6 7 7 8 8 9 10 10 10 11 11 11
12 12 13 15 16 16 17 17 21 21 22 23 24 25 25
26 27 27 28 28 29 30 31 31 32 32 33 33 34 36
39 41 42 45 46 47 48 49 50 50 51 52 53 54 55
56 63
her er
ac ma ch
Sem uma S teim n Stei
ly s son maneira de organizar estes dados é difícil enxergarlysso
.A
padrões.
f. D
r. A f. Dr
Pro Pro
4. Estatística e Probabilidade
Distribuição de freqüência e seus gráficos
Distribuição de freqüências é uma tabela que mostra
classes ou intervalo de entrada de dados com um número
total de entradas em cada classe. A freqüência f de uma
classe é o número de entrada de dados na classe.
As classes possuem
Classe Frequência, f amplitudes iguais e cada
1-5 5 classe possui um
6-10 8 limite inferior da classe, que
11-15 6 é menor número que pode
16-20 8
pertencer à classe, e o
ch er limite superior que é o maior r ch e
21-25 ima5 ima
on S
te número que pode ysson Ste pertencer
26-30 ss
. Aly
4 .Al
Dr a classe. Pro
f. Dr
Prof.
5. Estatística e Probabilidade
Amplitude das classes: Distância entre os limites inferiores
(ou superiores) de classes consecutivas.
Amplitude total: Diferença entre o máximo e o mínimo das entradas.
Classe Frequência,f
1-5 5 Amplitude das classes:
6-10 8
6-1=5
11-15 6 Amplitude total:
16-20 8 30 - 1 = 29
er ch er
21-25 n Steim 5 a ch eima
o n St
ly s s
o O número de classes deve
r. Alys
s
26-30 r. A 4 f. D
f. D estar Pro
entre 5 e 20.
Pro
6. Estatística e Probabilidade
Exemplo:
Minutos/mês gastos na internet para 30 assinantes
102 124 108 86 103 82
71 104 112 118 87 95
103 116 85 122 87 100
105 97 107 67 78 125
109 99 105 99 101 92
Faça uma tabela de distribuição de freqüência com
5 classes.
er ch er
a ch eima
n St
Valores-chave: eim Valor mínimo = 67 s o n St
o ly s
ly s s Valor máximo = r. A
D r. A 125
rof.
D
f.
Pro P
7. Estatística e Probabilidade
Como construir uma distribuição de frequências
1. Decida o número de classes, que deve ficar entre 5 e 20.
(Para este problema use 5.)
2. Calcule a amplitude das classes.
Primeiro calcule: amplitude total = valor máximo – mínimo. Em seguida,
divida o resultado pelo número de classes. Por fim, arredonde até o
próximo número conveniente. (125 – 67)/5 = 11,6 (arredondado para 12)
3. Calcule os limites das classes.
O limite inferior da classe é o valor mais baixo que pertence a ela e o
limite superior é o mais alto. Use o valor mínimo (67) como limite inferior
da primeira classe.
her er
c a ch
4. Marque um risco |aem cada entrada de dado na classe apropriada. teim
teim S
ss
Quando todos on S os valores estiverem marcados, conte os Alyssonem cada
. Aly . riscos
f. D
r f. Dr
Pro classe para determinar a freqüência dessa classe. Pro
8. Estatística e Probabilidade
Mínimo = 67, Máximo = 125
Número de classes = 5
Amplitude de classe = 12
Classe Riscos Freqüência
67 - 78 ||| 3
79 - 90 |||| 5
91 - 102 |||| ||| 8
103 - 113 |||| |||| 9
115 - 126 |||| 5
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr .D
Pro
f. Dica: Faça primeiro todos os limitesrof
P inferiores.
9. Estatística e Probabilidade
Definições importantes
Ponto médio de uma classe: é a caracteristica de uma classe. É a metade da
soma entre os limites inferior e superior da classe
(limite inferior + limite superior) / 2
Freqüência relativa de uma classe: é a porção ou porcentagem dos dados
que entra nessa classe.
frel = (freqüência da classe) / (tamanho da amostra n)
Freqüência cumulativa rde uma classe: é a soma da frequencia daquela her
e
ach classes anteriores. A frequencia cumulativateimac
eim
classe com a de todas as S da
n St so n
última classeoé igual ao tamanho da amostra n.
.Aly s s D r. A
ly s
f. Dr Pro
f.
Pro
10. Estatística e Probabilidade
Definições importantes
Tabela: possibilidade de identificar padrões
Classe f Ponto médio Freqüência Freqüência
(67 + 78)/2 relativa ( f / n) cumulativa
67-78 3 72,5 (3 / 30) = 0,10 3
79-90 5 84,5 (5 / 30) = 0,17 8
91-102 8 96,5 0,27 16
103-113 9 108 0,30 25
115-126 5 120,5 0,17 30
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
11. Estatística e Probabilidade
Gráficos das distribuições
de freqüência
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
12. Estatística e Probabilidade
Histograma de freqüência
é um gráfico de barras que representa a distribuição de freqüência de um
conjunto de dados. Um histograma possui as seguintes propriedades:
1 – A escala horizontal é quantitativa
2 – A escala vertical mede as freqüências das classes
3 – Barras consecutivas devem estar encostadas umas as outras
Como as barras de freqüência devem se encostar elas começam e
terminam na fronteira das classes, e não nos limites das classes.
Fronteira das classes são os números que separam as classes sem deixar
uma falha entre elas.er er
c h a a ch m
teim on Stei
ss on S Alys
s
Dr . Aly f. D r.
Pro
f. Pro
13. Estatística e Probabilidade
Para determinar a fronteira de classe encontre a média do valor entre o
limite inferior da segunda classe e o limite superior da primeira classe.
Subtraia este valor da fronteira inferior da primeira classe e some ao valor
superior da primeira classe e assim sucessivamente para as outras classes.
(79 – 78) / 2 = 0,5
Tempo na internet
Classe f Fronteiras 9
9
8
67-78 3 66,5–78,5 8
7
79-90 5 78,5–90,5 6
5
5 5
91-102 8 90,5–102,5 4
3 3
103-113 9 102,5–114,5
r 2
ch er
a ch e eima
5 Steim 114,5–126,5 n St
1
115-126 n o
o 0
ss
.Aly s s 66,5 78,5 r.
90,5 Aly102,5 114,5 126,5
Dr f. D
Prof. Pro minutos
14. Estatística e Probabilidade
Polígono de freqüência
é um gráfico em forma de linha que enfatiza a mudança contínua nas
freqüências.
Para traçar um polígono de freqüência marque o ponto médio no topo de cada barra.
Conecte os pontos médios consecutivos. Estenda o polígono até os eixos.
9 9
8 8
7 Tempo na internet
6
5 5 5
4
3 3
2
1
er ch er
0 a ch eima
eim n St
n St 72,5 96,5 s o
Al ysso 84,5 108,5 120,5
r. Alys
r. f. D
f. D minutos Pro
Pro
15. Estatística e Probabilidade
Histograma de freqüência relativa
Apresenta em sua escala vertical as freqüências relativas.
Freqüência relativa Tempo na internet
0,30
0,30 0,27
0,20 0,17 0,17
0,10
0,10
er 0
ch er
a ch 66,5 78,5 90,5 102,5 114,5 126,5
eima
eim n St
o n St minutos s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
16. Estatística e Probabilidade
Gráfico de freqüência cumulativa
Um gráfico de freqüência cumulativa (ou ogiva) mostra o número de
valores, em um conjunto de dados, que são iguais ou inferiores a um
dado valor x.
Tempo na internet
Freqüência cumulativa
30
30
25
20
16
10 8
3
0
r ch er
a 0 ch e eima
teim 66,5 78,5 90,5 102,5 114,5 126,5
n St
ss on S Alys
s o
. Aly minutos D r.
f. Dr Pro
f.
Pro
17. Estatística e Probabilidade
Mais gráficos e representações
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
18. Estatística e Probabilidade
Diagrama de tronco e folhas
é similar ao histograma, mas com a vantagem de que o gráfico ainda
contém os valores dos dados originais.
102 124 108 86 103 82
71 104 112 118 87 95
103 116 85 122 87 100
105 97 107 67 78 125
109 99 105 99 101 92
Se o valor mais baixo é 67 e o mais alto é 125,
o tronco vai de 6 a 12.
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
19. Estatística e Probabilidade
Diagrama de tronco e folhas
102 124 108 82 103 85
71 104 112 118 86 95
103 116 87 122 87 100
105 97 107 67 78 125
109 99 105 99 101 92
6 |7
7 |18
8 |25677
tronco
9 |25799
Chave: 6|7 significa 67
10 | 0 1 2 3 3 4 5 5 7 8 9
11 | 2 6 8 er
er ch
a ch eima
12 m
Stei | 2 4 5 folhas o n St
n s
l ysso r. Alys
D r. A f. D
Pro
f. Pro
20. Estatística e Probabilidade
Diagrama de tronco e folhas – 2 linhas/tronco
Chave: 6|7 significa 67 6|
6|7
7|1
7|8
Dígitos da 1a linha 0 1 2 3 4 8|2
Dígitos da 2a linha 5 6 7 8 9 8|5677
9|2
9|5799
10 | 0 1 2 3 3 4
10 | 5 5 7 8 9
11 | 2
er 11 | 6 8 er
achlinha 0 1 2 3 4 a ch
Dígitosteim 1a
da 12 | 2 4 on Steim
nS ly s
ysso
lDígitos da 2a linha 5 6 7 8 9 A5 s
f. D
r. A . 12 |
f Dr .
Pro Pro
21. Estatística e Probabilidade
Plote de pontos
Em um plote de pontos cada entrada é desenhada, usando um ponto ●
sobre um eixo horizontal.
minutos/mês na Internet
66 76 86 96 106 116 126
minutos
er er
Um plote de pontos permite que se veja como os dados estão teimach
a ch
eim nS
n St sso
distribuídos e se determinem entradas específicas de dados.
o
ss
ly ly
r .A
r. A f. D
f. D Pro
Pro
22. Estatística e Probabilidade
Diagrama de Pizza
tem a forma de um círculo que mostra as relações das partes como um
todo.
Para encontrar o angulo central para uma entrada de dados multiplique
3600 pela frequência relativa da entrada de dados.
Exemplo
O orçamento da Nasa (em bilhões de dólares) dividido em
três categorias
Bilhões de US$
Vôo espacial humano 5,7
Tecnologia 5,9
er ch er
Apoio às missões
teim
a ch 2,7 eima
S o n St
ys so n Alys
s
Al Construa um diagrama de pizza para esses. dados.
r
f. Dr . Pro
f. D
Pro
23. Estatística e Probabilidade
Bilhões de US$ Graus
Vôo espacial humano 5,7 143
Tecnologia 5,9 149
Apoio às missões 2,7 68
Total 14,3 360
Apoio às
missões 5,7
19%
14,3
5,9
14,3
Vôo espacial
humano
er 40%
Orçamento da Nasa
a ch
er
a ch m
eim Stei
Tecnologia o n St ly s s
on
(em bilhões de dólares)
Aly s s r .A
r.41% f. D
f. D Pro
Pro
24. Estatística e Probabilidade
Diagrama de Pareto
é um gráfico de dados qualitativos no qual a altura de cada barra
representa a freqüência ou a freqüência relativa. É frequentemente
usado no contexto de negócios.
Exemplo: Recentemente uma industria varejista perdeu 45 milhões de
dólares de seus ativos. Os dados das perdas são mostrados na tabela
abaixo:
Se você fosse o varejista qual causa
escolheria para atacar primeiro?
18
Valores (em
Causas 16
milhões) 14
Milhões de dólares
12
administrativas 7,8 10
8
furtos de 6
funcionários 15,6
r
4
ch er
ch e 2
ima
assaltos a lojas teima 14,7 0
n St
e
S o
so n administrativas furtos de s fraudes nas
Alys vendas
assaltos a
Alys
fraudes nas
r. vendas
funcionários
D r.
lojas
f. D 2,9 rof.
Pro PCausas
25. Estatística e Probabilidade
Gráficos de conjuntos de dados
emparelhados
Se dois conjuntos de dados têm o mesmo número de entradas e cada
entrada do primeiro corresponde a uma entrada do segundo, eles são
chamados de conjuntos de dados emparelhados.
Uma maneira de fazer o gráfico de dados emparelhados é usar um
mapa de dispersão.
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
26. Estatística e Probabilidade
Mapa de Dispersão
é um plote dos pares (x,y) de dados sendo a horizontal o eixo x e a
vertical o eixo y.
Exemplo:
Na tabela abaixo temos a duração do vínculo empregatício e o salário
anual correspondente de dez trabalhadores
Permanência no
Salário (R$) 45000
emprego (anos)
5 32000
salario (em reais)
40000
4 32500
8 40000
35000
4 27350
2 25000 30000
10 43000
7 er
41650 25000
ch er
ach 39225 eima
eim n St
n St
6
o o s8
y s Alys
2 4 6 10
. Al9 s 45100
Dr .
Dr Permanênciaf.no emprego (anos)
Pro
Prof. 3 28000
27. Estatística e Probabilidade
Gráfico da série temporal
é um plote de um conjunto de entradas de dados tomadas a intervalos
regulares durante um período de tempo.
Exemplo: Na tabela ao lado, número de Assinantes Conta média
assinantes de telefones celulares em milhões e Ano (em milhões) (em reais)
o valor médio da conta mensal local. 1987 1.2 96.83
100 1988 2.1 98.02
1989 3.5 89.3
Assinantes (em milhoes)
80 1990 5.3 80.9
1991 7.6 72.74
60 1992 11 68.68
1993 16 61.48
40 1994 24.1 56.21
1995 33.8 51
20
er 1996 44 47.7 er
ch
a ch teim
a
eim on S 42.78
n St
1997 55.3
so ly s s
0
Alys
. 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 1998
f. D
r. A69.2 39.43
Dr Pro
Prof. 1999 86 41.24
Anos