1. Aula 2
Resumo de Dados
Profa. Dra. Juliana Garcia Cespedes
Dep. de Matemática e Computação
UNIFEI - Itajubá
2. Problema
Um pesquisador está interessado em fazer um
levantamento sobre alguns aspectos socioeconômicos
dos empregados da seção de orçamentos de uma
empresa. Para isso, ele colheu seis informações sobre
os 36 empregados:
1. Estado civil;
2. Grau de instrução;
3. Número de filhos;
4. Salário;
5. Idade;
6. Região de procedência.
4. Tipos de variáveis
• Cada informação em estudo chama-se VARIÁVEL.
• Para representar cada uma das variáveis em estudo
atribui-se uma letra maiúscula, por exemplo, a letra X,
para identificá-las.
Variável Representação
Estado civil X
Grau de instrução Y
Número de filhos Z
Salário S
Idade U
Região de procedência V
5. Tipos de variáveis
• As VARIÁVEIS são classificadas de acordo com o seu
conteúdo e para cada tipo existe um tratamento estatístico
diferente.
Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Contínua
6. Tipos de variáveis
• VARIÁVEL QUALITATIVA:
– Apresentam como possíveis realizações uma qualidade (ou
atributo) do indivíduo pesquisado, exemplo, sexo, educação,
estado civil, etc.
• Nominal: não existe nenhuma ordenação nas possíveis realizações.
(sexo, estado civil)
• Ordinal: existe uma ordem nos seus resultados.
(educação, classe social)
• VARIÁVEL QUANTITATIVA:
– Apresentam como possíveis realizações números resultantes de
uma contagem ou mensuração, exemplo, número de filhos, salário,
idade, etc.
• Discreta: os valores pertencem a um conjunto finito ou enumerável de
números. (número de filhos)
• Contínua: os valores pertencem a um intervalo de números reais.
(peso, altura)
7. Tipos de variáveis
• Classifique as variáveis da pesquisa
socioeconômica:
1. Estado civil;
2. Grau de instrução;
3. Número de filhos;
4. Salário;
5. Idade;
6. Região de procedência.
8. Distribuição de frequências
• Quando se estuda uma variável, o maior interesse
do pesquisador é conhecer o comportamento
dessa variável, analisando a ocorrência de suas
possíveis realizações.
• É fácil analisar as variáveis, conhecer o seu
comportamento, utilizando a Tabela 1?
10. Distribuição de frequências
• Podemos resumir as informações contidas na
Tabela 1 construindo tabelas de frequências para
cada uma das variáveis pesquisadas.
• Uma tabela de frequências possui informações
sobre o número de pesquisados, a porcentagem,
a proporção e a proporção acumulada de cada
classe da variável analisada.
11. Distribuição de frequências
• Tabela de frequências da variável grau de
instrução:
Grau de Frequência Frequência Frequência Porcentagem
instrução relativa acumulada
fi fri fai 100 fri
Fundamental 12 12/36 =0,333 0,333 33,3%
Médio 18 18/36 =0,500 0,833 50,0%
Superior 6 6/36 =0,167 1,000 16,7%
Total 36 36/36 =1,000 100%
12. Distribuição de frequências
• Observando os resultados da segunda coluna, vê-
se que dos 36 empregados da companhia, 12 têm
ensino fundamental, 18 ensino médio e 6 possuem
curso superior.
• A frequência relativa e a porcentagem são
bastante úteis quando decide-se comparar o
resultado de pesquisas distintas, por exemplo,
quando deseja-se pesquisar o total de empregados
da companhia.
• A frequência acumulada é utilizada para verificar
onde encontra-se a maior parte da população
pesquisada.
13. Distribuição de frequências
• Construa a tabela de frequências para as variáveis
estado civil, número de filhos e região de
procedência :
14. Distribuição de frequências
• Quando a variável é contínua, a construção da
tabela de frequências exige certo cuidado.
• Se indicarmos cada classe que aparece na variável
salário em uma tabela de frequências, não
resumiremos as 36 observações num grupo menor,
pois não existem observações iguais.
• A solução é agrupar os dados por faixas de salário.
15. Distribuição de frequências
• Tabela de frequências dos salários dos empregados
Classe de Frequência Frequência Frequência Porcentagem
salários relativa acumulada
fi fri fai 100 fi
[4,00; 8,00) 10 10/36 =0,278 0,278 27,78%
[8,00; 12,00) 12 12/36 =0,333 0,611 33,33%
[12,00; 16,00) 8 8/36 =0,222 0,833 22,22%
[16,00; 20,00) 5 5/36 =0,139 0,972 13,89%
[20,00; 24,00) 1 1/36 =0,029 1,000 2,78%
Total 36 1 100%
16. Distribuição de frequências
• Procedendo deste modo, perde-se alguma
informação. Por exemplo, não sabemos quais são
os oito salários da classe de 12 a 16, a não ser
que investigamos a tabela original.
• Uma forma de interpretação é dizer que todos os
oito salários são iguais ao ponto médio, 14.
• Sugere-se entre 5 a 15 classes da mesma
amplitude.
17. Tabela de frequências conjunta
• É muito comum estarmos interessados no
comportamento conjunto de várias variáveis.
• Por exemplo, uma pesquisa é feita entre alunos
do primeiro ano da faculdade e perguntou-se
aos alunos se trabalhavam (variável X) e o
número de vestibulares prestados (variável Y).
X não sim não não não sim sim não sim sim
Y 1 1 2 1 1 2 3 1 1 1
X não não sim não sim não não não sim não
Y 2 2 1 3 2 2 2 1 3 2
18. • Os dados são resumidos em tabelas de
dupla entrada ( ou contingência).
• Cada elemento do corpo da tabela dá a
frequência observada das realizações
simultâneas das duas variáveis.
19. • A variável X apresente somente dois valores,
sim e não, que representaremos por sim e não.
a variável Y apresenta valores inteiros 1,2 ou 3.
• Podemos escrever a tabela de frequências
conjunta de X e Y:
(X,Y) Frequência Tabela de frequência marginal de X
(sim,1) 4
XY 1 2 3 Total
(sim,2) 2
sim 4 2 2 8
(sim,3) 2
nao 5 6 1 12
(nao,1) 5
(nao,2) 6 Total 9 8 3 20
(nao,3) 1
Total 20 Tabela de frequência marginal de Y
20. • Tabelas de frequências marginal ou individual
X freq Y 1 2 3 Total
sim 8 freq 9 8 3 20
nao 12
Total 20
21. Exercício
• Construa a tabela de frequências conjunta
para as variáveis grau de instrução e
região de procedência.
Fundamental Médio Superior Total proc.
Capital 4 5 2 11
Interior 3 7 2 12
Outra 5 6 2 13
Total grau 12 18 6 36
22. Gráficos para variáveis
qualitativas
• Existem vários gráficos para representar variáveis
qualitativas, os mais usados são: gráfico em barras
e composição em setores, “pizza”.
GRÁFICO EM BARRAS
Consiste em construir retângulos ou barras, em que uma das
dimensões é proporcional á magnitude a ser representada
(frequência absoluta ou relativa) e a outra igual para todas
as barras.
23. Gráficos para variáveis
qualitativas
60%
Superior
50%
40%
Médio
30%
20%
Fundamental
10%
0%
Fundamental Médio Superior 0 5 10 15 20
24. Gráficos para variáveis
qualitativas
COMPOSIÇÃO EM SETORES
Representa a composição, geralmente em porcentagem, de
partes de um todo. Consiste de um círculo de raio
arbitrário, dividido em setores, que correspondem às partes
de maneira proporcional
6; 16,7%
12; 33,3% Fundamental
Médio
Superior
18; 50%
25. Gráficos para variáveis
quantitativas
Considera-se mais representações gráficas para variáveis
quantitativas, tais como, gráfico de dispersão, ramo e
folhas, histograma.
GRÁFICOS DE DISPERSÃO UNIDIMENSIONAL
1) Valores representados por pontos ao longo da reta,
valores repetidos são acompanhados de um número que
indica as repetições;
2) Os pontos repetidos são empilhados um em cima do
outro.
27. Gráficos para variáveis
quantitativas
HISTOGRAMA
Gráfico de barras contínuas, com as bases proporcionais aos
intervalos das classes e a área de cada retângulo
proporcional à respectiva frequência.
Pode-se considerar tanto a freq. absoluta como a relativa.
Para que a área do retângulo seja proporcional a fi, a sua
altura deve ser proporcional a fi/i, em que i representa a
amplitude do i-ésimo intervalo.
29. Ramo e folhas
• Tanto o histograma como os gráficos em
barras dão uma idéia da forma da
distribuição.
• Um procedimento alternativo para resumir
um conjunto de valores, com o objetivo de
obter uma idéia da forma de sua
distribuição é o ramo e folhas. A vantagem
é que não perde-se a informação sobre os
dados.
30. • Não existe uma regra fixa para construir o
gráfico, a idéia básica é dividir cada
observação em duas partes: a primeira (o
ramo) é colocada à esquerda de uma
linha vertical, a segunda (a folha) é
colocada à direita. Para a variável salários
as observações 4,00 e 4,56, o ramo é o 4
e 00 e 56 são as folhas.
32. Exercício
• Construa a tabela de frequências para as
variáveis e represente-as graficamente:
Estado Civil, Região de Procedência,
Salário e Idade.
• Construa a tabela de frequências conjunta
para as variáveis grau de instrução e
região de procedência e também para
estado civil e número de filhos.