SlideShare ist ein Scribd-Unternehmen logo
1 von 140
Downloaden Sie, um offline zu lesen
104
Introdução ao e-learning
FMD_i.p65 15-01-2004, 10:49
104
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 2
ÍNDICE
1. INTRODUÇÃO .............................................
.................................... 4
1.1 DefiniçÔes Gerais ........................................................................ 5
1.1.1. População 5
1.1.2. VariĂĄveis ou atributos 5
1.1.3. Processo de amostragem 5
1.2 A Estatística Descritiva e a Estatística Indutiva .............
...... 6
2. ESTATÍSTICA DESCRITIVA .............................................
................... 8
2.1 VariĂĄveis Qualitativas ................................................................. 8
2.2 VariĂĄveis Quantitativas Discretas ............................................. 9
2.3 VariĂĄveis Quantitativas ContĂ­nuas ............................................ 10
2.4 Medidas de Localização ............................................................. 11
2.4.1. MĂ©dia 11
2.4.2. Mediana 12
2.4.3. Moda 13
2.5 Medidas de Ordem ...................................................................... 13
2.6 Medidas de Assimetria ............................................................... 14
2.7 Medidas de DispersĂŁo ................................................................ 15
2.7.1. DispersĂŁo Absoluta 15
2.7.2. DispersĂŁo Relativa 16
2.8 Anålise de Concentração ........................................................... 17
2.8.1. Curva de Lorenz 17
2.8.2. Índice de Gini 18
2.9 EstatĂ­stica Descritiva Bidimensional ........................................ 19
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 3
3. ESTATÍSTICA INDUTIVA .............................................
...................... 45
3.1 NoçÔes båsicas de probabilidades ........................................... 45
3.2 Probabilidade condicionada ...................................................... 48
3.3 FunçÔes de Probabilidade ........................................
.............. 49
3.4 Estimação por Intervalos ..........................................
.............. 76
3.5 Testes de hipóteses ..................................................
.............. 89
3.6 AplicaçÔes Estatísticas: Fiabilidade ......................................... 105
3.6.1. Conceito de fiabilidade 105
3.6.2. Fiabilidade de um sistema 105
3.7 AplicaçÔes Estatísticas: Controlo Estatístico de Qualidade .. 110
3.8 AplicaçÔes Estatísticas: Tratamento Estatístico de Inquéritos . 114
3.8.1. Teste de independĂȘncia do qui-quadrado 114
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 4
"A estatĂ­stica Ă© a tĂ©cnica de torturar os nĂșmeros atĂ© que eles confessem".
Autor desconhecido
1. INTRODUÇÃO
Inicialmente, a actividade estatĂ­stica surgiu como um ramo da MatemĂĄtica.
Limitava-se ao estudo de mediçÔes e técnicas de contagem de fenómenos
naturais e ao cĂĄlculo de probabilidades de acontecimentos que se podiam
repetir indefinidamente. Actualmente, os métodos estatísticos são utilizados em
muitos sectores de actividade, tendo como algumas aplicaçÔes estudos de
fiabilidade, pesquisas de mercado, testes de controle de qualidade, tratamento
de inquéritos, sondagens, modelos econométricos, previsÔes, etc.
Exemplo de uma estatística: os valores da inflação entre 1980 e 1990
constituem uma estatĂ­stica. Fazer estatĂ­stica sobre estes dados poderia
consistir, por exemplo, em traçar gråficos, calcular a inflação média trimestral
ou prever a inflação para 1991.
A anĂĄlise de um problema estatĂ­stico desenvolve-se ao longo de vĂĄrias fases
distintas:
(i) Definição do Problema
Saber exactamente aquilo que se pretende pesquisar; estabelecer o
objectivo de anålise e definição da população
(ii) Amostragem e Recolha de Dados
Fase operacional. É o processo de selecção e registo sistemático de dados,
com um objectivo determinado. Os dados podem ser primĂĄrios (publicados
pela própria pessoa ou organização) ou secundårios (quando são
publicados por outra organização).
(iii) Tratamento e Apresentação dos Dados
Resumo dos dados atravĂ©s da sua contagem e agrupamento. É a
classificação de dados, recorrendo a tabelas ou gråficos.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 5
(iv)Anålise e Interpretação dos Dados
A Ășltima fase do trabalho estatĂ­stico Ă© a mais importante e delicada. EstĂĄ
ligada essencialmente ao cĂĄlculo de medidas e coeficientes, cuja finalidade
principal Ă© descrever o comportamento do fenĂłmeno em estudo (estatĂ­stica
descritiva). Na estatística indutiva a interpretação dos dados se
fundamentam na teoria da probabilidade.
1.1. DefiniçÔes Gerais
1.1.1. População
Fazer estatística pressupÔe o estudo de um conjunto de objectos bem
delimitado com alguma caracterĂ­stica em comum sobre os quais observamos
um certo nĂșmero de atributos designados por variĂĄveis.
Exemplo: Empresas existentes em Portugal
1.1.2. VariĂĄveis ou atributos
As propriedades de uma população são estudadas observando um certo
nĂșmero de variĂĄveis ou atributos. As variĂĄveis podem ser de natureza
qualitativa ou quantitativa. As variĂĄveis quantitativas podem ainda dividir-se
entre discretas e contĂ­nuas. As variĂĄveis discretas assumem apenas um
nĂșmero finito numerĂĄvel de valores. As variĂĄveis contĂ­nuas podem assumir um
nĂșmero finito nĂŁo numerĂĄvel ou um nĂșmero infinito de valores.
Exemplo: um conjunto de empresas pode ser analisado em termos de sector
de actividade (atributo qualitativo), nĂșmero de trabalhadores (atributo
quantitativo discreto), rĂĄcio de autonomia financeira (atributo quantitativo
contĂ­nuo), etc
1.1.3. Processo de amostragem
Para conhecer de forma completa a população, podem efectuar-se:
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 6
- recenseamentos (indagação completa de todos os elementos da
população); este processo é, no entanto, tipicamente moroso e
dispendioso, sendo esses os motivos porque os Censos sĂŁo realizados
apenas em cada 10 anos.
- estudos por amostragem (observação de apenas um subconjunto, tido
como representativo do universo). As técnicas de recolha de amostras
garantem a sua representatividade e aleatoriedade.
1.2. A EstatĂ­stica Descritiva e a EstatĂ­stica Indutiva
Para além do ramo de amostragem, a estatística compreende dois grandes
ramos: a estatĂ­stica descritiva e a estatĂ­stica indutiva.
A estatĂ­stica descritiva Ă© o ramo da estatĂ­stica que se encarrega do tratamento
e anĂĄlise de dados amostrais. Assim, depois de recolhida a amostra de acordo
com técnicas que garantem a sua representatividade e aleatoriedade, fica
disponível um conjunto de dados sobre o universo “em bruto” ou não
classificados. Para que seja possível retirar qualquer tipo de conclusÔes, torna-
se necessĂĄrio classificar os dados, recorrendo a tabelas de frequĂȘncias e a
representaçÔes gråficas, isto é, é preciso tratar os dados. Depois de tratados,
serå possível proceder à anålise dos dados através de vårias medidas que
descrevem o seu comportamento: localização, dispersão, simetria dos dados,
concentração, etc. São disso exemplo indicadores numéricos bem conhecidos
como a média ou a variùncia.
A estatĂ­stica indutiva Ă© o ramo da estatĂ­stica que se ocupa em inferir das
conclusÔes retiradas sobre a amostra para a população. De facto, a amostra
não é mais do que um passo intermédio e exequível de obter informaçÔes
sobre o verdadeiro objecto de estudo, que Ă© o universo. A estatĂ­stica indutiva
(ou inferĂȘncia estatĂ­stica) garante a ligação entre amostra e universo: se algo
se concluiu acerca da amostra, até que ponto é possível afirmar algo
semelhante para o universo? É nesta fase que se procuram validar as
hipóteses formuladas numa fase prévia exploratória. Claro que o processo de
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 7
indução implica um certo grau de incerteza associado à tentativa de
generalização de conclusĂ”es da “parte” (amostra) para o “todo” (universo). O
conceito de probabilidade vai ter aqui, entĂŁo, um papel fundamental. Isto Ă©, nĂŁo
vai ser possĂ­vel afirmar com toda a certeza que o comportamento da amostra
ilustra perfeitamente o comportamento do universo, mas apenas que o faz com
forte probabilidade. As inferĂȘncias indutivas sĂŁo assim elaboradas medindo, ao
mesmo tempo, o respectivo grau de incerteza. Daí que, na ficha das técnicas
das sondagens eleitorais, por exemplo, apareçam referĂȘncias ao “nĂ­vel de
confiança” associado aos resultados e ao “erro” cometido.
O esquema seguinte ilustra a “roda” da disciplina de estatística, relacionando
os seus diferentes ramos:
POPULAÇÃO
OU UNIVERSO
Amostragem
TRATAMENTO E
ANÁLISE DA AMOSTRA
EstatĂ­stica
Descritiva
InferĂȘncia
EstatĂ­stica
INFERIR DA AMOSTRA
PARA O UNIVERSO
GrĂĄficos; tabelas; medidas descritivas
PrevisÔes
Estimação
Erros
AMOSTRA
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 8
2.ESTATÍSTICA DESCRITIVA
Os resultados da observação de um atributo sobre os elementos do conjunto a
analisar constituem os dados estatĂ­sticos. O ramo da estatĂ­stica que se ocupa
do tratamento, apresentação e anålise de dados amostrais denomina-se de
estatĂ­stica descritiva.
2.1. VariĂĄveis Qualitativas
Os dados qualitativos sĂŁo organizados na forma de uma tabela de frequĂȘncias,
que representa o nĂșmero ni de elementos de cada uma das categorias ou
classes e que Ă© chamado de frequĂȘncia absoluta. A soma de todas as
frequĂȘncias Ă© igual Ă  dimensĂŁo da amostra (n).
Numa tabela de frequĂȘncias, alĂ©m das frequĂȘncias absolutas, tambĂ©m se
apresentam as frequĂȘncias relativas (fi), obtida dividindo a frequĂȘncia absoluta
pelo nĂșmero total de observaçÔes.
Modalidades FrequĂȘncias absolutas FrequĂȘncias relativas
Mod. 1 n1 f1
Mod. j nj fj
Mod. n nn fn
Total n: dimensĂŁo da amostra 1
n
ni
fi = ; ni: nÂșde vezes que cada modalidade da variĂĄvel foi observada.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 9
Estes dados podem também ser representados graficamente através de:
Diagrama de barras
Para cada modalidade, desenha-se uma barra de altura igual Ă  frequĂȘncia
absoluta ou relativa (as frequĂȘncias relativas sĂŁo de preferir, pois permitem a
comparação de amostras de diferentes dimensÔes).
Diagrama sectorial ou circular
Esta representação é constituída por um círculo, em que se apresentam tantas
“fatias” quantas as modalidades em estudo. O ñngulo correspondente a cada
modalidade Ă© proporcional Ă s frequĂȘncias das classes, fazendo corresponder o
total da amostra (n) a 360Âș Geralmente, juntamente com a identificação da
modalidade, indica-se a frequĂȘncia relativa respectiva.
2.2. VariĂĄveis Quantitativas Discretas
SĂŁo variĂĄveis que assumem um nĂșmero finito ou infinito numerĂĄvel de valores.
A apresentação destas amostras é semelhante às variåveis qualitativas,
fazendo-se uma tabela de frequĂȘncias e uma representação grĂĄfica recorrendo
ao diagrama de barras.
Valores da variĂĄvel FrequĂȘncias absolutas FrequĂȘncias relativas
X1 n1 f1
Xj nj fj
Xn nn fn
Total n: dimensĂŁo da amostra 1
TambĂ©m Ă© possĂ­vel calcular as frequĂȘncias (absolutas – Ni - e relativas - Fi)
acumuladas, como se pode ver no exemplo:
NÂșdefeituosos (X) NÂșembalagens (ni) % embalagens (fi) Ni Fi
0 80 40% 80 40%
1 60 30% 80+60 40%+30%
2 30 15% 170 85%
3 20 10% 190 95%
4 10 5% 200 100%
Total 200 1
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 10
2.3. VariĂĄveis Quantitativas ContĂ­nuas
Como foi dito anteriormente, uma variĂĄvel (ou atributo) Ă© contĂ­nua quando
assume um nĂșmero infinito nĂŁo numerĂĄvel de valores, isto Ă©, podem assumir
qualquer valor dentro de um intervalo.
Neste caso, a construção da tabela compreende duas etapas:
(i) Definição de classes de valores disjuntas, correspondentes a intervalos de
nĂșmeros reais fechados Ă  esquerda e abertos Ă  direita, cuja constituição
obedece a certas regras
(ii) Contagem das observaçÔes pertencentes a cada classe
Regra de construção de classes
(pressupÔe a formação de classes de igual amplitude)
- NĂșmero de classes a constituir
Depende de n = dimensĂŁo da amostra
Se n≄25, o nĂșmero de classes a constituir deve ser 5
Se n<25, o nĂșmero de classes a constituir deve ser n
- Amplitude comum a todas as classes
Sendo a amplitude total dos dados dada pela diferença entre o valor
mĂĄximo e o valor mĂ­nimo observados, entĂŁo a amplitude de cada classe
serĂĄ:
Valor máximo da variável observado – Valor mínimo da variável observado
NÂșde classes a constituir
Classes de
valores da variĂĄvel
FrequĂȘncias absolutas FrequĂȘncias relativas
[x1; x2[ n1 f1
[x2; x3[
[x3; x4[ nj fj
[xn-1; xn] n fn
Total n: dimensĂŁo da amostra 1
A distribuição de frequĂȘncias representa-se atravĂ©s de um histograma.
Um histograma Ă© uma sucessĂŁo de rectĂąngulos adjacentes, em que a base Ă©
uma classe e a altura a frequĂȘncia (relativa ou absoluta) por unidade de
amplitude (ni/ai ou fi/ai), sendo a amplitude de cada classe ai=ei-ei-1. A ĂĄrea total
do histograma Ă© a soma das frequĂȘncias relativas, isto Ă©, 1.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 11
1. Esta distribuição permite visualizar o tipo de distribuição e deve salientar
alguns aspectos mais relevantes desta (moda, classe modal, ...). Como
as classes podem ter amplitudes diferentes, para que todos os
rectĂąngulos (colunas) sejam comparĂĄveis Ă© necessĂĄrio corrigir as
frequĂȘncias das classes (calculando as frequĂȘncias que se teria se a
amplitude de todas as classes fosse igual e igual a 1)
2. É preferível representar o histograma com fi/hi do que com ni/hi uma vez
que deste modo Ă© possĂ­vel comparar distribuiçÔes com diferente nĂșmero
de observaçÔes amostrais.
TambĂ©m Ă© possĂ­vel calcular as frequĂȘncias (absolutas – Ni - e relativas - Fi)
acumuladas.
2.4. Medidas de localização
2.4.1. MĂ©dia ( X )
É a medida de localização mais usada, sobretudo pela sua facilidade de
cĂĄlculo.
Dados nĂŁo-classificados (nĂŁo agrupados numa tabela de frequĂȘncias)
=
=
n
i
i
x
n
x
1
1
Média aritmética simples
Dados classificados (isto Ă©, agrupados numa tabela de frequĂȘncias)
VariĂĄveis discretas
=
=
=
=
n
i
i
i
i
n
i
i x
f
x
n
n
x
1
1
1
MĂ©dia ponderada dos valores de X
Dados classificados (isto Ă©, agrupados numa tabela de frequĂȘncias)
VariĂĄveis contĂ­nuas
=
=
=
=
n
i
i
i
i
n
i
i c
f
c
n
n
x
1
1
1
Média ponderada dos pontos médios das classes
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 12
onde ci é o ponto médio de cada classe (
2
.
sup
.
lim
.
inf
.
lim +
)
A média é uma medida de localização que, geralmente, indica o valor central
da distribuição, entendido como o valor em torno do qual se distribuem os
valores observados. Desta forma, a média é muitas vezes utilizada como valor
representativo da amostra.
No entanto, a média tem o grande inconveniente de ser sensível a valores
muito extremados ou aberrantes da distribuição (outliers). Em casos desses, a
média deixa de ser um valor que aparece na parte central da distribuição para
ser “empurrada” para os extremos. Nestes casos, Ă© preferĂ­vel recorrer Ă 
informação complementar fornecida por outras medidas de localização, como a
moda e a mediana, que se definem a seguir.
2.4.2. Mediana (Me)
A mediana não se calcula a partir do valor de todas as observaçÔes, mas a
partir da posição dessas observaçÔes.
Dados nĂŁo-classificados
Se tivermos n valores x1, x2, ... xn
Se n fĂŽr Ă­mpar,
2
1
+
= n
x
Me
Se n fĂŽr par,
2
1
2
2
+
+
=
n
n x
x
Me
Dados classificados
A mediana Ă© o valor tal que Fi = 0,5
VariĂĄveis discretas
Se existe um valor de xi para o qual Fi = 0,5, entĂŁo fala-se em intervalo
mediano.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 13
Se nĂŁo existe nenhum valor de xi para o qual Fi = 0,5, entĂŁo a mediana Ă©
o primeiro valor para o qual Fi > 0,5.
VariĂĄveis contĂ­nuas
Em geral, determina-se o valor para o qual Fi = 0,5 através de uma regra
de trĂȘs simples, atendendo a que as frequĂȘncias acumuladas variam
uniformemente dentro de cada classe.
De uma forma geral:
mediana
classe
xamp
FL
FL
FL
L
Me .
inf
sup
inf
5
.
0
inf
−
−
+
=
2.4.3. Moda (Mo)
VariĂĄveis discretas
A moda Ă© valor de X para o qual fi Ă© mĂĄximo, isto Ă©, Ă© o valor mais
frequente da distribuição.
VariĂĄveis contĂ­nuas
A classe modal Ă© a classe de valores de X para o qual fi/hi Ă© mĂĄximo,
isto Ă©, Ă© a classe a que corresponde maior frequĂȘncia por unidade de
amplitude.
2.5. Medidas de ordem
Tal como se definiu para a mediana, Ă© possĂ­vel definir outros valores de
posição ou valores separadores da distribuição em partes iguais.
Chama-se quantil de ordem p ao valor de x a que corresponde Fi = p.
- Se p=0,01; 0,02;.....0,99, chama-se ao quantil percentil
- Se p=0,1; 0,2;...0,9, chama-se ao quantil decil
- Se p=0,25, 0,5, 0,75, chama-se ao quantil QUARTIL (Q1, Q2 e Q3). A
mediana Ă© uma caso particular dos quartis (coincide com Q2)
VariĂĄvel discreta
O quantil de ordem p Ă© o primeiro valor de x para o qual i>p.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 14
VariĂĄvel contĂ­nua
Calcula-se por uma regra de trĂȘs simples, como a mediana.
De uma forma geral:
1
.
inf
sup
inf
25
.
0
inf
1 Q
classe
xamp
FL
FL
FL
L
Q
−
−
+
=
3
.
inf
sup
inf
75
.
0
inf
3 Q
classe
xamp
FL
FL
FL
L
Q
−
−
+
=
A representação gråfica destas medidas designa-se de diagrama de
extremos e quartis e serve para realçar algumas características da amostra.
Os valores da amostra compreendidos entre os 1Âș e 3Âș quartis sĂŁo
representados por um rectĂąngulo (caixa) com a mediana indicada por uma
barra. Seguidamente, consideram-se duas linhas que unem os meios dos
lados do rectĂąngulo com os extremos da amostra.
A partir deste diagrama, pode reconhecer-se a simetria ou enviesamento dos
dados e a sua maior ou menor concentração:
2.6. Medidas de assimetria
A assimetria Ă© tanto maior quanto mais afastados estiverem os valores da
média, mediana e moda. Concretamente, se:
− X = Me = Mo, a distribuição diz-se simĂ©trica
− X > Me > Mo, a distribuição diz-se assimĂ©trica positiva (ou enviesada Ă 
esquerda)
− X < Me < Mo, a distribuição diz-se assimĂ©trica negativa (ou enviesada Ă 
direita)
Coeficiente de assimetria de Bowley (g’):
1
3
)
1
2
(
)
2
3
(
Q
Q
Q
Q
Q
Q
−
−
−
−
Se g’ = 0 ..............a distribuição Ă© simĂ©trica positiva ou equilibrada
Os quartis estĂŁo Ă  mesma distĂąncia da mediana.
Se g’ > 0 ..............a distribuição Ă© assimĂ©trica positiva ou “puxada” para
25%
maiores
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 15
a esquerda (se fĂŽr = 1, assimetria Ă© mĂĄxima)
A mediana desliza para o lado do Q1,
logo Q3-Q2 > Q2-Q1
Se g’ < 0 ..............a distribuição Ă© assimĂ©trica negativa ou “puxada” para
a direita (se fĂŽr = -1, assimetria Ă© mĂĄxima)
A mediana desliza para o lado do Q3,
logo Q2-Q1 > Q3-Q2
2.7. Medidas de dispersĂŁo
Duas distribuiçÔes podem distinguir-se na medida em que os valores da
variåvel se dispersam relativamente ao ponto de localização (média, mediana,
moda). Apresentam-se de seguida algumas das mais utilizadas, classificadas
consoante a medida de localização usada para referenciar a dispersão das
observaçÔes:
2.7.1 Medidas de dispersĂŁo absoluta
(i) Em relação à mediana
Amplitude inter-quartis = Q = Q3 – Q1
Significa que 50% das observaçÔes se situam num intervalo de
amplitude Q. Quanto maior (menor) a amplitude do intervalo, maior
(menor) a dispersĂŁo em torno da mediana.
(ii) Em relação à média
VariĂąncia amostral: mede os desvios quadrĂĄticos de cada valor
observado em relação à média, havendo pouca dispersão se os desvios
forem globalmente pequenos, e havendo muita dispersĂŁo se os desvios
forem globalmente grandes.
Q1 Q2 Q3
Assimétrica positiva
Assimétrica negativa
Q1 Q2
Q3
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 16
Dados nĂŁo-classificados
( )
2
1
2 1
=
−
=
n
i
x
xi
n
s
Dados classificados
VariĂĄveis discretas
( ) ( )
=
=
−
=
−
=
n
i
n
i
x
xi
fi
x
xi
ni
n
s
1
2
2
1
2 1
Dados classificados
VariĂĄveis contĂ­nuas
( ) ( )
=
=
−
=
−
=
n
i
n
i
x
ci
fi
x
ci
ni
n
s
1
2
2
1
2 1
onde ci é o ponto médio de cada classe i.
Desvio-padrĂŁo: Medida de dispersĂŁo com significado real, mas que sĂł Ă©
possível calcular indirectamente, através da raiz quadrada da variùncia.
EstĂĄ expressa nas mesmas unidades da variĂĄvel.
2.7.2 Medidas de dispersĂŁo relativa
Muitas vezes, avaliar a dispersão através de um indicador de dispersão
absoluta nĂŁo Ă© conveniente, assim como comparara a dispersĂŁo de duas
distribuiçÔes, uma vez que estas medidas vĂȘm expressas na mesma unidade
da variĂĄvel – como Ă© o caso, por exemplo, da variĂąncia. Assim, Ă© de esperar
que os valores da variĂąncia sejam mais elevados quando os valores da variĂĄvel
são maiores, o que não significa que a distribuição seja muito dispersa. Para
comparar diferentes distribuiçÔes de frequĂȘncia sĂŁo precisas medidas de
dispersĂŁo relativa:
definida
estĂĄ
qual
Ă 
relação
em
o
localizaçã
de
Medida
absoluta
DispersĂŁo
relativa
DispersĂŁo =
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 17
Coeficiente de variação
x
s
CV = x100%
Outras medidas
2
1
3
Q
Q
Q −
Estas medidas nĂŁo estĂŁo expressas em nenhuma unidade, e permitem
comparar dispersÔes entre duas amostras, pois não são sensíveis à escala
(eventualmente diferente) em que as variĂĄveis estejam expressas.
2.8. Anålise da concentração
A noção de concentração apareceu associada ao estudo de desigualdades
económicas, como a repartição do rendimento ou a distribuição de salårios. O
fenómeno de concentração estå relacionado com a variabilidade ou dispersão
dos valores observados, apesar de não poder ser analisado através das
medidas de dispersĂŁo atrĂĄs descritas, que apenas medem a dispersĂŁo dos
valores em relação a um ponto. O objectivo é determinar como o atributo
(rendimento, salĂĄrios, nĂșmero de empresas) se distribui (se de forma mais ou
menos uniforme) pelos diferentes indivĂ­duos da amostra (que devem ser
susceptíveis de serem adicionados, isto é, a anålise de concentração não se
aplica a idade, altura, peso, etc).
Se o atributo estiver igualmente repartido pelos indivíduos, temos uma situação
extrema de igual distribuição; e vice-versa de o atributo estiver concentrado
num só indivíduo, temos uma situação extrema de måxima concentração. Em
geral, interessa medir o grau de concentração em situaçÔes intermédias.
Para analisar a concentração, existem dois instrumentos: a Curva de Lorenz e o Índice
de Gini.
2.8.1 Curva de Lorenz
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 18
O objectivo Ă© comparar a evolução das frequĂȘncias acumuladas (Fi = pi) com a
evolução da soma dos valores da variåvel (qi)
Quadro de dados
Classes de
valores da variĂĄvel
ni
Quantidade
atributo
Freq.relativa
acumuladas
Proporção
atrib.acumul,
[x1; x2[ n1 yi p1 q1
[x2; x3[
[x3; x4[ nj yj pj qj
[xn-1; xn[ nn yn pn=1 qn=1
Total n
Os pontos (pi;qi) pertencem ao quadrado (0,1) por (0,1). A curva que os une Ă©
a curva de Lorenz. Se houver igual distribuição, a frequĂȘncia das observaçÔes
deve ter uma evolução igual à proporção do atributo correspondente, isto é,
pi=qi. Nesse caso, a curva de Lorenz coincide com a diagonal do quadrado,
que é designada de recta de igual repartição. Quanto mais a curva se afastar
da recta, maior é a concentração. A zona entre a diagonal e acurva de Lorenz
designa-se, por isso, de zona de concentração.
2.8.2 Índice de Gini
O Ă­ndice de Gini Ă© calculado pela seguinte expressĂŁo
−
=
−
=
−
= 1
1
1
1
)
(
n
i
n
i
pi
qi
pi
G
Quando G = 0, a concentração é nula, havendo igual repartição. Caso o valor
de G seja 1, a concentração serå måxima. O valor de G varia entre 0 e 1, e
quanto maior o seu valor, maior a concentração.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 19
2.9. EstatĂ­stica Descritiva Bidimensional
Numa situação em que se observam pares de valores (xi; yj), pode ter interesse
estudar as relaçÔes porventura existentes entre os dois fenómenos,
nomeadamente relaçÔes estatísticas. Não se trata de estudar relaçÔes
funcionais (isto Ă©, a medida em que o valor de uma variĂĄvel Ă© determinado
exactamente pela outra), mas sim de estudar a forma como a variação de uma
variåvel poderå afectar a variação da outra, em média. (por exemplo, o peso e
a altura normalmente estão relacionados, mas a relação não é determinística).
Duas variåveis ligadas por uma relação estatística dizem-se correlacionadas.
Se as variaçÔes ocorrem, em média ou tendencialmente, no mesmo sentido, a
correlação diz-se positiva. Se ocorrem em sentidos opostos, a correlação diz-
se negativa.
Trata-se entĂŁo de estudar se:
- Se existe alguma correlação entre os fenómenos ou variåveis
observadas
- A existir, se Ă© traduzĂ­vel por alguma lei matemĂĄtica, nem que
tendencialmente
- A existir, se Ă© possĂ­vel medi-la
Por vezes, a representação gråfica do conjunto de dados bivariados sugere o
ajustamento de uma recta a este conjunto de pontos, indicando a existĂȘncia de
uma tendencial correlação linear entre as duas variåveis, como é o caso do
exemplo atrĂĄs descrito. A essa recta chama-se recta de regressĂŁo de y sobre
x, que permite descrever como se reflectem em y (variĂĄvel dependente ou
explicada) as modificaçÔes processadas em x (variåvel independente ou
explicativa). Essa recta torna possível, por exemplo, inferir (em média) a altura
de um indivĂ­duo, conhecendo o respectivo peso.
Um dos métodos mais conhecidos de ajustar uma recta a um conjunto de
dados Ă© o MĂ©todo dos MĂ­nimos Quadrados, que consiste em determinar a recta
que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores
de y e os obtidos a partir da recta que se pretende ajustar. Obtém-se assim a
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 20
recta de regressĂŁo ou recta dos mĂ­nimos quadrados. Assim, se a recta de
regressĂŁo obedecer Ă  seguinte fĂłrmula geral:
y = a + bx
o método permite minimizar a soma dos desvios quadråticos yi - (a + bxi).
Assim sendo, obtém-se:
−
−
= 2
2
x
n
x
y
x
n
y
x
b
i
i
i
e x
b
y
a −
=
Matematicamente, b designa o declive da recta. Em termos estatĂ­sticos, b
corresponde ao coeficiente de regressão de y sobre x, que indica a variação
média de y que acompanha uma variação unitåria de x.
O valor de a designa a ordenada na origem, isto Ă©, o valor que y assume
quando x=0.
Quando, quer através do diagrama de dispersão, quer através da recta de
regressĂŁo, se verifica a existĂȘncia de uma associação linear entre as variĂĄveis,
pode-se medir a maior ou menor força com que as variåveis se associam
através do coeficiente de correlação linear r:
)
)(
(
,
1
y
y
x
x
s
s
s
s
r i
n
i
i
xy
yy
xx
xy
−
−
=
=
=
Este indicador da correlação tem a vantagem de não depender das unidades
ou da ordem de grandeza em que as variĂĄveis estĂŁo expressas. O coeficiente
de correlação linear está sempre compreendido entre –1 e 1.
Se r > 0, então pode dizer-se que existe uma correlação positiva entre as
variĂĄveis, isto Ă©, as variĂĄveis variam no mesmo sentido: um aumento
(diminuição de x) provoca um aumento (diminuição) de y, mas menos que
proporcional.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 21
Se r < 0, então pode dizer-se que existe uma correlação negativa entre as
variĂĄveis, isto Ă©, as variĂĄveis variam em sentidos opostos: um aumento
(diminuição de x) provoca uma diminuição (aumento) de y, mas menos que
proporcional.
Se r = 0, entĂŁo pode dizer-se que as variĂĄveis nĂŁo estĂŁo correlacionadas
linearmente.
Antes de se efectuar um estudo de correlação, deve-se procurar justificação
teĂłrica para a existĂȘncia ou inexistĂȘncia de correlação. Caso contrĂĄrio, poderĂĄ
acontecer que variåveis sem relação de causalidade entre si, variem num certo
sentido por razÔes exteriores. A esta correlação ilusória, chama-se correlação
espĂșria.
Nos extremos, se r = 1 ou se r = -1, entĂŁo pode dizer-se que existe uma
correlação positiva ou negativa perfeita, respectivamente, entre as variåveis,
isto é, uma variação numa variåvel provoca na outra uma variação
exactamente proporcional no mesmo sentido ou em sentido contrĂĄrio. Isto Ă©, a
correlação é måxima.
Correlação ordinal
Por vezes, as variĂĄveis vĂȘm expressas numa escala ordinal, isto Ă©, interessa
mais conhecer a ordenação dos valores do que os valores observados
propriamente ditos. Neste caso, em vez do coeficiente de correlação linear,
calcula-se o coeficiente de correlação ordinal:
y
i
x
i
i
n
i
i
s R
R
d
n
n
d
r −
=
−
−
= =
,
)
1
(
6
1 2
1
2
Ordens (“ranks”) das
observaçÔes de X e
de Y, respectivamente
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 22
ESTATÍSTICA DESCRITIVA
ExercĂ­cios resolvidos
ExercĂ­cio 1
Considere a distribuição de 1000 empresas de um sector de actividade
segundo os resultados lĂ­quidos (em milhares de u.m.):
Resultado LĂ­quido FrequĂȘncia. Relativa (%)
[0; 1[ 10
[1; 3[ 25
[3; 5[ 35
[5; 15[ 15
[15; 25[ 10
[25; 50[ 5
Total 100
a) Represente a distribuição graficamente.
b) Determine a média e a moda da distribuição. Qual o significado dos
valores encontrados?
c) Calcule as frequĂȘncias acumuladas e represente-as graficamente.
Determine a mediana da distribuição.
d) Determine os quartis da distribuição. Faça a sua representação gråfica.
e) Analise a (as)simetria da distribuição em causa.
f) Analise a concentração atravĂ©s do Índice de Gini e da Curva de Lorenz.
Resolução
a)
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0,2
0 10 20 30 40 50 60
fi/hi
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 23
b) 325
,
7
%)
5
5
.
37
(
...
%)
25
2
(
%)
10
5
,
0
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
Em média, o resultado líquido de uma empresa é de 7325 unidades
monetĂĄrias.
A classe modal Ă© aquela a que corresponde maior frequĂȘncia por unidade de
amplitude. Neste caso, o maior valor de fi / hi Ă© 0,175. correspondente Ă  classe
[3; 5[, isto Ă©, os valores de resultado lĂ­quido mais provĂĄveis para uma empresa
situam-se entre 3000 u.m. e 5000 u.m.
c) A representação grĂĄfica das frequĂȘncias acumuladas (ver tabela) designa-se
de polĂ­gono integral:
Classe mediana (classe a que corresponde uma frequĂȘncia acumulada 0,5): [3; 5[
3 : Fi=0,35
5 : Fi = 0,7
Fi
0
0,2
0,4
0,6
0,8
1
0 20 40 60 80 100 120
X fi hi fi/hi Fi ci
[0; 1[ 10% 1 0.1 10% 0.5
[1; 3[ 25% 2 0.125 35% 2
[3; 5[ 35% 2 0.175 70% 4
[5; 15[ 15% 10 0.015 85% 10
[15; 25[ 10% 10 0.01 95% 20
[25; 50] 5% 25 0.002 100% 37.5
Total 1
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 24
CĂĄlculo da mediana:
0,7 - 0,35 ------------ 5 - 3
0,5 – 0,35 -------------- Me – 3
Me = 3 + ((2x0,15)/0,35) = 3,857
50% das empresas apresentam resultados lĂ­quidos inferiores a 3857 u.m.
d) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia
acumulada 0,25): [1; 3[
1 : Fi=0,1
3 : Fi = 0,35
CĂĄlculo do Q1:
0,35 - 0,1 ------------ 3 - 1
0,25 – 0,1 -------------- Q1 – 1
Q1 = 1 + ((2x0,15)/0,25) = 2,2
25% das empresas apresentam resultados lĂ­quidos inferiores a 2200 u.m.
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [5; 15[
5 : Fi=0,7
15 : Fi = 0,85
CĂĄlculo do Q3:
0,85 - 0,7 ------------ 15 - 5
0,75 – 0,7 -------------- Q3 – 5
Q3 = 5 + ((10x0,05)/0,15) = 8,333(3)
75% das empresas apresentam resultados lĂ­quidos inferiores a 8333 u.m.
e)
0
4596
,
0
2
,
2
333
,
8
)
2
,
2
857
,
3
(
)
857
,
3
333
,
8
(
1
3
)
1
2
(
)
2
3
(
' >
=
−
−
−
−
=
−
−
−
−
=
Q
Q
Q
Q
Q
Q
g
A distribuição é assimétrica positiva ou enviesada à esquerda.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 25
f)
X fi ni ci Atributo pi (=Fi) qi
[0; 1[ 10% 1000x10%=100 0.5 100x0.5=50 0.1 0.007
[1; 3[ 25% 250 2 250x2=500 0.35 0.075
[3; 5[ 35% 350 4 1400 0.7 0.266
[5; 15[ 15% 150 10 1500 0.85 0.471
[15; 25[ 10% 100 20 2000 0.95 0.744
[25; 50[ 5% 50 37.5 1875 1 1
Total 1 n=1000 7325
47
,
0
95
,
0
85
,
0
7
,
0
35
,
0
1
,
0
)
744
,
0
95
,
0
(
...
)
007
,
0
1
,
0
(
=
+
+
+
+
−
+
+
−
=
G
A distribuição dos resultados líquidos
apresenta concentração média (G=0,5
corresponde ao centro da escala
possĂ­vel, entre 0 e 1). Por exemplo,
70% das empresas apresentavam
resultados até 5000 u.m., mas isso
representava apenas 26,6% do total
de resultados das empresas da
amostra, o que sugere um tecido
empresarial com muitas PMEs, mas
em que cada uma tem baixo resultado
lĂ­quido.
ExercĂ­cio 2
Considere a seguinte amostra de dimensĂŁo 200, referente aos lucros obtidos
por empresas de um dado sector industrial, expressas numa determinada
unidade monetĂĄria.
Analise a concentração atravĂ©s do Índice de Gini e da Curva de Lorenz.
Res.Liq.Totais
7325
1400
500
50 +
+
Curva de Lorenz
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 26
Resolução
Lucros ni Lucro total pi (=Fi) qi
[0; 50[ 20 600 0.1 0.02
[50; 100[ 60 4400 0.4 0.16(6)
[100; 200[ 80 14000 0.8 0.63(3)
[200; 300[ 30 7500 0.95 0.883(3)
[300; 500] 10 3500 1 1
Total 200 30000
243
,
0
25
,
2
)
6
(
546
,
0
)
(
1
1
1
1
=
=
−
= −
=
−
=
n
i
n
i
pi
qi
pi
G
Tanto pela análise da Curva de Lorenz, como pelo valor do Índice de Gini,
conclui-se que esta amostra apresenta concentração moderada, encontrando-
se os valores razoavelmente repartidos.
ExercĂ­cio 3
Considere o exemplo abaixo referente ao peso e altura de 10 indivĂ­duos.
a) Represente o diagrama de dispersĂŁo.
b) Analise a correlação existente entre peso e altura.
c) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que
exprima as peso em função da altura.
Curva de Lorenz
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 27
IndivĂ­duo Peso (kg) Altura (cm)
A 72 175
B 65 170
C 80 185
D 57 154
E 60 165
F 77 175
G 83 182
H 79 178
I 67 175
J 68 173
Resolução
a)
b) No exemplo, r = 0,90681871, isto é, existe uma correlação positiva forte
entre as duas variĂĄveis, quase perfeita.
c)
Diagrama de DispersĂŁo
150
160
170
180
190
50 60 70 80 90
Peso (kg)
Altura
(cm)
Recta de RegressĂŁo
y = 0,9016x + 109,36
150
160
170
180
190
50 60 70 80 90
Peso (kg)
Altura
(cm)
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 28
A equação desta recta traduz-se em
Altura = 109,36 + 0,9016 x Peso
Isto Ă©, se um indivĂ­duo pesar 70 kg, a altura esperada serĂĄ de 109,36 + 0,9016
x 70 = 172,472.
Por cada kg de peso adicional, espera-se que a altura do indivĂ­duo aumente
0,9016 cm.
ExercĂ­cio 4
O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas
em milhares de u.m.) de uma empresa no perĂ­odo de 7 anos:
Ano Vendas Desp. Publicidade
1 10 3
2 13 3
3 18 5
4 19 6
5 25 8
6 30 9
7 35 13
a) Compare as vendas e as despesas em publicidade quanto Ă  dispersĂŁo.
b) Analise a correlação existente entre volume e custo de produção.
c) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que
exprima as vendas em função das despesas em publicidade.
Resolução
a) Para comparar a dispersão das duas distribuiçÔes, é necessårio calcular os
coeficientes de variação (medidas de dispersão relativa):
Dados nĂŁo-classificados
429
,
21
1
1
=
=
=
n
i
i
x
n
x 714
,
6
1
1
=
=
=
n
i
i
y
n
y
( ) 9408
,
69
1
2
1
2
=
−
=
=
n
i
x x
xi
n
s ( ) 0651
,
11
1
2
1
2
=
−
=
=
n
i
y y
yi
n
s
39
,
0
429
,
21
9408
,
69
=
=
=
x
s
CV x
x < 495
,
0
714
,
6
0651
,
11
=
=
=
y
s
CV
y
y
A dispersĂŁo das despesas em publicidade Ă© superior Ă  dispersĂŁo das vendas.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 29
b)
( )( ) ( )( )
[ ]
98
,
0
0651
,
11
9408
,
69
714
,
6
13
429
,
21
35
...
714
,
6
3
429
,
21
10
7
1
=
−
−
+
+
−
−
=
=
x
s
s
s
r
yy
xx
xy
Existe uma correlação positiva linear forte entre as duas variåveis. Em média,
quando as despesas em publicidade aumentam (diminuem), as vendas
aumentam (diminuem) de forma quase exactamente proporcional.
c)
ExercĂ­cio 5
Considere que 10 estudantes foram sujeitos a uma prova de avaliação no início
e no final do curso. No quadro abaixo, encontram-se as ordenaçÔes desses 10
estudantes segundo as classificaçÔes obtidas em cada uma das provas:
Aluno
Prova inicial
Ri
x
Prova final
Ri
y
di
Ri
x
- Ri
y
A 1 1 0
B 3 2 1
C 2 3 -1
D 5 4 1
E 7 6 1
F 8 8 0
G 9 7 2
H 10 9 1
I 6 10 -4
J 4 5 -1
Recta de RegressĂŁo
y = 2,4649x + 4,8782
0
10
20
30
3 8 13
Desp. Public.
Vendas
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 30
Resolução
Como não dispomos das classificaçÔes dos alunos, mas sim das ordenaçÔes
das classificaçÔes (do 1Âș ao 10Âș classificado), para avaliar a correlação
existente entre as 2 provas calcula-se o coeficiente de correlação ordinal:
8424
,
0
)
1
100
(
10
)
1
16
1
4
0
1
1
1
1
0
(
6
1
)
1
(
6
1 2
1
2
=
−
+
+
+
+
+
+
+
+
+
−
=
−
−
= =
x
x
n
n
d
r
n
i
i
s
A correlação Ă© positiva e elevada (rs varia entre –1 e 1), isto Ă©, os alunos que
tiveram boa nota na prova inicial tiveram, em média, igualmente boa nota na
prova final.
ExercĂ­cio 6
O quadro que se segue descreve a distribuição do rendimento anual (em
milhares de u.m.) de 2500 famílias da população de um país:
Rendimento anual NÂșde famĂ­lias
[0, 1[ 250
[1, 2[ 375
[2, 5[ 625
[5, 15[ 750
[15, 25[ 375
[25, 50[ 125
a) Represente as frequĂȘncias acumuladas graficamente.
b) Determine o rendimento médio e mediano.
c) Determine os trĂȘs primeiros quartis. Que indicaçÔes lhe dĂŁo sobre a
(as)simetria?
d) O que pode concluir quanto Ă  dispersĂŁo?
e) Calcule o índice de Gini. O que conclui sobre a concentração do
rendimento?
Resolução
a)
Rendimento anual NÂșde famĂ­lias % de famĂ­lias Fi (%) ci
[0, 1[ 250 10 10 0.5
[1, 2[ 375 15 25 1.5
[2, 5[ 625 25 50 3.5
[5, 15[ 750 30 80 10
[15, 25[ 375 15 95 20
[25, 50[ 125 5 1 37.5
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 31
b) 025
,
9
%)
5
5
.
37
(
...
%)
15
5
.
1
(
%)
10
5
,
0
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
Em média, o rendimento anual de uma família é de 9025 unidades monetårias.
Classe mediana (classe a que corresponde uma frequĂȘncia acumulada 0,5): [2; 5[
5 : Fi = 0,5. Logo, a mediana Ă© 5 (50% das famĂ­lias tĂȘm rendimentos anuais atĂ©
5000 unidades monetĂĄrias).
c) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia
acumulada 0,25): [1; 2[
3 : Fi = 0,25
25% das famĂ­lias apresentam rendimentos anuais inferiores a 2000 u.m.
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [5; 15[
5 : Fi=0,5
15 : Fi = 0,8
CĂĄlculo do Q3:
0,8 - 0,5 ------------ 15 - 5
0,75 – 0,5 -------------- Q3 – 5
Q3 = 5 + ((10x0,25)/0,3) = 13,333(3)
75% das famĂ­lias apresentam rendimentos anuais inferiores a 13333 u.m.
0
0,2
0,4
0,6
0,8
1
0 10 20 30 40 50 60 70 80 90 100
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 32
0
47
,
0
2
333
,
13
)
2
5
(
)
5
333
,
13
(
1
3
)
1
2
(
)
2
3
(
' >
=
−
−
−
−
=
−
−
−
−
=
Q
Q
Q
Q
Q
Q
g
A distribuição é assimétrica positiva ou enviesada à esquerda.
d) ( ) 286875
,
82
*
2
1
2
2
1
2
=
−
=
−
=
=
=
x
fici
x
ci
fi
s
n
i
n
i
x
071
,
9
286875
,
82
2
=
=
= x
x s
s
e)
Rendimento anual ni ci Rend. total pi (=Fi) qi
[0, 1[ 250 0.5 125 0,1 0.00554
[1, 2[ 375 1.5 562,5 0,25 0.0305
[2, 5[ 625 3.5 2187,5 0,5 0.1274
[5, 15[ 750 10 7500 0,8 0.46
[15, 25[ 375 20 7500 0,95 0.7922
[25, 50[ 125 37.5 4687.5 1 1
Total 2500 22562,5
4555
,
0
6
,
2
18436
,
1
)
(
1
1
1
1
=
=
−
= −
=
−
=
n
i
n
i
pi
qi
pi
G Concentração moderada do rendimento
ExercĂ­cio 7
Considere a seguinte tabela que representa a distribuição dos empregados de
uma instituição bancåria segundo a remuneração bruta mensal (em milhares de
unidades monetĂĄrias):
Remuneração
FrequĂȘncia. Relativa
(%)
[60; 80[ 7.8
[80; 100[ 15.2
[100; 120[ 31.2
[120; 140[ 19.5
[140; 160[ 7.2
[160; 200[ 8.1
[200; 250[ 5.4
[250, 300[ 2.6
[300; 350] 3.0
Total 100
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 33
a) Calcule os quartis da distribuição.
b) Analise a dispersão da distribuição em causa.
c) Analise a assimetria da distribuição em causa.
Resolução
a)
Remuneração FrequĂȘncia. Relativa (%)
Fi
(%)
[60; 80[ 7.8 7.8
[80; 100[ 15.2 23
[100; 120[ 31.2 54.2
[120; 140[ 19.5 73.7
[140; 160[ 7.2 80.9
[160; 200[ 8.1 89
[200; 250[ 5.4 94.4
[250, 300[ 2.6 97
[300; 350] 3.0 100
Total 100
Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia acumulada
0,25): [100; 120[
1 : Fi=0,23
3 : Fi = 0,542
CĂĄlculo do Q1:
0,542 - 0,23 ------------ 120 - 100
0,25 - 0,23 -------------- Q1 - 100
Q1 = 100 + ((20x0,02)/0,312) = 101,28
25% dos empregados auferem remuneraçÔes inferiores a 101,28 milhares u.m.
Classe a que pertence Q2 (classe a que corresponde uma frequĂȘncia acumulada
0,5): [100; 120[
100 : Fi=0,23
120 : Fi = 0,542
CĂĄlculo do Q2:
0,542 - 0,23 ------------ 120 - 100
0,5 - 0,23 -------------- Q2 - 100
Q2 = 100 + ((20x0,27)/0,312) = 117,3
50% dos empregados auferem remuneraçÔes inferiores a 117,3 milhares u.m.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 34
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [140; 160[
120 : Fi=0,737
140 : Fi = 0,809
CĂĄlculo do Q3:
0,809 - 0,737 ------------ 160 - 140
0,75 – 0,737 -------------- Q3 - 140
Q3 = 140 + ((20x0,013)/0,072) = 143,61(1)
75% dos empregados auferem remuneraçÔes inferiores a 143,61(1) milhares u.m.
b) Amplitude do intervalo inter-quartis = Q3 - Q1 = 143,61(1) - 101,28 = 42,33
(dispersĂŁo reduzida em torno da mediana)
c) 0
243
,
0
28
,
101
61
,
143
)
28
,
101
3
,
117
(
)
3
,
117
61
,
143
(
1
3
)
1
2
(
)
2
3
(
' >
=
−
−
−
−
=
−
−
−
−
=
Q
Q
Q
Q
Q
Q
g
A distribuição é assimétrica positiva ou enviesada à esquerda.
ExercĂ­cio 8
Os dados seguintes referem-se ao peso, expresso em gramas, do conteĂșdo de
uma série de 100 garrafas que, no decurso de um teste, saíram de uma linha
de enchimento automĂĄtico:
Peso (em gramas)
FrequĂȘncia. Relativa
(%)
[297; 298[ 8
[298; 299[ 21
[299; 300[ 28
[300; 301[ 15
[301; 302[ 11
[302; 303[ 10
[303; 304[ 5
[304; 305[ 1
[305; 306] 1
Total 100
a) Represente graficamente os dados acima.
b) Calcule as frequĂȘncias acumuladas e represente-as graficamente.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 35
c) Determine o peso médio, mediano e modal. Qual o seu significado?
d) Determine os quartis da distribuição.
e) Analise a dispersĂŁo do peso das garrafas.
Resolução
a)
b)
Peso (em gramas) FrequĂȘncia Relativa (%) Fi (%)
[297; 298[ 8 8
[298; 299[ 21 29
[299; 300[ 28 57
[300; 301[ 15 72
[301; 302[ 11 83
[302; 303[ 10 93
[303; 304[ 5 98
[304; 305[ 1 99
[305; 306] 1 100
Total 100
c)
11
,
300
%)
1
5
,
305
(
...
%)
21
5
,
298
(
%)
8
5
,
297
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
O peso médio das garrafas é de 300,11 kg.
0
0,05
0,1
0,15
0,2
0,25
0,3
296 297 298 299 300 301 302 303 304 305 306 307
Histograma
0
0,2
0,4
0,6
0,8
1
295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310
F*
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 36
Classe mediana (classe a que corresponde uma frequĂȘncia acumulada 0,5): [299;
300[
299 : Fi = 0,29
300 : Fi = 0,57
CĂĄlculo do Q2:
0,57 - 0,29 ------------ 300 - 299
0,5 - 0,29 -------------- Q2 - 299
Q2 = 299 + ((1x0,21)/0,28) = 299,75
50% das garrafas tĂȘm peso inferior a 299,75 kg.
A classe modal Ă© aquela a que corresponde maior frequĂȘncia relativa. Neste
caso, o maior valor de fi Ă© 0,28 correspondente Ă  classe [299; 300[, isto Ă©, os
pesos mais provĂĄveis das garrafas situam-se entre 299 kg e 300 kg.
d) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia
acumulada 0,25): [298; 299[
298 : Fi=0,08
299 : Fi = 0,29
CĂĄlculo do Q1:
0,29 - 0,08 ------------ 298 - 299
0,25 - 0,08 ------------ Q1 - 299
Q1 = 299 + ((1x0,17)/0,21) = 299,0357
25% das garrafas tĂȘm peso inferior a 299,0357 kg.
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [301; 302[
301 : Fi=0,72
302 : Fi = 0,83
CĂĄlculo do Q3:
0,83 - 0,72 ------------ 302 - 301
0,75 – 0,72 -------------- Q3 - 301
Q3 = 301 + ((1x0,03)/0,11) = 301,27(27)
75% das garrafas tĂȘm peso inferior a 301,27(27) kg.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 37
e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 301,27(27) - 299,0357 = 2,237
(dispersĂŁo reduzida em torno da mediana)
ExercĂ­cio 8
Numa faculdade, mediram-se as alturas de 100 alunos do primeiro ano:
Altura (em metros) NÂșAlunos
[1,4; 1,5[ 2
[1,5; 1,55[ 10
[1,55; 1,6[ 25
[1,6; 1,65[ 13
[1,65; 1,7[ 17
[1,7; 1,75[ 20
[1,75; 1,8[ 10
[1,8; 1,9] 3
Total 100
a) Represente graficamente os dados acima.
b) Determine a altura média e a altura modal. Qual o seu significado?
c) Calcule as frequĂȘncias acumuladas e represente-as graficamente.
d) Determine os quartis da distribuição e diga qual o seu significado.
e) Analise a dispersão da distribuição.
f) Analise a (as)simetria da distribuição.
Resolução
a)
Altura (em metros) ni fi ci hi fi/hi Fi
[1,4; 1,5[ 2 0,02 1,45 0,1 0,2 0,02
[1,5; 1,55[ 10 0,1 1,525 0,05 2 0,12
[1,55; 1,6[ 25 0,25 1,575 0,05 5 0,37
[1,6; 1,65[ 13 0,13 1,625 0,05 2,6 0,5
[1,65; 1,7[ 17 0,17 1,675 0,05 3,4 0,67
[1,7; 1,75[ 20 0,2 1,725 0,05 4 0,87
[1,75; 1,8[ 10 0,1 1,775 0,05 2 0,97
[1,8; 1,9] 3 0,03 1,85 0,1 0,3 1
Total 100 1
0
1
2
3
4
5
6
1,4 1,5 1,6 1,7 1,8 1,9
Histograma
fi/hi
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 38
b) 65
,
1
%)
3
85
,
1
(
...
%)
10
525
,
1
(
%)
2
45
,
1
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
A altura média dos alunos é de 1,65 m.
A classe modal Ă© aquela a que corresponde maior frequĂȘncia por unidade de
amplitude. Neste caso, o maior valor de fi / hi Ă© 5. correspondente Ă  classe
[1,55; 1,6[, isto Ă©, a altura mais provĂĄvel de um aluno rondarĂĄ 1,55m / 1,6m.
c)
d) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia
acumulada 0,25): [1,55; 1,6[
1,55 : Fi=0,12
1,6 : Fi = 0,37
CĂĄlculo do Q1:
0,37 – 0,12 ------------ 1,6 – 1,55
0,25 – 0,12 ------------ Q1 – 1,55
Q1 = 1,55 + ((0,05x0,13)/0,25) = 1,576
25% dos alunos tĂȘm altura inferior a 1,576 m.
Classe a que pertence Q2 (classe a que corresponde uma frequĂȘncia
acumulada 0,5): [1,6; 1,65[
1,65 : Fi = 0,5
50% dos alunos tĂȘm altura inferior a 1,65 m.
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [1,7; 1,75[
1,7 : Fi=0,67
1,75 : Fi = 0,87
0
0,2
0,4
0,6
0,8
1
1,3 1,4 1,5 1,6 1,7 1,8 1,9 2
F*
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 39
CĂĄlculo do Q3:
0,87- 0,67------------ 1,75 – 1,7
0,75 – 0,67-------------- Q3 – 1,7
Q3 = 1,7 + ((0,05*0,08)/0,2) = 1,72
75% dos alunos tĂȘm altura inferior a 1,72 m.
e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 1,72 – 1,576 = 0,144
(dispersĂŁo reduzida em torno da mediana)
( ) 00536875
,
0
*
2
1
2
2
1
2
=
−
=
−
=
=
=
x
fici
x
ci
fi
s
n
i
n
i
x
07327
,
0
00536875
,
0
2
=
=
= x
x s
s
(dispersão reduzida em torno da média)
f) 0
)
7
(
027
,
0
576
,
1
72
,
1
)
576
,
1
65
,
1
(
)
65
,
1
72
,
1
(
1
3
)
1
2
(
)
2
3
(
' <
−
=
−
−
−
−
=
−
−
−
−
=
Q
Q
Q
Q
Q
Q
g
A distribuição é ligeiramente assimétrica negativa ou enviesada à direita
(quase simétrica).
ExercĂ­cio 9
Em determinada central telefónica, registou-se a duração das chamadas
realizadas em Dezembro de 2001:
Duração (em minutos) NÂșChamadas
[0; 5[ 2000
[5; 10[ 1500
[10; 20[ 1000
[20; 30[ 300
[30; 50] 200
Total 5000
a) Represente graficamente as frequĂȘncias simples e acumuladas.
b) Determine a duração média das chamadas e respectivo desvio-padrão.
c) Qual a duração da chamada mediana? Qual o significado do valor
encontrado?
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 40
d) Sabe-se que as chamadas realizadas durante o ano de 2001
apresentaram uma duração média de 10 minutos, com desvio-padrão de
8,7 minutos. Compare, quanto Ă  dispersĂŁo, as chamadas efectuadas em
Dezembro com as que tiveram lugar durante todo o ano de 2001.
Resolução
a)
Duração (em minutos) ni fi hi fi/hi Fi ci
[0; 5[ 2000 0,4 5 0,08 0,4 2,5
[5; 10[ 1500 0,3 5 0,06 0,7 7,5
[10; 20[ 1000 0,2 10 0,02 0,9 15
[20; 30[ 300 0,06 10 0,006 0,96 25
[30; 50] 200 0,04 20 0,002 1 40
Total 5000 1
b) 35
,
9
%)
4
40
(
...
%)
30
5
,
7
(
%)
40
5
,
2
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
A duração média de uma chamada é de 9,35 minutos.
( ) 4525
,
81
*
2
1
2
2
1
2
=
−
=
−
=
=
=
x
fici
x
ci
fi
s
n
i
n
i
x
025
,
9
00536875
,
0
2
=
=
= x
x s
s
c) Classe mediana (classe a que corresponde frequĂȘncia acumulada 0,5): [5; 10[
0
0,02
0,04
0,06
0,08
0,1
0 10 20 30 40 50 60
Histograma
fi/hi
0
0,2
0,4
0,6
0,8
1
0 10 20 30 40 50 60 70 80 90 100
F*
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 41
5 : Fi = 0,4
10 : Fi = 0,7
CĂĄlculo da Me:
0,7 - 0,4 ------------ 10 - 5
0,5 - 0,4 ------------ Me - 5
Me = 5 + ((5x0,1)/0,3) = 6,67
50% das chamadas tĂȘm duração a 6,67 minutos.
d) 965
,
0
35
,
9
025
,
9
=
=
=
x
s
CV x
Dez > 87
,
0
10
7
,
8
2001 =
=
=
y
s
CV
y
ExercĂ­cio 10
Uma empresa coligiu dados relativos à produção de 12 lotes de um tipo especial
de rolamento. O volume de produção e o custo de produção de cada lote
apresentam-se na tabela:
Lote Volume (unidades) Custo (contos)
1 1500 3100
2 800 1900
3 2600 4200
4 1000 2300
5 600 1200
6 2800 4900
7 1200 2800
8 900 2100
9 400 1400
10 1300 2400
11 1200 2400
12 2000 3800
a) Analise a correlação existente entre volume e custo de produção.
b) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que
exprima o custo em função do volume de produção.
Resolução
a)
( )( ) ( )( )
[ ]
98
,
0
1145944
520854
3
,
2708
3800
3
,
1358
2000
...
3
,
2708
3100
3
,
1358
1500
12
1
=
−
−
+
+
−
−
=
=
x
s
s
s
r
yy
xx
xy
Correlação positiva quase perfeita.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 42
b)
ExercĂ­cio 11
Um conjunto de empresas do sector da Construção e Obras PĂșblicas cotadas
na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores:
EPS (Earnings per Share): Resultado Líquido por Acção
PBV (Price/Book Value): Preço / Situação Líquida por Acção
Empresa EPS ($) PBV ($)
1 191 0.9
2 32 1.0
3 104 0.8
4 117 0.8
5 210 1.5
6 95 0.7
7 65 0.9
8 201 1.3
9 81 0.4
a) Analise a correlação existente entre aqueles dois indicadores.
b) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que
exprima a variåvel EPS em função de PBV.
Resolução
a)
( )( ) ( )( )
[ ]
61
,
0
096933
,
0
332
,
3669
92
,
0
4
,
0
7
,
121
81
...
92
,
0
9
,
0
7
,
121
191
9
1
=
−
−
+
+
−
−
=
=
x
s
s
s
r
yy
xx
xy
Correlação positiva moderada.
y = 1,4553x + 731,6
0
1000
2000
3000
4000
5000
6000
0 500 1000 1500 2000 2500 3000
Volume
Custo
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 43
b)
ExercĂ­cio 12
Recolheu-se uma amostra em 17 cidades do paĂ­s relativamente aos seguintes
indicadores:
Ri: Rendimento médio mensal na cidade i (em 106
unidades monetĂĄrias)
Gi: Gasto médio mensal em bens de luxo na cidade i (em 106
u.m.)
Ri Gi Ri Gi
125 54 144 61
127 56 147 62
130 57 150 62
131 57 152 63
133 58 154 63
135 58 160 64
140 59 162 65
143 59 165 66
169 66
Dados adicionais
= 2467
i
R =1030
i
G = 361073
2
i
R
= 62620
2
i
G = 150270
i
iG
R
a) Estude a correlação entre rendimento e despesas em bens de luxo.
b) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que
exprima a variåvel Gi em função de Ri.
y = 124,04x + 7,383
0
50
100
150
200
250
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6
PBV
EPS
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 44
Resolução
a)
986
,
0
)
17
1030
*
17
62620
)(
17
2467
*
17
361073
(
17
1030
*
17
2467
*
17
150270
)
)(
(
2
2
2
2
2
2
2
2
=
−
−
−
=
−
−
−
=
G
n
G
R
n
R
G
R
n
G
R
r
i
i
i
i
XY
Correlação positiva forte.
b)
y = 0,2604x + 22,801
50
52
54
56
58
60
62
64
66
68
100 120 140 160 180 200
Rendimento
Gasto
104
Introdução ao e-learning
FMD_i.p65 15-01-2004, 10:49
104
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 45
3.ESTATÍSTICA INDUTIVA
A estatĂ­stica indutiva Ă© o ramo da estatĂ­stica que se ocupa em inferir das
conclusÔes retiradas sobre a amostra para a população. Claro que o processo
de indução implica um certo grau de incerteza associado à tentativa de
generalização de conclusĂ”es da “parte” (amostra) para o “todo” (universo). O
conceito de probabilidade vai ter aqui, entĂŁo, um papel fundamental. Isto Ă©, nĂŁo
vai ser possĂ­vel afirmar com toda a certeza que o comportamento da amostra
ilustra perfeitamente o comportamento do universo, mas apenas que o faz com
forte probabilidade.
De seguida, serão apresentadas algumas noçÔes simples de probabilidades e
funçÔes de probabilidade, que serĂŁo Ășteis a aplicaçÔes de estatĂ­stica indutiva
relacionadas com controlo estatĂ­stico de qualidade e fiabilidade de
componentes e sistemas.
3.1. NoçÔes båsicas de probabilidade
A teoria das probabilidades Ă© um ramo da matemĂĄtica extremamente Ăștil para o
estudo e a investigação das regularidades dos chamados fenómenos
aleatĂłrios. O exemplo seguinte pretende clarificar o que vulgarmente Ă©
designado por experiĂȘncia aleatĂłria.
Deve entender-se como experiĂȘncia qualquer processo ou conjunto de
circunstĂąncias capaz de produzir resultados observĂĄveis; quando uma
experiĂȘncia estĂĄ sujeita Ă  influĂȘncia de factores casuais e conduz a resultados
incertos, diz-se que a experiĂȘncia Ă© aleatĂłria.
Fundamentalmente, as experiĂȘncias aleatĂłrias caracterizam-se por:
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 46
(i) poder repetir-se um grande nĂșmero de vezes nas mesmas condiçÔes
ou em condiçÔes muito semelhantes
(ii) cada vez que a experiĂȘncia se realiza, obtĂ©m-se um resultado
individual, mas nĂŁo Ă© possĂ­vel prever exactamente esse resultado
(iii) os resultados das experiĂȘncias individuais mostram-se irregulares,
mas os resultados obtidos apĂłs uma longa repetição da experiĂȘncia
patenteiam uma grande regularidade estatĂ­stica no seu conjunto
Alguns autores consideram inserido no conceito de experiĂȘncia aleatĂłria um
outro, o de espaço de resultados. O espaço de resultados corresponde ao
conjunto formado por todos os resultados possĂ­veis de uma experiĂȘncia
aleatória. Por exemplo, num lançamento de um dado ordinårio tem-se que o
espaço de resultados é }
{ 6
,
5
,
4
,
3
,
2
,
1 .
A importùncia da definição deste conceito advém sobretudo por ser o meio
empregue para a definição de acontecimentos, que não sei mais que
subconjuntos do espaço de resultados. Por exemplo, no lançamento de um
dado podem definir-se, para além dos 6 acontecimentos elementares
correspondentes à saída de cada uma das faces, outros como “saída de um
nĂșmero Ă­mpar” definido pelo subconjunto }
{ 5
,
3
,
1 .
Definidos como conjuntos, aos acontecimentos é aplicåvel toda a construção
disponĂ­vel para aqueles, isto Ă©, existe um paralelismo perfeito entre ĂĄlgebra de
conjuntos e ĂĄlgebra de acontecimentos:
(i) O acontecimento que contem todos os elementos do espaço de
resultados chama-se acontecimento certo
(ii) O acontecimento que não contem qualquer elemento do espaço de
resultados chama-se acontecimento impossĂ­vel
(iii) Dois acontecimentos sĂŁo mutuamente exclusivos se nĂŁo tĂȘm em
comum qualquer acontecimento do espaço de resultados
(iv) A uniĂŁo de dois acontecimentos A e B representa-se por A âˆȘ B e Ă©
formado pelos elementos que pertencem a pelo menos um dos dois,
A ou B
(v) A intersecção de dois acontecimentos A e B representa-se por A ∩ B e
Ă© formado pelos elementos comuns a A e B
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 47
Probabilidade de um acontecimento Ă© expressa na escala de 0 a 1, sendo 0 a
probabilidade associada a um acontecimento impossĂ­vel e 1 a probabilidade
associada a um acontecimento certo. A primeira definição foi proposta por
Laplace em 1812. Pode definir-se probabilidade de um acontecimento A
como sendo:
NĂșmero de casos favorĂĄveis ao acontecimento A
P(A) =
NĂșmero total de casos possĂ­veis na exp. aleatĂłria
Uma das principais críticas a esta definição é a de que ela só é aplicåvel
quando o espaço de resultados é finito e os seus elementos possuem igual
probabilidade; daí que ela surja muito ligada aos “jogos de azar”, que possuem
essas propriedades. É o que acontece com as duas faces de uma moeda, as
52 cartas de um baralho, as 6 faces de um dado, etc.
Para se analisar a probabilidade de ocorrĂȘncia de determinados
acontecimentos, deve ter-se em atenção o seguinte:
− Dois acontecimentos são ditos mutuamente exclusivos se não puderem
acontecer ao mesmo tempo; se dois acontecimentos forem mutuamente
exclusivos, entĂŁo:
P(A ∩ B) = 0
− A probabilidade de união de dois acontecimentos mutuamente
exclusivos Ă© dada por
P (A âˆȘ B) = P(A) + P(B)
− Para dois acontecimentos quaisquer, vem que
P (A âˆȘ B) = P(A) + P(B) - P(A ∩ B)
− Dois acontecimentos dizem-se complementares se:
P(A) = 1 – P( A )
− Dois acontecimentos sĂŁo ditos independentes se a ocorrĂȘncia de um
nĂŁo afectar a probabilidade de ocorrĂȘncia de outro; a probabilidade de
ocorrĂȘncia de dois ou mais acontecimentos independentes Ă© o produto
das probabilidades dos respectivos acontecimentos, isto Ă©:
P(A ∩ B) = P(A) x P(B)
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 48
Após a apresentação desta definição, convém ainda referir que, numa outra
perspectiva, a da chamada teoria frequencista, a probabilidade de um
acontecimento Ă© definida como sendo o valor para o qual tende a frequĂȘncia
relativa do acontecimento quando o nĂșmero de repetiçÔes da experiĂȘncia
aumenta.
3.2. Probabilidade condicionada
Exemplo:
Um grupo de pessoas Ă© classificado de acordo com o seu peso e a incidĂȘncia
de hipertensão. São as seguintes as proporçÔes das vårias categorias:
Obeso Normal Magro Total
Hipertenso 0,1 0,08 0,02 0,2
NĂŁo Hipertenso 0,15 0,45 0,2 0,8
Total 0,25 0,53 0,22 1,00
a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa?
b) Qual a probabilidade de uma pessoa obesa ser hipertensa?
Resolução
a) Basta ver que a proporção de hipertensos é de 20%
b) Hå que tomar em atenção que o que se pretende é a proporção de
hipertensos na população de obesos, isto é 4
,
0
25
,
0
1
,
0
= . Por outras palavras,
pretende-se calcular a probabilidade do acontecimento “ser hipertenso”,
sabendo que ocorreu o acontecimento “ser obeso”. Repare-se que este
quociente resulta da divisĂŁo entre a probabilidade de uma pessoa ser
hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Pode
escrever-se que a probabilidade pretendida Ă© dada por:
)
(
)
(
)
/
(
O
P
O
H
P
O
H
P
∩
=
onde P(H/O) Ă© a probabilidade de ocorrer o acontecimento “ser hipertenso”,
sabendo que ocorreu ou condicionado pelo acontecimento “ser obeso”.
Este exemplo corresponde ao cĂĄlculo de uma probabilidade condicionada.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 49
Como se viu anteriormente, dois acontecimentos sĂŁo ditos independentes se a
ocorrĂȘncia de um nĂŁo afectar a probabilidade de ocorrĂȘncia de outro, isto Ă©, se:
P(A / B) = P(A) e se P(B / A) = P(B).
Teorema de Bayes
Seja B um acontecimento que se realiza se e sĂł se um dos acontecimentos
mutuamente exclusivos A1, A2,
An se verifica. Aos acontecimentos A1, A2,
An
dĂĄ-se o nome de acontecimentos antecedentes. O teorema de Bayes permite
calcular a probabilidade Ă  posteriori de A1, A2,
 An, isto Ă©, a probabilidade de
ocorrĂȘncia de A1, A2,
 An calculadas sob a hipĂłtese de que B (acontecimento
consequente) se realizou. De acordo com este teorema:
=
= n
i
i
i
i
i
i
A
B
P
A
P
A
B
P
A
P
B
A
P
1
)
/
(
).
(
)
/
(
).
(
)
/
(
Este Teorema utiliza-se em situaçÔes em que a relação causal estå invertida.
=
n
i
i
i A
B
P
A
P
1
)
/
(
).
( designa-se de probabilidade total de ocorrĂȘncia do
acontecimento B, isto Ă©, Ă© a probabilidade de ocorrĂȘncia do acontecimento
consequente B face a todos os possíveis acontecimentos A1, A2,
 An que o
podem ter antecedido (ou causado a sua ocorrĂȘncia).
3.3. FunçÔes de probabilidade
A probabilidade associada aos acontecimentos possĂ­veis numa experiĂȘncia
aleatĂłria obedecem, por vezes, a um padrĂŁo. Se associarmos a uma
experiĂȘncia aleatĂłria uma variĂĄvel X (por exemplo, associar aos resultados da
experiĂȘncia lançamento de um dado - que sĂŁo 6 (saĂ­da de face 1 a 6) – a
variĂĄvel X:“NÂș da face resultante do lançamento de um dado”), entĂŁo pode ser
constituída uma lei ou função de probabilidade (f(x)) dessa variåvel X, tal que
f(x) = P(X=xi)
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 50
Por exemplo, para X: nÂș da face resultante do lançamento de um dado, vem
que:
xi 1 2 3 4 5 6
f(xi) 1/6 1/6 1/6 1/6 1/6 1/6
que se designa por lei uniforme.
Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior
nĂșmero de fenĂłmenos estatĂ­sticos do que outras. Entre estas, contam-se a lei
Binomial, a lei de Poisson e a lei Exponencial.
(i) Lei Binomial
HĂĄ alguns acontecimentos que sĂŁo constituĂ­dos por um conjunto de
experiĂȘncias independentes, cada uma das quais com apenas dois estados
possĂ­veis de ocorrĂȘncia e com uma probabilidade fixa de ocorrĂȘncia para cada
um deles. Por exemplo, os produtos resultantes de uma fĂĄbrica podem ser
classificados como sendo defeituosos ou sendo nĂŁo defeituosos, e o facto de
um ter saĂ­do (ou nĂŁo) defeituoso nĂŁo influencia os outros serem (ou nĂŁo). A
distribuição das duas classes possíveis é discreta e do tipo binomial.
No exemplo anterior, consideremos uma amostra de n artigos retirados da
produção total, em relação aos quais se pretende identificar a variĂĄvel X: “NÂșde
artigos defeituosos nos n que constituem a amostra”. A probabilidade de
ocorrĂȘncia do acontecimento “artigo Ă© defeituoso” Ă© dada por p: incidĂȘncia de
defeituosos na produção (convenientemente calculada através de métodos de
estimação). A probabilidade do acontecimento complementar “artigo Ă© nĂŁo-
defeituoso” Ă© dada por
1 – p = q
A probabilidade associada a x artigos defeituosos Ă© dada por px
(p x p x p x
p...x vezes). Se hĂĄ x defeituosos, restam n-x artigos nĂŁo-defeituosos, com
probabilidade dada por qn-x
. Para calcular o nĂșmero exacto de combinaçÔes de
x artigos defeituosos com n-x artigos nĂŁo-defeituosos, utiliza-se a figura
“combinaçÔes de n, x a x, oriunda das tĂ©cnicas de cĂĄlculo combinatĂłrio. Vem
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 51
entĂŁo que a probabilidade de existĂȘncia de x defeituosos (e logo n-x nĂŁo
defeituosos) Ă© igual a:
x
n
x
x
n
x
n
x q
p
p
p
n
n
q
p
C
x
f −
−
−
=
=
!
)!
(
!
)
(
sendo que X segue Bi (n;p), sendo n e p os parĂąmetros caracterizadores da lei.
Um acontecimento deve ter 4 caracterĂ­sticas para que se possa associar a uma
lei binomial:
- nĂșmero fixo de experiĂȘncias (n)
- cada experiĂȘncia ter apenas duas classes de resultados possĂ­veis
- todas as experiĂȘncias terem igual probabilidade de ocorrĂȘncia (p)
- as experiĂȘncias serem independentes
Em sistemas eléctricos de energia é possível, por exemplo, aplicar a
distribuição binomial quando se pretende calcular a fiabilidade de uma central
eléctrica, com vårias unidades iguais e admitindo que cada unidade apenas
pode residir em dois estados, a funcionar ou avariada.
(ii) Lei de Poisson
A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) dĂĄ a
probabilidade de um acontecimento ocorrer um dado nĂșmero de vezes num
intervalo de tempo ou espaço fixado, quando a taxa de ocorrĂȘncia Ă© fixa (por
exemplo, nÂșde chamadas que chegam a uma central telefĂłnica por minuto; nÂș
de varias que ocorrem numa mĂĄquina por dia). Os nĂșmeros de acontecimentos
de “sucesso” ocorridos em diferentes intervalos são independentes. O
parùmetro caracterizador da distribuição de Poisson é λ, que corresponde ao
nĂșmero mĂ©dio de ocorrĂȘncias por unidade de tempo ou espaço.
Como o nĂșmero mĂ©dio de ocorrĂȘncias do acontecimento Ă© proporcional Ă 
amplitude do intervalo de tempo ou espaço a que se refere, a variĂĄvel X: “NÂșde
ocorrĂȘncias do acontecimento no intervalo [0,t[” segue lei de Poisson de
parĂąmetro λt (isto Ă©, se para 1 unidade de tempo o nÂș mĂ©dio de ocorrĂȘncias Ă©
λ, para t unidades de tempo o nĂșmero mĂ©dio de ocorrĂȘncias Ă© λt). A expressĂŁo
( ) t
x
e
x
t λ
λ −
!
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 52
dĂĄ a probabilidade de acontecerem x ocorrĂȘncias no intervalo de tempo [0,t[, e
corresponde à expressão da lei de probabilidade de Poisson : Po(λt)
Por exemplo, se X fĂŽr o “NÂș de avarias que ocorrem no intervalo de tempo
[0,t[”, entĂŁo a probabilidade de nĂŁo ocorrerem avarias nesse intervalo, isto Ă©, a
fiabilidade do componente/sistema como função do tempo, é dada por:
( ) t
t
e
e
t λ
λ
λ −
−
=
!
0
0
(iii) Lei Exponencial
Seja T a variĂĄvel “Tempo ou espaço que decorre entre ocorrĂȘncias
consecutivas de um acontecimento”. EntĂŁo T segue lei exponencial Exp (λ),
sendo
λ
1
o tempo que, em mĂ©dia, decorre entre ocorrĂȘncias sucessivas do
acontecimento.
Note-se que é possível estabelecer uma relação entre a lei exponencial e a lei
de Poisson. Assim, se X fĂŽr o “NÂș de avarias que ocorrem no intervalo de
tempo [0,t[”, e T fîr o “Tempo que decorre entre avarias consecutivas”, então:
P (T>t) = P(tempo que decorre entre avarias exceder t)
= P(até ao instante t, não ocorre qualquer avaria)
= P (ocorrerem zero avarias no intervalo [0,t[) = P(X=0) =
t
e λ
−
A distribuição exponencial é a mais usada em estudos de fiabilidade, jå que a
probabilidade de um componente sobreviver até ao instante t é dada por
t
e λ
−
A probabilidade de avariar até ao instante t é dada por
t
e λ
−
−
1
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 53
(iv) Lei Normal
A lei Normal tem como parùmetros caracterizadores a média ” e o desvio-
padrĂŁo σ. Isto Ă©, os valores observados tĂȘm uma determinada tendĂȘncia
central e uma determinada dispersĂŁo em torno da tendĂȘncia central.
A expressĂŁo
∏
−
− 2
2
)
(
2
1
2
1 σ
”
σ
Xi
e
representa a função densidade de probabilidade da distribuição Normal.
Se se fizer o valor médio ” igual a zero e todos os desvios forem medidos em
relação à média, a equação serå:
σ
”
−
=
X
Z
que corresponde a uma distribuição normal estandardizada (0;1) com os
valores tabelados, a qual Ă© caracterizada por uma curva de Gauss:
Esta distribuição apresenta 99,73% dos valores entre os extremos –3 e 3.
Existem muitos tipos de distribuição, mas a curva normal é a forma de
distribuição mais frequente nos processos industriais para características
mensurĂĄveis, e pode considerar-se como estabelecida pela experiĂȘncia prĂĄtica.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 54
(v) Lei Qui-Quadrado
Considere-se um conjunto de n variĂĄveis aleatĂłrias Zi, obedecendo Ă s
seguintes condiçÔes:
- cada variåvel Zi segue distribuição N(0,1);
- as variĂĄveis Zi sĂŁo mutuamente independentes
EntĂŁo, a variĂĄvel aleatĂłria X, construĂ­da a partir da soma das n variĂĄveis Zi
elevadas ao quadrado, segue distribuição Qui-Quadrado com n graus de
liberdade, denotada por
2
2
2
2
1
1
2
... n
n
i
i Z
Z
Z
Z
X +
+
+
=
=
=
2
n
X χ
∩
O termo “Graus de Liberdade” (d.f: degrees of freedom) Ă© habitualmente usado
para designar o nĂșmero n de parcelas (variĂĄveis Zi) adicionadas. É possĂ­vel
demonstrar que o valor esperado e a variùncia da distribuição de uma variåvel
Qui-Quadrado sĂŁo respectivamente
n
=
”
n
2
2
=
σ
A distribuição Qui-Quadrado é uma distribuição assimétrica à esquerda,
aproximando-se da distribuição Normal à medida que n cresce.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 55
104
Introdução ao e-learning
FMD_i.p65 15-01-2004, 10:49
104
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 56
PROBABILIDADES
ExercĂ­cios resolvidos
ExercĂ­cio 1
De um baralho ordinĂĄrio (52 cartas) extrai-se ao acaso 1 carta. Determine a
probabilidade dos seguintes acontecimentos:
a) saĂ­da de Rei
b) saĂ­da de copas
c) saĂ­da de Rei ou copas
d) saĂ­da de Rei mas nĂŁo de copas
e) nĂŁo saĂ­da de Rei
f) nĂŁo saĂ­da de Rei nem de copas
g) nĂŁo saĂ­da de Rei ou nĂŁo saĂ­da de copas
Resolução
A: saĂ­da de Rei
B: saĂ­da de copas
a) P(A)=1/13
b) P(B)=1/4
c) P(AâˆȘ B) = P(A) + P(B) - P(A∩ B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52)
d) P(A-B) = P(A) – P(A∩ B) = 1/13 – 1/52 = 3/52 (= (4-1)/52)
e) P( A )= 1-1/13 = 12/13 (=(52-4)/52)
f) P( )
B
A ∩ = P( B
A âˆȘ ) = 1 – P(AâˆȘ B) = 1 – 4/13 = 9/13
g) P( )
B
A âˆȘ = P( B
A ∩ ) = 1 – P )
( B
A ∩ = 1 – 1/52 = 51/52
ExercĂ­cio 2
Um sistema electrĂłnico Ă© formado por dois sub-sistemas, A e B. De ensaios
anteriores, sabe-se que:
- a probabilidade de A falhar Ă© de 20%
- a probabilidade de B falhar sozinho Ă© 15%
- a probabilidade de A e B falharem Ă© 15%
Determine a probabilidade de:
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 57
a) B falhar
b) falhar apenas A
c) falhar A ou B
d) nĂŁo falhar nem A nem B
e) A e B nĂŁo falharem simultaneamente
Resolução
A: o subsistema A falha
B: o subsistema B falha
P(A)=20% P( A )= 80%
P(B-A)=15%
P(A∩ B)=15%
a) P(B) = P(B-A)+ P(A∩ B) = 0,15 + 0,15 = 30%
b) P(A-B) = P(A) – P(A∩ B) = 0,2 – 0,15 = 5%
c) P(AâˆȘ B) = P(A) + P(B) - P(A∩ B) = 0,2 + 0,3 – 0,15 = 35%
d) P( )
B
A ∩ = P( B
A âˆȘ ) = 1 – P(AâˆȘ B) = 1 – 0,35 = 65%
e) P( B
A ∩ ) = 1 – P )
( B
A ∩ = 1 – 0,15 = 85%
ExercĂ­cio 3
Suponha que hĂĄ 3 jornais, A, B e C, com as seguintes percentagens de leitura:
A: 9,8%; B: 22,9%; C: 12,1%; A e B: 5,1%; A e C: 3,7%; B e C: 6%;
A, B e C: 2,4%
Escolhe-se uma pessoa ao acaso. Calcule a probabilidade dessa pessoa:
a) ler pelo menos um dos jornais
b) ler A e B mas nĂŁo C
c) ler A mas nĂŁo ler B nem C
Resolução
A: a pessoa escolhida lĂȘ o jornal A
B: a pessoa escolhida lĂȘ o jornal B
C: a pessoa escolhida lĂȘ o jornal C
P(A) = 9,8% P(B) = 22,9% P(C) = 12,1%
P(A∩ B) = 5,1% P(A∩ C) = 3,7% P(B∩ C) = 6%
P(A∩ B∩ C) = 2,4%
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 58
a)
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
( C
B
A
P
C
B
P
C
A
P
B
A
P
C
P
B
P
A
P
C
B
A
P ∩
∩
+
∩
−
∩
−
∩
−
+
+
=
âˆȘ
âˆȘ
= 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4%
b) P( )
C
B
A ∩
∩ = P( )
(
) C
B
A
P
B
A ∩
∩
−
∩ = 0,051 – 0,024 = 2,7%
c) )
( C
B
A
P ∩
∩ = P(A) - )
(
)
(
)
( C
B
A
P
C
A
P
B
A
P ∩
∩
+
∩
−
∩
= 0,098-0,051-0,037+0,024 = 3,4%
ExercĂ­cio 4
Um gerente de uma galeria de arte muito creditada no mercado, estĂĄ
interessado em comprar um quadro de um pintor famoso para posterior venda.
O gerente sabe que hå muitas falsificaçÔes deste pintor no mercado e que
algumas dessa falsificaçÔes são bastante perfeitas o que torna difícil avaliar se
o quadro que ele pretende comprar Ă© ou nĂŁo um original. De facto, sabe-se que
hĂĄ 4 quadros falsos desse pintor para 1 verdadeiro.
O gerente não quer comprometer o “bom nome” da galeria para a qual trabalha
comprando um quadro falso. Para obter mais informação o gerente resolve
levar o quadro a um museu de arte e pede para que o especialista do museu o
examine. Este especialista garante-lhe que em 90% dos casos em que lhe Ă©
pedido para examinar um quadro genuĂ­no daquele pintor, ele identifica-o
correctamente como sendo genuĂ­no. Mas em 15% dos casos em que examina
uma falsificação do mesmo pintor, ele identifica-o (erradamente) como sendo
genuĂ­no.
Depois de examinar o quadro que o gerente lhe levou, o especialista diz que
acha que o quadro é uma falsificação. Qual é agora a probabilidade de o
quadro ser realmente uma falsificação?
Resolução
V: o quadro Ă© genuĂ­no
F: o quadro Ă© falso
I: o quadro Ă© identificado correctamente
P(V) = 20%
P(F) = 80%
P(I/V) = 90% P( )
/V
I = 10%
P( )
/ F
I = 15% P(I/F) = 85%
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 59
P(ser realmente falsificação/especialista identificou como falsificação) =
= %
1
,
97
7
,
0
68
,
0
1
,
0
*
2
,
0
85
,
0
*
8
,
0
85
,
0
*
8
,
0
)
/
(
*
)
(
)
/
(
*
)
(
)
/
(
*
)
(
=
=
+
=
+ V
I
P
V
P
F
I
P
F
P
F
I
P
F
P
ExercĂ­cio 5
Na ida para o emprego, o Sr. Óscar, polícia de profissão, tem de passar
obrigatoriamente por trĂȘs cruzamentos com semĂĄforos. No primeiro
cruzamento, o do Largo Azul, a probabilidade do semĂĄforo se encontrar com
sinal vermelho Ă© de 10%. Em cada um dos cruzamentos seguintes, o Sr. Óscar
fica parado devido aos sinais vermelhos em metade das vezes que lĂĄ passa.
O Sr. Óscar já descobriu que os semáforos funcionam separadamente, não
estando ligados entre si por qualquer mecanismo.
Embora goste de cumprir a lei, o guarda Óscar passa no sinal verde e acelera
no amarelo, sĂł parando mesmo no sinal vermelho.
a) Qual a probabilidade do Sr. Óscar chegar ao emprego sem ter de parar
em qualquer sinal vermelho?
b) Qual a probabilidade do Sr. Óscar ter de parar num só semáforo?
c) Qual a probabilidade do Sr. Óscar ter parado no sinal vermelho do
cruzamento do Largo Azul, sabendo que parou num sĂł semĂĄforo na sua
ida para o emprego?
Resolução
A: polĂ­cia encontra sinal vermelho no 1Âșcruzamento
B: polĂ­cia encontra sinal vermelho no 2Âșcruzamento
C: polĂ­cia encontra sinal vermelho no 3Âșcruzamento
P(A)=10% P( A )= 90%
P(B)=50% P( B )= 50%
P(C)=50% P(C )= 50%
a) P( )
C
B
A ∩
∩ = P( A )*P( B )*P(C ) = 0,9*0,5*0,5 = 22,5%
b) P( )
C
B
A ∩
∩ + P( )
C
B
A ∩
∩ +P( )
C
B
A ∩
∩ =
= P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) = 47,5%
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 60
c) P(polĂ­cia parar no 1Âșcruzamento / polĂ­cia parou num sĂł semĂĄforo)
%
26
,
5
475
,
0
)
(
*
)
(
*
)
(
475
,
0
)
(
=
=
∩
∩
=
C
P
B
P
A
P
C
B
A
P
ExercĂ­cio 6
ApĂłs alguns testes efectuados Ă  personalidade de um indivĂ­duo, concluiu-se
que este Ă© louco com probabilidade 60%, ladrĂŁo com probabilidade igual a 70%
e nĂŁo Ă© louco nem ladrĂŁo com probabilidade 25%. Determine a probabilidade
do indivĂ­duo:
a) Ser louco e ladrĂŁo
b) Ser apenas louco ou apenas ladrĂŁo
c) Ser ladrĂŁo, sabendo-se que nĂŁo Ă© louco
Resolução
A: indivĂ­duo Ă© louco
B: indivĂ­duo Ă© ladrĂŁo
P(A)=60%
P(B)=70%
P( )
B
A ∩ = 25% = P( B
A âˆȘ ) P(AâˆȘ B) = 1 – 0,25 = 75%
a) P(AâˆȘ B) = P(A) + P(B) - P(A∩ B) 0,75 = 0,6 + 0,7 - P(A∩ B)
P(A∩ B) = 0,6 + 0,7 – 0,75 = 55%
b) P(A-B) + P(B-A) = (0,6-0,55) + (0,7-0,55) = 20Ă­
c) P(B/ A ) = %
5
,
37
4
,
0
15
,
0
6
,
0
1
)
(
)
(
)
(
=
=
−
−
=
∩ A
B
P
A
P
A
B
P
ExercĂ­cio 7
Uma moeda Ă© viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem
faces, entĂŁo um nĂșmero Ă© seleccionado de 1 a 9. Se parecem coroas, um
nĂșmero Ă© seleccionado entre 1 e 5. Determine a probabilidade de ser
seleccionado um nĂșmero par.
Resolução
P(Par) = 2/3*4/9 + 1/3*2/5 = 42,96%
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 61
ExercĂ­cio 8
Numa fåbrica, 3 måquinas, M1, M2 e M3 fabricam parafusos, sendo a produção
diĂĄria total de 10000 unidades. A probabilidade de um parafuso escolhido ao
acaso ter sido produzido por M1 Ă© 30% da probabilidade de ter sido produzido
por M2. A incidĂȘncia de defeituosos na produção de cada mĂĄquina Ă©:
M1: 3% M2: 1% M3: 2%
Extrai-se ao acaso da produção diåria um parafuso. Sabendo que a
probabilidade dele ser defeituoso Ă© de 1,65%, determine o nĂșmero de
parafusos que cada mĂĄquina produz diariamente.
Resolução
M1: o parafuso foi produzido por M1
M2: o parafuso foi produzido por M2
M3: o parafuso foi produzido por M3
D: o parafuso Ă© defeituoso
n = 10000 unidades
P(M1) = 0,3 P(M2)
P(D / M1) = 3%
P(D / M2) = 1%
P(D / M3) = 2%
P(D) = 1,65%
Prod. 1 = P(M1)*10000 = ?
Prod. 2 = P(M2)*10000 = ?
Prod. 3 = P(M3)*10000 = ?
+
+
=
=
+
+
=
)
3
/
(
*
)
3
(
)
2
/
(
*
)
2
(
)
1
/
(
*
)
1
(
)
(
1
)
3
(
)
2
(
)
1
(
)
2
(
3
,
0
)
1
(
M
D
P
M
P
M
D
P
M
P
M
D
P
M
P
D
P
M
P
M
P
M
P
M
P
M
P
⇔
+
+
=
=
+
−
02
,
0
*
)
3
(
01
,
0
*
)
2
(
03
,
0
*
)
2
(
3
,
0
0165
,
0
1
)
3
(
)
2
(
3
,
1
M
P
M
P
M
P
M
P
M
P ⇔
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 62
−
+
+
=
−
=
−
02
,
0
*
))
2
(
3
,
1
1
(
01
,
0
*
)
2
(
03
,
0
*
)
2
(
3
,
0
0165
,
0
)
2
(
3
,
1
1
)
3
(
M
P
M
P
M
P
M
P
M
P ⇔
=
=
−
=
−
=
=
=
%
50
)
2
(
%
35
5
,
0
*
3
,
1
1
)
2
(
3
,
1
1
)
3
(
%
15
5
,
0
*
3
,
0
)
1
(
M
P
M
P
M
P
M
P
ExercĂ­cio 9
O João tem à sua disposição 3 meios de transporte diferentes para se deslocar
de casa para a escola: os transportes A, B ou C. Sabe-se que a probabilidade de:
- chegar atrasado Ă  escola Ă© 60%
- chegar atrasado utilizando o transporte A Ă© 80%
- chegar atrasado utilizando o transporte B Ă© 50%
- chegar atrasado utilizando o transporte C Ă© 60%
- utilizar os transportes B e C Ă© a mesma
a) Calcule a probabilidade de o JoĂŁo utilizar o transporte A
b) Sabendo que o JoĂŁo chegou atrasado Ă  escola, calcule a probabilidade
de ter utilizado os transportes B ou C.
Resolução
T: O JoĂŁo chega atrasado
A: o JoĂŁo utiliza o transporte A
B: o JoĂŁo utiliza o transporte B
C: o JoĂŁo utiliza o transporte C
P(T) = 0,6
P(T/A) = 0,8
P(T/B) = 0,5
P(T/C) = 0,6
P(B) = P(C)
P(A)+P(B)+P(C) = 1 P(A) = 1- 2P(B)
a) P(T) = P(A)*P(T/A) + P(B)*P(T/B) + P(C)*P(T/C)
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 63
Logo
0,6 = (1-2P(B))*0,8 + P(B)*0,5 + P(B)*0,6
e vem que
P(B) = 40%
Então P(A) = 1 – 2P(B) = 1 – 2*0,4 = 20%
b) P(BâˆȘ C / T) =
)
(
)
/
(
*
)
(
)
/
(
*
)
(
T
P
C
T
P
C
P
B
T
P
B
P +
=
6
,
0
6
,
0
*
4
,
0
5
,
0
*
4
,
0 +
=73,3%
ExercĂ­cio 10
Uma empresa que se dedica à prestação de serviços de selecção de pessoal
em relação a um teste psicotécnico para uma profissão específica sabe o
seguinte:
- as percentagens de indivĂ­duos com um quociente de inteligĂȘncia (Q.I.)
elevado e médio são, respectivamente, de 30% e de 60%
- a percentagem de indivíduos com Q.I. médio que ficam aptos no teste é
de 50%
- a probabilidade de um indivĂ­duo com Q.I. baixo ficar apto no teste Ă© de
20%
- finalmente, sabe-se que 70% dos indivĂ­duos com Q.I. elevado ficam
aptos no teste
a) Qual a probabilidade de um indivĂ­duo escolhido ao acaso ficar apto no
teste?
b) Qual a probabilidade de um indivĂ­duo ter Q.I. baixo, sabendo-se que
ficou inapto?
Resolução
A: indivĂ­duo fica apto no teste
E: indivĂ­duo tem QI elevado
M: indivíduo tem QI médio
B: indivĂ­duo tem QI baixo
P(E) = 30% P(M) = 60% P(B) = 1 –0,3 – 0,6 = 10%
P(A/M) = 50% P(A/B) = 20% P(A/E) = 70%
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 64
a) P(A)
=P(E)*P(A/E)+P(M)*P(A/M)+P(B)*P(A/B)
=0,3*0,7+0,6*0,5+0,1*0,2=53%
b) P(B/ A ) = %
17
53
,
0
1
8
,
0
*
1
,
0
)
(
)
/
(
*
)
(
=
−
=
A
P
B
A
P
B
P
ExercĂ­cio 11
Os resultados de um inquérito aos agregados familiares de uma determinada
cidade forneceram os seguintes dados:
- 35% dos agregados possuem telefone
- 50% dos agregados possuem frigorĂ­fico
- 25% dos agregados possuem automĂłvel
- 15% dos agregados possuem telefone e frigorĂ­fico
- 20% dos agregados possuem telefone e automĂłvel
- 10% dos agregados possuem frigorĂ­fico e automĂłvel
- 5% dos agregados possuem telefone, automĂłvel e frigorĂ­fico
a) Calcule a probabilidade de um agregado familiar
1. possuir telefone ou frigorĂ­fico
2. nĂŁo possuir nem telefone nem automĂłvel
b) Calcule a probabilidade de um agregado que possui automĂłvel
1. possuir também frigorífico
2. possuir também telefone ou frigorífico
c) Calcule a probabilidade de um agregado familiar
1. possuir pelo menos um daqueles trĂȘs objectos
2. nĂŁo possuir nenhum daqueles trĂȘs objectos
Resolução
A: agregado familiar possui telefone
B: agregado familiar possui frigorĂ­fico
C: agregado familiar possui automĂłvel
P(A) = 35%
P(B) = 50%
P(C) = 25%
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 65
P(A∩ B) = 15%
P(A∩ C) = 20%
P(B∩ C) = 10%
P(A∩ B∩ C) = 5%
a) 1. P(AâˆȘ B) = P(A) + P(B) - P(A∩ B) = 0,35 + 0,5 – 0,15 = 70%
2. P( )
C
A ∩ = P( C
AâˆȘ ) = 1 – P(AâˆȘ C) = 1 – 0,4 = 60%
P(AâˆȘ C) = P(A) + P(C) - P(A∩ C) = 0,35 + 0,25 – 0,2 = 40%
b) krysktsh1. P(B / C) = %
40
25
,
0
1
,
0
)
(
)
(
=
=
∩
C
P
C
B
P
2. P(AâˆȘ B/ C) =
%
100
25
,
0
05
.
0
1
,
0
2
,
0
)
(
)
(
)
(
)
(
=
−
+
=
∩
∩
−
∩
+
∩
C
P
C
B
A
P
C
B
P
C
A
P
c) 1.
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
( C
B
A
P
C
B
P
C
A
P
B
A
P
C
P
B
P
A
P
C
B
A
P ∩
∩
+
∩
−
∩
−
∩
−
+
+
=
âˆȘ
âˆȘ
= 0,35+0,5+0,25-0,15-0,2-0,1+0,05 = 70%
2. 1 – P( )
C
B
A âˆȘ
âˆȘ = 1 – 0,7 = 30%
ExercĂ­cio 12
Admita que 60% dos seguros no ramo automĂłvel respeitam a condutores com
mais de 40 anos de idade, dos quais 5% sofrem, pelo menos, um acidente por
ano. De entre os segurados com idade igual ou inferior a 40 anos, 3% tĂȘm um
ou mais acidentes no mesmo perĂ­odo.
a) Qual a probabilidade de um segurado nĂŁo sofrer qualquer acidente
durante um ano?
b) Qual a probabilidade de um segurado que sofreu pelo menos um
acidente ter idade igual ou inferior a 40 anos?
c) Qual a probabilidade de, numa amostra de trĂȘs segurados
1. todos terem idade igual ou inferior a 40 anos?
2. nenhum ter sofrido qualquer acidente durante um ano?
3. Todos terem idade igual ou inferior a 40 anos, dado que cada um
sofreu, pelo menos, um acidente durante o referido perĂ­odo?
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 66
Resolução
I1: o segurado tem mais de 40 anos de idade
I2: o segurado tem 40 anos ou menos de idade
A: o segurado sofre pelo menos 1 acidente por ano
A : o segurado nĂŁo sofre nenhum acidente por ano
P(I1) = 60% P(I2) = 1 – 0,6 = 40%
P(A/I1) = 5% P( A /I1) = 1 – 0,05 = 95%
P(A/I2) = 3% P( A /I2) = 1 – 0,03 = 97%
a) P( A ) = P(I1)* P( A /I1) + P(I2)* P( A /I2) = 0,6*0,95 + 0,4*0,97 = 95,8%
b) P(I2/A) = %
57
,
28
958
,
0
1
03
,
0
*
6
,
0
)
(
)
2
/
(
*
)
2
(
)
(
)
2
(
=
−
=
=
∩
A
P
I
A
P
I
P
A
P
I
A
P
= P(B)
c) 1. P( )
2
2
2 I
I
I ∩
∩ = 0,4*0,4*0,4 = 6,4%
2. P( )
A
A
A ∩
∩ = 0,958*0,958*0,958 = 87,9%
3. P( )
B
B
B ∩
∩ = 0,2857*0,2857*0,2857 = 2,3%
104
Introdução ao e-learning
FMD_i.p65 15-01-2004, 10:49
104
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 67
FUNÇÕES DE PROBABILIDADE
ExercĂ­cios resolvidos
ExercĂ­cio 1
Se 20% das bobinas de um determinado cabo eléctrico forem defeituosas,
calcule a probabilidade de, entre as 4 bobines necessĂĄrias a um determinado
cliente, escolhidas ao acaso uma ser defeituosa.
Resolução
X: nĂșmero de bobines defeituosas no conjunto de 4 bobines necessĂĄrias a um
determinado cliente (0,1,2,3,4)
n=4 p=0,2 q=1-p=0,8
P(X=1)=C4
p1
q4-1
= 4*0,2*0,83
= 0,4096 = 41%
ExercĂ­cio 2
O nĂșmero mĂ©dio de chamadas telefĂłnicas a uma central, por minuto, Ă© 5. A
central sĂł pode atender um nĂșmero mĂĄximo de 8 chamadas por minuto. Qual a
probabilidade de nĂŁo serem atendidas todas as chamadas no intervalo de
tempo de 1 minuto?
Resolução
X: nĂșmero de chamadas telefĂłnicas atendidas numa central, por minuto
(0,1,2,3,4, 5, 6, 7, 8)
λ=5 p=0,2 q=1-p=0,8
P(X≀8) =
=
−
8
0
5
!
5
x
x
x
e
= 0,932 Logo P(X>8) = 1-0,932 = 0,06
ExercĂ­cio 3
O tempo de funcionamento sem avarias de uma determinada mĂĄquina de
produção contínua segue uma lei exponencial negativa com valor esperado
igual a 4,5 horas. Imagine que a mĂĄquina Ă© (re)colocada em funcionamento no
instante t=0 horas.
Qual a probabilidade de nĂŁo ocorrerem avarias antes do instante t=6 horas?
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 68
Resolução
Seja
T: tempo de funcionamento sem avarias (ou entre avarias consecutivas) de
uma mĂĄquina, e
X: numero de avarias que ocorrem no intervalo [0,6[, isto Ă©, num perĂ­odo de 6h
λ=1/4,5 corresponde ao nĂșmero de avarias por unidade de tempo (por hora)
Logo
P(T≄6) = P(X=0)=
333
,
1
6
*
5
,
4
1
−
−
= e
e = 0,264
ExercĂ­cio 4
Considere que o comprimento médio de determinado fio condutor é 120, com
desvio padrĂŁo 0,5. Qual a percentagem de fio com comprimento superior a 121?
Resolução
X: comprimento de determinado fio condutor
Calculando a variĂĄvel reduzida correspondente, vem:
2
5
,
0
120
121
=
−
=
Z
Consultando a tabela, verifica-se que o valor da função Z Ă© P(X≀2) = 0,9772.
Logo P(X>2) = 1-0,9772 = 2,28%.
ExercĂ­cio 5
Numa praia do litoral portuguĂȘs existe um serviço de aluguer de barcos,
destinado aos turistas que a frequentam. O nĂșmero de turistas que procuram
este serviço, por hora, estå associado a uma variåvel aleatória com distribuição
de Poisson.
Verificou-se que, em média, em cada hora, esse serviço é procurado por 8
turistas interessados em alugar barcos; sabe-se, por outro lado, que esse
serviço funciona ininterruptamente das 8 às 20 horas.
a) Qual a probabilidade de que, entre as 8 e as 9 horas, se aluguem 5
barcos?
b) Qual a probabilidade de que, entre as 9 e as 11 horas, os barcos
sejam procurados por mais de 25 turistas?
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 69
Resolução
X: nÂșde turistas que procuram o serviço de aluguer de barcos por hora
X segue Po(λ=8)
a) Na tabela da Po(λ=8) vem P(X=5) = 9,16%
b) Y1: nÂșde turistas que procuram o serviço de aluguer na 1ÂȘ hora
Y2: nÂșde de turistas que procuram o serviço de aluguer na 2ÂȘ hora
Logo
Y1+Y2: nÂșde turistas que procuram o serviço de aluguer em 2 horas
Pelo Teorema da Aditividade da Poisson, considerando Y1 e Y2
independentes e que todas seguem Po(8), vem que:
Z=Y1+Y2 segue Po(2*8=16)
Logo P(Z>25) = f(26) +... + f(33) = 0,0057 + ... + 0,0001 = 1,32%
ExercĂ­cio 6
O nĂșmero de navios petroleiros que chegam diariamente a certa refinaria Ă©
uma variåvel com distribuição de Poisson de parùmetro 2. Nas actuais
condiçÔes, o cais da refinaria pode atender, no måximo, 3 petroleiros por dia.
Atingido este nĂșmero, os restantes que eventualmente apareçam deverĂŁo
seguir para outro porto.
a) Qual a probabilidade de, num qualquer dia, ser preciso mandar
petroleiros para outro porto?
b) De quanto deveriam ser aumentadas as instalaçÔes de forma a
assegurar cais a todos os petroleiros em 99,9% dos dias?
c) Qual o nĂșmero esperado de petroleiros a chegarem por dia?
d) Qual o nĂșmero mais provĂĄvel de petroleiros a chegarem por dia?
e) Qual o nĂșmero esperado de petroleiros a serem atendidos diariamente?
f) Qual o nĂșmero esperado de petroleiros que recorrerĂŁo a outros portos
diariamente?
Resolução
X: nÂșde petroleiros que chegam diariamente a uma certa refinaria
X segue Po (2)
Capacidade mĂĄxima de atendimento da refinaria: 3 petroleiros/dia
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 70
a) P(X>3) = 1 – P(X≀3) = 1 – F(3) = 1 – 0,8571 =14,29%
(tab. pg.14)
b) NÂșmĂĄximo de petroleiros que podem chegar: 9 (informação da tabela)
Logo, a capacidade devia aumentar em 6 petroleiros/dia (9-3)
c) E(X) = 2
d) X = 1 ou X = 2, com probabilidade 27,07%
e) Y: nÂșde petroleiros que sĂŁo atendidos diariamente numa certa refinaria
(0,1, 2, 3)
g(0) = P(X=0) = 0,1353
g(1) = P(X=1) = 0,2707
g(2) = P(X=2) = 0,2707
g(3) = P(X=3) = 1 – P(X<3) = 1 – P(X≀2) = 1 – 0,6767 = 0,3233
E(Y) = 0*0,1353 + 
 + 3*0,3233 = 1,782
São atendidos, em média, entre 1 e 2 petroleiros diariamente
f) Z: nÂșde petroleiros que recorrem diariamente a outros portos
(0,1, 2, 3, 4, 5, 6)
Logo, Z = X - Y
E(Z) = E(X -Y) = E(X) - E(Y) = 2 - 1,782 = 0,218
Recorrem a outros portos, em média, entre 0 e 1 petroleiro por dia
g) W: nÂșde dias em que Ă© preciso mandar petroleiros para outro porto num
mĂȘs de 30 dias (0,1, 2,...30)
W segue Bi (n = 30; p = P(X>3) = 0,1429)
E(W) = 30*0,1429 = 4,3
Em mĂ©dia, Ă© preciso enviar petroleiros para outro porto 4 a 5 dias/mĂȘs
ExercĂ­cio 7
Os Serviços Municipalizados de Gås e Electricidade debitam mensalemnte aos
seus clientes um consumo teórico T de energia eléctrica calculado de tal modo
que a probabilidade de o consumo efectivo o exceder seja de 30,85%.
Suponha um cliente cujo consumo por mĂȘs segue lei normal de mĂ©dia 400 kwh
e desvio-padrĂŁo 40 kwh.
a) Qual o consumo teĂłrico que lhe Ă© mensalmente debitado?
b) 1. Qual a distribuição do consumo efectivo durante 3 meses?
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 71
2. Qual a probabilidade de que, ao fim de 3 meses, o consumo teĂłrico
exceda o efectivo em mais de 100 kwh?
Resolução
X: consumo efectivo de energia elĂ©ctrica de um cliente por mĂȘs (em kwh)
T: consumo teĂłrico (valor fixo) debitado ao cliente por mĂȘs (em kwh)
T: P(X>T) = 0,3085
X segue N(400; 1600)
a) P(X>T) = 0,3085 ⇔ P( 3085
,
0
)
40
400
40
400
=
−
>
− T
X
⇔
P(N(0,1) 420
5
,
0
40
400
6915
,
0
)
40
400
=
⇔
=
−
⇔
=
−
≀ T
T
T
b) 1.
X1: consumo efectivo de energia elĂ©ctrica de um cliente no 1Âș
mĂȘs (em kwh)
X2: consumo efectivo de energia elĂ©ctrica de um cliente no 2Âș
mĂȘs (em kwh)
X3: consumo efectivo de energia elĂ©ctrica de um cliente no 3Âș
mĂȘs (em kwh)
Logo
X1+X2+X3: consumo efectivo de energia eléctrica em 3 meses (em kwh)
Pelo Teorema da Aditividade da Normal, considerando X1, X2 e X3
independentes e que todas seguem N(400, 1600), vem que:
Y=X1+X2+X3 segue N(400*3; 1600*3), isto Ă©, N(1200; 4800)
2. P(3*420-Y > 100) = P(Y < 1160) = P(N(0,1)< )
4800
1200
1160 −
=
= P(N(0,1)<-0,58) = 28,1%
ExercĂ­cio 8
Num determinado processo de fabrico, existem 2 cadeias de montagem A e B,
com funcionamento independente.
A cadeia A opera a um ritmo médio de 2 montagens por hora, e a probabilidade
da cadeia B efectuar pelo menos uma montagem numa hora Ă© de 98,71%.
Admitindo que o nĂșmero de montagens efectuadas por hora em ambas as
cadeias Ă© uma v.a. Poisson, determine:
a) a probabilidade de se efectuarem mais de 6 montagens numa hora com
a cadeia B
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 72
b) a probabilidade de, em 3 horas de trabalho, se efectuarem no mĂĄximo
10 montagens com a cadeia B
c) a probabilidade de, numa hora, a cadeia A efectuar o dobro de
montagens de B
d) o nĂșmero mĂ©dio de montagens efectuadas num dia de trabalho de 8
horas com ambas as cadeiras
Resolução
X: nÂșde montagens da cadeia A por hora X segue Po(2)
Y: nÂșde montagens da cadeia B por hora
a) Y segue Poisson, mas desconhece-se a média (=parùmetro λ)
No entanto, como se sabe que P(Y≄1) = 0,9817, vem que
P(Y<1) = 1 – 0,9817 = 0,0183
Na tabela da Poisson, percorrendo as linhas de valor = 0, vem que o
valor 0,0183 pode ser encontrado no cruzamento da linha 0 com a
coluna 4. Logo, λ = 4.
Na tabela da Po(4), P(Y>6) = 1–P(Y≀6) = 1–F(6) = 1-0,8893=11,07%
b)
Y1: nÂșde montagens da cadeia B na 1ÂȘ hora
Y2: nÂșde montagens da cadeia B na 2ÂȘ hora
Y3: nÂșde montagens da cadeia B na 3ÂȘ hora
Logo
Y1+Y2+Y3: nÂșde montagens da cadeia B em 3 horas
Pelo Teorema da Aditividade da Poisson, considerando Y1, Y2 e Y3
independentes e que todas seguem Po(4), vem que:
Z=Y1+Y2+Y3 segue Po(4*3=12)
P(Z≀10) = f(0) + f(1) +... + f(10) = 0 + 0,0001 + 
 + 0,1048 = 34,72%
c) P(X=2Y) = P(X=0∩ Y=0) + P(X=2 ∩ Y=1) + P(X=4 ∩ Y=2) +
P(X=6 ∩ Y=3) + P(X=8∩ Y=4) = 0,1353*0,0183 + 0,2707*0,0753 +
0,0902*0,1465 + 0,012*0,1954 + 0,0009*0,1954 = 3,8%
d) W: nÂșde montagens das 2 cadeias num dia de trabalho de 8 horas
W = )
(
8
1
i
i
i Y
X +
=
onde Xi + Yi corresponde ao nÂșde montagens das 2 cadeias por hora
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 73
Pelo Teorema da Aditividade de Poisson, sendo as variĂĄveis
independentes e seguindo Po(2) e Po(4) respectivamente, vem que
Xi + Yi segue também Po(2+4=6).
E Z , também pelo mesmo Teorema, segue Po(6*8=48)
Logo, o nĂșmero mĂ©dio de montagens efectuado pelas 2 cadeias num dia
de trabalho de 8 horas Ă© de 48.
ExercĂ­cio 9
Uma companhia de tabacos recebeu em dada altura um elevado nĂșmero de
queixas quanto Ă  qualidade dos cigarros de certa marca que comercializa.
Numa råpida anålise às condiçÔes de produção, constata-se que 1% dos filtros
que compÔem o cigarro saem defeituosos. Nestas condiçÔes, determine:
a) a probabilidade de um maço acabado de formar
1. conter 1 cigarro com filtro defeituoso
2. conter 0 cigarros com filtro defeituoso
b) o nĂșmero de maços que, num volume que contĂ©m 20, a companhia
espera poder aproveitar se utilizar o critério:
1. maço é aproveitåvel se não contiver cigarros defeituosos
2. maço é aproveitåvel se contiver no måximo 1 cigarro defeituoso
Resolução
X: nÂșde cigarros com filtro defeituoso em 20 cigarros de um maço
X segue Bi(n=20; p=0,01)
a) 1. P(X=1) = 20*0,01*0,9919
= 16,52%
2. P(X=0) = 0,010
*0,9920
= 81,79%
b) 1. Crit. 1: maço é aproveitåvel se não contiver cigarros defeituosos
Y: nÂșde maços aproveitĂĄveis num volume que contem 20 maços
Y segue Bi(n=20; p=P(X=0) = 0,8179)
Logo E(Y) = 20*0,8179 = 16,36
2. Crit. 2: maço é aproveitåvel se contiver no måximo 1 cigarro defeituoso
Y: nÂșde maços aproveitĂĄveis num volume que contem 20 maços
Y segue Bi(n=20; p=P(X=0)+P(X=1)= 0,8179+0,1652 = 0,9831)
Logo E(Y) = 20*0,9831 = 19,66
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 74
ExercĂ­cio 10
O comprimento das peças produzidas por uma måquina é uma v.a. Normal
com mĂ©dia ” e variĂąncia σ2
. Uma peça defeituosa se o seu comprimento diferir
do valor mĂ©dio mais do que σ. Sabemos que 50% das peças produzidas tĂȘm
comprimento inferior a 0,25 mm e 47,5% tĂȘm comprimento entre 0,25 mm e
0,642 mm.
a) Calcule a média e o desvio-padrão do comprimento das peças.
b) Determine a probabilidade de uma peça não ser defeituosa.
Resolução
X: comprimento das peças produzidas por uma måquina
X segue N(”; σ2
)
Peça defeituosa se X>” + σ ou se X< ” - σ
P(X<0,25) = 50%
P(0,25<X<0,642) = 47,5%
a) Como P(X<0,25) = 50% vem que
P( %
50
)
25
,
0
=
−
<
−
σ
”
σ
”
X
Na tabela,
σ
”
−
25
,
0
tem que ser =0, logo ”
”
”
” = 0,25
E como
P(0,25<X<0,642) = 47,5% vem que
=
<
<
=
−
<
−
<
−
)
392
,
0
)
1
,
0
(
0
(
)
25
,
0
642
,
0
25
,
0
25
,
0
25
,
0
(
σ
σ
σ
σ
N
P
X
P
)
0
(
)
392
,
0
( Ξ
σ
ξ −
= = 0,475
Sendo Ξ (0)=0,5, vem que 975
,
0
5
,
0
475
,
0
)
392
,
0
( =
+
=
σ
Ξ
Na tabela 3B da Normal, vem que 96
,
1
392
,
0
=
σ
e logo σ
σ
σ
σ = 0,2
b) P(peça nĂŁo defeituosa) = P(” - σ < X < ” + σ) = P(0,05 < X < 0,45) =
P(X<0,45) – P(X<0,05) =
%
13
,
84
)
1
(
)
1
(
)
1
(
)
2
,
0
25
,
0
05
,
0
(
)
2
,
0
25
,
0
45
,
0
( =
=
−
−
=
−
−
−
D
Ξ
Ξ
Ξ
Ξ
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 75
ExercĂ­cio 11
Sabe-se que a probabilidade de cura de uma certa doença é 20%. PÔe-se à
prova um novo medicamento, que eleva a probabilidade de cura para 40%,
ministrando-o a um grupo de 20 doentes. Admite-se que o medicamento Ă©
eficaz no caso de contribuir para a cura de, pelo menos, 8 doentes em 20.
Calcule a probabilidade de se concluir pela ineficĂĄcia do medicamento, ainda
que este eleve de facto a probabilidade de cura para 40%.
Resolução
X: nĂșmero de doentes curados no grupo de 20 a que Ă© ministrado o novo
medicamento (0,1,2...19, 20)
n=20 p=0,4 q=1-p=0,6 X segue Bi (20; 0,4)
P(X≄8)=1- F(7) = 41,58%
ExercĂ­cio 12
Sabe-se por via experimental que, por cada perĂ­odo de 5 minutos, chegam, em
média, 4 veículos a determinado posto abastecedor de combustíveis. Um
empregado entra ao serviço às 8 horas. Qual a probabilidade de ter de
aguardar mais de 10 minutos até à chegada de um veículo?
Resolução
X: nÂșde veĂ­culos que chegam ao posto abastecedor por perĂ­odo de 5 minutos
X segue Po(4)
Se
X1: nÂșde veĂ­culos que chegam ao posto no 1ÂșperĂ­odo de 5 minutos
X2: nÂșde veĂ­culos que chegam ao posto no 2ÂșperĂ­odo de 5 minutos
entĂŁo
X1+X2: nÂșde veĂ­culos que chegam ao posto abastecedor em 10 minutos
Pelo Teorema da Aditividade de Poisson, considerando X1 e X2 independentes
e que ambas seguem Po(4), vem que X1+X2 também segue Po(4+4=8)
Logo P(X1+X2=0) na tabela da Po(8) vem igual a 0,03%.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 76
3.4. Estimação por intervalos
Conhecendo-se uma amostra em concreto, Ă© possĂ­vel estimar os valores dos
seus parùmetros caracterizadores através de métodos probabilísticos.
Por exemplo, suponhamos que numa fĂĄbrica produtora de açĂșcar se pretende
averiguar se o peso dos pacotes produzidos estå, em média, dentro das
normas de qualidade exigíveis. Na impossibilidade de medição do peso de
todos os pacotes, pela morosidade e dispĂȘndio de recursos que tal implicaria, a
estatĂ­stica permite que, a partir da observação de uma Ășnica amostra, seja
possível inferir entre que valores varia o peso médio com um grau de confiança
ou probabilidade elevado. Assim, ao recolher um determinado nĂșmero de
pacotes da produção total aleatoriamente, é possível calcular o peso médio de
acordo com as técnicas de estatística descritiva apreendidas atrås. Claro que
nada nos garante que esse valor coincide com o valor do parĂąmetro da
população em estudo. De facto, é até provåvel que não coincida e, mais, se
recolhermos outro conjunto idĂȘntico de pacotes, o valor seja diferente. Isto Ă©,
para cada amostra de dimensĂŁo n recolhida, a estimativa do parĂąmetro
assumiria valores distintos. Então, como retirar conclusÔes? Como garantir
algum nĂ­vel de rigor?
O mĂ©todo a estudar neste capĂ­tulo – a estimação por intervalos – permite, a
partir da recolha de uma Ășnica amostra, aferir entre que valores seria de
esperar que variasse o parĂąmetro de interesse se nos empenhĂĄssemos a
recolher um nĂșmero infinito de amostras. Isto Ă©, por exemplo, caso o valor
amostral fosse de 1,02 kg, este método poderia, por exemplo, permitir afirmar
que seria altamente provĂĄvel que o peso dos pacotes produzidos estivesse a
variar entre 0,92 kg e 1,12 kg. E esse resultado tem um determinado nĂ­vel de
confiança associado: por exemplo, se dissermos que o nível de confiança ou
certeza implicado Ă© de 95%, tal significa que, se nos fosse possĂ­vel observar
um nĂșmero infinito de amostras, o intervalo de valores apresentado
corresponderia aos resultados obtidos em 95% delas (os valores mais
usualmente utilizados são 90%, 95% ou 99% de confiança). Caberia depois à
empresa julgar se esses seriam ou nĂŁo valores aceitĂĄveis e proceder aos
eventuais reajustes necessĂĄrios.
Manual de ExercĂ­cios
EstatĂ­stica Aplicada 77
A partir do conceito de intervalo de confiança para um parùmetro, é fåcil
concluir que a sua especificação implica conhecer:
- o estimador do parĂąmetro em causa
- a sua distribuição de probabilidade
- uma estimativa particular daquele parĂąmetro
Como parùmetros de interesse e para efeitos de exemplificação, vão
considerar-se duas tipologias de intervalo: o intervalo de confiança para a
média de uma população normal e o intervalo de confiança para a proporção
de uma população binomial. Para efeitos de simplificação, vão considerar-se
apenas exemplos relativos a amostras de grande dimensĂŁo (na prĂĄtica, n≄100)
(i) Intervalo de confiança para a média ”
”
”
” de uma população normal
Seja X (média amostral) o estimador da média da população. Porque a
distribuição é Normal, a distribuição deste estimador serå:
)
;
(
n
N
X
σ
”
∩
Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se
necessĂĄrio calcular a variĂĄvel reduzida correspondente:
)
1
;
0
(
N
n
X
Z ∩
−
=
σ
”
Esta variåvel permitirå deduzir a fórmula geral do intervalo de confiança para a
média ” de uma população normal:
+
−
n
c
X
n
c
X
σ
σ
;
Isto é, em torno do valor do estimador, é definido um intervalo de variação onde
Ă© possĂ­vel afirmar que o parĂąmetro a estimar estĂĄ contido com um grau de
confiança Ύ . Esse intervalo de variação depende:
- da dimensĂŁo da amostra (n): quanto maior a dimensĂŁo da amostra,
menor a amplitude do intervalo. Este resultado explica-se facilmente: no
limite, se fosse possível observar todo o universo de dados (n=∞ ), o
valor amostral calculado corresponderia ao valor da população.
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf

Weitere Àhnliche Inhalte

Ähnlich wie dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf

Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.pptCurso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
ssuser2b53fe
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)
Luccy Crystal
 
CapĂ­tulo ii estatĂ­stica iniciais
CapĂ­tulo ii   estatĂ­stica  iniciaisCapĂ­tulo ii   estatĂ­stica  iniciais
CapĂ­tulo ii estatĂ­stica iniciais
con_seguir
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunos
CĂ©zar Guerra
 
Apresentacao quanti v4
Apresentacao quanti v4Apresentacao quanti v4
Apresentacao quanti v4
Procambiental
 
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.pptCurso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
ssuser2b53fe
 
Aprenda fazer uma distribuição de frequĂȘncia, Estatistica
Aprenda fazer uma distribuição de frequĂȘncia, EstatisticaAprenda fazer uma distribuição de frequĂȘncia, Estatistica
Aprenda fazer uma distribuição de frequĂȘncia, Estatistica
Pedro Kangombe
 
EstatĂ­stica completa
EstatĂ­stica completaEstatĂ­stica completa
EstatĂ­stica completa
Ronne Seles
 

Ähnlich wie dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf (20)

Apostila de estatistica
Apostila de estatisticaApostila de estatistica
Apostila de estatistica
 
2012 aula1 (1)
2012 aula1 (1)2012 aula1 (1)
2012 aula1 (1)
 
Atps estatistica 2
Atps estatistica 2Atps estatistica 2
Atps estatistica 2
 
Introdução a Estatistica 1.pdf
Introdução a Estatistica 1.pdfIntrodução a Estatistica 1.pdf
Introdução a Estatistica 1.pdf
 
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.pptCurso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)
 
CapĂ­tulo 1 livro bĂĄsico probabiliade
CapĂ­tulo 1  livro bĂĄsico probabiliadeCapĂ­tulo 1  livro bĂĄsico probabiliade
CapĂ­tulo 1 livro bĂĄsico probabiliade
 
EstatĂ­stica aplicada Ă  gestĂŁo de recursos humanos
EstatĂ­stica aplicada  Ă  gestĂŁo de recursos humanosEstatĂ­stica aplicada  Ă  gestĂŁo de recursos humanos
EstatĂ­stica aplicada Ă  gestĂŁo de recursos humanos
 
CapĂ­tulo ii estatĂ­stica iniciais
CapĂ­tulo ii   estatĂ­stica  iniciaisCapĂ­tulo ii   estatĂ­stica  iniciais
CapĂ­tulo ii estatĂ­stica iniciais
 
EstatĂ­stica
EstatĂ­sticaEstatĂ­stica
EstatĂ­stica
 
Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
Estdescr
EstdescrEstdescr
Estdescr
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunos
 
Aula de GrĂĄficos - Bioestatistica
Aula de GrĂĄficos - BioestatisticaAula de GrĂĄficos - Bioestatistica
Aula de GrĂĄficos - Bioestatistica
 
Apresentacao quanti v4
Apresentacao quanti v4Apresentacao quanti v4
Apresentacao quanti v4
 
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.pptCurso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
Curso_de_EstatĂ­stica_Aplicada_Usando_o_R.ppt
 
Aprenda fazer uma distribuição de frequĂȘncia, Estatistica
Aprenda fazer uma distribuição de frequĂȘncia, EstatisticaAprenda fazer uma distribuição de frequĂȘncia, Estatistica
Aprenda fazer uma distribuição de frequĂȘncia, Estatistica
 
Introd computacao
Introd computacaoIntrod computacao
Introd computacao
 
Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
EstatĂ­stica completa
EstatĂ­stica completaEstatĂ­stica completa
EstatĂ­stica completa
 

Mehr von RaquelSilva604657

Mehr von RaquelSilva604657 (18)

manual-11.pdf
manual-11.pdfmanual-11.pdf
manual-11.pdf
 
FME-7.pdf
FME-7.pdfFME-7.pdf
FME-7.pdf
 
FME-9.pdf
FME-9.pdfFME-9.pdf
FME-9.pdf
 
RESPOSTAS-6.pdf
RESPOSTAS-6.pdfRESPOSTAS-6.pdf
RESPOSTAS-6.pdf
 
FME-1.pdf
FME-1.pdfFME-1.pdf
FME-1.pdf
 
FME-4.pdf
FME-4.pdfFME-4.pdf
FME-4.pdf
 
FME-10.pdf
FME-10.pdfFME-10.pdf
FME-10.pdf
 
RESPOSTAS-11.pdf
RESPOSTAS-11.pdfRESPOSTAS-11.pdf
RESPOSTAS-11.pdf
 
RESPOSTAS-10.pdf
RESPOSTAS-10.pdfRESPOSTAS-10.pdf
RESPOSTAS-10.pdf
 
FME-11.pdf
FME-11.pdfFME-11.pdf
FME-11.pdf
 
FME-2.pdf
FME-2.pdfFME-2.pdf
FME-2.pdf
 
RESPOSTAS-7.pdf
RESPOSTAS-7.pdfRESPOSTAS-7.pdf
RESPOSTAS-7.pdf
 
RESPOSTAS-8.pdf
RESPOSTAS-8.pdfRESPOSTAS-8.pdf
RESPOSTAS-8.pdf
 
RESPOSTAS-9.pdf
RESPOSTAS-9.pdfRESPOSTAS-9.pdf
RESPOSTAS-9.pdf
 
FME-5.pdf
FME-5.pdfFME-5.pdf
FME-5.pdf
 
FME-6.pdf
FME-6.pdfFME-6.pdf
FME-6.pdf
 
FME-8.pdf
FME-8.pdfFME-8.pdf
FME-8.pdf
 
FME-3.pdf
FME-3.pdfFME-3.pdf
FME-3.pdf
 

dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf

  • 1.
  • 3. Manual de ExercĂ­cios EstatĂ­stica Aplicada 2 ÍNDICE 1. INTRODUÇÃO .............................................
.................................... 4 1.1 DefiniçÔes Gerais ........................................................................ 5 1.1.1. População 5 1.1.2. VariĂĄveis ou atributos 5 1.1.3. Processo de amostragem 5 1.2 A EstatĂ­stica Descritiva e a EstatĂ­stica Indutiva .............
...... 6 2. ESTATÍSTICA DESCRITIVA .............................................
................... 8 2.1 VariĂĄveis Qualitativas ................................................................. 8 2.2 VariĂĄveis Quantitativas Discretas ............................................. 9 2.3 VariĂĄveis Quantitativas ContĂ­nuas ............................................ 10 2.4 Medidas de Localização ............................................................. 11 2.4.1. MĂ©dia 11 2.4.2. Mediana 12 2.4.3. Moda 13 2.5 Medidas de Ordem ...................................................................... 13 2.6 Medidas de Assimetria ............................................................... 14 2.7 Medidas de DispersĂŁo ................................................................ 15 2.7.1. DispersĂŁo Absoluta 15 2.7.2. DispersĂŁo Relativa 16 2.8 AnĂĄlise de Concentração ........................................................... 17 2.8.1. Curva de Lorenz 17 2.8.2. Índice de Gini 18 2.9 EstatĂ­stica Descritiva Bidimensional ........................................ 19
  • 4. Manual de ExercĂ­cios EstatĂ­stica Aplicada 3 3. ESTATÍSTICA INDUTIVA .............................................
...................... 45 3.1 NoçÔes bĂĄsicas de probabilidades ........................................... 45 3.2 Probabilidade condicionada ...................................................... 48 3.3 FunçÔes de Probabilidade ........................................
.............. 49 3.4 Estimação por Intervalos ..........................................
.............. 76 3.5 Testes de hipĂłteses ..................................................
.............. 89 3.6 AplicaçÔes EstatĂ­sticas: Fiabilidade ......................................... 105 3.6.1. Conceito de fiabilidade 105 3.6.2. Fiabilidade de um sistema 105 3.7 AplicaçÔes EstatĂ­sticas: Controlo EstatĂ­stico de Qualidade .. 110 3.8 AplicaçÔes EstatĂ­sticas: Tratamento EstatĂ­stico de InquĂ©ritos . 114 3.8.1. Teste de independĂȘncia do qui-quadrado 114
  • 5. Manual de ExercĂ­cios EstatĂ­stica Aplicada 4 "A estatĂ­stica Ă© a tĂ©cnica de torturar os nĂșmeros atĂ© que eles confessem". Autor desconhecido 1. INTRODUÇÃO Inicialmente, a actividade estatĂ­stica surgiu como um ramo da MatemĂĄtica. Limitava-se ao estudo de mediçÔes e tĂ©cnicas de contagem de fenĂłmenos naturais e ao cĂĄlculo de probabilidades de acontecimentos que se podiam repetir indefinidamente. Actualmente, os mĂ©todos estatĂ­sticos sĂŁo utilizados em muitos sectores de actividade, tendo como algumas aplicaçÔes estudos de fiabilidade, pesquisas de mercado, testes de controle de qualidade, tratamento de inquĂ©ritos, sondagens, modelos economĂ©tricos, previsĂ”es, etc. Exemplo de uma estatĂ­stica: os valores da inflação entre 1980 e 1990 constituem uma estatĂ­stica. Fazer estatĂ­stica sobre estes dados poderia consistir, por exemplo, em traçar grĂĄficos, calcular a inflação mĂ©dia trimestral ou prever a inflação para 1991. A anĂĄlise de um problema estatĂ­stico desenvolve-se ao longo de vĂĄrias fases distintas: (i) Definição do Problema Saber exactamente aquilo que se pretende pesquisar; estabelecer o objectivo de anĂĄlise e definição da população (ii) Amostragem e Recolha de Dados Fase operacional. É o processo de selecção e registo sistemĂĄtico de dados, com um objectivo determinado. Os dados podem ser primĂĄrios (publicados pela prĂłpria pessoa ou organização) ou secundĂĄrios (quando sĂŁo publicados por outra organização). (iii) Tratamento e Apresentação dos Dados Resumo dos dados atravĂ©s da sua contagem e agrupamento. É a classificação de dados, recorrendo a tabelas ou grĂĄficos.
  • 6. Manual de ExercĂ­cios EstatĂ­stica Aplicada 5 (iv)AnĂĄlise e Interpretação dos Dados A Ășltima fase do trabalho estatĂ­stico Ă© a mais importante e delicada. EstĂĄ ligada essencialmente ao cĂĄlculo de medidas e coeficientes, cuja finalidade principal Ă© descrever o comportamento do fenĂłmeno em estudo (estatĂ­stica descritiva). Na estatĂ­stica indutiva a interpretação dos dados se fundamentam na teoria da probabilidade. 1.1. DefiniçÔes Gerais 1.1.1. População Fazer estatĂ­stica pressupĂ”e o estudo de um conjunto de objectos bem delimitado com alguma caracterĂ­stica em comum sobre os quais observamos um certo nĂșmero de atributos designados por variĂĄveis. Exemplo: Empresas existentes em Portugal 1.1.2. VariĂĄveis ou atributos As propriedades de uma população sĂŁo estudadas observando um certo nĂșmero de variĂĄveis ou atributos. As variĂĄveis podem ser de natureza qualitativa ou quantitativa. As variĂĄveis quantitativas podem ainda dividir-se entre discretas e contĂ­nuas. As variĂĄveis discretas assumem apenas um nĂșmero finito numerĂĄvel de valores. As variĂĄveis contĂ­nuas podem assumir um nĂșmero finito nĂŁo numerĂĄvel ou um nĂșmero infinito de valores. Exemplo: um conjunto de empresas pode ser analisado em termos de sector de actividade (atributo qualitativo), nĂșmero de trabalhadores (atributo quantitativo discreto), rĂĄcio de autonomia financeira (atributo quantitativo contĂ­nuo), etc 1.1.3. Processo de amostragem Para conhecer de forma completa a população, podem efectuar-se:
  • 7. Manual de ExercĂ­cios EstatĂ­stica Aplicada 6 - recenseamentos (indagação completa de todos os elementos da população); este processo Ă©, no entanto, tipicamente moroso e dispendioso, sendo esses os motivos porque os Censos sĂŁo realizados apenas em cada 10 anos. - estudos por amostragem (observação de apenas um subconjunto, tido como representativo do universo). As tĂ©cnicas de recolha de amostras garantem a sua representatividade e aleatoriedade. 1.2. A EstatĂ­stica Descritiva e a EstatĂ­stica Indutiva Para alĂ©m do ramo de amostragem, a estatĂ­stica compreende dois grandes ramos: a estatĂ­stica descritiva e a estatĂ­stica indutiva. A estatĂ­stica descritiva Ă© o ramo da estatĂ­stica que se encarrega do tratamento e anĂĄlise de dados amostrais. Assim, depois de recolhida a amostra de acordo com tĂ©cnicas que garantem a sua representatividade e aleatoriedade, fica disponĂ­vel um conjunto de dados sobre o universo “em bruto” ou nĂŁo classificados. Para que seja possĂ­vel retirar qualquer tipo de conclusĂ”es, torna- se necessĂĄrio classificar os dados, recorrendo a tabelas de frequĂȘncias e a representaçÔes grĂĄficas, isto Ă©, Ă© preciso tratar os dados. Depois de tratados, serĂĄ possĂ­vel proceder Ă  anĂĄlise dos dados atravĂ©s de vĂĄrias medidas que descrevem o seu comportamento: localização, dispersĂŁo, simetria dos dados, concentração, etc. SĂŁo disso exemplo indicadores numĂ©ricos bem conhecidos como a mĂ©dia ou a variĂąncia. A estatĂ­stica indutiva Ă© o ramo da estatĂ­stica que se ocupa em inferir das conclusĂ”es retiradas sobre a amostra para a população. De facto, a amostra nĂŁo Ă© mais do que um passo intermĂ©dio e exequĂ­vel de obter informaçÔes sobre o verdadeiro objecto de estudo, que Ă© o universo. A estatĂ­stica indutiva (ou inferĂȘncia estatĂ­stica) garante a ligação entre amostra e universo: se algo se concluiu acerca da amostra, atĂ© que ponto Ă© possĂ­vel afirmar algo semelhante para o universo? É nesta fase que se procuram validar as hipĂłteses formuladas numa fase prĂ©via exploratĂłria. Claro que o processo de
  • 8. Manual de ExercĂ­cios EstatĂ­stica Aplicada 7 indução implica um certo grau de incerteza associado Ă  tentativa de generalização de conclusĂ”es da “parte” (amostra) para o “todo” (universo). O conceito de probabilidade vai ter aqui, entĂŁo, um papel fundamental. Isto Ă©, nĂŁo vai ser possĂ­vel afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo, mas apenas que o faz com forte probabilidade. As inferĂȘncias indutivas sĂŁo assim elaboradas medindo, ao mesmo tempo, o respectivo grau de incerteza. DaĂ­ que, na ficha das tĂ©cnicas das sondagens eleitorais, por exemplo, apareçam referĂȘncias ao “nĂ­vel de confiança” associado aos resultados e ao “erro” cometido. O esquema seguinte ilustra a “roda” da disciplina de estatĂ­stica, relacionando os seus diferentes ramos: POPULAÇÃO OU UNIVERSO Amostragem TRATAMENTO E ANÁLISE DA AMOSTRA EstatĂ­stica Descritiva InferĂȘncia EstatĂ­stica INFERIR DA AMOSTRA PARA O UNIVERSO GrĂĄficos; tabelas; medidas descritivas PrevisĂ”es Estimação Erros AMOSTRA
  • 9. Manual de ExercĂ­cios EstatĂ­stica Aplicada 8 2.ESTATÍSTICA DESCRITIVA Os resultados da observação de um atributo sobre os elementos do conjunto a analisar constituem os dados estatĂ­sticos. O ramo da estatĂ­stica que se ocupa do tratamento, apresentação e anĂĄlise de dados amostrais denomina-se de estatĂ­stica descritiva. 2.1. VariĂĄveis Qualitativas Os dados qualitativos sĂŁo organizados na forma de uma tabela de frequĂȘncias, que representa o nĂșmero ni de elementos de cada uma das categorias ou classes e que Ă© chamado de frequĂȘncia absoluta. A soma de todas as frequĂȘncias Ă© igual Ă  dimensĂŁo da amostra (n). Numa tabela de frequĂȘncias, alĂ©m das frequĂȘncias absolutas, tambĂ©m se apresentam as frequĂȘncias relativas (fi), obtida dividindo a frequĂȘncia absoluta pelo nĂșmero total de observaçÔes. Modalidades FrequĂȘncias absolutas FrequĂȘncias relativas Mod. 1 n1 f1 Mod. j nj fj Mod. n nn fn Total n: dimensĂŁo da amostra 1 n ni fi = ; ni: nÂșde vezes que cada modalidade da variĂĄvel foi observada.
  • 10. Manual de ExercĂ­cios EstatĂ­stica Aplicada 9 Estes dados podem tambĂ©m ser representados graficamente atravĂ©s de: Diagrama de barras Para cada modalidade, desenha-se uma barra de altura igual Ă  frequĂȘncia absoluta ou relativa (as frequĂȘncias relativas sĂŁo de preferir, pois permitem a comparação de amostras de diferentes dimensĂ”es). Diagrama sectorial ou circular Esta representação Ă© constituĂ­da por um cĂ­rculo, em que se apresentam tantas “fatias” quantas as modalidades em estudo. O Ăąngulo correspondente a cada modalidade Ă© proporcional Ă s frequĂȘncias das classes, fazendo corresponder o total da amostra (n) a 360Âș Geralmente, juntamente com a identificação da modalidade, indica-se a frequĂȘncia relativa respectiva. 2.2. VariĂĄveis Quantitativas Discretas SĂŁo variĂĄveis que assumem um nĂșmero finito ou infinito numerĂĄvel de valores. A apresentação destas amostras Ă© semelhante Ă s variĂĄveis qualitativas, fazendo-se uma tabela de frequĂȘncias e uma representação grĂĄfica recorrendo ao diagrama de barras. Valores da variĂĄvel FrequĂȘncias absolutas FrequĂȘncias relativas X1 n1 f1 Xj nj fj Xn nn fn Total n: dimensĂŁo da amostra 1 TambĂ©m Ă© possĂ­vel calcular as frequĂȘncias (absolutas – Ni - e relativas - Fi) acumuladas, como se pode ver no exemplo: NÂșdefeituosos (X) NÂșembalagens (ni) % embalagens (fi) Ni Fi 0 80 40% 80 40% 1 60 30% 80+60 40%+30% 2 30 15% 170 85% 3 20 10% 190 95% 4 10 5% 200 100% Total 200 1
  • 11. Manual de ExercĂ­cios EstatĂ­stica Aplicada 10 2.3. VariĂĄveis Quantitativas ContĂ­nuas Como foi dito anteriormente, uma variĂĄvel (ou atributo) Ă© contĂ­nua quando assume um nĂșmero infinito nĂŁo numerĂĄvel de valores, isto Ă©, podem assumir qualquer valor dentro de um intervalo. Neste caso, a construção da tabela compreende duas etapas: (i) Definição de classes de valores disjuntas, correspondentes a intervalos de nĂșmeros reais fechados Ă  esquerda e abertos Ă  direita, cuja constituição obedece a certas regras (ii) Contagem das observaçÔes pertencentes a cada classe Regra de construção de classes (pressupĂ”e a formação de classes de igual amplitude) - NĂșmero de classes a constituir Depende de n = dimensĂŁo da amostra Se n≄25, o nĂșmero de classes a constituir deve ser 5 Se n<25, o nĂșmero de classes a constituir deve ser n - Amplitude comum a todas as classes Sendo a amplitude total dos dados dada pela diferença entre o valor mĂĄximo e o valor mĂ­nimo observados, entĂŁo a amplitude de cada classe serĂĄ: Valor mĂĄximo da variĂĄvel observado – Valor mĂ­nimo da variĂĄvel observado NÂșde classes a constituir Classes de valores da variĂĄvel FrequĂȘncias absolutas FrequĂȘncias relativas [x1; x2[ n1 f1 [x2; x3[ [x3; x4[ nj fj [xn-1; xn] n fn Total n: dimensĂŁo da amostra 1 A distribuição de frequĂȘncias representa-se atravĂ©s de um histograma. Um histograma Ă© uma sucessĂŁo de rectĂąngulos adjacentes, em que a base Ă© uma classe e a altura a frequĂȘncia (relativa ou absoluta) por unidade de amplitude (ni/ai ou fi/ai), sendo a amplitude de cada classe ai=ei-ei-1. A ĂĄrea total do histograma Ă© a soma das frequĂȘncias relativas, isto Ă©, 1.
  • 12. Manual de ExercĂ­cios EstatĂ­stica Aplicada 11 1. Esta distribuição permite visualizar o tipo de distribuição e deve salientar alguns aspectos mais relevantes desta (moda, classe modal, ...). Como as classes podem ter amplitudes diferentes, para que todos os rectĂąngulos (colunas) sejam comparĂĄveis Ă© necessĂĄrio corrigir as frequĂȘncias das classes (calculando as frequĂȘncias que se teria se a amplitude de todas as classes fosse igual e igual a 1) 2. É preferĂ­vel representar o histograma com fi/hi do que com ni/hi uma vez que deste modo Ă© possĂ­vel comparar distribuiçÔes com diferente nĂșmero de observaçÔes amostrais. TambĂ©m Ă© possĂ­vel calcular as frequĂȘncias (absolutas – Ni - e relativas - Fi) acumuladas. 2.4. Medidas de localização 2.4.1. MĂ©dia ( X ) É a medida de localização mais usada, sobretudo pela sua facilidade de cĂĄlculo. Dados nĂŁo-classificados (nĂŁo agrupados numa tabela de frequĂȘncias) = = n i i x n x 1 1 MĂ©dia aritmĂ©tica simples Dados classificados (isto Ă©, agrupados numa tabela de frequĂȘncias) VariĂĄveis discretas = = = = n i i i i n i i x f x n n x 1 1 1 MĂ©dia ponderada dos valores de X Dados classificados (isto Ă©, agrupados numa tabela de frequĂȘncias) VariĂĄveis contĂ­nuas = = = = n i i i i n i i c f c n n x 1 1 1 MĂ©dia ponderada dos pontos mĂ©dios das classes
  • 13. Manual de ExercĂ­cios EstatĂ­stica Aplicada 12 onde ci Ă© o ponto mĂ©dio de cada classe ( 2 . sup . lim . inf . lim + ) A mĂ©dia Ă© uma medida de localização que, geralmente, indica o valor central da distribuição, entendido como o valor em torno do qual se distribuem os valores observados. Desta forma, a mĂ©dia Ă© muitas vezes utilizada como valor representativo da amostra. No entanto, a mĂ©dia tem o grande inconveniente de ser sensĂ­vel a valores muito extremados ou aberrantes da distribuição (outliers). Em casos desses, a mĂ©dia deixa de ser um valor que aparece na parte central da distribuição para ser “empurrada” para os extremos. Nestes casos, Ă© preferĂ­vel recorrer Ă  informação complementar fornecida por outras medidas de localização, como a moda e a mediana, que se definem a seguir. 2.4.2. Mediana (Me) A mediana nĂŁo se calcula a partir do valor de todas as observaçÔes, mas a partir da posição dessas observaçÔes. Dados nĂŁo-classificados Se tivermos n valores x1, x2, ... xn Se n fĂŽr Ă­mpar, 2 1 + = n x Me Se n fĂŽr par, 2 1 2 2 + + = n n x x Me Dados classificados A mediana Ă© o valor tal que Fi = 0,5 VariĂĄveis discretas Se existe um valor de xi para o qual Fi = 0,5, entĂŁo fala-se em intervalo mediano.
  • 14. Manual de ExercĂ­cios EstatĂ­stica Aplicada 13 Se nĂŁo existe nenhum valor de xi para o qual Fi = 0,5, entĂŁo a mediana Ă© o primeiro valor para o qual Fi > 0,5. VariĂĄveis contĂ­nuas Em geral, determina-se o valor para o qual Fi = 0,5 atravĂ©s de uma regra de trĂȘs simples, atendendo a que as frequĂȘncias acumuladas variam uniformemente dentro de cada classe. De uma forma geral: mediana classe xamp FL FL FL L Me . inf sup inf 5 . 0 inf − − + = 2.4.3. Moda (Mo) VariĂĄveis discretas A moda Ă© valor de X para o qual fi Ă© mĂĄximo, isto Ă©, Ă© o valor mais frequente da distribuição. VariĂĄveis contĂ­nuas A classe modal Ă© a classe de valores de X para o qual fi/hi Ă© mĂĄximo, isto Ă©, Ă© a classe a que corresponde maior frequĂȘncia por unidade de amplitude. 2.5. Medidas de ordem Tal como se definiu para a mediana, Ă© possĂ­vel definir outros valores de posição ou valores separadores da distribuição em partes iguais. Chama-se quantil de ordem p ao valor de x a que corresponde Fi = p. - Se p=0,01; 0,02;.....0,99, chama-se ao quantil percentil - Se p=0,1; 0,2;...0,9, chama-se ao quantil decil - Se p=0,25, 0,5, 0,75, chama-se ao quantil QUARTIL (Q1, Q2 e Q3). A mediana Ă© uma caso particular dos quartis (coincide com Q2) VariĂĄvel discreta O quantil de ordem p Ă© o primeiro valor de x para o qual i>p.
  • 15. Manual de ExercĂ­cios EstatĂ­stica Aplicada 14 VariĂĄvel contĂ­nua Calcula-se por uma regra de trĂȘs simples, como a mediana. De uma forma geral: 1 . inf sup inf 25 . 0 inf 1 Q classe xamp FL FL FL L Q − − + = 3 . inf sup inf 75 . 0 inf 3 Q classe xamp FL FL FL L Q − − + = A representação grĂĄfica destas medidas designa-se de diagrama de extremos e quartis e serve para realçar algumas caracterĂ­sticas da amostra. Os valores da amostra compreendidos entre os 1Âș e 3Âș quartis sĂŁo representados por um rectĂąngulo (caixa) com a mediana indicada por uma barra. Seguidamente, consideram-se duas linhas que unem os meios dos lados do rectĂąngulo com os extremos da amostra. A partir deste diagrama, pode reconhecer-se a simetria ou enviesamento dos dados e a sua maior ou menor concentração: 2.6. Medidas de assimetria A assimetria Ă© tanto maior quanto mais afastados estiverem os valores da mĂ©dia, mediana e moda. Concretamente, se: − X = Me = Mo, a distribuição diz-se simĂ©trica − X > Me > Mo, a distribuição diz-se assimĂ©trica positiva (ou enviesada Ă  esquerda) − X < Me < Mo, a distribuição diz-se assimĂ©trica negativa (ou enviesada Ă  direita) Coeficiente de assimetria de Bowley (g’): 1 3 ) 1 2 ( ) 2 3 ( Q Q Q Q Q Q − − − − Se g’ = 0 ..............a distribuição Ă© simĂ©trica positiva ou equilibrada Os quartis estĂŁo Ă  mesma distĂąncia da mediana. Se g’ > 0 ..............a distribuição Ă© assimĂ©trica positiva ou “puxada” para 25% maiores
  • 16. Manual de ExercĂ­cios EstatĂ­stica Aplicada 15 a esquerda (se fĂŽr = 1, assimetria Ă© mĂĄxima) A mediana desliza para o lado do Q1, logo Q3-Q2 > Q2-Q1 Se g’ < 0 ..............a distribuição Ă© assimĂ©trica negativa ou “puxada” para a direita (se fĂŽr = -1, assimetria Ă© mĂĄxima) A mediana desliza para o lado do Q3, logo Q2-Q1 > Q3-Q2 2.7. Medidas de dispersĂŁo Duas distribuiçÔes podem distinguir-se na medida em que os valores da variĂĄvel se dispersam relativamente ao ponto de localização (mĂ©dia, mediana, moda). Apresentam-se de seguida algumas das mais utilizadas, classificadas consoante a medida de localização usada para referenciar a dispersĂŁo das observaçÔes: 2.7.1 Medidas de dispersĂŁo absoluta (i) Em relação Ă  mediana Amplitude inter-quartis = Q = Q3 – Q1 Significa que 50% das observaçÔes se situam num intervalo de amplitude Q. Quanto maior (menor) a amplitude do intervalo, maior (menor) a dispersĂŁo em torno da mediana. (ii) Em relação Ă  mĂ©dia VariĂąncia amostral: mede os desvios quadrĂĄticos de cada valor observado em relação Ă  mĂ©dia, havendo pouca dispersĂŁo se os desvios forem globalmente pequenos, e havendo muita dispersĂŁo se os desvios forem globalmente grandes. Q1 Q2 Q3 AssimĂ©trica positiva AssimĂ©trica negativa Q1 Q2 Q3
  • 17. Manual de ExercĂ­cios EstatĂ­stica Aplicada 16 Dados nĂŁo-classificados ( ) 2 1 2 1 = − = n i x xi n s Dados classificados VariĂĄveis discretas ( ) ( ) = = − = − = n i n i x xi fi x xi ni n s 1 2 2 1 2 1 Dados classificados VariĂĄveis contĂ­nuas ( ) ( ) = = − = − = n i n i x ci fi x ci ni n s 1 2 2 1 2 1 onde ci Ă© o ponto mĂ©dio de cada classe i. Desvio-padrĂŁo: Medida de dispersĂŁo com significado real, mas que sĂł Ă© possĂ­vel calcular indirectamente, atravĂ©s da raiz quadrada da variĂąncia. EstĂĄ expressa nas mesmas unidades da variĂĄvel. 2.7.2 Medidas de dispersĂŁo relativa Muitas vezes, avaliar a dispersĂŁo atravĂ©s de um indicador de dispersĂŁo absoluta nĂŁo Ă© conveniente, assim como comparara a dispersĂŁo de duas distribuiçÔes, uma vez que estas medidas vĂȘm expressas na mesma unidade da variĂĄvel – como Ă© o caso, por exemplo, da variĂąncia. Assim, Ă© de esperar que os valores da variĂąncia sejam mais elevados quando os valores da variĂĄvel sĂŁo maiores, o que nĂŁo significa que a distribuição seja muito dispersa. Para comparar diferentes distribuiçÔes de frequĂȘncia sĂŁo precisas medidas de dispersĂŁo relativa: definida estĂĄ qual Ă  relação em o localizaçã de Medida absoluta DispersĂŁo relativa DispersĂŁo =
  • 18. Manual de ExercĂ­cios EstatĂ­stica Aplicada 17 Coeficiente de variação x s CV = x100% Outras medidas 2 1 3 Q Q Q − Estas medidas nĂŁo estĂŁo expressas em nenhuma unidade, e permitem comparar dispersĂ”es entre duas amostras, pois nĂŁo sĂŁo sensĂ­veis Ă  escala (eventualmente diferente) em que as variĂĄveis estejam expressas. 2.8. AnĂĄlise da concentração A noção de concentração apareceu associada ao estudo de desigualdades econĂłmicas, como a repartição do rendimento ou a distribuição de salĂĄrios. O fenĂłmeno de concentração estĂĄ relacionado com a variabilidade ou dispersĂŁo dos valores observados, apesar de nĂŁo poder ser analisado atravĂ©s das medidas de dispersĂŁo atrĂĄs descritas, que apenas medem a dispersĂŁo dos valores em relação a um ponto. O objectivo Ă© determinar como o atributo (rendimento, salĂĄrios, nĂșmero de empresas) se distribui (se de forma mais ou menos uniforme) pelos diferentes indivĂ­duos da amostra (que devem ser susceptĂ­veis de serem adicionados, isto Ă©, a anĂĄlise de concentração nĂŁo se aplica a idade, altura, peso, etc). Se o atributo estiver igualmente repartido pelos indivĂ­duos, temos uma situação extrema de igual distribuição; e vice-versa de o atributo estiver concentrado num sĂł indivĂ­duo, temos uma situação extrema de mĂĄxima concentração. Em geral, interessa medir o grau de concentração em situaçÔes intermĂ©dias. Para analisar a concentração, existem dois instrumentos: a Curva de Lorenz e o Índice de Gini. 2.8.1 Curva de Lorenz
  • 19. Manual de ExercĂ­cios EstatĂ­stica Aplicada 18 O objectivo Ă© comparar a evolução das frequĂȘncias acumuladas (Fi = pi) com a evolução da soma dos valores da variĂĄvel (qi) Quadro de dados Classes de valores da variĂĄvel ni Quantidade atributo Freq.relativa acumuladas Proporção atrib.acumul, [x1; x2[ n1 yi p1 q1 [x2; x3[ [x3; x4[ nj yj pj qj [xn-1; xn[ nn yn pn=1 qn=1 Total n Os pontos (pi;qi) pertencem ao quadrado (0,1) por (0,1). A curva que os une Ă© a curva de Lorenz. Se houver igual distribuição, a frequĂȘncia das observaçÔes deve ter uma evolução igual Ă  proporção do atributo correspondente, isto Ă©, pi=qi. Nesse caso, a curva de Lorenz coincide com a diagonal do quadrado, que Ă© designada de recta de igual repartição. Quanto mais a curva se afastar da recta, maior Ă© a concentração. A zona entre a diagonal e acurva de Lorenz designa-se, por isso, de zona de concentração. 2.8.2 Índice de Gini O Ă­ndice de Gini Ă© calculado pela seguinte expressĂŁo − = − = − = 1 1 1 1 ) ( n i n i pi qi pi G Quando G = 0, a concentração Ă© nula, havendo igual repartição. Caso o valor de G seja 1, a concentração serĂĄ mĂĄxima. O valor de G varia entre 0 e 1, e quanto maior o seu valor, maior a concentração.
  • 20. Manual de ExercĂ­cios EstatĂ­stica Aplicada 19 2.9. EstatĂ­stica Descritiva Bidimensional Numa situação em que se observam pares de valores (xi; yj), pode ter interesse estudar as relaçÔes porventura existentes entre os dois fenĂłmenos, nomeadamente relaçÔes estatĂ­sticas. NĂŁo se trata de estudar relaçÔes funcionais (isto Ă©, a medida em que o valor de uma variĂĄvel Ă© determinado exactamente pela outra), mas sim de estudar a forma como a variação de uma variĂĄvel poderĂĄ afectar a variação da outra, em mĂ©dia. (por exemplo, o peso e a altura normalmente estĂŁo relacionados, mas a relação nĂŁo Ă© determinĂ­stica). Duas variĂĄveis ligadas por uma relação estatĂ­stica dizem-se correlacionadas. Se as variaçÔes ocorrem, em mĂ©dia ou tendencialmente, no mesmo sentido, a correlação diz-se positiva. Se ocorrem em sentidos opostos, a correlação diz- se negativa. Trata-se entĂŁo de estudar se: - Se existe alguma correlação entre os fenĂłmenos ou variĂĄveis observadas - A existir, se Ă© traduzĂ­vel por alguma lei matemĂĄtica, nem que tendencialmente - A existir, se Ă© possĂ­vel medi-la Por vezes, a representação grĂĄfica do conjunto de dados bivariados sugere o ajustamento de uma recta a este conjunto de pontos, indicando a existĂȘncia de uma tendencial correlação linear entre as duas variĂĄveis, como Ă© o caso do exemplo atrĂĄs descrito. A essa recta chama-se recta de regressĂŁo de y sobre x, que permite descrever como se reflectem em y (variĂĄvel dependente ou explicada) as modificaçÔes processadas em x (variĂĄvel independente ou explicativa). Essa recta torna possĂ­vel, por exemplo, inferir (em mĂ©dia) a altura de um indivĂ­duo, conhecendo o respectivo peso. Um dos mĂ©todos mais conhecidos de ajustar uma recta a um conjunto de dados Ă© o MĂ©todo dos MĂ­nimos Quadrados, que consiste em determinar a recta que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores de y e os obtidos a partir da recta que se pretende ajustar. ObtĂ©m-se assim a
  • 21. Manual de ExercĂ­cios EstatĂ­stica Aplicada 20 recta de regressĂŁo ou recta dos mĂ­nimos quadrados. Assim, se a recta de regressĂŁo obedecer Ă  seguinte fĂłrmula geral: y = a + bx o mĂ©todo permite minimizar a soma dos desvios quadrĂĄticos yi - (a + bxi). Assim sendo, obtĂ©m-se: − − = 2 2 x n x y x n y x b i i i e x b y a − = Matematicamente, b designa o declive da recta. Em termos estatĂ­sticos, b corresponde ao coeficiente de regressĂŁo de y sobre x, que indica a variação mĂ©dia de y que acompanha uma variação unitĂĄria de x. O valor de a designa a ordenada na origem, isto Ă©, o valor que y assume quando x=0. Quando, quer atravĂ©s do diagrama de dispersĂŁo, quer atravĂ©s da recta de regressĂŁo, se verifica a existĂȘncia de uma associação linear entre as variĂĄveis, pode-se medir a maior ou menor força com que as variĂĄveis se associam atravĂ©s do coeficiente de correlação linear r: ) )( ( , 1 y y x x s s s s r i n i i xy yy xx xy − − = = = Este indicador da correlação tem a vantagem de nĂŁo depender das unidades ou da ordem de grandeza em que as variĂĄveis estĂŁo expressas. O coeficiente de correlação linear estĂĄ sempre compreendido entre –1 e 1. Se r > 0, entĂŁo pode dizer-se que existe uma correlação positiva entre as variĂĄveis, isto Ă©, as variĂĄveis variam no mesmo sentido: um aumento (diminuição de x) provoca um aumento (diminuição) de y, mas menos que proporcional.
  • 22. Manual de ExercĂ­cios EstatĂ­stica Aplicada 21 Se r < 0, entĂŁo pode dizer-se que existe uma correlação negativa entre as variĂĄveis, isto Ă©, as variĂĄveis variam em sentidos opostos: um aumento (diminuição de x) provoca uma diminuição (aumento) de y, mas menos que proporcional. Se r = 0, entĂŁo pode dizer-se que as variĂĄveis nĂŁo estĂŁo correlacionadas linearmente. Antes de se efectuar um estudo de correlação, deve-se procurar justificação teĂłrica para a existĂȘncia ou inexistĂȘncia de correlação. Caso contrĂĄrio, poderĂĄ acontecer que variĂĄveis sem relação de causalidade entre si, variem num certo sentido por razĂ”es exteriores. A esta correlação ilusĂłria, chama-se correlação espĂșria. Nos extremos, se r = 1 ou se r = -1, entĂŁo pode dizer-se que existe uma correlação positiva ou negativa perfeita, respectivamente, entre as variĂĄveis, isto Ă©, uma variação numa variĂĄvel provoca na outra uma variação exactamente proporcional no mesmo sentido ou em sentido contrĂĄrio. Isto Ă©, a correlação Ă© mĂĄxima. Correlação ordinal Por vezes, as variĂĄveis vĂȘm expressas numa escala ordinal, isto Ă©, interessa mais conhecer a ordenação dos valores do que os valores observados propriamente ditos. Neste caso, em vez do coeficiente de correlação linear, calcula-se o coeficiente de correlação ordinal: y i x i i n i i s R R d n n d r − = − − = = , ) 1 ( 6 1 2 1 2 Ordens (“ranks”) das observaçÔes de X e de Y, respectivamente
  • 23. Manual de ExercĂ­cios EstatĂ­stica Aplicada 22 ESTATÍSTICA DESCRITIVA ExercĂ­cios resolvidos ExercĂ­cio 1 Considere a distribuição de 1000 empresas de um sector de actividade segundo os resultados lĂ­quidos (em milhares de u.m.): Resultado LĂ­quido FrequĂȘncia. Relativa (%) [0; 1[ 10 [1; 3[ 25 [3; 5[ 35 [5; 15[ 15 [15; 25[ 10 [25; 50[ 5 Total 100 a) Represente a distribuição graficamente. b) Determine a mĂ©dia e a moda da distribuição. Qual o significado dos valores encontrados? c) Calcule as frequĂȘncias acumuladas e represente-as graficamente. Determine a mediana da distribuição. d) Determine os quartis da distribuição. Faça a sua representação grĂĄfica. e) Analise a (as)simetria da distribuição em causa. f) Analise a concentração atravĂ©s do Índice de Gini e da Curva de Lorenz. Resolução a) 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0,18 0,2 0 10 20 30 40 50 60 fi/hi
  • 24. Manual de ExercĂ­cios EstatĂ­stica Aplicada 23 b) 325 , 7 %) 5 5 . 37 ( ... %) 25 2 ( %) 10 5 , 0 ( 1 1 1 = + + + = = = = = x x x c f c n n x n i i i i n i i Em mĂ©dia, o resultado lĂ­quido de uma empresa Ă© de 7325 unidades monetĂĄrias. A classe modal Ă© aquela a que corresponde maior frequĂȘncia por unidade de amplitude. Neste caso, o maior valor de fi / hi Ă© 0,175. correspondente Ă  classe [3; 5[, isto Ă©, os valores de resultado lĂ­quido mais provĂĄveis para uma empresa situam-se entre 3000 u.m. e 5000 u.m. c) A representação grĂĄfica das frequĂȘncias acumuladas (ver tabela) designa-se de polĂ­gono integral: Classe mediana (classe a que corresponde uma frequĂȘncia acumulada 0,5): [3; 5[ 3 : Fi=0,35 5 : Fi = 0,7 Fi 0 0,2 0,4 0,6 0,8 1 0 20 40 60 80 100 120 X fi hi fi/hi Fi ci [0; 1[ 10% 1 0.1 10% 0.5 [1; 3[ 25% 2 0.125 35% 2 [3; 5[ 35% 2 0.175 70% 4 [5; 15[ 15% 10 0.015 85% 10 [15; 25[ 10% 10 0.01 95% 20 [25; 50] 5% 25 0.002 100% 37.5 Total 1
  • 25. Manual de ExercĂ­cios EstatĂ­stica Aplicada 24 CĂĄlculo da mediana: 0,7 - 0,35 ------------ 5 - 3 0,5 – 0,35 -------------- Me – 3 Me = 3 + ((2x0,15)/0,35) = 3,857 50% das empresas apresentam resultados lĂ­quidos inferiores a 3857 u.m. d) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia acumulada 0,25): [1; 3[ 1 : Fi=0,1 3 : Fi = 0,35 CĂĄlculo do Q1: 0,35 - 0,1 ------------ 3 - 1 0,25 – 0,1 -------------- Q1 – 1 Q1 = 1 + ((2x0,15)/0,25) = 2,2 25% das empresas apresentam resultados lĂ­quidos inferiores a 2200 u.m. Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia acumulada 0,75): [5; 15[ 5 : Fi=0,7 15 : Fi = 0,85 CĂĄlculo do Q3: 0,85 - 0,7 ------------ 15 - 5 0,75 – 0,7 -------------- Q3 – 5 Q3 = 5 + ((10x0,05)/0,15) = 8,333(3) 75% das empresas apresentam resultados lĂ­quidos inferiores a 8333 u.m. e) 0 4596 , 0 2 , 2 333 , 8 ) 2 , 2 857 , 3 ( ) 857 , 3 333 , 8 ( 1 3 ) 1 2 ( ) 2 3 ( ' > = − − − − = − − − − = Q Q Q Q Q Q g A distribuição Ă© assimĂ©trica positiva ou enviesada Ă  esquerda.
  • 26. Manual de ExercĂ­cios EstatĂ­stica Aplicada 25 f) X fi ni ci Atributo pi (=Fi) qi [0; 1[ 10% 1000x10%=100 0.5 100x0.5=50 0.1 0.007 [1; 3[ 25% 250 2 250x2=500 0.35 0.075 [3; 5[ 35% 350 4 1400 0.7 0.266 [5; 15[ 15% 150 10 1500 0.85 0.471 [15; 25[ 10% 100 20 2000 0.95 0.744 [25; 50[ 5% 50 37.5 1875 1 1 Total 1 n=1000 7325 47 , 0 95 , 0 85 , 0 7 , 0 35 , 0 1 , 0 ) 744 , 0 95 , 0 ( ... ) 007 , 0 1 , 0 ( = + + + + − + + − = G A distribuição dos resultados lĂ­quidos apresenta concentração mĂ©dia (G=0,5 corresponde ao centro da escala possĂ­vel, entre 0 e 1). Por exemplo, 70% das empresas apresentavam resultados atĂ© 5000 u.m., mas isso representava apenas 26,6% do total de resultados das empresas da amostra, o que sugere um tecido empresarial com muitas PMEs, mas em que cada uma tem baixo resultado lĂ­quido. ExercĂ­cio 2 Considere a seguinte amostra de dimensĂŁo 200, referente aos lucros obtidos por empresas de um dado sector industrial, expressas numa determinada unidade monetĂĄria. Analise a concentração atravĂ©s do Índice de Gini e da Curva de Lorenz. Res.Liq.Totais 7325 1400 500 50 + + Curva de Lorenz 0 0,2 0,4 0,6 0,8 1 0 0,2 0,4 0,6 0,8 1
  • 27. Manual de ExercĂ­cios EstatĂ­stica Aplicada 26 Resolução Lucros ni Lucro total pi (=Fi) qi [0; 50[ 20 600 0.1 0.02 [50; 100[ 60 4400 0.4 0.16(6) [100; 200[ 80 14000 0.8 0.63(3) [200; 300[ 30 7500 0.95 0.883(3) [300; 500] 10 3500 1 1 Total 200 30000 243 , 0 25 , 2 ) 6 ( 546 , 0 ) ( 1 1 1 1 = = − = − = − = n i n i pi qi pi G Tanto pela anĂĄlise da Curva de Lorenz, como pelo valor do Índice de Gini, conclui-se que esta amostra apresenta concentração moderada, encontrando- se os valores razoavelmente repartidos. ExercĂ­cio 3 Considere o exemplo abaixo referente ao peso e altura de 10 indivĂ­duos. a) Represente o diagrama de dispersĂŁo. b) Analise a correlação existente entre peso e altura. c) Ajuste, pelo MĂ©todo dos MĂ­nimos Quadrados, uma função linear que exprima as peso em função da altura. Curva de Lorenz 0 0,2 0,4 0,6 0,8 1 0 0,2 0,4 0,6 0,8 1
  • 28. Manual de ExercĂ­cios EstatĂ­stica Aplicada 27 IndivĂ­duo Peso (kg) Altura (cm) A 72 175 B 65 170 C 80 185 D 57 154 E 60 165 F 77 175 G 83 182 H 79 178 I 67 175 J 68 173 Resolução a) b) No exemplo, r = 0,90681871, isto Ă©, existe uma correlação positiva forte entre as duas variĂĄveis, quase perfeita. c) Diagrama de DispersĂŁo 150 160 170 180 190 50 60 70 80 90 Peso (kg) Altura (cm) Recta de RegressĂŁo y = 0,9016x + 109,36 150 160 170 180 190 50 60 70 80 90 Peso (kg) Altura (cm)
  • 29. Manual de ExercĂ­cios EstatĂ­stica Aplicada 28 A equação desta recta traduz-se em Altura = 109,36 + 0,9016 x Peso Isto Ă©, se um indivĂ­duo pesar 70 kg, a altura esperada serĂĄ de 109,36 + 0,9016 x 70 = 172,472. Por cada kg de peso adicional, espera-se que a altura do indivĂ­duo aumente 0,9016 cm. ExercĂ­cio 4 O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas em milhares de u.m.) de uma empresa no perĂ­odo de 7 anos: Ano Vendas Desp. Publicidade 1 10 3 2 13 3 3 18 5 4 19 6 5 25 8 6 30 9 7 35 13 a) Compare as vendas e as despesas em publicidade quanto Ă  dispersĂŁo. b) Analise a correlação existente entre volume e custo de produção. c) Ajuste, pelo MĂ©todo dos MĂ­nimos Quadrados, uma função linear que exprima as vendas em função das despesas em publicidade. Resolução a) Para comparar a dispersĂŁo das duas distribuiçÔes, Ă© necessĂĄrio calcular os coeficientes de variação (medidas de dispersĂŁo relativa): Dados nĂŁo-classificados 429 , 21 1 1 = = = n i i x n x 714 , 6 1 1 = = = n i i y n y ( ) 9408 , 69 1 2 1 2 = − = = n i x x xi n s ( ) 0651 , 11 1 2 1 2 = − = = n i y y yi n s 39 , 0 429 , 21 9408 , 69 = = = x s CV x x < 495 , 0 714 , 6 0651 , 11 = = = y s CV y y A dispersĂŁo das despesas em publicidade Ă© superior Ă  dispersĂŁo das vendas.
  • 30. Manual de ExercĂ­cios EstatĂ­stica Aplicada 29 b) ( )( ) ( )( ) [ ] 98 , 0 0651 , 11 9408 , 69 714 , 6 13 429 , 21 35 ... 714 , 6 3 429 , 21 10 7 1 = − − + + − − = = x s s s r yy xx xy Existe uma correlação positiva linear forte entre as duas variĂĄveis. Em mĂ©dia, quando as despesas em publicidade aumentam (diminuem), as vendas aumentam (diminuem) de forma quase exactamente proporcional. c) ExercĂ­cio 5 Considere que 10 estudantes foram sujeitos a uma prova de avaliação no inĂ­cio e no final do curso. No quadro abaixo, encontram-se as ordenaçÔes desses 10 estudantes segundo as classificaçÔes obtidas em cada uma das provas: Aluno Prova inicial Ri x Prova final Ri y di Ri x - Ri y A 1 1 0 B 3 2 1 C 2 3 -1 D 5 4 1 E 7 6 1 F 8 8 0 G 9 7 2 H 10 9 1 I 6 10 -4 J 4 5 -1 Recta de RegressĂŁo y = 2,4649x + 4,8782 0 10 20 30 3 8 13 Desp. Public. Vendas
  • 31. Manual de ExercĂ­cios EstatĂ­stica Aplicada 30 Resolução Como nĂŁo dispomos das classificaçÔes dos alunos, mas sim das ordenaçÔes das classificaçÔes (do 1Âș ao 10Âș classificado), para avaliar a correlação existente entre as 2 provas calcula-se o coeficiente de correlação ordinal: 8424 , 0 ) 1 100 ( 10 ) 1 16 1 4 0 1 1 1 1 0 ( 6 1 ) 1 ( 6 1 2 1 2 = − + + + + + + + + + − = − − = = x x n n d r n i i s A correlação Ă© positiva e elevada (rs varia entre –1 e 1), isto Ă©, os alunos que tiveram boa nota na prova inicial tiveram, em mĂ©dia, igualmente boa nota na prova final. ExercĂ­cio 6 O quadro que se segue descreve a distribuição do rendimento anual (em milhares de u.m.) de 2500 famĂ­lias da população de um paĂ­s: Rendimento anual NÂșde famĂ­lias [0, 1[ 250 [1, 2[ 375 [2, 5[ 625 [5, 15[ 750 [15, 25[ 375 [25, 50[ 125 a) Represente as frequĂȘncias acumuladas graficamente. b) Determine o rendimento mĂ©dio e mediano. c) Determine os trĂȘs primeiros quartis. Que indicaçÔes lhe dĂŁo sobre a (as)simetria? d) O que pode concluir quanto Ă  dispersĂŁo? e) Calcule o Ă­ndice de Gini. O que conclui sobre a concentração do rendimento? Resolução a) Rendimento anual NÂșde famĂ­lias % de famĂ­lias Fi (%) ci [0, 1[ 250 10 10 0.5 [1, 2[ 375 15 25 1.5 [2, 5[ 625 25 50 3.5 [5, 15[ 750 30 80 10 [15, 25[ 375 15 95 20 [25, 50[ 125 5 1 37.5
  • 32. Manual de ExercĂ­cios EstatĂ­stica Aplicada 31 b) 025 , 9 %) 5 5 . 37 ( ... %) 15 5 . 1 ( %) 10 5 , 0 ( 1 1 1 = + + + = = = = = x x x c f c n n x n i i i i n i i Em mĂ©dia, o rendimento anual de uma famĂ­lia Ă© de 9025 unidades monetĂĄrias. Classe mediana (classe a que corresponde uma frequĂȘncia acumulada 0,5): [2; 5[ 5 : Fi = 0,5. Logo, a mediana Ă© 5 (50% das famĂ­lias tĂȘm rendimentos anuais atĂ© 5000 unidades monetĂĄrias). c) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia acumulada 0,25): [1; 2[ 3 : Fi = 0,25 25% das famĂ­lias apresentam rendimentos anuais inferiores a 2000 u.m. Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia acumulada 0,75): [5; 15[ 5 : Fi=0,5 15 : Fi = 0,8 CĂĄlculo do Q3: 0,8 - 0,5 ------------ 15 - 5 0,75 – 0,5 -------------- Q3 – 5 Q3 = 5 + ((10x0,25)/0,3) = 13,333(3) 75% das famĂ­lias apresentam rendimentos anuais inferiores a 13333 u.m. 0 0,2 0,4 0,6 0,8 1 0 10 20 30 40 50 60 70 80 90 100
  • 33. Manual de ExercĂ­cios EstatĂ­stica Aplicada 32 0 47 , 0 2 333 , 13 ) 2 5 ( ) 5 333 , 13 ( 1 3 ) 1 2 ( ) 2 3 ( ' > = − − − − = − − − − = Q Q Q Q Q Q g A distribuição Ă© assimĂ©trica positiva ou enviesada Ă  esquerda. d) ( ) 286875 , 82 * 2 1 2 2 1 2 = − = − = = = x fici x ci fi s n i n i x 071 , 9 286875 , 82 2 = = = x x s s e) Rendimento anual ni ci Rend. total pi (=Fi) qi [0, 1[ 250 0.5 125 0,1 0.00554 [1, 2[ 375 1.5 562,5 0,25 0.0305 [2, 5[ 625 3.5 2187,5 0,5 0.1274 [5, 15[ 750 10 7500 0,8 0.46 [15, 25[ 375 20 7500 0,95 0.7922 [25, 50[ 125 37.5 4687.5 1 1 Total 2500 22562,5 4555 , 0 6 , 2 18436 , 1 ) ( 1 1 1 1 = = − = − = − = n i n i pi qi pi G Concentração moderada do rendimento ExercĂ­cio 7 Considere a seguinte tabela que representa a distribuição dos empregados de uma instituição bancĂĄria segundo a remuneração bruta mensal (em milhares de unidades monetĂĄrias): Remuneração FrequĂȘncia. Relativa (%) [60; 80[ 7.8 [80; 100[ 15.2 [100; 120[ 31.2 [120; 140[ 19.5 [140; 160[ 7.2 [160; 200[ 8.1 [200; 250[ 5.4 [250, 300[ 2.6 [300; 350] 3.0 Total 100
  • 34. Manual de ExercĂ­cios EstatĂ­stica Aplicada 33 a) Calcule os quartis da distribuição. b) Analise a dispersĂŁo da distribuição em causa. c) Analise a assimetria da distribuição em causa. Resolução a) Remuneração FrequĂȘncia. Relativa (%) Fi (%) [60; 80[ 7.8 7.8 [80; 100[ 15.2 23 [100; 120[ 31.2 54.2 [120; 140[ 19.5 73.7 [140; 160[ 7.2 80.9 [160; 200[ 8.1 89 [200; 250[ 5.4 94.4 [250, 300[ 2.6 97 [300; 350] 3.0 100 Total 100 Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia acumulada 0,25): [100; 120[ 1 : Fi=0,23 3 : Fi = 0,542 CĂĄlculo do Q1: 0,542 - 0,23 ------------ 120 - 100 0,25 - 0,23 -------------- Q1 - 100 Q1 = 100 + ((20x0,02)/0,312) = 101,28 25% dos empregados auferem remuneraçÔes inferiores a 101,28 milhares u.m. Classe a que pertence Q2 (classe a que corresponde uma frequĂȘncia acumulada 0,5): [100; 120[ 100 : Fi=0,23 120 : Fi = 0,542 CĂĄlculo do Q2: 0,542 - 0,23 ------------ 120 - 100 0,5 - 0,23 -------------- Q2 - 100 Q2 = 100 + ((20x0,27)/0,312) = 117,3 50% dos empregados auferem remuneraçÔes inferiores a 117,3 milhares u.m.
  • 35. Manual de ExercĂ­cios EstatĂ­stica Aplicada 34 Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia acumulada 0,75): [140; 160[ 120 : Fi=0,737 140 : Fi = 0,809 CĂĄlculo do Q3: 0,809 - 0,737 ------------ 160 - 140 0,75 – 0,737 -------------- Q3 - 140 Q3 = 140 + ((20x0,013)/0,072) = 143,61(1) 75% dos empregados auferem remuneraçÔes inferiores a 143,61(1) milhares u.m. b) Amplitude do intervalo inter-quartis = Q3 - Q1 = 143,61(1) - 101,28 = 42,33 (dispersĂŁo reduzida em torno da mediana) c) 0 243 , 0 28 , 101 61 , 143 ) 28 , 101 3 , 117 ( ) 3 , 117 61 , 143 ( 1 3 ) 1 2 ( ) 2 3 ( ' > = − − − − = − − − − = Q Q Q Q Q Q g A distribuição Ă© assimĂ©trica positiva ou enviesada Ă  esquerda. ExercĂ­cio 8 Os dados seguintes referem-se ao peso, expresso em gramas, do conteĂșdo de uma sĂ©rie de 100 garrafas que, no decurso de um teste, saĂ­ram de uma linha de enchimento automĂĄtico: Peso (em gramas) FrequĂȘncia. Relativa (%) [297; 298[ 8 [298; 299[ 21 [299; 300[ 28 [300; 301[ 15 [301; 302[ 11 [302; 303[ 10 [303; 304[ 5 [304; 305[ 1 [305; 306] 1 Total 100 a) Represente graficamente os dados acima. b) Calcule as frequĂȘncias acumuladas e represente-as graficamente.
  • 36. Manual de ExercĂ­cios EstatĂ­stica Aplicada 35 c) Determine o peso mĂ©dio, mediano e modal. Qual o seu significado? d) Determine os quartis da distribuição. e) Analise a dispersĂŁo do peso das garrafas. Resolução a) b) Peso (em gramas) FrequĂȘncia Relativa (%) Fi (%) [297; 298[ 8 8 [298; 299[ 21 29 [299; 300[ 28 57 [300; 301[ 15 72 [301; 302[ 11 83 [302; 303[ 10 93 [303; 304[ 5 98 [304; 305[ 1 99 [305; 306] 1 100 Total 100 c) 11 , 300 %) 1 5 , 305 ( ... %) 21 5 , 298 ( %) 8 5 , 297 ( 1 1 1 = + + + = = = = = x x x c f c n n x n i i i i n i i O peso mĂ©dio das garrafas Ă© de 300,11 kg. 0 0,05 0,1 0,15 0,2 0,25 0,3 296 297 298 299 300 301 302 303 304 305 306 307 Histograma 0 0,2 0,4 0,6 0,8 1 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 F*
  • 37. Manual de ExercĂ­cios EstatĂ­stica Aplicada 36 Classe mediana (classe a que corresponde uma frequĂȘncia acumulada 0,5): [299; 300[ 299 : Fi = 0,29 300 : Fi = 0,57 CĂĄlculo do Q2: 0,57 - 0,29 ------------ 300 - 299 0,5 - 0,29 -------------- Q2 - 299 Q2 = 299 + ((1x0,21)/0,28) = 299,75 50% das garrafas tĂȘm peso inferior a 299,75 kg. A classe modal Ă© aquela a que corresponde maior frequĂȘncia relativa. Neste caso, o maior valor de fi Ă© 0,28 correspondente Ă  classe [299; 300[, isto Ă©, os pesos mais provĂĄveis das garrafas situam-se entre 299 kg e 300 kg. d) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia acumulada 0,25): [298; 299[ 298 : Fi=0,08 299 : Fi = 0,29 CĂĄlculo do Q1: 0,29 - 0,08 ------------ 298 - 299 0,25 - 0,08 ------------ Q1 - 299 Q1 = 299 + ((1x0,17)/0,21) = 299,0357 25% das garrafas tĂȘm peso inferior a 299,0357 kg. Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia acumulada 0,75): [301; 302[ 301 : Fi=0,72 302 : Fi = 0,83 CĂĄlculo do Q3: 0,83 - 0,72 ------------ 302 - 301 0,75 – 0,72 -------------- Q3 - 301 Q3 = 301 + ((1x0,03)/0,11) = 301,27(27) 75% das garrafas tĂȘm peso inferior a 301,27(27) kg.
  • 38. Manual de ExercĂ­cios EstatĂ­stica Aplicada 37 e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 301,27(27) - 299,0357 = 2,237 (dispersĂŁo reduzida em torno da mediana) ExercĂ­cio 8 Numa faculdade, mediram-se as alturas de 100 alunos do primeiro ano: Altura (em metros) NÂșAlunos [1,4; 1,5[ 2 [1,5; 1,55[ 10 [1,55; 1,6[ 25 [1,6; 1,65[ 13 [1,65; 1,7[ 17 [1,7; 1,75[ 20 [1,75; 1,8[ 10 [1,8; 1,9] 3 Total 100 a) Represente graficamente os dados acima. b) Determine a altura mĂ©dia e a altura modal. Qual o seu significado? c) Calcule as frequĂȘncias acumuladas e represente-as graficamente. d) Determine os quartis da distribuição e diga qual o seu significado. e) Analise a dispersĂŁo da distribuição. f) Analise a (as)simetria da distribuição. Resolução a) Altura (em metros) ni fi ci hi fi/hi Fi [1,4; 1,5[ 2 0,02 1,45 0,1 0,2 0,02 [1,5; 1,55[ 10 0,1 1,525 0,05 2 0,12 [1,55; 1,6[ 25 0,25 1,575 0,05 5 0,37 [1,6; 1,65[ 13 0,13 1,625 0,05 2,6 0,5 [1,65; 1,7[ 17 0,17 1,675 0,05 3,4 0,67 [1,7; 1,75[ 20 0,2 1,725 0,05 4 0,87 [1,75; 1,8[ 10 0,1 1,775 0,05 2 0,97 [1,8; 1,9] 3 0,03 1,85 0,1 0,3 1 Total 100 1 0 1 2 3 4 5 6 1,4 1,5 1,6 1,7 1,8 1,9 Histograma fi/hi
  • 39. Manual de ExercĂ­cios EstatĂ­stica Aplicada 38 b) 65 , 1 %) 3 85 , 1 ( ... %) 10 525 , 1 ( %) 2 45 , 1 ( 1 1 1 = + + + = = = = = x x x c f c n n x n i i i i n i i A altura mĂ©dia dos alunos Ă© de 1,65 m. A classe modal Ă© aquela a que corresponde maior frequĂȘncia por unidade de amplitude. Neste caso, o maior valor de fi / hi Ă© 5. correspondente Ă  classe [1,55; 1,6[, isto Ă©, a altura mais provĂĄvel de um aluno rondarĂĄ 1,55m / 1,6m. c) d) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia acumulada 0,25): [1,55; 1,6[ 1,55 : Fi=0,12 1,6 : Fi = 0,37 CĂĄlculo do Q1: 0,37 – 0,12 ------------ 1,6 – 1,55 0,25 – 0,12 ------------ Q1 – 1,55 Q1 = 1,55 + ((0,05x0,13)/0,25) = 1,576 25% dos alunos tĂȘm altura inferior a 1,576 m. Classe a que pertence Q2 (classe a que corresponde uma frequĂȘncia acumulada 0,5): [1,6; 1,65[ 1,65 : Fi = 0,5 50% dos alunos tĂȘm altura inferior a 1,65 m. Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia acumulada 0,75): [1,7; 1,75[ 1,7 : Fi=0,67 1,75 : Fi = 0,87 0 0,2 0,4 0,6 0,8 1 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 F*
  • 40. Manual de ExercĂ­cios EstatĂ­stica Aplicada 39 CĂĄlculo do Q3: 0,87- 0,67------------ 1,75 – 1,7 0,75 – 0,67-------------- Q3 – 1,7 Q3 = 1,7 + ((0,05*0,08)/0,2) = 1,72 75% dos alunos tĂȘm altura inferior a 1,72 m. e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 1,72 – 1,576 = 0,144 (dispersĂŁo reduzida em torno da mediana) ( ) 00536875 , 0 * 2 1 2 2 1 2 = − = − = = = x fici x ci fi s n i n i x 07327 , 0 00536875 , 0 2 = = = x x s s (dispersĂŁo reduzida em torno da mĂ©dia) f) 0 ) 7 ( 027 , 0 576 , 1 72 , 1 ) 576 , 1 65 , 1 ( ) 65 , 1 72 , 1 ( 1 3 ) 1 2 ( ) 2 3 ( ' < − = − − − − = − − − − = Q Q Q Q Q Q g A distribuição Ă© ligeiramente assimĂ©trica negativa ou enviesada Ă  direita (quase simĂ©trica). ExercĂ­cio 9 Em determinada central telefĂłnica, registou-se a duração das chamadas realizadas em Dezembro de 2001: Duração (em minutos) NÂșChamadas [0; 5[ 2000 [5; 10[ 1500 [10; 20[ 1000 [20; 30[ 300 [30; 50] 200 Total 5000 a) Represente graficamente as frequĂȘncias simples e acumuladas. b) Determine a duração mĂ©dia das chamadas e respectivo desvio-padrĂŁo. c) Qual a duração da chamada mediana? Qual o significado do valor encontrado?
  • 41. Manual de ExercĂ­cios EstatĂ­stica Aplicada 40 d) Sabe-se que as chamadas realizadas durante o ano de 2001 apresentaram uma duração mĂ©dia de 10 minutos, com desvio-padrĂŁo de 8,7 minutos. Compare, quanto Ă  dispersĂŁo, as chamadas efectuadas em Dezembro com as que tiveram lugar durante todo o ano de 2001. Resolução a) Duração (em minutos) ni fi hi fi/hi Fi ci [0; 5[ 2000 0,4 5 0,08 0,4 2,5 [5; 10[ 1500 0,3 5 0,06 0,7 7,5 [10; 20[ 1000 0,2 10 0,02 0,9 15 [20; 30[ 300 0,06 10 0,006 0,96 25 [30; 50] 200 0,04 20 0,002 1 40 Total 5000 1 b) 35 , 9 %) 4 40 ( ... %) 30 5 , 7 ( %) 40 5 , 2 ( 1 1 1 = + + + = = = = = x x x c f c n n x n i i i i n i i A duração mĂ©dia de uma chamada Ă© de 9,35 minutos. ( ) 4525 , 81 * 2 1 2 2 1 2 = − = − = = = x fici x ci fi s n i n i x 025 , 9 00536875 , 0 2 = = = x x s s c) Classe mediana (classe a que corresponde frequĂȘncia acumulada 0,5): [5; 10[ 0 0,02 0,04 0,06 0,08 0,1 0 10 20 30 40 50 60 Histograma fi/hi 0 0,2 0,4 0,6 0,8 1 0 10 20 30 40 50 60 70 80 90 100 F*
  • 42. Manual de ExercĂ­cios EstatĂ­stica Aplicada 41 5 : Fi = 0,4 10 : Fi = 0,7 CĂĄlculo da Me: 0,7 - 0,4 ------------ 10 - 5 0,5 - 0,4 ------------ Me - 5 Me = 5 + ((5x0,1)/0,3) = 6,67 50% das chamadas tĂȘm duração a 6,67 minutos. d) 965 , 0 35 , 9 025 , 9 = = = x s CV x Dez > 87 , 0 10 7 , 8 2001 = = = y s CV y ExercĂ­cio 10 Uma empresa coligiu dados relativos Ă  produção de 12 lotes de um tipo especial de rolamento. O volume de produção e o custo de produção de cada lote apresentam-se na tabela: Lote Volume (unidades) Custo (contos) 1 1500 3100 2 800 1900 3 2600 4200 4 1000 2300 5 600 1200 6 2800 4900 7 1200 2800 8 900 2100 9 400 1400 10 1300 2400 11 1200 2400 12 2000 3800 a) Analise a correlação existente entre volume e custo de produção. b) Ajuste, pelo MĂ©todo dos MĂ­nimos Quadrados, uma função linear que exprima o custo em função do volume de produção. Resolução a) ( )( ) ( )( ) [ ] 98 , 0 1145944 520854 3 , 2708 3800 3 , 1358 2000 ... 3 , 2708 3100 3 , 1358 1500 12 1 = − − + + − − = = x s s s r yy xx xy Correlação positiva quase perfeita.
  • 43. Manual de ExercĂ­cios EstatĂ­stica Aplicada 42 b) ExercĂ­cio 11 Um conjunto de empresas do sector da Construção e Obras PĂșblicas cotadas na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores: EPS (Earnings per Share): Resultado LĂ­quido por Acção PBV (Price/Book Value): Preço / Situação LĂ­quida por Acção Empresa EPS ($) PBV ($) 1 191 0.9 2 32 1.0 3 104 0.8 4 117 0.8 5 210 1.5 6 95 0.7 7 65 0.9 8 201 1.3 9 81 0.4 a) Analise a correlação existente entre aqueles dois indicadores. b) Ajuste, pelo MĂ©todo dos MĂ­nimos Quadrados, uma função linear que exprima a variĂĄvel EPS em função de PBV. Resolução a) ( )( ) ( )( ) [ ] 61 , 0 096933 , 0 332 , 3669 92 , 0 4 , 0 7 , 121 81 ... 92 , 0 9 , 0 7 , 121 191 9 1 = − − + + − − = = x s s s r yy xx xy Correlação positiva moderada. y = 1,4553x + 731,6 0 1000 2000 3000 4000 5000 6000 0 500 1000 1500 2000 2500 3000 Volume Custo
  • 44. Manual de ExercĂ­cios EstatĂ­stica Aplicada 43 b) ExercĂ­cio 12 Recolheu-se uma amostra em 17 cidades do paĂ­s relativamente aos seguintes indicadores: Ri: Rendimento mĂ©dio mensal na cidade i (em 106 unidades monetĂĄrias) Gi: Gasto mĂ©dio mensal em bens de luxo na cidade i (em 106 u.m.) Ri Gi Ri Gi 125 54 144 61 127 56 147 62 130 57 150 62 131 57 152 63 133 58 154 63 135 58 160 64 140 59 162 65 143 59 165 66 169 66 Dados adicionais = 2467 i R =1030 i G = 361073 2 i R = 62620 2 i G = 150270 i iG R a) Estude a correlação entre rendimento e despesas em bens de luxo. b) Ajuste, pelo MĂ©todo dos MĂ­nimos Quadrados, uma função linear que exprima a variĂĄvel Gi em função de Ri. y = 124,04x + 7,383 0 50 100 150 200 250 0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 PBV EPS
  • 45. Manual de ExercĂ­cios EstatĂ­stica Aplicada 44 Resolução a) 986 , 0 ) 17 1030 * 17 62620 )( 17 2467 * 17 361073 ( 17 1030 * 17 2467 * 17 150270 ) )( ( 2 2 2 2 2 2 2 2 = − − − = − − − = G n G R n R G R n G R r i i i i XY Correlação positiva forte. b) y = 0,2604x + 22,801 50 52 54 56 58 60 62 64 66 68 100 120 140 160 180 200 Rendimento Gasto
  • 47. Manual de ExercĂ­cios EstatĂ­stica Aplicada 45 3.ESTATÍSTICA INDUTIVA A estatĂ­stica indutiva Ă© o ramo da estatĂ­stica que se ocupa em inferir das conclusĂ”es retiradas sobre a amostra para a população. Claro que o processo de indução implica um certo grau de incerteza associado Ă  tentativa de generalização de conclusĂ”es da “parte” (amostra) para o “todo” (universo). O conceito de probabilidade vai ter aqui, entĂŁo, um papel fundamental. Isto Ă©, nĂŁo vai ser possĂ­vel afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo, mas apenas que o faz com forte probabilidade. De seguida, serĂŁo apresentadas algumas noçÔes simples de probabilidades e funçÔes de probabilidade, que serĂŁo Ășteis a aplicaçÔes de estatĂ­stica indutiva relacionadas com controlo estatĂ­stico de qualidade e fiabilidade de componentes e sistemas. 3.1. NoçÔes bĂĄsicas de probabilidade A teoria das probabilidades Ă© um ramo da matemĂĄtica extremamente Ăștil para o estudo e a investigação das regularidades dos chamados fenĂłmenos aleatĂłrios. O exemplo seguinte pretende clarificar o que vulgarmente Ă© designado por experiĂȘncia aleatĂłria. Deve entender-se como experiĂȘncia qualquer processo ou conjunto de circunstĂąncias capaz de produzir resultados observĂĄveis; quando uma experiĂȘncia estĂĄ sujeita Ă  influĂȘncia de factores casuais e conduz a resultados incertos, diz-se que a experiĂȘncia Ă© aleatĂłria. Fundamentalmente, as experiĂȘncias aleatĂłrias caracterizam-se por:
  • 48. Manual de ExercĂ­cios EstatĂ­stica Aplicada 46 (i) poder repetir-se um grande nĂșmero de vezes nas mesmas condiçÔes ou em condiçÔes muito semelhantes (ii) cada vez que a experiĂȘncia se realiza, obtĂ©m-se um resultado individual, mas nĂŁo Ă© possĂ­vel prever exactamente esse resultado (iii) os resultados das experiĂȘncias individuais mostram-se irregulares, mas os resultados obtidos apĂłs uma longa repetição da experiĂȘncia patenteiam uma grande regularidade estatĂ­stica no seu conjunto Alguns autores consideram inserido no conceito de experiĂȘncia aleatĂłria um outro, o de espaço de resultados. O espaço de resultados corresponde ao conjunto formado por todos os resultados possĂ­veis de uma experiĂȘncia aleatĂłria. Por exemplo, num lançamento de um dado ordinĂĄrio tem-se que o espaço de resultados Ă© } { 6 , 5 , 4 , 3 , 2 , 1 . A importĂąncia da definição deste conceito advĂ©m sobretudo por ser o meio empregue para a definição de acontecimentos, que nĂŁo sei mais que subconjuntos do espaço de resultados. Por exemplo, no lançamento de um dado podem definir-se, para alĂ©m dos 6 acontecimentos elementares correspondentes Ă  saĂ­da de cada uma das faces, outros como “saĂ­da de um nĂșmero Ă­mpar” definido pelo subconjunto } { 5 , 3 , 1 . Definidos como conjuntos, aos acontecimentos Ă© aplicĂĄvel toda a construção disponĂ­vel para aqueles, isto Ă©, existe um paralelismo perfeito entre ĂĄlgebra de conjuntos e ĂĄlgebra de acontecimentos: (i) O acontecimento que contem todos os elementos do espaço de resultados chama-se acontecimento certo (ii) O acontecimento que nĂŁo contem qualquer elemento do espaço de resultados chama-se acontecimento impossĂ­vel (iii) Dois acontecimentos sĂŁo mutuamente exclusivos se nĂŁo tĂȘm em comum qualquer acontecimento do espaço de resultados (iv) A uniĂŁo de dois acontecimentos A e B representa-se por A âˆȘ B e Ă© formado pelos elementos que pertencem a pelo menos um dos dois, A ou B (v) A intersecção de dois acontecimentos A e B representa-se por A ∩ B e Ă© formado pelos elementos comuns a A e B
  • 49. Manual de ExercĂ­cios EstatĂ­stica Aplicada 47 Probabilidade de um acontecimento Ă© expressa na escala de 0 a 1, sendo 0 a probabilidade associada a um acontecimento impossĂ­vel e 1 a probabilidade associada a um acontecimento certo. A primeira definição foi proposta por Laplace em 1812. Pode definir-se probabilidade de um acontecimento A como sendo: NĂșmero de casos favorĂĄveis ao acontecimento A P(A) = NĂșmero total de casos possĂ­veis na exp. aleatĂłria Uma das principais crĂ­ticas a esta definição Ă© a de que ela sĂł Ă© aplicĂĄvel quando o espaço de resultados Ă© finito e os seus elementos possuem igual probabilidade; daĂ­ que ela surja muito ligada aos “jogos de azar”, que possuem essas propriedades. É o que acontece com as duas faces de uma moeda, as 52 cartas de um baralho, as 6 faces de um dado, etc. Para se analisar a probabilidade de ocorrĂȘncia de determinados acontecimentos, deve ter-se em atenção o seguinte: − Dois acontecimentos sĂŁo ditos mutuamente exclusivos se nĂŁo puderem acontecer ao mesmo tempo; se dois acontecimentos forem mutuamente exclusivos, entĂŁo: P(A ∩ B) = 0 − A probabilidade de uniĂŁo de dois acontecimentos mutuamente exclusivos Ă© dada por P (A âˆȘ B) = P(A) + P(B) − Para dois acontecimentos quaisquer, vem que P (A âˆȘ B) = P(A) + P(B) - P(A ∩ B) − Dois acontecimentos dizem-se complementares se: P(A) = 1 – P( A ) − Dois acontecimentos sĂŁo ditos independentes se a ocorrĂȘncia de um nĂŁo afectar a probabilidade de ocorrĂȘncia de outro; a probabilidade de ocorrĂȘncia de dois ou mais acontecimentos independentes Ă© o produto das probabilidades dos respectivos acontecimentos, isto Ă©: P(A ∩ B) = P(A) x P(B)
  • 50. Manual de ExercĂ­cios EstatĂ­stica Aplicada 48 ApĂłs a apresentação desta definição, convĂ©m ainda referir que, numa outra perspectiva, a da chamada teoria frequencista, a probabilidade de um acontecimento Ă© definida como sendo o valor para o qual tende a frequĂȘncia relativa do acontecimento quando o nĂșmero de repetiçÔes da experiĂȘncia aumenta. 3.2. Probabilidade condicionada Exemplo: Um grupo de pessoas Ă© classificado de acordo com o seu peso e a incidĂȘncia de hipertensĂŁo. SĂŁo as seguintes as proporçÔes das vĂĄrias categorias: Obeso Normal Magro Total Hipertenso 0,1 0,08 0,02 0,2 NĂŁo Hipertenso 0,15 0,45 0,2 0,8 Total 0,25 0,53 0,22 1,00 a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa? b) Qual a probabilidade de uma pessoa obesa ser hipertensa? Resolução a) Basta ver que a proporção de hipertensos Ă© de 20% b) HĂĄ que tomar em atenção que o que se pretende Ă© a proporção de hipertensos na população de obesos, isto Ă© 4 , 0 25 , 0 1 , 0 = . Por outras palavras, pretende-se calcular a probabilidade do acontecimento “ser hipertenso”, sabendo que ocorreu o acontecimento “ser obeso”. Repare-se que este quociente resulta da divisĂŁo entre a probabilidade de uma pessoa ser hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Pode escrever-se que a probabilidade pretendida Ă© dada por: ) ( ) ( ) / ( O P O H P O H P ∩ = onde P(H/O) Ă© a probabilidade de ocorrer o acontecimento “ser hipertenso”, sabendo que ocorreu ou condicionado pelo acontecimento “ser obeso”. Este exemplo corresponde ao cĂĄlculo de uma probabilidade condicionada.
  • 51. Manual de ExercĂ­cios EstatĂ­stica Aplicada 49 Como se viu anteriormente, dois acontecimentos sĂŁo ditos independentes se a ocorrĂȘncia de um nĂŁo afectar a probabilidade de ocorrĂȘncia de outro, isto Ă©, se: P(A / B) = P(A) e se P(B / A) = P(B). Teorema de Bayes Seja B um acontecimento que se realiza se e sĂł se um dos acontecimentos mutuamente exclusivos A1, A2,
An se verifica. Aos acontecimentos A1, A2,
An dĂĄ-se o nome de acontecimentos antecedentes. O teorema de Bayes permite calcular a probabilidade Ă  posteriori de A1, A2,
 An, isto Ă©, a probabilidade de ocorrĂȘncia de A1, A2,
 An calculadas sob a hipĂłtese de que B (acontecimento consequente) se realizou. De acordo com este teorema: = = n i i i i i i A B P A P A B P A P B A P 1 ) / ( ). ( ) / ( ). ( ) / ( Este Teorema utiliza-se em situaçÔes em que a relação causal estĂĄ invertida. = n i i i A B P A P 1 ) / ( ). ( designa-se de probabilidade total de ocorrĂȘncia do acontecimento B, isto Ă©, Ă© a probabilidade de ocorrĂȘncia do acontecimento consequente B face a todos os possĂ­veis acontecimentos A1, A2,
 An que o podem ter antecedido (ou causado a sua ocorrĂȘncia). 3.3. FunçÔes de probabilidade A probabilidade associada aos acontecimentos possĂ­veis numa experiĂȘncia aleatĂłria obedecem, por vezes, a um padrĂŁo. Se associarmos a uma experiĂȘncia aleatĂłria uma variĂĄvel X (por exemplo, associar aos resultados da experiĂȘncia lançamento de um dado - que sĂŁo 6 (saĂ­da de face 1 a 6) – a variĂĄvel X:“NÂș da face resultante do lançamento de um dado”), entĂŁo pode ser constituĂ­da uma lei ou função de probabilidade (f(x)) dessa variĂĄvel X, tal que f(x) = P(X=xi)
  • 52. Manual de ExercĂ­cios EstatĂ­stica Aplicada 50 Por exemplo, para X: nÂș da face resultante do lançamento de um dado, vem que: xi 1 2 3 4 5 6 f(xi) 1/6 1/6 1/6 1/6 1/6 1/6 que se designa por lei uniforme. Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior nĂșmero de fenĂłmenos estatĂ­sticos do que outras. Entre estas, contam-se a lei Binomial, a lei de Poisson e a lei Exponencial. (i) Lei Binomial HĂĄ alguns acontecimentos que sĂŁo constituĂ­dos por um conjunto de experiĂȘncias independentes, cada uma das quais com apenas dois estados possĂ­veis de ocorrĂȘncia e com uma probabilidade fixa de ocorrĂȘncia para cada um deles. Por exemplo, os produtos resultantes de uma fĂĄbrica podem ser classificados como sendo defeituosos ou sendo nĂŁo defeituosos, e o facto de um ter saĂ­do (ou nĂŁo) defeituoso nĂŁo influencia os outros serem (ou nĂŁo). A distribuição das duas classes possĂ­veis Ă© discreta e do tipo binomial. No exemplo anterior, consideremos uma amostra de n artigos retirados da produção total, em relação aos quais se pretende identificar a variĂĄvel X: “NÂșde artigos defeituosos nos n que constituem a amostra”. A probabilidade de ocorrĂȘncia do acontecimento “artigo Ă© defeituoso” Ă© dada por p: incidĂȘncia de defeituosos na produção (convenientemente calculada atravĂ©s de mĂ©todos de estimação). A probabilidade do acontecimento complementar “artigo Ă© nĂŁo- defeituoso” Ă© dada por 1 – p = q A probabilidade associada a x artigos defeituosos Ă© dada por px (p x p x p x p...x vezes). Se hĂĄ x defeituosos, restam n-x artigos nĂŁo-defeituosos, com probabilidade dada por qn-x . Para calcular o nĂșmero exacto de combinaçÔes de x artigos defeituosos com n-x artigos nĂŁo-defeituosos, utiliza-se a figura “combinaçÔes de n, x a x, oriunda das tĂ©cnicas de cĂĄlculo combinatĂłrio. Vem
  • 53. Manual de ExercĂ­cios EstatĂ­stica Aplicada 51 entĂŁo que a probabilidade de existĂȘncia de x defeituosos (e logo n-x nĂŁo defeituosos) Ă© igual a: x n x x n x n x q p p p n n q p C x f − − − = = ! )! ( ! ) ( sendo que X segue Bi (n;p), sendo n e p os parĂąmetros caracterizadores da lei. Um acontecimento deve ter 4 caracterĂ­sticas para que se possa associar a uma lei binomial: - nĂșmero fixo de experiĂȘncias (n) - cada experiĂȘncia ter apenas duas classes de resultados possĂ­veis - todas as experiĂȘncias terem igual probabilidade de ocorrĂȘncia (p) - as experiĂȘncias serem independentes Em sistemas elĂ©ctricos de energia Ă© possĂ­vel, por exemplo, aplicar a distribuição binomial quando se pretende calcular a fiabilidade de uma central elĂ©ctrica, com vĂĄrias unidades iguais e admitindo que cada unidade apenas pode residir em dois estados, a funcionar ou avariada. (ii) Lei de Poisson A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) dĂĄ a probabilidade de um acontecimento ocorrer um dado nĂșmero de vezes num intervalo de tempo ou espaço fixado, quando a taxa de ocorrĂȘncia Ă© fixa (por exemplo, nÂșde chamadas que chegam a uma central telefĂłnica por minuto; nÂș de varias que ocorrem numa mĂĄquina por dia). Os nĂșmeros de acontecimentos de “sucesso” ocorridos em diferentes intervalos sĂŁo independentes. O parĂąmetro caracterizador da distribuição de Poisson Ă© λ, que corresponde ao nĂșmero mĂ©dio de ocorrĂȘncias por unidade de tempo ou espaço. Como o nĂșmero mĂ©dio de ocorrĂȘncias do acontecimento Ă© proporcional Ă  amplitude do intervalo de tempo ou espaço a que se refere, a variĂĄvel X: “NÂșde ocorrĂȘncias do acontecimento no intervalo [0,t[” segue lei de Poisson de parĂąmetro λt (isto Ă©, se para 1 unidade de tempo o nÂș mĂ©dio de ocorrĂȘncias Ă© λ, para t unidades de tempo o nĂșmero mĂ©dio de ocorrĂȘncias Ă© λt). A expressĂŁo ( ) t x e x t λ λ − !
  • 54. Manual de ExercĂ­cios EstatĂ­stica Aplicada 52 dĂĄ a probabilidade de acontecerem x ocorrĂȘncias no intervalo de tempo [0,t[, e corresponde Ă  expressĂŁo da lei de probabilidade de Poisson : Po(λt) Por exemplo, se X fĂŽr o “NÂș de avarias que ocorrem no intervalo de tempo [0,t[”, entĂŁo a probabilidade de nĂŁo ocorrerem avarias nesse intervalo, isto Ă©, a fiabilidade do componente/sistema como função do tempo, Ă© dada por: ( ) t t e e t λ λ λ − − = ! 0 0 (iii) Lei Exponencial Seja T a variĂĄvel “Tempo ou espaço que decorre entre ocorrĂȘncias consecutivas de um acontecimento”. EntĂŁo T segue lei exponencial Exp (λ), sendo λ 1 o tempo que, em mĂ©dia, decorre entre ocorrĂȘncias sucessivas do acontecimento. Note-se que Ă© possĂ­vel estabelecer uma relação entre a lei exponencial e a lei de Poisson. Assim, se X fĂŽr o “NÂș de avarias que ocorrem no intervalo de tempo [0,t[”, e T fĂŽr o “Tempo que decorre entre avarias consecutivas”, entĂŁo: P (T>t) = P(tempo que decorre entre avarias exceder t) = P(atĂ© ao instante t, nĂŁo ocorre qualquer avaria) = P (ocorrerem zero avarias no intervalo [0,t[) = P(X=0) = t e λ − A distribuição exponencial Ă© a mais usada em estudos de fiabilidade, jĂĄ que a probabilidade de um componente sobreviver atĂ© ao instante t Ă© dada por t e λ − A probabilidade de avariar atĂ© ao instante t Ă© dada por t e λ − − 1
  • 55. Manual de ExercĂ­cios EstatĂ­stica Aplicada 53 (iv) Lei Normal A lei Normal tem como parĂąmetros caracterizadores a mĂ©dia ” e o desvio- padrĂŁo σ. Isto Ă©, os valores observados tĂȘm uma determinada tendĂȘncia central e uma determinada dispersĂŁo em torno da tendĂȘncia central. A expressĂŁo ∏ − − 2 2 ) ( 2 1 2 1 σ ” σ Xi e representa a função densidade de probabilidade da distribuição Normal. Se se fizer o valor mĂ©dio ” igual a zero e todos os desvios forem medidos em relação Ă  mĂ©dia, a equação serĂĄ: σ ” − = X Z que corresponde a uma distribuição normal estandardizada (0;1) com os valores tabelados, a qual Ă© caracterizada por uma curva de Gauss: Esta distribuição apresenta 99,73% dos valores entre os extremos –3 e 3. Existem muitos tipos de distribuição, mas a curva normal Ă© a forma de distribuição mais frequente nos processos industriais para caracterĂ­sticas mensurĂĄveis, e pode considerar-se como estabelecida pela experiĂȘncia prĂĄtica.
  • 56. Manual de ExercĂ­cios EstatĂ­stica Aplicada 54 (v) Lei Qui-Quadrado Considere-se um conjunto de n variĂĄveis aleatĂłrias Zi, obedecendo Ă s seguintes condiçÔes: - cada variĂĄvel Zi segue distribuição N(0,1); - as variĂĄveis Zi sĂŁo mutuamente independentes EntĂŁo, a variĂĄvel aleatĂłria X, construĂ­da a partir da soma das n variĂĄveis Zi elevadas ao quadrado, segue distribuição Qui-Quadrado com n graus de liberdade, denotada por 2 2 2 2 1 1 2 ... n n i i Z Z Z Z X + + + = = = 2 n X χ ∩ O termo “Graus de Liberdade” (d.f: degrees of freedom) Ă© habitualmente usado para designar o nĂșmero n de parcelas (variĂĄveis Zi) adicionadas. É possĂ­vel demonstrar que o valor esperado e a variĂąncia da distribuição de uma variĂĄvel Qui-Quadrado sĂŁo respectivamente n = ” n 2 2 = σ A distribuição Qui-Quadrado Ă© uma distribuição assimĂ©trica Ă  esquerda, aproximando-se da distribuição Normal Ă  medida que n cresce.
  • 59. Manual de ExercĂ­cios EstatĂ­stica Aplicada 56 PROBABILIDADES ExercĂ­cios resolvidos ExercĂ­cio 1 De um baralho ordinĂĄrio (52 cartas) extrai-se ao acaso 1 carta. Determine a probabilidade dos seguintes acontecimentos: a) saĂ­da de Rei b) saĂ­da de copas c) saĂ­da de Rei ou copas d) saĂ­da de Rei mas nĂŁo de copas e) nĂŁo saĂ­da de Rei f) nĂŁo saĂ­da de Rei nem de copas g) nĂŁo saĂ­da de Rei ou nĂŁo saĂ­da de copas Resolução A: saĂ­da de Rei B: saĂ­da de copas a) P(A)=1/13 b) P(B)=1/4 c) P(AâˆȘ B) = P(A) + P(B) - P(A∩ B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52) d) P(A-B) = P(A) – P(A∩ B) = 1/13 – 1/52 = 3/52 (= (4-1)/52) e) P( A )= 1-1/13 = 12/13 (=(52-4)/52) f) P( ) B A ∩ = P( B A âˆȘ ) = 1 – P(AâˆȘ B) = 1 – 4/13 = 9/13 g) P( ) B A âˆȘ = P( B A ∩ ) = 1 – P ) ( B A ∩ = 1 – 1/52 = 51/52 ExercĂ­cio 2 Um sistema electrĂłnico Ă© formado por dois sub-sistemas, A e B. De ensaios anteriores, sabe-se que: - a probabilidade de A falhar Ă© de 20% - a probabilidade de B falhar sozinho Ă© 15% - a probabilidade de A e B falharem Ă© 15% Determine a probabilidade de:
  • 60. Manual de ExercĂ­cios EstatĂ­stica Aplicada 57 a) B falhar b) falhar apenas A c) falhar A ou B d) nĂŁo falhar nem A nem B e) A e B nĂŁo falharem simultaneamente Resolução A: o subsistema A falha B: o subsistema B falha P(A)=20% P( A )= 80% P(B-A)=15% P(A∩ B)=15% a) P(B) = P(B-A)+ P(A∩ B) = 0,15 + 0,15 = 30% b) P(A-B) = P(A) – P(A∩ B) = 0,2 – 0,15 = 5% c) P(AâˆȘ B) = P(A) + P(B) - P(A∩ B) = 0,2 + 0,3 – 0,15 = 35% d) P( ) B A ∩ = P( B A âˆȘ ) = 1 – P(AâˆȘ B) = 1 – 0,35 = 65% e) P( B A ∩ ) = 1 – P ) ( B A ∩ = 1 – 0,15 = 85% ExercĂ­cio 3 Suponha que hĂĄ 3 jornais, A, B e C, com as seguintes percentagens de leitura: A: 9,8%; B: 22,9%; C: 12,1%; A e B: 5,1%; A e C: 3,7%; B e C: 6%; A, B e C: 2,4% Escolhe-se uma pessoa ao acaso. Calcule a probabilidade dessa pessoa: a) ler pelo menos um dos jornais b) ler A e B mas nĂŁo C c) ler A mas nĂŁo ler B nem C Resolução A: a pessoa escolhida lĂȘ o jornal A B: a pessoa escolhida lĂȘ o jornal B C: a pessoa escolhida lĂȘ o jornal C P(A) = 9,8% P(B) = 22,9% P(C) = 12,1% P(A∩ B) = 5,1% P(A∩ C) = 3,7% P(B∩ C) = 6% P(A∩ B∩ C) = 2,4%
  • 61. Manual de ExercĂ­cios EstatĂ­stica Aplicada 58 a) ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( C B A P C B P C A P B A P C P B P A P C B A P ∩ ∩ + ∩ − ∩ − ∩ − + + = âˆȘ âˆȘ = 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4% b) P( ) C B A ∩ ∩ = P( ) ( ) C B A P B A ∩ ∩ − ∩ = 0,051 – 0,024 = 2,7% c) ) ( C B A P ∩ ∩ = P(A) - ) ( ) ( ) ( C B A P C A P B A P ∩ ∩ + ∩ − ∩ = 0,098-0,051-0,037+0,024 = 3,4% ExercĂ­cio 4 Um gerente de uma galeria de arte muito creditada no mercado, estĂĄ interessado em comprar um quadro de um pintor famoso para posterior venda. O gerente sabe que hĂĄ muitas falsificaçÔes deste pintor no mercado e que algumas dessa falsificaçÔes sĂŁo bastante perfeitas o que torna difĂ­cil avaliar se o quadro que ele pretende comprar Ă© ou nĂŁo um original. De facto, sabe-se que hĂĄ 4 quadros falsos desse pintor para 1 verdadeiro. O gerente nĂŁo quer comprometer o “bom nome” da galeria para a qual trabalha comprando um quadro falso. Para obter mais informação o gerente resolve levar o quadro a um museu de arte e pede para que o especialista do museu o examine. Este especialista garante-lhe que em 90% dos casos em que lhe Ă© pedido para examinar um quadro genuĂ­no daquele pintor, ele identifica-o correctamente como sendo genuĂ­no. Mas em 15% dos casos em que examina uma falsificação do mesmo pintor, ele identifica-o (erradamente) como sendo genuĂ­no. Depois de examinar o quadro que o gerente lhe levou, o especialista diz que acha que o quadro Ă© uma falsificação. Qual Ă© agora a probabilidade de o quadro ser realmente uma falsificação? Resolução V: o quadro Ă© genuĂ­no F: o quadro Ă© falso I: o quadro Ă© identificado correctamente P(V) = 20% P(F) = 80% P(I/V) = 90% P( ) /V I = 10% P( ) / F I = 15% P(I/F) = 85%
  • 62. Manual de ExercĂ­cios EstatĂ­stica Aplicada 59 P(ser realmente falsificação/especialista identificou como falsificação) = = % 1 , 97 7 , 0 68 , 0 1 , 0 * 2 , 0 85 , 0 * 8 , 0 85 , 0 * 8 , 0 ) / ( * ) ( ) / ( * ) ( ) / ( * ) ( = = + = + V I P V P F I P F P F I P F P ExercĂ­cio 5 Na ida para o emprego, o Sr. Óscar, polĂ­cia de profissĂŁo, tem de passar obrigatoriamente por trĂȘs cruzamentos com semĂĄforos. No primeiro cruzamento, o do Largo Azul, a probabilidade do semĂĄforo se encontrar com sinal vermelho Ă© de 10%. Em cada um dos cruzamentos seguintes, o Sr. Óscar fica parado devido aos sinais vermelhos em metade das vezes que lĂĄ passa. O Sr. Óscar jĂĄ descobriu que os semĂĄforos funcionam separadamente, nĂŁo estando ligados entre si por qualquer mecanismo. Embora goste de cumprir a lei, o guarda Óscar passa no sinal verde e acelera no amarelo, sĂł parando mesmo no sinal vermelho. a) Qual a probabilidade do Sr. Óscar chegar ao emprego sem ter de parar em qualquer sinal vermelho? b) Qual a probabilidade do Sr. Óscar ter de parar num sĂł semĂĄforo? c) Qual a probabilidade do Sr. Óscar ter parado no sinal vermelho do cruzamento do Largo Azul, sabendo que parou num sĂł semĂĄforo na sua ida para o emprego? Resolução A: polĂ­cia encontra sinal vermelho no 1Âșcruzamento B: polĂ­cia encontra sinal vermelho no 2Âșcruzamento C: polĂ­cia encontra sinal vermelho no 3Âșcruzamento P(A)=10% P( A )= 90% P(B)=50% P( B )= 50% P(C)=50% P(C )= 50% a) P( ) C B A ∩ ∩ = P( A )*P( B )*P(C ) = 0,9*0,5*0,5 = 22,5% b) P( ) C B A ∩ ∩ + P( ) C B A ∩ ∩ +P( ) C B A ∩ ∩ = = P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) = 47,5%
  • 63. Manual de ExercĂ­cios EstatĂ­stica Aplicada 60 c) P(polĂ­cia parar no 1Âșcruzamento / polĂ­cia parou num sĂł semĂĄforo) % 26 , 5 475 , 0 ) ( * ) ( * ) ( 475 , 0 ) ( = = ∩ ∩ = C P B P A P C B A P ExercĂ­cio 6 ApĂłs alguns testes efectuados Ă  personalidade de um indivĂ­duo, concluiu-se que este Ă© louco com probabilidade 60%, ladrĂŁo com probabilidade igual a 70% e nĂŁo Ă© louco nem ladrĂŁo com probabilidade 25%. Determine a probabilidade do indivĂ­duo: a) Ser louco e ladrĂŁo b) Ser apenas louco ou apenas ladrĂŁo c) Ser ladrĂŁo, sabendo-se que nĂŁo Ă© louco Resolução A: indivĂ­duo Ă© louco B: indivĂ­duo Ă© ladrĂŁo P(A)=60% P(B)=70% P( ) B A ∩ = 25% = P( B A âˆȘ ) P(AâˆȘ B) = 1 – 0,25 = 75% a) P(AâˆȘ B) = P(A) + P(B) - P(A∩ B) 0,75 = 0,6 + 0,7 - P(A∩ B) P(A∩ B) = 0,6 + 0,7 – 0,75 = 55% b) P(A-B) + P(B-A) = (0,6-0,55) + (0,7-0,55) = 20Ă­ c) P(B/ A ) = % 5 , 37 4 , 0 15 , 0 6 , 0 1 ) ( ) ( ) ( = = − − = ∩ A B P A P A B P ExercĂ­cio 7 Uma moeda Ă© viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem faces, entĂŁo um nĂșmero Ă© seleccionado de 1 a 9. Se parecem coroas, um nĂșmero Ă© seleccionado entre 1 e 5. Determine a probabilidade de ser seleccionado um nĂșmero par. Resolução P(Par) = 2/3*4/9 + 1/3*2/5 = 42,96%
  • 64. Manual de ExercĂ­cios EstatĂ­stica Aplicada 61 ExercĂ­cio 8 Numa fĂĄbrica, 3 mĂĄquinas, M1, M2 e M3 fabricam parafusos, sendo a produção diĂĄria total de 10000 unidades. A probabilidade de um parafuso escolhido ao acaso ter sido produzido por M1 Ă© 30% da probabilidade de ter sido produzido por M2. A incidĂȘncia de defeituosos na produção de cada mĂĄquina Ă©: M1: 3% M2: 1% M3: 2% Extrai-se ao acaso da produção diĂĄria um parafuso. Sabendo que a probabilidade dele ser defeituoso Ă© de 1,65%, determine o nĂșmero de parafusos que cada mĂĄquina produz diariamente. Resolução M1: o parafuso foi produzido por M1 M2: o parafuso foi produzido por M2 M3: o parafuso foi produzido por M3 D: o parafuso Ă© defeituoso n = 10000 unidades P(M1) = 0,3 P(M2) P(D / M1) = 3% P(D / M2) = 1% P(D / M3) = 2% P(D) = 1,65% Prod. 1 = P(M1)*10000 = ? Prod. 2 = P(M2)*10000 = ? Prod. 3 = P(M3)*10000 = ? + + = = + + = ) 3 / ( * ) 3 ( ) 2 / ( * ) 2 ( ) 1 / ( * ) 1 ( ) ( 1 ) 3 ( ) 2 ( ) 1 ( ) 2 ( 3 , 0 ) 1 ( M D P M P M D P M P M D P M P D P M P M P M P M P M P ⇔ + + = = + − 02 , 0 * ) 3 ( 01 , 0 * ) 2 ( 03 , 0 * ) 2 ( 3 , 0 0165 , 0 1 ) 3 ( ) 2 ( 3 , 1 M P M P M P M P M P ⇔
  • 65. Manual de ExercĂ­cios EstatĂ­stica Aplicada 62 − + + = − = − 02 , 0 * )) 2 ( 3 , 1 1 ( 01 , 0 * ) 2 ( 03 , 0 * ) 2 ( 3 , 0 0165 , 0 ) 2 ( 3 , 1 1 ) 3 ( M P M P M P M P M P ⇔ = = − = − = = = % 50 ) 2 ( % 35 5 , 0 * 3 , 1 1 ) 2 ( 3 , 1 1 ) 3 ( % 15 5 , 0 * 3 , 0 ) 1 ( M P M P M P M P ExercĂ­cio 9 O JoĂŁo tem Ă  sua disposição 3 meios de transporte diferentes para se deslocar de casa para a escola: os transportes A, B ou C. Sabe-se que a probabilidade de: - chegar atrasado Ă  escola Ă© 60% - chegar atrasado utilizando o transporte A Ă© 80% - chegar atrasado utilizando o transporte B Ă© 50% - chegar atrasado utilizando o transporte C Ă© 60% - utilizar os transportes B e C Ă© a mesma a) Calcule a probabilidade de o JoĂŁo utilizar o transporte A b) Sabendo que o JoĂŁo chegou atrasado Ă  escola, calcule a probabilidade de ter utilizado os transportes B ou C. Resolução T: O JoĂŁo chega atrasado A: o JoĂŁo utiliza o transporte A B: o JoĂŁo utiliza o transporte B C: o JoĂŁo utiliza o transporte C P(T) = 0,6 P(T/A) = 0,8 P(T/B) = 0,5 P(T/C) = 0,6 P(B) = P(C) P(A)+P(B)+P(C) = 1 P(A) = 1- 2P(B) a) P(T) = P(A)*P(T/A) + P(B)*P(T/B) + P(C)*P(T/C)
  • 66. Manual de ExercĂ­cios EstatĂ­stica Aplicada 63 Logo 0,6 = (1-2P(B))*0,8 + P(B)*0,5 + P(B)*0,6 e vem que P(B) = 40% EntĂŁo P(A) = 1 – 2P(B) = 1 – 2*0,4 = 20% b) P(BâˆȘ C / T) = ) ( ) / ( * ) ( ) / ( * ) ( T P C T P C P B T P B P + = 6 , 0 6 , 0 * 4 , 0 5 , 0 * 4 , 0 + =73,3% ExercĂ­cio 10 Uma empresa que se dedica Ă  prestação de serviços de selecção de pessoal em relação a um teste psicotĂ©cnico para uma profissĂŁo especĂ­fica sabe o seguinte: - as percentagens de indivĂ­duos com um quociente de inteligĂȘncia (Q.I.) elevado e mĂ©dio sĂŁo, respectivamente, de 30% e de 60% - a percentagem de indivĂ­duos com Q.I. mĂ©dio que ficam aptos no teste Ă© de 50% - a probabilidade de um indivĂ­duo com Q.I. baixo ficar apto no teste Ă© de 20% - finalmente, sabe-se que 70% dos indivĂ­duos com Q.I. elevado ficam aptos no teste a) Qual a probabilidade de um indivĂ­duo escolhido ao acaso ficar apto no teste? b) Qual a probabilidade de um indivĂ­duo ter Q.I. baixo, sabendo-se que ficou inapto? Resolução A: indivĂ­duo fica apto no teste E: indivĂ­duo tem QI elevado M: indivĂ­duo tem QI mĂ©dio B: indivĂ­duo tem QI baixo P(E) = 30% P(M) = 60% P(B) = 1 –0,3 – 0,6 = 10% P(A/M) = 50% P(A/B) = 20% P(A/E) = 70%
  • 67. Manual de ExercĂ­cios EstatĂ­stica Aplicada 64 a) P(A) =P(E)*P(A/E)+P(M)*P(A/M)+P(B)*P(A/B) =0,3*0,7+0,6*0,5+0,1*0,2=53% b) P(B/ A ) = % 17 53 , 0 1 8 , 0 * 1 , 0 ) ( ) / ( * ) ( = − = A P B A P B P ExercĂ­cio 11 Os resultados de um inquĂ©rito aos agregados familiares de uma determinada cidade forneceram os seguintes dados: - 35% dos agregados possuem telefone - 50% dos agregados possuem frigorĂ­fico - 25% dos agregados possuem automĂłvel - 15% dos agregados possuem telefone e frigorĂ­fico - 20% dos agregados possuem telefone e automĂłvel - 10% dos agregados possuem frigorĂ­fico e automĂłvel - 5% dos agregados possuem telefone, automĂłvel e frigorĂ­fico a) Calcule a probabilidade de um agregado familiar 1. possuir telefone ou frigorĂ­fico 2. nĂŁo possuir nem telefone nem automĂłvel b) Calcule a probabilidade de um agregado que possui automĂłvel 1. possuir tambĂ©m frigorĂ­fico 2. possuir tambĂ©m telefone ou frigorĂ­fico c) Calcule a probabilidade de um agregado familiar 1. possuir pelo menos um daqueles trĂȘs objectos 2. nĂŁo possuir nenhum daqueles trĂȘs objectos Resolução A: agregado familiar possui telefone B: agregado familiar possui frigorĂ­fico C: agregado familiar possui automĂłvel P(A) = 35% P(B) = 50% P(C) = 25%
  • 68. Manual de ExercĂ­cios EstatĂ­stica Aplicada 65 P(A∩ B) = 15% P(A∩ C) = 20% P(B∩ C) = 10% P(A∩ B∩ C) = 5% a) 1. P(AâˆȘ B) = P(A) + P(B) - P(A∩ B) = 0,35 + 0,5 – 0,15 = 70% 2. P( ) C A ∩ = P( C AâˆȘ ) = 1 – P(AâˆȘ C) = 1 – 0,4 = 60% P(AâˆȘ C) = P(A) + P(C) - P(A∩ C) = 0,35 + 0,25 – 0,2 = 40% b) krysktsh1. P(B / C) = % 40 25 , 0 1 , 0 ) ( ) ( = = ∩ C P C B P 2. P(AâˆȘ B/ C) = % 100 25 , 0 05 . 0 1 , 0 2 , 0 ) ( ) ( ) ( ) ( = − + = ∩ ∩ − ∩ + ∩ C P C B A P C B P C A P c) 1. ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( C B A P C B P C A P B A P C P B P A P C B A P ∩ ∩ + ∩ − ∩ − ∩ − + + = âˆȘ âˆȘ = 0,35+0,5+0,25-0,15-0,2-0,1+0,05 = 70% 2. 1 – P( ) C B A âˆȘ âˆȘ = 1 – 0,7 = 30% ExercĂ­cio 12 Admita que 60% dos seguros no ramo automĂłvel respeitam a condutores com mais de 40 anos de idade, dos quais 5% sofrem, pelo menos, um acidente por ano. De entre os segurados com idade igual ou inferior a 40 anos, 3% tĂȘm um ou mais acidentes no mesmo perĂ­odo. a) Qual a probabilidade de um segurado nĂŁo sofrer qualquer acidente durante um ano? b) Qual a probabilidade de um segurado que sofreu pelo menos um acidente ter idade igual ou inferior a 40 anos? c) Qual a probabilidade de, numa amostra de trĂȘs segurados 1. todos terem idade igual ou inferior a 40 anos? 2. nenhum ter sofrido qualquer acidente durante um ano? 3. Todos terem idade igual ou inferior a 40 anos, dado que cada um sofreu, pelo menos, um acidente durante o referido perĂ­odo?
  • 69. Manual de ExercĂ­cios EstatĂ­stica Aplicada 66 Resolução I1: o segurado tem mais de 40 anos de idade I2: o segurado tem 40 anos ou menos de idade A: o segurado sofre pelo menos 1 acidente por ano A : o segurado nĂŁo sofre nenhum acidente por ano P(I1) = 60% P(I2) = 1 – 0,6 = 40% P(A/I1) = 5% P( A /I1) = 1 – 0,05 = 95% P(A/I2) = 3% P( A /I2) = 1 – 0,03 = 97% a) P( A ) = P(I1)* P( A /I1) + P(I2)* P( A /I2) = 0,6*0,95 + 0,4*0,97 = 95,8% b) P(I2/A) = % 57 , 28 958 , 0 1 03 , 0 * 6 , 0 ) ( ) 2 / ( * ) 2 ( ) ( ) 2 ( = − = = ∩ A P I A P I P A P I A P = P(B) c) 1. P( ) 2 2 2 I I I ∩ ∩ = 0,4*0,4*0,4 = 6,4% 2. P( ) A A A ∩ ∩ = 0,958*0,958*0,958 = 87,9% 3. P( ) B B B ∩ ∩ = 0,2857*0,2857*0,2857 = 2,3%
  • 71. Manual de ExercĂ­cios EstatĂ­stica Aplicada 67 FUNÇÕES DE PROBABILIDADE ExercĂ­cios resolvidos ExercĂ­cio 1 Se 20% das bobinas de um determinado cabo elĂ©ctrico forem defeituosas, calcule a probabilidade de, entre as 4 bobines necessĂĄrias a um determinado cliente, escolhidas ao acaso uma ser defeituosa. Resolução X: nĂșmero de bobines defeituosas no conjunto de 4 bobines necessĂĄrias a um determinado cliente (0,1,2,3,4) n=4 p=0,2 q=1-p=0,8 P(X=1)=C4 p1 q4-1 = 4*0,2*0,83 = 0,4096 = 41% ExercĂ­cio 2 O nĂșmero mĂ©dio de chamadas telefĂłnicas a uma central, por minuto, Ă© 5. A central sĂł pode atender um nĂșmero mĂĄximo de 8 chamadas por minuto. Qual a probabilidade de nĂŁo serem atendidas todas as chamadas no intervalo de tempo de 1 minuto? Resolução X: nĂșmero de chamadas telefĂłnicas atendidas numa central, por minuto (0,1,2,3,4, 5, 6, 7, 8) λ=5 p=0,2 q=1-p=0,8 P(X≀8) = = − 8 0 5 ! 5 x x x e = 0,932 Logo P(X>8) = 1-0,932 = 0,06 ExercĂ­cio 3 O tempo de funcionamento sem avarias de uma determinada mĂĄquina de produção contĂ­nua segue uma lei exponencial negativa com valor esperado igual a 4,5 horas. Imagine que a mĂĄquina Ă© (re)colocada em funcionamento no instante t=0 horas. Qual a probabilidade de nĂŁo ocorrerem avarias antes do instante t=6 horas?
  • 72. Manual de ExercĂ­cios EstatĂ­stica Aplicada 68 Resolução Seja T: tempo de funcionamento sem avarias (ou entre avarias consecutivas) de uma mĂĄquina, e X: numero de avarias que ocorrem no intervalo [0,6[, isto Ă©, num perĂ­odo de 6h λ=1/4,5 corresponde ao nĂșmero de avarias por unidade de tempo (por hora) Logo P(T≄6) = P(X=0)= 333 , 1 6 * 5 , 4 1 − − = e e = 0,264 ExercĂ­cio 4 Considere que o comprimento mĂ©dio de determinado fio condutor Ă© 120, com desvio padrĂŁo 0,5. Qual a percentagem de fio com comprimento superior a 121? Resolução X: comprimento de determinado fio condutor Calculando a variĂĄvel reduzida correspondente, vem: 2 5 , 0 120 121 = − = Z Consultando a tabela, verifica-se que o valor da função Z Ă© P(X≀2) = 0,9772. Logo P(X>2) = 1-0,9772 = 2,28%. ExercĂ­cio 5 Numa praia do litoral portuguĂȘs existe um serviço de aluguer de barcos, destinado aos turistas que a frequentam. O nĂșmero de turistas que procuram este serviço, por hora, estĂĄ associado a uma variĂĄvel aleatĂłria com distribuição de Poisson. Verificou-se que, em mĂ©dia, em cada hora, esse serviço Ă© procurado por 8 turistas interessados em alugar barcos; sabe-se, por outro lado, que esse serviço funciona ininterruptamente das 8 Ă s 20 horas. a) Qual a probabilidade de que, entre as 8 e as 9 horas, se aluguem 5 barcos? b) Qual a probabilidade de que, entre as 9 e as 11 horas, os barcos sejam procurados por mais de 25 turistas?
  • 73. Manual de ExercĂ­cios EstatĂ­stica Aplicada 69 Resolução X: nÂșde turistas que procuram o serviço de aluguer de barcos por hora X segue Po(λ=8) a) Na tabela da Po(λ=8) vem P(X=5) = 9,16% b) Y1: nÂșde turistas que procuram o serviço de aluguer na 1ÂȘ hora Y2: nÂșde de turistas que procuram o serviço de aluguer na 2ÂȘ hora Logo Y1+Y2: nÂșde turistas que procuram o serviço de aluguer em 2 horas Pelo Teorema da Aditividade da Poisson, considerando Y1 e Y2 independentes e que todas seguem Po(8), vem que: Z=Y1+Y2 segue Po(2*8=16) Logo P(Z>25) = f(26) +... + f(33) = 0,0057 + ... + 0,0001 = 1,32% ExercĂ­cio 6 O nĂșmero de navios petroleiros que chegam diariamente a certa refinaria Ă© uma variĂĄvel com distribuição de Poisson de parĂąmetro 2. Nas actuais condiçÔes, o cais da refinaria pode atender, no mĂĄximo, 3 petroleiros por dia. Atingido este nĂșmero, os restantes que eventualmente apareçam deverĂŁo seguir para outro porto. a) Qual a probabilidade de, num qualquer dia, ser preciso mandar petroleiros para outro porto? b) De quanto deveriam ser aumentadas as instalaçÔes de forma a assegurar cais a todos os petroleiros em 99,9% dos dias? c) Qual o nĂșmero esperado de petroleiros a chegarem por dia? d) Qual o nĂșmero mais provĂĄvel de petroleiros a chegarem por dia? e) Qual o nĂșmero esperado de petroleiros a serem atendidos diariamente? f) Qual o nĂșmero esperado de petroleiros que recorrerĂŁo a outros portos diariamente? Resolução X: nÂșde petroleiros que chegam diariamente a uma certa refinaria X segue Po (2) Capacidade mĂĄxima de atendimento da refinaria: 3 petroleiros/dia
  • 74. Manual de ExercĂ­cios EstatĂ­stica Aplicada 70 a) P(X>3) = 1 – P(X≀3) = 1 – F(3) = 1 – 0,8571 =14,29% (tab. pg.14) b) NÂșmĂĄximo de petroleiros que podem chegar: 9 (informação da tabela) Logo, a capacidade devia aumentar em 6 petroleiros/dia (9-3) c) E(X) = 2 d) X = 1 ou X = 2, com probabilidade 27,07% e) Y: nÂșde petroleiros que sĂŁo atendidos diariamente numa certa refinaria (0,1, 2, 3) g(0) = P(X=0) = 0,1353 g(1) = P(X=1) = 0,2707 g(2) = P(X=2) = 0,2707 g(3) = P(X=3) = 1 – P(X<3) = 1 – P(X≀2) = 1 – 0,6767 = 0,3233 E(Y) = 0*0,1353 + 
 + 3*0,3233 = 1,782 SĂŁo atendidos, em mĂ©dia, entre 1 e 2 petroleiros diariamente f) Z: nÂșde petroleiros que recorrem diariamente a outros portos (0,1, 2, 3, 4, 5, 6) Logo, Z = X - Y E(Z) = E(X -Y) = E(X) - E(Y) = 2 - 1,782 = 0,218 Recorrem a outros portos, em mĂ©dia, entre 0 e 1 petroleiro por dia g) W: nÂșde dias em que Ă© preciso mandar petroleiros para outro porto num mĂȘs de 30 dias (0,1, 2,...30) W segue Bi (n = 30; p = P(X>3) = 0,1429) E(W) = 30*0,1429 = 4,3 Em mĂ©dia, Ă© preciso enviar petroleiros para outro porto 4 a 5 dias/mĂȘs ExercĂ­cio 7 Os Serviços Municipalizados de GĂĄs e Electricidade debitam mensalemnte aos seus clientes um consumo teĂłrico T de energia elĂ©ctrica calculado de tal modo que a probabilidade de o consumo efectivo o exceder seja de 30,85%. Suponha um cliente cujo consumo por mĂȘs segue lei normal de mĂ©dia 400 kwh e desvio-padrĂŁo 40 kwh. a) Qual o consumo teĂłrico que lhe Ă© mensalmente debitado? b) 1. Qual a distribuição do consumo efectivo durante 3 meses?
  • 75. Manual de ExercĂ­cios EstatĂ­stica Aplicada 71 2. Qual a probabilidade de que, ao fim de 3 meses, o consumo teĂłrico exceda o efectivo em mais de 100 kwh? Resolução X: consumo efectivo de energia elĂ©ctrica de um cliente por mĂȘs (em kwh) T: consumo teĂłrico (valor fixo) debitado ao cliente por mĂȘs (em kwh) T: P(X>T) = 0,3085 X segue N(400; 1600) a) P(X>T) = 0,3085 ⇔ P( 3085 , 0 ) 40 400 40 400 = − > − T X ⇔ P(N(0,1) 420 5 , 0 40 400 6915 , 0 ) 40 400 = ⇔ = − ⇔ = − ≀ T T T b) 1. X1: consumo efectivo de energia elĂ©ctrica de um cliente no 1Âș mĂȘs (em kwh) X2: consumo efectivo de energia elĂ©ctrica de um cliente no 2Âș mĂȘs (em kwh) X3: consumo efectivo de energia elĂ©ctrica de um cliente no 3Âș mĂȘs (em kwh) Logo X1+X2+X3: consumo efectivo de energia elĂ©ctrica em 3 meses (em kwh) Pelo Teorema da Aditividade da Normal, considerando X1, X2 e X3 independentes e que todas seguem N(400, 1600), vem que: Y=X1+X2+X3 segue N(400*3; 1600*3), isto Ă©, N(1200; 4800) 2. P(3*420-Y > 100) = P(Y < 1160) = P(N(0,1)< ) 4800 1200 1160 − = = P(N(0,1)<-0,58) = 28,1% ExercĂ­cio 8 Num determinado processo de fabrico, existem 2 cadeias de montagem A e B, com funcionamento independente. A cadeia A opera a um ritmo mĂ©dio de 2 montagens por hora, e a probabilidade da cadeia B efectuar pelo menos uma montagem numa hora Ă© de 98,71%. Admitindo que o nĂșmero de montagens efectuadas por hora em ambas as cadeias Ă© uma v.a. Poisson, determine: a) a probabilidade de se efectuarem mais de 6 montagens numa hora com a cadeia B
  • 76. Manual de ExercĂ­cios EstatĂ­stica Aplicada 72 b) a probabilidade de, em 3 horas de trabalho, se efectuarem no mĂĄximo 10 montagens com a cadeia B c) a probabilidade de, numa hora, a cadeia A efectuar o dobro de montagens de B d) o nĂșmero mĂ©dio de montagens efectuadas num dia de trabalho de 8 horas com ambas as cadeiras Resolução X: nÂșde montagens da cadeia A por hora X segue Po(2) Y: nÂșde montagens da cadeia B por hora a) Y segue Poisson, mas desconhece-se a mĂ©dia (=parĂąmetro λ) No entanto, como se sabe que P(Y≄1) = 0,9817, vem que P(Y<1) = 1 – 0,9817 = 0,0183 Na tabela da Poisson, percorrendo as linhas de valor = 0, vem que o valor 0,0183 pode ser encontrado no cruzamento da linha 0 com a coluna 4. Logo, λ = 4. Na tabela da Po(4), P(Y>6) = 1–P(Y≀6) = 1–F(6) = 1-0,8893=11,07% b) Y1: nÂșde montagens da cadeia B na 1ÂȘ hora Y2: nÂșde montagens da cadeia B na 2ÂȘ hora Y3: nÂșde montagens da cadeia B na 3ÂȘ hora Logo Y1+Y2+Y3: nÂșde montagens da cadeia B em 3 horas Pelo Teorema da Aditividade da Poisson, considerando Y1, Y2 e Y3 independentes e que todas seguem Po(4), vem que: Z=Y1+Y2+Y3 segue Po(4*3=12) P(Z≀10) = f(0) + f(1) +... + f(10) = 0 + 0,0001 + 
 + 0,1048 = 34,72% c) P(X=2Y) = P(X=0∩ Y=0) + P(X=2 ∩ Y=1) + P(X=4 ∩ Y=2) + P(X=6 ∩ Y=3) + P(X=8∩ Y=4) = 0,1353*0,0183 + 0,2707*0,0753 + 0,0902*0,1465 + 0,012*0,1954 + 0,0009*0,1954 = 3,8% d) W: nÂșde montagens das 2 cadeias num dia de trabalho de 8 horas W = ) ( 8 1 i i i Y X + = onde Xi + Yi corresponde ao nÂșde montagens das 2 cadeias por hora
  • 77. Manual de ExercĂ­cios EstatĂ­stica Aplicada 73 Pelo Teorema da Aditividade de Poisson, sendo as variĂĄveis independentes e seguindo Po(2) e Po(4) respectivamente, vem que Xi + Yi segue tambĂ©m Po(2+4=6). E Z , tambĂ©m pelo mesmo Teorema, segue Po(6*8=48) Logo, o nĂșmero mĂ©dio de montagens efectuado pelas 2 cadeias num dia de trabalho de 8 horas Ă© de 48. ExercĂ­cio 9 Uma companhia de tabacos recebeu em dada altura um elevado nĂșmero de queixas quanto Ă  qualidade dos cigarros de certa marca que comercializa. Numa rĂĄpida anĂĄlise Ă s condiçÔes de produção, constata-se que 1% dos filtros que compĂ”em o cigarro saem defeituosos. Nestas condiçÔes, determine: a) a probabilidade de um maço acabado de formar 1. conter 1 cigarro com filtro defeituoso 2. conter 0 cigarros com filtro defeituoso b) o nĂșmero de maços que, num volume que contĂ©m 20, a companhia espera poder aproveitar se utilizar o critĂ©rio: 1. maço Ă© aproveitĂĄvel se nĂŁo contiver cigarros defeituosos 2. maço Ă© aproveitĂĄvel se contiver no mĂĄximo 1 cigarro defeituoso Resolução X: nÂșde cigarros com filtro defeituoso em 20 cigarros de um maço X segue Bi(n=20; p=0,01) a) 1. P(X=1) = 20*0,01*0,9919 = 16,52% 2. P(X=0) = 0,010 *0,9920 = 81,79% b) 1. Crit. 1: maço Ă© aproveitĂĄvel se nĂŁo contiver cigarros defeituosos Y: nÂșde maços aproveitĂĄveis num volume que contem 20 maços Y segue Bi(n=20; p=P(X=0) = 0,8179) Logo E(Y) = 20*0,8179 = 16,36 2. Crit. 2: maço Ă© aproveitĂĄvel se contiver no mĂĄximo 1 cigarro defeituoso Y: nÂșde maços aproveitĂĄveis num volume que contem 20 maços Y segue Bi(n=20; p=P(X=0)+P(X=1)= 0,8179+0,1652 = 0,9831) Logo E(Y) = 20*0,9831 = 19,66
  • 78. Manual de ExercĂ­cios EstatĂ­stica Aplicada 74 ExercĂ­cio 10 O comprimento das peças produzidas por uma mĂĄquina Ă© uma v.a. Normal com mĂ©dia ” e variĂąncia σ2 . Uma peça defeituosa se o seu comprimento diferir do valor mĂ©dio mais do que σ. Sabemos que 50% das peças produzidas tĂȘm comprimento inferior a 0,25 mm e 47,5% tĂȘm comprimento entre 0,25 mm e 0,642 mm. a) Calcule a mĂ©dia e o desvio-padrĂŁo do comprimento das peças. b) Determine a probabilidade de uma peça nĂŁo ser defeituosa. Resolução X: comprimento das peças produzidas por uma mĂĄquina X segue N(”; σ2 ) Peça defeituosa se X>” + σ ou se X< ” - σ P(X<0,25) = 50% P(0,25<X<0,642) = 47,5% a) Como P(X<0,25) = 50% vem que P( % 50 ) 25 , 0 = − < − σ ” σ ” X Na tabela, σ ” − 25 , 0 tem que ser =0, logo ” ” ” ” = 0,25 E como P(0,25<X<0,642) = 47,5% vem que = < < = − < − < − ) 392 , 0 ) 1 , 0 ( 0 ( ) 25 , 0 642 , 0 25 , 0 25 , 0 25 , 0 ( σ σ σ σ N P X P ) 0 ( ) 392 , 0 ( Ξ σ Ξ − = = 0,475 Sendo Ξ (0)=0,5, vem que 975 , 0 5 , 0 475 , 0 ) 392 , 0 ( = + = σ Ξ Na tabela 3B da Normal, vem que 96 , 1 392 , 0 = σ e logo σ σ σ σ = 0,2 b) P(peça nĂŁo defeituosa) = P(” - σ < X < ” + σ) = P(0,05 < X < 0,45) = P(X<0,45) – P(X<0,05) = % 13 , 84 ) 1 ( ) 1 ( ) 1 ( ) 2 , 0 25 , 0 05 , 0 ( ) 2 , 0 25 , 0 45 , 0 ( = = − − = − − − D Ξ Ξ Ξ Ξ
  • 79. Manual de ExercĂ­cios EstatĂ­stica Aplicada 75 ExercĂ­cio 11 Sabe-se que a probabilidade de cura de uma certa doença Ă© 20%. PĂ”e-se Ă  prova um novo medicamento, que eleva a probabilidade de cura para 40%, ministrando-o a um grupo de 20 doentes. Admite-se que o medicamento Ă© eficaz no caso de contribuir para a cura de, pelo menos, 8 doentes em 20. Calcule a probabilidade de se concluir pela ineficĂĄcia do medicamento, ainda que este eleve de facto a probabilidade de cura para 40%. Resolução X: nĂșmero de doentes curados no grupo de 20 a que Ă© ministrado o novo medicamento (0,1,2...19, 20) n=20 p=0,4 q=1-p=0,6 X segue Bi (20; 0,4) P(X≄8)=1- F(7) = 41,58% ExercĂ­cio 12 Sabe-se por via experimental que, por cada perĂ­odo de 5 minutos, chegam, em mĂ©dia, 4 veĂ­culos a determinado posto abastecedor de combustĂ­veis. Um empregado entra ao serviço Ă s 8 horas. Qual a probabilidade de ter de aguardar mais de 10 minutos atĂ© Ă  chegada de um veĂ­culo? Resolução X: nÂșde veĂ­culos que chegam ao posto abastecedor por perĂ­odo de 5 minutos X segue Po(4) Se X1: nÂșde veĂ­culos que chegam ao posto no 1ÂșperĂ­odo de 5 minutos X2: nÂșde veĂ­culos que chegam ao posto no 2ÂșperĂ­odo de 5 minutos entĂŁo X1+X2: nÂșde veĂ­culos que chegam ao posto abastecedor em 10 minutos Pelo Teorema da Aditividade de Poisson, considerando X1 e X2 independentes e que ambas seguem Po(4), vem que X1+X2 tambĂ©m segue Po(4+4=8) Logo P(X1+X2=0) na tabela da Po(8) vem igual a 0,03%.
  • 80. Manual de ExercĂ­cios EstatĂ­stica Aplicada 76 3.4. Estimação por intervalos Conhecendo-se uma amostra em concreto, Ă© possĂ­vel estimar os valores dos seus parĂąmetros caracterizadores atravĂ©s de mĂ©todos probabilĂ­sticos. Por exemplo, suponhamos que numa fĂĄbrica produtora de açĂșcar se pretende averiguar se o peso dos pacotes produzidos estĂĄ, em mĂ©dia, dentro das normas de qualidade exigĂ­veis. Na impossibilidade de medição do peso de todos os pacotes, pela morosidade e dispĂȘndio de recursos que tal implicaria, a estatĂ­stica permite que, a partir da observação de uma Ășnica amostra, seja possĂ­vel inferir entre que valores varia o peso mĂ©dio com um grau de confiança ou probabilidade elevado. Assim, ao recolher um determinado nĂșmero de pacotes da produção total aleatoriamente, Ă© possĂ­vel calcular o peso mĂ©dio de acordo com as tĂ©cnicas de estatĂ­stica descritiva apreendidas atrĂĄs. Claro que nada nos garante que esse valor coincide com o valor do parĂąmetro da população em estudo. De facto, Ă© atĂ© provĂĄvel que nĂŁo coincida e, mais, se recolhermos outro conjunto idĂȘntico de pacotes, o valor seja diferente. Isto Ă©, para cada amostra de dimensĂŁo n recolhida, a estimativa do parĂąmetro assumiria valores distintos. EntĂŁo, como retirar conclusĂ”es? Como garantir algum nĂ­vel de rigor? O mĂ©todo a estudar neste capĂ­tulo – a estimação por intervalos – permite, a partir da recolha de uma Ășnica amostra, aferir entre que valores seria de esperar que variasse o parĂąmetro de interesse se nos empenhĂĄssemos a recolher um nĂșmero infinito de amostras. Isto Ă©, por exemplo, caso o valor amostral fosse de 1,02 kg, este mĂ©todo poderia, por exemplo, permitir afirmar que seria altamente provĂĄvel que o peso dos pacotes produzidos estivesse a variar entre 0,92 kg e 1,12 kg. E esse resultado tem um determinado nĂ­vel de confiança associado: por exemplo, se dissermos que o nĂ­vel de confiança ou certeza implicado Ă© de 95%, tal significa que, se nos fosse possĂ­vel observar um nĂșmero infinito de amostras, o intervalo de valores apresentado corresponderia aos resultados obtidos em 95% delas (os valores mais usualmente utilizados sĂŁo 90%, 95% ou 99% de confiança). Caberia depois Ă  empresa julgar se esses seriam ou nĂŁo valores aceitĂĄveis e proceder aos eventuais reajustes necessĂĄrios.
  • 81. Manual de ExercĂ­cios EstatĂ­stica Aplicada 77 A partir do conceito de intervalo de confiança para um parĂąmetro, Ă© fĂĄcil concluir que a sua especificação implica conhecer: - o estimador do parĂąmetro em causa - a sua distribuição de probabilidade - uma estimativa particular daquele parĂąmetro Como parĂąmetros de interesse e para efeitos de exemplificação, vĂŁo considerar-se duas tipologias de intervalo: o intervalo de confiança para a mĂ©dia de uma população normal e o intervalo de confiança para a proporção de uma população binomial. Para efeitos de simplificação, vĂŁo considerar-se apenas exemplos relativos a amostras de grande dimensĂŁo (na prĂĄtica, n≄100) (i) Intervalo de confiança para a mĂ©dia ” ” ” ” de uma população normal Seja X (mĂ©dia amostral) o estimador da mĂ©dia da população. Porque a distribuição Ă© Normal, a distribuição deste estimador serĂĄ: ) ; ( n N X σ ” ∩ Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se necessĂĄrio calcular a variĂĄvel reduzida correspondente: ) 1 ; 0 ( N n X Z ∩ − = σ ” Esta variĂĄvel permitirĂĄ deduzir a fĂłrmula geral do intervalo de confiança para a mĂ©dia ” de uma população normal: + − n c X n c X σ σ ; Isto Ă©, em torno do valor do estimador, Ă© definido um intervalo de variação onde Ă© possĂ­vel afirmar que o parĂąmetro a estimar estĂĄ contido com um grau de confiança ÎŽ . Esse intervalo de variação depende: - da dimensĂŁo da amostra (n): quanto maior a dimensĂŁo da amostra, menor a amplitude do intervalo. Este resultado explica-se facilmente: no limite, se fosse possĂ­vel observar todo o universo de dados (n=∞ ), o valor amostral calculado corresponderia ao valor da população.