Weitere Ă€hnliche Inhalte Ăhnlich wie dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf (20) Mehr von RaquelSilva604657 (18) dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-formando.pdf3. Manual de ExercĂcios
EstatĂstica Aplicada 2
ĂNDICE
1. INTRODUĂĂO .............................................âŠ.................................... 4
1.1 DefiniçÔes Gerais ........................................................................ 5
1.1.1. População 5
1.1.2. VariĂĄveis ou atributos 5
1.1.3. Processo de amostragem 5
1.2 A EstatĂstica Descritiva e a EstatĂstica Indutiva .............âŠ...... 6
2. ESTATĂSTICA DESCRITIVA .............................................âŠ................... 8
2.1 VariĂĄveis Qualitativas ................................................................. 8
2.2 VariĂĄveis Quantitativas Discretas ............................................. 9
2.3 VariĂĄveis Quantitativas ContĂnuas ............................................ 10
2.4 Medidas de Localização ............................................................. 11
2.4.1. MĂ©dia 11
2.4.2. Mediana 12
2.4.3. Moda 13
2.5 Medidas de Ordem ...................................................................... 13
2.6 Medidas de Assimetria ............................................................... 14
2.7 Medidas de DispersĂŁo ................................................................ 15
2.7.1. DispersĂŁo Absoluta 15
2.7.2. DispersĂŁo Relativa 16
2.8 Anålise de Concentração ........................................................... 17
2.8.1. Curva de Lorenz 17
2.8.2. Ăndice de Gini 18
2.9 EstatĂstica Descritiva Bidimensional ........................................ 19
4. Manual de ExercĂcios
EstatĂstica Aplicada 3
3. ESTATĂSTICA INDUTIVA .............................................âŠ...................... 45
3.1 NoçÔes båsicas de probabilidades ........................................... 45
3.2 Probabilidade condicionada ...................................................... 48
3.3 FunçÔes de Probabilidade ........................................âŠ.............. 49
3.4 Estimação por Intervalos ..........................................âŠ.............. 76
3.5 Testes de hipĂłteses ..................................................âŠ.............. 89
3.6 AplicaçÔes EstatĂsticas: Fiabilidade ......................................... 105
3.6.1. Conceito de fiabilidade 105
3.6.2. Fiabilidade de um sistema 105
3.7 AplicaçÔes EstatĂsticas: Controlo EstatĂstico de Qualidade .. 110
3.8 AplicaçÔes EstatĂsticas: Tratamento EstatĂstico de InquĂ©ritos . 114
3.8.1. Teste de independĂȘncia do qui-quadrado 114
5. Manual de ExercĂcios
EstatĂstica Aplicada 4
"A estatĂstica Ă© a tĂ©cnica de torturar os nĂșmeros atĂ© que eles confessem".
Autor desconhecido
1. INTRODUĂĂO
Inicialmente, a actividade estatĂstica surgiu como um ramo da MatemĂĄtica.
Limitava-se ao estudo de mediçÔes e técnicas de contagem de fenómenos
naturais e ao cĂĄlculo de probabilidades de acontecimentos que se podiam
repetir indefinidamente. Actualmente, os mĂ©todos estatĂsticos sĂŁo utilizados em
muitos sectores de actividade, tendo como algumas aplicaçÔes estudos de
fiabilidade, pesquisas de mercado, testes de controle de qualidade, tratamento
de inquéritos, sondagens, modelos econométricos, previsÔes, etc.
Exemplo de uma estatĂstica: os valores da inflação entre 1980 e 1990
constituem uma estatĂstica. Fazer estatĂstica sobre estes dados poderia
consistir, por exemplo, em traçar gråficos, calcular a inflação média trimestral
ou prever a inflação para 1991.
A anĂĄlise de um problema estatĂstico desenvolve-se ao longo de vĂĄrias fases
distintas:
(i) Definição do Problema
Saber exactamente aquilo que se pretende pesquisar; estabelecer o
objectivo de anålise e definição da população
(ii) Amostragem e Recolha de Dados
Fase operacional. à o processo de selecção e registo sistemåtico de dados,
com um objectivo determinado. Os dados podem ser primĂĄrios (publicados
pela própria pessoa ou organização) ou secundårios (quando são
publicados por outra organização).
(iii) Tratamento e Apresentação dos Dados
Resumo dos dados através da sua contagem e agrupamento. à a
classificação de dados, recorrendo a tabelas ou gråficos.
6. Manual de ExercĂcios
EstatĂstica Aplicada 5
(iv)Anålise e Interpretação dos Dados
A Ășltima fase do trabalho estatĂstico Ă© a mais importante e delicada. EstĂĄ
ligada essencialmente ao cĂĄlculo de medidas e coeficientes, cuja finalidade
principal Ă© descrever o comportamento do fenĂłmeno em estudo (estatĂstica
descritiva). Na estatĂstica indutiva a interpretação dos dados se
fundamentam na teoria da probabilidade.
1.1. DefiniçÔes Gerais
1.1.1. População
Fazer estatĂstica pressupĂ”e o estudo de um conjunto de objectos bem
delimitado com alguma caracterĂstica em comum sobre os quais observamos
um certo nĂșmero de atributos designados por variĂĄveis.
Exemplo: Empresas existentes em Portugal
1.1.2. VariĂĄveis ou atributos
As propriedades de uma população são estudadas observando um certo
nĂșmero de variĂĄveis ou atributos. As variĂĄveis podem ser de natureza
qualitativa ou quantitativa. As variĂĄveis quantitativas podem ainda dividir-se
entre discretas e contĂnuas. As variĂĄveis discretas assumem apenas um
nĂșmero finito numerĂĄvel de valores. As variĂĄveis contĂnuas podem assumir um
nĂșmero finito nĂŁo numerĂĄvel ou um nĂșmero infinito de valores.
Exemplo: um conjunto de empresas pode ser analisado em termos de sector
de actividade (atributo qualitativo), nĂșmero de trabalhadores (atributo
quantitativo discreto), rĂĄcio de autonomia financeira (atributo quantitativo
contĂnuo), etc
1.1.3. Processo de amostragem
Para conhecer de forma completa a população, podem efectuar-se:
7. Manual de ExercĂcios
EstatĂstica Aplicada 6
- recenseamentos (indagação completa de todos os elementos da
população); este processo é, no entanto, tipicamente moroso e
dispendioso, sendo esses os motivos porque os Censos sĂŁo realizados
apenas em cada 10 anos.
- estudos por amostragem (observação de apenas um subconjunto, tido
como representativo do universo). As técnicas de recolha de amostras
garantem a sua representatividade e aleatoriedade.
1.2. A EstatĂstica Descritiva e a EstatĂstica Indutiva
Para alĂ©m do ramo de amostragem, a estatĂstica compreende dois grandes
ramos: a estatĂstica descritiva e a estatĂstica indutiva.
A estatĂstica descritiva Ă© o ramo da estatĂstica que se encarrega do tratamento
e anĂĄlise de dados amostrais. Assim, depois de recolhida a amostra de acordo
com técnicas que garantem a sua representatividade e aleatoriedade, fica
disponĂvel um conjunto de dados sobre o universo âem brutoâ ou nĂŁo
classificados. Para que seja possĂvel retirar qualquer tipo de conclusĂ”es, torna-
se necessĂĄrio classificar os dados, recorrendo a tabelas de frequĂȘncias e a
representaçÔes gråficas, isto é, é preciso tratar os dados. Depois de tratados,
serĂĄ possĂvel proceder Ă anĂĄlise dos dados atravĂ©s de vĂĄrias medidas que
descrevem o seu comportamento: localização, dispersão, simetria dos dados,
concentração, etc. São disso exemplo indicadores numéricos bem conhecidos
como a média ou a variùncia.
A estatĂstica indutiva Ă© o ramo da estatĂstica que se ocupa em inferir das
conclusÔes retiradas sobre a amostra para a população. De facto, a amostra
nĂŁo Ă© mais do que um passo intermĂ©dio e exequĂvel de obter informaçÔes
sobre o verdadeiro objecto de estudo, que Ă© o universo. A estatĂstica indutiva
(ou inferĂȘncia estatĂstica) garante a ligação entre amostra e universo: se algo
se concluiu acerca da amostra, atĂ© que ponto Ă© possĂvel afirmar algo
semelhante para o universo? Ă nesta fase que se procuram validar as
hipóteses formuladas numa fase prévia exploratória. Claro que o processo de
8. Manual de ExercĂcios
EstatĂstica Aplicada 7
indução implica um certo grau de incerteza associado à tentativa de
generalização de conclusĂ”es da âparteâ (amostra) para o âtodoâ (universo). O
conceito de probabilidade vai ter aqui, entĂŁo, um papel fundamental. Isto Ă©, nĂŁo
vai ser possĂvel afirmar com toda a certeza que o comportamento da amostra
ilustra perfeitamente o comportamento do universo, mas apenas que o faz com
forte probabilidade. As inferĂȘncias indutivas sĂŁo assim elaboradas medindo, ao
mesmo tempo, o respectivo grau de incerteza. Daà que, na ficha das técnicas
das sondagens eleitorais, por exemplo, apareçam referĂȘncias ao ânĂvel de
confiançaâ associado aos resultados e ao âerroâ cometido.
O esquema seguinte ilustra a ârodaâ da disciplina de estatĂstica, relacionando
os seus diferentes ramos:
POPULAĂĂO
OU UNIVERSO
Amostragem
TRATAMENTO E
ANĂLISE DA AMOSTRA
EstatĂstica
Descritiva
InferĂȘncia
EstatĂstica
INFERIR DA AMOSTRA
PARA O UNIVERSO
GrĂĄficos; tabelas; medidas descritivas
PrevisÔes
Estimação
Erros
AMOSTRA
9. Manual de ExercĂcios
EstatĂstica Aplicada 8
2.ESTATĂSTICA DESCRITIVA
Os resultados da observação de um atributo sobre os elementos do conjunto a
analisar constituem os dados estatĂsticos. O ramo da estatĂstica que se ocupa
do tratamento, apresentação e anålise de dados amostrais denomina-se de
estatĂstica descritiva.
2.1. VariĂĄveis Qualitativas
Os dados qualitativos sĂŁo organizados na forma de uma tabela de frequĂȘncias,
que representa o nĂșmero ni de elementos de cada uma das categorias ou
classes e que Ă© chamado de frequĂȘncia absoluta. A soma de todas as
frequĂȘncias Ă© igual Ă dimensĂŁo da amostra (n).
Numa tabela de frequĂȘncias, alĂ©m das frequĂȘncias absolutas, tambĂ©m se
apresentam as frequĂȘncias relativas (fi), obtida dividindo a frequĂȘncia absoluta
pelo nĂșmero total de observaçÔes.
Modalidades FrequĂȘncias absolutas FrequĂȘncias relativas
Mod. 1 n1 f1
Mod. j nj fj
Mod. n nn fn
Total n: dimensĂŁo da amostra 1
n
ni
fi = ; ni: nÂșde vezes que cada modalidade da variĂĄvel foi observada.
10. Manual de ExercĂcios
EstatĂstica Aplicada 9
Estes dados podem também ser representados graficamente através de:
Diagrama de barras
Para cada modalidade, desenha-se uma barra de altura igual Ă frequĂȘncia
absoluta ou relativa (as frequĂȘncias relativas sĂŁo de preferir, pois permitem a
comparação de amostras de diferentes dimensÔes).
Diagrama sectorial ou circular
Esta representação Ă© constituĂda por um cĂrculo, em que se apresentam tantas
âfatiasâ quantas as modalidades em estudo. O Ăąngulo correspondente a cada
modalidade Ă© proporcional Ă s frequĂȘncias das classes, fazendo corresponder o
total da amostra (n) a 360Âș Geralmente, juntamente com a identificação da
modalidade, indica-se a frequĂȘncia relativa respectiva.
2.2. VariĂĄveis Quantitativas Discretas
SĂŁo variĂĄveis que assumem um nĂșmero finito ou infinito numerĂĄvel de valores.
A apresentação destas amostras é semelhante às variåveis qualitativas,
fazendo-se uma tabela de frequĂȘncias e uma representação grĂĄfica recorrendo
ao diagrama de barras.
Valores da variĂĄvel FrequĂȘncias absolutas FrequĂȘncias relativas
X1 n1 f1
Xj nj fj
Xn nn fn
Total n: dimensĂŁo da amostra 1
TambĂ©m Ă© possĂvel calcular as frequĂȘncias (absolutas â Ni - e relativas - Fi)
acumuladas, como se pode ver no exemplo:
NÂșdefeituosos (X) NÂșembalagens (ni) % embalagens (fi) Ni Fi
0 80 40% 80 40%
1 60 30% 80+60 40%+30%
2 30 15% 170 85%
3 20 10% 190 95%
4 10 5% 200 100%
Total 200 1
11. Manual de ExercĂcios
EstatĂstica Aplicada 10
2.3. VariĂĄveis Quantitativas ContĂnuas
Como foi dito anteriormente, uma variĂĄvel (ou atributo) Ă© contĂnua quando
assume um nĂșmero infinito nĂŁo numerĂĄvel de valores, isto Ă©, podem assumir
qualquer valor dentro de um intervalo.
Neste caso, a construção da tabela compreende duas etapas:
(i) Definição de classes de valores disjuntas, correspondentes a intervalos de
nĂșmeros reais fechados Ă esquerda e abertos Ă direita, cuja constituição
obedece a certas regras
(ii) Contagem das observaçÔes pertencentes a cada classe
Regra de construção de classes
(pressupÔe a formação de classes de igual amplitude)
- NĂșmero de classes a constituir
Depende de n = dimensĂŁo da amostra
Se nâ„25, o nĂșmero de classes a constituir deve ser 5
Se n<25, o nĂșmero de classes a constituir deve ser n
- Amplitude comum a todas as classes
Sendo a amplitude total dos dados dada pela diferença entre o valor
mĂĄximo e o valor mĂnimo observados, entĂŁo a amplitude de cada classe
serĂĄ:
Valor mĂĄximo da variĂĄvel observado â Valor mĂnimo da variĂĄvel observado
NÂșde classes a constituir
Classes de
valores da variĂĄvel
FrequĂȘncias absolutas FrequĂȘncias relativas
[x1; x2[ n1 f1
[x2; x3[
[x3; x4[ nj fj
[xn-1; xn] n fn
Total n: dimensĂŁo da amostra 1
A distribuição de frequĂȘncias representa-se atravĂ©s de um histograma.
Um histograma Ă© uma sucessĂŁo de rectĂąngulos adjacentes, em que a base Ă©
uma classe e a altura a frequĂȘncia (relativa ou absoluta) por unidade de
amplitude (ni/ai ou fi/ai), sendo a amplitude de cada classe ai=ei-ei-1. A ĂĄrea total
do histograma Ă© a soma das frequĂȘncias relativas, isto Ă©, 1.
12. Manual de ExercĂcios
EstatĂstica Aplicada 11
1. Esta distribuição permite visualizar o tipo de distribuição e deve salientar
alguns aspectos mais relevantes desta (moda, classe modal, ...). Como
as classes podem ter amplitudes diferentes, para que todos os
rectĂąngulos (colunas) sejam comparĂĄveis Ă© necessĂĄrio corrigir as
frequĂȘncias das classes (calculando as frequĂȘncias que se teria se a
amplitude de todas as classes fosse igual e igual a 1)
2. Ă preferĂvel representar o histograma com fi/hi do que com ni/hi uma vez
que deste modo Ă© possĂvel comparar distribuiçÔes com diferente nĂșmero
de observaçÔes amostrais.
TambĂ©m Ă© possĂvel calcular as frequĂȘncias (absolutas â Ni - e relativas - Fi)
acumuladas.
2.4. Medidas de localização
2.4.1. MĂ©dia ( X )
à a medida de localização mais usada, sobretudo pela sua facilidade de
cĂĄlculo.
Dados nĂŁo-classificados (nĂŁo agrupados numa tabela de frequĂȘncias)
=
=
n
i
i
x
n
x
1
1
Média aritmética simples
Dados classificados (isto Ă©, agrupados numa tabela de frequĂȘncias)
VariĂĄveis discretas
=
=
=
=
n
i
i
i
i
n
i
i x
f
x
n
n
x
1
1
1
MĂ©dia ponderada dos valores de X
Dados classificados (isto Ă©, agrupados numa tabela de frequĂȘncias)
VariĂĄveis contĂnuas
=
=
=
=
n
i
i
i
i
n
i
i c
f
c
n
n
x
1
1
1
Média ponderada dos pontos médios das classes
13. Manual de ExercĂcios
EstatĂstica Aplicada 12
onde ci é o ponto médio de cada classe (
2
.
sup
.
lim
.
inf
.
lim +
)
A média é uma medida de localização que, geralmente, indica o valor central
da distribuição, entendido como o valor em torno do qual se distribuem os
valores observados. Desta forma, a média é muitas vezes utilizada como valor
representativo da amostra.
No entanto, a mĂ©dia tem o grande inconveniente de ser sensĂvel a valores
muito extremados ou aberrantes da distribuição (outliers). Em casos desses, a
média deixa de ser um valor que aparece na parte central da distribuição para
ser âempurradaâ para os extremos. Nestes casos, Ă© preferĂvel recorrer Ă
informação complementar fornecida por outras medidas de localização, como a
moda e a mediana, que se definem a seguir.
2.4.2. Mediana (Me)
A mediana não se calcula a partir do valor de todas as observaçÔes, mas a
partir da posição dessas observaçÔes.
Dados nĂŁo-classificados
Se tivermos n valores x1, x2, ... xn
Se n fĂŽr Ămpar,
2
1
+
= n
x
Me
Se n fĂŽr par,
2
1
2
2
+
+
=
n
n x
x
Me
Dados classificados
A mediana Ă© o valor tal que Fi = 0,5
VariĂĄveis discretas
Se existe um valor de xi para o qual Fi = 0,5, entĂŁo fala-se em intervalo
mediano.
14. Manual de ExercĂcios
EstatĂstica Aplicada 13
Se nĂŁo existe nenhum valor de xi para o qual Fi = 0,5, entĂŁo a mediana Ă©
o primeiro valor para o qual Fi > 0,5.
VariĂĄveis contĂnuas
Em geral, determina-se o valor para o qual Fi = 0,5 através de uma regra
de trĂȘs simples, atendendo a que as frequĂȘncias acumuladas variam
uniformemente dentro de cada classe.
De uma forma geral:
mediana
classe
xamp
FL
FL
FL
L
Me .
inf
sup
inf
5
.
0
inf
â
â
+
=
2.4.3. Moda (Mo)
VariĂĄveis discretas
A moda Ă© valor de X para o qual fi Ă© mĂĄximo, isto Ă©, Ă© o valor mais
frequente da distribuição.
VariĂĄveis contĂnuas
A classe modal Ă© a classe de valores de X para o qual fi/hi Ă© mĂĄximo,
isto Ă©, Ă© a classe a que corresponde maior frequĂȘncia por unidade de
amplitude.
2.5. Medidas de ordem
Tal como se definiu para a mediana, Ă© possĂvel definir outros valores de
posição ou valores separadores da distribuição em partes iguais.
Chama-se quantil de ordem p ao valor de x a que corresponde Fi = p.
- Se p=0,01; 0,02;.....0,99, chama-se ao quantil percentil
- Se p=0,1; 0,2;...0,9, chama-se ao quantil decil
- Se p=0,25, 0,5, 0,75, chama-se ao quantil QUARTIL (Q1, Q2 e Q3). A
mediana Ă© uma caso particular dos quartis (coincide com Q2)
VariĂĄvel discreta
O quantil de ordem p Ă© o primeiro valor de x para o qual i>p.
15. Manual de ExercĂcios
EstatĂstica Aplicada 14
VariĂĄvel contĂnua
Calcula-se por uma regra de trĂȘs simples, como a mediana.
De uma forma geral:
1
.
inf
sup
inf
25
.
0
inf
1 Q
classe
xamp
FL
FL
FL
L
Q
â
â
+
=
3
.
inf
sup
inf
75
.
0
inf
3 Q
classe
xamp
FL
FL
FL
L
Q
â
â
+
=
A representação gråfica destas medidas designa-se de diagrama de
extremos e quartis e serve para realçar algumas caracterĂsticas da amostra.
Os valores da amostra compreendidos entre os 1Âș e 3Âș quartis sĂŁo
representados por um rectĂąngulo (caixa) com a mediana indicada por uma
barra. Seguidamente, consideram-se duas linhas que unem os meios dos
lados do rectĂąngulo com os extremos da amostra.
A partir deste diagrama, pode reconhecer-se a simetria ou enviesamento dos
dados e a sua maior ou menor concentração:
2.6. Medidas de assimetria
A assimetria Ă© tanto maior quanto mais afastados estiverem os valores da
média, mediana e moda. Concretamente, se:
â X = Me = Mo, a distribuição diz-se simĂ©trica
â X > Me > Mo, a distribuição diz-se assimĂ©trica positiva (ou enviesada Ă
esquerda)
â X < Me < Mo, a distribuição diz-se assimĂ©trica negativa (ou enviesada Ă
direita)
Coeficiente de assimetria de Bowley (gâ):
1
3
)
1
2
(
)
2
3
(
Q
Q
Q
Q
Q
Q
â
â
â
â
Se gâ = 0 ..............a distribuição Ă© simĂ©trica positiva ou equilibrada
Os quartis estĂŁo Ă mesma distĂąncia da mediana.
Se gâ > 0 ..............a distribuição Ă© assimĂ©trica positiva ou âpuxadaâ para
25%
maiores
16. Manual de ExercĂcios
EstatĂstica Aplicada 15
a esquerda (se fĂŽr = 1, assimetria Ă© mĂĄxima)
A mediana desliza para o lado do Q1,
logo Q3-Q2 > Q2-Q1
Se gâ < 0 ..............a distribuição Ă© assimĂ©trica negativa ou âpuxadaâ para
a direita (se fĂŽr = -1, assimetria Ă© mĂĄxima)
A mediana desliza para o lado do Q3,
logo Q2-Q1 > Q3-Q2
2.7. Medidas de dispersĂŁo
Duas distribuiçÔes podem distinguir-se na medida em que os valores da
variåvel se dispersam relativamente ao ponto de localização (média, mediana,
moda). Apresentam-se de seguida algumas das mais utilizadas, classificadas
consoante a medida de localização usada para referenciar a dispersão das
observaçÔes:
2.7.1 Medidas de dispersĂŁo absoluta
(i) Em relação à mediana
Amplitude inter-quartis = Q = Q3 â Q1
Significa que 50% das observaçÔes se situam num intervalo de
amplitude Q. Quanto maior (menor) a amplitude do intervalo, maior
(menor) a dispersĂŁo em torno da mediana.
(ii) Em relação à média
VariĂąncia amostral: mede os desvios quadrĂĄticos de cada valor
observado em relação à média, havendo pouca dispersão se os desvios
forem globalmente pequenos, e havendo muita dispersĂŁo se os desvios
forem globalmente grandes.
Q1 Q2 Q3
Assimétrica positiva
Assimétrica negativa
Q1 Q2
Q3
17. Manual de ExercĂcios
EstatĂstica Aplicada 16
Dados nĂŁo-classificados
( )
2
1
2 1
=
â
=
n
i
x
xi
n
s
Dados classificados
VariĂĄveis discretas
( ) ( )
=
=
â
=
â
=
n
i
n
i
x
xi
fi
x
xi
ni
n
s
1
2
2
1
2 1
Dados classificados
VariĂĄveis contĂnuas
( ) ( )
=
=
â
=
â
=
n
i
n
i
x
ci
fi
x
ci
ni
n
s
1
2
2
1
2 1
onde ci é o ponto médio de cada classe i.
Desvio-padrĂŁo: Medida de dispersĂŁo com significado real, mas que sĂł Ă©
possĂvel calcular indirectamente, atravĂ©s da raiz quadrada da variĂąncia.
EstĂĄ expressa nas mesmas unidades da variĂĄvel.
2.7.2 Medidas de dispersĂŁo relativa
Muitas vezes, avaliar a dispersão através de um indicador de dispersão
absoluta nĂŁo Ă© conveniente, assim como comparara a dispersĂŁo de duas
distribuiçÔes, uma vez que estas medidas vĂȘm expressas na mesma unidade
da variĂĄvel â como Ă© o caso, por exemplo, da variĂąncia. Assim, Ă© de esperar
que os valores da variĂąncia sejam mais elevados quando os valores da variĂĄvel
são maiores, o que não significa que a distribuição seja muito dispersa. Para
comparar diferentes distribuiçÔes de frequĂȘncia sĂŁo precisas medidas de
dispersĂŁo relativa:
definida
estĂĄ
qual
Ă
relação
em
o
localizaçã
de
Medida
absoluta
DispersĂŁo
relativa
DispersĂŁo =
18. Manual de ExercĂcios
EstatĂstica Aplicada 17
Coeficiente de variação
x
s
CV = x100%
Outras medidas
2
1
3
Q
Q
Q â
Estas medidas nĂŁo estĂŁo expressas em nenhuma unidade, e permitem
comparar dispersĂ”es entre duas amostras, pois nĂŁo sĂŁo sensĂveis Ă escala
(eventualmente diferente) em que as variĂĄveis estejam expressas.
2.8. Anålise da concentração
A noção de concentração apareceu associada ao estudo de desigualdades
económicas, como a repartição do rendimento ou a distribuição de salårios. O
fenómeno de concentração estå relacionado com a variabilidade ou dispersão
dos valores observados, apesar de não poder ser analisado através das
medidas de dispersĂŁo atrĂĄs descritas, que apenas medem a dispersĂŁo dos
valores em relação a um ponto. O objectivo é determinar como o atributo
(rendimento, salĂĄrios, nĂșmero de empresas) se distribui (se de forma mais ou
menos uniforme) pelos diferentes indivĂduos da amostra (que devem ser
susceptĂveis de serem adicionados, isto Ă©, a anĂĄlise de concentração nĂŁo se
aplica a idade, altura, peso, etc).
Se o atributo estiver igualmente repartido pelos indivĂduos, temos uma situação
extrema de igual distribuição; e vice-versa de o atributo estiver concentrado
num sĂł indivĂduo, temos uma situação extrema de mĂĄxima concentração. Em
geral, interessa medir o grau de concentração em situaçÔes intermédias.
Para analisar a concentração, existem dois instrumentos: a Curva de Lorenz e o Ăndice
de Gini.
2.8.1 Curva de Lorenz
19. Manual de ExercĂcios
EstatĂstica Aplicada 18
O objectivo Ă© comparar a evolução das frequĂȘncias acumuladas (Fi = pi) com a
evolução da soma dos valores da variåvel (qi)
Quadro de dados
Classes de
valores da variĂĄvel
ni
Quantidade
atributo
Freq.relativa
acumuladas
Proporção
atrib.acumul,
[x1; x2[ n1 yi p1 q1
[x2; x3[
[x3; x4[ nj yj pj qj
[xn-1; xn[ nn yn pn=1 qn=1
Total n
Os pontos (pi;qi) pertencem ao quadrado (0,1) por (0,1). A curva que os une Ă©
a curva de Lorenz. Se houver igual distribuição, a frequĂȘncia das observaçÔes
deve ter uma evolução igual à proporção do atributo correspondente, isto é,
pi=qi. Nesse caso, a curva de Lorenz coincide com a diagonal do quadrado,
que é designada de recta de igual repartição. Quanto mais a curva se afastar
da recta, maior é a concentração. A zona entre a diagonal e acurva de Lorenz
designa-se, por isso, de zona de concentração.
2.8.2 Ăndice de Gini
O Ăndice de Gini Ă© calculado pela seguinte expressĂŁo
â
=
â
=
â
= 1
1
1
1
)
(
n
i
n
i
pi
qi
pi
G
Quando G = 0, a concentração é nula, havendo igual repartição. Caso o valor
de G seja 1, a concentração serå måxima. O valor de G varia entre 0 e 1, e
quanto maior o seu valor, maior a concentração.
20. Manual de ExercĂcios
EstatĂstica Aplicada 19
2.9. EstatĂstica Descritiva Bidimensional
Numa situação em que se observam pares de valores (xi; yj), pode ter interesse
estudar as relaçÔes porventura existentes entre os dois fenómenos,
nomeadamente relaçÔes estatĂsticas. NĂŁo se trata de estudar relaçÔes
funcionais (isto Ă©, a medida em que o valor de uma variĂĄvel Ă© determinado
exactamente pela outra), mas sim de estudar a forma como a variação de uma
variåvel poderå afectar a variação da outra, em média. (por exemplo, o peso e
a altura normalmente estĂŁo relacionados, mas a relação nĂŁo Ă© determinĂstica).
Duas variĂĄveis ligadas por uma relação estatĂstica dizem-se correlacionadas.
Se as variaçÔes ocorrem, em média ou tendencialmente, no mesmo sentido, a
correlação diz-se positiva. Se ocorrem em sentidos opostos, a correlação diz-
se negativa.
Trata-se entĂŁo de estudar se:
- Se existe alguma correlação entre os fenómenos ou variåveis
observadas
- A existir, se Ă© traduzĂvel por alguma lei matemĂĄtica, nem que
tendencialmente
- A existir, se Ă© possĂvel medi-la
Por vezes, a representação gråfica do conjunto de dados bivariados sugere o
ajustamento de uma recta a este conjunto de pontos, indicando a existĂȘncia de
uma tendencial correlação linear entre as duas variåveis, como é o caso do
exemplo atrĂĄs descrito. A essa recta chama-se recta de regressĂŁo de y sobre
x, que permite descrever como se reflectem em y (variĂĄvel dependente ou
explicada) as modificaçÔes processadas em x (variåvel independente ou
explicativa). Essa recta torna possĂvel, por exemplo, inferir (em mĂ©dia) a altura
de um indivĂduo, conhecendo o respectivo peso.
Um dos métodos mais conhecidos de ajustar uma recta a um conjunto de
dados Ă© o MĂ©todo dos MĂnimos Quadrados, que consiste em determinar a recta
que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores
de y e os obtidos a partir da recta que se pretende ajustar. Obtém-se assim a
21. Manual de ExercĂcios
EstatĂstica Aplicada 20
recta de regressĂŁo ou recta dos mĂnimos quadrados. Assim, se a recta de
regressĂŁo obedecer Ă seguinte fĂłrmula geral:
y = a + bx
o método permite minimizar a soma dos desvios quadråticos yi - (a + bxi).
Assim sendo, obtém-se:
â
â
= 2
2
x
n
x
y
x
n
y
x
b
i
i
i
e x
b
y
a â
=
Matematicamente, b designa o declive da recta. Em termos estatĂsticos, b
corresponde ao coeficiente de regressão de y sobre x, que indica a variação
média de y que acompanha uma variação unitåria de x.
O valor de a designa a ordenada na origem, isto Ă©, o valor que y assume
quando x=0.
Quando, quer através do diagrama de dispersão, quer através da recta de
regressĂŁo, se verifica a existĂȘncia de uma associação linear entre as variĂĄveis,
pode-se medir a maior ou menor força com que as variåveis se associam
através do coeficiente de correlação linear r:
)
)(
(
,
1
y
y
x
x
s
s
s
s
r i
n
i
i
xy
yy
xx
xy
â
â
=
=
=
Este indicador da correlação tem a vantagem de não depender das unidades
ou da ordem de grandeza em que as variĂĄveis estĂŁo expressas. O coeficiente
de correlação linear estĂĄ sempre compreendido entre â1 e 1.
Se r > 0, então pode dizer-se que existe uma correlação positiva entre as
variĂĄveis, isto Ă©, as variĂĄveis variam no mesmo sentido: um aumento
(diminuição de x) provoca um aumento (diminuição) de y, mas menos que
proporcional.
22. Manual de ExercĂcios
EstatĂstica Aplicada 21
Se r < 0, então pode dizer-se que existe uma correlação negativa entre as
variĂĄveis, isto Ă©, as variĂĄveis variam em sentidos opostos: um aumento
(diminuição de x) provoca uma diminuição (aumento) de y, mas menos que
proporcional.
Se r = 0, entĂŁo pode dizer-se que as variĂĄveis nĂŁo estĂŁo correlacionadas
linearmente.
Antes de se efectuar um estudo de correlação, deve-se procurar justificação
teĂłrica para a existĂȘncia ou inexistĂȘncia de correlação. Caso contrĂĄrio, poderĂĄ
acontecer que variåveis sem relação de causalidade entre si, variem num certo
sentido por razÔes exteriores. A esta correlação ilusória, chama-se correlação
espĂșria.
Nos extremos, se r = 1 ou se r = -1, entĂŁo pode dizer-se que existe uma
correlação positiva ou negativa perfeita, respectivamente, entre as variåveis,
isto é, uma variação numa variåvel provoca na outra uma variação
exactamente proporcional no mesmo sentido ou em sentido contrĂĄrio. Isto Ă©, a
correlação é måxima.
Correlação ordinal
Por vezes, as variĂĄveis vĂȘm expressas numa escala ordinal, isto Ă©, interessa
mais conhecer a ordenação dos valores do que os valores observados
propriamente ditos. Neste caso, em vez do coeficiente de correlação linear,
calcula-se o coeficiente de correlação ordinal:
y
i
x
i
i
n
i
i
s R
R
d
n
n
d
r â
=
â
â
= =
,
)
1
(
6
1 2
1
2
Ordens (âranksâ) das
observaçÔes de X e
de Y, respectivamente
23. Manual de ExercĂcios
EstatĂstica Aplicada 22
ESTATĂSTICA DESCRITIVA
ExercĂcios resolvidos
ExercĂcio 1
Considere a distribuição de 1000 empresas de um sector de actividade
segundo os resultados lĂquidos (em milhares de u.m.):
Resultado LĂquido FrequĂȘncia. Relativa (%)
[0; 1[ 10
[1; 3[ 25
[3; 5[ 35
[5; 15[ 15
[15; 25[ 10
[25; 50[ 5
Total 100
a) Represente a distribuição graficamente.
b) Determine a média e a moda da distribuição. Qual o significado dos
valores encontrados?
c) Calcule as frequĂȘncias acumuladas e represente-as graficamente.
Determine a mediana da distribuição.
d) Determine os quartis da distribuição. Faça a sua representação gråfica.
e) Analise a (as)simetria da distribuição em causa.
f) Analise a concentração atravĂ©s do Ăndice de Gini e da Curva de Lorenz.
Resolução
a)
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0,2
0 10 20 30 40 50 60
fi/hi
24. Manual de ExercĂcios
EstatĂstica Aplicada 23
b) 325
,
7
%)
5
5
.
37
(
...
%)
25
2
(
%)
10
5
,
0
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
Em mĂ©dia, o resultado lĂquido de uma empresa Ă© de 7325 unidades
monetĂĄrias.
A classe modal Ă© aquela a que corresponde maior frequĂȘncia por unidade de
amplitude. Neste caso, o maior valor de fi / hi Ă© 0,175. correspondente Ă classe
[3; 5[, isto Ă©, os valores de resultado lĂquido mais provĂĄveis para uma empresa
situam-se entre 3000 u.m. e 5000 u.m.
c) A representação grĂĄfica das frequĂȘncias acumuladas (ver tabela) designa-se
de polĂgono integral:
Classe mediana (classe a que corresponde uma frequĂȘncia acumulada 0,5): [3; 5[
3 : Fi=0,35
5 : Fi = 0,7
Fi
0
0,2
0,4
0,6
0,8
1
0 20 40 60 80 100 120
X fi hi fi/hi Fi ci
[0; 1[ 10% 1 0.1 10% 0.5
[1; 3[ 25% 2 0.125 35% 2
[3; 5[ 35% 2 0.175 70% 4
[5; 15[ 15% 10 0.015 85% 10
[15; 25[ 10% 10 0.01 95% 20
[25; 50] 5% 25 0.002 100% 37.5
Total 1
25. Manual de ExercĂcios
EstatĂstica Aplicada 24
CĂĄlculo da mediana:
0,7 - 0,35 ------------ 5 - 3
0,5 â 0,35 -------------- Me â 3
Me = 3 + ((2x0,15)/0,35) = 3,857
50% das empresas apresentam resultados lĂquidos inferiores a 3857 u.m.
d) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia
acumulada 0,25): [1; 3[
1 : Fi=0,1
3 : Fi = 0,35
CĂĄlculo do Q1:
0,35 - 0,1 ------------ 3 - 1
0,25 â 0,1 -------------- Q1 â 1
Q1 = 1 + ((2x0,15)/0,25) = 2,2
25% das empresas apresentam resultados lĂquidos inferiores a 2200 u.m.
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [5; 15[
5 : Fi=0,7
15 : Fi = 0,85
CĂĄlculo do Q3:
0,85 - 0,7 ------------ 15 - 5
0,75 â 0,7 -------------- Q3 â 5
Q3 = 5 + ((10x0,05)/0,15) = 8,333(3)
75% das empresas apresentam resultados lĂquidos inferiores a 8333 u.m.
e)
0
4596
,
0
2
,
2
333
,
8
)
2
,
2
857
,
3
(
)
857
,
3
333
,
8
(
1
3
)
1
2
(
)
2
3
(
' >
=
â
â
â
â
=
â
â
â
â
=
Q
Q
Q
Q
Q
Q
g
A distribuição é assimétrica positiva ou enviesada à esquerda.
26. Manual de ExercĂcios
EstatĂstica Aplicada 25
f)
X fi ni ci Atributo pi (=Fi) qi
[0; 1[ 10% 1000x10%=100 0.5 100x0.5=50 0.1 0.007
[1; 3[ 25% 250 2 250x2=500 0.35 0.075
[3; 5[ 35% 350 4 1400 0.7 0.266
[5; 15[ 15% 150 10 1500 0.85 0.471
[15; 25[ 10% 100 20 2000 0.95 0.744
[25; 50[ 5% 50 37.5 1875 1 1
Total 1 n=1000 7325
47
,
0
95
,
0
85
,
0
7
,
0
35
,
0
1
,
0
)
744
,
0
95
,
0
(
...
)
007
,
0
1
,
0
(
=
+
+
+
+
â
+
+
â
=
G
A distribuição dos resultados lĂquidos
apresenta concentração média (G=0,5
corresponde ao centro da escala
possĂvel, entre 0 e 1). Por exemplo,
70% das empresas apresentavam
resultados até 5000 u.m., mas isso
representava apenas 26,6% do total
de resultados das empresas da
amostra, o que sugere um tecido
empresarial com muitas PMEs, mas
em que cada uma tem baixo resultado
lĂquido.
ExercĂcio 2
Considere a seguinte amostra de dimensĂŁo 200, referente aos lucros obtidos
por empresas de um dado sector industrial, expressas numa determinada
unidade monetĂĄria.
Analise a concentração atravĂ©s do Ăndice de Gini e da Curva de Lorenz.
Res.Liq.Totais
7325
1400
500
50 +
+
Curva de Lorenz
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
27. Manual de ExercĂcios
EstatĂstica Aplicada 26
Resolução
Lucros ni Lucro total pi (=Fi) qi
[0; 50[ 20 600 0.1 0.02
[50; 100[ 60 4400 0.4 0.16(6)
[100; 200[ 80 14000 0.8 0.63(3)
[200; 300[ 30 7500 0.95 0.883(3)
[300; 500] 10 3500 1 1
Total 200 30000
243
,
0
25
,
2
)
6
(
546
,
0
)
(
1
1
1
1
=
=
â
= â
=
â
=
n
i
n
i
pi
qi
pi
G
Tanto pela anĂĄlise da Curva de Lorenz, como pelo valor do Ăndice de Gini,
conclui-se que esta amostra apresenta concentração moderada, encontrando-
se os valores razoavelmente repartidos.
ExercĂcio 3
Considere o exemplo abaixo referente ao peso e altura de 10 indivĂduos.
a) Represente o diagrama de dispersĂŁo.
b) Analise a correlação existente entre peso e altura.
c) Ajuste, pelo MĂ©todo dos MĂnimos Quadrados, uma função linear que
exprima as peso em função da altura.
Curva de Lorenz
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
28. Manual de ExercĂcios
EstatĂstica Aplicada 27
IndivĂduo Peso (kg) Altura (cm)
A 72 175
B 65 170
C 80 185
D 57 154
E 60 165
F 77 175
G 83 182
H 79 178
I 67 175
J 68 173
Resolução
a)
b) No exemplo, r = 0,90681871, isto é, existe uma correlação positiva forte
entre as duas variĂĄveis, quase perfeita.
c)
Diagrama de DispersĂŁo
150
160
170
180
190
50 60 70 80 90
Peso (kg)
Altura
(cm)
Recta de RegressĂŁo
y = 0,9016x + 109,36
150
160
170
180
190
50 60 70 80 90
Peso (kg)
Altura
(cm)
29. Manual de ExercĂcios
EstatĂstica Aplicada 28
A equação desta recta traduz-se em
Altura = 109,36 + 0,9016 x Peso
Isto Ă©, se um indivĂduo pesar 70 kg, a altura esperada serĂĄ de 109,36 + 0,9016
x 70 = 172,472.
Por cada kg de peso adicional, espera-se que a altura do indivĂduo aumente
0,9016 cm.
ExercĂcio 4
O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas
em milhares de u.m.) de uma empresa no perĂodo de 7 anos:
Ano Vendas Desp. Publicidade
1 10 3
2 13 3
3 18 5
4 19 6
5 25 8
6 30 9
7 35 13
a) Compare as vendas e as despesas em publicidade quanto Ă dispersĂŁo.
b) Analise a correlação existente entre volume e custo de produção.
c) Ajuste, pelo MĂ©todo dos MĂnimos Quadrados, uma função linear que
exprima as vendas em função das despesas em publicidade.
Resolução
a) Para comparar a dispersão das duas distribuiçÔes, é necessårio calcular os
coeficientes de variação (medidas de dispersão relativa):
Dados nĂŁo-classificados
429
,
21
1
1
=
=
=
n
i
i
x
n
x 714
,
6
1
1
=
=
=
n
i
i
y
n
y
( ) 9408
,
69
1
2
1
2
=
â
=
=
n
i
x x
xi
n
s ( ) 0651
,
11
1
2
1
2
=
â
=
=
n
i
y y
yi
n
s
39
,
0
429
,
21
9408
,
69
=
=
=
x
s
CV x
x < 495
,
0
714
,
6
0651
,
11
=
=
=
y
s
CV
y
y
A dispersĂŁo das despesas em publicidade Ă© superior Ă dispersĂŁo das vendas.
30. Manual de ExercĂcios
EstatĂstica Aplicada 29
b)
( )( ) ( )( )
[ ]
98
,
0
0651
,
11
9408
,
69
714
,
6
13
429
,
21
35
...
714
,
6
3
429
,
21
10
7
1
=
â
â
+
+
â
â
=
=
x
s
s
s
r
yy
xx
xy
Existe uma correlação positiva linear forte entre as duas variåveis. Em média,
quando as despesas em publicidade aumentam (diminuem), as vendas
aumentam (diminuem) de forma quase exactamente proporcional.
c)
ExercĂcio 5
Considere que 10 estudantes foram sujeitos a uma prova de avaliação no inĂcio
e no final do curso. No quadro abaixo, encontram-se as ordenaçÔes desses 10
estudantes segundo as classificaçÔes obtidas em cada uma das provas:
Aluno
Prova inicial
Ri
x
Prova final
Ri
y
di
Ri
x
- Ri
y
A 1 1 0
B 3 2 1
C 2 3 -1
D 5 4 1
E 7 6 1
F 8 8 0
G 9 7 2
H 10 9 1
I 6 10 -4
J 4 5 -1
Recta de RegressĂŁo
y = 2,4649x + 4,8782
0
10
20
30
3 8 13
Desp. Public.
Vendas
31. Manual de ExercĂcios
EstatĂstica Aplicada 30
Resolução
Como não dispomos das classificaçÔes dos alunos, mas sim das ordenaçÔes
das classificaçÔes (do 1Âș ao 10Âș classificado), para avaliar a correlação
existente entre as 2 provas calcula-se o coeficiente de correlação ordinal:
8424
,
0
)
1
100
(
10
)
1
16
1
4
0
1
1
1
1
0
(
6
1
)
1
(
6
1 2
1
2
=
â
+
+
+
+
+
+
+
+
+
â
=
â
â
= =
x
x
n
n
d
r
n
i
i
s
A correlação Ă© positiva e elevada (rs varia entre â1 e 1), isto Ă©, os alunos que
tiveram boa nota na prova inicial tiveram, em média, igualmente boa nota na
prova final.
ExercĂcio 6
O quadro que se segue descreve a distribuição do rendimento anual (em
milhares de u.m.) de 2500 famĂlias da população de um paĂs:
Rendimento anual NÂșde famĂlias
[0, 1[ 250
[1, 2[ 375
[2, 5[ 625
[5, 15[ 750
[15, 25[ 375
[25, 50[ 125
a) Represente as frequĂȘncias acumuladas graficamente.
b) Determine o rendimento médio e mediano.
c) Determine os trĂȘs primeiros quartis. Que indicaçÔes lhe dĂŁo sobre a
(as)simetria?
d) O que pode concluir quanto Ă dispersĂŁo?
e) Calcule o Ăndice de Gini. O que conclui sobre a concentração do
rendimento?
Resolução
a)
Rendimento anual NÂșde famĂlias % de famĂlias Fi (%) ci
[0, 1[ 250 10 10 0.5
[1, 2[ 375 15 25 1.5
[2, 5[ 625 25 50 3.5
[5, 15[ 750 30 80 10
[15, 25[ 375 15 95 20
[25, 50[ 125 5 1 37.5
32. Manual de ExercĂcios
EstatĂstica Aplicada 31
b) 025
,
9
%)
5
5
.
37
(
...
%)
15
5
.
1
(
%)
10
5
,
0
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
Em mĂ©dia, o rendimento anual de uma famĂlia Ă© de 9025 unidades monetĂĄrias.
Classe mediana (classe a que corresponde uma frequĂȘncia acumulada 0,5): [2; 5[
5 : Fi = 0,5. Logo, a mediana Ă© 5 (50% das famĂlias tĂȘm rendimentos anuais atĂ©
5000 unidades monetĂĄrias).
c) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia
acumulada 0,25): [1; 2[
3 : Fi = 0,25
25% das famĂlias apresentam rendimentos anuais inferiores a 2000 u.m.
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [5; 15[
5 : Fi=0,5
15 : Fi = 0,8
CĂĄlculo do Q3:
0,8 - 0,5 ------------ 15 - 5
0,75 â 0,5 -------------- Q3 â 5
Q3 = 5 + ((10x0,25)/0,3) = 13,333(3)
75% das famĂlias apresentam rendimentos anuais inferiores a 13333 u.m.
0
0,2
0,4
0,6
0,8
1
0 10 20 30 40 50 60 70 80 90 100
33. Manual de ExercĂcios
EstatĂstica Aplicada 32
0
47
,
0
2
333
,
13
)
2
5
(
)
5
333
,
13
(
1
3
)
1
2
(
)
2
3
(
' >
=
â
â
â
â
=
â
â
â
â
=
Q
Q
Q
Q
Q
Q
g
A distribuição é assimétrica positiva ou enviesada à esquerda.
d) ( ) 286875
,
82
*
2
1
2
2
1
2
=
â
=
â
=
=
=
x
fici
x
ci
fi
s
n
i
n
i
x
071
,
9
286875
,
82
2
=
=
= x
x s
s
e)
Rendimento anual ni ci Rend. total pi (=Fi) qi
[0, 1[ 250 0.5 125 0,1 0.00554
[1, 2[ 375 1.5 562,5 0,25 0.0305
[2, 5[ 625 3.5 2187,5 0,5 0.1274
[5, 15[ 750 10 7500 0,8 0.46
[15, 25[ 375 20 7500 0,95 0.7922
[25, 50[ 125 37.5 4687.5 1 1
Total 2500 22562,5
4555
,
0
6
,
2
18436
,
1
)
(
1
1
1
1
=
=
â
= â
=
â
=
n
i
n
i
pi
qi
pi
G Concentração moderada do rendimento
ExercĂcio 7
Considere a seguinte tabela que representa a distribuição dos empregados de
uma instituição bancåria segundo a remuneração bruta mensal (em milhares de
unidades monetĂĄrias):
Remuneração
FrequĂȘncia. Relativa
(%)
[60; 80[ 7.8
[80; 100[ 15.2
[100; 120[ 31.2
[120; 140[ 19.5
[140; 160[ 7.2
[160; 200[ 8.1
[200; 250[ 5.4
[250, 300[ 2.6
[300; 350] 3.0
Total 100
34. Manual de ExercĂcios
EstatĂstica Aplicada 33
a) Calcule os quartis da distribuição.
b) Analise a dispersão da distribuição em causa.
c) Analise a assimetria da distribuição em causa.
Resolução
a)
Remuneração FrequĂȘncia. Relativa (%)
Fi
(%)
[60; 80[ 7.8 7.8
[80; 100[ 15.2 23
[100; 120[ 31.2 54.2
[120; 140[ 19.5 73.7
[140; 160[ 7.2 80.9
[160; 200[ 8.1 89
[200; 250[ 5.4 94.4
[250, 300[ 2.6 97
[300; 350] 3.0 100
Total 100
Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia acumulada
0,25): [100; 120[
1 : Fi=0,23
3 : Fi = 0,542
CĂĄlculo do Q1:
0,542 - 0,23 ------------ 120 - 100
0,25 - 0,23 -------------- Q1 - 100
Q1 = 100 + ((20x0,02)/0,312) = 101,28
25% dos empregados auferem remuneraçÔes inferiores a 101,28 milhares u.m.
Classe a que pertence Q2 (classe a que corresponde uma frequĂȘncia acumulada
0,5): [100; 120[
100 : Fi=0,23
120 : Fi = 0,542
CĂĄlculo do Q2:
0,542 - 0,23 ------------ 120 - 100
0,5 - 0,23 -------------- Q2 - 100
Q2 = 100 + ((20x0,27)/0,312) = 117,3
50% dos empregados auferem remuneraçÔes inferiores a 117,3 milhares u.m.
35. Manual de ExercĂcios
EstatĂstica Aplicada 34
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [140; 160[
120 : Fi=0,737
140 : Fi = 0,809
CĂĄlculo do Q3:
0,809 - 0,737 ------------ 160 - 140
0,75 â 0,737 -------------- Q3 - 140
Q3 = 140 + ((20x0,013)/0,072) = 143,61(1)
75% dos empregados auferem remuneraçÔes inferiores a 143,61(1) milhares u.m.
b) Amplitude do intervalo inter-quartis = Q3 - Q1 = 143,61(1) - 101,28 = 42,33
(dispersĂŁo reduzida em torno da mediana)
c) 0
243
,
0
28
,
101
61
,
143
)
28
,
101
3
,
117
(
)
3
,
117
61
,
143
(
1
3
)
1
2
(
)
2
3
(
' >
=
â
â
â
â
=
â
â
â
â
=
Q
Q
Q
Q
Q
Q
g
A distribuição é assimétrica positiva ou enviesada à esquerda.
ExercĂcio 8
Os dados seguintes referem-se ao peso, expresso em gramas, do conteĂșdo de
uma sĂ©rie de 100 garrafas que, no decurso de um teste, saĂram de uma linha
de enchimento automĂĄtico:
Peso (em gramas)
FrequĂȘncia. Relativa
(%)
[297; 298[ 8
[298; 299[ 21
[299; 300[ 28
[300; 301[ 15
[301; 302[ 11
[302; 303[ 10
[303; 304[ 5
[304; 305[ 1
[305; 306] 1
Total 100
a) Represente graficamente os dados acima.
b) Calcule as frequĂȘncias acumuladas e represente-as graficamente.
36. Manual de ExercĂcios
EstatĂstica Aplicada 35
c) Determine o peso médio, mediano e modal. Qual o seu significado?
d) Determine os quartis da distribuição.
e) Analise a dispersĂŁo do peso das garrafas.
Resolução
a)
b)
Peso (em gramas) FrequĂȘncia Relativa (%) Fi (%)
[297; 298[ 8 8
[298; 299[ 21 29
[299; 300[ 28 57
[300; 301[ 15 72
[301; 302[ 11 83
[302; 303[ 10 93
[303; 304[ 5 98
[304; 305[ 1 99
[305; 306] 1 100
Total 100
c)
11
,
300
%)
1
5
,
305
(
...
%)
21
5
,
298
(
%)
8
5
,
297
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
O peso médio das garrafas é de 300,11 kg.
0
0,05
0,1
0,15
0,2
0,25
0,3
296 297 298 299 300 301 302 303 304 305 306 307
Histograma
0
0,2
0,4
0,6
0,8
1
295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310
F*
37. Manual de ExercĂcios
EstatĂstica Aplicada 36
Classe mediana (classe a que corresponde uma frequĂȘncia acumulada 0,5): [299;
300[
299 : Fi = 0,29
300 : Fi = 0,57
CĂĄlculo do Q2:
0,57 - 0,29 ------------ 300 - 299
0,5 - 0,29 -------------- Q2 - 299
Q2 = 299 + ((1x0,21)/0,28) = 299,75
50% das garrafas tĂȘm peso inferior a 299,75 kg.
A classe modal Ă© aquela a que corresponde maior frequĂȘncia relativa. Neste
caso, o maior valor de fi Ă© 0,28 correspondente Ă classe [299; 300[, isto Ă©, os
pesos mais provĂĄveis das garrafas situam-se entre 299 kg e 300 kg.
d) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia
acumulada 0,25): [298; 299[
298 : Fi=0,08
299 : Fi = 0,29
CĂĄlculo do Q1:
0,29 - 0,08 ------------ 298 - 299
0,25 - 0,08 ------------ Q1 - 299
Q1 = 299 + ((1x0,17)/0,21) = 299,0357
25% das garrafas tĂȘm peso inferior a 299,0357 kg.
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [301; 302[
301 : Fi=0,72
302 : Fi = 0,83
CĂĄlculo do Q3:
0,83 - 0,72 ------------ 302 - 301
0,75 â 0,72 -------------- Q3 - 301
Q3 = 301 + ((1x0,03)/0,11) = 301,27(27)
75% das garrafas tĂȘm peso inferior a 301,27(27) kg.
38. Manual de ExercĂcios
EstatĂstica Aplicada 37
e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 301,27(27) - 299,0357 = 2,237
(dispersĂŁo reduzida em torno da mediana)
ExercĂcio 8
Numa faculdade, mediram-se as alturas de 100 alunos do primeiro ano:
Altura (em metros) NÂșAlunos
[1,4; 1,5[ 2
[1,5; 1,55[ 10
[1,55; 1,6[ 25
[1,6; 1,65[ 13
[1,65; 1,7[ 17
[1,7; 1,75[ 20
[1,75; 1,8[ 10
[1,8; 1,9] 3
Total 100
a) Represente graficamente os dados acima.
b) Determine a altura média e a altura modal. Qual o seu significado?
c) Calcule as frequĂȘncias acumuladas e represente-as graficamente.
d) Determine os quartis da distribuição e diga qual o seu significado.
e) Analise a dispersão da distribuição.
f) Analise a (as)simetria da distribuição.
Resolução
a)
Altura (em metros) ni fi ci hi fi/hi Fi
[1,4; 1,5[ 2 0,02 1,45 0,1 0,2 0,02
[1,5; 1,55[ 10 0,1 1,525 0,05 2 0,12
[1,55; 1,6[ 25 0,25 1,575 0,05 5 0,37
[1,6; 1,65[ 13 0,13 1,625 0,05 2,6 0,5
[1,65; 1,7[ 17 0,17 1,675 0,05 3,4 0,67
[1,7; 1,75[ 20 0,2 1,725 0,05 4 0,87
[1,75; 1,8[ 10 0,1 1,775 0,05 2 0,97
[1,8; 1,9] 3 0,03 1,85 0,1 0,3 1
Total 100 1
0
1
2
3
4
5
6
1,4 1,5 1,6 1,7 1,8 1,9
Histograma
fi/hi
39. Manual de ExercĂcios
EstatĂstica Aplicada 38
b) 65
,
1
%)
3
85
,
1
(
...
%)
10
525
,
1
(
%)
2
45
,
1
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
A altura média dos alunos é de 1,65 m.
A classe modal Ă© aquela a que corresponde maior frequĂȘncia por unidade de
amplitude. Neste caso, o maior valor de fi / hi Ă© 5. correspondente Ă classe
[1,55; 1,6[, isto Ă©, a altura mais provĂĄvel de um aluno rondarĂĄ 1,55m / 1,6m.
c)
d) Classe a que pertence Q1 (classe a que corresponde uma frequĂȘncia
acumulada 0,25): [1,55; 1,6[
1,55 : Fi=0,12
1,6 : Fi = 0,37
CĂĄlculo do Q1:
0,37 â 0,12 ------------ 1,6 â 1,55
0,25 â 0,12 ------------ Q1 â 1,55
Q1 = 1,55 + ((0,05x0,13)/0,25) = 1,576
25% dos alunos tĂȘm altura inferior a 1,576 m.
Classe a que pertence Q2 (classe a que corresponde uma frequĂȘncia
acumulada 0,5): [1,6; 1,65[
1,65 : Fi = 0,5
50% dos alunos tĂȘm altura inferior a 1,65 m.
Classe a que pertence Q3 (classe a que corresponde uma frequĂȘncia
acumulada 0,75): [1,7; 1,75[
1,7 : Fi=0,67
1,75 : Fi = 0,87
0
0,2
0,4
0,6
0,8
1
1,3 1,4 1,5 1,6 1,7 1,8 1,9 2
F*
40. Manual de ExercĂcios
EstatĂstica Aplicada 39
CĂĄlculo do Q3:
0,87- 0,67------------ 1,75 â 1,7
0,75 â 0,67-------------- Q3 â 1,7
Q3 = 1,7 + ((0,05*0,08)/0,2) = 1,72
75% dos alunos tĂȘm altura inferior a 1,72 m.
e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 1,72 â 1,576 = 0,144
(dispersĂŁo reduzida em torno da mediana)
( ) 00536875
,
0
*
2
1
2
2
1
2
=
â
=
â
=
=
=
x
fici
x
ci
fi
s
n
i
n
i
x
07327
,
0
00536875
,
0
2
=
=
= x
x s
s
(dispersão reduzida em torno da média)
f) 0
)
7
(
027
,
0
576
,
1
72
,
1
)
576
,
1
65
,
1
(
)
65
,
1
72
,
1
(
1
3
)
1
2
(
)
2
3
(
' <
â
=
â
â
â
â
=
â
â
â
â
=
Q
Q
Q
Q
Q
Q
g
A distribuição é ligeiramente assimétrica negativa ou enviesada à direita
(quase simétrica).
ExercĂcio 9
Em determinada central telefónica, registou-se a duração das chamadas
realizadas em Dezembro de 2001:
Duração (em minutos) NÂșChamadas
[0; 5[ 2000
[5; 10[ 1500
[10; 20[ 1000
[20; 30[ 300
[30; 50] 200
Total 5000
a) Represente graficamente as frequĂȘncias simples e acumuladas.
b) Determine a duração média das chamadas e respectivo desvio-padrão.
c) Qual a duração da chamada mediana? Qual o significado do valor
encontrado?
41. Manual de ExercĂcios
EstatĂstica Aplicada 40
d) Sabe-se que as chamadas realizadas durante o ano de 2001
apresentaram uma duração média de 10 minutos, com desvio-padrão de
8,7 minutos. Compare, quanto Ă dispersĂŁo, as chamadas efectuadas em
Dezembro com as que tiveram lugar durante todo o ano de 2001.
Resolução
a)
Duração (em minutos) ni fi hi fi/hi Fi ci
[0; 5[ 2000 0,4 5 0,08 0,4 2,5
[5; 10[ 1500 0,3 5 0,06 0,7 7,5
[10; 20[ 1000 0,2 10 0,02 0,9 15
[20; 30[ 300 0,06 10 0,006 0,96 25
[30; 50] 200 0,04 20 0,002 1 40
Total 5000 1
b) 35
,
9
%)
4
40
(
...
%)
30
5
,
7
(
%)
40
5
,
2
(
1
1
1
=
+
+
+
=
=
=
=
=
x
x
x
c
f
c
n
n
x
n
i
i
i
i
n
i
i
A duração média de uma chamada é de 9,35 minutos.
( ) 4525
,
81
*
2
1
2
2
1
2
=
â
=
â
=
=
=
x
fici
x
ci
fi
s
n
i
n
i
x
025
,
9
00536875
,
0
2
=
=
= x
x s
s
c) Classe mediana (classe a que corresponde frequĂȘncia acumulada 0,5): [5; 10[
0
0,02
0,04
0,06
0,08
0,1
0 10 20 30 40 50 60
Histograma
fi/hi
0
0,2
0,4
0,6
0,8
1
0 10 20 30 40 50 60 70 80 90 100
F*
42. Manual de ExercĂcios
EstatĂstica Aplicada 41
5 : Fi = 0,4
10 : Fi = 0,7
CĂĄlculo da Me:
0,7 - 0,4 ------------ 10 - 5
0,5 - 0,4 ------------ Me - 5
Me = 5 + ((5x0,1)/0,3) = 6,67
50% das chamadas tĂȘm duração a 6,67 minutos.
d) 965
,
0
35
,
9
025
,
9
=
=
=
x
s
CV x
Dez > 87
,
0
10
7
,
8
2001 =
=
=
y
s
CV
y
ExercĂcio 10
Uma empresa coligiu dados relativos à produção de 12 lotes de um tipo especial
de rolamento. O volume de produção e o custo de produção de cada lote
apresentam-se na tabela:
Lote Volume (unidades) Custo (contos)
1 1500 3100
2 800 1900
3 2600 4200
4 1000 2300
5 600 1200
6 2800 4900
7 1200 2800
8 900 2100
9 400 1400
10 1300 2400
11 1200 2400
12 2000 3800
a) Analise a correlação existente entre volume e custo de produção.
b) Ajuste, pelo MĂ©todo dos MĂnimos Quadrados, uma função linear que
exprima o custo em função do volume de produção.
Resolução
a)
( )( ) ( )( )
[ ]
98
,
0
1145944
520854
3
,
2708
3800
3
,
1358
2000
...
3
,
2708
3100
3
,
1358
1500
12
1
=
â
â
+
+
â
â
=
=
x
s
s
s
r
yy
xx
xy
Correlação positiva quase perfeita.
43. Manual de ExercĂcios
EstatĂstica Aplicada 42
b)
ExercĂcio 11
Um conjunto de empresas do sector da Construção e Obras PĂșblicas cotadas
na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores:
EPS (Earnings per Share): Resultado LĂquido por Acção
PBV (Price/Book Value): Preço / Situação LĂquida por Acção
Empresa EPS ($) PBV ($)
1 191 0.9
2 32 1.0
3 104 0.8
4 117 0.8
5 210 1.5
6 95 0.7
7 65 0.9
8 201 1.3
9 81 0.4
a) Analise a correlação existente entre aqueles dois indicadores.
b) Ajuste, pelo MĂ©todo dos MĂnimos Quadrados, uma função linear que
exprima a variåvel EPS em função de PBV.
Resolução
a)
( )( ) ( )( )
[ ]
61
,
0
096933
,
0
332
,
3669
92
,
0
4
,
0
7
,
121
81
...
92
,
0
9
,
0
7
,
121
191
9
1
=
â
â
+
+
â
â
=
=
x
s
s
s
r
yy
xx
xy
Correlação positiva moderada.
y = 1,4553x + 731,6
0
1000
2000
3000
4000
5000
6000
0 500 1000 1500 2000 2500 3000
Volume
Custo
44. Manual de ExercĂcios
EstatĂstica Aplicada 43
b)
ExercĂcio 12
Recolheu-se uma amostra em 17 cidades do paĂs relativamente aos seguintes
indicadores:
Ri: Rendimento médio mensal na cidade i (em 106
unidades monetĂĄrias)
Gi: Gasto médio mensal em bens de luxo na cidade i (em 106
u.m.)
Ri Gi Ri Gi
125 54 144 61
127 56 147 62
130 57 150 62
131 57 152 63
133 58 154 63
135 58 160 64
140 59 162 65
143 59 165 66
169 66
Dados adicionais
= 2467
i
R =1030
i
G = 361073
2
i
R
= 62620
2
i
G = 150270
i
iG
R
a) Estude a correlação entre rendimento e despesas em bens de luxo.
b) Ajuste, pelo MĂ©todo dos MĂnimos Quadrados, uma função linear que
exprima a variåvel Gi em função de Ri.
y = 124,04x + 7,383
0
50
100
150
200
250
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6
PBV
EPS
45. Manual de ExercĂcios
EstatĂstica Aplicada 44
Resolução
a)
986
,
0
)
17
1030
*
17
62620
)(
17
2467
*
17
361073
(
17
1030
*
17
2467
*
17
150270
)
)(
(
2
2
2
2
2
2
2
2
=
â
â
â
=
â
â
â
=
G
n
G
R
n
R
G
R
n
G
R
r
i
i
i
i
XY
Correlação positiva forte.
b)
y = 0,2604x + 22,801
50
52
54
56
58
60
62
64
66
68
100 120 140 160 180 200
Rendimento
Gasto
47. Manual de ExercĂcios
EstatĂstica Aplicada 45
3.ESTATĂSTICA INDUTIVA
A estatĂstica indutiva Ă© o ramo da estatĂstica que se ocupa em inferir das
conclusÔes retiradas sobre a amostra para a população. Claro que o processo
de indução implica um certo grau de incerteza associado à tentativa de
generalização de conclusĂ”es da âparteâ (amostra) para o âtodoâ (universo). O
conceito de probabilidade vai ter aqui, entĂŁo, um papel fundamental. Isto Ă©, nĂŁo
vai ser possĂvel afirmar com toda a certeza que o comportamento da amostra
ilustra perfeitamente o comportamento do universo, mas apenas que o faz com
forte probabilidade.
De seguida, serão apresentadas algumas noçÔes simples de probabilidades e
funçÔes de probabilidade, que serĂŁo Ășteis a aplicaçÔes de estatĂstica indutiva
relacionadas com controlo estatĂstico de qualidade e fiabilidade de
componentes e sistemas.
3.1. NoçÔes båsicas de probabilidade
A teoria das probabilidades Ă© um ramo da matemĂĄtica extremamente Ăștil para o
estudo e a investigação das regularidades dos chamados fenómenos
aleatĂłrios. O exemplo seguinte pretende clarificar o que vulgarmente Ă©
designado por experiĂȘncia aleatĂłria.
Deve entender-se como experiĂȘncia qualquer processo ou conjunto de
circunstĂąncias capaz de produzir resultados observĂĄveis; quando uma
experiĂȘncia estĂĄ sujeita Ă influĂȘncia de factores casuais e conduz a resultados
incertos, diz-se que a experiĂȘncia Ă© aleatĂłria.
Fundamentalmente, as experiĂȘncias aleatĂłrias caracterizam-se por:
48. Manual de ExercĂcios
EstatĂstica Aplicada 46
(i) poder repetir-se um grande nĂșmero de vezes nas mesmas condiçÔes
ou em condiçÔes muito semelhantes
(ii) cada vez que a experiĂȘncia se realiza, obtĂ©m-se um resultado
individual, mas nĂŁo Ă© possĂvel prever exactamente esse resultado
(iii) os resultados das experiĂȘncias individuais mostram-se irregulares,
mas os resultados obtidos apĂłs uma longa repetição da experiĂȘncia
patenteiam uma grande regularidade estatĂstica no seu conjunto
Alguns autores consideram inserido no conceito de experiĂȘncia aleatĂłria um
outro, o de espaço de resultados. O espaço de resultados corresponde ao
conjunto formado por todos os resultados possĂveis de uma experiĂȘncia
aleatória. Por exemplo, num lançamento de um dado ordinårio tem-se que o
espaço de resultados é }
{ 6
,
5
,
4
,
3
,
2
,
1 .
A importùncia da definição deste conceito advém sobretudo por ser o meio
empregue para a definição de acontecimentos, que não sei mais que
subconjuntos do espaço de resultados. Por exemplo, no lançamento de um
dado podem definir-se, para além dos 6 acontecimentos elementares
correspondentes Ă saĂda de cada uma das faces, outros como âsaĂda de um
nĂșmero Ămparâ definido pelo subconjunto }
{ 5
,
3
,
1 .
Definidos como conjuntos, aos acontecimentos é aplicåvel toda a construção
disponĂvel para aqueles, isto Ă©, existe um paralelismo perfeito entre ĂĄlgebra de
conjuntos e ĂĄlgebra de acontecimentos:
(i) O acontecimento que contem todos os elementos do espaço de
resultados chama-se acontecimento certo
(ii) O acontecimento que não contem qualquer elemento do espaço de
resultados chama-se acontecimento impossĂvel
(iii) Dois acontecimentos sĂŁo mutuamente exclusivos se nĂŁo tĂȘm em
comum qualquer acontecimento do espaço de resultados
(iv) A uniĂŁo de dois acontecimentos A e B representa-se por A âȘ B e Ă©
formado pelos elementos que pertencem a pelo menos um dos dois,
A ou B
(v) A intersecção de dois acontecimentos A e B representa-se por A ⩠B e
Ă© formado pelos elementos comuns a A e B
49. Manual de ExercĂcios
EstatĂstica Aplicada 47
Probabilidade de um acontecimento Ă© expressa na escala de 0 a 1, sendo 0 a
probabilidade associada a um acontecimento impossĂvel e 1 a probabilidade
associada a um acontecimento certo. A primeira definição foi proposta por
Laplace em 1812. Pode definir-se probabilidade de um acontecimento A
como sendo:
NĂșmero de casos favorĂĄveis ao acontecimento A
P(A) =
NĂșmero total de casos possĂveis na exp. aleatĂłria
Uma das principais crĂticas a esta definição Ă© a de que ela sĂł Ă© aplicĂĄvel
quando o espaço de resultados é finito e os seus elementos possuem igual
probabilidade; daĂ que ela surja muito ligada aos âjogos de azarâ, que possuem
essas propriedades. Ă o que acontece com as duas faces de uma moeda, as
52 cartas de um baralho, as 6 faces de um dado, etc.
Para se analisar a probabilidade de ocorrĂȘncia de determinados
acontecimentos, deve ter-se em atenção o seguinte:
â Dois acontecimentos sĂŁo ditos mutuamente exclusivos se nĂŁo puderem
acontecer ao mesmo tempo; se dois acontecimentos forem mutuamente
exclusivos, entĂŁo:
P(A â© B) = 0
â A probabilidade de uniĂŁo de dois acontecimentos mutuamente
exclusivos Ă© dada por
P (A âȘ B) = P(A) + P(B)
â Para dois acontecimentos quaisquer, vem que
P (A âȘ B) = P(A) + P(B) - P(A â© B)
â Dois acontecimentos dizem-se complementares se:
P(A) = 1 â P( A )
â Dois acontecimentos sĂŁo ditos independentes se a ocorrĂȘncia de um
nĂŁo afectar a probabilidade de ocorrĂȘncia de outro; a probabilidade de
ocorrĂȘncia de dois ou mais acontecimentos independentes Ă© o produto
das probabilidades dos respectivos acontecimentos, isto Ă©:
P(A â© B) = P(A) x P(B)
50. Manual de ExercĂcios
EstatĂstica Aplicada 48
Após a apresentação desta definição, convém ainda referir que, numa outra
perspectiva, a da chamada teoria frequencista, a probabilidade de um
acontecimento Ă© definida como sendo o valor para o qual tende a frequĂȘncia
relativa do acontecimento quando o nĂșmero de repetiçÔes da experiĂȘncia
aumenta.
3.2. Probabilidade condicionada
Exemplo:
Um grupo de pessoas Ă© classificado de acordo com o seu peso e a incidĂȘncia
de hipertensão. São as seguintes as proporçÔes das vårias categorias:
Obeso Normal Magro Total
Hipertenso 0,1 0,08 0,02 0,2
NĂŁo Hipertenso 0,15 0,45 0,2 0,8
Total 0,25 0,53 0,22 1,00
a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa?
b) Qual a probabilidade de uma pessoa obesa ser hipertensa?
Resolução
a) Basta ver que a proporção de hipertensos é de 20%
b) Hå que tomar em atenção que o que se pretende é a proporção de
hipertensos na população de obesos, isto é 4
,
0
25
,
0
1
,
0
= . Por outras palavras,
pretende-se calcular a probabilidade do acontecimento âser hipertensoâ,
sabendo que ocorreu o acontecimento âser obesoâ. Repare-se que este
quociente resulta da divisĂŁo entre a probabilidade de uma pessoa ser
hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Pode
escrever-se que a probabilidade pretendida Ă© dada por:
)
(
)
(
)
/
(
O
P
O
H
P
O
H
P
â©
=
onde P(H/O) Ă© a probabilidade de ocorrer o acontecimento âser hipertensoâ,
sabendo que ocorreu ou condicionado pelo acontecimento âser obesoâ.
Este exemplo corresponde ao cĂĄlculo de uma probabilidade condicionada.
51. Manual de ExercĂcios
EstatĂstica Aplicada 49
Como se viu anteriormente, dois acontecimentos sĂŁo ditos independentes se a
ocorrĂȘncia de um nĂŁo afectar a probabilidade de ocorrĂȘncia de outro, isto Ă©, se:
P(A / B) = P(A) e se P(B / A) = P(B).
Teorema de Bayes
Seja B um acontecimento que se realiza se e sĂł se um dos acontecimentos
mutuamente exclusivos A1, A2,âŠAn se verifica. Aos acontecimentos A1, A2,âŠAn
dĂĄ-se o nome de acontecimentos antecedentes. O teorema de Bayes permite
calcular a probabilidade à posteriori de A1, A2,⊠An, isto é, a probabilidade de
ocorrĂȘncia de A1, A2,⊠An calculadas sob a hipĂłtese de que B (acontecimento
consequente) se realizou. De acordo com este teorema:
=
= n
i
i
i
i
i
i
A
B
P
A
P
A
B
P
A
P
B
A
P
1
)
/
(
).
(
)
/
(
).
(
)
/
(
Este Teorema utiliza-se em situaçÔes em que a relação causal estå invertida.
=
n
i
i
i A
B
P
A
P
1
)
/
(
).
( designa-se de probabilidade total de ocorrĂȘncia do
acontecimento B, isto Ă©, Ă© a probabilidade de ocorrĂȘncia do acontecimento
consequente B face a todos os possĂveis acontecimentos A1, A2,⊠An que o
podem ter antecedido (ou causado a sua ocorrĂȘncia).
3.3. FunçÔes de probabilidade
A probabilidade associada aos acontecimentos possĂveis numa experiĂȘncia
aleatĂłria obedecem, por vezes, a um padrĂŁo. Se associarmos a uma
experiĂȘncia aleatĂłria uma variĂĄvel X (por exemplo, associar aos resultados da
experiĂȘncia lançamento de um dado - que sĂŁo 6 (saĂda de face 1 a 6) â a
variĂĄvel X:âNÂș da face resultante do lançamento de um dadoâ), entĂŁo pode ser
constituĂda uma lei ou função de probabilidade (f(x)) dessa variĂĄvel X, tal que
f(x) = P(X=xi)
52. Manual de ExercĂcios
EstatĂstica Aplicada 50
Por exemplo, para X: nÂș da face resultante do lançamento de um dado, vem
que:
xi 1 2 3 4 5 6
f(xi) 1/6 1/6 1/6 1/6 1/6 1/6
que se designa por lei uniforme.
Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior
nĂșmero de fenĂłmenos estatĂsticos do que outras. Entre estas, contam-se a lei
Binomial, a lei de Poisson e a lei Exponencial.
(i) Lei Binomial
HĂĄ alguns acontecimentos que sĂŁo constituĂdos por um conjunto de
experiĂȘncias independentes, cada uma das quais com apenas dois estados
possĂveis de ocorrĂȘncia e com uma probabilidade fixa de ocorrĂȘncia para cada
um deles. Por exemplo, os produtos resultantes de uma fĂĄbrica podem ser
classificados como sendo defeituosos ou sendo nĂŁo defeituosos, e o facto de
um ter saĂdo (ou nĂŁo) defeituoso nĂŁo influencia os outros serem (ou nĂŁo). A
distribuição das duas classes possĂveis Ă© discreta e do tipo binomial.
No exemplo anterior, consideremos uma amostra de n artigos retirados da
produção total, em relação aos quais se pretende identificar a variĂĄvel X: âNÂșde
artigos defeituosos nos n que constituem a amostraâ. A probabilidade de
ocorrĂȘncia do acontecimento âartigo Ă© defeituosoâ Ă© dada por p: incidĂȘncia de
defeituosos na produção (convenientemente calculada através de métodos de
estimação). A probabilidade do acontecimento complementar âartigo Ă© nĂŁo-
defeituosoâ Ă© dada por
1 â p = q
A probabilidade associada a x artigos defeituosos Ă© dada por px
(p x p x p x
p...x vezes). Se hĂĄ x defeituosos, restam n-x artigos nĂŁo-defeituosos, com
probabilidade dada por qn-x
. Para calcular o nĂșmero exacto de combinaçÔes de
x artigos defeituosos com n-x artigos nĂŁo-defeituosos, utiliza-se a figura
âcombinaçÔes de n, x a x, oriunda das tĂ©cnicas de cĂĄlculo combinatĂłrio. Vem
53. Manual de ExercĂcios
EstatĂstica Aplicada 51
entĂŁo que a probabilidade de existĂȘncia de x defeituosos (e logo n-x nĂŁo
defeituosos) Ă© igual a:
x
n
x
x
n
x
n
x q
p
p
p
n
n
q
p
C
x
f â
â
â
=
=
!
)!
(
!
)
(
sendo que X segue Bi (n;p), sendo n e p os parĂąmetros caracterizadores da lei.
Um acontecimento deve ter 4 caracterĂsticas para que se possa associar a uma
lei binomial:
- nĂșmero fixo de experiĂȘncias (n)
- cada experiĂȘncia ter apenas duas classes de resultados possĂveis
- todas as experiĂȘncias terem igual probabilidade de ocorrĂȘncia (p)
- as experiĂȘncias serem independentes
Em sistemas elĂ©ctricos de energia Ă© possĂvel, por exemplo, aplicar a
distribuição binomial quando se pretende calcular a fiabilidade de uma central
eléctrica, com vårias unidades iguais e admitindo que cada unidade apenas
pode residir em dois estados, a funcionar ou avariada.
(ii) Lei de Poisson
A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) dĂĄ a
probabilidade de um acontecimento ocorrer um dado nĂșmero de vezes num
intervalo de tempo ou espaço fixado, quando a taxa de ocorrĂȘncia Ă© fixa (por
exemplo, nÂșde chamadas que chegam a uma central telefĂłnica por minuto; nÂș
de varias que ocorrem numa mĂĄquina por dia). Os nĂșmeros de acontecimentos
de âsucessoâ ocorridos em diferentes intervalos sĂŁo independentes. O
parùmetro caracterizador da distribuição de Poisson é λ, que corresponde ao
nĂșmero mĂ©dio de ocorrĂȘncias por unidade de tempo ou espaço.
Como o nĂșmero mĂ©dio de ocorrĂȘncias do acontecimento Ă© proporcional Ă
amplitude do intervalo de tempo ou espaço a que se refere, a variĂĄvel X: âNÂșde
ocorrĂȘncias do acontecimento no intervalo [0,t[â segue lei de Poisson de
parĂąmetro λt (isto Ă©, se para 1 unidade de tempo o nÂș mĂ©dio de ocorrĂȘncias Ă©
λ, para t unidades de tempo o nĂșmero mĂ©dio de ocorrĂȘncias Ă© λt). A expressĂŁo
( ) t
x
e
x
t λ
λ â
!
54. Manual de ExercĂcios
EstatĂstica Aplicada 52
dĂĄ a probabilidade de acontecerem x ocorrĂȘncias no intervalo de tempo [0,t[, e
corresponde à expressão da lei de probabilidade de Poisson : Po(λt)
Por exemplo, se X fĂŽr o âNÂș de avarias que ocorrem no intervalo de tempo
[0,t[â, entĂŁo a probabilidade de nĂŁo ocorrerem avarias nesse intervalo, isto Ă©, a
fiabilidade do componente/sistema como função do tempo, é dada por:
( ) t
t
e
e
t λ
λ
λ â
â
=
!
0
0
(iii) Lei Exponencial
Seja T a variĂĄvel âTempo ou espaço que decorre entre ocorrĂȘncias
consecutivas de um acontecimentoâ. EntĂŁo T segue lei exponencial Exp (λ),
sendo
λ
1
o tempo que, em mĂ©dia, decorre entre ocorrĂȘncias sucessivas do
acontecimento.
Note-se que Ă© possĂvel estabelecer uma relação entre a lei exponencial e a lei
de Poisson. Assim, se X fĂŽr o âNÂș de avarias que ocorrem no intervalo de
tempo [0,t[â, e T fĂŽr o âTempo que decorre entre avarias consecutivasâ, entĂŁo:
P (T>t) = P(tempo que decorre entre avarias exceder t)
= P(até ao instante t, não ocorre qualquer avaria)
= P (ocorrerem zero avarias no intervalo [0,t[) = P(X=0) =
t
e λ
â
A distribuição exponencial é a mais usada em estudos de fiabilidade, jå que a
probabilidade de um componente sobreviver até ao instante t é dada por
t
e λ
â
A probabilidade de avariar até ao instante t é dada por
t
e λ
â
â
1
55. Manual de ExercĂcios
EstatĂstica Aplicada 53
(iv) Lei Normal
A lei Normal tem como parùmetros caracterizadores a média ” e o desvio-
padrĂŁo Ï. Isto Ă©, os valores observados tĂȘm uma determinada tendĂȘncia
central e uma determinada dispersĂŁo em torno da tendĂȘncia central.
A expressĂŁo
â
â
â 2
2
)
(
2
1
2
1 Ï
”
Ï
Xi
e
representa a função densidade de probabilidade da distribuição Normal.
Se se fizer o valor médio ” igual a zero e todos os desvios forem medidos em
relação à média, a equação serå:
Ï
”
â
=
X
Z
que corresponde a uma distribuição normal estandardizada (0;1) com os
valores tabelados, a qual Ă© caracterizada por uma curva de Gauss:
Esta distribuição apresenta 99,73% dos valores entre os extremos â3 e 3.
Existem muitos tipos de distribuição, mas a curva normal é a forma de
distribuição mais frequente nos processos industriais para caracterĂsticas
mensurĂĄveis, e pode considerar-se como estabelecida pela experiĂȘncia prĂĄtica.
56. Manual de ExercĂcios
EstatĂstica Aplicada 54
(v) Lei Qui-Quadrado
Considere-se um conjunto de n variĂĄveis aleatĂłrias Zi, obedecendo Ă s
seguintes condiçÔes:
- cada variåvel Zi segue distribuição N(0,1);
- as variĂĄveis Zi sĂŁo mutuamente independentes
EntĂŁo, a variĂĄvel aleatĂłria X, construĂda a partir da soma das n variĂĄveis Zi
elevadas ao quadrado, segue distribuição Qui-Quadrado com n graus de
liberdade, denotada por
2
2
2
2
1
1
2
... n
n
i
i Z
Z
Z
Z
X +
+
+
=
=
=
2
n
X Ï
â©
O termo âGraus de Liberdadeâ (d.f: degrees of freedom) Ă© habitualmente usado
para designar o nĂșmero n de parcelas (variĂĄveis Zi) adicionadas. Ă possĂvel
demonstrar que o valor esperado e a variùncia da distribuição de uma variåvel
Qui-Quadrado sĂŁo respectivamente
n
=
”
n
2
2
=
Ï
A distribuição Qui-Quadrado é uma distribuição assimétrica à esquerda,
aproximando-se da distribuição Normal à medida que n cresce.
59. Manual de ExercĂcios
EstatĂstica Aplicada 56
PROBABILIDADES
ExercĂcios resolvidos
ExercĂcio 1
De um baralho ordinĂĄrio (52 cartas) extrai-se ao acaso 1 carta. Determine a
probabilidade dos seguintes acontecimentos:
a) saĂda de Rei
b) saĂda de copas
c) saĂda de Rei ou copas
d) saĂda de Rei mas nĂŁo de copas
e) nĂŁo saĂda de Rei
f) nĂŁo saĂda de Rei nem de copas
g) nĂŁo saĂda de Rei ou nĂŁo saĂda de copas
Resolução
A: saĂda de Rei
B: saĂda de copas
a) P(A)=1/13
b) P(B)=1/4
c) P(AâȘ B) = P(A) + P(B) - P(Aâ© B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52)
d) P(A-B) = P(A) â P(Aâ© B) = 1/13 â 1/52 = 3/52 (= (4-1)/52)
e) P( A )= 1-1/13 = 12/13 (=(52-4)/52)
f) P( )
B
A â© = P( B
A âȘ ) = 1 â P(AâȘ B) = 1 â 4/13 = 9/13
g) P( )
B
A âȘ = P( B
A â© ) = 1 â P )
( B
A â© = 1 â 1/52 = 51/52
ExercĂcio 2
Um sistema electrĂłnico Ă© formado por dois sub-sistemas, A e B. De ensaios
anteriores, sabe-se que:
- a probabilidade de A falhar Ă© de 20%
- a probabilidade de B falhar sozinho Ă© 15%
- a probabilidade de A e B falharem Ă© 15%
Determine a probabilidade de:
60. Manual de ExercĂcios
EstatĂstica Aplicada 57
a) B falhar
b) falhar apenas A
c) falhar A ou B
d) nĂŁo falhar nem A nem B
e) A e B nĂŁo falharem simultaneamente
Resolução
A: o subsistema A falha
B: o subsistema B falha
P(A)=20% P( A )= 80%
P(B-A)=15%
P(Aâ© B)=15%
a) P(B) = P(B-A)+ P(Aâ© B) = 0,15 + 0,15 = 30%
b) P(A-B) = P(A) â P(Aâ© B) = 0,2 â 0,15 = 5%
c) P(AâȘ B) = P(A) + P(B) - P(Aâ© B) = 0,2 + 0,3 â 0,15 = 35%
d) P( )
B
A â© = P( B
A âȘ ) = 1 â P(AâȘ B) = 1 â 0,35 = 65%
e) P( B
A â© ) = 1 â P )
( B
A â© = 1 â 0,15 = 85%
ExercĂcio 3
Suponha que hĂĄ 3 jornais, A, B e C, com as seguintes percentagens de leitura:
A: 9,8%; B: 22,9%; C: 12,1%; A e B: 5,1%; A e C: 3,7%; B e C: 6%;
A, B e C: 2,4%
Escolhe-se uma pessoa ao acaso. Calcule a probabilidade dessa pessoa:
a) ler pelo menos um dos jornais
b) ler A e B mas nĂŁo C
c) ler A mas nĂŁo ler B nem C
Resolução
A: a pessoa escolhida lĂȘ o jornal A
B: a pessoa escolhida lĂȘ o jornal B
C: a pessoa escolhida lĂȘ o jornal C
P(A) = 9,8% P(B) = 22,9% P(C) = 12,1%
P(Aâ© B) = 5,1% P(Aâ© C) = 3,7% P(Bâ© C) = 6%
P(Aâ© Bâ© C) = 2,4%
61. Manual de ExercĂcios
EstatĂstica Aplicada 58
a)
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
( C
B
A
P
C
B
P
C
A
P
B
A
P
C
P
B
P
A
P
C
B
A
P â©
â©
+
â©
â
â©
â
â©
â
+
+
=
âȘ
âȘ
= 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4%
b) P( )
C
B
A â©
â© = P( )
(
) C
B
A
P
B
A â©
â©
â
â© = 0,051 â 0,024 = 2,7%
c) )
( C
B
A
P â©
â© = P(A) - )
(
)
(
)
( C
B
A
P
C
A
P
B
A
P â©
â©
+
â©
â
â©
= 0,098-0,051-0,037+0,024 = 3,4%
ExercĂcio 4
Um gerente de uma galeria de arte muito creditada no mercado, estĂĄ
interessado em comprar um quadro de um pintor famoso para posterior venda.
O gerente sabe que hå muitas falsificaçÔes deste pintor no mercado e que
algumas dessa falsificaçÔes sĂŁo bastante perfeitas o que torna difĂcil avaliar se
o quadro que ele pretende comprar Ă© ou nĂŁo um original. De facto, sabe-se que
hĂĄ 4 quadros falsos desse pintor para 1 verdadeiro.
O gerente nĂŁo quer comprometer o âbom nomeâ da galeria para a qual trabalha
comprando um quadro falso. Para obter mais informação o gerente resolve
levar o quadro a um museu de arte e pede para que o especialista do museu o
examine. Este especialista garante-lhe que em 90% dos casos em que lhe Ă©
pedido para examinar um quadro genuĂno daquele pintor, ele identifica-o
correctamente como sendo genuĂno. Mas em 15% dos casos em que examina
uma falsificação do mesmo pintor, ele identifica-o (erradamente) como sendo
genuĂno.
Depois de examinar o quadro que o gerente lhe levou, o especialista diz que
acha que o quadro é uma falsificação. Qual é agora a probabilidade de o
quadro ser realmente uma falsificação?
Resolução
V: o quadro Ă© genuĂno
F: o quadro Ă© falso
I: o quadro Ă© identificado correctamente
P(V) = 20%
P(F) = 80%
P(I/V) = 90% P( )
/V
I = 10%
P( )
/ F
I = 15% P(I/F) = 85%
62. Manual de ExercĂcios
EstatĂstica Aplicada 59
P(ser realmente falsificação/especialista identificou como falsificação) =
= %
1
,
97
7
,
0
68
,
0
1
,
0
*
2
,
0
85
,
0
*
8
,
0
85
,
0
*
8
,
0
)
/
(
*
)
(
)
/
(
*
)
(
)
/
(
*
)
(
=
=
+
=
+ V
I
P
V
P
F
I
P
F
P
F
I
P
F
P
ExercĂcio 5
Na ida para o emprego, o Sr. Ăscar, polĂcia de profissĂŁo, tem de passar
obrigatoriamente por trĂȘs cruzamentos com semĂĄforos. No primeiro
cruzamento, o do Largo Azul, a probabilidade do semĂĄforo se encontrar com
sinal vermelho Ă© de 10%. Em cada um dos cruzamentos seguintes, o Sr. Ăscar
fica parado devido aos sinais vermelhos em metade das vezes que lĂĄ passa.
O Sr. Ăscar jĂĄ descobriu que os semĂĄforos funcionam separadamente, nĂŁo
estando ligados entre si por qualquer mecanismo.
Embora goste de cumprir a lei, o guarda Ăscar passa no sinal verde e acelera
no amarelo, sĂł parando mesmo no sinal vermelho.
a) Qual a probabilidade do Sr. Ăscar chegar ao emprego sem ter de parar
em qualquer sinal vermelho?
b) Qual a probabilidade do Sr. Ăscar ter de parar num sĂł semĂĄforo?
c) Qual a probabilidade do Sr. Ăscar ter parado no sinal vermelho do
cruzamento do Largo Azul, sabendo que parou num sĂł semĂĄforo na sua
ida para o emprego?
Resolução
A: polĂcia encontra sinal vermelho no 1Âșcruzamento
B: polĂcia encontra sinal vermelho no 2Âșcruzamento
C: polĂcia encontra sinal vermelho no 3Âșcruzamento
P(A)=10% P( A )= 90%
P(B)=50% P( B )= 50%
P(C)=50% P(C )= 50%
a) P( )
C
B
A â©
â© = P( A )*P( B )*P(C ) = 0,9*0,5*0,5 = 22,5%
b) P( )
C
B
A â©
â© + P( )
C
B
A â©
â© +P( )
C
B
A â©
â© =
= P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) = 47,5%
63. Manual de ExercĂcios
EstatĂstica Aplicada 60
c) P(polĂcia parar no 1Âșcruzamento / polĂcia parou num sĂł semĂĄforo)
%
26
,
5
475
,
0
)
(
*
)
(
*
)
(
475
,
0
)
(
=
=
â©
â©
=
C
P
B
P
A
P
C
B
A
P
ExercĂcio 6
ApĂłs alguns testes efectuados Ă personalidade de um indivĂduo, concluiu-se
que este Ă© louco com probabilidade 60%, ladrĂŁo com probabilidade igual a 70%
e nĂŁo Ă© louco nem ladrĂŁo com probabilidade 25%. Determine a probabilidade
do indivĂduo:
a) Ser louco e ladrĂŁo
b) Ser apenas louco ou apenas ladrĂŁo
c) Ser ladrĂŁo, sabendo-se que nĂŁo Ă© louco
Resolução
A: indivĂduo Ă© louco
B: indivĂduo Ă© ladrĂŁo
P(A)=60%
P(B)=70%
P( )
B
A â© = 25% = P( B
A âȘ ) P(AâȘ B) = 1 â 0,25 = 75%
a) P(AâȘ B) = P(A) + P(B) - P(Aâ© B) 0,75 = 0,6 + 0,7 - P(Aâ© B)
P(Aâ© B) = 0,6 + 0,7 â 0,75 = 55%
b) P(A-B) + P(B-A) = (0,6-0,55) + (0,7-0,55) = 20Ă
c) P(B/ A ) = %
5
,
37
4
,
0
15
,
0
6
,
0
1
)
(
)
(
)
(
=
=
â
â
=
â© A
B
P
A
P
A
B
P
ExercĂcio 7
Uma moeda Ă© viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem
faces, entĂŁo um nĂșmero Ă© seleccionado de 1 a 9. Se parecem coroas, um
nĂșmero Ă© seleccionado entre 1 e 5. Determine a probabilidade de ser
seleccionado um nĂșmero par.
Resolução
P(Par) = 2/3*4/9 + 1/3*2/5 = 42,96%
64. Manual de ExercĂcios
EstatĂstica Aplicada 61
ExercĂcio 8
Numa fåbrica, 3 måquinas, M1, M2 e M3 fabricam parafusos, sendo a produção
diĂĄria total de 10000 unidades. A probabilidade de um parafuso escolhido ao
acaso ter sido produzido por M1 Ă© 30% da probabilidade de ter sido produzido
por M2. A incidĂȘncia de defeituosos na produção de cada mĂĄquina Ă©:
M1: 3% M2: 1% M3: 2%
Extrai-se ao acaso da produção diåria um parafuso. Sabendo que a
probabilidade dele ser defeituoso Ă© de 1,65%, determine o nĂșmero de
parafusos que cada mĂĄquina produz diariamente.
Resolução
M1: o parafuso foi produzido por M1
M2: o parafuso foi produzido por M2
M3: o parafuso foi produzido por M3
D: o parafuso Ă© defeituoso
n = 10000 unidades
P(M1) = 0,3 P(M2)
P(D / M1) = 3%
P(D / M2) = 1%
P(D / M3) = 2%
P(D) = 1,65%
Prod. 1 = P(M1)*10000 = ?
Prod. 2 = P(M2)*10000 = ?
Prod. 3 = P(M3)*10000 = ?
+
+
=
=
+
+
=
)
3
/
(
*
)
3
(
)
2
/
(
*
)
2
(
)
1
/
(
*
)
1
(
)
(
1
)
3
(
)
2
(
)
1
(
)
2
(
3
,
0
)
1
(
M
D
P
M
P
M
D
P
M
P
M
D
P
M
P
D
P
M
P
M
P
M
P
M
P
M
P
â
+
+
=
=
+
â
02
,
0
*
)
3
(
01
,
0
*
)
2
(
03
,
0
*
)
2
(
3
,
0
0165
,
0
1
)
3
(
)
2
(
3
,
1
M
P
M
P
M
P
M
P
M
P â
65. Manual de ExercĂcios
EstatĂstica Aplicada 62
â
+
+
=
â
=
â
02
,
0
*
))
2
(
3
,
1
1
(
01
,
0
*
)
2
(
03
,
0
*
)
2
(
3
,
0
0165
,
0
)
2
(
3
,
1
1
)
3
(
M
P
M
P
M
P
M
P
M
P â
=
=
â
=
â
=
=
=
%
50
)
2
(
%
35
5
,
0
*
3
,
1
1
)
2
(
3
,
1
1
)
3
(
%
15
5
,
0
*
3
,
0
)
1
(
M
P
M
P
M
P
M
P
ExercĂcio 9
O João tem à sua disposição 3 meios de transporte diferentes para se deslocar
de casa para a escola: os transportes A, B ou C. Sabe-se que a probabilidade de:
- chegar atrasado Ă escola Ă© 60%
- chegar atrasado utilizando o transporte A Ă© 80%
- chegar atrasado utilizando o transporte B Ă© 50%
- chegar atrasado utilizando o transporte C Ă© 60%
- utilizar os transportes B e C Ă© a mesma
a) Calcule a probabilidade de o JoĂŁo utilizar o transporte A
b) Sabendo que o JoĂŁo chegou atrasado Ă escola, calcule a probabilidade
de ter utilizado os transportes B ou C.
Resolução
T: O JoĂŁo chega atrasado
A: o JoĂŁo utiliza o transporte A
B: o JoĂŁo utiliza o transporte B
C: o JoĂŁo utiliza o transporte C
P(T) = 0,6
P(T/A) = 0,8
P(T/B) = 0,5
P(T/C) = 0,6
P(B) = P(C)
P(A)+P(B)+P(C) = 1 P(A) = 1- 2P(B)
a) P(T) = P(A)*P(T/A) + P(B)*P(T/B) + P(C)*P(T/C)
66. Manual de ExercĂcios
EstatĂstica Aplicada 63
Logo
0,6 = (1-2P(B))*0,8 + P(B)*0,5 + P(B)*0,6
e vem que
P(B) = 40%
EntĂŁo P(A) = 1 â 2P(B) = 1 â 2*0,4 = 20%
b) P(BâȘ C / T) =
)
(
)
/
(
*
)
(
)
/
(
*
)
(
T
P
C
T
P
C
P
B
T
P
B
P +
=
6
,
0
6
,
0
*
4
,
0
5
,
0
*
4
,
0 +
=73,3%
ExercĂcio 10
Uma empresa que se dedica à prestação de serviços de selecção de pessoal
em relação a um teste psicotĂ©cnico para uma profissĂŁo especĂfica sabe o
seguinte:
- as percentagens de indivĂduos com um quociente de inteligĂȘncia (Q.I.)
elevado e médio são, respectivamente, de 30% e de 60%
- a percentagem de indivĂduos com Q.I. mĂ©dio que ficam aptos no teste Ă©
de 50%
- a probabilidade de um indivĂduo com Q.I. baixo ficar apto no teste Ă© de
20%
- finalmente, sabe-se que 70% dos indivĂduos com Q.I. elevado ficam
aptos no teste
a) Qual a probabilidade de um indivĂduo escolhido ao acaso ficar apto no
teste?
b) Qual a probabilidade de um indivĂduo ter Q.I. baixo, sabendo-se que
ficou inapto?
Resolução
A: indivĂduo fica apto no teste
E: indivĂduo tem QI elevado
M: indivĂduo tem QI mĂ©dio
B: indivĂduo tem QI baixo
P(E) = 30% P(M) = 60% P(B) = 1 â0,3 â 0,6 = 10%
P(A/M) = 50% P(A/B) = 20% P(A/E) = 70%
67. Manual de ExercĂcios
EstatĂstica Aplicada 64
a) P(A)
=P(E)*P(A/E)+P(M)*P(A/M)+P(B)*P(A/B)
=0,3*0,7+0,6*0,5+0,1*0,2=53%
b) P(B/ A ) = %
17
53
,
0
1
8
,
0
*
1
,
0
)
(
)
/
(
*
)
(
=
â
=
A
P
B
A
P
B
P
ExercĂcio 11
Os resultados de um inquérito aos agregados familiares de uma determinada
cidade forneceram os seguintes dados:
- 35% dos agregados possuem telefone
- 50% dos agregados possuem frigorĂfico
- 25% dos agregados possuem automĂłvel
- 15% dos agregados possuem telefone e frigorĂfico
- 20% dos agregados possuem telefone e automĂłvel
- 10% dos agregados possuem frigorĂfico e automĂłvel
- 5% dos agregados possuem telefone, automĂłvel e frigorĂfico
a) Calcule a probabilidade de um agregado familiar
1. possuir telefone ou frigorĂfico
2. nĂŁo possuir nem telefone nem automĂłvel
b) Calcule a probabilidade de um agregado que possui automĂłvel
1. possuir tambĂ©m frigorĂfico
2. possuir tambĂ©m telefone ou frigorĂfico
c) Calcule a probabilidade de um agregado familiar
1. possuir pelo menos um daqueles trĂȘs objectos
2. nĂŁo possuir nenhum daqueles trĂȘs objectos
Resolução
A: agregado familiar possui telefone
B: agregado familiar possui frigorĂfico
C: agregado familiar possui automĂłvel
P(A) = 35%
P(B) = 50%
P(C) = 25%
68. Manual de ExercĂcios
EstatĂstica Aplicada 65
P(Aâ© B) = 15%
P(Aâ© C) = 20%
P(Bâ© C) = 10%
P(Aâ© Bâ© C) = 5%
a) 1. P(AâȘ B) = P(A) + P(B) - P(Aâ© B) = 0,35 + 0,5 â 0,15 = 70%
2. P( )
C
A â© = P( C
AâȘ ) = 1 â P(AâȘ C) = 1 â 0,4 = 60%
P(AâȘ C) = P(A) + P(C) - P(Aâ© C) = 0,35 + 0,25 â 0,2 = 40%
b) krysktsh1. P(B / C) = %
40
25
,
0
1
,
0
)
(
)
(
=
=
â©
C
P
C
B
P
2. P(AâȘ B/ C) =
%
100
25
,
0
05
.
0
1
,
0
2
,
0
)
(
)
(
)
(
)
(
=
â
+
=
â©
â©
â
â©
+
â©
C
P
C
B
A
P
C
B
P
C
A
P
c) 1.
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
( C
B
A
P
C
B
P
C
A
P
B
A
P
C
P
B
P
A
P
C
B
A
P â©
â©
+
â©
â
â©
â
â©
â
+
+
=
âȘ
âȘ
= 0,35+0,5+0,25-0,15-0,2-0,1+0,05 = 70%
2. 1 â P( )
C
B
A âȘ
âȘ = 1 â 0,7 = 30%
ExercĂcio 12
Admita que 60% dos seguros no ramo automĂłvel respeitam a condutores com
mais de 40 anos de idade, dos quais 5% sofrem, pelo menos, um acidente por
ano. De entre os segurados com idade igual ou inferior a 40 anos, 3% tĂȘm um
ou mais acidentes no mesmo perĂodo.
a) Qual a probabilidade de um segurado nĂŁo sofrer qualquer acidente
durante um ano?
b) Qual a probabilidade de um segurado que sofreu pelo menos um
acidente ter idade igual ou inferior a 40 anos?
c) Qual a probabilidade de, numa amostra de trĂȘs segurados
1. todos terem idade igual ou inferior a 40 anos?
2. nenhum ter sofrido qualquer acidente durante um ano?
3. Todos terem idade igual ou inferior a 40 anos, dado que cada um
sofreu, pelo menos, um acidente durante o referido perĂodo?
69. Manual de ExercĂcios
EstatĂstica Aplicada 66
Resolução
I1: o segurado tem mais de 40 anos de idade
I2: o segurado tem 40 anos ou menos de idade
A: o segurado sofre pelo menos 1 acidente por ano
A : o segurado nĂŁo sofre nenhum acidente por ano
P(I1) = 60% P(I2) = 1 â 0,6 = 40%
P(A/I1) = 5% P( A /I1) = 1 â 0,05 = 95%
P(A/I2) = 3% P( A /I2) = 1 â 0,03 = 97%
a) P( A ) = P(I1)* P( A /I1) + P(I2)* P( A /I2) = 0,6*0,95 + 0,4*0,97 = 95,8%
b) P(I2/A) = %
57
,
28
958
,
0
1
03
,
0
*
6
,
0
)
(
)
2
/
(
*
)
2
(
)
(
)
2
(
=
â
=
=
â©
A
P
I
A
P
I
P
A
P
I
A
P
= P(B)
c) 1. P( )
2
2
2 I
I
I â©
â© = 0,4*0,4*0,4 = 6,4%
2. P( )
A
A
A â©
â© = 0,958*0,958*0,958 = 87,9%
3. P( )
B
B
B â©
â© = 0,2857*0,2857*0,2857 = 2,3%
71. Manual de ExercĂcios
EstatĂstica Aplicada 67
FUNĂĂES DE PROBABILIDADE
ExercĂcios resolvidos
ExercĂcio 1
Se 20% das bobinas de um determinado cabo eléctrico forem defeituosas,
calcule a probabilidade de, entre as 4 bobines necessĂĄrias a um determinado
cliente, escolhidas ao acaso uma ser defeituosa.
Resolução
X: nĂșmero de bobines defeituosas no conjunto de 4 bobines necessĂĄrias a um
determinado cliente (0,1,2,3,4)
n=4 p=0,2 q=1-p=0,8
P(X=1)=C4
p1
q4-1
= 4*0,2*0,83
= 0,4096 = 41%
ExercĂcio 2
O nĂșmero mĂ©dio de chamadas telefĂłnicas a uma central, por minuto, Ă© 5. A
central sĂł pode atender um nĂșmero mĂĄximo de 8 chamadas por minuto. Qual a
probabilidade de nĂŁo serem atendidas todas as chamadas no intervalo de
tempo de 1 minuto?
Resolução
X: nĂșmero de chamadas telefĂłnicas atendidas numa central, por minuto
(0,1,2,3,4, 5, 6, 7, 8)
λ=5 p=0,2 q=1-p=0,8
P(Xâ€8) =
=
â
8
0
5
!
5
x
x
x
e
= 0,932 Logo P(X>8) = 1-0,932 = 0,06
ExercĂcio 3
O tempo de funcionamento sem avarias de uma determinada mĂĄquina de
produção contĂnua segue uma lei exponencial negativa com valor esperado
igual a 4,5 horas. Imagine que a mĂĄquina Ă© (re)colocada em funcionamento no
instante t=0 horas.
Qual a probabilidade de nĂŁo ocorrerem avarias antes do instante t=6 horas?
72. Manual de ExercĂcios
EstatĂstica Aplicada 68
Resolução
Seja
T: tempo de funcionamento sem avarias (ou entre avarias consecutivas) de
uma mĂĄquina, e
X: numero de avarias que ocorrem no intervalo [0,6[, isto Ă©, num perĂodo de 6h
λ=1/4,5 corresponde ao nĂșmero de avarias por unidade de tempo (por hora)
Logo
P(Tâ„6) = P(X=0)=
333
,
1
6
*
5
,
4
1
â
â
= e
e = 0,264
ExercĂcio 4
Considere que o comprimento médio de determinado fio condutor é 120, com
desvio padrĂŁo 0,5. Qual a percentagem de fio com comprimento superior a 121?
Resolução
X: comprimento de determinado fio condutor
Calculando a variĂĄvel reduzida correspondente, vem:
2
5
,
0
120
121
=
â
=
Z
Consultando a tabela, verifica-se que o valor da função Z Ă© P(Xâ€2) = 0,9772.
Logo P(X>2) = 1-0,9772 = 2,28%.
ExercĂcio 5
Numa praia do litoral portuguĂȘs existe um serviço de aluguer de barcos,
destinado aos turistas que a frequentam. O nĂșmero de turistas que procuram
este serviço, por hora, estå associado a uma variåvel aleatória com distribuição
de Poisson.
Verificou-se que, em média, em cada hora, esse serviço é procurado por 8
turistas interessados em alugar barcos; sabe-se, por outro lado, que esse
serviço funciona ininterruptamente das 8 às 20 horas.
a) Qual a probabilidade de que, entre as 8 e as 9 horas, se aluguem 5
barcos?
b) Qual a probabilidade de que, entre as 9 e as 11 horas, os barcos
sejam procurados por mais de 25 turistas?
73. Manual de ExercĂcios
EstatĂstica Aplicada 69
Resolução
X: nÂșde turistas que procuram o serviço de aluguer de barcos por hora
X segue Po(λ=8)
a) Na tabela da Po(λ=8) vem P(X=5) = 9,16%
b) Y1: nÂșde turistas que procuram o serviço de aluguer na 1ÂȘ hora
Y2: nÂșde de turistas que procuram o serviço de aluguer na 2ÂȘ hora
Logo
Y1+Y2: nÂșde turistas que procuram o serviço de aluguer em 2 horas
Pelo Teorema da Aditividade da Poisson, considerando Y1 e Y2
independentes e que todas seguem Po(8), vem que:
Z=Y1+Y2 segue Po(2*8=16)
Logo P(Z>25) = f(26) +... + f(33) = 0,0057 + ... + 0,0001 = 1,32%
ExercĂcio 6
O nĂșmero de navios petroleiros que chegam diariamente a certa refinaria Ă©
uma variåvel com distribuição de Poisson de parùmetro 2. Nas actuais
condiçÔes, o cais da refinaria pode atender, no måximo, 3 petroleiros por dia.
Atingido este nĂșmero, os restantes que eventualmente apareçam deverĂŁo
seguir para outro porto.
a) Qual a probabilidade de, num qualquer dia, ser preciso mandar
petroleiros para outro porto?
b) De quanto deveriam ser aumentadas as instalaçÔes de forma a
assegurar cais a todos os petroleiros em 99,9% dos dias?
c) Qual o nĂșmero esperado de petroleiros a chegarem por dia?
d) Qual o nĂșmero mais provĂĄvel de petroleiros a chegarem por dia?
e) Qual o nĂșmero esperado de petroleiros a serem atendidos diariamente?
f) Qual o nĂșmero esperado de petroleiros que recorrerĂŁo a outros portos
diariamente?
Resolução
X: nÂșde petroleiros que chegam diariamente a uma certa refinaria
X segue Po (2)
Capacidade mĂĄxima de atendimento da refinaria: 3 petroleiros/dia
74. Manual de ExercĂcios
EstatĂstica Aplicada 70
a) P(X>3) = 1 â P(Xâ€3) = 1 â F(3) = 1 â 0,8571 =14,29%
(tab. pg.14)
b) NÂșmĂĄximo de petroleiros que podem chegar: 9 (informação da tabela)
Logo, a capacidade devia aumentar em 6 petroleiros/dia (9-3)
c) E(X) = 2
d) X = 1 ou X = 2, com probabilidade 27,07%
e) Y: nÂșde petroleiros que sĂŁo atendidos diariamente numa certa refinaria
(0,1, 2, 3)
g(0) = P(X=0) = 0,1353
g(1) = P(X=1) = 0,2707
g(2) = P(X=2) = 0,2707
g(3) = P(X=3) = 1 â P(X<3) = 1 â P(Xâ€2) = 1 â 0,6767 = 0,3233
E(Y) = 0*0,1353 + ⊠+ 3*0,3233 = 1,782
São atendidos, em média, entre 1 e 2 petroleiros diariamente
f) Z: nÂșde petroleiros que recorrem diariamente a outros portos
(0,1, 2, 3, 4, 5, 6)
Logo, Z = X - Y
E(Z) = E(X -Y) = E(X) - E(Y) = 2 - 1,782 = 0,218
Recorrem a outros portos, em média, entre 0 e 1 petroleiro por dia
g) W: nÂșde dias em que Ă© preciso mandar petroleiros para outro porto num
mĂȘs de 30 dias (0,1, 2,...30)
W segue Bi (n = 30; p = P(X>3) = 0,1429)
E(W) = 30*0,1429 = 4,3
Em mĂ©dia, Ă© preciso enviar petroleiros para outro porto 4 a 5 dias/mĂȘs
ExercĂcio 7
Os Serviços Municipalizados de Gås e Electricidade debitam mensalemnte aos
seus clientes um consumo teórico T de energia eléctrica calculado de tal modo
que a probabilidade de o consumo efectivo o exceder seja de 30,85%.
Suponha um cliente cujo consumo por mĂȘs segue lei normal de mĂ©dia 400 kwh
e desvio-padrĂŁo 40 kwh.
a) Qual o consumo teĂłrico que lhe Ă© mensalmente debitado?
b) 1. Qual a distribuição do consumo efectivo durante 3 meses?
75. Manual de ExercĂcios
EstatĂstica Aplicada 71
2. Qual a probabilidade de que, ao fim de 3 meses, o consumo teĂłrico
exceda o efectivo em mais de 100 kwh?
Resolução
X: consumo efectivo de energia elĂ©ctrica de um cliente por mĂȘs (em kwh)
T: consumo teĂłrico (valor fixo) debitado ao cliente por mĂȘs (em kwh)
T: P(X>T) = 0,3085
X segue N(400; 1600)
a) P(X>T) = 0,3085 â P( 3085
,
0
)
40
400
40
400
=
â
>
â T
X
â
P(N(0,1) 420
5
,
0
40
400
6915
,
0
)
40
400
=
â
=
â
â
=
â
†T
T
T
b) 1.
X1: consumo efectivo de energia elĂ©ctrica de um cliente no 1Âș
mĂȘs (em kwh)
X2: consumo efectivo de energia elĂ©ctrica de um cliente no 2Âș
mĂȘs (em kwh)
X3: consumo efectivo de energia elĂ©ctrica de um cliente no 3Âș
mĂȘs (em kwh)
Logo
X1+X2+X3: consumo efectivo de energia eléctrica em 3 meses (em kwh)
Pelo Teorema da Aditividade da Normal, considerando X1, X2 e X3
independentes e que todas seguem N(400, 1600), vem que:
Y=X1+X2+X3 segue N(400*3; 1600*3), isto Ă©, N(1200; 4800)
2. P(3*420-Y > 100) = P(Y < 1160) = P(N(0,1)< )
4800
1200
1160 â
=
= P(N(0,1)<-0,58) = 28,1%
ExercĂcio 8
Num determinado processo de fabrico, existem 2 cadeias de montagem A e B,
com funcionamento independente.
A cadeia A opera a um ritmo médio de 2 montagens por hora, e a probabilidade
da cadeia B efectuar pelo menos uma montagem numa hora Ă© de 98,71%.
Admitindo que o nĂșmero de montagens efectuadas por hora em ambas as
cadeias Ă© uma v.a. Poisson, determine:
a) a probabilidade de se efectuarem mais de 6 montagens numa hora com
a cadeia B
76. Manual de ExercĂcios
EstatĂstica Aplicada 72
b) a probabilidade de, em 3 horas de trabalho, se efectuarem no mĂĄximo
10 montagens com a cadeia B
c) a probabilidade de, numa hora, a cadeia A efectuar o dobro de
montagens de B
d) o nĂșmero mĂ©dio de montagens efectuadas num dia de trabalho de 8
horas com ambas as cadeiras
Resolução
X: nÂșde montagens da cadeia A por hora X segue Po(2)
Y: nÂșde montagens da cadeia B por hora
a) Y segue Poisson, mas desconhece-se a média (=parùmetro λ)
No entanto, como se sabe que P(Yâ„1) = 0,9817, vem que
P(Y<1) = 1 â 0,9817 = 0,0183
Na tabela da Poisson, percorrendo as linhas de valor = 0, vem que o
valor 0,0183 pode ser encontrado no cruzamento da linha 0 com a
coluna 4. Logo, λ = 4.
Na tabela da Po(4), P(Y>6) = 1âP(Yâ€6) = 1âF(6) = 1-0,8893=11,07%
b)
Y1: nÂșde montagens da cadeia B na 1ÂȘ hora
Y2: nÂșde montagens da cadeia B na 2ÂȘ hora
Y3: nÂșde montagens da cadeia B na 3ÂȘ hora
Logo
Y1+Y2+Y3: nÂșde montagens da cadeia B em 3 horas
Pelo Teorema da Aditividade da Poisson, considerando Y1, Y2 e Y3
independentes e que todas seguem Po(4), vem que:
Z=Y1+Y2+Y3 segue Po(4*3=12)
P(Zâ€10) = f(0) + f(1) +... + f(10) = 0 + 0,0001 + ⊠+ 0,1048 = 34,72%
c) P(X=2Y) = P(X=0â© Y=0) + P(X=2 â© Y=1) + P(X=4 â© Y=2) +
P(X=6 â© Y=3) + P(X=8â© Y=4) = 0,1353*0,0183 + 0,2707*0,0753 +
0,0902*0,1465 + 0,012*0,1954 + 0,0009*0,1954 = 3,8%
d) W: nÂșde montagens das 2 cadeias num dia de trabalho de 8 horas
W = )
(
8
1
i
i
i Y
X +
=
onde Xi + Yi corresponde ao nÂșde montagens das 2 cadeias por hora
77. Manual de ExercĂcios
EstatĂstica Aplicada 73
Pelo Teorema da Aditividade de Poisson, sendo as variĂĄveis
independentes e seguindo Po(2) e Po(4) respectivamente, vem que
Xi + Yi segue também Po(2+4=6).
E Z , também pelo mesmo Teorema, segue Po(6*8=48)
Logo, o nĂșmero mĂ©dio de montagens efectuado pelas 2 cadeias num dia
de trabalho de 8 horas Ă© de 48.
ExercĂcio 9
Uma companhia de tabacos recebeu em dada altura um elevado nĂșmero de
queixas quanto Ă qualidade dos cigarros de certa marca que comercializa.
Numa råpida anålise às condiçÔes de produção, constata-se que 1% dos filtros
que compÔem o cigarro saem defeituosos. Nestas condiçÔes, determine:
a) a probabilidade de um maço acabado de formar
1. conter 1 cigarro com filtro defeituoso
2. conter 0 cigarros com filtro defeituoso
b) o nĂșmero de maços que, num volume que contĂ©m 20, a companhia
espera poder aproveitar se utilizar o critério:
1. maço é aproveitåvel se não contiver cigarros defeituosos
2. maço é aproveitåvel se contiver no måximo 1 cigarro defeituoso
Resolução
X: nÂșde cigarros com filtro defeituoso em 20 cigarros de um maço
X segue Bi(n=20; p=0,01)
a) 1. P(X=1) = 20*0,01*0,9919
= 16,52%
2. P(X=0) = 0,010
*0,9920
= 81,79%
b) 1. Crit. 1: maço é aproveitåvel se não contiver cigarros defeituosos
Y: nÂșde maços aproveitĂĄveis num volume que contem 20 maços
Y segue Bi(n=20; p=P(X=0) = 0,8179)
Logo E(Y) = 20*0,8179 = 16,36
2. Crit. 2: maço é aproveitåvel se contiver no måximo 1 cigarro defeituoso
Y: nÂșde maços aproveitĂĄveis num volume que contem 20 maços
Y segue Bi(n=20; p=P(X=0)+P(X=1)= 0,8179+0,1652 = 0,9831)
Logo E(Y) = 20*0,9831 = 19,66
78. Manual de ExercĂcios
EstatĂstica Aplicada 74
ExercĂcio 10
O comprimento das peças produzidas por uma måquina é uma v.a. Normal
com mĂ©dia ” e variĂąncia Ï2
. Uma peça defeituosa se o seu comprimento diferir
do valor mĂ©dio mais do que Ï. Sabemos que 50% das peças produzidas tĂȘm
comprimento inferior a 0,25 mm e 47,5% tĂȘm comprimento entre 0,25 mm e
0,642 mm.
a) Calcule a média e o desvio-padrão do comprimento das peças.
b) Determine a probabilidade de uma peça não ser defeituosa.
Resolução
X: comprimento das peças produzidas por uma måquina
X segue N(”; Ï2
)
Peça defeituosa se X>” + Ï ou se X< ” - Ï
P(X<0,25) = 50%
P(0,25<X<0,642) = 47,5%
a) Como P(X<0,25) = 50% vem que
P( %
50
)
25
,
0
=
â
<
â
Ï
”
Ï
”
X
Na tabela,
Ï
”
â
25
,
0
tem que ser =0, logo ”
”
”
” = 0,25
E como
P(0,25<X<0,642) = 47,5% vem que
=
<
<
=
â
<
â
<
â
)
392
,
0
)
1
,
0
(
0
(
)
25
,
0
642
,
0
25
,
0
25
,
0
25
,
0
(
Ï
Ï
Ï
Ï
N
P
X
P
)
0
(
)
392
,
0
( Ξ
Ï
Ξ â
= = 0,475
Sendo Ξ (0)=0,5, vem que 975
,
0
5
,
0
475
,
0
)
392
,
0
( =
+
=
Ï
Ξ
Na tabela 3B da Normal, vem que 96
,
1
392
,
0
=
Ï
e logo Ï
Ï
Ï
Ï = 0,2
b) P(peça nĂŁo defeituosa) = P(” - Ï < X < ” + Ï) = P(0,05 < X < 0,45) =
P(X<0,45) â P(X<0,05) =
%
13
,
84
)
1
(
)
1
(
)
1
(
)
2
,
0
25
,
0
05
,
0
(
)
2
,
0
25
,
0
45
,
0
( =
=
â
â
=
â
â
â
D
Ξ
Ξ
Ξ
Ξ
79. Manual de ExercĂcios
EstatĂstica Aplicada 75
ExercĂcio 11
Sabe-se que a probabilidade de cura de uma certa doença Ă© 20%. PĂ”e-se Ă
prova um novo medicamento, que eleva a probabilidade de cura para 40%,
ministrando-o a um grupo de 20 doentes. Admite-se que o medicamento Ă©
eficaz no caso de contribuir para a cura de, pelo menos, 8 doentes em 20.
Calcule a probabilidade de se concluir pela ineficĂĄcia do medicamento, ainda
que este eleve de facto a probabilidade de cura para 40%.
Resolução
X: nĂșmero de doentes curados no grupo de 20 a que Ă© ministrado o novo
medicamento (0,1,2...19, 20)
n=20 p=0,4 q=1-p=0,6 X segue Bi (20; 0,4)
P(Xâ„8)=1- F(7) = 41,58%
ExercĂcio 12
Sabe-se por via experimental que, por cada perĂodo de 5 minutos, chegam, em
mĂ©dia, 4 veĂculos a determinado posto abastecedor de combustĂveis. Um
empregado entra ao serviço às 8 horas. Qual a probabilidade de ter de
aguardar mais de 10 minutos atĂ© Ă chegada de um veĂculo?
Resolução
X: nÂșde veĂculos que chegam ao posto abastecedor por perĂodo de 5 minutos
X segue Po(4)
Se
X1: nÂșde veĂculos que chegam ao posto no 1ÂșperĂodo de 5 minutos
X2: nÂșde veĂculos que chegam ao posto no 2ÂșperĂodo de 5 minutos
entĂŁo
X1+X2: nÂșde veĂculos que chegam ao posto abastecedor em 10 minutos
Pelo Teorema da Aditividade de Poisson, considerando X1 e X2 independentes
e que ambas seguem Po(4), vem que X1+X2 também segue Po(4+4=8)
Logo P(X1+X2=0) na tabela da Po(8) vem igual a 0,03%.
80. Manual de ExercĂcios
EstatĂstica Aplicada 76
3.4. Estimação por intervalos
Conhecendo-se uma amostra em concreto, Ă© possĂvel estimar os valores dos
seus parĂąmetros caracterizadores atravĂ©s de mĂ©todos probabilĂsticos.
Por exemplo, suponhamos que numa fĂĄbrica produtora de açĂșcar se pretende
averiguar se o peso dos pacotes produzidos estå, em média, dentro das
normas de qualidade exigĂveis. Na impossibilidade de medição do peso de
todos os pacotes, pela morosidade e dispĂȘndio de recursos que tal implicaria, a
estatĂstica permite que, a partir da observação de uma Ășnica amostra, seja
possĂvel inferir entre que valores varia o peso mĂ©dio com um grau de confiança
ou probabilidade elevado. Assim, ao recolher um determinado nĂșmero de
pacotes da produção total aleatoriamente, Ă© possĂvel calcular o peso mĂ©dio de
acordo com as tĂ©cnicas de estatĂstica descritiva apreendidas atrĂĄs. Claro que
nada nos garante que esse valor coincide com o valor do parĂąmetro da
população em estudo. De facto, é até provåvel que não coincida e, mais, se
recolhermos outro conjunto idĂȘntico de pacotes, o valor seja diferente. Isto Ă©,
para cada amostra de dimensĂŁo n recolhida, a estimativa do parĂąmetro
assumiria valores distintos. Então, como retirar conclusÔes? Como garantir
algum nĂvel de rigor?
O mĂ©todo a estudar neste capĂtulo â a estimação por intervalos â permite, a
partir da recolha de uma Ășnica amostra, aferir entre que valores seria de
esperar que variasse o parĂąmetro de interesse se nos empenhĂĄssemos a
recolher um nĂșmero infinito de amostras. Isto Ă©, por exemplo, caso o valor
amostral fosse de 1,02 kg, este método poderia, por exemplo, permitir afirmar
que seria altamente provĂĄvel que o peso dos pacotes produzidos estivesse a
variar entre 0,92 kg e 1,12 kg. E esse resultado tem um determinado nĂvel de
confiança associado: por exemplo, se dissermos que o nĂvel de confiança ou
certeza implicado Ă© de 95%, tal significa que, se nos fosse possĂvel observar
um nĂșmero infinito de amostras, o intervalo de valores apresentado
corresponderia aos resultados obtidos em 95% delas (os valores mais
usualmente utilizados sĂŁo 90%, 95% ou 99% de confiança). Caberia depois Ă
empresa julgar se esses seriam ou nĂŁo valores aceitĂĄveis e proceder aos
eventuais reajustes necessĂĄrios.
81. Manual de ExercĂcios
EstatĂstica Aplicada 77
A partir do conceito de intervalo de confiança para um parùmetro, é fåcil
concluir que a sua especificação implica conhecer:
- o estimador do parĂąmetro em causa
- a sua distribuição de probabilidade
- uma estimativa particular daquele parĂąmetro
Como parùmetros de interesse e para efeitos de exemplificação, vão
considerar-se duas tipologias de intervalo: o intervalo de confiança para a
média de uma população normal e o intervalo de confiança para a proporção
de uma população binomial. Para efeitos de simplificação, vão considerar-se
apenas exemplos relativos a amostras de grande dimensĂŁo (na prĂĄtica, nâ„100)
(i) Intervalo de confiança para a média ”
”
”
” de uma população normal
Seja X (média amostral) o estimador da média da população. Porque a
distribuição é Normal, a distribuição deste estimador serå:
)
;
(
n
N
X
Ï
”
â©
Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se
necessĂĄrio calcular a variĂĄvel reduzida correspondente:
)
1
;
0
(
N
n
X
Z â©
â
=
Ï
”
Esta variåvel permitirå deduzir a fórmula geral do intervalo de confiança para a
média ” de uma população normal:
+
â
n
c
X
n
c
X
Ï
Ï
;
Isto é, em torno do valor do estimador, é definido um intervalo de variação onde
Ă© possĂvel afirmar que o parĂąmetro a estimar estĂĄ contido com um grau de
confiança Ύ . Esse intervalo de variação depende:
- da dimensĂŁo da amostra (n): quanto maior a dimensĂŁo da amostra,
menor a amplitude do intervalo. Este resultado explica-se facilmente: no
limite, se fosse possĂvel observar todo o universo de dados (n=â ), o
valor amostral calculado corresponderia ao valor da população.