1) O documento apresenta a distribuição binomial, que descreve experimentos com dois resultados possíveis (sucesso e fracasso) e eventos independentes.
2) É explicado que a probabilidade de resultados em lançamentos múltiplos de moedas honestas pode ser obtida da fórmula binomial e lida no triângulo de Pascal.
3) O conceito de nível de significância em testes de hipóteses é introduzido, referindo-se à probabilidade de rejeitar incorretamente a hipótese nula.
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
Distribuição binomial e nível de significância em estatística
1. 0
Associação Diocesana de Ensino e Cultura de Caruaru
FACULDADE DE FILOSOFIA, CIÊNCIAS E LETRAS DE CARUARU
Reconhecida pelo Decreto 6399 de 15.01.69 D.O. 17-01-69
CURSO: ADMINISTRAÇÃO
Prof. Wellington Marinho Falcão
AULA 1
2. 1
DISTRIBUIÇÃO BINOMIAL
É uma distribuição probabilística. Mas o que é uma distribuição
probabilística?
Toda vez que associamos, no plano cartesiano, uma variável x no
eixo horizontal à sua probabilidade de ocorrência P(x) no eixo
vertical, teremos uma distribuição probabilística.
x: x1, x2, x3, ..., xi, ..., xn
P(x): p1 p2 p3 …, pi …, pn
FIG. 1
3. 2
Há várias distribuições probabilísticas, tais como: binomial,
normal, t de student, poisson, etc.
Comecemos com a distribuição binomial!
Lancemos uma moeda honesta* duas vezes ou duas moedas
honestas uma única vez, o que dá no mesmo, não é?
Chamemos cara de Ca e coroa de Co
Os resultados possíveis são: CaCa, CaCo, CoCa, CoCo;
conforme é demonstrado no quadro abaixo:
M1
M2 Ca Co
Ca CaCa CaCo
Co CoCa CoCo
Tab. 1
Do exposto acima, já podemos destacar certas propriedades da
distribuição binomial:
• Variáveis discretas;
• Eventos Independentes;
• Presunção de Reposição.
Lá atrás chamamos a probabilidade de o evento x ocorrer de p, ou
seja, P(x) = p.
Chamaremos de q a probabilidade de o evento x não ocorrer, logo,
p + q = 1. Evidente, pois a soma de todas as probabilidades é
sempre igual a 1.
p + q = 1 q = 1 – p
Convencionou-se o seguinte:
p = sucesso
q = fracasso
4. 3
CUIDADO!
O conceito de sucesso em estatística é diferente do que
entendemos por sucesso no nosso dia-a-dia, pois na estatística,
sucesso é a ocorrência do evento e fracasso é a não-ocorrência.
Por exemplo: Se numa pesquisa estamos estudante a taxa de
mortalidade infantil, ocorrer um óbito é sucesso e fracasso será
sobreviver.
Temos aí, mais uma propriedade da distribuição binomial:
• Ocorrência de apenas dois resultados: p (sucesso) e q
(fracasso).
Suponhamos que no lançamento de duas moedas honestas,
sucesso “p” seja cara e fracasso “q” seja coroa, onde p0 será a
probabilidade de zero cara, p1 de um cara e p2 de dois cara.
Levando para o plano cartesiano:
5. 4
Mais uma propriedade:
• Não importa a ordem. Tanto faz se cara vem antes ou depois
do coroa para x = 1.
Para o lançamento de três moedas honestas, teríamos:
Para 4 moedas teríamos:
6. 5
Aumentando-se o número de lançamentos de moeda, aumenta-
se o número de colunas como se pode ver nas figuras 2, 3 e 4.
Quando n (número de lançamentos) tende a infinito,um número
infinito de colunas se acomoda na curva da figuras supracitadas. As
colunas ficam tão finas (apinhadas sob a curva) quanto uma linha,
que o gráfico, ao invés de colunas verticais poderá ser a própria
curva. Aí tereos a distribuição normal que é válida para variáveis
contínuas ou, quando n muito grande, para variáveis discretas
(aproximação pela normal).
Veremos mais sobre a distribuição normal ao longo do curso.
Mas o que são variáveis discretas e variáveis contínuas?
Variável discreta é aquela que não é contínua. OH! OH! OH!
Parece óbvio, não é? E é mesmo!!!
No caso da moeda, não existe nenhum valor intermediário entre
ocorrerem 2 caras ou 3 caras, por exemplo. Não há a possibilidade
de ocorrerem 2,5 caras, ou seja, há uma descontinuidade entre 2 e
3.
Já uma variável peso ou altura seria contínua, pois não importa
quão próximos estejam dois valores, sempre haverá infinitos valores
entre os dois.
Vejamos!
Quantos valores haverá entre 10,6 kg e 11,0 kg?
Uma pessoa mais desavisada diria: 10,7 kg; 10,8 kg e 10,9 kg, ou
seja, 3 valores. Mas aumentando o número de casas decimais de 1
para 2, teríamos entre 10,9 kg e 11,0 kg valores como: 10,92 kg ou
10,99 kg. E com 3 casas decimais teríamos entre 10,99 kg e 11 kg
valores como: 10,991 kg ou 10,995 kg.
E com 4, 5, 6, ... casas decimais???
Não importa quão próximos estejam dois valores, sempre haverá
uma infinidade de valores entre eles. Esta variável não sofre
descontinuidade, isto é, ela é uma variável contínua.
7. 6
Voltemos ao exemplo do lançamento de 2 moedas ou de 1
moeda duas vezes (que dá no mesmo)
Chamemos de p (sucesso) a probabilidade de sair cara e q
(fracasso) a probabilidade de não sair cara, ou seja, sair coroa.
Perceba que as probabilidades para 0, 1 e 2 caras são as da
FIG.2
8. 7
O mesmo resultado da FIG.3
Sabendo-se que a ordem das parcelas não altera a soma:
p³ + 3qp² + 3pq² + q³ =
= q³ + 3q²p + 3qp² + p³ (I)
Em cada uma das parcelas da expressão acima há tanto q
quanto p. Na 1ª parcela p não aparece, pois é p0
que é igual a 1 e
na última q não aparece, pois é q0
que igual a 1. Vejamos!
=1q³p0
+ 3q²p¹+ 3q¹p² + 1q0
p³ (II)
Perceba que a expressão (II) é a mesmíssima coisa da expressão
(I). Como a moeda foi lançada 3 vezes (n = 3), o expoente de q
começa por 3 e vai diminuindo de 1 em 1 até zerar. O inverso
ocorre com p que começ com o expoente zero e vai aumentando de
1 em e1 até chegar em 3 (n = 3)
Estes coeficientes da expressão (II) que são 1, 3, 3 e 1; vêm da
linha n = 3 do triângulo de Pascal.
1q³p0
+ 3q²p¹+ 3q¹p² + 1q0
p³ (II)
Abaixo, temos o triângulo de pascal de n=1 até n=8
n
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
9. 8
No Triângulo de Pascal, cada número resulta da soma do número
acima com o número que está à esquerda do que está acima. Note
o destaque dado ao número 21 da linha n =7. Ele é a soma do
número que está acima: 6; com o que está à esquerda de 6: 15.
Logo, 6 + 15 = 21.
EXERCÍCIO RESOLVIDO:
Qual a probabilidade de termos 3 caras em 8 lançamentos de
uma moeda honesta?
Solução:
O expoente de q começa com 8 (n = 8) e vai diminuindo de 1 em
1, enquanto o expoente de p, começa em 0 e vai crescendo de 1
em 1 até chegar em 8 (n= 8)
1 q8
p0
+ 8 q7
p1
+ 28 q6
p2
+ 56 q5
p3
+ ...... (III)
n
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
O expoente de p significa o número de sucessos e o expoente de
q o de fracassos. Como no enunciado da questão eu quero saber a
probabilidade de saírem 3 caras em 8 lançamentos, eu preciso só
do termo cujo expoente de p seja 3 que é: 56q5
p³; daí o fato de
10. 9
termos parado de construir a expressão (III). Se por exemplo, eu
quisesse a probabilidade para 4 sucessos (4 caras em 8
lançamentos), eu deveria avançar em sua construção, ou seja, iria
até 70q4
p4
.
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
Mas não é pedido no enunciado da questão, portanto:
A probabilidade de 3 caras em 8 lançamentos de uma moeda
honesta (p = q = ½) é a seguinte:
56 q5
p³ = 56 x (0,5)5
x (0,5)³ = 0,2187 = 21,87%
NÍVEL DE SIGNIFICÂNCIA
Para falarmos de nível de significância, precisamos de uma breve
introdução ao Teste das Hipóteses, que será tratado com mais
detalhes ao longo do curso.
Suponhamos o experimento a seguir:
Ao lançarmos uma moeda 6 vezes (n = 6), obtemos 1 cara e 5
coroas). O conjunto R de todos os resultados possíveis de número
de sucessos (sair cara) em 6 lançamentos é:
R = {0,1,2,3,4,5,6 caras}
Lança-se a hipótese H0, chamada de hipótese probanda, de que
a moeda é honesta, ou seja, a probabilidade de ser cara ou coroa é
a mesma. Caso esta hipótese não seja aceita, parte-se para a Ha,
hipótese alternativa, que, no nosso caso, é bem razoável crer que a
probabilidade de cara seja menor que a de coroa.
11. 10
Quando adentrarmos mais profundamente no Teste das
Hipóteses, haverá um macete das setas e de lá faremos um flash-
back até aqui.
O experimento pode fazer com que a gente rejeite a hipótese H0
(de que a moeda é honesta), pois apesar de a probabilidade de esta
hipótese ser verdadeira existir, ela venha a ser muito pequena. Esta
probabilidade pequeníssima é a probabilidade de se cometer este
erro, conhecida como nível significância e quanto menor for este
nível, melhor.
O nível de significância é indicado pela letra grega alfa (α)
Se estipularmos um α = 12%, indicamos que estamos dispostos a
tolerar um erro de no máximo estes 12%. Se α = 5%, por exemplo,
significa que ficamos menos tolerantes ao erro.
Vejamos a análise para α = 12%
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
Para x = 0 (nenhum cara): P(x=0) = 1q6
p0
= q6
= (0,5)6
= 0,01562
= 1,56%
O que nos diz a expressão acima?
Que mesmo sendo honesta, é possível que em 6 lançamentos só
saia coroa, embora esta probabilidade seja de meros 1,56%.
Uma pessoa em sã consciência rejeitaria a hipótese probanda
(H0) de que a moeda é honesta e optaria pela hipótese (Ha) de que
a probabilidade de cara seja menor que a de coroa.
Se para a infelicidade do cidadão a “danada” da moeda for
honesta, ele erra ao rejeitar H0, mas esta possibilidade de errar é de
meros 1,56%.
12. 11
Lembre-se que 1,56% < α, ou seja, < 12%.
Como o pesquisador tolerou errar em até 12% (α), se não saísse
nenhum cara ele optaria por Ha e correria o pequeno risco de
cometer este erro
Para x = 1 (um cara), temos P(x=1) = 6q5
p = 6 x (0,5)5
x (0,5) =
0,09375 = 9,37%.
Além do fato de 9,37% < α = 12%, nos levar a optar por Ha, é
preciso que a soma de P(x=0) e P(x=1) também seja menor que α.
0,015625 + 0,09375 = 0,109375 = 10, 94% < 12%
Logo, saindo 1 cara em 6 lançamentos, nos leva a optar por Ha
com uma chance de estarmos errados próxima de 11%.
Para x = 2 temos P(x=2) = 15q4
p2
= 15 x (0,5)4
x (0,5)² =
0,234375 = 23,44%.
Como 23,44% > 12%, se saíssem duas caras em 6 lançamentos,
eu não mais rejeitaria a H0 (moeda honesta), pois se assim o
fizesse, eu teria uma probabilidade de estar errado de 23,44% que
é muito além do erro máximo tolerado que é de 12% (nível de
significância α)
RESULTADOS POSSÍVEIS:
0 1 2 3 4 5 6
Rc Rc*
Rc é a região de rejeição de H0 e Rc* é a região de não-rejeição
para α = 12%
Se α passa-se para 5%, significaria que minha tolerância ao erro
diminuiria e o “1” pularia de Rc para Rc*. Diante deste rigor de ser
mais intolerante ao erro, o aparecimento de 1 cara em 6
13. 12
lançamentos já é motivo o suficiente para não rejeitar H0, pois se
assim o fizesse, eu estaria incorrendo na probabilidade de estar
errado em 9,37%, quando minha tolerância ao erro é agora de 5%.
ALTERNATIVA AO TRIÂNGULO DE PASCAL
Vimos como capturar do triângulo de pascal no exercício resolvido
lá atrás a probabilidade de 3 caras em 8 lançamentos de uma
moeda honesta (p = q = ½):
56 q5
p³ = 56 x (0,5)5
x (0,5)³ = 0,2187 = 21,87%
Mas o que ocorreira, por exemplo, se quiséssemos trabalhar com o
valor de “n” muito grande: n= 15; n = 22, etc...
Não dá para fazer um triângulo de Pascal do tamenho das
pirâmides do Egito, não é?
Para isto utilizamos a seguinte fórmula:
)
Onde k é o número de sucessos e n o número de lançamentos.
No caso de 3 caras (k =3) em 8 lançamentos (n=8)
[(8 x 7 x 6 x 5!) / (3 x 2 x 5!)] q5
p3
= 56q5
p3
kkn
pq
knk
n −
− )!(!
!
338
)!38(!3
!8
pq −
−
14. BIBLIOGRAFIA
Introdução Ilustrada à Estatística – autor: Sérgio Francisco Costa – Editora Harbra
Estatística e Introdução à Econometria – autor: Alexandre Sartoris – Editora Saraiva
Estatística Aplicada à Gestão Empresarial – autor: Adriano Leal Bruni – Editora Atlas
Estatística Fácil – autor Antônio Arnot Crespo – Editora Saraiva