Este documento descreve os conceitos básicos de inferência estatística, incluindo:
1) A relação entre populações e amostras e como amostras aleatórias são usadas para inferir propriedades da população;
2) Definições de estatísticas, estimativas, estimadores e propriedades desejáveis de estimadores como não tendenciosidade e eficiência;
3) Exemplos de estimadores comuns como a média e variância amostral.
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
Introdução à Inferência Estatística e Estimativa de Parâmetros
1. UNIVERSIDADE FEDERAL DE SÃO CARLOS
CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA
DEPARTAMENTO DE ESTATÍSTICA
INTRODUÇÃO AO PLANEJAMENTO E ANÁLISE
ESTATÍSTICA DE EXPERIMENTOS
CAPÍTULO # 3
INTRODUÇÃO A PROBABILIDADE E A
INFERÊNCIA ESTATÍSTICA
PARTE # 2
PROF. PEDRO FERREIRA FILHO
PROFa. ESTELA MARIS P. BERETA
2º SEMESTRE DE 2010
2. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
3.4. INFERÊNCIA ESTATÍSTICA:
3.4.1. INTRODUÇÃO:
O campo da inferência estatística consiste naqueles métodos usados para tomar decisões ou
tirar conclusões acerca de uma população. Esses métodos utilizam a informação contida em uma
amostra da população para tirar conclusões. Mostramos na Fig. 3.10 a relação entre uma população
e uma amostra. Este ponto inicia nosso estudo dos métodos estatísticos usados para a inferência e a
tomada de decisões.
Figura 3.10. Relação entre uma população e uma amostra
Inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e teste
de hipóteses. Como um exemplo de um problema de estimação de parâmetros, suponha que um
engenheiro de estruturas esteja analisando a resistência a tensão de um componente usado em um
chassi de automóvel. Uma vez que a variabilidade da resistência à tração esta naturalmente presente
entre componentes individuais, devido às diferenças nas bateladas da matéria-prima nos processos
de fabricação e nos procedimentos de medidas (por exemplo), o engenheiro está interessado na
estimação da resistência média a tração dos componentes. Na pratica, o engenheiro usara dados da
amostra para calcular um número que e, de algum modo, um valor razoável (ou tentativa) da média
verdadeira. Esse número é chamado de estimativa. Veremos que e possível estabelecer a precisão da
estimativa.
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 2
3. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Considere agora uma situação em que duas temperaturas diferentes de reação, como t1 e t2
possam ser usadas em um processo químico. O engenheiro conjectura que t1 resulta em rendimentos
maiores que t2 o teste estatístico de hipóteses e a estrutura para resolver problemas desse tipo.
Nesse caso, a hipótese seria que o rendimento médio usando a temperatura t1 é maior que o
rendimento médio usando a temperatura t2. Note que não há ênfase na estimação de rendimentos;
em vez disso, o foco esta na tirada de conclusões acerca de uma hipótese estabelecida.
3.4.2. DEFINIÇÕES E PROPRIEDADES BÁSICAS:
Na maioria dos problemas de inferência estatística, é impossível ou impraticável observar a
população inteira. Por exemplo, não poderíamos testar à resistência a tração de todos os elementos
estruturais dos chassis, pois consumiria muito tempo e seria muito caro. Além disso, alguns (talvez
muitos) desses elementos estruturais não existam mais no tempo em que a decisão deve ser feita;
assim, para uma larga extensão, temos de visualizar a população como conceitual. Logo,
dependemos de um conjunto de observações da população para ajudar a tomar decisões à cerca da
população.
Para que nossas inferências sejam validas, a amostra tem que ser representativa da
população. É freqüentemente tentador selecionar uma amostra com as observações que sejam mais
convenientes ou exercer julgamento na seleção da amostra. Esses procedimentos podem
freqüentemente introduzir alguma tendência na amostra e, como resultado, o parâmetro de interesse
será consistentemente subestimado (ou superestimado) por tal amostra. Alem disso, o
comportamento de uma amostra de julgamento não pode ser estatisticamente descrito. Para evitar
essas dificuldades, é desejável selecionar uma amostra aleatória como o resultado de algum
mecanismo de chance. Conseqüentemente, a seleção de uma amostra e um experimento aleatório e
cada observação na amostra e o valor observado de uma variável aleatória. As observações na
população determinam a distribuição de probabilidades da variável aleatória.
Para definir uma amostra aleatória, faça X ser uma variável aleatória que represente o resultado
de uma seleção de uma observação proveniente da população. Faça f(x) denotar a função densidade
de probabilidade de X Suponha que cada observação na amostra seja obtida independentemente,
sob condições inalteradas. Ou seja, as observações para a amostra são obtidas, observando-se X
independentemente, sob condições inalteradas, isto é, n vezes. Faça X denotar a variável aleatória
que representa a i-ésima replica. Então, X1, X2, ..., Xn é uma amostra aleatória e os valores numéricos
obtidos são denotados por x1, x2,...,xn. As variáveis aleatórias em uma amostra aleatória são
independentes, com a mesma distribuição de probabilidades f(x), por causa das condições idênticas
sob as quais cada observação é obtida. Isto é, a função densidade de probabilidade marginal de X1,
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 3
4. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
X2, ...,Xn e fx1,x2,...,xn(x1, x2,...,xn), respectivamente, e pela independência, a função densidade de
probabilidade conjunta da amostra aleatória é f(x1)f(x2)...f(xn).
Definição 1: As variáveis aleatórias (X1,X2,...,Xn) são uma amostra aleatória de tamanho n, se: (a)
os X’s são variáveis aleatórias independentes (b) todos os Xi’s tiverem a mesma distribuição de
probabilidade.
Para ilustrar essa definição, suponha que estejamos investigando a vida efetiva de serviço de um
componente eletrônico usado em um marca-passo cardíaco e que a vida do componente seja
normalmente distribuída. Então, esperaríamos que cada uma das observações da vida do
componente Xl, X2, ..., Xn em uma amostra aleatória de n componentes fosse uma variável aleatória
independente com, exatamente, a mesma distribuição normal. Depois dos dados serem coletados, os
valores numéricos dos tempos de vida observados são denotados por x1,x2,...,xn.
A finalidade principal de tomar uma amostra aleatória e obter informação sobre os
parâmetros desconhecidos da população.
Definição 2: Uma estatística é qualquer função das observações de uma amostra aleatória.
Encontramos estatísticas anteriormente. Por exemplo, se X1, X2, ...,Xn. for uma amostra aleatória
de tamanho n, então a média da amostra X , a variância da amostra S2 e o desvio-padrão S da
amostra são estatísticas. O processo de tirar conclusões sobre a população, baseando-se nos dados
da amostra, faz uso considerável dessas estatísticas.
Desde que uma estatística seja uma variável aleatória, ela terá uma distribuição de probabilidades.
Chamamos a distribuição de probabilidades de uma estatística de distribuição amostral. A noção de
uma distribuição amostral é muito importante e será discutida e ilustrada mais adiante neste capitulo.
Uma aplicação muito importante de estatísticas e a obtenção das estimativas dos parâmetros, tais
como a media da população e a variância da população. Em problemas de inferência, é conveniente
ter um símbolo geral para representar o parâmetro de interesse. Usaremos o símbolo grego θ (teta)
para representar o parâmetro. O objetivo da estimação e selecionar um único número baseado nos
dados da amostra, sendo esse o valor mais plausível para θ. Um valor numérico de uma estatística
amostra será usado como a estimativa.
Definição 3: Uma estimativa pontual de algum parâmetro θ da população é um único valor
numérico de uma estatística θ .
ˆ
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 4
5. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Como um exemplo, suponha que a variável aleatória X seja normalmente distribuída com uma
média desconhecida µ. A média da amostra é um estimador da média desconhecida µ da população.
Isto é µ = X . Depois de a amostra ter sido selecionada, o valor numérico x e a estimativa de
ˆ µ.
Assim, se x1 = 25, x2 = 30, x3 = 29 e x4 = 31, então a estimativa de µé
25 + 30 + 29 + 31
X = = 28.75
4
Similarmente, se a variância da população σ2 for também desconhecida, um estimador para σ2
será a variância da amostra S2 e o valor numérico s2 = 6.9, calculado a partir dos dados amostrais,
é chamado de estimativa de σ2.
Problemas de estimação ocorrem freqüentemente em engenharia. Geralmente, necessitamos
estimar:
• A média µ de uma única população;
• A variância σ2 (ou desvio-padrão σ) de uma única população;
• A proporção p de itens em uma população que pertence a uma classe de interesse;.
• A diferença nas médias de duas populações, µ1 - µ2;.
• A diferença nas proporções de duas populações, p1 – p2;
Estimativas razoáveis desses parâmetros são dadas a seguir:
• Para µ, a estimativa é µ = x , a média da amostra.
ˆ
• Para σ2 a estimativa é σ 2 = s 2 a variância da amostra.
ˆ
• Para p, a estimativa é p 2 = x
ˆ
n
a proporção da amostra, sendo x o numero de itens em uma
amostra aleatória de tamanho n que pertence a classe de interesse.
• Para µ1 - µ2, a estimativa é µ1 − µ 2 = x1 − x 2
ˆ ˆ a diferença entre as médias de duas amostras
aleatórias independentes.
• Para p1 – p2 a estimativa é p1 − p 2 , a diferença entre duas proporções amostrais, calculadas
ˆ ˆ
a partir de duas amostras aleatórias independentes.
Podemos ter varias escolhas diferentes para o estimador pontual de um parâmetro. Por
exemplo, se desejarmos estimar a média de uma população, podemos considerar como
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 5
6. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
estimadores a média ou a mediana da amostra ou talvez a média das observações menores e
maiores da amostra. De modo a decidir qual estimador de um parâmetro particular é o melhor
para se usar, necessitamos examinar suas propriedades estatísticas e desenvolver algum critério
para comparar os estimadores.
Os critérios para escolha do “melhor” estimador para um determinado parâmetro populacional
são definidos a partir de “propriedades” desejáveis destes estimadores. As propriedades mais
consideradas são:
Propriedade 1: Um estimador θ é não viciado (ou não tendencioso) para um parâmetro
ˆ
populacional θ se:
()
Eθ =θ
ˆ
Essa propriedade diz que um estimador deve estar "perto", de algum modo, do valor ver-
dadeiro do parâmetro desconhecido. Formalmente, dizemos que θ é um estimador não tendencioso
ˆ
de θ, se o valor esperado de θ for igual a θ. Isso é equivalente a dizer que a média da distribuição
ˆ
de probabilidades de θ (ou a media da distribuição amostral de θ) é igual a θ.
Propriedade 2: Sejam θ1 e θ 2 dois estimadores não viciados de um parâmetro θ. θ1 é mais eficiente do
ˆ ˆ ˆ
que θˆ2 se:
Var( θ1 ) < Var( θ 2 )
ˆ ˆ
ou seja, um estimador é mais eficiente quanto menor for a sua variância, ou ainda, quanto mais
preciso (menor dispersão) ele for.
Definição 4: Se considerarmos todos os estimadores não viciados de um parâmetro θ, aquele com
menor variância será denominado de estimador não viciado de menor variância.
A interpretação das propriedades acima pode ser observada a partir da seguinte situação:
Deseja-se comprar um rifle, e após algumas seleções, restaram quatro alternativas que
denominamos de rifles A, B, C e D. Realiza-se um teste para cada um dos rifles que consistiu em
fixá-lo num cavalete, mirar o centro de um alvo e disparar 15 tiros. Os resultados estão na figura
3.11.
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 6
7. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Figura 3.11 Resultados de 15 tiros dados por 4 rifles
Questão: Qual o melhor rifle?
Características:
Rifle A: Não viciado com baixa precisão (grande dispersão ou variância);
Rifle B: Viciado com baixa precisão;
Rifle C: Não viciado com boa precisão;
Rifle D: Viciado com alta precisão;
3.4.3. MÉTODOS DE ESTIMAÇÃO:
A forma de obtenção de um estimador para um dado parâmetro populacional, de preferência
com as propriedades desejáveis, pode ser feita utilizando-se diferentes procedimentos chamados de
métodos de estimação. Esses métodos não serão aqui apresentados e podem ser vistos, por
exemplo, em Montgomery e Runger (ver bibliografia do curso). Destacamos que os principais
métodos de estimação são:
• Métodos dos Momentos;
• Método da Máxima Verossimilhança;
• Método dos Mínimos Quadrados;
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 7
8. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
3.5. DISTRIBUIÇÕES AMOSTRAIS:
A inferência estatística como vimos anteriormente, tem por objetivo tomar decisões acerca de
uma população, baseando-se na informação contida em uma amostra aleatória proveniente daquela
população. Por exemplo, podemos estar interessados no volume médio de enchimento de uma lata
de refrigerante. O volume médio de enchimento na população e 300 ml. Um engenheiro considera
uma amostra aleatória de 25 latas e calcula o volume médio amostral de enchimento como x = 298
ml. 0 engenheiro decidirá, provavelmente, que a média da população é µ = 300 ml, muito embora a
média amostral tenha sido 298 ml, porque ele sabe que a média amostral é uma estimativa razoável
de µ e que com a média amostral de 298 ml é muito provável de ocorrer, mesmo se a média
verdadeira da população for µ = 300 ml. De fato, se a média verdadeira for 300 ml, então os testes
de 25 latas feitos repetidamente, talvez a cada 5 minutos, produzirão valores de x que variarão
acima e abaixo de µ = 300 ml.
A média amostral e uma estatística; isto e, ela e uma variável aleatória que depende dos
resultados obtidos em cada amostra particular. Uma vez que uma estatística e uma variável aleatória,
ela tem uma distribuição de probabilidades.
Definição: A distribuição de probabilidades de uma estatística e chamada de uma distribuição
amostral.
Por exemplo, a distribuição de probabilidades de X é chamada de distribuição
amostral da média.
A distribuição amostral de uma estatística depende da distribuição da população, do tamanho
da amostra e do método de seleção da amostra. A próxima seção deste capítulo apresenta talvez a
mais importante distribuição amostral. Outras distribuições amostrais e suas aplicações serão
ilustradas quando necessárias (por exemplo, a distribuição amostral da variância amostral).
3.5.1. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA:
3.5.1.1. DISTRIBUIÇÃO AMOSTRAL PARA UMA MÉDIA:
Considere a determinação da distribuição amostral da média X da amostra. Suponha que
uma amostra aleatória de tamanho n seja retirada de uma população normal com média µ e
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 8
9. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
variância σ2. Então, pela propriedade reprodutiva da distribuição normal, concluímos que a média da
σ2
amostra tem uma distribuição normal com média µ X = µ e variância σ X =
2
, ou seja, a
n
distribuição da média da amostra tem como média o mesmo valor da média da populacional da
característica em estudo (estimador não viciado) e variância igual à variância populacional dividida
pelo tamanho da amostra.
Notação:
Se X i ~ N ( µ , σ 2 ) então X ~ N ( µ , σ
2
)
n
Observação: Propriedade reprodutiva ⇒ Uma combinação linear de variáveis aleatórias normais é
também normal.
Se estivermos amostrando de uma população que tenha uma distribuição desconhecida de
probabilidades, a distribuição amostral da média da amostra será aproximadamente normal, com
média µ e variância σ2/n, se o tamanho n da amostra for grande. Esse é um dos mais úteis
teoremas em estatística, o chamado teorema central do limite.
3.5.1.2. TEOREMA DO LIMITE CENTRAL:
Se X1, X2 ,..., Xn representa uma amostra aleatória de tamanho n de uma variável X
com média e variância finita σ2, obtida em uma população (finita ou infinita) e se X for a
média da amostra, então a forma limite da distribuição para n grande é dada por
X − µ)
Z=
σ
n
Interpretação: O Teorema Central do Limite nos diz que, independente da distribuição que
a característica em estudo pode ser representada, a medida que o tamanho da amostra
aumenta, a distribuição amostral da média X pode ser representada pelo modelo normal.
A qualidade da aproximação normal para X depende do tamanho n da amostra. A
Fig. 3.12(a) mostra a distribuição obtida para o arremesso de um único dado verdadeiro com
seis faces. As probabilidades são iguais a (1/6) para todos os valores obtidos, 1,2,3,4,5 ou 6.
A Fig. 3.12(b) mostra a distribuição das pontuações médias obtidas quando arremessando
três, cinco e dez vezes o dado, respectivamente. Note que, embora a população (um dado)
esteja relativamente longe da normal, a distribuição das medias será aproximada
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 9
10. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
razoavelmente bem pela distribuição normal, para amostras de tamanho tão pequeno
quanto cinco. (As distribuições dos arremessos dos dados são discretas, enquanto a normal
e continua.) Embora o teorema central do limite trabalhe bem para pequenas amostras (n =
4, 5) na maioria dos casos, particularmente onde a população seja continua, unimodal e
simétrica, amostras maiores serão necessária em outras situações, dependendo da forma da
população. Em muitos casos de interesse prático, se n ~ 30, a aproximação normal será
satisfatória, independente da formal da população. Se n < 30, o teorema central do limite
funcionara, se a distribuição da população não for muito diferente da normal.
Exemplo: Uma companhia eletrônica fabrica resistores que têm uma resistência média de 100Ω e
um desvio padrão de 10Ω. A distribuição das resistências pode ser representada pelo modelo normal.
Encontre a probabilidade de uma amostra aleatória de tamanho n = 25 resistores ter uma resistência
média menor que 95Ω?
Solução:
X = resistência dos resistores ⇒ X ~ N (100,10 2 )
X = Média da amostra de n = 25 resistores
⇒ X ~ N ( µ ,σ
2 2
) ⇒ X ~ N (100,10 = 2)
n 25
Conseqüentemente a probabilidade desejada é dada por:
X − µ ) 95 − 100)
[
P X < 95 = P ] < = P[Z < −2.5] = 0.0062
σ 2
n
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 10
11. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Figura 3.12 Distribuição das pontuações médias obtidas quando arremessamos dados
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 11
12. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
3.5.1.3. DISTRIBUIÇÃO AMOSTRAL PARA DIFERENÇA DE DUAS MÉDIAS:
Agora consideremos o caso em que temos duas populações independentes. Faça a primeira
população ter uma média 1 e variância σ 12 e a segunda população ter uma média 2 e variância
σ 2 . Suponha que ambas as populações possam ser representadas pelo modelo normal. Então,
2
usando o fato de que combinações lineares de variáveis aleatórias normais têm distribuição normal,
podemos dizer que a distribuição amostral de X 1 − X 2 é normal, com média
µ X − X = µ X − µ X = µ1 − µ 2
1 2 1 2
e variância
σX
2
σX
2
σ 2
X1 − X 2
=σ 2
X1
+σ 2
X 21
= 1
+ 2
n1 n2
Portanto:
σ 12 σ2
2
X 1 − X 2 ~ N ( µ1 − µ 2 , + )
n1 n2
Se as duas populações não forem normalmente distribuídas, porem se ambos os tamanhos da
amostra n1 e n2 forem maiores que 30, podemos usar o teorema central do limite e considerar que
X 1eX 2 sigam aproximadamente distribuições normais independentes. Por conseguinte, a distribuição
amostral de X 1 − X 2 é aproximadamente normal, com média e variância dadas acima. Se n1 ou n2
forem menores que 30, então a distribuição amostral de X 1 − X 2 será aproximadamente normal,
com média e variância dadas acima, desde que a população da qual a amostra e retirada não seja
drasticamente deferente da normal.
Exemplo: A vida efetiva de um componente usado em um motor de uma turbina de um avião a jato
é uma variável aleatória, com media de 5.000 h e desvio-padrão de 40 h. A distribuição da vida efe-
tiva é razoavelmente próxima da distribuição normal. 0 fabricante do motor introduz uma melhoria
no processo de fabricação para esse componente, que aumenta a vida media para 5.050 h e diminui
o desvio-padrão para 30 h. Suponha que uma amostra aleatória de n1= 16 componentes seja
selecionada do processo "antigo" e uma amostra aleatória de n2 = 25 componentes seja selecionada
do processo "melhorado". Qual é a probabilidade de que a diferença nas duas médias amostrais
X 2 − X 1 I seja no mínimo de 25 h? Considere que o processo antigo e o melhorado possam ser
considerados como populações independentes.
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 12
13. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Solução:
X1 = tempo de vida do processo antigo ⇒ X 1 ~ N (5000,40 2 )
X2 = tempo de vida do processo melhorado ⇒ X 2 ~ N (5050,30 2 )
Logo:
2 2
X 1 ~ N (5000, 40 = 10) X 21 ~ N (5050, 30 = 6)
16 25
e
X 2 − X 1 ~ N (5050 − 5000,6 2 + 10 2 ) = N (50,136)
Desta forma:
25 − 50)
P[X 2 − X 1> 25] = P Z >
= P[Z > −2.14] = 1 − P[Z < −2.14] = 1 − 0.001617 = 0.9838
136
3.6. INTERVALOS DE CONFIANÇA:
3.6.1. INTRODUÇÃO:
Em muitas situações, uma estimativa pontual de um parâmetro, como foi vista até o
momento, não fornece informação completa para um engenheiro. Por exemplo, considere o
problema da condutividade térmica de ferro Armco. Usando uma temperatura de 100ºF e uma
potência de 550w, 10 medidas foram observadas obtendo-se uma média amostral de
x = 41.924 BTU/h.ft.oF. É improvável que a média verdadeira da condutividade térmica seja
exatamente igual a esse valor; assim, uma questão relevante aparece: quão próximo esta x da
média verdadeira? Calcular o erro-padrão da estimativa (desvio do estimador) é um guia aproximado
para a precisão da estimação. Outra abordagem é usar um intervalo de confiança para expressar o
grau de incerteza associado com uma estimativa.
Uma estimativa do intervalo de confiança de um parâmetro desconhecido θ é um intervalo da
forma l ≤ θ ≤ s em que os pontos finais l e s dependem do valor numérico da estatística θ da
ˆ
amostra para uma amostra particular. Uma vez que amostras diferentes produzirão valores
diferentes de θ e , conseqüentemente, valores diferentes dos pontos finais l e s, esses pontos finais
ˆ
são valores de variáveis aleatórias, como L e S, respectivamente. Da distribuição amostral da media
estatística e, seremos capazes de determinar valores de L e S, tal que a seguinte afirmação sobre
probabilidade seja verdadeira:
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 13
14. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
P[L≤θ≤S]=1-α
sendo 0 < α < 1. Assim, temos uma probabilidade de 1 - α de selecionar uma amostra que
produzira um intervalo contendo o valor verdadeiro de θ.
O intervalo resultante:
l≤θ≤s
é chamado de intervalo com 100(1 - α)% de confiança para o parâmetro θ . As grandezas l e s são
chamadas de limites inferior e superior de confiança, respectivamente, e (1 - α) é chamado de
coeficiente de confiança. A interpretação de um intervalo de confiança é que se um número infinito
de amostras aleatórias for calculado e um intervalo com 100(1 - α)% de confiança para θ for
calculado a partir de cada amostra, então 100(1 - α)% desses intervalos conterão o valor verdadeiro
de θ.
A situação e ilustrada na Figura 3.13, que mostra vários intervalos com 100(1 - α)% de
confiança para o parâmetro θ de uma distribuição. Os pontos nos centros dos intervalos indicam a
estimativa pontual de θ (ou seja, θ ). Note que um dos 25 intervalos não contém θ. Se esse fosse um
ˆ
intervalo com 95%, no final das contas, somente 5% dos intervalos não conteriam θ.
Figura 3.13. Construção repetida de um intervalo de confiança para θ
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 14
15. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Agora, na prática, obtemos somente uma amostra aleatória e calculamos um intervalo de
confiança. Uma vez que esse intervalo conterá ou não o valor verdadeiro de θ, não é razoável fixar
um nível de probabilidade a esse evento específico. A afirmação apropriada é: O intervalo observado
[l, s] contém o valor verdadeiro de θ, com 100(1 - α) de confiança. Essa afirmação tem uma
interpretação de freqüência; ou seja, não sabemos se a afirmação é verdadeira para essa amostra
especifica, mas o método usado para obter o intervalo [l, s] resulta em afirmações corretas em 100(
1- α)% do tempo.
O comprimento θ - l do intervalo observado de confiança é uma importante medida da qualidade
da informação obtida a partir da amostra. A metade do comprimento do intervalo θ - l ou s - θe
chamada de precisão do estimador. Quanto maior for o intervalo de confiança, mais confiantes
estaremos de que o intervalo realmente contém o valor verdadeiro de θ. Por outro lado, quanto
maior for o intervalo, menos informação teremos a respeito do valor verdadeiro de θ. Em uma
situação ideal, gostaríamos de obter um intervalo relativamente pequeno com alta confiança.
Em muitas situações práticas, é fácil encontrar os pontos finais que definem o intervalo de
confiança para um parâmetro. Por exemplo, os pontos finais para o intervalo de confiança para a
média µ de uma distribuição normal envolvem o erro-padrão da média amostral X . Na verdade, o
intervalo de confiança para µ é encontrado adicionando e subtraindo um múltiplo do erro-padrão
σ ou do erro-padrao estimado S , para a média amostral.
n n
Intervalos de confiança estão intimamente relacionados à outra técnica estatística de tomada de
decisão, chamada de teste de hipóteses. As hipóteses são apenas afirmações sobre os parâmetros
das distribuições de probabilidades. O objetivo é tomar decisões a respeito dessas afirmações.
Freqüentemente, essas decisões podem ser tomadas examinando a faixa de valores razoáveis para
um parâmetro a partir de um intervalo de confiança. A seguir, discutiremos e ilustraremos teste de
hipóteses relacionado à média populacional.
3.6.2. INTERVALO DE CONFIANÇA PARA MÉDIA µ:
A estimação pontual fixa um valor numérico que esteja satisfatoriamente próximo do
verdadeiro valor do parâmetro. A estimação intervalar, como apresentado no tópico anterior,
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 15
16. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
determina intervalos com limites aleatórios, que contenham o valor do parâmetro, com uma margem
de segurança prefixada.
Vimos ainda que para uma amostra suficientemente grande, independente da distribuição da
característica em estudo, a distribuição das médias amostrais em torno da média populacional é
σ
normal com desvio padrão n
(erro padrão (EP) da média). Quanto menor o valor de EP mais
próximas estarão às médias amostrais da média populacional .
Um estimador pontual com base em uma amostra especifica um único valor como estimativa
do parâmetro de interesse. Esse procedimento não permite julgar qual a possível magnitude do erro
que estamos cometendo. A forma usual de se considerar conjuntamente o estimador e a precisão
com que se estima o parâmetro é através dos intervalos de confiança que são baseados na
distribuição amostral do estimador pontual.
Qualquer intervalo de confiança tem duas partes: um intervalo calculado a partir dos dados e
um de nível confiança de 100(1 - α)%. Um intervalo usualmente assume a seguinte forma:
Estimativa Pontual ± margem de erro
O nível (ou coeficiente) de confiança (100(1 - α)%) é a taxa de sucesso do método que
produz o intervalo, ou ainda a cada n amostras (100(1 - α)%) irão conter o verdadeiro valor do
parâmetro.
Para toda estatística de interesse, é possível encontrar um intervalo de confiança da forma
acima apresentada. Nesse curso, nos limitaremos a estudar o caso onde o interesse é o estudo da
média da população.
3.6.2.1. INTERVALO DE CONFIANÇA PARA MÉDIA µ COM VARIÂNCIA
CONHECIDA:
Nossa primeira situação é aquela onde temos interesse em construir um intervalo de
confiança para a média µ, de uma característica que pode ser representada pelo modelo normal e
que a variância deste modelo é conhecida (situação pouco usual em termos práticos!).
Para estimar a média de uma população usamos a média X da amostra observada.
Qualquer que seja a amostra coletada, no intervalo de confiança definiremos um “erro” observado
em torno do valor médio, este “erro” é dado por e = ( x − µ ) , ou seja, o desvio da média amostral
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 16
17. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
em relação a verdadeira média populacional. Consideremos a variável aleatória “erro” dada
por ε = ( X − µ ) . Dividindo esta última expressão por σ
n
temos pelo Teorema Central do Limite que,
ε ( X − µ)
σ
= σ
~ N (0;1)
n n
Assim, fixado um valor (100(1 - α)%) tal que 0 < α < 1, podemos encontrar um valor de Zα/2 tal
que
P( ε < zα / 2 σ
n
) = 1−α
O índice de Zα/2 apresenta o valor α dividido por 2 uma vez que a “massa” α deve ser distribuída
igualmente em torno de 0. O valor de Zα/2 pode ser obtido da tabela da normal padrão.
(100(1 - α)%)
Podemos determinar a probabilidade de a estimativa pontual estar a uma determinada
distância da média verdadeira, ou seja, determinar a probabilidade de cometermos erros de
determinada magnitude. Por exemplo, α = 5% ⇒ (1-α)=0.95
P( ε < zα / 2 σ
n
) = 1−α
P( ε < 1,96 σ
n
) = 0,95
P( X − µ < 1,96 σ
n
) = 0,95
P(−1,96 σ
n
< X − µ < 1,96 σ
n
) = 0,95
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 17
18. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
P( X − 1,96 σ
n
< µ < X + 1,96 σ
n
) = 0,95
Portanto, o intervalo de confiança para , com coeficiente de confiança (100(1 - α)%) é dado
por
σ σ
IC ( µ ; (1 - α %) = [ X − zα / 2 , X + zα / 2 ]
n n
Valores para zα / 2 mais usuais:
Nível de Confiança 90% 95% 99%
Valor crítico: zα / 2 1.645 1.960 2.576
Amplitude do intervalo:
A amplitude do intervalo de confiança é dada pela diferença entre o extremo inferior e
superior, isto é,
σ σ σ
X + zα / 2 - ( X − zα / 2 ) = 2 zα / 2
n n n
É usual se referir à semi-amplitude, como o erro envolvido na estimação.
Exemplo 1: Um cientista descobriu que uma doença que afeta indivíduos de certa região está
relacionada com a concentração da substância A no sangue, sendo considerado doente todo
indivíduo para o qual a concentração de A é menor que 1,488 mg/cm3. Com o intuito de conhecer a
concentração da substância A no sangue em indivíduos desta região afetados pela moléstia em
estudo, o cientista avaliou um grupo 867 pessoas. Supondo que a concentração da substância A no
sangue, em indivíduos com a doença em estudo, tem distribuição normal com média desconhecida
e desvio padrão 0,4 mg/cm3 determine uma estimativa intervalar com 95% de confiança para o nível
médio da concentração de substância, sabendo que para esta amostra de 867 pessoas obteve-se
x =1,23.
Determinação do tamanho da amostra:
Este assunto pertence ao que na Estatística se denomina Teoria de Amostragem que não é
objeto deste curso, no entanto podemos calcular para algumas situações especiais, o tamanho da
amostra necessário, como uma aplicação de intervalos de confiança. Se o objetivo é estimar a média
podemos usar os intervalos anteriormente estabelecidos, para obter o tamanho da amostra. Para isto
precisamos fixar o maior erro da estimativa aceitável e o nível de confiança com o qual desejamos
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 18
19. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
σ
trabalhar. À medida que n cresce o erro padrão da média , decresce. Conseqüentemente o
n
intervalo de confiança torna-se mais estreito. Com isto, a média é estimada com maior precisão.
Em muitas situações, aumentar o tamanho da amostra implica em aumento de custo, por
exemplo, tempo, recursos financeiros, etc. Tem-se desta forma um impasse entre precisão na
estimativa de e o custo desta estimação. Idealmente, seria interessante analisarmos o problema
sob o ponto de vista de estimar µ, com precisão desejada e de acordo com os recursos disponíveis.
Entretanto, ignoraremos o fator custo e apenas consideraremos o problema de determinação do
tamanho da amostra para uma precisão pré-estabelecida.
Durante a fase do planejamento do experimento, o pesquisador pode estabelecer o erro
tolerável, e na estimação de . Esta margem de erro pode ser expressa como:
e = (x − µ)
Como já visto anteriormente o intervalo de confiança aleatório para é dado por:
σ σ
X − zα / 2 ≤ µ ≤ X + zα / 2
n n
que pode ser reescrito como
µ − X ≤ zα / 2 σ
n (1)
σ
O fator zα / 2 n é na verdade a precisão usada na estimação de através de x . Observe
que E = ( x − µ ) é a variável aleatória erro. Reescrevendo (1) como
E ≤ zα / 2σ / n
Igualando zα / 2σ / n ao erro e, pré-estabelecido pelo pesquisador, na pior das hipóteses
temos:
e = zα / 2σ / n
Portanto, o tamanho mínimo necessário da amostra para estimar com precisão e, é dado
por:
z ∗σ
2
n=
e
Sendo z* o valor crítico para o nível de confiança desejado.
3.6.2.2. INTERVALO DE CONFIANÇA PARA MÉDIA µ COM VARIÂNCIA
DESCONHECIDA:
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 19
20. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Nas situações praticas é usual conhecermos o modelo probabilístico (usualmente o normal,
nos problemas de Engenharia) associado à variável aleatória em estudo. Porém os parâmetros desse
modelo são desconhecidos na situação em estudo, portanto devem ser estimados a partir dos dados
da própria amostra. No caso do modelo normal, nessa situação tanto a média µ e a variância σ2 não
são conhecidos e seus valores serão estimados pela média e variância amostral.
Agora se a distribuição de X, variável em estudo é normal, então a média amostral X tem
distribuição N(µ, σ2/n). Se σ2 é conhecido, como vimos no tópico anterior, um intervalo de confiança
para µ, é dado por [X ± z * σ
n
] . Embora a situação de normalidade seja razoável em muitos
casos práticos, dificilmente se conhece a variância de uma população quando sua média é
desconhecida.
Quando σ2 é desconhecido, e a nossa amostra aleatória (X1,..., Xn) é constituída de
variáveis aleatórias independentes com densidade normal de média e variância σ2, utilizamos o
“melhor” estimador para σ2 que é por s2. Nesse caso, o intervalo de confiança é obtido utilizando-se
uma nova estatística:
X −µ
T= Sx
n
sendo s o estimador do desvio padrão σ . Temos que T também é uma variável aleatória, mas
apesar de X ter distribuição normal, o denominador de T envolve a variável aleatória S2, que fará
com que a função de densidade de T seja diferente da normal. Essa estatística tem distribuição
conhecida como t-Student com n-1 graus de liberdade, sendo n o tamanho da amostra. A forma da
distribuição t-Student é parecida com a da normal. É simétrica em relação a zero, mas apresenta
caudas “grossas”, ou seja, maior variância do que a normal. Aumentando-se o tamanho de amostra
n, a distribuição t de Student aproxima-se do modelo normal.
Pode-se observar, pela figura abaixo, que a distribuição t –Student é muito semelhante à
curva normal. À medida que aumentam os graus de liberdade, a distribuição t-Student aproxima-se
da distribuição normal padronizada (média = 0, desvio-padrão = 1). A curva normal padronizada é
um caso particular da distribuição t quando graus de liberdade tende ao infinito. Para os propósitos
práticos, os valores da distribuição t-Student aproximam-se dos valores da distribuição normal
padronizada relativamente depressa, tal que quando graus de liberdade= 30 esses valores são quase
idênticos.
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 20
21. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Para cada valor de graus de liberdade temos uma distribuição diferente.
O procedimento para a obtenção do intervalo é semelhante ao desenvolvido anteriormente.
Utilizando a estatística,
X −µ
T= Sx
~ tn −1
n
que nos permite construir o intervalo de confiança para µ. Para isto através da tabela da distribuição
tn-1, obtemos um valor de t* tal que
X −µ
P ( −t * ≤ Sx
≤ t*) = (1 − α )
n
Ou seja,
P( - t*≤ tn-1 ≤ t*)= 1-α
P( X − t * ≤ µ ≤ X +t* ) =1−α
Sx Sx
n n
Assim, um intervalo de confiança para µ com nível de confiança de 100(1-α) % é dado por:
IC ( µ ; (1 − α )) : [ X − t n −1, (α / 2) ; X + t n −1, (α / 2 )
Sx Sx
n n
]
tn −1, (α / 2 ) denota o percentil α/2 (que é equivalente ao percentil (1-(α/2) )da distribuição t-
Student com n-1 graus de liberdade. Assim, o intervalo de confiança para µ é centrado na estimativa
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 21
22. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
do efeito, e varia de uma quantidade t * desvios padrão para baixo até o mesmo número de desvios
padrão para cima.
Exemplo 3: Em uma pesquisa para toxinas produzidas por um parasita que infecta as safras de
milho, um bioquímico preparou extratos da cultura do parasita com solventes orgânicos e mediu a
quantidade de substância tóxica por grama de solução. Para uma amostra de 9 culturas encontrou
uma quantidade média de substância tóxica igual a 1,02 miligramas e um desvio padrão de 0,26
miligramas. Seja µ a verdadeira quantidade média de substância tóxica. Construir um Intervalo de
95% de confiança para µ.
Observação:
• Se variância σ2 for desconhecida e a variável não tem densidade normal, é necessário considerar
um tamanho de amostra suficientemente grande. Pois, nesse caso, é sabido que S2 se aproxima
de σ2 de tal forma que seu uso, juntamente com aplicação do Teorema Central do Limite,
X −µ
permite considerar X como tendo distribuição Normal. Conseqüentemente Sx
~ N (0,1) , e
n
um intervalo de confiança γ para é dado por:
IC ( µ ; (1 − α )) : [ X − z(α / 2 ) ; X + z(α / 2 )
Sx Sx
n n
]
Exemplo 4: Para estimar o rendimento semanal de operários de construção de uma grande cidade,
um sociólogo seleciona uma amostra aleatória de 75 operários. A média amostral é dada por x =
427,00 reais e s= 15,00 reais. Determine um intervalo de confiança para µ considerando coeficientes
de confiança 0,90 e 0,95.
3.6.3. INTERVALO DE CONFIANÇA PARA DIFERENÇAS DE
MÉDIAS:
Engenheiros e cientistas estão freqüentemente interessados em comparar duas condições diferentes,
com o objetivo de determinar se as mesmas produzem diferentes resultados na resposta que esta
sendo observada. Essas condições são chamadas na maioria das vezes de tratamentos.
Consideremos a seguinte situação: Dois tratamentos são definidos por duas diferentes formulações
de tinta (formulação padrão e uma nova formulação) e a resposta é o tempo de secagem. O objetivo
do estudo é determinar se a nova formulação resulta redução do tempo de secagem.
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 22
23. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Nesse caso, o objetivo do estudo passa pelo estudo das médias observadas em amostras de
unidades de observação submetidas aos dois tratamentos em estudos (diferentes formulações, no
exemplo).
Uma das formas possíveis de analisar o comportamento de dois tratamentos é o estudo da
diferença de suas médias. A partir do valor estimado, a partir da amostra, podermos identificar que
tratamento apresenta melhor desempenho na resposta de interesse.
Portanto, para análise do problema utilizaremos a distribuição da estatística “diferença de
duas médias” apresentada em
Lembrando:
Se o primeiro tratamento tem uma media 1 e variância σ 12 e o segundo tratamento tem uma
media 2 e variância σ 2 . Supondo que ambas as populações possam ser representadas pelo
2
modelo normal ou que as condições do Teorema Central do Limite são satisfeitas, podemos dizer que
a distribuição amostral de X 1 − X 2 é normal, com media
µ X − X = µ X − µ X = µ1 − µ 2
1 2 1 2
e variância
σX
2
σX
2
σ 2
X1 − X 2
=σ 2
X1
+σ 2
X 21
= 1
+ 2
n1 n2
Portanto:
σ 12 σ2
2
X 1 − X 2 ~ N ( µ1 − µ 2 , + )
n1 n2
A distribuição amostral da diferença entre duas médias nos leva a considerar, para fins de
obtenção de um intervalo de confiança, as seguintes situações:
• Variâncias dos diferentes grupos (tratamentos) são conhecidas;
• Variâncias dos diferentes grupos (tratamentos) são desconhecidas e portanto também
precisam ser estimadas na amostra;
Mas temos ainda que, para ambos os casos precisamos considerar se as variâncias são iguais ou
diferentes nos diferentes tratamentos, surge ai também duas alternativas:
• Variâncias Iguais;
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 23
24. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
• Variâncias Diferentes;
3.6.3.1. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COM
VARIÂNCIAS CONHECIDAS:
Considerando o resultado acima apresentado:
σ 12 σ2
2
X 1 − X 2 ~ N ( µ1 − µ 2 , + )
n1 n2
e utilizando os mesmos procedimentos utilizados no caso de uma amostra, podemos facilmente
mostrar que um intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado
por:
σ 12 σ 2
2
σ 12 σ 2
2
X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2 +
n1 n2 n1 n2
ou seja:
σ 12 σ 2
2
σ 12 σ 2
2
P X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2 + = 1−α
n1 n2 n1 n2
Exemplo:
Testes de resistência à tensão foram realizados em duas estruturas contendo dois teores de
alumínio. Essas estruturas foram usadas na fabricação das asas de um avião comercial. De
experiências passadas com o passado de fabricação dessas estruturas e com o procedimento de
testes, os desvios-padrão das resistências a tensão são considerados conhecidos e dados por 1.0 no
caso da estrutura 1 e de 1.5 na estrutura 2. Uma amostra de 10 unidades da estrutura 1 resultaram
em uma resistência a tensão média de 87.6 enquanto que uma amostra de 12 unidades da estrutura
2 resultou em uma média de 74.5. Encontre um intervalo de confiança de 90% para a diferença das
médias de resistência a tensão das duas estruturas.
Solução: Seja:
X1 = resistência a tensão na estrutura 1
X2 = resistência a tensão na estrutura 2
Considerando ainda que em ambos os casos a resistência a tensão pode ser representada por um
modelo normal, temos que:
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 24
25. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
σ 12 σ2
2
1 1 .5 2
X 1 − X 2 ~ N ( µ1 − µ 2 , + ) ⇒ X 1 − X 2 ~ N ( µ1 − µ 2 , + )
n1 n2 10 12
e o intervalo de confiança é dado por:
σ 12 σ 2 2
σ 12 σ 2
2
X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 + zα / 2 + =
n1 n 2 n1 n2
1 1 .5 2 1 1 .5 2
87.6 − 74.5 − zα / 2 + ≤ µ1 − µ 2 ≤ 87.6 − 74.5 + zα / 2 + =
10 12 10 12
1 1 .5 2 1 1 .5 2
13.1 − 1.645 + ≤ µ1 − µ 2 ≤ 13.1 + 1.645 + =
10 12 10 12
[13.1 − 0.88 ≤ µ1 − µ 2 ≤ 13.1 + 0.88] =
[12.22 ≤ µ1 − µ 2 ≤ 13.98]
Questão:
Qual o significado destes intervalos ser todo positivo?
Observação:
Se as variâncias dos diferentes tratamentos (grupos) além de conhecidas forem iguais, temos que:
σ 12 = σ 2 = σ 2 então a expressão do intervalo de confiança fica simplificada da seguinte forma:
2
1 1 1 1
X 1 − X 2 − z α / 2σ + ≤ µ1 − µ 2 ≤ X 1 − X 2 − zα / 2σ +
n1 n 2 n1 n 2
3.6.3.2. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COM
VARIÂNCIAS DESCONHECIDAS E IGUAIS:
Nessa situação consideramos que a variância dos dois tratamentos em estudo são
desconhecidos, logo devem também ser estimados pela amostra. Porém, embora desconhecidas,
têm-se a informação que as variâncias dos dois tratamentos são iguais. Nesse caso temos:
σ 2 σ 2 1 1
X 1 − X 2 ~ N µ1 − µ 2 , 1 + 2 ⇒ X 1 − X 2 ~ N ( µ1 − µ 2 , σ 2 +
n n n
1 n2
1 2
Problema:
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 25
26. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Considerando que as variância são desconhecidas, porém iguais e que é possível obter uma
estimativa para variância amostral em cada um dos tratamentos, como estimamos, a partir desses
valores, a variância que é igual para ambos os tratamentos?
Consideremos:
• uma amostra de tamanho n1 do tratamento 1 com variância estimada denotada por S12 ;
• 2
uma amostra de tamanho n2 do tratamento 2 com variância estimada denotada por S 2 ;
Parece ser razoável combinar as duas variâncias da amostras S12 e S 2 para se obter um estimador
2
único para variância. Este estimador, denominado estimador combinado (pooled estimator) de
σ2 é definido por:
(n1 − 1) S12 + (n 2 − 1) S 2
2
Sp =
2
n1 + n 2 − 2
conseqüentemente, pelos mesmos motivos expostos quando do estudo para a situação de uma única
média com variância desconhecida temos que
(X 1 − X 2 ) − (µ1 − µ 2 ) ~ t
n1 + n2 − 2
1 1
Sp +
n1 n2
e assim o intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por:
1 1 1 1
X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p + ≤ µ1 − µ 2 ≤ X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p +
n1 n2 n1 n2
Exemplo:
As análises de dois lotes de carbono de cálcio mostraram as cinzas (%) indicadas na tabela a
seguir. Construir um intervalo de confiança de 95% para à diferença de médias destes dois lotes.
Amostras Lote 1 Lote 2
1 1.7 5.9
2 5.9 6.9
3 1.5 3.6
4 4.1 4.3
5 5.9 8.0
6 1.7 2.0
7 3.7 4.8
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 26
27. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
8 3.1 6.8
9 1.7 9.1
10 3.2 1.5
Média Amostral xi 3.25 5.29
Variância Amostral S i2 2.805 6.263
Assim:
(n1 − 1) S12 + (n 2 − 1) S 2 9 * 2.805 + 9 * 6.263
2
Sp =
2
= = 4.53
n1 + n 2 − 2 10 + 10 − 2
e o intervalo de confiança é dado por:
1 1 1 1
3.25 − 5.29 − t18 (5%) 4.53 + ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t18 (5%) 4.53 +
10 10 10 10
1 1 1 1
= − 2.04 − 2.101 4.53 + ≤ µ1 − µ 2 ≤ −2.04 + 2.101 4.53 +
10 10 10 10
= [− 6.93 ≤ µ1 − µ 2 ≤ −2.85]
Observação: Qual o significado do intervalo conter apenas valores negativos?
3.6.3.3. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COM
VARIÂNCIAS DESCONHECIDAS E DIFERENTES:
Nessa situação temos que variância dos dois tratamentos em estudo são desconhecidas e
diferentes e a estimativa da variância amostral de cada grupo será utilizada como estimador das
mesmas.
• na amostra de tamanho n1 do tratamento 1, a variância estimada denotada por S12 será o
estimador de σ 12 ;
• 2
na amostra de tamanho n2 do tratamento 2, a variância estimada denotada por S 2 será o
estimador de σ 2 ;
2
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 27
28. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Dessa forma, pelos mesmos motivos expostos quando do estudo para a situação de uma
única média com variância desconhecida temos que
( X 1 − X 2 ) − ( µ1 − µ 2 ) ~ t
1 1
v
Sp +
n1 n2
com v dado por:
2
S12 S 2
2
n +n
v= 1 2
−2
2 2 2
S12 S2
n
1 + n2
n1 + 1 n2 + 1
e assim o intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por:
S12 S 2
2
S12 S 2
2
X 1 − X 2 − t v , (α / 2 ) + ≤ µ1 − µ 2 ≤ X 1 − X 2 − t v , ( α / 2 ) +
n1 n2 n1 n2
Exemplo: Refazer o exemplo anterior considerando variâncias diferentes.
Variâncias Amostrais S12 = 2.805 S 2 = 6.263
2
2
S12 S 2
2
2.805 6.263
2
n + +
n2 (0.2805 + 0.6263)2 − 2
v = 12 10 10
−2= −2=
S1
2 2 2
S2 2.805
2
6.263
2
(0.2805)2 + (0.6263)2
n
1 + n2 10 + 10 11 11
n1 + 1 n2 + 1 11 11
.82
= − 2 = 14.4
.01 + .04
e
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 28
29. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
2.805 6.263 2.805 6.263
3.25 − 5.29 − t14 (5%) + ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t14 (5%) +
10 10 10 10
[
= − 2.04 − 2.145 .2805 + .6263 ≤ µ1 − µ 2 ≤ −2.04 + 2.145 .2805 + .6263 ]
= [− 2.04 − 1.44 ≤ µ1 − µ 2 ≤ −2.04 + 1.44]
= [− 3.48 ≤ µ1 − µ 2 ≤ −.60]
Interpretação:
Observações:
• Em todas as situações, temos que as expressões apresentadas são simplificadas
quando n1=n2.
• Como identificar do ponto de vista estatístico se as variâncias dos dois grupos são
iguais ou não? Veremos no próximo ponto.
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 29
31. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
3.7. TESTE DE HIPÓTESES:
3.7.1. INTRODUÇÃO:
Inferir significa tirar uma conclusão. A inferência estatística oferece-nos métodos para
tirarmos conclusões para a população a partir dos dados amostrais disponíveis, conclusões estas que
devem levar em conta a variabilidade natural dos dados. Na verdade, nos tópicos anteriores já
estabelecemos algumas formas de se obter conclusões a partir dos dados amostrais. O que será novo
a partir de agora é que recorremos à probabilidade para descrever a variação que se produz pelo
acaso.
Definimos anteriormente que a inferência estatística pode ser realizada a partir da estimação
(pontual e por intervalos) e através de testes de hipóteses. Na parte de estimação, vimos que os
intervalos de confiança são um dos tipos mais comuns de inferência estatística. Eles são apropriados
quando nosso objetivo é estimar um parâmetro populacional. Por outro lado, os testes de hipóteses,
também chamados de testes de significância, são direcionados a um objetivo diferente: avaliar a
evidência fornecida pelos dados sobre alguma afirmação feita sobre a população.
Especificamente, em problemas de Engenharia, muitos problemas exigem uma tomada de
decisão entre aceitar ou rejeitar uma afirmação a cerca de uma característica populacional. A
afirmação a ser investigada é denominada de hipótese e o procedimento de tomada de decisão
sobre a hipótese é o que denominamos de teste de hipótese. Por exemplo, suponha que estamos
interessados na taxa de queima de um propelente sólido, usado para fornecer energia aos sistemas
de escapamento de aeronaves. A taxa de queima é uma variável aleatória que pode ser descrita por
um modelo de probabilidade. O interesse no problema consiste em verificar se a taxa média de
queima (parâmetro do modelo de probabilidade) é ou não equivalente a 50 cm/s.
Os testes de hipóteses é um dos aspectos mais úteis da inferência estatística, uma vez que
muitos tipos de problemas de tomada de decisão, teste ou experimentos, no mundo da engenharia,
podem ser formulados como um problema desse tipo. Podemos considerar o teste estatístico de
hipóteses como o estágio da análise de dados de um experimento comparativo, em que o
engenheiro, como no exemplo acima, deseja comparar a média de uma população a dado valor
especifico de interesse no problema. Esses experimentos comparativos simples são freqüentemente
encontrados na prática e fornecem uma boa base para problemas mais complexos de
planejamento de experimentos que serão discutidos as seguir.
Considerando que os métodos de inferência baseiam-se nas distribuições amostrais, eles
requerem um modelo probabilístico para os dados. Modelos probabilísticos confiáveis podem
aparecer de muitas maneiras, e a segurança do modelo e a confiabilidade da inferência são máximas
quando os dados são provenientes de um modelo apropriadamente aleatorizado. Quando utilizamos
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 31
32. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
a inferência estatística estamos considerando os dados como se eles fossem provenientes de uma
amostra aleatória ou de um experimento onde em alguma etapa de sua execução, houve uma forma
de atribuição ou sorteio aleatório. Caso isto não se verifique as nossas conclusões poderão ser objeto
de contestação.
Um teste de significância é um procedimento formal para comparar dados observados com
uma hipótese, cuja veracidade procura-se avaliar. A hipótese constitui-se em uma afirmação que se
faz sobre os parâmetros de uma população ou de um modelo. Os resultados de um teste são
expressos em termos de uma probabilidade que mede quão bem os dados e a hipótese concordam
entre si.
3.7.2. DEFINIÇÕES E CONCEITOS BÁSICOS:
Definição 1: Em estatística, uma hipótese, é uma afirmativa sobre uma propriedade da população,
ou ainda, uma afirmação sobre os parâmetros de uma ou mais populações.
Definição 2: Um teste de hipótese (ou teste de significâncias), é um procedimento para se
verificar a veracidade ou não de uma hipótese estatística.
Consideremos o exemplo da taxa de queima de um propeleno sólido, acima apresentado.
Nesse problema a tomada de decisão significa concluir por uma das duas seguintes alternativas.
H1 : A taxa média de queima do propeleno sólido é 50 cm/s.
H2 : A taxa média de queima do propeleno sólido não é 50 cm/s.
Sob ponto de vista estatístico, considerando que representa a taxa média de queima
populacional, as hipóteses acima são definidas como.
H0 : = 50 cm/s
H1 : ≠ 50 cm/s
A alternativa H1 ou Hipótese H0 é chamada de hipótese nula enquanto que a alternativa H2
ou hipótese H1 é chamada de hipótese alternativa.
Definição 3: A Hipótese Nula é a afirmativa de que o parâmetro populacional é igual a uma valor
específico.
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 32
33. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
Definição 4: A Hipótese Alternativa é a afirmativa de que o parâmetro populacional tem um valor
que, de alguma forma, difere da hipótese nula.
No exemplo, temos que a hipótese alternativa especifica valores de que podem ser maiores
ou menores que 50 cm/s, nessa situação dizemos que a hipótese alternativa é bilateral. Em
determinadas situações, podemos desejar formular uma hipótese unilateral, ou seja, verificar se o
valor de é especificamente maior ou menor que o valor definido pela hipótese nula. No exemplo:
H0 : = 50 cm/s ou H0 : = 50 cm/s
H1 : > 50 cm/s H1 : < 50 cm/s
O valor do parâmetro especificado da população na hipótese nula (50 cm/s, no exemplo), é
geralmente definido a partir de uma das três maneiras:
1. Pode ser resultado de experiências passadas ou de conhecimento do processo ou mesmo de
testes ou experimentos prévios;
2. O valor pode ser determinado, a partir de alguma teoria ou modelo relativo ao processo em
estudo;
3. O valor de parâmetro da população resulta de considerações externas, tais como valor de
projeto ou especificações de engenharia ou a partir de obrigações contratuais.
A partir de um teste de hipóteses verificamos se os dados provenientes da amostra são
consistentes com a hipótese em estudo. A medida que os dados forem consistentes com a hipótese,
concluiremos que a hipótese é verdadeira; no entanto se essa informação for inconsistente com a
hipótese, concluiremos que a hipótese é falsa. Destacamos que a veracidade ou falsidade de uma
hipótese especifica nunca pode ser conhecida com certeza, exceto se toda população fosse
observada, o que é usualmente impossível na prática.
A estrutura de problemas de testes de hipóteses será idêntica em todas as aplicações que
iremos considerar. A hipótese nula é aquela que se deseja testar. A rejeição dessa hipótese leva a
aceitação da hipótese alternativa. Testar a hipótese envolve considerar uma amostra aleatória,
calcular uma estatística de teste a partir dos dados amostrais e, então a partir da estatística de teste
tomar uma decisão com respeito à hipótese nula.
Definição 5: Uma estatística de teste é um valor calculado a partir dos dados amostrais e é
usada para tomar a decisão sobre a rejeição ou não da hipótese nula. Para isso faz-se necessário a
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 33
34. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística
comparação da estatística com um valor de referência a fim de ser possível a tomada de decisão de
rejeição ou não da hipótese.
Com o objetivo de ilustrar as definições e conceitos acima, considere o problema da taxa de
queima do propelente, introduzido anteriormente. A hipótese nula e a taxa média de queima ser 50
cm/s; a alternativa é: essa taxa não é igual a 50 cm/s. Ou seja, desejamos testar
H0 : = 50 cm/s
H1 : ≠ 50 cm/s
Suponha que uma amostra de n = 10 espécimes seja testada e que a taxa media de queima
da amostra x seja observada. A média amostral é uma estimativa da media verdadeira da
população. Um valor da media amostral x que caia próximo ao valor da hipótese de = 50 cm/s é
uma evidência de que a media verdadeira é realmente 50 cm/s; isto é, tal evidencia suporta a
hipótese nula Ho. Por outro lado, uma média amostral que seja consideravelmente diferente de 50
cm/s evidencia de que a hipótese alternativa H1 é valida. Assim, a média amostral é a estatística de
teste nesse caso.
A média amostral pode assumir muitos valores. Suponha que se 48,5 < x < 51,5, não
rejeitaremos a hipótese nula Ho: = 50. Se x < 48,5 ou x > 51,5, rejeitaremos a hipótese nula em
favor da hipótese alternativa H1: ≠ 50. Isso é ilustrado na Fig. 3.14. Os valores de x que forem
menores do que 48,5 e maiores do que 51,5 constituem a região critica para o teste, enquanto todos
os valores que estejam no intervalo 48,5 < x < 51,5 formam uma região para a qual falharemos em
rejeitar a hipótese nula. Por convenção, ela geralmente e chamada de região de aceitação. O limite
entre as regiões critica e a região de aceitação é chamada de valores críticos. Em nosso exemplo, os
valores críticos são 48,5 e 51,5. E comum estabelecer conclusões relativas a hipótese nula Ho. Logo,
rejeitaremos Ho em favor de H1 se a estatística de teste cair na região crítica e deixamos de
rejeitar H0 caso contrário.
Região Crítica 1 Região de não Rejeição de Ho Região Crítica 2
Figura 3.13 Critério de decisão no teste de H0 contra H1
Definição 6: Região crítica é definida pelo conjunto de valores para os quais a hipótese H0 é
rejeitada.
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 34