SlideShare ist ein Scribd-Unternehmen logo
1 von 53
Downloaden Sie, um offline zu lesen
UNIVERSIDADE FEDERAL DE SÃO CARLOS
  CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA
        DEPARTAMENTO DE ESTATÍSTICA




INTRODUÇÃO AO PLANEJAMENTO E ANÁLISE
     ESTATÍSTICA DE EXPERIMENTOS


               CAPÍTULO # 3
   INTRODUÇÃO     A   PROBABILIDADE        E A

        INFERÊNCIA ESTATÍSTICA

                PARTE # 2

      PROF. PEDRO FERREIRA FILHO
     PROFa. ESTELA MARIS P. BERETA


            2º SEMESTRE DE 2010
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística



3.4. INFERÊNCIA ESTATÍSTICA:

3.4.1. INTRODUÇÃO:


           O campo da inferência estatística consiste naqueles métodos usados para tomar decisões ou
tirar conclusões acerca de uma população. Esses métodos utilizam a informação contida em uma
amostra da população para tirar conclusões. Mostramos na Fig. 3.10 a relação entre uma população
e uma amostra. Este ponto inicia nosso estudo dos métodos estatísticos usados para a inferência e a
tomada de decisões.




                                      Figura 3.10. Relação entre uma população e uma amostra


    Inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e teste
de hipóteses. Como um exemplo de um problema de estimação de parâmetros, suponha que um
engenheiro de estruturas esteja analisando a resistência a tensão de um componente usado em um
chassi de automóvel. Uma vez que a variabilidade da resistência à tração esta naturalmente presente
entre componentes individuais, devido às diferenças nas bateladas da matéria-prima nos processos
de fabricação e nos procedimentos de medidas (por exemplo), o engenheiro está interessado na
estimação da resistência média a tração dos componentes. Na pratica, o engenheiro usara dados da
amostra para calcular um número que e, de algum modo, um valor razoável (ou tentativa) da média
verdadeira. Esse número é chamado de estimativa. Veremos que e possível estabelecer a precisão da
estimativa.

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   2
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


           Considere agora uma situação em que duas temperaturas diferentes de reação, como t1 e t2
possam ser usadas em um processo químico. O engenheiro conjectura que t1 resulta em rendimentos
maiores que t2 o teste estatístico de hipóteses e a estrutura para resolver problemas desse tipo.
Nesse caso, a hipótese seria que o rendimento médio usando a temperatura t1 é maior que o
rendimento médio usando a temperatura t2. Note que não há ênfase na estimação de rendimentos;
em vez disso, o foco esta na tirada de conclusões acerca de uma hipótese estabelecida.


3.4.2. DEFINIÇÕES                                E    PROPRIEDADES BÁSICAS:

  Na maioria dos problemas de inferência estatística, é impossível ou impraticável observar a
população inteira. Por exemplo, não poderíamos testar à resistência a tração de todos os elementos
estruturais dos chassis, pois consumiria muito tempo e seria muito caro. Além disso, alguns (talvez
muitos) desses elementos estruturais não existam mais no tempo em que a decisão deve ser feita;
assim, para uma larga extensão, temos de visualizar a população como conceitual. Logo,
dependemos de um conjunto de observações da população para ajudar a tomar decisões à cerca da
população.
           Para que nossas inferências sejam validas, a amostra tem que ser representativa da
população. É freqüentemente tentador selecionar uma amostra com as observações que sejam mais
convenientes ou exercer julgamento na seleção da amostra. Esses procedimentos podem
freqüentemente introduzir alguma tendência na amostra e, como resultado, o parâmetro de interesse
será consistentemente subestimado (ou superestimado) por tal amostra. Alem disso, o
comportamento de uma amostra de julgamento não pode ser estatisticamente descrito. Para evitar
essas dificuldades, é desejável selecionar uma amostra aleatória como o resultado de algum
mecanismo de chance. Conseqüentemente, a seleção de uma amostra e um experimento aleatório e
cada observação na amostra e o valor observado de uma variável aleatória. As observações na
população determinam a distribuição de probabilidades da variável aleatória.
    Para definir uma amostra aleatória, faça X ser uma variável aleatória que represente o resultado
de uma seleção de uma observação proveniente da população. Faça f(x) denotar a função densidade
de probabilidade de X Suponha que cada observação na amostra seja obtida independentemente,
sob condições inalteradas. Ou seja, as observações para a amostra são obtidas, observando-se X
independentemente, sob condições inalteradas, isto é, n vezes. Faça X denotar a variável aleatória
que representa a i-ésima replica. Então, X1, X2, ..., Xn é uma amostra aleatória e os valores numéricos
obtidos são denotados por x1, x2,...,xn. As variáveis aleatórias em uma amostra aleatória são
independentes, com a mesma distribuição de probabilidades f(x), por causa das condições idênticas
sob as quais cada observação é obtida. Isto é, a função densidade de probabilidade marginal de X1,


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   3
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


X2, ...,Xn e fx1,x2,...,xn(x1, x2,...,xn), respectivamente, e pela independência, a função densidade de
probabilidade conjunta da amostra aleatória é f(x1)f(x2)...f(xn).

Definição 1: As variáveis aleatórias (X1,X2,...,Xn) são uma amostra aleatória de tamanho n, se: (a)
os X’s são variáveis aleatórias independentes (b) todos os Xi’s tiverem a mesma distribuição de
probabilidade.


    Para ilustrar essa definição, suponha que estejamos investigando a vida efetiva de serviço de um
componente eletrônico usado em um marca-passo cardíaco e que a vida do componente seja
normalmente distribuída. Então, esperaríamos que cada uma das observações da vida do
componente Xl, X2, ..., Xn em uma amostra aleatória de n componentes fosse uma variável aleatória
independente com, exatamente, a mesma distribuição normal. Depois dos dados serem coletados, os
valores numéricos dos tempos de vida observados são denotados por x1,x2,...,xn.
           A finalidade principal de tomar uma amostra aleatória e obter informação sobre os
parâmetros desconhecidos da população.


Definição 2: Uma estatística é qualquer função das observações de uma amostra aleatória.


    Encontramos estatísticas anteriormente. Por exemplo, se X1, X2, ...,Xn. for uma amostra aleatória
de tamanho n, então a média da amostra X , a variância da amostra S2 e o desvio-padrão S da
amostra são estatísticas. O processo de tirar conclusões sobre a população, baseando-se nos dados
da amostra, faz uso considerável dessas estatísticas.
    Desde que uma estatística seja uma variável aleatória, ela terá uma distribuição de probabilidades.
Chamamos a distribuição de probabilidades de uma estatística de distribuição amostral. A noção de
uma distribuição amostral é muito importante e será discutida e ilustrada mais adiante neste capitulo.
    Uma aplicação muito importante de estatísticas e a obtenção das estimativas dos parâmetros, tais
como a media da população e a variância da população. Em problemas de inferência, é conveniente
ter um símbolo geral para representar o parâmetro de interesse. Usaremos o símbolo grego θ (teta)
para representar o parâmetro. O objetivo da estimação e selecionar um único número baseado nos
dados da amostra, sendo esse o valor mais plausível para θ. Um valor numérico de uma estatística
amostra será usado como a estimativa.


Definição 3: Uma estimativa pontual de algum parâmetro θ da população é um único valor

numérico de uma estatística θ .
                             ˆ



Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   4
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


   Como um exemplo, suponha que a variável aleatória X seja normalmente distribuída com uma

média desconhecida              µ. A média da amostra é um estimador da média desconhecida µ da população.
Isto é µ = X . Depois de a amostra ter sido selecionada, o valor numérico x e a estimativa de
       ˆ                                                                                                                                           µ.
Assim, se x1 = 25, x2 = 30, x3 = 29 e x4 = 31, então a estimativa de                                      µé
                                                               25 + 30 + 29 + 31
                                                        X =                      = 28.75
                                                                       4
Similarmente, se a variância da população σ2 for também desconhecida, um estimador para σ2
será a variância da amostra S2 e o valor numérico s2 = 6.9, calculado a partir dos dados amostrais,
é chamado de estimativa de σ2.
   Problemas de estimação ocorrem freqüentemente em engenharia. Geralmente, necessitamos
estimar:

     •     A média       µ de uma única população;

     •     A variância σ2 (ou desvio-padrão σ) de uma única população;

     •     A proporção p de itens em uma população que pertence a uma classe de interesse;.

     •     A diferença nas médias de duas populações,                            µ1 - µ2;.

     •     A diferença nas proporções de duas populações, p1 – p2;


   Estimativas razoáveis desses parâmetros são dadas a seguir:

     •     Para    µ, a estimativa é µ = x , a média da amostra.
                                     ˆ

     •     Para σ2 a estimativa é σ 2 = s 2 a variância da amostra.
                                   ˆ

     •     Para p, a estimativa é p 2 = x
                                  ˆ
                                                          n
                                                              a proporção da amostra, sendo x o numero de itens em uma

           amostra aleatória de tamanho n que pertence a classe de interesse.

     •     Para    µ1 - µ2, a estimativa é µ1 − µ 2 = x1 − x 2
                                           ˆ    ˆ                                     a diferença entre as médias de duas amostras

           aleatórias independentes.

     •     Para p1 – p2 a estimativa é p1 − p 2 , a diferença entre duas proporções amostrais, calculadas
                                       ˆ    ˆ
           a partir de duas amostras aleatórias independentes.

   Podemos ter varias escolhas diferentes para o estimador pontual de um parâmetro. Por
exemplo, se desejarmos estimar a média de uma população, podemos considerar como


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta    5
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


estimadores a média ou a mediana da amostra ou talvez a média das observações menores e
maiores da amostra. De modo a decidir qual estimador de um parâmetro particular é o melhor
para se usar, necessitamos examinar suas propriedades estatísticas e desenvolver algum critério
para comparar os estimadores.

   Os critérios para escolha do “melhor” estimador para um determinado parâmetro populacional
são definidos a partir de “propriedades” desejáveis destes estimadores. As propriedades mais
consideradas são:


Propriedade 1: Um estimador θ é não viciado (ou não tendencioso) para um parâmetro
                             ˆ

populacional θ se:

                                                                          ()
                                                                      Eθ =θ
                                                                        ˆ

            Essa propriedade diz que um estimador deve estar "perto", de algum modo, do valor ver-

dadeiro do parâmetro desconhecido. Formalmente, dizemos que θ é um estimador não tendencioso
                                                             ˆ

de θ, se o valor esperado de θ for igual a θ. Isso é equivalente a dizer que a média da distribuição
                              ˆ

de probabilidades de θ (ou a media da distribuição amostral de θ) é igual a θ.

Propriedade 2: Sejam θ1 e θ 2 dois estimadores não viciados de um parâmetro θ. θ1 é mais eficiente do
                      ˆ    ˆ                                                    ˆ

que   θˆ2   se:


                                                               Var( θ1 ) < Var( θ 2 )
                                                                     ˆ           ˆ

ou seja, um estimador é mais eficiente quanto menor for a sua variância, ou ainda, quanto mais
preciso (menor dispersão) ele for.


Definição 4: Se considerarmos todos os estimadores não viciados de um parâmetro θ, aquele com
menor variância será denominado de estimador não viciado de menor variância.

            A interpretação das propriedades acima pode ser observada a partir da seguinte situação:

            Deseja-se comprar um rifle, e após algumas seleções, restaram quatro alternativas que
denominamos de rifles A, B, C e D. Realiza-se um teste para cada um dos rifles que consistiu em
fixá-lo num cavalete, mirar o centro de um alvo e disparar 15 tiros. Os resultados estão na figura
3.11.




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   6
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística




                                          Figura 3.11 Resultados de 15 tiros dados por 4 rifles

Questão: Qual o melhor rifle?

Características:

Rifle A: Não viciado com baixa precisão (grande dispersão ou variância);

Rifle B: Viciado com baixa precisão;

Rifle C: Não viciado com boa precisão;

Rifle D: Viciado com alta precisão;



3.4.3. MÉTODOS                             DE      ESTIMAÇÃO:
           A forma de obtenção de um estimador para um dado parâmetro populacional, de preferência
com as propriedades desejáveis, pode ser feita utilizando-se diferentes procedimentos chamados de
métodos de estimação. Esses métodos não serão aqui apresentados e podem ser vistos, por
exemplo, em Montgomery e Runger (ver bibliografia do curso). Destacamos que os principais
métodos de estimação são:

     •     Métodos dos Momentos;

     •     Método da Máxima Verossimilhança;

     •     Método dos Mínimos Quadrados;
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   7
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística



3.5. DISTRIBUIÇÕES AMOSTRAIS:

           A inferência estatística como vimos anteriormente, tem por objetivo tomar decisões acerca de
uma população, baseando-se na informação contida em uma amostra aleatória proveniente daquela
população. Por exemplo, podemos estar interessados no volume médio de enchimento de uma lata
de refrigerante. O volume médio de enchimento na população e 300 ml. Um engenheiro considera
uma amostra aleatória de 25 latas e calcula o volume médio amostral de enchimento como x = 298

ml. 0 engenheiro decidirá, provavelmente, que a média da população é                                             µ = 300 ml, muito embora a
média amostral tenha sido 298 ml, porque ele sabe que a média amostral é uma estimativa razoável

de   µ     e que com a média amostral de 298 ml é muito provável de ocorrer, mesmo se a média

verdadeira da população for                  µ    = 300 ml. De fato, se a média verdadeira for 300 ml, então os testes

de 25 latas feitos repetidamente, talvez a cada 5 minutos, produzirão valores de x que variarão

acima e abaixo de            µ = 300 ml.
     A média amostral e uma estatística; isto e, ela e uma variável aleatória que depende dos
resultados obtidos em cada amostra particular. Uma vez que uma estatística e uma variável aleatória,
ela tem uma distribuição de probabilidades.


Definição: A distribuição de probabilidades de uma estatística e chamada de uma distribuição
amostral.
           Por exemplo, a distribuição de probabilidades de X é chamada de distribuição
amostral da média.
           A distribuição amostral de uma estatística depende da distribuição da população, do tamanho
da amostra e do método de seleção da amostra. A próxima seção deste capítulo apresenta talvez a
mais importante distribuição amostral. Outras distribuições amostrais e suas aplicações serão
ilustradas quando necessárias (por exemplo, a distribuição amostral da variância amostral).


3.5.1. DISTRIBUIÇÃO AMOSTRAL                                                      DA       MÉDIA:


3.5.1.1. DISTRIBUIÇÃO AMOSTRAL                                                PARA UMA                MÉDIA:


           Considere a determinação da distribuição amostral da média X da amostra. Suponha que

uma amostra aleatória de tamanho n seja retirada de uma população normal com média                                                                 µ   e


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta       8
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística



variância      σ2. Então, pela propriedade reprodutiva da distribuição normal, concluímos que a média da
                                                                                                                                  σ2
amostra tem uma distribuição normal com média µ X = µ e variância σ X =
                                                                    2
                                                                                                                                         , ou seja, a
                                                                                                                                    n
distribuição da média da amostra tem como média o mesmo valor da média da populacional da
característica em estudo (estimador não viciado) e variância igual à variância populacional dividida
pelo tamanho da amostra.
Notação:

                                             Se X i ~ N ( µ , σ 2 ) então X ~ N ( µ , σ
                                                                                                          2
                                                                                                                  )
                                                                                                              n
Observação: Propriedade reprodutiva ⇒ Uma combinação linear de variáveis aleatórias normais é
também normal.


   Se estivermos amostrando de uma população que tenha uma distribuição desconhecida de
probabilidades, a distribuição amostral da média da amostra será aproximadamente normal, com

média      µ   e variância         σ2/n,       se o tamanho n da amostra for grande. Esse é um dos mais úteis

teoremas em estatística, o chamado teorema central do limite.


3.5.1.2. TEOREMA                          DO      LIMITE CENTRAL:

           Se X1, X2 ,..., Xn representa uma amostra aleatória de tamanho n de uma variável X
com média              e variância finita σ2, obtida em uma população (finita ou infinita) e se X for a
média da amostra, então a forma limite da distribuição para n grande é dada por
                                                                             X − µ)
                                                                      Z=
                                                                               σ
                                                                                   n
Interpretação: O Teorema Central do Limite nos diz que, independente da distribuição que
a característica em estudo pode ser representada, a medida que o tamanho da amostra
aumenta, a distribuição amostral da média X pode ser representada pelo modelo normal.
           A qualidade da aproximação normal para X depende do tamanho n da amostra. A
Fig. 3.12(a) mostra a distribuição obtida para o arremesso de um único dado verdadeiro com
seis faces. As probabilidades são iguais a (1/6) para todos os valores obtidos, 1,2,3,4,5 ou 6.
A Fig. 3.12(b) mostra a distribuição das pontuações médias obtidas quando arremessando
três, cinco e dez vezes o dado, respectivamente. Note que, embora a população (um dado)
esteja relativamente longe da normal, a distribuição das medias será aproximada

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta    9
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


razoavelmente bem pela distribuição normal, para amostras de tamanho tão pequeno
quanto cinco. (As distribuições dos arremessos dos dados são discretas, enquanto a normal
e continua.) Embora o teorema central do limite trabalhe bem para pequenas amostras (n =
4, 5) na maioria dos casos, particularmente onde a população seja continua, unimodal e
simétrica, amostras maiores serão necessária em outras situações, dependendo da forma da
população. Em muitos casos de interesse prático, se n ~ 30, a aproximação normal será
satisfatória, independente da formal da população. Se n < 30, o teorema central do limite
funcionara, se a distribuição da população não for muito diferente da normal.


Exemplo: Uma companhia eletrônica fabrica resistores que têm uma resistência média de 100Ω e
um desvio padrão de 10Ω. A distribuição das resistências pode ser representada pelo modelo normal.
Encontre a probabilidade de uma amostra aleatória de tamanho n = 25 resistores ter uma resistência
média menor que 95Ω?
Solução:
X = resistência dos resistores ⇒ X ~ N (100,10 2 )

X      = Média da amostra de n = 25 resistores

⇒ X ~ N ( µ ,σ
                         2                         2
                                 ) ⇒ X ~ N (100,10                = 2)
                             n                               25
Conseqüentemente a probabilidade desejada é dada por:

                                      X − µ ) 95 − 100) 
                             [
                        P X < 95 = P    ]    <           = P[Z < −2.5] = 0.0062
                                      σ           2     
                                         n              




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   10
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística




                  Figura 3.12 Distribuição das pontuações médias obtidas quando arremessamos dados




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   11
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


3.5.1.3. DISTRIBUIÇÃO AMOSTRAL                                                     PARA         DIFERENÇA            DE     DUAS MÉDIAS:


Agora consideremos o caso em que temos duas populações independentes. Faça a primeira

população ter uma média                      1   e variância σ 12 e a segunda população ter uma média                                     2   e variância

σ 2 . Suponha que ambas as populações possam ser representadas pelo modelo normal. Então,
  2


usando o fato de que combinações lineares de variáveis aleatórias normais têm distribuição normal,
podemos dizer que a distribuição amostral de X 1 − X 2 é normal, com média

                                                         µ X − X = µ X − µ X = µ1 − µ 2
                                                              1     2          1           2


e variância

                                                                                               σX
                                                                                                2
                                                                                                            σX
                                                                                                             2

                                                     σ   2
                                                         X1 − X 2
                                                                    =σ    2
                                                                          X1
                                                                               +σ   2
                                                                                    X 21
                                                                                           =        1
                                                                                                        +        2

                                                                                               n1           n2
Portanto:

                                                                                               σ 12         σ2
                                                                                                             2
                                                      X 1 − X 2 ~ N ( µ1 − µ 2 ,                        +        )
                                                                                               n1           n2
           Se as duas populações não forem normalmente distribuídas, porem se ambos os tamanhos da
amostra n1 e n2 forem maiores que 30, podemos usar o teorema central do limite e considerar que
X 1eX 2 sigam aproximadamente distribuições normais independentes. Por conseguinte, a distribuição

amostral de X 1 − X 2 é aproximadamente normal, com média e variância dadas acima. Se n1 ou n2

forem menores que 30, então a distribuição amostral de X 1 − X 2 será aproximadamente normal,

com média e variância dadas acima, desde que a população da qual a amostra e retirada não seja
drasticamente deferente da normal.


Exemplo: A vida efetiva de um componente usado em um motor de uma turbina de um avião a jato
é uma variável aleatória, com media de 5.000 h e desvio-padrão de 40 h. A distribuição da vida efe-
tiva é razoavelmente próxima da distribuição normal. 0 fabricante do motor introduz uma melhoria
no processo de fabricação para esse componente, que aumenta a vida media para 5.050 h e diminui
o desvio-padrão para 30 h. Suponha que uma amostra aleatória de n1= 16 componentes seja
selecionada do processo "antigo" e uma amostra aleatória de n2 = 25 componentes seja selecionada
do processo "melhorado". Qual é a probabilidade de que a diferença nas duas médias amostrais
X 2 − X 1 I seja no mínimo de 25 h? Considere que o processo antigo e o melhorado possam ser
considerados como populações independentes.



Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta      12
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


Solução:
X1 = tempo de vida do processo antigo ⇒ X 1 ~ N (5000,40 2 )

X2 = tempo de vida do processo melhorado ⇒ X 2 ~ N (5050,30 2 )

Logo:
                          2                                              2
X 1 ~ N (5000, 40                  = 10)     X 21 ~ N (5050, 30                   = 6)
                              16                                             25
e
                                           X 2 − X 1 ~ N (5050 − 5000,6 2 + 10 2 ) = N (50,136)
Desta forma:

                           25 − 50) 
P[X 2 − X 1> 25] = P  Z >
                     
                                     = P[Z > −2.14] = 1 − P[Z < −2.14] = 1 − 0.001617 = 0.9838
                             136 



3.6. INTERVALOS DE CONFIANÇA:

3.6.1. INTRODUÇÃO:

           Em muitas situações, uma estimativa pontual de um parâmetro, como foi vista até o
momento, não fornece informação completa para um engenheiro. Por exemplo, considere o
problema da condutividade térmica de ferro Armco. Usando uma temperatura de 100ºF e uma
potência de 550w, 10 medidas foram observadas obtendo-se uma média amostral                                                                         de

 x = 41.924 BTU/h.ft.oF. É improvável que a média verdadeira da condutividade térmica                                                              seja

exatamente igual a esse valor; assim, uma questão relevante aparece: quão próximo esta x da
média verdadeira? Calcular o erro-padrão da estimativa (desvio do estimador) é um guia aproximado
para a precisão da estimação. Outra abordagem é usar um intervalo de confiança para expressar o
grau de incerteza associado com uma estimativa.
           Uma estimativa do intervalo de confiança de um parâmetro desconhecido θ é um intervalo da

forma l ≤ θ ≤ s em que os pontos finais l e s dependem do valor numérico da estatística θ da
                                                                                         ˆ

amostra para uma amostra particular. Uma vez que amostras diferentes produzirão valores

diferentes de θ e , conseqüentemente, valores diferentes dos pontos finais l e s, esses pontos finais
               ˆ
são valores de variáveis aleatórias, como L e S, respectivamente. Da distribuição amostral da media
estatística e, seremos capazes de determinar valores de L e S, tal que a seguinte afirmação sobre
probabilidade seja verdadeira:


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta    13
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística



                                                        P[L≤θ≤S]=1-α


sendo 0 <          α    < 1. Assim, temos uma probabilidade de 1 -                                   α    de selecionar uma amostra que

produzira um intervalo contendo o valor verdadeiro de θ.
           O intervalo resultante:
                                                                        l≤θ≤s

é chamado de intervalo com 100(1 -                        α)% de confiança para o parâmetro θ . As grandezas l e s são
chamadas de limites inferior e superior de confiança, respectivamente, e (1 -                                                    α)    é chamado de

coeficiente de confiança. A interpretação de um intervalo de confiança é que se um número infinito

de amostras aleatórias for calculado e um intervalo com 100(1 -                                              α)%       de confiança para θ for

calculado a partir de cada amostra, então 100(1 -                              α)% desses intervalos conterão o valor verdadeiro
de θ.

           A situação e ilustrada na Figura 3.13, que mostra vários intervalos com 100(1 -                                                         α)%   de

confiança para o parâmetro θ de uma distribuição. Os pontos nos centros dos intervalos indicam a

estimativa pontual de θ (ou seja, θ ). Note que um dos 25 intervalos não contém θ. Se esse fosse um
                                   ˆ

intervalo com 95%, no final das contas, somente 5% dos intervalos não conteriam θ.




                               Figura 3.13. Construção repetida de um intervalo de confiança para θ
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta         14
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística




           Agora, na prática, obtemos somente uma amostra aleatória e calculamos um intervalo de

confiança. Uma vez que esse intervalo conterá ou não o valor verdadeiro de                                                θ,   não é razoável fixar

um nível de probabilidade a esse evento específico. A afirmação apropriada é: O intervalo observado

[l, s] contém o valor verdadeiro de                          θ,    com 100(1 -           α)    de confiança. Essa afirmação tem uma

interpretação de freqüência; ou seja, não sabemos se a afirmação é verdadeira para essa amostra
especifica, mas o método usado para obter o intervalo [l, s] resulta em afirmações corretas em 100(

1-   α)% do tempo.
    O comprimento            θ   - l do intervalo observado de confiança é uma importante medida da qualidade

da informação obtida a partir da amostra. A metade do comprimento do intervalo                                                     θ   - l ou s -     θe
chamada de precisão do estimador. Quanto maior for o intervalo de confiança, mais confiantes

estaremos de que o intervalo realmente contém o valor verdadeiro de                                                 θ.   Por outro lado, quanto

maior for o intervalo, menos informação teremos a respeito do valor verdadeiro de                                                          θ.      Em uma

situação ideal, gostaríamos de obter um intervalo relativamente pequeno com alta confiança.
    Em muitas situações práticas, é fácil encontrar os pontos finais que definem o intervalo de
confiança para um parâmetro. Por exemplo, os pontos finais para o intervalo de confiança para a

média     µ de     uma distribuição normal envolvem o erro-padrão da média amostral X . Na verdade, o

intervalo de confiança para                  µ   é encontrado adicionando e subtraindo um múltiplo do erro-padrão

σ         ou do erro-padrao estimado S                            , para a média amostral.
      n                                                       n
    Intervalos de confiança estão intimamente relacionados à outra técnica estatística de tomada de
decisão, chamada de teste de hipóteses. As hipóteses são apenas afirmações sobre os parâmetros
das distribuições de probabilidades. O objetivo é tomar decisões a respeito dessas afirmações.
Freqüentemente, essas decisões podem ser tomadas examinando a faixa de valores razoáveis para
um parâmetro a partir de um intervalo de confiança. A seguir, discutiremos e ilustraremos teste de
hipóteses relacionado à média populacional.



3.6.2. INTERVALO                               DE     CONFIANÇA                     PARA          MÉDIA µ:


           A estimação pontual fixa um valor numérico que esteja satisfatoriamente próximo do
verdadeiro valor do parâmetro. A estimação intervalar, como apresentado no tópico anterior,



Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta       15
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


determina intervalos com limites aleatórios, que contenham o valor do parâmetro, com uma margem
de segurança prefixada.
           Vimos ainda que para uma amostra suficientemente grande, independente da distribuição da
característica em estudo, a distribuição das médias amostrais em torno da média populacional                                                       é
                                              σ
normal com desvio padrão                        n
                                                    (erro padrão (EP) da média). Quanto menor o valor de EP mais

próximas estarão às médias amostrais da média populacional .
           Um estimador pontual com base em uma amostra especifica um único valor como estimativa
do parâmetro de interesse. Esse procedimento não permite julgar qual a possível magnitude do erro
que estamos cometendo. A forma usual de se considerar conjuntamente o estimador e a precisão
com que se estima o parâmetro é através dos intervalos de confiança que são baseados na
distribuição amostral do estimador pontual.
           Qualquer intervalo de confiança tem duas partes: um intervalo calculado a partir dos dados e

 um de nível confiança de 100(1                          - α)%. Um intervalo usualmente assume a seguinte forma:


                                              Estimativa Pontual ± margem de erro


           O nível (ou coeficiente) de confiança (100(1 -                                α)%)      é a taxa de sucesso do método que

 produz o intervalo, ou ainda a cada n amostras (100(1 -                                       α)%)      irão conter o verdadeiro valor do

 parâmetro.
           Para toda estatística de interesse, é possível encontrar um intervalo de confiança da forma
 acima apresentada. Nesse curso, nos limitaremos a estudar o caso onde o interesse é o estudo da
 média         da população.


3.6.2.1. INTERVALO                                  DE    CONFIANÇA                  PARA          MÉDIA µ                COM         VARIÂNCIA
CONHECIDA:


           Nossa primeira situação é aquela onde temos interesse em construir um intervalo de

confiança para a média                µ,    de uma característica que pode ser representada pelo modelo normal e

que a variância deste modelo é conhecida (situação pouco usual em termos práticos!).

           Para estimar a média                       de uma população usamos a média X da amostra observada.

Qualquer que seja a amostra coletada, no intervalo de confiança definiremos um “erro” observado

em torno do valor médio, este “erro” é dado por                               e = ( x − µ ) , ou seja, o desvio da média amostral

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   16
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


em relação a verdadeira média populacional. Consideremos a variável aleatória “erro” dada
por ε = ( X − µ ) . Dividindo esta última expressão por                                  σ
                                                                                         n
                                                                                                 temos pelo Teorema Central do Limite que,


                                                       ε              ( X − µ)
                                                        σ
                                                              =            σ
                                                                                         ~ N (0;1)
                                                         n                  n



Assim, fixado um valor (100(1 -                     α)%)      tal que 0 < α < 1, podemos encontrar um valor de Zα/2 tal

que

                                                       P( ε < zα / 2             σ
                                                                                     n
                                                                                         ) = 1−α
O índice de Zα/2 apresenta o valor                      α    dividido por 2 uma vez que a “massa”                          α deve       ser distribuída

igualmente em torno de 0. O valor de Zα/2 pode ser obtido da tabela da normal padrão.




                                                            (100(1 -     α)%)




           Podemos determinar a probabilidade de a estimativa pontual estar a uma determinada
distância da média verdadeira, ou seja, determinar a probabilidade de cometermos erros de

determinada magnitude. Por exemplo,                          α = 5%            ⇒ (1-α)=0.95

                                                       P( ε < zα / 2             σ
                                                                                     n
                                                                                         ) = 1−α
                                                             P( ε < 1,96         σ
                                                                                  n
                                                                                      ) = 0,95

                                                     P( X − µ < 1,96                     σ
                                                                                             n
                                                                                                 ) = 0,95

                                                 P(−1,96        σ
                                                                  n
                                                                      < X − µ < 1,96               σ
                                                                                                    n
                                                                                                        ) = 0,95


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta    17
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


                                               P( X − 1,96        σ
                                                                   n
                                                                       < µ < X + 1,96           σ
                                                                                                 n
                                                                                                     ) = 0,95

           Portanto, o intervalo de confiança para , com coeficiente de confiança (100(1 -                                               α)%) é dado
por


                                                                                    σ                       σ
                                 IC ( µ ; (1 - α %) = [ X − zα / 2                          , X + zα / 2           ]
                                                                                      n                       n
Valores para         zα / 2 mais usuais:
Nível de Confiança                             90%                              95%                               99%
Valor crítico: zα / 2                          1.645                           1.960                              2.576



Amplitude do intervalo:
           A amplitude do intervalo de confiança é dada pela diferença entre o extremo inferior e
superior, isto é,
                                                            σ                        σ                      σ
                                              X + zα / 2          - ( X − zα / 2            ) = 2 zα / 2
                                                              n                         n                     n
           É usual se referir à semi-amplitude, como o erro envolvido na estimação.


Exemplo 1: Um cientista descobriu que uma doença que afeta indivíduos de certa região está
relacionada com a concentração da substância A no sangue, sendo considerado doente todo
indivíduo para o qual a concentração de A é menor que 1,488 mg/cm3. Com o intuito de conhecer a
concentração da substância A no sangue em indivíduos desta região afetados pela moléstia em
estudo, o cientista avaliou um grupo 867 pessoas. Supondo que a concentração da substância A no
sangue, em indivíduos com a doença em estudo, tem distribuição normal com média                                                          desconhecida
e desvio padrão 0,4 mg/cm3 determine uma estimativa intervalar com 95% de confiança para o nível
médio da concentração de substância, sabendo que para esta amostra de 867 pessoas obteve-se
x =1,23.


Determinação do tamanho da amostra:
           Este assunto pertence ao que na Estatística se denomina Teoria de Amostragem que não é
objeto deste curso, no entanto podemos calcular para algumas situações especiais, o tamanho da
amostra necessário, como uma aplicação de intervalos de confiança. Se o objetivo é estimar a média
podemos usar os intervalos anteriormente estabelecidos, para obter o tamanho da amostra. Para isto
precisamos fixar o maior erro da estimativa aceitável e o nível de confiança com o qual desejamos


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   18
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


                                                                                                    σ
trabalhar. À medida que n cresce o erro padrão da média                                                  , decresce. Conseqüentemente o
                                                                                                     n
intervalo de confiança torna-se mais estreito. Com isto, a média                                         é estimada com maior precisão.
           Em muitas situações, aumentar o tamanho da amostra implica em aumento de custo, por
exemplo, tempo, recursos financeiros, etc. Tem-se desta forma um impasse entre precisão na
estimativa de             e o custo desta estimação. Idealmente, seria interessante analisarmos o problema
sob o ponto de vista de estimar µ, com precisão desejada e de acordo com os recursos disponíveis.
Entretanto, ignoraremos o fator custo e apenas consideraremos o problema de determinação do
tamanho da amostra para uma precisão pré-estabelecida.
           Durante a fase do planejamento do experimento, o pesquisador pode estabelecer o erro
tolerável, e na estimação de . Esta margem de erro pode ser expressa como:
                                                                       e = (x − µ)
           Como já visto anteriormente o intervalo de confiança aleatório para                                          é dado por:
                                                                           σ                             σ
                                                            X − zα / 2           ≤ µ ≤ X + zα / 2
                                                                             n                             n
           que pode ser reescrito como

                                                         µ − X ≤ zα / 2               σ
                                                                                       n                                    (1)

                                  σ
           O fator      zα / 2     n   é na verdade a precisão usada na estimação de                                     através de x . Observe

que E = ( x − µ ) é a variável aleatória erro. Reescrevendo (1) como

                                                                         E ≤ zα / 2σ / n

           Igualando zα / 2σ / n ao erro e, pré-estabelecido pelo pesquisador, na pior das hipóteses

temos:

                                                                         e = zα / 2σ / n

           Portanto, o tamanho mínimo necessário da amostra para estimar                                                com precisão e, é dado
por:

                                                                        z ∗σ 
                                                                                       2

                                                                     n=      
                                                                        e 
Sendo z* o valor crítico para o nível de confiança desejado.


3.6.2.2. INTERVALO                               DE       CONFIANÇA                  PARA          MÉDIA µ                COM         VARIÂNCIA
DESCONHECIDA:


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   19
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


           Nas situações praticas é usual conhecermos o modelo probabilístico (usualmente o normal,
nos problemas de Engenharia) associado à variável aleatória em estudo. Porém os parâmetros desse
modelo são desconhecidos na situação em estudo, portanto devem ser estimados a partir dos dados

da própria amostra. No caso do modelo normal, nessa situação tanto a média µ e a variância                                                         σ2   não

são conhecidos e seus valores serão estimados pela média e variância amostral.
           Agora se a distribuição de X, variável em estudo é normal, então a média amostral X tem

distribuição N(µ, σ2/n). Se               σ2 é conhecido, como vimos no tópico anterior, um intervalo de confiança

para    µ,   é dado por          [X ± z *           σ
                                                      n
                                                          ] . Embora a situação de normalidade seja razoável em muitos
casos práticos, dificilmente se conhece a variância de uma população quando sua média é
desconhecida.

             Quando        σ2     é desconhecido, e a nossa amostra aleatória (X1,..., Xn) é constituída de

variáveis aleatórias independentes com densidade normal de média                                                  e variância σ2, utilizamos o

“melhor” estimador para                σ2 que é por s2. Nesse caso, o intervalo de confiança é obtido utilizando-se
uma nova estatística:

                                                                                  X −µ
                                                                      T=                Sx
                                                                                         n

sendo s o estimador do desvio padrão                             σ   . Temos que T também é uma variável aleatória, mas

apesar de X ter distribuição normal, o denominador de T envolve a variável aleatória S2, que fará
com que a função de densidade de T seja diferente da normal. Essa estatística tem distribuição
conhecida como t-Student com n-1 graus de liberdade, sendo n o tamanho da amostra. A forma da
distribuição t-Student é parecida com a da normal. É simétrica em relação a zero, mas apresenta
caudas “grossas”, ou seja, maior variância do que a normal. Aumentando-se o tamanho de amostra
n, a distribuição t de Student aproxima-se do modelo normal.
           Pode-se observar, pela figura abaixo, que a distribuição t –Student é muito semelhante à
curva normal. À medida que aumentam os graus de liberdade, a distribuição t-Student aproxima-se
da distribuição normal padronizada (média = 0, desvio-padrão = 1). A curva normal padronizada é
um caso particular da distribuição t quando graus de liberdade tende ao infinito. Para os propósitos
práticos, os valores da distribuição t-Student aproximam-se dos valores da distribuição normal
padronizada relativamente depressa, tal que quando graus de liberdade= 30 esses valores são quase
idênticos.


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta         20
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística




           Para cada valor de graus de liberdade temos uma distribuição diferente.


           O procedimento para a obtenção do intervalo é semelhante ao desenvolvido anteriormente.
Utilizando a estatística,



                                                                            X −µ
                                                              T=                Sx
                                                                                             ~ tn −1
                                                                                    n
que nos permite construir o intervalo de confiança para µ. Para isto através da tabela da distribuição
tn-1, obtemos um valor de t* tal que

                                                                  X −µ
                                               P ( −t * ≤              Sx
                                                                                 ≤ t*) = (1 − α )
                                                                        n

           Ou seja,

                                                     P( - t*≤ tn-1 ≤ t*)= 1-α
                                         P( X − t *                    ≤ µ ≤ X +t*                            ) =1−α
                                                                 Sx                                     Sx
                                                                   n                                      n

Assim, um intervalo de confiança para µ com nível de confiança de 100(1-α) % é dado por:


 IC ( µ ; (1 − α )) : [ X − t n −1, (α / 2)                                          ; X + t n −1, (α / 2 )
                                                                              Sx                                          Sx
                                                                                n                                            n
                                                                                                                                 ]

tn −1, (α / 2 ) denota         o percentil        α/2       (que é equivalente ao percentil                        (1-(α/2) )da distribuição t-

Student com n-1 graus de liberdade. Assim, o intervalo de confiança para µ é centrado na estimativa
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   21
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


do efeito, e varia de uma quantidade t * desvios padrão para baixo até o mesmo número de desvios
padrão para cima.


 Exemplo 3: Em uma pesquisa para toxinas produzidas por um parasita que infecta as safras de
milho, um bioquímico preparou extratos da cultura do parasita com solventes orgânicos e mediu a
quantidade de substância tóxica por grama de solução. Para uma amostra de 9 culturas encontrou
uma quantidade média de substância tóxica igual a 1,02 miligramas e um desvio padrão de 0,26
miligramas. Seja µ a verdadeira quantidade média de substância tóxica. Construir um Intervalo de
95% de confiança para µ.


Observação:

 •     Se variância σ2 for desconhecida e a variável não tem densidade normal, é necessário considerar
       um tamanho de amostra suficientemente grande. Pois, nesse caso, é sabido que S2 se aproxima
       de σ2 de tal forma que seu uso, juntamente com aplicação do Teorema Central do Limite,

                                                                                                                                     X −µ
       permite considerar X como tendo distribuição Normal. Conseqüentemente                                                          Sx
                                                                                                                                            ~ N (0,1) , e
                                                                                                                                       n

       um intervalo de confiança γ para                       é dado por:

                              IC ( µ ; (1 − α )) : [ X − z(α / 2 )                             ; X + z(α / 2 )
                                                                                           Sx                              Sx
                                                                                             n                               n
                                                                                                                                 ]

Exemplo 4: Para estimar o rendimento semanal de operários de construção de uma grande cidade,
um sociólogo seleciona uma amostra aleatória de 75 operários. A média amostral é dada por x =
427,00 reais e s= 15,00 reais. Determine um intervalo de confiança para µ considerando coeficientes
de confiança 0,90 e 0,95.



3.6.3.                INTERVALO                       DE          CONFIANÇA                        PARA              DIFERENÇAS                     DE

MÉDIAS:

Engenheiros e cientistas estão freqüentemente interessados em comparar duas condições diferentes,
com o objetivo de determinar se as mesmas produzem diferentes resultados na resposta que esta
sendo observada. Essas condições são chamadas na maioria das vezes de tratamentos.
Consideremos a seguinte situação: Dois tratamentos são definidos por duas diferentes formulações
de tinta (formulação padrão e uma nova formulação) e a resposta é o tempo de secagem. O objetivo
do estudo é determinar se a nova formulação resulta redução do tempo de secagem.
Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta      22
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


           Nesse caso, o objetivo do estudo passa pelo estudo das médias observadas em amostras de
unidades de observação submetidas aos dois tratamentos em estudos (diferentes formulações, no
exemplo).
           Uma das formas possíveis de analisar o comportamento de dois tratamentos é o estudo da
diferença de suas médias. A partir do valor estimado, a partir da amostra, podermos identificar que
tratamento apresenta melhor desempenho na resposta de interesse.
           Portanto, para análise do problema utilizaremos a distribuição da estatística “diferença de
duas médias” apresentada em


Lembrando:

Se o primeiro tratamento tem uma media                                         1   e variância σ 12 e o segundo tratamento tem uma

media         2   e variância σ 2 . Supondo que ambas as populações possam ser representadas pelo
                                2



modelo normal ou que as condições do Teorema Central do Limite são satisfeitas, podemos dizer que
a distribuição amostral de X 1 − X 2 é normal, com media

                                                         µ X − X = µ X − µ X = µ1 − µ 2
                                                              1     2          1           2


e variância

                                                                                               σX
                                                                                                2
                                                                                                            σX
                                                                                                             2

                                                     σ   2
                                                         X1 − X 2
                                                                    =σ    2
                                                                          X1
                                                                               +σ   2
                                                                                    X 21
                                                                                           =        1
                                                                                                        +        2

                                                                                               n1           n2
Portanto:

                                                                                               σ 12         σ2
                                                                                                             2
                                                      X 1 − X 2 ~ N ( µ1 − µ 2 ,                        +        )
                                                                                               n1           n2


           A distribuição amostral da diferença entre duas médias nos leva a considerar, para fins de
obtenção de um intervalo de confiança, as seguintes situações:



     •     Variâncias dos diferentes grupos (tratamentos) são conhecidas;

     •     Variâncias dos diferentes grupos (tratamentos) são desconhecidas e portanto também
           precisam ser estimadas na amostra;


Mas temos ainda que, para ambos os casos precisamos considerar se as variâncias são iguais ou
diferentes nos diferentes tratamentos, surge ai também duas alternativas:

     •     Variâncias Iguais;

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   23
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística



     •     Variâncias Diferentes;


3.6.3.1. INTERVALO                              DE      CONFIANÇA                  PARA         DIFERENÇA                 DE      MÉDIAS             COM

VARIÂNCIAS CONHECIDAS:


           Considerando o resultado acima apresentado:

                                                                                         σ 12       σ2
                                                                                                     2
                                                      X 1 − X 2 ~ N ( µ1 − µ 2 ,                +        )
                                                                                          n1        n2
e utilizando os mesmos procedimentos utilizados no caso de uma amostra, podemos facilmente

mostrar que um intervalo de confiança (100(1 -                             α)%) para a diferença de médias,                         1-       2     é dado

por:

                                               σ 12 σ 2
                                                       2
                                                                                          σ 12 σ 2 
                                                                                                 2
                            X 1 − X 2 − zα / 2     +    ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2     +    
                           
                                               n1 n2                                     n1 n2   
ou seja:

                                          σ 12 σ 2
                                                  2
                                                                                     σ 12 σ 2 
                                                                                            2
                    P  X 1 − X 2 − zα / 2     +    ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2     +     = 1−α
                      
                                          n1 n2                                     n1 n2   


Exemplo:
           Testes de resistência à tensão foram realizados em duas estruturas contendo dois teores de
alumínio. Essas estruturas foram usadas na fabricação das asas de um avião comercial. De
experiências passadas com o passado de fabricação dessas estruturas e com o procedimento de
testes, os desvios-padrão das resistências a tensão são considerados conhecidos e dados por 1.0 no
caso da estrutura 1 e de 1.5 na estrutura 2. Uma amostra de 10 unidades da estrutura 1 resultaram
em uma resistência a tensão média de 87.6 enquanto que uma amostra de 12 unidades da estrutura
2 resultou em uma média de 74.5. Encontre um intervalo de confiança de 90% para a diferença das
médias de resistência a tensão das duas estruturas.


Solução: Seja:
X1 = resistência a tensão na estrutura 1
X2 = resistência a tensão na estrutura 2
Considerando ainda que em ambos os casos a resistência a tensão pode ser representada por um
modelo normal, temos que:



Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta        24
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


                                               σ 12       σ2
                                                           2
                                                                                                       1 1 .5 2
            X 1 − X 2 ~ N ( µ1 − µ 2 ,                +        ) ⇒ X 1 − X 2 ~ N ( µ1 − µ 2 ,           +       )
                                               n1         n2                                          10 12


e o intervalo de confiança é dado por:

                                         σ 12 σ 2 2
                                                                                     σ 12 σ 2 
                                                                                             2
                      X 1 − X 2 − zα / 2      +     ≤ µ1 − µ 2 ≤ X 1 − X 2 + zα / 2      +    =
                     
                                          n1 n 2                                    n1     n2 
                                                                                               
                                             1 1 .5 2                                      1 1 .5 2 
                     87.6 − 74.5 − zα / 2       +      ≤ µ1 − µ 2 ≤ 87.6 − 74.5 + zα / 2     +      =
                     
                                            10 12                                         10 12    
                                       1 1 .5 2                              1 1 .5 2 
                     13.1 − 1.645        +       ≤ µ1 − µ 2 ≤ 13.1 + 1.645      +       =
                     
                                     10 12                                  10 12      
                     [13.1 − 0.88 ≤ µ1 − µ 2 ≤ 13.1 + 0.88] =
                     [12.22 ≤ µ1 − µ 2 ≤ 13.98]
Questão:
           Qual o significado destes intervalos ser todo positivo?


Observação:


Se as variâncias dos diferentes tratamentos (grupos) além de conhecidas forem iguais, temos que:
σ 12 = σ 2 = σ 2 então a expressão do intervalo de confiança fica simplificada da seguinte forma:
         2



                                                 1   1                                   1  1 
                            X 1 − X 2 − z α / 2σ   +    ≤ µ1 − µ 2 ≤ X 1 − X 2 − zα / 2σ   + 
                                                 n1 n 2                                  n1 n 2 



3.6.3.2. INTERVALO                              DE        CONFIANÇA                PARA         DIFERENÇA                 DE      MÉDIAS           COM

VARIÂNCIAS DESCONHECIDAS                                          E   IGUAIS:


           Nessa situação consideramos que a variância dos dois tratamentos em estudo são
desconhecidos, logo devem também ser estimados pela amostra. Porém, embora desconhecidas,
têm-se a informação que as variâncias dos dois tratamentos são iguais. Nesse caso temos:

                                              σ 2 σ 2                                   1  1 
                  X 1 − X 2 ~ N   µ1 − µ 2 ,  1 + 2   ⇒  X 1 − X 2 ~ N ( µ1 − µ 2 , σ 2  +   
                                               n                                              n n 
                                
                                              1   n2   
                                                         
                                                           
                                                                                              1  2 




Problema:


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta     25
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


            Considerando que as variância são desconhecidas, porém iguais e que é possível obter uma
estimativa para variância amostral em cada um dos tratamentos, como estimamos, a partir desses
valores, a variância que é igual para ambos os tratamentos?
Consideremos:

     •     uma amostra de tamanho n1 do tratamento 1 com variância estimada denotada por S12 ;

     •                                                                                     2
           uma amostra de tamanho n2 do tratamento 2 com variância estimada denotada por S 2 ;

Parece ser razoável combinar as duas variâncias da amostras S12 e S 2 para se obter um estimador
                                                                    2


único para variância. Este estimador, denominado estimador combinado (pooled estimator) de

σ2 é definido por:
                                                                  (n1 − 1) S12 + (n 2 − 1) S 2
                                                                                             2
                                                         Sp =
                                                          2

                                                                         n1 + n 2 − 2
conseqüentemente, pelos mesmos motivos expostos quando do estudo para a situação de uma única
média com variância desconhecida temos que

                                                                                               
                                                                                               
                                                    (X 1 − X 2 ) − (µ1 − µ 2 ) ~ t             
                                                                                    n1 + n2 − 2
                                                               1 1                             
                                                         Sp        +                           
                                                   
                                                               n1 n2                           
                                                                                                
e assim o intervalo de confiança (100(1 -                         α)%) para a diferença de médias,                         1-       2   é dado por:

                                        1 1                                                       1 1 
 X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p   +   ≤ µ1 − µ 2 ≤ X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p   + 
                                        n1 n2                                                     n1 n2 
Exemplo:
           As análises de dois lotes de carbono de cálcio mostraram as cinzas (%) indicadas na tabela a
seguir. Construir um intervalo de confiança de 95% para à diferença de médias destes dois lotes.

                                      Amostras                                      Lote 1              Lote 2
                                      1                                             1.7                 5.9
                                      2                                             5.9                 6.9
                                      3                                             1.5                 3.6
                                      4                                             4.1                 4.3
                                      5                                             5.9                 8.0
                                      6                                             1.7                 2.0
                                      7                                             3.7                 4.8

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta      26
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


                                      8                                             3.1                 6.8
                                      9                                             1.7                 9.1
                                      10                                            3.2                 1.5

                                      Média Amostral xi                             3.25                5.29

                                      Variância Amostral S i2                       2.805               6.263



Assim:
                                           (n1 − 1) S12 + (n 2 − 1) S 2 9 * 2.805 + 9 * 6.263
                                                                      2
                                  Sp =
                                   2
                                                                        =                     = 4.53
                                                  n1 + n 2 − 2               10 + 10 − 2


e o intervalo de confiança é dado por:


                                1 1                                              1 1 
3.25 − 5.29 − t18 (5%) 4.53      +     ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t18 (5%) 4.53   + 
                               10 10                                            10 10 
                          1 1                                           1 1 
= − 2.04 − 2.101 4.53        +    ≤ µ1 − µ 2 ≤ −2.04 + 2.101 4.53        + 
                         10 10                                         10 10 
= [− 6.93 ≤ µ1 − µ 2 ≤ −2.85]


Observação: Qual o significado do intervalo conter apenas valores negativos?


3.6.3.3. INTERVALO                              DE      CONFIANÇA                  PARA         DIFERENÇA                 DE      MÉDIAS           COM

VARIÂNCIAS DESCONHECIDAS                                         E   DIFERENTES:


           Nessa situação temos que variância dos dois tratamentos em estudo são desconhecidas e
diferentes e a estimativa da variância amostral de cada grupo será utilizada como estimador das
mesmas.

     •     na amostra de tamanho n1 do tratamento 1, a variância estimada denotada por S12 será o

           estimador de σ 12 ;

     •                                                                                   2
           na amostra de tamanho n2 do tratamento 2, a variância estimada denotada por S 2 será o

           estimador de σ 2 ;
                          2




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta     27
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística




           Dessa forma, pelos mesmos motivos expostos quando do estudo para a situação de uma
única média com variância desconhecida temos que

                                                                                          
                                                       
                                                        ( X 1 − X 2 ) − ( µ1 − µ 2 ) ~ t 
                                                                    1 1
                                                                                         v
                                                                                           
                                                              Sp        +                 
                                                       
                                                                    n1 n2                 
                                                                                           
com v dado por:
                                                                                        2
                                                                S12 S 2 
                                                                        2

                                                               n +n 
                                                                         
                                                          v=    1      2 
                                                                               −2
                                                                     2     2 2
                                                              S12     S2 
                                                              
                                                             n        
                                                                        
                                                              1  +  n2 
                                                              n1 + 1    n2 + 1

e assim o intervalo de confiança (100(1 -                         α)%) para a diferença de médias,                         1-       2   é dado por:

                            S12 S 2
                                   2
                                                                              S12 S 2 
                                                                                    2
 X 1 − X 2 − t v , (α / 2 )    +    ≤ µ1 − µ 2 ≤ X 1 − X 2 − t v , ( α / 2 )    +    

                            n1 n2                                            n1 n2  


Exemplo: Refazer o exemplo anterior considerando variâncias diferentes.


Variâncias Amostrais S12 = 2.805 S 2 = 6.263
                                   2




                              2
      S12 S 2 
              2
                                                 2.805 6.263 
                                                                               2
     
     n    +                                            +       
             n2                                                              (0.2805 + 0.6263)2 − 2
v =  12                                        10         10 
                     −2=                                                −2=
    S1 
       2         2 2
              S2                             2.805 
                                                        2
                                                             6.263 
                                                                      2
                                                                            (0.2805)2 + (0.6263)2
    
   n        
                                                               
    1  +  n2                               10  +  10                    11          11
    n1 + 1    n2 + 1                              11            11
       .82
=             − 2 = 14.4
    .01 + .04
e




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta      28
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística



                       2.805 6.263                                     2.805 6.263 
3.25 − 5.29 − t14 (5%)      +      ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t14 (5%)      +      
                        10    10                                        10    10 
   [
= − 2.04 − 2.145 .2805 + .6263 ≤ µ1 − µ 2 ≤ −2.04 + 2.145 .2805 + .6263                                                      ]
= [− 2.04 − 1.44 ≤ µ1 − µ 2 ≤ −2.04 + 1.44]
= [− 3.48 ≤ µ1 − µ 2 ≤ −.60]
Interpretação:




Observações:

       •   Em todas as situações, temos que as expressões apresentadas são simplificadas
           quando n1=n2.

       •   Como identificar do ponto de vista estatístico se as variâncias dos dois grupos são
           iguais                  ou               não?                 Veremos                      no               próximo                     ponto.




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta       29
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


                                                                       Anexo 1
                                                          t table with right tail probabilities




                 dfp        0.40           0.25           0.10           0.05          0.025          0.01           0.005         0.0005

                   1     0.324920       1.000000       3.077684       6.313752       12.70620       31.82052       63.65674      636.6192

                   2     0.288675       0.816497       1.885618       2.919986       4.30265        6.96456        9.92484       31.5991

                   3     0.276671       0.764892       1.637744       2.353363       3.18245        4.54070        5.84091       12.9240

                   4     0.270722       0.740697       1.533206       2.131847       2.77645        3.74695        4.60409       8.6103

                   5     0.267181       0.726687       1.475884       2.015048       2.57058        3.36493        4.03214       6.8688

                   6     0.264835       0.717558       1.439756       1.943180       2.44691        3.14267        3.70743       5.9588

                   7     0.263167       0.711142       1.414924       1.894579       2.36462        2.99795        3.49948       5.4079

                   8     0.261921       0.706387       1.396815       1.859548       2.30600        2.89646        3.35539       5.0413

                   9     0.260955       0.702722       1.383029       1.833113       2.26216        2.82144        3.24984       4.7809

                  10     0.260185       0.699812       1.372184       1.812461       2.22814        2.76377        3.16927       4.5869

                  11     0.259556       0.697445       1.363430       1.795885       2.20099        2.71808        3.10581       4.4370

                  12     0.259033       0.695483       1.356217       1.782288       2.17881        2.68100        3.05454       4.3178

                  13     0.258591       0.693829       1.350171       1.770933       2.16037        2.65031        3.01228       4.2208

                  14     0.258213       0.692417       1.345030       1.761310       2.14479        2.62449        2.97684       4.1405

                  15     0.257885       0.691197       1.340606       1.753050       2.13145        2.60248        2.94671       4.0728

                  16     0.257599       0.690132       1.336757       1.745884       2.11991        2.58349        2.92078       4.0150

                  17     0.257347       0.689195       1.333379       1.739607       2.10982        2.56693        2.89823       3.9651

                  18     0.257123       0.688364       1.330391       1.734064       2.10092        2.55238        2.87844       3.9216

                  19     0.256923       0.687621       1.327728       1.729133       2.09302        2.53948        2.86093       3.8834

                  20     0.256743       0.686954       1.325341       1.724718       2.08596        2.52798        2.84534       3.8495

                  21     0.256580       0.686352       1.323188       1.720743       2.07961        2.51765        2.83136       3.8193

                  22     0.256432       0.685805       1.321237       1.717144       2.07387        2.50832        2.81876       3.7921

                  23     0.256297       0.685306       1.319460       1.713872       2.06866        2.49987        2.80734       3.7676

                  24     0.256173       0.684850       1.317836       1.710882       2.06390        2.49216        2.79694       3.7454

                  25     0.256060       0.684430       1.316345       1.708141       2.05954        2.48511        2.78744       3.7251

                  26     0.255955       0.684043       1.314972       1.705618       2.05553        2.47863        2.77871       3.7066

                  27     0.255858       0.683685       1.313703       1.703288       2.05183        2.47266        2.77068       3.6896

                  28     0.255768       0.683353       1.312527       1.701131       2.04841        2.46714        2.76326       3.6739

                  29     0.255684       0.683044       1.311434       1.699127       2.04523        2.46202        2.75639       3.6594

                  30     0.255605       0.682756       1.310415       1.697261       2.04227        2.45726        2.75000       3.6460

                  inf    0.253347       0.674490       1.281552       1.644854       1.95996        2.32635        2.57583       3.2905




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta   30
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística



3.7. TESTE DE HIPÓTESES:
3.7.1. INTRODUÇÃO:
           Inferir significa tirar uma conclusão. A inferência estatística oferece-nos métodos para
tirarmos conclusões para a população a partir dos dados amostrais disponíveis, conclusões estas que
devem levar em conta a variabilidade natural dos dados. Na verdade, nos tópicos anteriores já
estabelecemos algumas formas de se obter conclusões a partir dos dados amostrais. O que será novo
a partir de agora é que recorremos à probabilidade para descrever a variação que se produz pelo
acaso.
           Definimos anteriormente que a inferência estatística pode ser realizada a partir da estimação
(pontual e por intervalos) e através de testes de hipóteses. Na parte de estimação, vimos que os
intervalos de confiança são um dos tipos mais comuns de inferência estatística. Eles são apropriados
quando nosso objetivo é estimar um parâmetro populacional. Por outro lado, os testes de hipóteses,
também chamados de testes de significância, são direcionados a um objetivo diferente: avaliar a
evidência fornecida pelos dados sobre alguma afirmação feita sobre a população.
           Especificamente, em problemas de Engenharia, muitos problemas exigem uma tomada de
decisão entre aceitar ou rejeitar uma afirmação a cerca de uma característica populacional. A
afirmação a ser investigada é denominada de hipótese e o procedimento de tomada de decisão
sobre a hipótese é o que denominamos de teste de hipótese. Por exemplo, suponha que estamos
interessados na taxa de queima de um propelente sólido, usado para fornecer energia aos sistemas
de escapamento de aeronaves. A taxa de queima é uma variável aleatória que pode ser descrita por
um modelo de probabilidade. O interesse no problema consiste em verificar se a taxa média de
queima (parâmetro do modelo de probabilidade) é ou não equivalente a 50 cm/s.
           Os testes de hipóteses é um dos aspectos mais úteis da inferência estatística, uma vez que
muitos tipos de problemas de tomada de decisão, teste ou experimentos, no mundo da engenharia,
podem ser formulados como um problema desse tipo. Podemos considerar o teste estatístico de
hipóteses como o estágio da análise de dados de um experimento comparativo, em que o
engenheiro, como no exemplo acima, deseja comparar a média de uma população a dado valor
especifico de interesse no problema. Esses experimentos comparativos simples são freqüentemente
encontrados na prática e fornecem uma boa base para problemas mais complexos de
planejamento de experimentos que serão discutidos as seguir.
           Considerando que os métodos de inferência baseiam-se nas distribuições amostrais, eles
requerem um modelo probabilístico para os dados. Modelos probabilísticos confiáveis podem
aparecer de muitas maneiras, e a segurança do modelo e a confiabilidade da inferência são máximas
quando os dados são provenientes de um modelo apropriadamente aleatorizado. Quando utilizamos

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta   31
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


a inferência estatística estamos considerando os dados como se eles fossem provenientes de uma
amostra aleatória ou de um experimento onde em alguma etapa de sua execução, houve uma forma
de atribuição ou sorteio aleatório. Caso isto não se verifique as nossas conclusões poderão ser objeto
de contestação.
           Um teste de significância é um procedimento formal para comparar dados observados com
uma hipótese, cuja veracidade procura-se avaliar. A hipótese constitui-se em uma afirmação que se
faz sobre os parâmetros de uma população ou de um modelo. Os resultados de um teste são
expressos em termos de uma probabilidade que mede quão bem os dados e a hipótese concordam
entre si.


3.7.2. DEFINIÇÕES                                E    CONCEITOS BÁSICOS:



Definição 1: Em estatística, uma hipótese, é uma afirmativa sobre uma propriedade da população,
ou ainda, uma afirmação sobre os parâmetros de uma ou mais populações.


Definição 2: Um teste de hipótese (ou teste de significâncias), é um procedimento para se
verificar a veracidade ou não de uma hipótese estatística.


           Consideremos o exemplo da taxa de queima de um propeleno sólido, acima apresentado.
Nesse problema a tomada de decisão significa concluir por uma das duas seguintes alternativas.
H1 : A taxa média de queima do propeleno sólido é 50 cm/s.
H2 : A taxa média de queima do propeleno sólido não é 50 cm/s.
           Sob ponto de vista estatístico, considerando que                                       representa a taxa média de queima
populacional, as hipóteses acima são definidas como.

H0 :         = 50 cm/s
H1 :         ≠ 50 cm/s
           A alternativa H1 ou Hipótese H0 é chamada de hipótese nula enquanto que a alternativa H2
ou hipótese H1 é chamada de hipótese alternativa.


Definição 3: A Hipótese Nula é a afirmativa de que o parâmetro populacional é igual a uma valor
específico.




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta   32
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


Definição 4: A Hipótese Alternativa é a afirmativa de que o parâmetro populacional tem um valor
que, de alguma forma, difere da hipótese nula.


           No exemplo, temos que a hipótese alternativa especifica valores de                                            que podem ser maiores
ou menores que 50 cm/s, nessa situação dizemos que a hipótese alternativa é bilateral. Em
determinadas situações, podemos desejar formular uma hipótese unilateral, ou seja, verificar se o
valor de        é especificamente maior ou menor que o valor definido pela hipótese nula. No exemplo:


                                       H0 :         = 50 cm/s ou H0 :                              = 50 cm/s
                                     H1 :         > 50 cm/s                          H1 :         < 50 cm/s
           O valor do parâmetro especificado da população na hipótese nula (50 cm/s, no exemplo), é
geralmente definido a partir de uma das três maneiras:
     1. Pode ser resultado de experiências passadas ou de conhecimento do processo ou mesmo de
           testes ou experimentos prévios;
     2. O valor pode ser determinado, a partir de alguma teoria ou modelo relativo ao processo em
           estudo;
     3. O valor de parâmetro da população resulta de considerações externas, tais como valor de
           projeto ou especificações de engenharia ou a partir de obrigações contratuais.


     A partir de um teste de hipóteses verificamos se os dados provenientes da amostra são
consistentes com a hipótese em estudo. A medida que os dados forem consistentes com a hipótese,
concluiremos que a hipótese é verdadeira; no entanto se essa informação for inconsistente com a
hipótese, concluiremos que a hipótese é falsa. Destacamos que a veracidade ou falsidade de uma
hipótese especifica nunca pode ser conhecida com certeza, exceto se toda população fosse
observada, o que é usualmente impossível na prática.
           A estrutura de problemas de testes de hipóteses será idêntica em todas as aplicações que
iremos considerar. A hipótese nula é aquela que se deseja testar. A rejeição dessa hipótese leva a
aceitação da hipótese alternativa. Testar a hipótese envolve considerar uma amostra aleatória,
calcular uma estatística de teste a partir dos dados amostrais e, então a partir da estatística de teste
tomar uma decisão com respeito à hipótese nula.


Definição 5: Uma estatística de teste é um valor calculado a partir dos dados amostrais e é
usada para tomar a decisão sobre a rejeição ou não da hipótese nula. Para isso faz-se necessário a




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta   33
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


  comparação da estatística com um valor de referência a fim de ser possível a tomada de decisão de
  rejeição ou não da hipótese.

             Com o objetivo de ilustrar as definições e conceitos acima, considere o problema da taxa de
  queima do propelente, introduzido anteriormente. A hipótese nula e a taxa média de queima ser 50
  cm/s; a alternativa é: essa taxa não é igual a 50 cm/s. Ou seja, desejamos testar

                                                                H0 :         = 50 cm/s
                                                                H1 :         ≠ 50 cm/s
             Suponha que uma amostra de n = 10 espécimes seja testada e que a taxa media de queima
  da amostra x seja observada. A média amostral é uma estimativa da media verdadeira                                                                    da
  população. Um valor da media amostral x que caia próximo ao valor da hipótese de                                                           = 50 cm/s é
  uma evidência de que a media verdadeira                                  é realmente 50 cm/s; isto é, tal evidencia suporta a
  hipótese nula Ho. Por outro lado, uma média amostral que seja consideravelmente diferente de 50
  cm/s evidencia de que a hipótese alternativa H1 é valida. Assim, a média amostral é a estatística de
  teste nesse caso.
     A média amostral pode assumir muitos valores. Suponha que se 48,5 < x < 51,5, não
  rejeitaremos a hipótese nula Ho:                       = 50. Se x < 48,5 ou x > 51,5, rejeitaremos a hipótese nula em
  favor da hipótese alternativa H1:                       ≠ 50. Isso é ilustrado na Fig. 3.14. Os valores de x que forem
  menores do que 48,5 e maiores do que 51,5 constituem a região critica para o teste, enquanto todos
  os valores que estejam no intervalo 48,5 < x < 51,5 formam uma região para a qual falharemos em
  rejeitar a hipótese nula. Por convenção, ela geralmente e chamada de região de aceitação. O limite
  entre as regiões critica e a região de aceitação é chamada de valores críticos. Em nosso exemplo, os
  valores críticos são 48,5 e 51,5. E comum estabelecer conclusões relativas a hipótese nula Ho. Logo,
  rejeitaremos Ho em favor de H1 se a estatística de teste cair na região crítica e deixamos de
  rejeitar H0 caso contrário.



Região Crítica 1                                       Região de não Rejeição de Ho                                              Região Crítica 2




  Figura 3.13 Critério de decisão no teste de H0 contra H1


  Definição 6: Região crítica é definida pelo conjunto de valores para os quais a hipótese H0 é
  rejeitada.



  Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta   34
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros
Introdução à Inferência Estatística e Estimativa de Parâmetros

Weitere ähnliche Inhalte

Was ist angesagt?

Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística DescritivaAnderson Pinho
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraFlávia Salame
 
Distribuição Amostral da Média
Distribuição Amostral da MédiaDistribuição Amostral da Média
Distribuição Amostral da MédiaAnderson Pinho
 
Curso #H4A - Módulo 5
Curso #H4A - Módulo 5Curso #H4A - Módulo 5
Curso #H4A - Módulo 5Mgfamiliar Net
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricosRodrigo Rodrigues
 
Aula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a médiaAula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a médiaCarlos Alberto Monteiro
 
Pobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iPobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iAnderson Araujo
 
Aula distribuição amostral da média
Aula distribuição amostral da médiaAula distribuição amostral da média
Aula distribuição amostral da médiaGiselle Onuki
 

Was ist angesagt? (19)

Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Econometria
EconometriaEconometria
Econometria
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma Amostra
 
Estdescr1
Estdescr1Estdescr1
Estdescr1
 
Distribuição Amostral da Média
Distribuição Amostral da MédiaDistribuição Amostral da Média
Distribuição Amostral da Média
 
Curso #H4A - Módulo 5
Curso #H4A - Módulo 5Curso #H4A - Módulo 5
Curso #H4A - Módulo 5
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricos
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Aula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a médiaAula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a média
 
Intervalos de confianã‡a
Intervalos de confianã‡aIntervalos de confianã‡a
Intervalos de confianã‡a
 
Pobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iPobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc i
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Aula distribuição amostral da média
Aula distribuição amostral da médiaAula distribuição amostral da média
Aula distribuição amostral da média
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Tópico 2 Intervalo de Confiança
Tópico 2   Intervalo de ConfiançaTópico 2   Intervalo de Confiança
Tópico 2 Intervalo de Confiança
 
Bioestatistica
BioestatisticaBioestatistica
Bioestatistica
 
1. intervalo de confiança parte i
1. intervalo de confiança   parte i1. intervalo de confiança   parte i
1. intervalo de confiança parte i
 
Tópico 3 testes de hípoteses - 1 amostra
Tópico 3   testes de hípoteses - 1 amostraTópico 3   testes de hípoteses - 1 amostra
Tópico 3 testes de hípoteses - 1 amostra
 
Aula 12 intervalo de confiança
Aula 12   intervalo de confiançaAula 12   intervalo de confiança
Aula 12 intervalo de confiança
 

Ähnlich wie Introdução à Inferência Estatística e Estimativa de Parâmetros

Ce209teorica
Ce209teoricaCe209teorica
Ce209teoricathalitab
 
Apostila teoria da amostragem
Apostila   teoria da  amostragemApostila   teoria da  amostragem
Apostila teoria da amostragemAroldo Costa
 
Apostila estatistica descritiva ii
Apostila estatistica descritiva iiApostila estatistica descritiva ii
Apostila estatistica descritiva iisimuladocontabil
 
Estatística na educação
Estatística na educação Estatística na educação
Estatística na educação UFMA e UEMA
 
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docxAPOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docxMariaDeSousa41
 
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]Dafmet Ufpel
 
Amostragem-1.pdf
Amostragem-1.pdfAmostragem-1.pdf
Amostragem-1.pdfMatsuBara1
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeLeonel Boano
 
Cap7 - Parte 3 - Teste De Uma Média
Cap7 - Parte 3 - Teste De Uma MédiaCap7 - Parte 3 - Teste De Uma Média
Cap7 - Parte 3 - Teste De Uma MédiaRegis Andrade
 
Apostila estatística matemática vol 1 2009
Apostila estatística matemática vol 1 2009Apostila estatística matemática vol 1 2009
Apostila estatística matemática vol 1 2009Edson Xavier
 
Tópico 1 - Estatistica Descritiva.pdf
Tópico 1 - Estatistica Descritiva.pdfTópico 1 - Estatistica Descritiva.pdf
Tópico 1 - Estatistica Descritiva.pdfCarlosMahumane1
 
amostragem.ppt
amostragem.pptamostragem.ppt
amostragem.pptwfkam
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)Luccy Crystal
 

Ähnlich wie Introdução à Inferência Estatística e Estimativa de Parâmetros (20)

Ce209teorica
Ce209teoricaCe209teorica
Ce209teorica
 
Apostila teoria da amostragem
Apostila   teoria da  amostragemApostila   teoria da  amostragem
Apostila teoria da amostragem
 
Estatistica
EstatisticaEstatistica
Estatistica
 
Introd inferencia
Introd inferenciaIntrod inferencia
Introd inferencia
 
Apostila estatistica descritiva ii
Apostila estatistica descritiva iiApostila estatistica descritiva ii
Apostila estatistica descritiva ii
 
Método dos mínimos quadrados
Método dos mínimos quadradosMétodo dos mínimos quadrados
Método dos mínimos quadrados
 
Estatística na educação
Estatística na educação Estatística na educação
Estatística na educação
 
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docxAPOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
 
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
 
referente a estatística
referente a estatísticareferente a estatística
referente a estatística
 
Aula7
Aula7Aula7
Aula7
 
Amostragem-1.pdf
Amostragem-1.pdfAmostragem-1.pdf
Amostragem-1.pdf
 
Amostragem - estatistica
Amostragem - estatisticaAmostragem - estatistica
Amostragem - estatistica
 
Aula 01 p&e
Aula 01 p&eAula 01 p&e
Aula 01 p&e
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
 
Cap7 - Parte 3 - Teste De Uma Média
Cap7 - Parte 3 - Teste De Uma MédiaCap7 - Parte 3 - Teste De Uma Média
Cap7 - Parte 3 - Teste De Uma Média
 
Apostila estatística matemática vol 1 2009
Apostila estatística matemática vol 1 2009Apostila estatística matemática vol 1 2009
Apostila estatística matemática vol 1 2009
 
Tópico 1 - Estatistica Descritiva.pdf
Tópico 1 - Estatistica Descritiva.pdfTópico 1 - Estatistica Descritiva.pdf
Tópico 1 - Estatistica Descritiva.pdf
 
amostragem.ppt
amostragem.pptamostragem.ppt
amostragem.ppt
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)
 

Mehr von Dharma Initiative

Manual do Usuário - Mini System Philips FW339, FW316 e FW356
Manual do Usuário - Mini System Philips FW339, FW316 e FW356Manual do Usuário - Mini System Philips FW339, FW316 e FW356
Manual do Usuário - Mini System Philips FW339, FW316 e FW356Dharma Initiative
 
Owner's Manual - Tape Deck Pioneer KEH-P4450
Owner's Manual - Tape Deck Pioneer KEH-P4450Owner's Manual - Tape Deck Pioneer KEH-P4450
Owner's Manual - Tape Deck Pioneer KEH-P4450Dharma Initiative
 
Teoria - Transferência de Calor - capítulos 1, 2 e 3
Teoria - Transferência de Calor - capítulos 1, 2 e 3Teoria - Transferência de Calor - capítulos 1, 2 e 3
Teoria - Transferência de Calor - capítulos 1, 2 e 3Dharma Initiative
 
Tabela de Ponto de Ignição - Todas as Montadoras
Tabela de Ponto de Ignição - Todas as MontadorasTabela de Ponto de Ignição - Todas as Montadoras
Tabela de Ponto de Ignição - Todas as MontadorasDharma Initiative
 
Service Manual - Sony STR-K660P
Service Manual - Sony STR-K660PService Manual - Sony STR-K660P
Service Manual - Sony STR-K660PDharma Initiative
 
Roteiro para utilização do software Origin - OriginLab
Roteiro para utilização do software Origin - OriginLabRoteiro para utilização do software Origin - OriginLab
Roteiro para utilização do software Origin - OriginLabDharma Initiative
 
Roteiro da Prática 2 - Aminoacidos e Proteinas
Roteiro da Prática 2 - Aminoacidos e ProteinasRoteiro da Prática 2 - Aminoacidos e Proteinas
Roteiro da Prática 2 - Aminoacidos e ProteinasDharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 1
Service Manual - Pioneer CDX-P1210 - 1Service Manual - Pioneer CDX-P1210 - 1
Service Manual - Pioneer CDX-P1210 - 1Dharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 5
Service Manual - Pioneer CDX-P1210 - 5Service Manual - Pioneer CDX-P1210 - 5
Service Manual - Pioneer CDX-P1210 - 5Dharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 4
Service Manual - Pioneer CDX-P1210 - 4Service Manual - Pioneer CDX-P1210 - 4
Service Manual - Pioneer CDX-P1210 - 4Dharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 3
Service Manual - Pioneer CDX-P1210 - 3Service Manual - Pioneer CDX-P1210 - 3
Service Manual - Pioneer CDX-P1210 - 3Dharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 2
Service Manual - Pioneer CDX-P1210 - 2Service Manual - Pioneer CDX-P1210 - 2
Service Manual - Pioneer CDX-P1210 - 2Dharma Initiative
 
Equilíbrio da Oxidação e Redução
Equilíbrio da Oxidação e ReduçãoEquilíbrio da Oxidação e Redução
Equilíbrio da Oxidação e ReduçãoDharma Initiative
 
Point Groups and Its Geometries
Point Groups and Its GeometriesPoint Groups and Its Geometries
Point Groups and Its GeometriesDharma Initiative
 
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...Dharma Initiative
 
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...Dharma Initiative
 
Apostila de Química Analítica Qualitativa
Apostila de Química Analítica QualitativaApostila de Química Analítica Qualitativa
Apostila de Química Analítica QualitativaDharma Initiative
 

Mehr von Dharma Initiative (20)

Manual do Usuário - Mini System Philips FW339, FW316 e FW356
Manual do Usuário - Mini System Philips FW339, FW316 e FW356Manual do Usuário - Mini System Philips FW339, FW316 e FW356
Manual do Usuário - Mini System Philips FW339, FW316 e FW356
 
Owner's Manual - Tape Deck Pioneer KEH-P4450
Owner's Manual - Tape Deck Pioneer KEH-P4450Owner's Manual - Tape Deck Pioneer KEH-P4450
Owner's Manual - Tape Deck Pioneer KEH-P4450
 
Teoria - Transferência de Calor - capítulos 1, 2 e 3
Teoria - Transferência de Calor - capítulos 1, 2 e 3Teoria - Transferência de Calor - capítulos 1, 2 e 3
Teoria - Transferência de Calor - capítulos 1, 2 e 3
 
Tabela de Ponto de Ignição - Todas as Montadoras
Tabela de Ponto de Ignição - Todas as MontadorasTabela de Ponto de Ignição - Todas as Montadoras
Tabela de Ponto de Ignição - Todas as Montadoras
 
Service Manual - Sony STR-K660P
Service Manual - Sony STR-K660PService Manual - Sony STR-K660P
Service Manual - Sony STR-K660P
 
VW Santana Vista - Brochure
VW Santana Vista - BrochureVW Santana Vista - Brochure
VW Santana Vista - Brochure
 
Roteiro para utilização do software Origin - OriginLab
Roteiro para utilização do software Origin - OriginLabRoteiro para utilização do software Origin - OriginLab
Roteiro para utilização do software Origin - OriginLab
 
Roteiro da Prática 2 - Aminoacidos e Proteinas
Roteiro da Prática 2 - Aminoacidos e ProteinasRoteiro da Prática 2 - Aminoacidos e Proteinas
Roteiro da Prática 2 - Aminoacidos e Proteinas
 
Service Manual - Pioneer CDX-P1210 - 1
Service Manual - Pioneer CDX-P1210 - 1Service Manual - Pioneer CDX-P1210 - 1
Service Manual - Pioneer CDX-P1210 - 1
 
Service Manual - Pioneer CDX-P1210 - 5
Service Manual - Pioneer CDX-P1210 - 5Service Manual - Pioneer CDX-P1210 - 5
Service Manual - Pioneer CDX-P1210 - 5
 
Service Manual - Pioneer CDX-P1210 - 4
Service Manual - Pioneer CDX-P1210 - 4Service Manual - Pioneer CDX-P1210 - 4
Service Manual - Pioneer CDX-P1210 - 4
 
Service Manual - Pioneer CDX-P1210 - 3
Service Manual - Pioneer CDX-P1210 - 3Service Manual - Pioneer CDX-P1210 - 3
Service Manual - Pioneer CDX-P1210 - 3
 
Service Manual - Pioneer CDX-P1210 - 2
Service Manual - Pioneer CDX-P1210 - 2Service Manual - Pioneer CDX-P1210 - 2
Service Manual - Pioneer CDX-P1210 - 2
 
Equilíbrio da Oxidação e Redução
Equilíbrio da Oxidação e ReduçãoEquilíbrio da Oxidação e Redução
Equilíbrio da Oxidação e Redução
 
Point Groups and Its Geometries
Point Groups and Its GeometriesPoint Groups and Its Geometries
Point Groups and Its Geometries
 
Tables for Group Theory
Tables for Group TheoryTables for Group Theory
Tables for Group Theory
 
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
 
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
 
Apostila de Química Analítica Qualitativa
Apostila de Química Analítica QualitativaApostila de Química Analítica Qualitativa
Apostila de Química Analítica Qualitativa
 
Ipaee capitulo7
Ipaee capitulo7Ipaee capitulo7
Ipaee capitulo7
 

Kürzlich hochgeladen

Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxLuizHenriquedeAlmeid6
 
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresLilianPiola
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxleandropereira983288
 
Simulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdfSimulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdfEditoraEnovus
 
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptxAD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptxkarinedarozabatista
 
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMCOMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMVanessaCavalcante37
 
William J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdfWilliam J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdfAdrianaCunha84
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasRosalina Simão Nunes
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinhaMary Alvarenga
 
Governo Provisório Era Vargas 1930-1934 Brasil
Governo Provisório Era Vargas 1930-1934 BrasilGoverno Provisório Era Vargas 1930-1934 Brasil
Governo Provisório Era Vargas 1930-1934 Brasillucasp132400
 
UFCD_10392_Intervenção em populações de risco_índice .pdf
UFCD_10392_Intervenção em populações de risco_índice .pdfUFCD_10392_Intervenção em populações de risco_índice .pdf
UFCD_10392_Intervenção em populações de risco_índice .pdfManuais Formação
 
Cultura e Literatura indígenas: uma análise do poema “O silêncio”, de Kent Ne...
Cultura e Literatura indígenas: uma análise do poema “O silêncio”, de Kent Ne...Cultura e Literatura indígenas: uma análise do poema “O silêncio”, de Kent Ne...
Cultura e Literatura indígenas: uma análise do poema “O silêncio”, de Kent Ne...ArianeLima50
 
A Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesA Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesMary Alvarenga
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividadeMary Alvarenga
 
E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?Rosalina Simão Nunes
 
Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.keislayyovera123
 

Kürzlich hochgeladen (20)

Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
 
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
 
Bullying, sai pra lá
Bullying,  sai pra láBullying,  sai pra lá
Bullying, sai pra lá
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptx
 
Simulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdfSimulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdf
 
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptxAD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
 
XI OLIMPÍADAS DA LÍNGUA PORTUGUESA -
XI OLIMPÍADAS DA LÍNGUA PORTUGUESA      -XI OLIMPÍADAS DA LÍNGUA PORTUGUESA      -
XI OLIMPÍADAS DA LÍNGUA PORTUGUESA -
 
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMCOMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
 
William J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdfWilliam J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdf
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinha
 
Em tempo de Quaresma .
Em tempo de Quaresma                            .Em tempo de Quaresma                            .
Em tempo de Quaresma .
 
Governo Provisório Era Vargas 1930-1934 Brasil
Governo Provisório Era Vargas 1930-1934 BrasilGoverno Provisório Era Vargas 1930-1934 Brasil
Governo Provisório Era Vargas 1930-1934 Brasil
 
UFCD_10392_Intervenção em populações de risco_índice .pdf
UFCD_10392_Intervenção em populações de risco_índice .pdfUFCD_10392_Intervenção em populações de risco_índice .pdf
UFCD_10392_Intervenção em populações de risco_índice .pdf
 
Cultura e Literatura indígenas: uma análise do poema “O silêncio”, de Kent Ne...
Cultura e Literatura indígenas: uma análise do poema “O silêncio”, de Kent Ne...Cultura e Literatura indígenas: uma análise do poema “O silêncio”, de Kent Ne...
Cultura e Literatura indígenas: uma análise do poema “O silêncio”, de Kent Ne...
 
A Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesA Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das Mães
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividade
 
E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?
 
Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.Época Realista y la obra de Madame Bovary.
Época Realista y la obra de Madame Bovary.
 
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
 

Introdução à Inferência Estatística e Estimativa de Parâmetros

  • 1. UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA DEPARTAMENTO DE ESTATÍSTICA INTRODUÇÃO AO PLANEJAMENTO E ANÁLISE ESTATÍSTICA DE EXPERIMENTOS CAPÍTULO # 3 INTRODUÇÃO A PROBABILIDADE E A INFERÊNCIA ESTATÍSTICA PARTE # 2 PROF. PEDRO FERREIRA FILHO PROFa. ESTELA MARIS P. BERETA 2º SEMESTRE DE 2010
  • 2. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 3.4. INFERÊNCIA ESTATÍSTICA: 3.4.1. INTRODUÇÃO: O campo da inferência estatística consiste naqueles métodos usados para tomar decisões ou tirar conclusões acerca de uma população. Esses métodos utilizam a informação contida em uma amostra da população para tirar conclusões. Mostramos na Fig. 3.10 a relação entre uma população e uma amostra. Este ponto inicia nosso estudo dos métodos estatísticos usados para a inferência e a tomada de decisões. Figura 3.10. Relação entre uma população e uma amostra Inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e teste de hipóteses. Como um exemplo de um problema de estimação de parâmetros, suponha que um engenheiro de estruturas esteja analisando a resistência a tensão de um componente usado em um chassi de automóvel. Uma vez que a variabilidade da resistência à tração esta naturalmente presente entre componentes individuais, devido às diferenças nas bateladas da matéria-prima nos processos de fabricação e nos procedimentos de medidas (por exemplo), o engenheiro está interessado na estimação da resistência média a tração dos componentes. Na pratica, o engenheiro usara dados da amostra para calcular um número que e, de algum modo, um valor razoável (ou tentativa) da média verdadeira. Esse número é chamado de estimativa. Veremos que e possível estabelecer a precisão da estimativa. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 2
  • 3. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Considere agora uma situação em que duas temperaturas diferentes de reação, como t1 e t2 possam ser usadas em um processo químico. O engenheiro conjectura que t1 resulta em rendimentos maiores que t2 o teste estatístico de hipóteses e a estrutura para resolver problemas desse tipo. Nesse caso, a hipótese seria que o rendimento médio usando a temperatura t1 é maior que o rendimento médio usando a temperatura t2. Note que não há ênfase na estimação de rendimentos; em vez disso, o foco esta na tirada de conclusões acerca de uma hipótese estabelecida. 3.4.2. DEFINIÇÕES E PROPRIEDADES BÁSICAS: Na maioria dos problemas de inferência estatística, é impossível ou impraticável observar a população inteira. Por exemplo, não poderíamos testar à resistência a tração de todos os elementos estruturais dos chassis, pois consumiria muito tempo e seria muito caro. Além disso, alguns (talvez muitos) desses elementos estruturais não existam mais no tempo em que a decisão deve ser feita; assim, para uma larga extensão, temos de visualizar a população como conceitual. Logo, dependemos de um conjunto de observações da população para ajudar a tomar decisões à cerca da população. Para que nossas inferências sejam validas, a amostra tem que ser representativa da população. É freqüentemente tentador selecionar uma amostra com as observações que sejam mais convenientes ou exercer julgamento na seleção da amostra. Esses procedimentos podem freqüentemente introduzir alguma tendência na amostra e, como resultado, o parâmetro de interesse será consistentemente subestimado (ou superestimado) por tal amostra. Alem disso, o comportamento de uma amostra de julgamento não pode ser estatisticamente descrito. Para evitar essas dificuldades, é desejável selecionar uma amostra aleatória como o resultado de algum mecanismo de chance. Conseqüentemente, a seleção de uma amostra e um experimento aleatório e cada observação na amostra e o valor observado de uma variável aleatória. As observações na população determinam a distribuição de probabilidades da variável aleatória. Para definir uma amostra aleatória, faça X ser uma variável aleatória que represente o resultado de uma seleção de uma observação proveniente da população. Faça f(x) denotar a função densidade de probabilidade de X Suponha que cada observação na amostra seja obtida independentemente, sob condições inalteradas. Ou seja, as observações para a amostra são obtidas, observando-se X independentemente, sob condições inalteradas, isto é, n vezes. Faça X denotar a variável aleatória que representa a i-ésima replica. Então, X1, X2, ..., Xn é uma amostra aleatória e os valores numéricos obtidos são denotados por x1, x2,...,xn. As variáveis aleatórias em uma amostra aleatória são independentes, com a mesma distribuição de probabilidades f(x), por causa das condições idênticas sob as quais cada observação é obtida. Isto é, a função densidade de probabilidade marginal de X1, Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 3
  • 4. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística X2, ...,Xn e fx1,x2,...,xn(x1, x2,...,xn), respectivamente, e pela independência, a função densidade de probabilidade conjunta da amostra aleatória é f(x1)f(x2)...f(xn). Definição 1: As variáveis aleatórias (X1,X2,...,Xn) são uma amostra aleatória de tamanho n, se: (a) os X’s são variáveis aleatórias independentes (b) todos os Xi’s tiverem a mesma distribuição de probabilidade. Para ilustrar essa definição, suponha que estejamos investigando a vida efetiva de serviço de um componente eletrônico usado em um marca-passo cardíaco e que a vida do componente seja normalmente distribuída. Então, esperaríamos que cada uma das observações da vida do componente Xl, X2, ..., Xn em uma amostra aleatória de n componentes fosse uma variável aleatória independente com, exatamente, a mesma distribuição normal. Depois dos dados serem coletados, os valores numéricos dos tempos de vida observados são denotados por x1,x2,...,xn. A finalidade principal de tomar uma amostra aleatória e obter informação sobre os parâmetros desconhecidos da população. Definição 2: Uma estatística é qualquer função das observações de uma amostra aleatória. Encontramos estatísticas anteriormente. Por exemplo, se X1, X2, ...,Xn. for uma amostra aleatória de tamanho n, então a média da amostra X , a variância da amostra S2 e o desvio-padrão S da amostra são estatísticas. O processo de tirar conclusões sobre a população, baseando-se nos dados da amostra, faz uso considerável dessas estatísticas. Desde que uma estatística seja uma variável aleatória, ela terá uma distribuição de probabilidades. Chamamos a distribuição de probabilidades de uma estatística de distribuição amostral. A noção de uma distribuição amostral é muito importante e será discutida e ilustrada mais adiante neste capitulo. Uma aplicação muito importante de estatísticas e a obtenção das estimativas dos parâmetros, tais como a media da população e a variância da população. Em problemas de inferência, é conveniente ter um símbolo geral para representar o parâmetro de interesse. Usaremos o símbolo grego θ (teta) para representar o parâmetro. O objetivo da estimação e selecionar um único número baseado nos dados da amostra, sendo esse o valor mais plausível para θ. Um valor numérico de uma estatística amostra será usado como a estimativa. Definição 3: Uma estimativa pontual de algum parâmetro θ da população é um único valor numérico de uma estatística θ . ˆ Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 4
  • 5. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Como um exemplo, suponha que a variável aleatória X seja normalmente distribuída com uma média desconhecida µ. A média da amostra é um estimador da média desconhecida µ da população. Isto é µ = X . Depois de a amostra ter sido selecionada, o valor numérico x e a estimativa de ˆ µ. Assim, se x1 = 25, x2 = 30, x3 = 29 e x4 = 31, então a estimativa de µé 25 + 30 + 29 + 31 X = = 28.75 4 Similarmente, se a variância da população σ2 for também desconhecida, um estimador para σ2 será a variância da amostra S2 e o valor numérico s2 = 6.9, calculado a partir dos dados amostrais, é chamado de estimativa de σ2. Problemas de estimação ocorrem freqüentemente em engenharia. Geralmente, necessitamos estimar: • A média µ de uma única população; • A variância σ2 (ou desvio-padrão σ) de uma única população; • A proporção p de itens em uma população que pertence a uma classe de interesse;. • A diferença nas médias de duas populações, µ1 - µ2;. • A diferença nas proporções de duas populações, p1 – p2; Estimativas razoáveis desses parâmetros são dadas a seguir: • Para µ, a estimativa é µ = x , a média da amostra. ˆ • Para σ2 a estimativa é σ 2 = s 2 a variância da amostra. ˆ • Para p, a estimativa é p 2 = x ˆ n a proporção da amostra, sendo x o numero de itens em uma amostra aleatória de tamanho n que pertence a classe de interesse. • Para µ1 - µ2, a estimativa é µ1 − µ 2 = x1 − x 2 ˆ ˆ a diferença entre as médias de duas amostras aleatórias independentes. • Para p1 – p2 a estimativa é p1 − p 2 , a diferença entre duas proporções amostrais, calculadas ˆ ˆ a partir de duas amostras aleatórias independentes. Podemos ter varias escolhas diferentes para o estimador pontual de um parâmetro. Por exemplo, se desejarmos estimar a média de uma população, podemos considerar como Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 5
  • 6. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística estimadores a média ou a mediana da amostra ou talvez a média das observações menores e maiores da amostra. De modo a decidir qual estimador de um parâmetro particular é o melhor para se usar, necessitamos examinar suas propriedades estatísticas e desenvolver algum critério para comparar os estimadores. Os critérios para escolha do “melhor” estimador para um determinado parâmetro populacional são definidos a partir de “propriedades” desejáveis destes estimadores. As propriedades mais consideradas são: Propriedade 1: Um estimador θ é não viciado (ou não tendencioso) para um parâmetro ˆ populacional θ se: () Eθ =θ ˆ Essa propriedade diz que um estimador deve estar "perto", de algum modo, do valor ver- dadeiro do parâmetro desconhecido. Formalmente, dizemos que θ é um estimador não tendencioso ˆ de θ, se o valor esperado de θ for igual a θ. Isso é equivalente a dizer que a média da distribuição ˆ de probabilidades de θ (ou a media da distribuição amostral de θ) é igual a θ. Propriedade 2: Sejam θ1 e θ 2 dois estimadores não viciados de um parâmetro θ. θ1 é mais eficiente do ˆ ˆ ˆ que θˆ2 se: Var( θ1 ) < Var( θ 2 ) ˆ ˆ ou seja, um estimador é mais eficiente quanto menor for a sua variância, ou ainda, quanto mais preciso (menor dispersão) ele for. Definição 4: Se considerarmos todos os estimadores não viciados de um parâmetro θ, aquele com menor variância será denominado de estimador não viciado de menor variância. A interpretação das propriedades acima pode ser observada a partir da seguinte situação: Deseja-se comprar um rifle, e após algumas seleções, restaram quatro alternativas que denominamos de rifles A, B, C e D. Realiza-se um teste para cada um dos rifles que consistiu em fixá-lo num cavalete, mirar o centro de um alvo e disparar 15 tiros. Os resultados estão na figura 3.11. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 6
  • 7. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Figura 3.11 Resultados de 15 tiros dados por 4 rifles Questão: Qual o melhor rifle? Características: Rifle A: Não viciado com baixa precisão (grande dispersão ou variância); Rifle B: Viciado com baixa precisão; Rifle C: Não viciado com boa precisão; Rifle D: Viciado com alta precisão; 3.4.3. MÉTODOS DE ESTIMAÇÃO: A forma de obtenção de um estimador para um dado parâmetro populacional, de preferência com as propriedades desejáveis, pode ser feita utilizando-se diferentes procedimentos chamados de métodos de estimação. Esses métodos não serão aqui apresentados e podem ser vistos, por exemplo, em Montgomery e Runger (ver bibliografia do curso). Destacamos que os principais métodos de estimação são: • Métodos dos Momentos; • Método da Máxima Verossimilhança; • Método dos Mínimos Quadrados; Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 7
  • 8. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 3.5. DISTRIBUIÇÕES AMOSTRAIS: A inferência estatística como vimos anteriormente, tem por objetivo tomar decisões acerca de uma população, baseando-se na informação contida em uma amostra aleatória proveniente daquela população. Por exemplo, podemos estar interessados no volume médio de enchimento de uma lata de refrigerante. O volume médio de enchimento na população e 300 ml. Um engenheiro considera uma amostra aleatória de 25 latas e calcula o volume médio amostral de enchimento como x = 298 ml. 0 engenheiro decidirá, provavelmente, que a média da população é µ = 300 ml, muito embora a média amostral tenha sido 298 ml, porque ele sabe que a média amostral é uma estimativa razoável de µ e que com a média amostral de 298 ml é muito provável de ocorrer, mesmo se a média verdadeira da população for µ = 300 ml. De fato, se a média verdadeira for 300 ml, então os testes de 25 latas feitos repetidamente, talvez a cada 5 minutos, produzirão valores de x que variarão acima e abaixo de µ = 300 ml. A média amostral e uma estatística; isto e, ela e uma variável aleatória que depende dos resultados obtidos em cada amostra particular. Uma vez que uma estatística e uma variável aleatória, ela tem uma distribuição de probabilidades. Definição: A distribuição de probabilidades de uma estatística e chamada de uma distribuição amostral. Por exemplo, a distribuição de probabilidades de X é chamada de distribuição amostral da média. A distribuição amostral de uma estatística depende da distribuição da população, do tamanho da amostra e do método de seleção da amostra. A próxima seção deste capítulo apresenta talvez a mais importante distribuição amostral. Outras distribuições amostrais e suas aplicações serão ilustradas quando necessárias (por exemplo, a distribuição amostral da variância amostral). 3.5.1. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA: 3.5.1.1. DISTRIBUIÇÃO AMOSTRAL PARA UMA MÉDIA: Considere a determinação da distribuição amostral da média X da amostra. Suponha que uma amostra aleatória de tamanho n seja retirada de uma população normal com média µ e Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 8
  • 9. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística variância σ2. Então, pela propriedade reprodutiva da distribuição normal, concluímos que a média da σ2 amostra tem uma distribuição normal com média µ X = µ e variância σ X = 2 , ou seja, a n distribuição da média da amostra tem como média o mesmo valor da média da populacional da característica em estudo (estimador não viciado) e variância igual à variância populacional dividida pelo tamanho da amostra. Notação: Se X i ~ N ( µ , σ 2 ) então X ~ N ( µ , σ 2 ) n Observação: Propriedade reprodutiva ⇒ Uma combinação linear de variáveis aleatórias normais é também normal. Se estivermos amostrando de uma população que tenha uma distribuição desconhecida de probabilidades, a distribuição amostral da média da amostra será aproximadamente normal, com média µ e variância σ2/n, se o tamanho n da amostra for grande. Esse é um dos mais úteis teoremas em estatística, o chamado teorema central do limite. 3.5.1.2. TEOREMA DO LIMITE CENTRAL: Se X1, X2 ,..., Xn representa uma amostra aleatória de tamanho n de uma variável X com média e variância finita σ2, obtida em uma população (finita ou infinita) e se X for a média da amostra, então a forma limite da distribuição para n grande é dada por X − µ) Z= σ n Interpretação: O Teorema Central do Limite nos diz que, independente da distribuição que a característica em estudo pode ser representada, a medida que o tamanho da amostra aumenta, a distribuição amostral da média X pode ser representada pelo modelo normal. A qualidade da aproximação normal para X depende do tamanho n da amostra. A Fig. 3.12(a) mostra a distribuição obtida para o arremesso de um único dado verdadeiro com seis faces. As probabilidades são iguais a (1/6) para todos os valores obtidos, 1,2,3,4,5 ou 6. A Fig. 3.12(b) mostra a distribuição das pontuações médias obtidas quando arremessando três, cinco e dez vezes o dado, respectivamente. Note que, embora a população (um dado) esteja relativamente longe da normal, a distribuição das medias será aproximada Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 9
  • 10. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística razoavelmente bem pela distribuição normal, para amostras de tamanho tão pequeno quanto cinco. (As distribuições dos arremessos dos dados são discretas, enquanto a normal e continua.) Embora o teorema central do limite trabalhe bem para pequenas amostras (n = 4, 5) na maioria dos casos, particularmente onde a população seja continua, unimodal e simétrica, amostras maiores serão necessária em outras situações, dependendo da forma da população. Em muitos casos de interesse prático, se n ~ 30, a aproximação normal será satisfatória, independente da formal da população. Se n < 30, o teorema central do limite funcionara, se a distribuição da população não for muito diferente da normal. Exemplo: Uma companhia eletrônica fabrica resistores que têm uma resistência média de 100Ω e um desvio padrão de 10Ω. A distribuição das resistências pode ser representada pelo modelo normal. Encontre a probabilidade de uma amostra aleatória de tamanho n = 25 resistores ter uma resistência média menor que 95Ω? Solução: X = resistência dos resistores ⇒ X ~ N (100,10 2 ) X = Média da amostra de n = 25 resistores ⇒ X ~ N ( µ ,σ 2 2 ) ⇒ X ~ N (100,10 = 2) n 25 Conseqüentemente a probabilidade desejada é dada por:  X − µ ) 95 − 100)  [ P X < 95 = P  ] <  = P[Z < −2.5] = 0.0062  σ 2   n  Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 10
  • 11. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Figura 3.12 Distribuição das pontuações médias obtidas quando arremessamos dados Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 11
  • 12. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 3.5.1.3. DISTRIBUIÇÃO AMOSTRAL PARA DIFERENÇA DE DUAS MÉDIAS: Agora consideremos o caso em que temos duas populações independentes. Faça a primeira população ter uma média 1 e variância σ 12 e a segunda população ter uma média 2 e variância σ 2 . Suponha que ambas as populações possam ser representadas pelo modelo normal. Então, 2 usando o fato de que combinações lineares de variáveis aleatórias normais têm distribuição normal, podemos dizer que a distribuição amostral de X 1 − X 2 é normal, com média µ X − X = µ X − µ X = µ1 − µ 2 1 2 1 2 e variância σX 2 σX 2 σ 2 X1 − X 2 =σ 2 X1 +σ 2 X 21 = 1 + 2 n1 n2 Portanto: σ 12 σ2 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 Se as duas populações não forem normalmente distribuídas, porem se ambos os tamanhos da amostra n1 e n2 forem maiores que 30, podemos usar o teorema central do limite e considerar que X 1eX 2 sigam aproximadamente distribuições normais independentes. Por conseguinte, a distribuição amostral de X 1 − X 2 é aproximadamente normal, com média e variância dadas acima. Se n1 ou n2 forem menores que 30, então a distribuição amostral de X 1 − X 2 será aproximadamente normal, com média e variância dadas acima, desde que a população da qual a amostra e retirada não seja drasticamente deferente da normal. Exemplo: A vida efetiva de um componente usado em um motor de uma turbina de um avião a jato é uma variável aleatória, com media de 5.000 h e desvio-padrão de 40 h. A distribuição da vida efe- tiva é razoavelmente próxima da distribuição normal. 0 fabricante do motor introduz uma melhoria no processo de fabricação para esse componente, que aumenta a vida media para 5.050 h e diminui o desvio-padrão para 30 h. Suponha que uma amostra aleatória de n1= 16 componentes seja selecionada do processo "antigo" e uma amostra aleatória de n2 = 25 componentes seja selecionada do processo "melhorado". Qual é a probabilidade de que a diferença nas duas médias amostrais X 2 − X 1 I seja no mínimo de 25 h? Considere que o processo antigo e o melhorado possam ser considerados como populações independentes. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 12
  • 13. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Solução: X1 = tempo de vida do processo antigo ⇒ X 1 ~ N (5000,40 2 ) X2 = tempo de vida do processo melhorado ⇒ X 2 ~ N (5050,30 2 ) Logo: 2 2 X 1 ~ N (5000, 40 = 10) X 21 ~ N (5050, 30 = 6) 16 25 e X 2 − X 1 ~ N (5050 − 5000,6 2 + 10 2 ) = N (50,136) Desta forma: 25 − 50)  P[X 2 − X 1> 25] = P  Z >   = P[Z > −2.14] = 1 − P[Z < −2.14] = 1 − 0.001617 = 0.9838  136  3.6. INTERVALOS DE CONFIANÇA: 3.6.1. INTRODUÇÃO: Em muitas situações, uma estimativa pontual de um parâmetro, como foi vista até o momento, não fornece informação completa para um engenheiro. Por exemplo, considere o problema da condutividade térmica de ferro Armco. Usando uma temperatura de 100ºF e uma potência de 550w, 10 medidas foram observadas obtendo-se uma média amostral de x = 41.924 BTU/h.ft.oF. É improvável que a média verdadeira da condutividade térmica seja exatamente igual a esse valor; assim, uma questão relevante aparece: quão próximo esta x da média verdadeira? Calcular o erro-padrão da estimativa (desvio do estimador) é um guia aproximado para a precisão da estimação. Outra abordagem é usar um intervalo de confiança para expressar o grau de incerteza associado com uma estimativa. Uma estimativa do intervalo de confiança de um parâmetro desconhecido θ é um intervalo da forma l ≤ θ ≤ s em que os pontos finais l e s dependem do valor numérico da estatística θ da ˆ amostra para uma amostra particular. Uma vez que amostras diferentes produzirão valores diferentes de θ e , conseqüentemente, valores diferentes dos pontos finais l e s, esses pontos finais ˆ são valores de variáveis aleatórias, como L e S, respectivamente. Da distribuição amostral da media estatística e, seremos capazes de determinar valores de L e S, tal que a seguinte afirmação sobre probabilidade seja verdadeira: Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 13
  • 14. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística P[L≤θ≤S]=1-α sendo 0 < α < 1. Assim, temos uma probabilidade de 1 - α de selecionar uma amostra que produzira um intervalo contendo o valor verdadeiro de θ. O intervalo resultante: l≤θ≤s é chamado de intervalo com 100(1 - α)% de confiança para o parâmetro θ . As grandezas l e s são chamadas de limites inferior e superior de confiança, respectivamente, e (1 - α) é chamado de coeficiente de confiança. A interpretação de um intervalo de confiança é que se um número infinito de amostras aleatórias for calculado e um intervalo com 100(1 - α)% de confiança para θ for calculado a partir de cada amostra, então 100(1 - α)% desses intervalos conterão o valor verdadeiro de θ. A situação e ilustrada na Figura 3.13, que mostra vários intervalos com 100(1 - α)% de confiança para o parâmetro θ de uma distribuição. Os pontos nos centros dos intervalos indicam a estimativa pontual de θ (ou seja, θ ). Note que um dos 25 intervalos não contém θ. Se esse fosse um ˆ intervalo com 95%, no final das contas, somente 5% dos intervalos não conteriam θ. Figura 3.13. Construção repetida de um intervalo de confiança para θ Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 14
  • 15. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Agora, na prática, obtemos somente uma amostra aleatória e calculamos um intervalo de confiança. Uma vez que esse intervalo conterá ou não o valor verdadeiro de θ, não é razoável fixar um nível de probabilidade a esse evento específico. A afirmação apropriada é: O intervalo observado [l, s] contém o valor verdadeiro de θ, com 100(1 - α) de confiança. Essa afirmação tem uma interpretação de freqüência; ou seja, não sabemos se a afirmação é verdadeira para essa amostra especifica, mas o método usado para obter o intervalo [l, s] resulta em afirmações corretas em 100( 1- α)% do tempo. O comprimento θ - l do intervalo observado de confiança é uma importante medida da qualidade da informação obtida a partir da amostra. A metade do comprimento do intervalo θ - l ou s - θe chamada de precisão do estimador. Quanto maior for o intervalo de confiança, mais confiantes estaremos de que o intervalo realmente contém o valor verdadeiro de θ. Por outro lado, quanto maior for o intervalo, menos informação teremos a respeito do valor verdadeiro de θ. Em uma situação ideal, gostaríamos de obter um intervalo relativamente pequeno com alta confiança. Em muitas situações práticas, é fácil encontrar os pontos finais que definem o intervalo de confiança para um parâmetro. Por exemplo, os pontos finais para o intervalo de confiança para a média µ de uma distribuição normal envolvem o erro-padrão da média amostral X . Na verdade, o intervalo de confiança para µ é encontrado adicionando e subtraindo um múltiplo do erro-padrão σ ou do erro-padrao estimado S , para a média amostral. n n Intervalos de confiança estão intimamente relacionados à outra técnica estatística de tomada de decisão, chamada de teste de hipóteses. As hipóteses são apenas afirmações sobre os parâmetros das distribuições de probabilidades. O objetivo é tomar decisões a respeito dessas afirmações. Freqüentemente, essas decisões podem ser tomadas examinando a faixa de valores razoáveis para um parâmetro a partir de um intervalo de confiança. A seguir, discutiremos e ilustraremos teste de hipóteses relacionado à média populacional. 3.6.2. INTERVALO DE CONFIANÇA PARA MÉDIA µ: A estimação pontual fixa um valor numérico que esteja satisfatoriamente próximo do verdadeiro valor do parâmetro. A estimação intervalar, como apresentado no tópico anterior, Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 15
  • 16. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística determina intervalos com limites aleatórios, que contenham o valor do parâmetro, com uma margem de segurança prefixada. Vimos ainda que para uma amostra suficientemente grande, independente da distribuição da característica em estudo, a distribuição das médias amostrais em torno da média populacional é σ normal com desvio padrão n (erro padrão (EP) da média). Quanto menor o valor de EP mais próximas estarão às médias amostrais da média populacional . Um estimador pontual com base em uma amostra especifica um único valor como estimativa do parâmetro de interesse. Esse procedimento não permite julgar qual a possível magnitude do erro que estamos cometendo. A forma usual de se considerar conjuntamente o estimador e a precisão com que se estima o parâmetro é através dos intervalos de confiança que são baseados na distribuição amostral do estimador pontual. Qualquer intervalo de confiança tem duas partes: um intervalo calculado a partir dos dados e um de nível confiança de 100(1 - α)%. Um intervalo usualmente assume a seguinte forma: Estimativa Pontual ± margem de erro O nível (ou coeficiente) de confiança (100(1 - α)%) é a taxa de sucesso do método que produz o intervalo, ou ainda a cada n amostras (100(1 - α)%) irão conter o verdadeiro valor do parâmetro. Para toda estatística de interesse, é possível encontrar um intervalo de confiança da forma acima apresentada. Nesse curso, nos limitaremos a estudar o caso onde o interesse é o estudo da média da população. 3.6.2.1. INTERVALO DE CONFIANÇA PARA MÉDIA µ COM VARIÂNCIA CONHECIDA: Nossa primeira situação é aquela onde temos interesse em construir um intervalo de confiança para a média µ, de uma característica que pode ser representada pelo modelo normal e que a variância deste modelo é conhecida (situação pouco usual em termos práticos!). Para estimar a média de uma população usamos a média X da amostra observada. Qualquer que seja a amostra coletada, no intervalo de confiança definiremos um “erro” observado em torno do valor médio, este “erro” é dado por e = ( x − µ ) , ou seja, o desvio da média amostral Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 16
  • 17. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística em relação a verdadeira média populacional. Consideremos a variável aleatória “erro” dada por ε = ( X − µ ) . Dividindo esta última expressão por σ n temos pelo Teorema Central do Limite que, ε ( X − µ) σ = σ ~ N (0;1) n n Assim, fixado um valor (100(1 - α)%) tal que 0 < α < 1, podemos encontrar um valor de Zα/2 tal que P( ε < zα / 2 σ n ) = 1−α O índice de Zα/2 apresenta o valor α dividido por 2 uma vez que a “massa” α deve ser distribuída igualmente em torno de 0. O valor de Zα/2 pode ser obtido da tabela da normal padrão. (100(1 - α)%) Podemos determinar a probabilidade de a estimativa pontual estar a uma determinada distância da média verdadeira, ou seja, determinar a probabilidade de cometermos erros de determinada magnitude. Por exemplo, α = 5% ⇒ (1-α)=0.95 P( ε < zα / 2 σ n ) = 1−α P( ε < 1,96 σ n ) = 0,95 P( X − µ < 1,96 σ n ) = 0,95 P(−1,96 σ n < X − µ < 1,96 σ n ) = 0,95 Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 17
  • 18. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística P( X − 1,96 σ n < µ < X + 1,96 σ n ) = 0,95 Portanto, o intervalo de confiança para , com coeficiente de confiança (100(1 - α)%) é dado por σ σ IC ( µ ; (1 - α %) = [ X − zα / 2 , X + zα / 2 ] n n Valores para zα / 2 mais usuais: Nível de Confiança 90% 95% 99% Valor crítico: zα / 2 1.645 1.960 2.576 Amplitude do intervalo: A amplitude do intervalo de confiança é dada pela diferença entre o extremo inferior e superior, isto é, σ σ σ X + zα / 2 - ( X − zα / 2 ) = 2 zα / 2 n n n É usual se referir à semi-amplitude, como o erro envolvido na estimação. Exemplo 1: Um cientista descobriu que uma doença que afeta indivíduos de certa região está relacionada com a concentração da substância A no sangue, sendo considerado doente todo indivíduo para o qual a concentração de A é menor que 1,488 mg/cm3. Com o intuito de conhecer a concentração da substância A no sangue em indivíduos desta região afetados pela moléstia em estudo, o cientista avaliou um grupo 867 pessoas. Supondo que a concentração da substância A no sangue, em indivíduos com a doença em estudo, tem distribuição normal com média desconhecida e desvio padrão 0,4 mg/cm3 determine uma estimativa intervalar com 95% de confiança para o nível médio da concentração de substância, sabendo que para esta amostra de 867 pessoas obteve-se x =1,23. Determinação do tamanho da amostra: Este assunto pertence ao que na Estatística se denomina Teoria de Amostragem que não é objeto deste curso, no entanto podemos calcular para algumas situações especiais, o tamanho da amostra necessário, como uma aplicação de intervalos de confiança. Se o objetivo é estimar a média podemos usar os intervalos anteriormente estabelecidos, para obter o tamanho da amostra. Para isto precisamos fixar o maior erro da estimativa aceitável e o nível de confiança com o qual desejamos Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 18
  • 19. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística σ trabalhar. À medida que n cresce o erro padrão da média , decresce. Conseqüentemente o n intervalo de confiança torna-se mais estreito. Com isto, a média é estimada com maior precisão. Em muitas situações, aumentar o tamanho da amostra implica em aumento de custo, por exemplo, tempo, recursos financeiros, etc. Tem-se desta forma um impasse entre precisão na estimativa de e o custo desta estimação. Idealmente, seria interessante analisarmos o problema sob o ponto de vista de estimar µ, com precisão desejada e de acordo com os recursos disponíveis. Entretanto, ignoraremos o fator custo e apenas consideraremos o problema de determinação do tamanho da amostra para uma precisão pré-estabelecida. Durante a fase do planejamento do experimento, o pesquisador pode estabelecer o erro tolerável, e na estimação de . Esta margem de erro pode ser expressa como: e = (x − µ) Como já visto anteriormente o intervalo de confiança aleatório para é dado por: σ σ X − zα / 2 ≤ µ ≤ X + zα / 2 n n que pode ser reescrito como µ − X ≤ zα / 2 σ n (1) σ O fator zα / 2 n é na verdade a precisão usada na estimação de através de x . Observe que E = ( x − µ ) é a variável aleatória erro. Reescrevendo (1) como E ≤ zα / 2σ / n Igualando zα / 2σ / n ao erro e, pré-estabelecido pelo pesquisador, na pior das hipóteses temos: e = zα / 2σ / n Portanto, o tamanho mínimo necessário da amostra para estimar com precisão e, é dado por:  z ∗σ  2 n=   e  Sendo z* o valor crítico para o nível de confiança desejado. 3.6.2.2. INTERVALO DE CONFIANÇA PARA MÉDIA µ COM VARIÂNCIA DESCONHECIDA: Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 19
  • 20. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Nas situações praticas é usual conhecermos o modelo probabilístico (usualmente o normal, nos problemas de Engenharia) associado à variável aleatória em estudo. Porém os parâmetros desse modelo são desconhecidos na situação em estudo, portanto devem ser estimados a partir dos dados da própria amostra. No caso do modelo normal, nessa situação tanto a média µ e a variância σ2 não são conhecidos e seus valores serão estimados pela média e variância amostral. Agora se a distribuição de X, variável em estudo é normal, então a média amostral X tem distribuição N(µ, σ2/n). Se σ2 é conhecido, como vimos no tópico anterior, um intervalo de confiança para µ, é dado por [X ± z * σ n ] . Embora a situação de normalidade seja razoável em muitos casos práticos, dificilmente se conhece a variância de uma população quando sua média é desconhecida. Quando σ2 é desconhecido, e a nossa amostra aleatória (X1,..., Xn) é constituída de variáveis aleatórias independentes com densidade normal de média e variância σ2, utilizamos o “melhor” estimador para σ2 que é por s2. Nesse caso, o intervalo de confiança é obtido utilizando-se uma nova estatística: X −µ T= Sx n sendo s o estimador do desvio padrão σ . Temos que T também é uma variável aleatória, mas apesar de X ter distribuição normal, o denominador de T envolve a variável aleatória S2, que fará com que a função de densidade de T seja diferente da normal. Essa estatística tem distribuição conhecida como t-Student com n-1 graus de liberdade, sendo n o tamanho da amostra. A forma da distribuição t-Student é parecida com a da normal. É simétrica em relação a zero, mas apresenta caudas “grossas”, ou seja, maior variância do que a normal. Aumentando-se o tamanho de amostra n, a distribuição t de Student aproxima-se do modelo normal. Pode-se observar, pela figura abaixo, que a distribuição t –Student é muito semelhante à curva normal. À medida que aumentam os graus de liberdade, a distribuição t-Student aproxima-se da distribuição normal padronizada (média = 0, desvio-padrão = 1). A curva normal padronizada é um caso particular da distribuição t quando graus de liberdade tende ao infinito. Para os propósitos práticos, os valores da distribuição t-Student aproximam-se dos valores da distribuição normal padronizada relativamente depressa, tal que quando graus de liberdade= 30 esses valores são quase idênticos. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 20
  • 21. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Para cada valor de graus de liberdade temos uma distribuição diferente. O procedimento para a obtenção do intervalo é semelhante ao desenvolvido anteriormente. Utilizando a estatística, X −µ T= Sx ~ tn −1 n que nos permite construir o intervalo de confiança para µ. Para isto através da tabela da distribuição tn-1, obtemos um valor de t* tal que X −µ P ( −t * ≤ Sx ≤ t*) = (1 − α ) n Ou seja, P( - t*≤ tn-1 ≤ t*)= 1-α P( X − t * ≤ µ ≤ X +t* ) =1−α Sx Sx n n Assim, um intervalo de confiança para µ com nível de confiança de 100(1-α) % é dado por: IC ( µ ; (1 − α )) : [ X − t n −1, (α / 2) ; X + t n −1, (α / 2 ) Sx Sx n n ] tn −1, (α / 2 ) denota o percentil α/2 (que é equivalente ao percentil (1-(α/2) )da distribuição t- Student com n-1 graus de liberdade. Assim, o intervalo de confiança para µ é centrado na estimativa Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 21
  • 22. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística do efeito, e varia de uma quantidade t * desvios padrão para baixo até o mesmo número de desvios padrão para cima. Exemplo 3: Em uma pesquisa para toxinas produzidas por um parasita que infecta as safras de milho, um bioquímico preparou extratos da cultura do parasita com solventes orgânicos e mediu a quantidade de substância tóxica por grama de solução. Para uma amostra de 9 culturas encontrou uma quantidade média de substância tóxica igual a 1,02 miligramas e um desvio padrão de 0,26 miligramas. Seja µ a verdadeira quantidade média de substância tóxica. Construir um Intervalo de 95% de confiança para µ. Observação: • Se variância σ2 for desconhecida e a variável não tem densidade normal, é necessário considerar um tamanho de amostra suficientemente grande. Pois, nesse caso, é sabido que S2 se aproxima de σ2 de tal forma que seu uso, juntamente com aplicação do Teorema Central do Limite, X −µ permite considerar X como tendo distribuição Normal. Conseqüentemente Sx ~ N (0,1) , e n um intervalo de confiança γ para é dado por: IC ( µ ; (1 − α )) : [ X − z(α / 2 ) ; X + z(α / 2 ) Sx Sx n n ] Exemplo 4: Para estimar o rendimento semanal de operários de construção de uma grande cidade, um sociólogo seleciona uma amostra aleatória de 75 operários. A média amostral é dada por x = 427,00 reais e s= 15,00 reais. Determine um intervalo de confiança para µ considerando coeficientes de confiança 0,90 e 0,95. 3.6.3. INTERVALO DE CONFIANÇA PARA DIFERENÇAS DE MÉDIAS: Engenheiros e cientistas estão freqüentemente interessados em comparar duas condições diferentes, com o objetivo de determinar se as mesmas produzem diferentes resultados na resposta que esta sendo observada. Essas condições são chamadas na maioria das vezes de tratamentos. Consideremos a seguinte situação: Dois tratamentos são definidos por duas diferentes formulações de tinta (formulação padrão e uma nova formulação) e a resposta é o tempo de secagem. O objetivo do estudo é determinar se a nova formulação resulta redução do tempo de secagem. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 22
  • 23. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Nesse caso, o objetivo do estudo passa pelo estudo das médias observadas em amostras de unidades de observação submetidas aos dois tratamentos em estudos (diferentes formulações, no exemplo). Uma das formas possíveis de analisar o comportamento de dois tratamentos é o estudo da diferença de suas médias. A partir do valor estimado, a partir da amostra, podermos identificar que tratamento apresenta melhor desempenho na resposta de interesse. Portanto, para análise do problema utilizaremos a distribuição da estatística “diferença de duas médias” apresentada em Lembrando: Se o primeiro tratamento tem uma media 1 e variância σ 12 e o segundo tratamento tem uma media 2 e variância σ 2 . Supondo que ambas as populações possam ser representadas pelo 2 modelo normal ou que as condições do Teorema Central do Limite são satisfeitas, podemos dizer que a distribuição amostral de X 1 − X 2 é normal, com media µ X − X = µ X − µ X = µ1 − µ 2 1 2 1 2 e variância σX 2 σX 2 σ 2 X1 − X 2 =σ 2 X1 +σ 2 X 21 = 1 + 2 n1 n2 Portanto: σ 12 σ2 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 A distribuição amostral da diferença entre duas médias nos leva a considerar, para fins de obtenção de um intervalo de confiança, as seguintes situações: • Variâncias dos diferentes grupos (tratamentos) são conhecidas; • Variâncias dos diferentes grupos (tratamentos) são desconhecidas e portanto também precisam ser estimadas na amostra; Mas temos ainda que, para ambos os casos precisamos considerar se as variâncias são iguais ou diferentes nos diferentes tratamentos, surge ai também duas alternativas: • Variâncias Iguais; Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 23
  • 24. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística • Variâncias Diferentes; 3.6.3.1. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COM VARIÂNCIAS CONHECIDAS: Considerando o resultado acima apresentado: σ 12 σ2 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 e utilizando os mesmos procedimentos utilizados no caso de uma amostra, podemos facilmente mostrar que um intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por:  σ 12 σ 2 2 σ 12 σ 2  2  X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2 +    n1 n2 n1 n2   ou seja:  σ 12 σ 2 2 σ 12 σ 2  2 P  X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2 +  = 1−α   n1 n2 n1 n2   Exemplo: Testes de resistência à tensão foram realizados em duas estruturas contendo dois teores de alumínio. Essas estruturas foram usadas na fabricação das asas de um avião comercial. De experiências passadas com o passado de fabricação dessas estruturas e com o procedimento de testes, os desvios-padrão das resistências a tensão são considerados conhecidos e dados por 1.0 no caso da estrutura 1 e de 1.5 na estrutura 2. Uma amostra de 10 unidades da estrutura 1 resultaram em uma resistência a tensão média de 87.6 enquanto que uma amostra de 12 unidades da estrutura 2 resultou em uma média de 74.5. Encontre um intervalo de confiança de 90% para a diferença das médias de resistência a tensão das duas estruturas. Solução: Seja: X1 = resistência a tensão na estrutura 1 X2 = resistência a tensão na estrutura 2 Considerando ainda que em ambos os casos a resistência a tensão pode ser representada por um modelo normal, temos que: Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 24
  • 25. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística σ 12 σ2 2 1 1 .5 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) ⇒ X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 10 12 e o intervalo de confiança é dado por:  σ 12 σ 2 2 σ 12 σ 2  2  X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 + zα / 2 + =   n1 n 2 n1 n2    1 1 .5 2 1 1 .5 2  87.6 − 74.5 − zα / 2 + ≤ µ1 − µ 2 ≤ 87.6 − 74.5 + zα / 2 + =   10 12 10 12    1 1 .5 2 1 1 .5 2  13.1 − 1.645 + ≤ µ1 − µ 2 ≤ 13.1 + 1.645 + =   10 12 10 12   [13.1 − 0.88 ≤ µ1 − µ 2 ≤ 13.1 + 0.88] = [12.22 ≤ µ1 − µ 2 ≤ 13.98] Questão: Qual o significado destes intervalos ser todo positivo? Observação: Se as variâncias dos diferentes tratamentos (grupos) além de conhecidas forem iguais, temos que: σ 12 = σ 2 = σ 2 então a expressão do intervalo de confiança fica simplificada da seguinte forma: 2  1 1 1 1   X 1 − X 2 − z α / 2σ + ≤ µ1 − µ 2 ≤ X 1 − X 2 − zα / 2σ +   n1 n 2 n1 n 2  3.6.3.2. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COM VARIÂNCIAS DESCONHECIDAS E IGUAIS: Nessa situação consideramos que a variância dos dois tratamentos em estudo são desconhecidos, logo devem também ser estimados pela amostra. Porém, embora desconhecidas, têm-se a informação que as variâncias dos dois tratamentos são iguais. Nesse caso temos:   σ 2 σ 2   1 1  X 1 − X 2 ~ N   µ1 − µ 2 ,  1 + 2   ⇒  X 1 − X 2 ~ N ( µ1 − µ 2 , σ 2  +    n  n n     1 n2        1 2  Problema: Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 25
  • 26. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Considerando que as variância são desconhecidas, porém iguais e que é possível obter uma estimativa para variância amostral em cada um dos tratamentos, como estimamos, a partir desses valores, a variância que é igual para ambos os tratamentos? Consideremos: • uma amostra de tamanho n1 do tratamento 1 com variância estimada denotada por S12 ; • 2 uma amostra de tamanho n2 do tratamento 2 com variância estimada denotada por S 2 ; Parece ser razoável combinar as duas variâncias da amostras S12 e S 2 para se obter um estimador 2 único para variância. Este estimador, denominado estimador combinado (pooled estimator) de σ2 é definido por: (n1 − 1) S12 + (n 2 − 1) S 2 2 Sp = 2 n1 + n 2 − 2 conseqüentemente, pelos mesmos motivos expostos quando do estudo para a situação de uma única média com variância desconhecida temos que      (X 1 − X 2 ) − (µ1 − µ 2 ) ~ t  n1 + n2 − 2  1 1   Sp +    n1 n2   e assim o intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por:  1 1 1 1   X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p + ≤ µ1 − µ 2 ≤ X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p +   n1 n2 n1 n2  Exemplo: As análises de dois lotes de carbono de cálcio mostraram as cinzas (%) indicadas na tabela a seguir. Construir um intervalo de confiança de 95% para à diferença de médias destes dois lotes. Amostras Lote 1 Lote 2 1 1.7 5.9 2 5.9 6.9 3 1.5 3.6 4 4.1 4.3 5 5.9 8.0 6 1.7 2.0 7 3.7 4.8 Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 26
  • 27. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 8 3.1 6.8 9 1.7 9.1 10 3.2 1.5 Média Amostral xi 3.25 5.29 Variância Amostral S i2 2.805 6.263 Assim: (n1 − 1) S12 + (n 2 − 1) S 2 9 * 2.805 + 9 * 6.263 2 Sp = 2 = = 4.53 n1 + n 2 − 2 10 + 10 − 2 e o intervalo de confiança é dado por:  1 1 1 1  3.25 − 5.29 − t18 (5%) 4.53 + ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t18 (5%) 4.53 +   10 10 10 10   1 1 1 1  = − 2.04 − 2.101 4.53 + ≤ µ1 − µ 2 ≤ −2.04 + 2.101 4.53 +   10 10 10 10  = [− 6.93 ≤ µ1 − µ 2 ≤ −2.85] Observação: Qual o significado do intervalo conter apenas valores negativos? 3.6.3.3. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COM VARIÂNCIAS DESCONHECIDAS E DIFERENTES: Nessa situação temos que variância dos dois tratamentos em estudo são desconhecidas e diferentes e a estimativa da variância amostral de cada grupo será utilizada como estimador das mesmas. • na amostra de tamanho n1 do tratamento 1, a variância estimada denotada por S12 será o estimador de σ 12 ; • 2 na amostra de tamanho n2 do tratamento 2, a variância estimada denotada por S 2 será o estimador de σ 2 ; 2 Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 27
  • 28. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Dessa forma, pelos mesmos motivos expostos quando do estudo para a situação de uma única média com variância desconhecida temos que     ( X 1 − X 2 ) − ( µ1 − µ 2 ) ~ t   1 1 v   Sp +    n1 n2   com v dado por: 2  S12 S 2  2 n +n    v=  1 2  −2 2 2 2  S12   S2    n       1  +  n2  n1 + 1 n2 + 1 e assim o intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por:  S12 S 2 2 S12 S 2  2  X 1 − X 2 − t v , (α / 2 ) + ≤ µ1 − µ 2 ≤ X 1 − X 2 − t v , ( α / 2 ) +    n1 n2 n1 n2   Exemplo: Refazer o exemplo anterior considerando variâncias diferentes. Variâncias Amostrais S12 = 2.805 S 2 = 6.263 2 2  S12 S 2  2  2.805 6.263  2  n +   +  n2  (0.2805 + 0.6263)2 − 2 v =  12   10 10  −2= −2=  S1  2 2 2  S2   2.805  2  6.263  2 (0.2805)2 + (0.6263)2   n           1  +  n2   10  +  10  11 11 n1 + 1 n2 + 1 11 11 .82 = − 2 = 14.4 .01 + .04 e Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 28
  • 29. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística  2.805 6.263 2.805 6.263  3.25 − 5.29 − t14 (5%) + ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t14 (5%) +   10 10 10 10  [ = − 2.04 − 2.145 .2805 + .6263 ≤ µ1 − µ 2 ≤ −2.04 + 2.145 .2805 + .6263 ] = [− 2.04 − 1.44 ≤ µ1 − µ 2 ≤ −2.04 + 1.44] = [− 3.48 ≤ µ1 − µ 2 ≤ −.60] Interpretação: Observações: • Em todas as situações, temos que as expressões apresentadas são simplificadas quando n1=n2. • Como identificar do ponto de vista estatístico se as variâncias dos dois grupos são iguais ou não? Veremos no próximo ponto. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 29
  • 30. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Anexo 1 t table with right tail probabilities dfp 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0005 1 0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674 636.6192 2 0.288675 0.816497 1.885618 2.919986 4.30265 6.96456 9.92484 31.5991 3 0.276671 0.764892 1.637744 2.353363 3.18245 4.54070 5.84091 12.9240 4 0.270722 0.740697 1.533206 2.131847 2.77645 3.74695 4.60409 8.6103 5 0.267181 0.726687 1.475884 2.015048 2.57058 3.36493 4.03214 6.8688 6 0.264835 0.717558 1.439756 1.943180 2.44691 3.14267 3.70743 5.9588 7 0.263167 0.711142 1.414924 1.894579 2.36462 2.99795 3.49948 5.4079 8 0.261921 0.706387 1.396815 1.859548 2.30600 2.89646 3.35539 5.0413 9 0.260955 0.702722 1.383029 1.833113 2.26216 2.82144 3.24984 4.7809 10 0.260185 0.699812 1.372184 1.812461 2.22814 2.76377 3.16927 4.5869 11 0.259556 0.697445 1.363430 1.795885 2.20099 2.71808 3.10581 4.4370 12 0.259033 0.695483 1.356217 1.782288 2.17881 2.68100 3.05454 4.3178 13 0.258591 0.693829 1.350171 1.770933 2.16037 2.65031 3.01228 4.2208 14 0.258213 0.692417 1.345030 1.761310 2.14479 2.62449 2.97684 4.1405 15 0.257885 0.691197 1.340606 1.753050 2.13145 2.60248 2.94671 4.0728 16 0.257599 0.690132 1.336757 1.745884 2.11991 2.58349 2.92078 4.0150 17 0.257347 0.689195 1.333379 1.739607 2.10982 2.56693 2.89823 3.9651 18 0.257123 0.688364 1.330391 1.734064 2.10092 2.55238 2.87844 3.9216 19 0.256923 0.687621 1.327728 1.729133 2.09302 2.53948 2.86093 3.8834 20 0.256743 0.686954 1.325341 1.724718 2.08596 2.52798 2.84534 3.8495 21 0.256580 0.686352 1.323188 1.720743 2.07961 2.51765 2.83136 3.8193 22 0.256432 0.685805 1.321237 1.717144 2.07387 2.50832 2.81876 3.7921 23 0.256297 0.685306 1.319460 1.713872 2.06866 2.49987 2.80734 3.7676 24 0.256173 0.684850 1.317836 1.710882 2.06390 2.49216 2.79694 3.7454 25 0.256060 0.684430 1.316345 1.708141 2.05954 2.48511 2.78744 3.7251 26 0.255955 0.684043 1.314972 1.705618 2.05553 2.47863 2.77871 3.7066 27 0.255858 0.683685 1.313703 1.703288 2.05183 2.47266 2.77068 3.6896 28 0.255768 0.683353 1.312527 1.701131 2.04841 2.46714 2.76326 3.6739 29 0.255684 0.683044 1.311434 1.699127 2.04523 2.46202 2.75639 3.6594 30 0.255605 0.682756 1.310415 1.697261 2.04227 2.45726 2.75000 3.6460 inf 0.253347 0.674490 1.281552 1.644854 1.95996 2.32635 2.57583 3.2905 Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 30
  • 31. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 3.7. TESTE DE HIPÓTESES: 3.7.1. INTRODUÇÃO: Inferir significa tirar uma conclusão. A inferência estatística oferece-nos métodos para tirarmos conclusões para a população a partir dos dados amostrais disponíveis, conclusões estas que devem levar em conta a variabilidade natural dos dados. Na verdade, nos tópicos anteriores já estabelecemos algumas formas de se obter conclusões a partir dos dados amostrais. O que será novo a partir de agora é que recorremos à probabilidade para descrever a variação que se produz pelo acaso. Definimos anteriormente que a inferência estatística pode ser realizada a partir da estimação (pontual e por intervalos) e através de testes de hipóteses. Na parte de estimação, vimos que os intervalos de confiança são um dos tipos mais comuns de inferência estatística. Eles são apropriados quando nosso objetivo é estimar um parâmetro populacional. Por outro lado, os testes de hipóteses, também chamados de testes de significância, são direcionados a um objetivo diferente: avaliar a evidência fornecida pelos dados sobre alguma afirmação feita sobre a população. Especificamente, em problemas de Engenharia, muitos problemas exigem uma tomada de decisão entre aceitar ou rejeitar uma afirmação a cerca de uma característica populacional. A afirmação a ser investigada é denominada de hipótese e o procedimento de tomada de decisão sobre a hipótese é o que denominamos de teste de hipótese. Por exemplo, suponha que estamos interessados na taxa de queima de um propelente sólido, usado para fornecer energia aos sistemas de escapamento de aeronaves. A taxa de queima é uma variável aleatória que pode ser descrita por um modelo de probabilidade. O interesse no problema consiste em verificar se a taxa média de queima (parâmetro do modelo de probabilidade) é ou não equivalente a 50 cm/s. Os testes de hipóteses é um dos aspectos mais úteis da inferência estatística, uma vez que muitos tipos de problemas de tomada de decisão, teste ou experimentos, no mundo da engenharia, podem ser formulados como um problema desse tipo. Podemos considerar o teste estatístico de hipóteses como o estágio da análise de dados de um experimento comparativo, em que o engenheiro, como no exemplo acima, deseja comparar a média de uma população a dado valor especifico de interesse no problema. Esses experimentos comparativos simples são freqüentemente encontrados na prática e fornecem uma boa base para problemas mais complexos de planejamento de experimentos que serão discutidos as seguir. Considerando que os métodos de inferência baseiam-se nas distribuições amostrais, eles requerem um modelo probabilístico para os dados. Modelos probabilísticos confiáveis podem aparecer de muitas maneiras, e a segurança do modelo e a confiabilidade da inferência são máximas quando os dados são provenientes de um modelo apropriadamente aleatorizado. Quando utilizamos Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 31
  • 32. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística a inferência estatística estamos considerando os dados como se eles fossem provenientes de uma amostra aleatória ou de um experimento onde em alguma etapa de sua execução, houve uma forma de atribuição ou sorteio aleatório. Caso isto não se verifique as nossas conclusões poderão ser objeto de contestação. Um teste de significância é um procedimento formal para comparar dados observados com uma hipótese, cuja veracidade procura-se avaliar. A hipótese constitui-se em uma afirmação que se faz sobre os parâmetros de uma população ou de um modelo. Os resultados de um teste são expressos em termos de uma probabilidade que mede quão bem os dados e a hipótese concordam entre si. 3.7.2. DEFINIÇÕES E CONCEITOS BÁSICOS: Definição 1: Em estatística, uma hipótese, é uma afirmativa sobre uma propriedade da população, ou ainda, uma afirmação sobre os parâmetros de uma ou mais populações. Definição 2: Um teste de hipótese (ou teste de significâncias), é um procedimento para se verificar a veracidade ou não de uma hipótese estatística. Consideremos o exemplo da taxa de queima de um propeleno sólido, acima apresentado. Nesse problema a tomada de decisão significa concluir por uma das duas seguintes alternativas. H1 : A taxa média de queima do propeleno sólido é 50 cm/s. H2 : A taxa média de queima do propeleno sólido não é 50 cm/s. Sob ponto de vista estatístico, considerando que representa a taxa média de queima populacional, as hipóteses acima são definidas como. H0 : = 50 cm/s H1 : ≠ 50 cm/s A alternativa H1 ou Hipótese H0 é chamada de hipótese nula enquanto que a alternativa H2 ou hipótese H1 é chamada de hipótese alternativa. Definição 3: A Hipótese Nula é a afirmativa de que o parâmetro populacional é igual a uma valor específico. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 32
  • 33. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Definição 4: A Hipótese Alternativa é a afirmativa de que o parâmetro populacional tem um valor que, de alguma forma, difere da hipótese nula. No exemplo, temos que a hipótese alternativa especifica valores de que podem ser maiores ou menores que 50 cm/s, nessa situação dizemos que a hipótese alternativa é bilateral. Em determinadas situações, podemos desejar formular uma hipótese unilateral, ou seja, verificar se o valor de é especificamente maior ou menor que o valor definido pela hipótese nula. No exemplo: H0 : = 50 cm/s ou H0 : = 50 cm/s H1 : > 50 cm/s H1 : < 50 cm/s O valor do parâmetro especificado da população na hipótese nula (50 cm/s, no exemplo), é geralmente definido a partir de uma das três maneiras: 1. Pode ser resultado de experiências passadas ou de conhecimento do processo ou mesmo de testes ou experimentos prévios; 2. O valor pode ser determinado, a partir de alguma teoria ou modelo relativo ao processo em estudo; 3. O valor de parâmetro da população resulta de considerações externas, tais como valor de projeto ou especificações de engenharia ou a partir de obrigações contratuais. A partir de um teste de hipóteses verificamos se os dados provenientes da amostra são consistentes com a hipótese em estudo. A medida que os dados forem consistentes com a hipótese, concluiremos que a hipótese é verdadeira; no entanto se essa informação for inconsistente com a hipótese, concluiremos que a hipótese é falsa. Destacamos que a veracidade ou falsidade de uma hipótese especifica nunca pode ser conhecida com certeza, exceto se toda população fosse observada, o que é usualmente impossível na prática. A estrutura de problemas de testes de hipóteses será idêntica em todas as aplicações que iremos considerar. A hipótese nula é aquela que se deseja testar. A rejeição dessa hipótese leva a aceitação da hipótese alternativa. Testar a hipótese envolve considerar uma amostra aleatória, calcular uma estatística de teste a partir dos dados amostrais e, então a partir da estatística de teste tomar uma decisão com respeito à hipótese nula. Definição 5: Uma estatística de teste é um valor calculado a partir dos dados amostrais e é usada para tomar a decisão sobre a rejeição ou não da hipótese nula. Para isso faz-se necessário a Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 33
  • 34. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística comparação da estatística com um valor de referência a fim de ser possível a tomada de decisão de rejeição ou não da hipótese. Com o objetivo de ilustrar as definições e conceitos acima, considere o problema da taxa de queima do propelente, introduzido anteriormente. A hipótese nula e a taxa média de queima ser 50 cm/s; a alternativa é: essa taxa não é igual a 50 cm/s. Ou seja, desejamos testar H0 : = 50 cm/s H1 : ≠ 50 cm/s Suponha que uma amostra de n = 10 espécimes seja testada e que a taxa media de queima da amostra x seja observada. A média amostral é uma estimativa da media verdadeira da população. Um valor da media amostral x que caia próximo ao valor da hipótese de = 50 cm/s é uma evidência de que a media verdadeira é realmente 50 cm/s; isto é, tal evidencia suporta a hipótese nula Ho. Por outro lado, uma média amostral que seja consideravelmente diferente de 50 cm/s evidencia de que a hipótese alternativa H1 é valida. Assim, a média amostral é a estatística de teste nesse caso. A média amostral pode assumir muitos valores. Suponha que se 48,5 < x < 51,5, não rejeitaremos a hipótese nula Ho: = 50. Se x < 48,5 ou x > 51,5, rejeitaremos a hipótese nula em favor da hipótese alternativa H1: ≠ 50. Isso é ilustrado na Fig. 3.14. Os valores de x que forem menores do que 48,5 e maiores do que 51,5 constituem a região critica para o teste, enquanto todos os valores que estejam no intervalo 48,5 < x < 51,5 formam uma região para a qual falharemos em rejeitar a hipótese nula. Por convenção, ela geralmente e chamada de região de aceitação. O limite entre as regiões critica e a região de aceitação é chamada de valores críticos. Em nosso exemplo, os valores críticos são 48,5 e 51,5. E comum estabelecer conclusões relativas a hipótese nula Ho. Logo, rejeitaremos Ho em favor de H1 se a estatística de teste cair na região crítica e deixamos de rejeitar H0 caso contrário. Região Crítica 1 Região de não Rejeição de Ho Região Crítica 2 Figura 3.13 Critério de decisão no teste de H0 contra H1 Definição 6: Região crítica é definida pelo conjunto de valores para os quais a hipótese H0 é rejeitada. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 34