1. Sesión 3Sesión 3
TLC,TLC,
Intervalos de Confianza yIntervalos de Confianza y
pruebas de Hipótesispruebas de Hipótesis
Estadística en las
organizaciones AD4001
Dr. Jorge Ramírez Medina
2. Distribución deDistribución de
probabilidad Normalprobabilidad Normal
estandarizadaestandarizada
Función de densidad normal estándar
donde:
z = (x – µ)/σ
π = 3.14159
e = 2.71828
Dr Jorge Ramírez Medina
EGADE Business School
2
2
2
1
)(
z
exf
−
=
πσ
3. Distribución deDistribución de
probabilidad Normalprobabilidad Normal
estandarizadaestandarizada
Ejemplo: “El tuercas”
• Punto de reorden 20 litros
• La demanda durante el tiempo de resurtido esta
distribuida normalmente
• Media 15 lts, desv. est. 6 lts
El
tuercas
5w-20
Motor Oil
Dr Jorge Ramírez Medina
EGADE Business School
4. zz = (= (xx -- µµ)/)/σσ
= (20 - 15)/6= (20 - 15)/6
= .83= .83
Paso 1: ConviertaPaso 1: Convierta xx a la distribución normal estándara la distribución normal estándar
El
Tuercas
5w-20
Motor Oil
Paso 2: encuentre el área bajo la curva normalPaso 2: encuentre el área bajo la curva normal
estandarizada a la izquierda de z = .83.estandarizada a la izquierda de z = .83.
Distribución deDistribución de
probabilidadprobabilidad
Normal estandarizadaNormal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
5. Tabla de probabilidad acumulada para la distribución
normal estandarizada
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
. . . . . . . . . . .
P(z < .83)P(z < .83)
Distribución deDistribución de
probabilidadprobabilidad
Normal estandarizadaNormal estandarizada
El
Tuercas
5w-20
Motor Oil
http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.htm
Dr Jorge Ramírez Medina
EGADE Business School
6. P(z > .83) = 1 – P(z < .83)P(z > .83) = 1 – P(z < .83)
= 1- .7967= 1- .7967
= .2033= .2033
Step 3: Calcule el área bajo la curva normal estandar
a la derecha de z = .83.
Probabilidad deProbabilidad de
faltantesfaltantes P(x > 20)P(x > 20)
El
Tuercas
5w-20
Motor Oil
Distribución deDistribución de
probabilidadprobabilidad
Normal estandarizadaNormal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
7. 0 .83
Area = .7967
Area = 1 - .7967
= .2033
z
El
Tuercas
5w-20
Motor Oil
Distribución deDistribución de
probabilidadprobabilidad
Normal estandarizadaNormal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
8. Si se desea que la probabilidad de faltantes
no sea más de 0.05, cuál deberá ser el
punto de reorden?
El
Tuercas
5w-20
Motor Oil
Distribución deDistribución de
probabilidadprobabilidad
Normal estandarizadaNormal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
9. 0
Area = .9500
Area = .0500
zz
z.05
El
Tuercas
5w-20
Motor Oil
Distribución deDistribución de
probabilidadprobabilidad
Normal estandarizadaNormal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
10. Paso 1: encuentre el valor de z que corta un área de .05
en la cola derecha de la distribución normal
estándar.
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
. . . . . . . . . . .
Buscamos el complemento de elBuscamos el complemento de el
área en la cola (1 - .05 = .95)área en la cola (1 - .05 = .95) El
Tuercas
5w-20
Motor Oil
Distribución deDistribución de
probabilidadprobabilidad
Normal estandarizadaNormal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
11. paso 2: Convierta z.05 al correspondiente valor de x.
x = µ + z.05σ
= 15 + 1.645(6)
= 24.87 o 25
Un punto de reorden de 25 litros llevará la probabilidad
de faltantes durante el reabasto (poco menos de) .05.
El
Tuercas
5w-20
Motor Oil
Distribución deDistribución de
probabilidadprobabilidad
Normal estandarizadaNormal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
12. Distribución de muestreo
de la media muestral
• Es la distribución de probabilidad de la
población de todas las posibles medias
muestrales que pueden ser obtenidas de
todas las posibles muestras del mismo
tamaño.
Dr. Jorge Ramírez Medina
EGADE Business School
13. Forma de distribuciónForma de distribución
muestral demuestral de x
Dr Jorge Ramírez Medina
EGADE Business School
14. Si se usa una muestra aleatoria simple grande
(n > 30) el teorema del límite central nos permite
concluir que la distribución de puede ser
aproximada como una distribución normal.
Cuando la muestra aleatoria simple es pequeña
(n < 30), la distribución de muestreo de puede ser
considerada normal sólo si asumimos que la
población tiene una distribución normal.
Forma de distribuciónForma de distribución
muestral demuestral de x
Dr Jorge Ramírez Medina
EGADE Business School
x
x
15. UnaUna estimación del intervaloestimación del intervalo se puede calcularse puede calcular
por sumar y restar unpor sumar y restar un margen de errormargen de error del estimadordel estimador
puntual:puntual:
Estimador puntual +/- Margen de Error
Margen de Error yMargen de Error y
estimación de intervalosestimación de intervalos
Por ejemplo la forma general de una estimación delPor ejemplo la forma general de una estimación del
intervalo para una media poblacional es:intervalo para una media poblacional es:
Margen de Error±
Dr Jorge Ramírez Medina
EGADE Business School
x
16. Estimación de intervalo deEstimación de intervalo de
la media de una Poblaciónla media de una Población :
σ conocidaconocida
El margen de error puede ser calculado con:
– La desviación estándar de la población σ , o
– La desviación estándar de la muestra s
σ raramente se conoce con exactitud, se
pueden obtener estimados de datos
históricos.
Dr Jorge Ramírez Medina
EGADE Business School
17. Para el ejemplo de los
autos
Dr. Jorge Ramírez Medina
EGADE Business School
18. µµ
αα/2/2 αα/2/2
Estimación de intervalo deEstimación de intervalo de
la media de una Población :la media de una Población :
σ conocidaconocida
x
Dr Jorge Ramírez Medina
EGADE Business School
Distribución deDistribución de
Muestreo deMuestreo de
1 - α de
todos los valores
de x
xz σα 2/ xz σα 2/
intervalointervalo
incluyeincluye mm
intervalointervalo
nono
incluyeincluye mm
http://onlinestatbook.com/stat_sim/conf_interval/index.html
19. • Estimación de intervalo de µ
donde: es la media muestral
1 -α es el coeficiente de confidencia
zα/2 es el valor z que provee un área de
α/2 en la cola superior de la distribución
de probabilidad normal estandarizada
σ es la desviación estándar de la población
n es el tamaño de la muestra
Estimación de intervalo deEstimación de intervalo de
la media de una Población :la media de una Población :
σ conocidaconocida
x
Dr Jorge Ramírez Medina
EGADE Business School
n
zx
σ
α 2/±
20. • Selección del tamaño de la muestra
en la mayoría de las aplicaciones, un tamaño deen la mayoría de las aplicaciones, un tamaño de
muestra de n = 30 es adecuado.muestra de n = 30 es adecuado.
Si la distribución de la población es de un alto sesgoSi la distribución de la población es de un alto sesgo
o contiene outliers, se recomienda un tamaño deo contiene outliers, se recomienda un tamaño de
muestra de 50 ó más.muestra de 50 ó más.
Estimación de intervalo deEstimación de intervalo de
la media de una Población :la media de una Población :
σ conocidaconocida
Dr Jorge Ramírez Medina
EGADE Business School
21. • Selección del tamaño de la muestra
si la población no está normalmente distribuida perosi la población no está normalmente distribuida pero
es simétrica (+/-) un tamaño de muestra pequeñoes simétrica (+/-) un tamaño de muestra pequeño
de 15 es suficiente.de 15 es suficiente.
Si se cree que la distribución de la población esSi se cree que la distribución de la población es
aproximadamente normal, se puede utilizar unaproximadamente normal, se puede utilizar un
tamaño de muestra de menos de 15.tamaño de muestra de menos de 15.
Estimación de intervalo deEstimación de intervalo de
la media de una Población :la media de una Población :
σ conocidaconocida
Dr Jorge Ramírez Medina
EGADE Business School
22. • Ejemplo: DiscoSuena
Estimación de intervalo deEstimación de intervalo de
la media de una Población :la media de una Población :
σ conocidaconocida
n=36
U= $31,100
S= $4,500
Intervalo de confianza del 95%
x
σ
Dr Jorge Ramírez Medina
EGADE Business School
23. 95% de las medias muestrales, están dentro de
un + 1.96 de la media poblacional µ.σ x
El margen de error es:
Estimación de intervalo deEstimación de intervalo de
la media de una Población :la media de una Población :
σ conocidaconocida
La estimación del intervalo para µ es:
$31,100 + $1,470
o
$29,630 to $32,570
470,1
36
500,4
96.12/ =
=
n
z
σ
α
Dr Jorge Ramírez Medina
EGADE Business School
24. • Si no se puede tener un estimado de la
desviación estándar de la población σ se utiliza la
desviación estándar s de la muestra para estimar σ .
• En este caso, la estimación del intervalo para µ está
basada en la distribución t.
Estimación de intervalo deEstimación de intervalo de
la media de una Población :la media de una Población :
σ desconocidadesconocida
Dr Jorge Ramírez Medina
EGADE Business School
25. La distribución t es una familia de distribuciones deLa distribución t es una familia de distribuciones de
probabilidad similares.probabilidad similares.
Una distribución t específica depende de unUna distribución t específica depende de un
parámetro conocido como grados de libertad.parámetro conocido como grados de libertad.
Los grados de libertad se refieren a el número deLos grados de libertad se refieren a el número de
piezas independientes de información que se usanpiezas independientes de información que se usan
en el cálculo de s.en el cálculo de s.
Distribución t
Dr Jorge Ramírez Medina
EGADE Business School
26. Conforme la distribución t tiene más grados deConforme la distribución t tiene más grados de
libertad, ésta tiene menos dispersión.libertad, ésta tiene menos dispersión.
Conforme se incrementan los grados de libertad,Conforme se incrementan los grados de libertad,
la diferencia entre la distribución t y la distribuciónla diferencia entre la distribución t y la distribución
de probabilidad normal estandarizada se hace másde probabilidad normal estandarizada se hace más
pequeña.pequeña.
Distribución t
William Sealy Gosset
Dr Jorge Ramírez Medina
EGADE Business School
28. Para más de 100 grados de libertad, el valor de zPara más de 100 grados de libertad, el valor de z
normal estandarizado, da una buena aproximaciónnormal estandarizado, da una buena aproximación
del valor t.del valor t.
Los valores z normal estandarizados, se puedenLos valores z normal estandarizados, se pueden
encontrar en la tabla t, con infinito grados de libertad.encontrar en la tabla t, con infinito grados de libertad.
Distribución t
Dr Jorge Ramírez Medina
EGADE Business School
29. Degrees Area in Upper Tail
of Freedom .20 .10 .05 .025 .01 .005
. . . . . . .
50 .849 1.299 1.676 2.009 2.403 2.678
60 .848 1.296 1.671 2.000 2.390 2.660
80 .846 1.292 1.664 1.990 2.374 2.639
100 .845 1.290 1.660 1.984 2.364 2.626
.842 1.282 1.645 1.960 2.326 2.576∞
Valores z
normal estandarizados
Distribución t
Dr Jorge Ramírez Medina
EGADE Business School
30. Pruebas de hipótesisPruebas de hipótesis
• Una cola
– Cola superior
– Cola inferior
σ conocida
σ desconocida
• Dos colas
σ conocida
σ desconocida
Dr Jorge Ramírez Medina
EGADE Business School
α = .10
Reject H0
Do Not Reject H0
zz
31. Hipótesis nula y
alternativa
Hypothesis testing can be used to determine whether
a statement about the value of a population parameter
should or should not be rejected.
The null hypothesis, denoted by H0 , is a tentative
assumption about a population parameter.
The alternative hypothesis, denoted by Ha, is the
opposite of what is stated in the null hypothesis.
The alternative hypothesis is what the test is
attempting to establish.
Dr Jorge Ramírez Medina
EGADE Business School
32. • Testing Research Hypotheses
Planteamiento de
Hipótesis
• The research hypothesis should be expressed as
the alternative hypothesis.
• The conclusion that the research hypothesis is true
comes from sample data that contradict the null
hypothesis.
Dr Jorge Ramírez Medina
EGADE Business School
34. Type I and Type II Errors
Correct
Decision
Type II Error
Correct
DecisionType I Error
Reject H0
(Conclude µ > 12)
Accept H0
(Conclude µ < 12)
H0 True
(µ < 12)
H0 False
(µ > 12)Conclusion
Population Condition
Dr Jorge Ramírez Medina
EGADE Business School
ErroresErrores
35. Error Tipo I
Because hypothesis tests are based on sample data,
we must allow for the possibility of errors.
A Type I error is rejecting H0 when it is true.
The probability of making a Type I error when the
null hypothesis is true as an equality is called the
level of significance.
Applications of hypothesis testing that only control
the Type I error are often called significance tests.
Dr Jorge Ramírez Medina
EGADE Business School
36. A Type II error is accepting H0 when it is false.
It is difficult to control for the probability of making
a Type II error.
Statisticians avoid the risk of making a Type II
error by using “do not reject H0” and not “accept H0”.
Error Tipo II
Dr Jorge Ramírez Medina
EGADE Business School
37. One-tailed
(lower-tail)
One-tailed
(upper-tail)
Two-tailed
Summary of Forms for Null and Alternative
Hypotheses about a Population Mean
The equality part of the hypotheses always appears
in the null hypothesis.
In general, a hypothesis test about the value of a
population mean µ must take one of the following
three forms (where µ0 is the hypothesized value of
the population mean).
Dr Jorge Ramírez Medina
EGADE Business School
0 0:H µ µ≥
0:aH µ µ<
0 0:H µ µ≤
0:aH µ µ>
0 0:H µ µ=
0:aH µ µ≠
38. The rejection rule:The rejection rule:
RejectReject HH00 if theif the pp-value-value << αα ..
Compute theCompute the pp-value-value using the following three steps:using the following three steps:
3. Double the tail area obtained in step 2 to obtain3. Double the tail area obtained in step 2 to obtain
thethe pp –value.–value.
2. If2. If zz is in the upper tail (is in the upper tail (zz > 0), find the area under> 0), find the area under
the standard normal curve to the right ofthe standard normal curve to the right of zz..
IfIf zz is in the lower tail (is in the lower tail (zz < 0), find the area under< 0), find the area under
the standard normal curve to the left ofthe standard normal curve to the left of zz..
1. Compute the value of the test statistic1. Compute the value of the test statistic zz..
p-Value para la prueba de
Hipótesis de dos colas
Dr Jorge Ramírez Medina
EGADE Business School
39. he critical values will occur in both the lower andhe critical values will occur in both the lower and
pper tails of the standard normal curve.pper tails of the standard normal curve.
The rejection rule is:The rejection rule is:
RejectReject HH00 ifif zz << --zzαα/2/2 oror zz >> zzαα/2/2..
Use the standard normal probability distributionUse the standard normal probability distribution
table to findtable to find zzαα/2/2 (the(the zz-value with an area of-value with an area of αα/2 in/2 in
the upper tail of the distribution).the upper tail of the distribution).
p-Value para la prueba de
Hipótesis de dos colas
Dr Jorge Ramírez Medina
EGADE Business School
40. Step 1.Step 1. Develop the null and alternative hypotheses.Develop the null and alternative hypotheses.
Step 2.Step 2. Specify the level of significanceSpecify the level of significance αα..
Step 3.Step 3. Collect the sample data and compute the testCollect the sample data and compute the test
statistic.statistic.
pp-Value Approach-Value Approach
Step 4.Step 4. Use the value of the test statistic to compute theUse the value of the test statistic to compute the
pp-value.-value.
Step 5.Step 5. RejectReject HH00 ifif pp-value-value << αα..
Pasos de la prueba de
Hipótesis
Dr Jorge Ramírez Medina
EGADE Business School
41. Critical Value ApproachCritical Value Approach
Step 4.Step 4. Use the level of significanceUse the level of significance to determineto determine
the critical value and the rejection rule.the critical value and the rejection rule.
Step 5.Step 5. Use the value of the test statistic and theUse the value of the test statistic and the
rejectionrejection
rule to determine whether to rejectrule to determine whether to reject HH00..
Pasos de la prueba de
Hipótesis
Dr Jorge Ramírez Medina
EGADE Business School
42. Ejemplo: Pasta de
dientes
• Two-Tailed Test About a Population Mean:Two-Tailed Test About a Population Mean: σσ KnownKnown
oz.
GlowGlow
Quality assurance procedures call forQuality assurance procedures call for
the continuation of the filling process if thethe continuation of the filling process if the
sample results are consistent with the assumption thatsample results are consistent with the assumption that
the mean filling weight for the population of toothpastethe mean filling weight for the population of toothpaste
tubes is 6 oz.; otherwise the process will be adjusted.tubes is 6 oz.; otherwise the process will be adjusted.
The production line for Glow toothpasteThe production line for Glow toothpaste
is designed to fill tubes with a mean weightis designed to fill tubes with a mean weight
of 6 oz. Periodically, a sample of 30 tubesof 6 oz. Periodically, a sample of 30 tubes
will be selected in order to check thewill be selected in order to check the
filling process.filling process.
Dr Jorge Ramírez Medina
EGADE Business School
43. Two-Tailed Test About a Population Mean:Two-Tailed Test About a Population Mean: σσ KnownKnown
oz.
GlowGlow
Perform a hypothesis test, at the .03Perform a hypothesis test, at the .03
level of significance, to help determinelevel of significance, to help determine
whether the filling process should continuewhether the filling process should continue
operating or be stopped and corrected.operating or be stopped and corrected.
Assume that a sample of 30 toothpasteAssume that a sample of 30 toothpaste
tubes provides a sample mean of 6.1 oz.tubes provides a sample mean of 6.1 oz.
The population standard deviation isThe population standard deviation is
believed to be 0.2 oz.believed to be 0.2 oz.
Ejemplo: Pasta de dientes
Dr Jorge Ramírez Medina
EGADE Business School
44. 1. Determine the hypotheses.1. Determine the hypotheses.
2. Specify the level of significance2. Specify the level of significance..
3. Compute the value of the test statistic.3. Compute the value of the test statistic.
αα = .03= .03
p –Value and Critical Value Approachesp –Value and Critical Value Approaches
GlowGlow
HH00:: µµ = 6= 6
HHaa:: 6µ ≠
Prueba de dos colas de
µ:
σ conocida
Dr Jorge Ramírez Medina
EGADE Business School
74.2
302.
61.6
=
−
=
n
xz
/
0
σ
µ−=
45. GlowGlow
5. Determine whether to reject H5. Determine whether to reject H00..
p –Value Approachp –Value Approach
4. Compute the p –value.4. Compute the p –value.
ForFor zz = 2.74, cumulative probability = .9969= 2.74, cumulative probability = .9969
pp–value = 2(1–value = 2(1 −− .9969) = .0062.9969) = .0062
BecauseBecause pp–value = .0062–value = .0062 << αα = .03, we reject= .03, we reject HH00..
We are at least 97% confident that the meanWe are at least 97% confident that the mean
filling weight of the toothpaste tubes is not 6 oz.filling weight of the toothpaste tubes is not 6 oz.
Prueba de dos colas de
µ:
σ conocida
Dr Jorge Ramírez Medina
EGADE Business School
46. GlowGlow
α/2 =
.015
0
zα/2 = 2.17
z
α/2 =
.015
p-Value Approachp-Value Approach
-zα/2 = -2.17
z = 2.74z = -2.74
1/2
p -value
= .0031
1/2
p -value
= .0031
Prueba de dos colas de
µ:
σ conocida
Dr Jorge Ramírez Medina
EGADE Business School
47. Prueba de dos colas de
µ:
σ conocida
Dr Jorge Ramírez Medina
EGADE Business School
Critical Value ApproachCritical Value Approach
GlowGlow
5. Determine whether to reject H5. Determine whether to reject H00..
We are at least 97% confident that the meanWe are at least 97% confident that the mean
filling weight of the toothpaste tubes is not 6 oz.filling weight of the toothpaste tubes is not 6 oz.
Because 2.47Because 2.47 >> 2.17, we reject2.17, we reject HH00..
ForFor αα/2 = .03/2 = .015,/2 = .03/2 = .015, zz.015.015 = 2.17= 2.17
4. Determine the critical value and rejection rule.4. Determine the critical value and rejection rule.
RejectReject HH00 ifif zz << -2.17 or-2.17 or zz >> 2.172.17
48. Prueba de dos colas de
µ:
σ conocida
Dr Jorge Ramírez Medina
EGADE Business School
α/2 = .015
0 2.17
Reject H0Do Not Reject H0
z
Reject H0
-2.17
GlowGlow
Critical Value ApproachCritical Value Approach
Sampling
distribution
of
α/2 = .015
n
xz
/
0
σ
µ−=
49. Prueba de Hipótesis de
µ:
σ desconocida
• Test StatisticTest Statistic
Dr Jorge Ramírez Medina
EGADE Business School
This test statistic has aThis test statistic has a tt distributiondistribution
withwith nn - 1 degrees of freedom.- 1 degrees of freedom.
t
x
s n
=
− µ0
/
50. Rejection Rule: p -Value ApproachRejection Rule: p -Value Approach
HH00:: µµ << µµ00 RejectReject HH00 ifif tt >> ttαα
RejectReject HH00 ifif tt << --ttαα
RejectReject HH00 ifif tt << -- ttα/2α/2 oror tt >> ttα/2α/2
HH00:: µµ >> µµ00
HH00:: µµ == µµ00
Rejection Rule: Critical Value ApproachRejection Rule: Critical Value Approach
RejectReject HH00 ifif pp –value–value << αα
Prueba de Hipótesis de
µ:
σ desconocida
Dr Jorge Ramírez Medina
EGADE Business School