1. Procesos industriales área manufactura.
Estadística.
Tema 1. Prueba de hipótesis
Tema 2. Intervalos de confianza.
Leonardo García Lamas.
Grupo y sección: 2 “a”
2. PRUEBA DE HIPÓTESIS
Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal
contraste involucra la toma de decisión acerca de las hipótesis. La decisión
consiste en rechazar o no una hipótesis en favor de la otra. Una hipótesis
estadística se denota por “H” y son dos:
- Ho: hipótesis nula
- H1: hipótesis alternativa
Partes de una hipótesis
1. Hipótesis
- La hipótesis nula “Ho”
Se refiere siempre a un valor especifico del parámetro de la población, no a
una estadística de muestra. La letra H significa hipótesis y el subíndice cero no
hay diferencia. Por lo general hay un “no” en la hipótesis nula que indica que
“no hay cambio” Podemos rechazar o aceptar Ho.
Por lo tanto la hipótesis nula es una afirmación que no se rechaza a menos que
los datos muéstrales proporcionen evidencia convincente de que es falsa. El
planteamiento de la hipótesis nula siempre contiene un signo de igualdad con
respecto al valor especificado del parámetro.
- La hipótesis alternativa “H1”
Es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se
acepta si los datos muéstrales proporcionan evidencia suficiente de que la
hipótesis nula es falsa. Se le conoce también como la hipótesis de
investigación. El planteamiento de la hipótesis alternativa nunca contiene un
signo de igualdad con respecto al valor especificado del parámetro.
2. Nivel de significancia
Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota
mediante la letra griega α, también es denominada como nivel de riesgo, este
término es mas adecuado ya que se corre el riesgo de rechazar la hipótesis
nula, cuando en realidad es verdadera.
La distribución de muestreo de la estadística de prueba se divide en dos
regiones, una región de rechazo (conocida como región crítica) y una región
de no rechazo (aceptación). Si la estadística de prueba cae dentro de la región
de aceptación, no se puede rechazar la hipótesis nula. Estos valores no son tan
improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa
la región de no rechazo de la de rechazo.
3. Errores tipo I y II
Error tipo l se presenta si la hipótesis nula Ho es rechazada cuando es
verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se
denomina con la letra alfa α
Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula
es aceptada cuando de hecho es falsa y debía ser rechazada.
3. Estadístico de prueba
Valor determinado a partir de la información muestral, que se utiliza para
determinar si se rechaza la hipótesis nula., existen muchos estadísticos de
prueba para nuestro caso utilizaremos los estadísticos z y t. La elección de uno
de estos depende de la cantidad de muestras que se toman, si las muestras
son iguales a 30 o mas se utiliza el estadístico z, en caso contrario se utiliza el
estadístico t.
Tipos de prueba
4. Formular la regla de desición
Se establece las condiciones específicas en la que se rechaza la hipótesis nula
y las condiciones en que no se rechaza la hipótesis nula. La región de rechazo
define la ubicación de todos los valores que son tan grandes o tan pequeños,
que la probabilidad de que se presenten bajo la suposición de que la hipótesis
nula es verdadera, es muy remota
Distribución muestral del valor estadístico z, con prueba de una cola a la
derecha
Valor crítico: Es el punto de división entre la región en la que se rechaza la
hipótesis nula y la región en la que no se rechaza la hipótesis nula.
4. 5. Tomar una decisión.
En este último paso de la prueba de hipótesis, se calcula el estadístico de
prueba, se compara con el valor crítico y se toma la decisión de rechazar o no
la hipótesis nula. Tenga presente que en una prueba de hipótesis solo se
puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Debe
subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula
cuando no debería haberse rechazado (error tipo I ). También existe la
posibilidad de que la hipótesis nula se acepte cuando debería haberse
rechazado ( error de tipo II ).
Intervalo de Confianza
En el contexto de estimar un parámetro poblacional, un intervalo de confianza
es un rango de valores (calculado en una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el
intervalo construido se denomina nivel de confianza, y se denota 1- . La
probabilidad de equivocarnos se llama nivel de significancia y se simboliza.
Generalmente se construyen intervalos con confianza 1- =95% (o significancia
=5%). Menos frecuentes son los intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la
distribución Normal Estándar cumple 1:
P(−1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un
programa computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribución N( , ), entonces el 95% de las
veces se cumple:
5. Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es
un intervalo de confianza al 95% para la media cuando la variable X es
normal y es conocido.
CONCEPTOS CLAVES
1. Un intervalo de confianza aporta más información que un estimador puntual
cuando se quiere hacer inferencias sobre parámetros poblacionales.
2. Existen intervalos de confianza bilateral y unilateral.
3. La amplitud de un intervalo de confianza está determinado por: el nivel de
confianza establecido; la variabilidad de los datos; el tamaño de la muestra.
4. En un estudio Caso-Control o uno de Cohorte, es posible (y frecuentemente
deseable) construir intervalos de confianza para Odds Ratios y Riesgos
Relativos.
5. Un intervalo de confianza permite verificar hipótesis planteadas acerca de
parámetros poblacionales
En estadística se establecen modelos de los sistemas a partir de fenómenos
individuales, por lo que no se puede cerrar el modelo de forma que no haya
incertidumbre.
Por ejemplo, estudiamos las estaturas de 1000 mexicanos y vemos que todas
están entre 1.50 y 1.85, y que el 10% están entre 1.50 y 1.60.
Si generalizamos estos datos para TODA la población mexicana no podremos
decir que el 100% de los mexicanos están entre 1.50 y 1.85 y el 10% entre 1.50
y 1.60, porque en toda la población mexicana puede haber gente de menos de
1.50 y de más de 1.85.
Para eso se establecen niveles (o intervalos) de confianza, es decir, la
probabilidad de que la generalización sea correcta.
Normalmente se toman 90%, 95% ó 99%.
Ejemplo: "(hay un 95% de probabilidad de que) el 100% de la población
mexicana mide entre 1.50 y 1.85"