Este documento presenta los procedimientos estadísticos de intervalos de confianza y pruebas de hipótesis para medias y diferencias de medias utilizando Z de 1 muestra, t de 1 muestra, y t de 2 muestras en Minitab. Explica cómo calcular intervalos de confianza y realizar pruebas de hipótesis para la media de una población o la diferencia entre medias cuando se conocen o no los valores de desviación estándar. También incluye ejemplos ilustrativos de cómo aplicar estos procedimientos en
2. Estadística Aplicada a la Ing.
1
ESTADISTICA BASICA
Intervalos de confianza y pruebas de hipótesis de medias
Los cuatro procedimientos de las pruebas de hipótesis e intervalos de confianza para las
medias de la población o la diferencia entre las medias se basan en que la distribución de
la media de la muestra siga una distribución normal. De acuerdo con el Teorema del límite
central, la distribución normal se convierte en una aproximación cada vez mejor para la
distribución de la media de la muestra extraída de cualquier distribución a medida que
aumenta el tamaño de la muestra.
Z DE 1 MUESTRA
Z de 1 muestra calcula un intervalo de confianza o realiza una prueba de hipótesis de la
media cuando la desviación estándar de la población, s, es conocida. Este procedimiento
se basa en una distribución normal, de manera que para las muestras pequeñas, este
procedimiento funciona mejor si sus datos fueron extraídos de una distribución normal o
una distribución cercana a normal. A partir del Teorema del límite central, usted puede
utilizar este procedimiento si tiene una muestra grande, sustituyendo la desviación
estándar de la muestra por s. Una regla de oro común consiste en considerar que las
muestras con un tamaño de 30 o más son muestras grandes. Muchos analistas eligen el
procedimiento t y no el procedimiento Z cuando s es desconocida.
REVISION GENERAL
Utilice Z de 1 muestra para calcular un intervalo de confianza o realizar una prueba de
hipótesis de la media cuando no se conoce s. Para una prueba Z de una muestra de dos
colas, las hipótesis son:
H0 : = 0 versus H1: ≠ 0
Donde es la media de la población y 0 es la media de la población hipotética.
Elementos del cuadro de diálogo
Muestras en columnas: Elija esta opción si ha ingresado datos sin procesar en columnas.
Ingrese las columnas que contienen los datos de muestra.
Datos resumidos: Elija esta opción si tiene valores de resumen para el tamaño de la
muestra y la media.
Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra.
3. Estadística Aplicada a la Ing.
2
Media: Ingrese el valor para la media de la muestra.
Desviación estándar: Ingrese el valor de la desviación estándar de población.
Realizar prueba de hipótesis: Marque esta opción para realizar una prueba de hipótesis.
Media hipotética: Ingrese la media de la prueba m 0.
PROCEDIMIENTO
1 ElijaEstadísticas> Estadísticas básicas> Z de 1 muestra.
2 En Muestrasen columnas,ingrese lascolumnasque contienenlasmuestras.
3 En Desviaciónestándar,ingrese unvalorparas.
4 Si lo desea,utilice cualquieropcióndelcuadrode diálogoyluegohagaclic enAceptar.
EJEMPLO:
Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución de las
mediciones históricamente ha estado cerca de una distribución normal con s = 0.2. Puesto
que usted conoce el valor de s y desea probar si la media de población es 5 y obtener un
intervalo de confianza de 90% para la media, usted utiliza el procedimiento Z.
1 Abra la hoja de trabajo EJA_ESTAD.MTW.
2 Elija Estadísticas > Estadísticas básicas > Z de 1 muestra.
3 En Muestras en columnas, ingrese Valores.
4 En Desviación estándar, ingrese 0.2.
5 Marque Realizar prueba de hipótesis.En Media hipotética, ingrese 5.
6 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en Aceptar.
7 Haga clic en Gráficas. Marque Gráfica de valores individuales. Haga clic en Aceptar en
cada cuadro de diálogo.
Z de una muestra: Valores
Prueba de mu = 5 vs. no = 5
La desviación estándar supuesta = 0.
4. Estadística Aplicada a la Ing.
3
Error
estándar
de la
Variable N Media Desv.Est. media IC de 90% Z P
Valores 9 4.7889 0.2472 0.0667 (4.6792, 4.8985) -3.17 0.002
5.1
5.0
4.9
4.8
4.7
4.6
4.5
4.4
X
_
Ho
Valores
Gráfica de valores individuales de Valores
(con Ho e intervalo de confianza Z de 90% para la media y Desv.Est. = 0.2)
Interpretación de los resultados
La estadística de prueba, Z, para probar si la media de población es igual a 5 es -3.17. El
valor p, o la probabilidad de rechazar la hipótesis nula cuando es verdadera, es 0.002. Esto
se denomina un nivel de significancia obtenido, valor p o a obtenido de la prueba. Debido
a que el valor p de 0.002 es más pequeño que los niveles a comúnmente elegidos, existe
evidencia significativa de que m no es igual a 5, de manera que usted puede rechazar H0
en favor de que el valor de m no es 5.
Una prueba de hipótesis en a = 0.1 también puede realizarse al observar una gráfica de
valores individuales. El valor hipotético se ubica fuera del intervalo de confianza de 90%
para la media de población (4.6792, 4.8985) y de este modo puede rechazar la hipótesis
nula.
5. Estadística Aplicada a la Ing.
4
T DE 1 MUESTRA
t de 1 muestra calcula un intervalo de confianza o realiza una prueba de hipótesis de la
media cuando s es desconocida. Este procedimiento se basa en la distribución t, que se
deriva de una distribución normal con s desconocida. Para el caso de muestras pequeñas,
este procedimiento funciona mejor si sus datos fueron extraídos de una distribución que
es normal o cercana a normal. Este procedimiento es más conservador que el
procedimiento Z y siempre deberá tener preferencia sobre el procedimiento Z cuando se
trata de muestras pequeñas y s es desconocida. Muchos analistas eligen el procedimiento
t y no el procedimiento Z cada vez que s es desconocida. De acuerdo con el Teorema del
límite central, mientras mayor sea el tamaño de la muestra, usted podrá tener mayor
confianza en los resultados de este procedimiento, porque la distribución de la media de
la muestra se comporta cada vez más como una distribución normal.
REVISION GENERAL
Realiza una prueba t de una muestra o intervalo de confianza t para la media.
Utilice t de 1 muestra para calcular un intervalo de confianza y realice una prueba de
hipótesis de la media cuando no se conoce la desviación estándar de la población, . Para
una t de una muestra con dos colas,
H0: = 0 versus H1: ≠ 0
Donde es la media de la población y 0 es la media de la población hipotética.
Elementos del cuadro de diálogo
Muestras en columnas: Elija esta opción si ha ingresado datos sin procesar en columnas.
Ingrese las columnas que contienen los datos de muestra.
Datos resumidos: Elija si tiene valores de resumen para el tamaño de la muestra, media y
desviación estándar.
Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra.
Media: Ingrese el valor para la media de la muestra.
Desviación estándar: Ingrese el valor para la desviación estándar de la muestra.
Realizar prueba de hipótesis: Marque esta opción para realizar una prueba de hipótesis.
6. Estadística Aplicada a la Ing.
5
Media hipotética: Ingrese la media de la prueba 0
PROCEDIMIENTO
1 Elija Estadísticas > Estadísticas básicas > t de 1 muestra.
2 En Muestras en columnas, ingrese las columnas que contienen las muestras.
3 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar.
EJEMPLO
Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución de las
mediciones de los artefactos históricamente ha estado cerca de una distribución normal,
pero supongamos que usted no conoce . Para probar si la media de población es 5 y para
obtener un intervalo de confianza de 90% para la media, usted utiliza un procedimiento t.
1 Abra la hoja de trabajo EJA_ESTAD.MTW.
2 Elija Estadísticas > Estadísticas básicas > t de 1 muestra.
3 En Muestras en columnas, ingrese Valores.
4 Marque Realizar prueba de hipótesis.En Media hipotética, ingrese 5.
5 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en Aceptar en
cada cuadro de diálogo.
Salida de la ventana Sesión
T de una muestra: Valores
Prueba de mu = 5 vs. no = 5
Error
estándar
de la
Variable N Media Desv.Est. media IC de 90%
T P
Valores 9 4.7889 0.2472 0.0824 (4.6357, 4.9421) -
7. Estadística Aplicada a la Ing.
6
2.56 0.034
5.1
5.0
4.9
4.8
4.7
4.6
4.5
4.4
X
_
Ho
Valores
Gráfica de valores individuales de Valores
(con Ho e intervalo de confianza t de 90% para la media)
Interpretación de los resultados
La estadística de prueba, T, para H0: = 5 se calcula como 2.56.
El valor p de esta prueba, o la probabilidad de obtener más valores extremos de la
estadística de prueba en virtud de las probabilidades si la hipótesis nula fuera verdadera, es
de 0.034. Esto se denomina nivel de significancia obtenido o valor p. Por lo tanto, rechace
H0 si su nivel aceptable es mayor que el valor p o 0.034.
Un intervalo de confianza de 90% para la media de población, , es (4.6357,4.9421). Este
intervalo es ligeramente más amplio que el intervalo Z correspondiente que se muestra en
Ejemplo de Z de 1 muestra.
8. Estadística Aplicada a la Ing.
7
T DE 2 MUESTRAS
T de 2 muestras calcula un intervalo de confianza y realiza una prueba de hipótesis de la
diferencia entre las medias de dos poblaciones cuando las s son desconocidas y las
muestras han sido extraídas independientemente. Este procedimiento se basa en la
distribución t y, en el caso de muestras pequeñas, funciona mejor si sus datos se extraen
de distribuciones que son normales o cercanas a normales. A medida que el tamaño de la
muestra aumenta, usted puede tener mayor confianza en los resultados.
REVISION GENERAL
Realiza una prueba t de 2 muestras independientes y genera un intervalo de confianza .
Cuando tenga muestras dependientes , utilice Estadísticas > Estadísticas básicas > t
pareada.
Utilice t de 2 muestras para realizar una prueba de hipótesis y calcular un intervalo de
confianza o la diferencia entre dos medias de población cuando las desviaciones estándar
de las poblaciones, , sean desconocidas. Para una prueba t de 2 muestras con dos colas
H0: 1 2 = 0 versus H1: 1 2 ≠ 0
donde 1 y 2 son las medias de población y 0 es la diferencia hipotética entre las dos
medias de población.
Elementos del cuadro de diálogo
Muestras en una columna: Elija esta opción si los datos de la muestra se encuentran en
una columna individual, diferenciados por los valores de subíndice (códigos de grupo) en
una segunda columna.
Muestras: Ingrese la columna que contiene los datos.
Subíndices: Ingrese la columna que contiene los subíndices de la muestra.
Muestras en diferentes columnas: Elija esta opción si los datos de las dos muestras están
en columnas separadas.
Primero: Ingrese la columna que contiene una muestra.
Segundo: Ingrese la columna que contiene la otra muestra.
9. Estadística Aplicada a la Ing.
8
Datos resumidos (diferencias): Elija esta opción si tiene valores de resumen para el
tamaño de la muestra , media y desviación estándar para cada muestra.
Nombre
Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra.
Media: Ingrese el valor de la media.
Desviación estándar: Ingrese el valor de la desviación estándar.
Segundo
Tamaño de la muestra: Ingrese el valor del tamaño de la muestra.
Media: Ingrese el valor de la media.
Desviación estándar: Ingrese el valor de la desviación estándar.
Asumir varianzas iguales: Marque esta opción para presuponer que las poblaciones tienen
varianzas iguales. La opción predeterminada es presuponer varianzas desiguales. Véase
Varianzas iguales o desiguales.
PROCEDIMIENTO
1 Elija Estadísticas > Estadísticas básicas > t de 2 muestra.
2 Elija una de las siguientes opciones:
Si sus datos están apilados en una columna individual:
Elija Muestras en una columna.
En Muestras, ingrese la columna que contiene los datos numéricos.
En Subíndices, ingrese la columna que contiene los códigos de grupo o población.
Si sus datos no están apilados, es decir, cada muestra se encuentra en una columna
separada:
Elija Muestras en diferentes columnas.
En Primera, ingrese la columna que contiene la primera muestra.
En Segunda, ingrese la columna que contiene la otra muestra.
10. Estadística Aplicada a la Ing.
9
3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en
Aceptar.
EJEMPLO
Se llevó a cabo un estudio para evaluar la efectividad de dos dispositivos para mejorar la
eficiencia de sistemas de calefacción domésticos a gas. El consumo de energía en las
viviendas se midió después de la instalación de uno de los dos dispositivos. Los dos
dispositivos eran: un regulador eléctrico (Regulador=1) y un regulador de activación
térmica (Regulador=2). Los datos de consumo de energía (BTU.Con) se apilan en una
columna y una columna de agrupación (Regulador) contiene identificadores o subíndices
para denotar la población. Supongamos que realizó una prueba de varianza y no encontró
evidencia de que las varianzas no sean iguales (véase Ejemplo de 2 varianzas). Ahora, usted
desea comparar la efectividad de estos dos dispositivos al determinar si existe o no
evidencia de que la diferencia entre los dispositivos es diferente de cero.
1 Abra la hoja de trabajo HORNO.MTW.
2 Elija Estadísticas > Estadísticas básicas > t de 2 muestras.
3 Elija Muestras en una columna.
4 En Muestras, ingrese 'BTU.Con'.
5 En Subíndices, ingrese Regulador.
6 Marque la opción Asumir varianzas iguales. Haga clic en Aceptar.
Salida de la ventana Sesión
Prueba T e IC de dos muestras: BTU.Con, Regulador
T de dos muestras para BTU.Con
Error
estándar
de la
Regulador N Media Desv.Est. media
1 40 9.91 3.02 0.48
2 50 10.14 2.77 0.39
Diferencia = mu (1) - mu (2)
11. Estadística Aplicada a la Ing.
10
Estimado de la diferencia: -0.235
IC de 95% para la diferencia: (-1.450, 0.980)
Prueba T de diferencia = 0 (vs. no =): Valor T = -0.38 Valor P = 0.701 GL =
88
Ambos utilizan Desv.Est. agrupada = 2.8818
2
1
20
15
10
5
Regulador
BTU.Con
Gráfica de valores individuales de BTU.Con vs. Regulador
Interpretación de los resultados
Minitab muestra una tabla de los tamaños de muestras, las medias de muestras, las
desviaciones estándar y los errores estándar de las dos muestras.
Debido a que anteriormente no se encontró evidencia de que las varianzas sean desiguales,
decidimos utilizar la desviación estándar agrupada al elegir Asumir varianzas iguales. La
desviación estándar agrupada, 2.8818, se utiliza para calcular la estadística de prueba y los
intervalos de confianza .
Una segunda tabla ofrece un nivel de confianza para la diferencia en las medias de
poblaciones. Para este ejemplo, un intervalo de confianza de 95% es (1.450, 0.980), el
cual incluye cero, lo que sugiere que no existe diferencia. El siguiente es el resultado de la
prueba de hipótesis . La estadística de prueba es 0.38, con un valor p de 0.701 y 88 grados
de libertad . Debido a que el valor p es mayor que los niveles normalmente elegidos, no
12. Estadística Aplicada a la Ing.
11
existe evidencia de que haya diferencia en uso de energía cuando se utiliza un regulador
eléctrico versus un regulador de activación térmica.
T PAREADA
T pareada calcula un intervalo de confianza y realiza una prueba de hipótesis de la
diferencia entre las medias de dos poblaciones cuando las observaciones son pareadas
(coinciden). Cuando los datos son pareados, tal como ocurre en las mediciones "antes y
después", el procedimiento de t pareada produce una varianza menor y mayor potencia
para detectar diferencias en comparación con el procedimiento de t de 2 muestras
anterior, el cual presupone que las muestras fueron extraídas de manera independiente.
REVISION GENERAL
Realiza una prueba t pareada . Este procedimiento es apropiado para poner a prueba la
diferencia media entre observaciones pareadas cuando las diferencias pareadas siguen una
distribución normal.
Utilice el comando t pareada para calcular un intervalo de confianza y realizar una prueba
de hipótesis de la diferencia media entre las observaciones pareadas de la población. Una
prueba t pareada crea correspondencia en pares de respuestas que son dependientes o están
relacionadas. Esta correspondencia permite explicar la variabilidad entre los pares que por
lo general produce un término de error más pequeño y, de esta manera, se aumenta la
sensibilidad de la prueba de hipótesis o intervalo de confianza.
Como ejemplos típicos de datos pareados figuran las mediciones hechas en gemelos o
mediciones del tipo "antes y después". Para una prueba t pareada:
H0: d = 0 versus H1: d ≠ 0
donde d es la media de la población de las diferencias y 0 es la media hipotética de las
diferencias.
Cuando las muestras se extraen de manera independiente de dos poblaciones, utilice
Estadísticas > Estadísticas básicas > t de 2 muestras.
Elementos del cuadro de diálogo
Muestra en columnas: Elija esta opción si ha ingresado datos sin procesar en dos
columnas.
Primera muestra: Ingrese la columna que contiene la primera muestra
Segunda muestra: Ingrese la columna que contiene la segunda muestra
13. Estadística Aplicada a la Ing.
12
Datos resumidos (diferencias): Elija si tiene valores de resumen para el tamaño de la
muestra , media y desviación estándar de la media.
Tamaño de muestra: Ingrese el valor del tamaño de la muestra.
Media: Ingrese el valor de la media.
Desviación estándar: Ingrese el valor de la desviación estándar.
PROCEDIMIENTO
1 Elija Estadísticas > Estadísticas básicas > t pareada.
2 En Primera muestra, ingrese la columna que contiene la primera muestra.
3 En Segunda muestra, ingrese la columna que contiene la segunda muestra.
4 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en
Aceptar.
EJEMPLO
Una empresa fabricante de zapatos desea comparar dos materiales, A y B, para utilizar en
las suelas de los zapatos para niños varones. En este ejemplo, cada uno de diez niños en un
estudio usó un par especial de zapatos con la suela de un zapato hecha con el material A y
con la suela del otro zapato hecha con el material B. El tipo de suela fue asignado de forma
aleatoria para explicar las diferencias sistemáticas en el desgaste entre el pie izquierdo y el
derecho. Después de tres meses, los zapatos se miden para su uso.
Para estos datos, usted utilizaría un diseño pareado en vez de un diseño no pareado. Un
procedimiento t pareado probablemente tendría un término de error más pequeño que el que
correspondería a un procedimiento no pareado porque éste elimina la variabilidad causada
por diferencias entre los pares. Por ejemplo, es posible que uno de los niños viva en la
ciudad y camine sobre pavimento la mayor parte del día, mientras que otro niño pudiera
vivir en el campo y pasar gran parte del día sobre superficies no pavimentadas.
1 Abra la hoja de trabajo EJA_ESTAD.MTW.
2 Elija Estadísticas > Estadísticas básicas > t pareada.
3 Elija Muestras en columnas.
4 En Primera muestra, ingrese Mat-A. En Segunda muestra, ingrese Mat-B. Haga clic
en Aceptar.
14. Estadística Aplicada a la Ing.
13
Salida de la ventana Sesión
IC y Prueba T pareada: Mat-A, Mat-B
T pareada para Mat-A - Mat-B
Error
estándar
de la
N Media Desv.Est. media
Mat-A 10 10.630 2.451 0.775
Mat-B 10 11.040 2.518 0.796
Diferencia 10 -0.410 0.387 0.122
IC de 95% para la diferencia media:: (-0.687, -0.133)
Prueba t de diferencia media = 0 (vs. no = 0): Valor T = -3.35 Valor P = 0.009
0.0
-0.3
-0.6
-0.9
-1.2
X
_
Ho
Diferencias
Gráfica de valores individuales de Diferencias
(con Ho e intervalo de confianza t de 95% para la media)
15. Estadística Aplicada a la Ing.
14
Interpretación de los resultados
El intervalo de confianza para la media de la diferencia entre los dos materiales no incluye
cero, lo cual sugiere una diferencia entre ellos. El valor p pequeño (p = 0.009) también
sugiere que los datos no concuerdan con H0 : d = 0, es decir, los dos materiales no tienen el
mismo rendimiento. Específicamente, el Material B (media = 11.04) tuvo mejor
rendimiento que el Material A (media = 10.63) en lo que respecta a desgaste a lo largo del
período de prueba de tres meses.
Compare los resultados del procedimiento pareado con los resultados del no pareado,
prueba t de dos muestras (Estadísticas > Estadísticas básicas > t de 2 muestras). Los
resultados del procedimiento pareado nos inducen a creer que los datos no concuerdan con
H0 (t = 3.35; p = 0.009). Sin embargo, los resultados del procedimiento no pareado (no se
muestran) son totalmente diferentes. Una prueba t no pareada produce un valor t de 0.37,
y un valor p de 0.72. Con base en estos resultados, no sería posible rechazar la hipótesis
nula y podríamos concluir que no existe diferencia en el rendimiento de los dos materiales.
En el procedimiento no pareado, la gran cantidad de varianza en el desgaste de los zapatos
entre los niños (el desgaste promedio para un niño fue de 6.50 y para otro de 14.25) oculta
la diferencia, hasta cierto punto menos drástica, en el desgaste entre los zapatos izquierdo y
derecho (la diferencia más grande entre zapatos fue de 1.10). Esta es la razón por la cual un
diseño experimental pareado y un análisis subsiguiente con una prueba t pareada, cuando
corresponda, es con frecuencia mucho más potente que un enfoque no pareado.
INTERVALOS DECONFIANZA Y PRUEBAS DEHIPÓTESIS DE PROPORCIONES
1 PROPORCION
1 Proporción calcula un intervalo de confianza y somete a una prueba de hipótesis una
proporción de la población.
REVISIONGENERAL
Realiza una prueba de una proporción binomial.
Utilice 1 Proporción para calcular un intervalo de confianza y realizar una prueba de
hipótesis de la proporción . Por ejemplo, una fábrica de repuestos para vehículos afirma que
menos del 2% de sus bujías son defectuosas. Usted podría tomar una muestra aleatoria de
las bujías y determinar si la proporción defectuosa real coincide o no con la afirmación.
Para una prueba de dos colas de una proporción:
16. Estadística Aplicada a la Ing.
15
H0 : p = p0 versus H1 : p ≠ p0 donde p es la proporción de población y p0 es el valor
hipotético.
Para comparar dos proporciones, utilice Estadísticas > Estadísticas básicas > 2
proporciones.
Elementos del cuadro de diálogo
Muestras en columnas: Elija esta opción si usted tiene datos en las columnas, luego,
ingrese las columnas que contienen los datos de muestra. Cada celda de estas columnas
debe tener uno de dos valores posibles y corresponder a un elemento o sujeto. Los valores
posibles en las columnas deben ser idénticos si usted ingresa columnas múltiples.
Datos resumidos: Elija esta opción si tiene valores de resumen para los números de
ensayos y eventos.
Número de eventos: Ingrese el número de eventos observados. Si usted ingresa más de un
valor; el valor entero que ingrese en Número de ensayos se aplicará a todos.
Número de ensayos: Ingrese un valores individuales para el número de ensayos.
Realizar prueba de hipótesis: Marque esta opción para realizar la prueba de hipótesis de
que la proporción de población es igual a un valor especificado.
Proporción hipotética: Ingrese el valor de la proporción para la hipótesis nula de la
prueba.
PROCEDIMIENTO
1 Elija Estadísticas > Estadísticas básicas > 1 Proporción.
2 Realice uno de los siguientes procedimientos:
Si tiene datos sin procesar, elija Muestras en columnas, e ingrese las columnas que
contienen los datos sin procesar.
Si tiene datos resumidos:
1 Elija Datos resumidos.
2 En Número de ensayos, ingrese un valor entero numérico simple para el número de
ensayos. Con frecuencia, el número de ensayos será su tamaño de muestra..
3 En Número de eventos, ingrese uno o más valores enteros numéricos como el número
observado de eventos.
17. Estadística Aplicada a la Ing.
16
3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en
Aceptar.
EJEMPLO
A una fiscal de condado le gustaría postularse para la fiscalía del estado. Ella decide que
renunciará a su cargo en la oficina del condado y postularse para la fiscalía del estado si
más del 65% de los miembros de su partido la respaldan. Usted necesita probar H0 : p = .65
versus H1: p > .65
Como su director de campaña, usted recopiló información de 950 miembros del partido
seleccionados de manera aleatoria y observa que 560 miembros del partido apoyan a la
candidata. Una prueba de proporción se realizó para determinar si la proporción de los
partidarios era o no mayor que la proporción requerida de 0.65. Además, se construyó un
límite de confianza del 95% para determinar el límite inferior para la proporción de
partidarios.
1 Elija Estadísticas > Estadísticas básicas > 1 Proporción.
2 Elija Datos resumidos.
3 En Número de eventos, ingrese 560. En Número de ensayos, ingrese 950.
4 Marque Realizar prueba de hipótesis.En Proporción hipotética, ingrese 0.65.
5 Haga clic en Opciones. En Hipótesis alterna, elija Mayor que. Haga clic en Aceptar
en cada cuadro de diálogo.
Salida de la ventana Sesión
Prueba e IC para una proporción
Prueba de p = 0.65 vs. p > 0.65
95% Límite Valor P
Muestra X N Muestra p inferior exacto
1 560 950 0.589474 0.562515 1.000
18. Estadística Aplicada a la Ing.
17
Interpretación de los resultados
El valor p de 1.0 sugiere que los datos son consistentes con la hipótesis nula (H0: p = 0.65),
es decir, la proporción de los miembros del partido que apoyan a la candidata no es mayor
que la proporción requerida de 0.65. Como su director de campaña, usted le aconsejaría no
postularse para la fiscalía del estado.
2 PROPORCIONES
2 proporciones calcula un intervalo de confianza y somete a una prueba de hipótesis la
diferencia entre 2 proporciones de la población.
REVISION GENERAL
Realiza una prueba de dos proporciones binomiales .
Utilice el comando 2 proporciones para calcular un intervalo de confianza y realizar una
prueba de hipótesis de la diferencia entre dos proporciones. Minitab ofrece dos pruebas de
hipótesis para la diferencia entre dos proporciones: La prueba exacta de Fisher y una prueba
basada en una aproximación normal. La prueba de aproximación normal puede ser inexacta
para muestras en las cuales el número de eventos de cada muestra es menor que cinco o si
la diferencia entre el número de ensayos y eventos de cada muestra es menor que cinco. La
prueba exacta de Fisher es exacta para todos los tamaños de muestra , pero sólo se puede
calcular cuando la hipótesis nula establece que las proporciones de población son iguales.
En otras palabras, Minitab sólo realiza la prueba exacta de Fisher cuando usted especifica
una diferencia de la prueba de cero en el cuadro de diálogo secundario Opciones.
Por ejemplo, supongamos que usted desea saber si la proporción de consumidores que
responden a una encuesta pudiera incrementarse al ofrecer un incentivo tal como una
muestra del producto. Usted puede incluir la muestra del producto en la mitad de sus
correos y determinar si obtiene más repuestas del grupo que recibió la muestra que del
grupo que no la recibió. Para una prueba de dos colas de dos proporciones:
H0: p1 - p2 = p0 versus H1: p1 - p2 ≠ p0
cuando p1 y p2 son las proporciones de eventos en las poblaciones 1 y 2, respectivamente, y
p0 es la diferencia hipotética entre las dos proporciones.
Para probar una proporción utilice Estadísticas > Estadísticas básicas > 2 Proporciones.
19. Estadística Aplicada a la Ing.
18
Elementos del cuadro de diálogo
Muestras en una columna: Elija esta opción si ha ingresado datos sin procesar en una
columna individual con una segunda columna de subíndices que identifican la muestra.
Muestras: Ingrese la columna que contiene los datos sin procesar.
Subíndices: Ingrese la columna que contiene los subíndices de la muestra.
Muestras en diferentes columnas: Elija esta opción si introdujo datos sin procesar en las
columnas individuales para cada muestra.
Primero: Ingrese la columna que contiene los datos sin procesar para la primera muestra.
Segundo: Ingrese la columna que contiene los datos sin procesar para la segunda muestra.
Datos resumidos: Elija esta opción si tiene valores de resumen para los números de
ensayos y eventos.
Nombre
Eventos: Ingrese el número de eventos en la primera muestra.
Ensayos: Ingrese el número de ensayos en la primera muestra.
Segundo
Eventos: Ingrese el número de eventos en la segunda muestra.
Ensayos: Ingrese el número de ensayos en la segunda muestra.
PROCEDIMIENTO
1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones.
2 Realice uno de los siguientes procedimientos:
Si sus datos sin procesar están apilados en una columna individual:
1 Elija Muestras en una columna.
2 En Muestras, ingrese la columna que contenga los datos sin procesar.
3 En Subíndices, ingrese la columna que contiene los códigos de grupo o población.
20. Estadística Aplicada a la Ing.
19
Si sus datos sin procesar no están apilados, es decir, cada muestra se encuentra en una
columna separada:
1 Elija Muestras en diferentes columnas.
2 En Primera, ingrese la columna que contiene la primera muestra.
3 En Segunda, ingrese la columna que contiene la otra muestra.
Si tiene datos resumidos:
1 Elija Datos resumidos.
2 En Primera muestra, ingrese los valores numéricos en Ensayos y en Eventos.
3 En Segunda muestra, ingrese los valores numéricos en Ensayos y en Eventos.
3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en
Aceptar.
EJEMPLO
Como gerente de compras de su corporación, usted debe autorizar la adquisición de veinte
máquinas fotocopiadoras nuevas. Después de comparar numerosas marcas en términos de
precio, calidad de la copia, garantía y funciones, usted ha reducido sus opciones a dos:
Marca X y Marca Y. Usted decide que el factor determinante será la confiabilidad de las
marcas definida por la proporción de servicio requerido dentro de un año a partir de la
compra.
Debido a que su corporación ya utiliza ambas marcas, usted pudo obtener información
acerca del historial de servicio de 50 máquinas de cada marca seleccionadas aleatoriamente.
Los registros indican que seis máquinas de la Marca X y ocho de la Marca Y requirieron
servicio. Utilice esta información para orientar su elección de la marca a comprar.
1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones.
2 Elija Datos resumidos.
3 En Primera muestra, en Eventos, ingrese 44. En Ensayos, ingrese 50.
4 En Segunda muestra, en Eventos, ingrese 42. En Ensayos, ingrese 50. Haga clic en
Aceptar.
Salida de la ventana Sesión
21. Estadística Aplicada a la Ing.
20
Prueba e IC para dos proporciones
Muestra X N Muestra p
1 44 50 0.880000
2 42 50 0.840000
Diferencia = p (1) - p (2)
Estimado de la diferencia: 0.04
IC de 95% para la diferencia: (-0.0957903, 0.175790)
Prueba para la diferencia = 0 vs. no = 0: Z = 0.58 Valor P = 0.564
Prueba exacta de Fisher: Valor P = 0.774
Interpretación de los resultados
En este ejemplo, la prueba de aproximación normal es válida porque, para ambas muestras,
el número de eventos es mayor que cuatro y la diferencia entre los números de ensayos y
eventos es mayor que cuatro. La prueba de aproximación normal indica un valor p de
0.564, y la prueba exacta de Fisher señala un valor p de 0.774. Ambos valores p son
mayores que los niveles comúnmente elegidos. Por lo tanto, los datos concuerdan con la
hipótesis nula de que las proporciones de población son iguales. En otras palabras, la
proporción de máquinas fotocopiadoras que necesitaron servicio en el primer año no difiere
dependiendo de la marca. Como gerente de compras, usted debe hallar un criterio diferente
para orientar su decisión sobre cuál marca comprar.
Debido a que la aproximación normal es válida, usted puede sacar la misma conclusión del
intervalo de confianza de 95%. Debido a que cero se ubica en el intervalo de confianza de
(0.0957903 a 0.175790) usted puede concluir que los datos coinciden con la hipótesis
nula. Si considera que el intervalo de confianza es demasiado amplio y no provee
información precisa con respecto al valor de p1 p2, es recomendable que recolecte más
datos con el fin de obtener un mejor estimado de la diferencia.