MAYO 1 PROYECTO día de la madre el amor más grande
Psico. 13 ava. prueba de hipótesis a partir de dos muestras
1. PRUEBA DE HIPÓTESIS
Inferencia a partir de dos
poblaciones
ESTADÍSTICA
Facultad de Ciencias de la Salud
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE PSICOLOGÍA
Dr. Mayhuasca Salgado Ronald
Docente
2. Al término de la clase el estudiante será capaz de contrastar
hipótesis realizadas sobre dos poblaciones relacionadas o
independientes tanto de medias como de proporciones
Propósito
3. Problema tipo
Se desea estudiar el peso de hijos nacidos en madres que fuman y no
fuman. Para tal motivo se extrajo una muestra representativa siendo los
resultados del peso al nacer los siguientes (pesos en kg):
Fuman: 2,30; 2,15; 2,60; 2,45; 2,10
No fuman: 3,10; 3,00; 2,90; 2,80
Se desea conocer si la diferencia de pesos es significativa. Determine p.
4. Inferencia a partir de dos muestras
Prueba de hipótesis para dos poblaciones
1. Prueba de hipótesis para la diferencia de medias en
muestras independientes
2. Prueba de hipótesis para la diferencia de medias en
muestras relacionadas o pareadas
3. Prueba de hipótesis para la diferencia de proporciones
5. La comparación de dos medias µ1 y µ2 se hace
mediante la diferencia o sea µ1 - µ2
El estimador que nos proporciona una buena
estimación de este parámetro se da por: 𝑥1 − 𝑥2
Prueba de hipótesis para la diferencia de medias
en muestras independientes
Por consiguiente lo que se quiere
evaluar es si la diferencia observada
es o no significativa
6. Por ejemplo se tiene interés en comparar dos tratamientos (1 y 2), para ver
si son diferentes o no. Las consecuencias de cada tratamiento se
representarán por µ1 y µ2.
Veamos qué tipo de hipótesis podemos formular:
Prueba de hipótesis para la diferencia de medias
en muestras independientes
1ra
situación
Ho : µ1 - µ2 = 0
H1 : µ1 - µ2 ≠ 0 Hipótesis bilateral
Si lo que se quiere evaluar es si el tratamiento 1 difiere del tratamiento 2,
entonces:
7. µ1 - µ2 en muestras independientes
Ho : µ1 - µ2 ≤ 0
H1 : µ1 - µ2 > 0
Si queremos evaluar si el tratamiento 1 es mejor que el tratamiento 2,
entonces:
2da
situación
Hipótesis unilateral a la derecha
Ho : µ1 - µ2 ≥ 0
H1 : µ1 - µ2 < 0
Si queremos evaluar si el tratamiento 2 es mejor que el tratamiento 1,
entonces:
Hipótesis unilateral a la izquierda
3ra
situación
8. Contrastación de hipótesis para µ1 - µ2
en muestras independientes
Ejemplo
Mediante un experimento se desea evaluar el efecto de las dietas A y B en la ganancia de peso, usando
dos grupos de animales experimentales. El grupo 1 recibirá la dieta A (enriquecida) y el grupo 2 la dieta
B (convencional). Los investigadores desean determinar si con la dieta A, los animales ganarán mayor
peso que con la B.
Después de 5 semanas de seguimiento se calculó el incremento de peso para cada animal. Los resultados
fueron:
Grupo 1: muestra 12, media de las
ganancias de peso: 27,2g con una
desviación estándar de 6,0g
Grupo 2: muestra 12, media de las
ganancias de peso: 21,2g con una
desviación estándar de 3,8g
9. SOLUCIÓN
En vista que no se conocen las varianzas
poblacionales se hará uso del contraste «t» .
Para el buen uso del contraste los datos deben
satisfacer los siguientes supuestos básicos:
1. Normalidad
2. Aleatoriedad
3. Homogeneidad de varianzas
Si los supuestos se cumplen entonces
el procedimiento es:
T es la distribución de
probabilidades para encontrar
el número de errores
estándar
µ1 - µ2 en muestras independientes
11. SOLUCIÓN
Grupo 1: muestra 12, media de las ganancias de
peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de
peso: 21,2g con una desviación estándar de 3,8g
𝑆2 𝑝 =
𝑛1 −1 𝑆2
1
+ 𝑛2−1 𝑆2
2
𝑛1+𝑛2 −2
𝑆2 𝑝 =
12−1 62
+ 12−1 3.82
22
𝑆2 𝑝 = 25,22
Volviendo y reemplazando en la fórmula de contraste
µ1 - µ2 en muestras independientes
12. SOLUCIÓN
Grupo 1: muestra 12, media de las ganancias de
peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de
peso: 21,2g con una desviación estándar de 3,8g
Contraste estadístico
𝑡22 =
(27,2 − 21,2)
√(
25,22
12
+
25,22
12
)
= 2,927
Ubicamos este valor en la tabla T
µ1 - µ2 en muestras independientes
𝑡(𝑛1 + 𝑛2) − 2 =
( 𝑋1 − 𝑋2
√(
𝑆2 𝑝
𝑛1
+
𝑆2 𝑝
𝑛2
)
13. 2,927Ubicamos el valor dentro
de la distribución T para determinar el
valor de p
P, se halla entre los
niveles de confianza
de 0,995 y 0,9995
Se
rechaza
Ho
No se
rechaza
Ho
µ1 - µ2 en muestras independientes
14. Tabla de valores críticos de T de Student
g.l
Nivel de significación para prueba de una cola
.10 .05 .025 .01 .005 .0005
Nivel de significación para prueba de dos colas
.20 .10 .05 .02 .01 .001
g.l
Nivel de significación para prueba de una cola
.10 .05 .025 .01 .005 .0005
Nivel de significación para prueba de dos colas
.20 .10 .05 .02 .01 .001
Desde aquí se
rechaza Ho
15. c. Valor de p
0,0005 < p < 0,005 (nivel de significancia)
Decisión
Siendo p<0,05 se rechaza la Ho.
Conclusión
La dieta A produjo mayor ganancia de peso que
la dieta B, con p <0,05.
d. Decisión y conclusión
µ1 - µ2 en muestras independientes
16. Cuando existen dos muestras relacionadas como consecuencia de
tener un diseño de estudio antes-después; o que a un mismo
paciente se le observó en dos momentos distintos tras la
administración de alguna terapia, entonces:
Se tendrá que contrastar la Ho: 𝑥1 − 𝑥2 = 0
Prueba de hipótesis para la diferencia de
medias en muestras relacionadas (pareadas)
Eso implica cambiar la estructura de
la prueba estadística a considerar.
17. EJEMPLO
Se tienen los niveles de colesterol total de una muestra de ocho pacientes
antes y después de participar en un programa dieta-ejercicio.
¿Se puede concluir que el programa tuvo efecto favorable?
Paciente Antes Después di
1 201 200 1
2 211 216 -5
3 205 200 5
4 220 193 27
5 208 204 4
6 217 196 21
7 216 186 30
8 215 175 40
Prueba de hipótesis para la diferencia de medias en muestras
relacionadas (pareadas)
18. SOLUCIÓN
a. Planteamiento de Hipótesis
Se expresarán del siguiente modo:
Ho: μd ≤ 0 (después del programa los valores
no disminuyen)
H1: μd > 0 (después del programa los valores
disminuyen)
unilateral
Donde
μd = Media poblacional de las
diferencias
Prueba de hipótesis para la diferencia de medias en muestras relacionadas (pareadas)
19. 𝑡(𝑛 − 1) =
(𝑑)
𝑆 𝑑/√𝑛)
b. Contraste estadístico
𝑑 : media aritmética de las diferencias
𝑆 𝑑 : desviación estándar de las diferencias
Si la muestra es
probabilística y las
diferencias (di) tienen
distribución normal
𝑡 7 =
15,375
16,2387
8
= 2,678
Prueba de hipótesis para la diferencia de medias en muestras relacionadas (pareadas)
Reemplazando datos:
20. Hallando la desviación estándar
de las diferencias , a partir de la
varianza
𝑆2 =
𝑋𝑖2
−𝑛 𝑋2
𝑛−1
𝑆2 = 263,69
Volviendo y reemplazando en la fórmula de contraste
𝑆𝑑 = √𝑆2 = √263,69 = 16,2387
Prueba de hipótesis para la diferencia de medias en muestras relacionadas (pareadas)
21. 𝟐, 𝟔𝟕𝟖Ubicamos el valor dentro
de la distribución T para determinar
el valor de p
P, se halla entre los
niveles de confianza
de 0,975 y 0,99
Se
rechaza
Ho
No se
rechaza
Ho
Prueba de hipótesis para la diferencia de medias en muestras relacionadas (pareadas)
22. c. Valor de p
0,010 < p < 0,025 (nivel de significancia)
Decisión
Siendo p<0,05 se rechaza la Ho.
Conclusión
Se concluye que después del programa los niveles
de colesterol son significativamente menores que
los obtenidos antes, con p <0,05.
d. Decisión y conclusión
Prueba de hipótesis para la diferencia de medias en muestras relacionadas (pareadas)
𝒑 = 𝟐, 𝟔𝟕𝟖
23. Cuando se desea comparar dos proporciones poblacionales P1 y P2, se
realiza su diferencia P1 - P2 y su estimador estará representado por la
diferencia de sus proporciones muestrales p1-p2. Entonces conviene saber
si la diferencia de proporciones es significativa.
Prueba de hipótesis para la diferencia de dos
proporciones poblacionales
Aplicación: comparación de eficacia
de dos medicamentos en la curación
de una enfermedad usando dos
grupos de pacientes
24. EJEMPLO
Un profesional de salud pública desea comparar la proporción de niños menores de 5 años que
están parasitados en dos comunidades . Una de las comunidades posee servicios básicos de
agua y desagüe. De cada comunidad se selecciona una muestra de 220 niños. Se evalúa la
situación de cada niños y se obtienen los datos siguientes:
Comunidad
A
Posee servicios
B
Sin servicios
Niños menores de 05
años
n1 = 220 n2 = 220
Proporción de
parasitados
p1= 0,35 p2= 0,52
Prueba de hipótesis para la diferencia de dos proporciones poblacionales
De acuerdo con los resultados ¿la diferencia observada es estadísticamente significativa? 𝛼 = 0,05
25. SOLUCIÓN
a. Planteamiento de Hipótesis
Se expresarán del siguiente modo:
Ho: 𝑷 𝟏 − 𝑷 𝟐 = 𝟎 (la diferencia observada no es significativa)
H1: 𝑷 𝟏 − 𝑷 𝟐 ≠ 𝟎 (la diferencia observada es significativa)
Prueba de hipótesis para la diferencia de dos proporciones poblacionales
b. Nivel de significación: 𝛼 = 0,05
26. 𝑷𝒎 =
𝒏 𝟏 𝒑 𝟏 + 𝒏 𝟐 𝒑 𝟐
𝒏 𝟏 + 𝒏 𝟐
c. Contraste estadístico
Se parte del supuesto de que la Ho es
verdadera. Por consiguiente ambas
proporciones poblacionales son
iguales, o sea P1= P2 =P
Necesitamos entonces estimar esta
proporción poblacional común P en
base a las proporciones muestrales p1
y p2. Consideramos el siguiente
estimador
Prueba de hipótesis para la diferencia de dos proporciones poblacionales
Proporción muestral mancomunada
27. 𝒁 =
𝒑 𝟏 − 𝒑 𝟐 − (𝑷 𝟏 − 𝑷 𝟐)
𝒑 𝒎 ∗ 𝒒 𝒎
𝒏 𝟏
+
𝒑 𝒎 ∗ 𝒒 𝒎
𝒏 𝟐
c. Contraste estadístico
Por lo tanto como 𝒏 𝟏∗ 𝒑 𝟏y 𝒏 𝟐∗ 𝒑 𝟐 > 𝟓,
𝑎𝑝licamos la prueba Z, con la ecuación:
Prueba de hipótesis para la diferencia de dos proporciones poblacionales
“Z” posee distribución aproximad a la
normal con 𝛼 = 0 𝑦 𝜎 = 1,
𝑠𝑖 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎
𝑺𝒊𝒆𝒏𝒅𝒐 ∶ 𝒒 𝒎: 1 − 𝒑 𝒎
28. d. Regla de decisión
Prueba de hipótesis para la diferencia de dos proporciones poblacionales
Como la estadística Z posee distribución
normal estándar, H1 es bilateral y 𝛼= 0,05
Si p<0,05 se rechaza la Ho
Si p>0,05 no se rechaza Ho
e. Cálculos
Se tiene que: 𝑷𝒎 =
220∗0.35+220∗0,52
220+220
= 0,435
𝒒 𝒎 =1-0,435= 0,565
Como es una prueba de
dos colas el p=2P
29. Prueba de hipótesis para la diferencia de dos proporciones poblacionales
e. Cálculos
Reemplazando valores en la
fórmula de la estadística de
prueba, se tiene:
𝒁 =
𝟎,𝟑𝟓−𝟎,𝟓𝟐−(𝟎)
𝟎,𝟒𝟑𝟓∗𝟎,𝟓𝟔𝟓
𝟐𝟐𝟎
+
𝟎,𝟒𝟑𝟓∗𝟎,𝟓𝟔𝟓
𝟐𝟐𝟎
= -3,60
Como H es bilateral , Zc = -3,60 se tiene el valor
p=0,0002… pero es un solo extremo, el otro
extremo adiciona otro 0,0002, siendo el valor
total de p= 0,0004
32. Decisión
Siendo p<0,05 se rechaza la Ho.
Conclusión
La diferencia observada es significativa, es decir, que la proporción
de niños menores de 5 años que están parasitados en ambas
comunidades es diferente (p<0,05)
f. Decisión y conclusión
Prueba de hipótesis para la diferencia de dos proporciones poblacionales
(p= 0,0004)
33. Conclusiones
- La prueba de hipótesis nos permite estimar si las diferencias
son realmente significativas para la determinación de medias
tanto en muestras de poblaciones relacionadas o
independientes
- Este tipo de inferencia ayuda en el proceso de toma de
decisiones.
34. Ejercicio 01
Se desea estudiar el peso al nacer de los hijos en madres que fuman y no
fuman. Para tal motivo se extrajo una muestra representativa siendo los
resultados del peso al nacer de los hijos de ambas madres los siguientes
(pesos en kg):
Fuman: 2,30; 2,15; 2,60; 2,45; 2,10
No fuman: 3,10; 3,00; 2,90; 2,80
Se desea conocer si la diferencia de pesos es significativa. Determine p.