2. ÁREAS DE LA INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA
Estimación de parámetros
Prueba de hipótesis
Por punto
Por intervalos
Calcular un valor que corresponde a una característica de la población
De orden cuantitativo. Establece conclusiones sobre alguna afirmación o supuesto (hipótesis)
3.
4. Prueba de hipótesis
Rama de la inferencia estadística, denominada docimacia de hipótesis o contraste de hipótesis.
Una hipótesis estadística es un supuesto acerca de algún parámetro poblacional o sobre alguna situación existente en la población.
Existen dos tipos de hipótesis estadísticas:
H. Nula, Ho
H. Alterna, H1
5. Prueba de hipótesis
Una prueba de hipótesis es un procedimiento estadístico en el que a partir de una o más muestras aleatorias, tomamos la decisión de rechazar o no un supuesto (hipótesis) acerca de la población, asumiendo un riesgo (probabilidad de error) de equivocarnos al tomar la decisión.
Para el proceso de prueba de hipótesis es necesario que primero se considere de manera clara lo que se desea probar y expresarlo de modo verbal, luego en términos de medidas estadísticas de la variable bajo estudio.
Teach point
6. Tipos de hipótesis
Es la hipótesis que el procedimiento estadístico somete a prueba, se formula como supuesto de no diferencia o igualdad para el valor poblacional, o como un supuesto de no asociación de dos variables
Sirve para contrastar la hipótesis nula, usualmente se formula como un supuesto de diferencia. Es la hipótesis de trabajo y la que se espera sea apoyada por los datos de la muestra
1. Hipótesis nula
2. Hipótesis alterna
Se plantea esperando ser rechazada (que los datos de la muestra no la apoyen) y es la que se somete a contrastación
7. Tipos de hipótesis
El porcentaje de pacientes que refiere efectos adversos al ingerir ciprofloxacina es de 5%
Ho: P=0,05
El porcentaje de pacientes que refiere efectos adversos al ingerir ciprofloxacina es menor al 5%
Ho: P<0,05
1. Hipótesis nula
2. Hipótesis alterna
El nivel promedio de glicemia en pacientes con diabetes tipo II del distrito de Huancán es 210mg
Ho: μ= 210mg
El nivel promedio de glicemia en pacientes con diabetes tipo II del distrito de Huancán es mayor de 210mg
Ho: μ> 210mg
La prevalencia de parasitosis intestinal en los niños preescolares del asentamiento humano JPH es igual a la de los niños preescolares del distrito de El Tambo
Ho: P1=P2
La prevalencia de parasitosis intestinal en los niños preescolares del asentamiento humano JPH es mayor a la de los niños preescolares del distrito de El Tambo
Ho: P1>P2
8. Procedimiento a seguir para la realización de una prueba de hipótesis
Defina con claridad los supuestos que se plantean en la investigación
Identifique el tipo de variable en estudio relacionada con las suposiciones
Identifique la o las poblaciones bajo estudio
Elija la prueba estadística apropiada para la prueba de hipótesis planteadas
Plantee las hipótesis nula y alterna
Calcule la estadística de la prueba con los datos obtenidos para este fin
Pre-determine el nivel de significancia para la región de rechazo
Tome la decisión comparando el nivel crítico (p) con el nivel de significancia (α)
Obtenga el nivel crítico para el resultado obtenido con la muestra
9. Al tomar la decisión respecto a la Ho, se puede correr el riesgo de cometer dos distintos tipos de error:
DECISIÓN
Planteamiento (situación poblacional)
Ho CIERTA
Ho Falsa
Rechazar Ho
Error tipo I
Probabilidad = α (ρ)
«nivel de significación»
Decisión acertada
Probabilidad = (1-β)
«potencia»
No rechazar Ho
Decisión acertada
Probabilidad = (1-α)
«nivel de confianza»
Error tipo II
Probabilidad = β Ó
11. Las cuatro son probabilidades condicionales, así:
α = probabilidad de rechazar Ho, cuando Ho es cierta
1-α = probabilidad de no rechazar Ho, cuando Ho es cierta
β = probabilidad de no rechazar Ho, cuando Ho es falsa
1-β = probabilidad de rechazar Ho, cuando Ho es falsa Ó
Alfa y Beta se relacionan de manera inversa: al decrecer una aumenta la otra. Habitualmente α está bajo nuestro control; pero β sólo está en forma indirecta mediante su relación inversa que tiene con α.
12. En investigaciones biomédicas el nivel de confianza más usado es 95%; es decir (1-α) = 0,95; luego el nivel de significancia más usado es 5% (α=0,05). De la misma forma la potencia más usada es 80% es decir (1- β) = 0,80, entonces β= 0,20.
Existe una igualdad empírica entre los valores de α y β, que ayuda a fijar el valor de β para un valor elegido de α:
β = 4α
13. Comparación de dos medias de poblaciones independientes y relacionadas
PRUEBA DE HIPÓTESIS
14. Diferencia (comparación) de dos medias de poblaciones independientes
PRUEBA DE HIPÓTESIS
Se contrastará alguna de las hipótesis que sigue:
Ho: μ1 = μ2
H1: μ1 ≠ μ2
bilateral
Ho: μ1 ≥ μ2
H1: μ1 < μ2
unilateral
Ho: μ1 ≤ μ2
H1: μ1 > μ2
unilateral
16. Diferencia (comparación) de dos medias de poblaciones independientes
EJEMPLO
Mediante un experimento se desea evaluar el efecto de las dietas A y B en la ganancia de peso, usando dos grupos de animales experimentales. El grupo 1 recibirá la dieta A (enriquecida) y el grupo 2 la dieta B (convencional).
Los investigadores desean determinar si con la dieta A, los animales ganarán mayor peso que con la B.
Después de 5 semanas de seguimiento se calculó el incremento de peso para cada animal. Los resultados fueron:
Grupo 1: muestra 12, media de las ganancias de peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de peso: 21,2g con una desviación estándar de 3,8g
17. Diferencia (comparación) de dos medias de poblaciones independientes
SOLUCIÓN
En vista que no se conocen las varianzas poblacionales se hará uso del contraste «t» . Para el buen uso del contraste los datos deben satisfacer los siguientes supuestos básicos:
1.Normalidad
2.Aleatoriedad
3.Homogeneidad de varianzas
Si los supuestos se cumplen entonces el procedimiento es:
T es la distribución de probabilidades para encontrar el número de errores estándar
18. Diferencia (comparación) de dos medias de poblaciones independientes
a. Hipótesis
푡(푛1+푛2)−2= (푋1 − 푋2) √( 푆2푝 푛1+ 푆2푝 푛2)
b. Contraste estadístico
Ho: μ1 = μ2 H1: μ1 ≠ μ2 bilateral
Ho: μ1 ≥ μ2
H1: μ1 < μ2
unilateral
Ho: μ1 ≤ μ2
H1: μ1 > μ2
unilateral
Ho: μ1- μ2 ≤ 0
H1: μ1 - μ2 > 0
푆2푝 es la varianza ponderada
Donde:
19. Diferencia (comparación) de dos medias de poblaciones independientes
SOLUCIÓN
Grupo 1: muestra 12, media de las ganancias de peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de peso: 21,2g con una desviación estándar de 3,8g
푆2푝 = 푛1 −1푆21+푛2−1푆22 푛1+푛2 −2
푆2푝 = 12−1621+12−13.8222
푆2푝=25,22
Volviendo y reemplazando en la fórmula de contraste
20. Diferencia (comparación) de dos medias de poblaciones independientes
SOLUCIÓN
Grupo 1: muestra 12, media de las ganancias de peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de peso: 21,2g con una desviación estándar de 3,8g
푡(푛1+푛2)−2= (푋1 − 푋2) √( 푆2푝 푛1+ 푆2푝 푛2)
Contraste estadístico
푡22 = (27,2 −21,2) √( 25,2212+ 25,2212) = 2,927
Ubicamos este valor en la tabla T
21. Diferencia (comparación) de dos medias de poblaciones independientes
2,927
Ubicamos el valor dentro de la distribución T para determinar el valor de p
P, se halla entre los niveles de confianza de 0,995 y 0,9995
Se rechaza Ho
No se rechaza Ho
22. Diferencia (comparación) de dos medias de poblaciones independientes
c. Valor de p
0,0005 < p < 0,005 (nivel de significancia)
Decisión Siendo p<0,05 se rechaza la Ho. Conclusión La dieta A produjo mayor ganancia de peso que la dieta B, con p <0,05.
d. Decisión y conclusión
24. Diferencia (comparación) de dos medias de poblaciones relacionadas
EJEMPLO
Se tienen los niveles de colesterol total de una muestra de ocho pacientes antes y después de participar en un programa dieta-ejercicio.
¿Puede concluirse que el programa tuvo efecto favorable?
Paciente
Antes
Después
di
1
201
200
1
2
211
216
-5
3
205
200
5
4
220
193
27
5
208
204
4
6
217
196
21
7
216
186
30
8
215
175
40
25. Diferencia (comparación) de dos medias de poblaciones relacionadas
SOLUCIÓN
a.Planteamiento de Hipótesis
Se expresarán del siguiente modo:
Ho: μd ≤ 0 (después del programa los valores no disminuyen)
H1: μd > 0 (después del programa los valores disminuyen)
unilateral
Donde
μd = Media poblacional de las diferencias
26. Diferencia (comparación) de dos medias de poblaciones relacionadas
푡(푛−1)= (푑) 푆푑/√푛)
b. Contraste estadístico
푑 media aritmética de las diferencias 푆푑 desviación estándar de las diferencias
Si la muestra es probabilística y las diferencias (di) tienen distribución normal
푡7= 15,37516,23878=2,678
27. Diferencia (comparación) de dos medias de poblaciones relacionadas
Hallando la desviación estándar de las diferencias , a partir de la varianza
푆2 = 푋푖2 −푛푋 2 푛−1
푆2=263,69
Volviendo y reemplazando en la fórmula de contraste
푆푑= √푆2=√263,69 = 16,2387
28. Diferencia (comparación) de dos medias de poblaciones relacionadas
2,678
Ubicamos el valor dentro de la distribución T para determinar el valor de p
P, se halla entre los niveles de confianza de 0,975 y 0,99
Se rechaza Ho
No se rechaza Ho
29. Diferencia (comparación) de dos medias de poblaciones relacionadas
c. Valor de p 0,010 < p < 0,025 (nivel de significancia)
Decisión
Siendo p<0,05 se rechaza la Ho.
Conclusión
Se concluye que después del programa los niveles de colesterol son significativamente menores que los obtenidos antes, con p <0,025.
d. Decisión y conclusión