Bioestadística: Test de Hipótesis nivel DESCRIPTIVO: Chi-cuadrado de bondad de ajuste y T de Student para una muestra por Bioq. José Luis Soto Velásquez (3-3)
TAMBIÉN ESTOY EN: Youtube: https://bit.ly/2TCUoiR y Facebook: https://bit.ly/2QYxWPf
Como "Bioestadística con JL Soto"
Estadística Inferencial: Test de Hipótesis del nivel DESCRIPTIVO (Univariado)
investigacionjls@gmail.com
metodologia de investigacion cientifica-tipos de estudio
Ähnlich wie Bioestadística: Test de Hipótesis nivel DESCRIPTIVO: Chi-cuadrado de bondad de ajuste y T de Student para una muestra por Bioq. José Luis Soto Velásquez (3-3)
Ähnlich wie Bioestadística: Test de Hipótesis nivel DESCRIPTIVO: Chi-cuadrado de bondad de ajuste y T de Student para una muestra por Bioq. José Luis Soto Velásquez (3-3) (20)
Bioestadística: Test de Hipótesis nivel DESCRIPTIVO: Chi-cuadrado de bondad de ajuste y T de Student para una muestra por Bioq. José Luis Soto Velásquez (3-3)
1. Test de Hipótesis
Descriptivo
t de Student para una muestra y Chi cuadrado de Bondad
de Ajuste
Pruebas Paramétricas y Pruebas
No Paramétricas
Describir Estimar Comparar
Dr. José Luis Soto Velásquez
2. 02 Descriptivo
Univariado
ESTADÍSTICA
N i v e l e s d e I n v e s t i g a c i ó n
Describe fenómenos sociales o clínicos en una circunstancia temporal y
geográfica determinada. Su finalidad es describir y/o estimar parámetros.
Se describen frecuencias y/o promedios; y se estiman parámetros con
intervalos de confianza. Ejm. los estudios de frecuencia de la enfermedad:
Incidencia y Prevalencia.
Propósito investigativo: Incidencia, Prevalencia, Frecuencia,
Estimación, Descripción, Elaboración.
6. 05
04
03
02
01
01Descriptivo
Univariado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas Variables Numéricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
Nivel de investigación
DESCRIPTIVO
7. Sexo Frecuencia (n)
Porcentaje
(%)
Masculino 110 55
Femenino 90 45
Total 200 100
Tabla N° 1.- Distribución según Sexo (Población, lugar y tiempo)
Fuente.- Elaboración propia, 2018.
Masculino
55%
Femenino
45%
Grafico N° 1.- Distribución según Sexo (Población, lugar y tiempo)
a. Tabla de Frecuencia y b. Diagrama de sectores Variables CATEGÓRICAS
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
Según la tabla n° 1, El 55% de la población de estudio corresponde al sexo masculino y el
45% al sexo femenino.
8. Tabla N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo)
Fuente.- Elaboración propia, 2018.
Grafico N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo)
Estado
Nutricional
Frecuencia
(n)
Porcentaje
(%)
Desnutrición 16 7
Normal (Eutrófico) 126 57
Sobrepeso 65 29
Obesidad 12 5
Obesidad mórbida 4 2
Total 223 100
7%
57%
29%
5%
2%
0%
10%
20%
30%
40%
50%
60%
Desnutrición Normal
(Eutrófico)
Sobrepeso Obesidad Obesidad
mórbida
Porcentaje(%)
Estado Nutricional
a. Tabla de Frecuencia y b. Gráfico de Barras Variables CATEGÓRICAS
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
Según la tabla n° 2, se pudo evidenciar que el 29% de la población de estudio presenta Sobrepeso,
mientras que el 7% tiene Obesidad y desnutrición.
9. c. Intervalos de Confianza para Prevalencia Variables CATEGÓRICAS
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
1.- Calculo de los Intervalos de confianza para la PREVALENCIA (95%) con n=100
Fuente.- Elaboración propia, 2018.
Muestra Prevalencia 1-Prevalencia Error Estándar Intervalos de confianza 95%
Estadístico n p q Límite inferior Límite superior
Diabetes 100 0,18 0,82 0,038 0,106 0,254
Hipertensión 100 0,39 0,61 0,049 0,294 0,486
Triglicéridos 100 0,52 0,51 0,050 0,422 0,618
HDL disminuido 100 0,47 0,47 0,050 0,372 0,568
Intervalos de confianza para la media 95%:
EEevalenciaIC *96,1Pr
10. Aplicativo
Predictivo
Explicativo
Relacional
Descriptivo
Exploratorio
Univariado a.- Describir
b.- Estimar
c.- Verificar
Frecuencias y gráficos
Estimación puntual e
Intervalos de confianza
Prueba de
Bondad de Ajuste de Chi cuadrado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
11. La bondad de ajuste de un modelo estadístico describe lo bien que
se ajusta un conjunto de observaciones. Las medidas de bondad en
general resumen la discrepancia entre los valores observados y los
que valores esperados en el modelo de estudio.
Tales medidas se pueden emplear en el contraste de hipótesis, e.g.
el test de normalidad de los residuos, comprobar si dos muestras se
obtienen a partir de dos distribuciones idénticas ( test de
Kolmogorov-Smirnov), o si las frecuencias siguen una distribución
específica (Chi cuadrado).
Prueba de
Bondad de Ajuste de Chi cuadrado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
12. 3,84
3,989
95,00%
5,00%
Si X2 = 3,84
Entonces p = 0,05
Prueba de
Bondad de Ajuste de Chi cuadrado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
13. 4,57%
95,43%
P-valor= 0,0457
3,989
Prueba de
Bondad de Ajuste de Chi cuadrado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
14. Regla de decisiones para la prueba de hipótesis
H1 Ho
0 0,01 0,050,02 0,03 0,04
Nivel de significancia (alfa)
p-valor p-valor
P-valor= 0,0457
Prueba de
Bondad de Ajuste de Chi cuadrado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
15. PLANTEAMIENTO: La prevalencia de diabetes en la población general es del 8%. En una
muestra de 385 personas mayores a 40 años se encontró 51 casos de diabetes. ¿La prevalencia
de diabetes en mayores de 40 años es distinta al de la población general?
1
Plantear Hipótesis
Ho: La prevalencia de diabetes en mayores de 40 años NO es DISTINTA al de la población general
H1: La prevalencia de diabetes en mayores de 40 años es DISTINTA al de la población general
2 Establecer un nivel de significancia
Nivel de Significancia (alfa) α = ___5% = 0,05____________
3 Seleccionar estadístico de prueba (Resaltarla con amarillo)
a)Chi Cuadrado de Bondad de ajuste
4
Valor de P=____ 0,000148 = 0,0148% ____________
Lectura del p-valor
Con una probabilidad de error 0,0148% la prevalencia de diabetes en mayores de 40 años es DISTINTA al
de la población.
5 Toma de decisiones (dar como respuesta una de las Hipótesis)
La prevalencia de diabetes en mayores de 40 años es DISTINTA al de la población
Prueba de
Bondad de Ajuste de Chi cuadrado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
16. Diabetes Cantidad
Porcentaje
(%)
Si 51 13%
No 334 87%
Total 385 100%
La Interpretación:
En el presente año la prevalencia de diabetes en mayores de 40 años está por encima (P: 0,000) al de la
población general.
X2: 14,400 P: 0,000148
Prueba de
Bondad de Ajuste de Chi cuadrado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
PLANTEAMIENTO: La prevalencia de diabetes en la población general es del 8%. En una
muestra de 385 personas mayores a 40 años se encontró 51 casos de diabetes. ¿La prevalencia
de diabetes en mayores de 40 años es distinta al de la población general?
17. PLANTEAMIENTO: La prevalencia de Helicobacter pylori en la población de Santa Cruz es del
73%. En una muestra de 64 personas se encontró 37 casos positivos. ¿La prevalencia de
Helicobacter pylori en la población de estudio será menor al parámetro departamental?
1
Plantear Hipótesis
H1: La prevalencia de Helicobacter pylori en la población de estudio ES MENOR al parámetro departamental
Ho: La prevalencia de Helicobacter pylori en la población de estudio ES MAYOR al parámetro departamental
2
Establecer un nivel de significancia
Nivel de Significancia (alfa) α = ___5% = 0,05____________
3
Seleccionar estadístico de prueba
a) Chi Cuadrado de Bondad de ajuste
4
Valor de P=____ 0,0062/2 = 0,0031 = 0,31% ____________
Lectura del p-valor
Con una probabilidad de error 0,31% La prevalencia de Helicobacter pylori en la población de estudio es menor al
parámetro departamental.
5
Toma de decisiones (dar como respuesta una de las Hipótesis)
La prevalencia de Helicobacter pylori en la población de estudio es menor al parámetro departamental.
Prueba de
Bondad de Ajuste de Chi cuadrado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
18. Prueba de
Helicobacter
pylori
Frecuencia
(n)
Porcentaje
(%)
Positivo 37 57,8
Negativo 27 42,2
Total 64 100,0
La Interpretación:
La seroprevalencia fue del 57,8% de la población de estudio que dio positivo a la prueba de Helicobacter
pylori, mientras que el 42,2% dio negativo.
En la comprobación de hipótesis se aceptó la hipótesis alternativa (H1) que dice que la seroprevalencia
(57,8%) de la población de estudio es menor (P: 0,0031) al parámetro departamental (73%) .
X2: 7,490 P: 0,0062
Prueba de
Bondad de Ajuste de Chi cuadrado
a.- Frecuencias absolutas y relativas
b.- Gráficos de barras y diagramas de sectores
Variables Categóricas
c.- Intervalos de Confianza para prevalencia
d.- Chi-Cuadrado de Bondad de Ajuste
PLANTEAMIENTO: La prevalencia de Helicobacter pylori en la población de Santa Cruz es del
73%. En una muestra de 64 personas se encontró 37 casos positivos. ¿La prevalencia de
Helicobacter pylori en la población de estudio será menor al parámetro departamental?
19. CASO PRACTICO N° 13
Prueba de bondad de ajuste
de Chi-cuadrado para
frecuencias
21. Tabla N° 1.- Medidas de tendencia central (Edad)
Fuente.- Elaboración propia, 2018.
Estadístico
Media = 43,420
Mediana = 43
Moda = 42
Tabla N° 2.- Medidas de dispersión (Peso)
Estadístico
Desviación Estándar = 9,176
La varianza = 84,199
Error estándar = 1,297
Fuente.- Elaboración propia, 2018.
a. Medidas de tendencia Central y de Dispersión Variables Numéricas
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
22. Grafico N° 1.- Histograma (Hemoglobina en g/dl) (Población, lugar y tiempo)
b. Gráfica de Histograma Variables Numéricas
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
23. c. Intervalos de Confianza para la Media Variables Numéricas
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
Tabla N° 1.- Intervalos de confianza para la MEDIA (95%)
Intervalos de confianza
Estadístico Media Error estándar Límite inferior Límite superior
Edad = 43,420 1,215 41,038 45,802
Peso = 74,380 1,298 71,837 76,923
Talla = 1,681 0,008 1,665 1,697
IMC = 26,289 0,395 25,515 27,062
Fuente.- Elaboración propia, 2018
Intervalos de confianza para la media 95%:
EExIC *96,1
24. a.- Describir
b.- Estimar
c.- Verificar
Medidas de tendencia
central y dispersión
Estimación puntual e
Intervalos de confianza
Prueba de t de Student
para una muestra
Aplicativo
Predictivo
Explicativo
Relacional
Descriptivo
Exploratorio
Univariado
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
25. Permite comprobar si es posible aceptar que la media de la población es
un valor determinado. Se toma una muestra y el Test permite evaluar si
es razonable mantener la Hipótesis nula de que la media es tal valor.
Se trata de un Test paramétrico; o sea, parte de la suposición de que la
variable analizada en el conjunto de la población sigue una variabilidad,
una distribución como la de la campana de Gauss. Por lo tanto, podemos
pensar que la distribución normal es un buen modelo de esa población.
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
26. Distribución normal
- Simétrica
- Mesocúrtica
95%
2,5% 2,5%
Propósito: Analizar la distribución de la variable aleatoria.
Ho: La distribución de la variable aleatoria no es distinta a la distribución normal
H1: La distribución de la variable aleatoria es distinta a la distribución normal
La prueba de hipótesis se realiza con el estadístico: Kolmogorov-Smirnov
Contraste de hipótesis para la distribución
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
27. Propósito: Comparar el promedio del grupo con el parámetro de la población.
Ho: El promedio del grupo no es distinto al promedio de la población.
H1: El promedio del grupo es distinto al promedio de la población.
La prueba de hipótesis se realiza con el estadístico: t de Student para una muestra.
Contraste de hipótesis para la media
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
28. Planteamiento de hipótesis para la media
A dos colas
Hipótesis bilateral
Ho: El peso promedio de los recién nacidos de madres adolescentes no es diferente (es igual) al de la población
H1: El peso promedio de los recién nacidos de madres adolescentes es diferente al de la población
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
29. Planteamiento de hipótesis para la media
A una cola
Hipótesis unilateral
H1: Los niveles de glucosa en ayunas en los diabéticos son mayores que los niveles de glucosa en ayunas en los no diabéticos
Ho: Los niveles de glucosa en ayunas en los diabéticos son menores que los niveles de glucosa en ayunas en los no diabéticos
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
30. Planteamiento de hipótesis para la media
A una cola
Hipótesis unilateral
Ho: Los niveles de la hemoglobina antes de la terapia son mayores que los niveles de la hemoglobina después de la terapia
H1: Los niveles de la hemoglobina antes de la terapia son menores que los niveles de la hemoglobina después de la terapia
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
31. Planteamiento: El peso promedio de los recién nacidos en una población es de
3350 gramos. ¿El peso un conjunto de recién nacidos de madres adolescentes es
menor que el de la población?
1
Plantear Hipótesis
H1: El peso promedio de los recién nacidos de madres adolescentes es menor al de la población
Ho: El peso promedio de los recién nacidos de madres adolescentes no es menor al de la población
2 Establecer un nivel de significancia
Nivel de Significancia (alfa) α = ___5% = 0,05________
3
Seleccionar estadístico de prueba (Resaltarla con amarillo)
a) t de Student para una muestra
b) t para grupos independientes
c) t para medidas repetidas
d) Análisis de la varianza
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
32. 4
Valor de P=_______0,0446395= 4,46%________________________________
Lectura del p-valor
Con una probabilidad de error del 4,46% el peso promedio de los recién nacidos de madres
adolescentes es menor al de la población.
5 Toma de decisiones (dar como respuesta una de las Hipótesis)
El peso promedio de los recién nacidos de madres adolescentes es menor al de la población
Interpretación: El peso promedio de los recién nacidos de madres adolescentes es menor (P: 0,0446) al
peso de los RN de la población en general.
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
Planteamiento: El peso promedio de los recién nacidos en una población es de
3350 gramos. ¿El peso un conjunto de recién nacidos de madres adolescentes es
menor que el de la población?
33. Planteamiento: La Hemoglobina promedio en las mujeres embarazadas del
primer trimestre en el departamento de Santa Cruz es de 11,0 g/dl. ¿La
Hemoglobina de las mujeres embarazadas guaraníes será menor que la
hemoglobina promedio?
1
Plantear Hipótesis
H1: _______________________________________________________________________
Ho: _______________________________________________________________________
2 Establecer un nivel de significancia
Nivel de Significancia (alfa) α = ___5% = 0,05________
3
Seleccionar estadístico de prueba (Resaltarla con amarillo)
a) t de Student para una muestra
b) t para grupos independientes
c) t para medidas repetidas
d) Análisis de la varianza
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
34. 4
Valor de P=_______0,000________________________________
Lectura del p-valor
_______________________________________________________________________________
_______________________________________________________________________________
5 Toma de decisiones (dar como respuesta una de las Hipótesis)
_______________________________________________________________________________
Interpretación:
____________________________________________________________________________________
____________________________________________________________________________________.
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
Planteamiento: La Hemoglobina promedio en las mujeres embarazadas del
primer trimestre en el departamento de Santa Cruz es de 11,0 g/dl. ¿La
Hemoglobina de las mujeres embarazadas guaraníes será menor que la
hemoglobina promedio?
35. Planteamiento: El Colesterol promedio en la población de la ciudad de
Santa Cruz de la Sierra es de 200 mg/dl. ¿El colesterol de una
población de estudio será mayor al colesterol promedio?
1
Plantear Hipótesis
Ho:
H1: El colesterol de una población de estudio es mayor al colesterol promedio
2 Establecer un nivel de significancia
Nivel de Significancia (alfa) α = ___5% = 0,05________
3
Seleccionar estadístico de prueba (Resaltarla con amarillo)
a) t de Student para una muestra
b) t para grupos independientes
c) t para medidas repetidas
d) Análisis de la varianza
Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
36. Prueba de t de Student
para una muestra
Variables Numéricas
a.- Medidas de Tendencia Central y de dispersión
b.- Gráficos de Histogramas
c.- Intervalos de Confianza para la Media
d.- T Student para una muestra
4
Valor de P=_______0,000________________________________
Lectura del p-valor
_______________________________________________________________________________
_______________________________________________________________________________
5 Toma de decisiones (dar como respuesta una de las Hipótesis)
_______________________________________________________________________________
Interpretación:
____________________________________________________________________________________
____________________________________________________________________________________.
Planteamiento: El Colesterol promedio en la población de la ciudad de
Santa Cruz de la Sierra es de 200 mg/dl. ¿El colesterol de una
población de estudio será mayor al colesterol promedio?
37. CASO PRACTICO N° 19
Prueba de hipótesis para
promedios
“t de Student para una
muestra”