SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
Psico. 11ava estimadores de medias y proporciones
1. ESTIMACIÓN
𝐸𝑆 𝑃
𝐸𝑆 𝑋
Facultad de Ciencias de la Salud
ESTADÍSTICA
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE PSICOLOGÍA
Dr. Mayhuasca Salgado Ronald
Docente
2. Al término de la clase el estudiante conocerá las bases de la
estadística inferencial sobre estimaciones puntuales y por intervalos
tanto de medias como de proporciones pobalcionales
Propósito
3. Problema tipo
Se desea estimar la proporción de niños desnutridos menores
de 5 años al 95% de IC, de una determinada comunidad. Para tal
efecto, se selecciona una muestra de 100 niños menores de 05
años y se determina que 45 están desnutridos.
4. ¿Por qué hacemos inferencia estadística?
1. Cuando investigamos algo, el objetivo es conocer y concluir algo acerca
de una población, pero sólo disponemos de datos de una muestra.
2. Si la muestra es aleatoria, los resultados de los datos describen lo que
ocurre en esa muestra, pero no en la población.
3. Entonces tenemos que inferir (suponer) los resultados de la muestra
hacia la población con un cierto margen de incertidumbre (error)
4. Ese proceso de llama INFERENCIA ESTADÍSTICA
Bejarano L, Mormontoy W, Tipacti C. Muestreo e inferencia
estadística en ciencias de la salud. Lima: Unión;2006.
Es el proceso por el que se obtienen conclusiones probabilísticas
en relación a una población al valerse de la información
proporcionada por una muestra de esa población
6. Inferencia es un proceso lógico de
naturaleza deductiva o inductiva
que permite sacar una conclusión
a partir de una premisa
Procedimiento que permite realizar afirmaciones de
naturaleza probabilística respecto a una población, en
base a los resultados obtenidos en una muestra
seleccionada de esa población.
Como las poblaciones son descritas por medidas numéricas
descriptivas llamadas parámetros, se puede hacer
inferencias acerca de la población haciendo inferencias
respecto a sus parámetros
Inferencia estadística
7. INFERENCIA
ESTADÍSTICA
Estimación de
parámetros
Prueba de
hipótesis
Por punto
Por intervalosCalcular un valor que
corresponde a una
característica de la población
De orden cuantitativo.
Establece conclusiones sobre
alguna afirmación o supuesto
(hipótesis)
Establece un rango
donde se supone está el
parámetro
Margen de error
EXISTE
Áreas de la inferencia estadística
8. Efectuar una estimación es usar las medidas calculadas en una
muestra (estimadores) para predecir el valor de uno o más
parámetros de la población.
Un estimador a menudo es expresado en términos de una
fórmula matemática que da la estimación como una función de
las medidas muestrales.
ESTIMACIÓN
9. De parámetros y estimadores
Parámetro Estimador Descripción
µ 𝑋 Media aritmética
σ2 S2 Varianza
µ1 - µ2 𝑋1 - 𝑋2 Diferencia de
medias
π p Proporción
π1 – π2 p1 – p2 Diferencia de
proporciones
10. Se usan las medidas de la muestra para calcular un único
valor numérico que es la estimación puntual del
parámetro poblacional
Las medidas de la muestra pueden también usarse para calcular
dos valores numéricos que definen un intervalo el cual, con
un cierto nivel de confianza, se considera que incluye al
parámetro
1. Estimación por punto
2. Estimación por intervalo
11. Se usan las medidas de la muestra para calcular un único
valor numérico que es la estimación puntual del
parámetro poblacional
En un estudio la media y la desviación estándar de las edades de una
muestra de pacientes fueron (33±5 años). Entonces 33 años es la
estimación puntual de la edad promedio poblacional.
Pregunta:
¿cuál es la estimación puntual de la desviación estándar y de la varianza
de la población de dichos pacientes?
Ejemplo:
1. Estimación por punto
12. Se necesita estimar el gasto promedio mensual en capacitaciones de los
psicólogos de los diferentes servicios de salud mental en los hospitales de
la región. Para tal efecto se recurre a una muestra aleatoria de 25
psicologos y se obtienen los siguientes resultados:
Media: 1 600 nuevos soles
D.E: 320
Ejemplo 02:
1. Estimación por punto
El gasto promedio de todos los psicólogos está
representado por µ (parámetro poblacional) y la
estimación por punto de este parámetro sería:
𝑋=1600 n.s.
pero…
… ese valor no es estable, por que si tomamos otra
muestra van a haber resultados distintos, ante ello
es mejor determinar un INTERVALO donde
“caigan” las distintas medidas paramétricas con un
cierto grado de seguridad
13. Las medidas de la muestra pueden también usarse para calcular dos
valores numéricos que definen un intervalo el cual, con un cierto nivel de
confianza, se considera que incluye al parámetro
Límite
inferior
Límite
superior
A veces el parámetro no se halla en el intervalo
cuando la muestra no es representativa
Una muestra debe incluir al
parámetro
2. Estimación por intervalo
14. La probabilidad de que una estimación por intervalo incluya el parámetro
se denomina nivel de confianza
El modelo general de estimación por intervalo de un
parámetro cualquiera, es:
Al restar el producto del estimador se obtiene el límite
inferior del intervalo (LI) y al sumar se obtiene el límite
superior (LS). La expresión final de la estimación de un
parámetro cualquiera es:
IC 95% [LI;LS]
PARÁMETRO = ESTIMADOR ± COEFICIENTE DE CONFIANZA x ERROR ESTÁNDAR DEL ESTIMADOR
El margen de error es grande
cuando la muestra es pequeña
A este producto se llama MARGEN DE
ERROR O PRECISIÓN DEL ESTIMADOR
O ERROR ABSOLUTO
Parámetro = estimador ± precisión del estimador
2. Estimación por intervalo
15. Error muestral:
Error y sus tipos
Es la diferencia entre el valor de un estadístico y su
parámetro correspondiente, por ejemplo:
Son diversas las causas que lo generan y pueden
ser muestrales y no muestrales
Además su cálculo varia cuando se
conoce y desconoce la población (N)
|μ - 𝑥 | |π – p |
Error no muestral:
Si tomo varias muestras de una población, para cada una habrá una media
distinta, esa variabilidad entre muestra y muestra se llama error muestral y
se calcula a través de una medida de dispersión llamada error estándar del
estimador
Surge de la selección de la muestra, del recuento de toda la población;
comprende los sesgos y equivocaciones durante la recolección de datos,
codificación y procesamiento de datos.
16. El error estándar estimado de la media con población finita es:
Los errores cuando conocemos N
Cuantitativo
𝐸𝑆 𝑋
=
𝑆
𝑛
√
𝑁 − 𝑛
𝑁
Para el 𝐸𝑆 𝑋
de toda la población
simplemente multiplicamos por N
El error estándar estimado de la media con población finita es:
Cualitativo
𝐸𝑆 𝑝
=
𝑝𝑞
𝑛
√
𝑁 − 𝑛
𝑁
Para el 𝐸𝑆 𝑝 de toda la población
simplemente multiplicamos por N
17. μ = 𝑥 ± Z 1-α/2 .
σ
√𝑛
Media aritmética
(promedio)
poblacional
Media aritmética
(promedio) muestral
Coeficiente de confiabilidad:
Distribución Z
Desviación estándar
poblacional
Límite superior
Límite inferior
Parámetro = estimador ± precisión del estimador
1. Estimación de la media poblacional
Error estándar
Parámetro = estimador ± E (error absoluto)
Cuando conocemos la varianza poblacional (σ2) y n ≥ 30
18. μ = 𝑥 ± Z 1-α/2 .
𝑆
√𝑛
Media aritmética
(promedio)
poblacional
Media aritmética
(promedio) muestral
Coeficiente de confiabilidad:
Distribución Z
Desviación estándar
muestral
Límite superior
Límite inferior
Parámetro = estimador ± precisión del estimador
1. Estimación de la media poblacional
Error estándar (N
desconocido)
Parámetro = estimador ± E (error absoluto)
Cuando NO conocemos la varianza poblacional (σ2) y n ≥ 30
19. μ = 𝑥 ± tn-1.
𝑆
√𝑛
Media aritmética
(promedio)
poblacional
Media aritmética
(promedio) muestral
Coeficiente de confiabilidad:
Distribución T
Desviación estándar
muestral
Límite superior
Límite inferior
Parámetro = estimador ± precisión del estimador
1. Estimación de la media poblacional
Error estándar (N desconocido)
Parámetro = estimador ± E (error absoluto)
Cuando NO conocemos la varianza poblacional (σ2) y n < 30
20. Donde tn-1 es el coeficiente de confiabilidad, su valor se obtiene de la tabla «t» de Student
con [n-1] grados de libertad para el nivel de confianza o de significación deseado.
μ = 𝑥 ± tn-1.
𝑆
√𝑛
Límite superior
Límite inferior
Características de la distribución
«t» de Student:
• Conformada por una familia de curvas simétricas respecto a la
perpendicular en el punto t=0
• Cada curva es diferente de otra en base a los grados de
libertad
• A medida que n aumenta, «t» se aproxima a la normal
estándar Z.
• Su curva es mas “chata” que la normal y tiene colas más
anchas y su μ=0
1. Estimación de la media poblacional
21. Distribución «t» de Student:
• Conformada por una familia de curvas simétricas respecto a la
perpendicular en el punto t=0
• Cada curva es diferente de otra en base a los grados de libertad
• A medida que n aumenta, «t» se aproxima a la normal estándar Z.
22. Se necesita estimar el gasto promedio mensual en capacitaciones de los psicólogos
de los diferentes servicios de salud mental de los hospitales de la región. Para tal
efecto se recurre a una muestra aleatoria de 25 psicólogos y se obtienen los
siguientes resultados:
Media: 1 600 nuevos soles
D.E: 320
Del ejemplo anterior:
Estimación por intervalo
Aquí la distribución t, posee 25-1 grados de libertad
y para un nivel de significación de 0,05 y para una
prueba de dos colas el t(24)=2,064
Operacionalizando tendremos para:
Li=1467,9 n.s.
Ls= 1732,1 n.s.
Se le asigna un intervalo de confianza de 95%
μ = 𝑥 ± tn-1.
𝑆
√𝑛
23. Se desea estimar el tiempo promedio de espera de una clínica
privada. En una muestra de 61 usuarios se obtuvo una 𝑋= 18,7 y
S=6,8 minutos. Estimar μ con 95% de confianza.
EJEMPLO 02
Solución
Como no se conoce σ (desviación estándar poblacional), el
error estándar de la media muestral se obtiene con S. Entonces:Supuestos:
aleatoriedad y
normalidad
μ = 𝑥 ± tn-1.
𝑆
√𝑛
μ = 18,7± t61-1.
6,8
√61
Estimación de la media poblacional
Vamos usar la distribución T, pese a que n>30 para comparar
24. Se desea estimar el tiempo promedio de espera de una clínica privada. En una muestra
de 61 usuarios se obtuvo una 𝑋= 18,7 y S=6,8 minutos. Estimar μ con 95% de confianza.
EJEMPLO
En este caso, para 60
grados de libertad y un
nivel de significación
bilateral de 0,05 (α =
0,05), se tiene t60=2,00,
luego:
μ = 18,7± t61-1.
6,8
√61
μ = 18,7± t60.
6,8
√61
μ = 18,7± (2,00).
6,8
√61
μ = 18,7± 1,74
20,4min
17,0min
Estimación de la media poblacional (μ)
25. Nota: la cantidad ± 1,74
recibe el nombre de
precisión de la estimación o
margen de error
Interpretación
El tiempo promedio de espera, para la atención médica en la
población de pacientes que acude a la clínica , se encuentra
entre 17,0 y 20,4 minutos, con un nivel de confianza de 95%.
Expresión en informe: IC 95% [17,0;20,4] minutos
Estimación de la media poblacional (μ)
Se desea estimar el tiempo promedio de espera de una clínica privada. En una
muestra de 61 usuarios se obtuvo una 𝑋= 18,7 y S=6,8 minutos. Estimar μ con
95% de confianza.
EJEMPLO
μ = 18,7± 1,705
20,40min
16,99min
Al usar la distribución Z, los valores
serían:
μ = 18,7± 1,74
20,4min
17,0min
26. π = p ± Z α/2. √
𝑝𝑞
𝑛
Proporción
poblacional
Proporción
muestral
Coeficiente de confiabilidad:
Distribución Z (bilateral)
p: proporción esperada de individuos
con la variable de interés
Límite superior
Límite inferior
Precisión del estimador (margen de error)
Error estándar (N
desconocido)
PARÁMETRO
ESTIMADOR
Parámetro = estimador ± precisión del estimador
q =1-p
Estimación de una proporción poblacional (π)
N grande o infinita (desconocida)
27. π = p ± Z α/2. √
𝑝𝑞
𝑛
(
𝑁−𝑛
𝑁−1
)Proporción
poblacional
Proporción
muestral
Coeficiente de confiabilidad:
Distribución Z (bilateral)
p: proporción esperada de individuos
con la variable de interés
Límite superior
Límite inferior
Precisión del estimador (margen de error)
Error estándar (N
conocido)
PARÁMETRO
ESTIMADOR
Parámetro = estimador ± precisión del estimador
q =1-p
Estimación de una proporción poblacional (π)
N finita (conocida)
28. Para estimar la prevalencia de obesidad en una población de pacientes de
sexo femenino se tomó una muestra de 120 individuos de esa población y
se encontró que 54 presentaban obesidad. Estimar la prevalencia
poblacional con 95% de confianza.
Solución
Supuestos: muestra
probabilística y n > 30
π = p ± Zα/2. √
𝑝𝑞
𝑛p = 54/120 = 0,45
q = 1- 0,45
n = 120
α= 1-0,95= 0,05 π = 0,45 ± Z1-0,95. √
0,45 (0,55)
120
π = 0,45 ± Z0,05. √
0,45 (0,55)
120
π = 0,45 ± 1,96. √
(0,2475)
120
Z(1-α) : Valor correspondiente
en la distribución Z para un
nivel de confianza α=…
Estimación de una proporción poblacional (π)
EJEMPLO
Nivel 90% 95% 99%
α 0,10 0,05 0,01
Zα
1,28 1,64 2,33
Zα/2
1,64 1,96 2,57Bilateral
Vemos que no conocemos N
29. p = 54/120 = 0,45
q = 1- 0,45
n = 120
α= 1-0,95= 0,05
π = 0,45 ± 1,96. √
(0,2475)
120
π = 0,45 ± 0,089
0,539
0,361
Expresión en informe:
IC 95% [0,361;0,539] IC 95% [36,1;53,9] %
La prevalencia de obesidad en la población de pacientes de sexo
femenino se encuentra entre 36,1 y 53,9%, con 95% de confianza.Respuesta:
Para estimar la prevalencia de obesidad en una población de pacientes de
sexo femenino se tomó una muestra de 120 individuos de esa población y
se encontró que 54 presentaban obesidad. Estimar la prevalencia
poblacional con 95% de confianza.
Estimación de una proporción poblacional (π)
EJEMPLO
30. Para la aplicación de las estimaciones se requieren cumplir los
supuestos de normalidad y aleatoriedad
Las estimaciones permiten el ahorro de recursos y tiempo en el
proceso de investigación
Conclusiones
31. Problema tipo
Se desea estimar la proporción de niños desnutridos menores
de 5 años al 95% de IC, de una determinada comunidad. Para tal
efecto, se selecciona una muestra de 100 niños menores de 05
años y se determina que 45 están desnutridos.
32. Problema tipo
Posteriormente se sabe que una ONG dará donaciones en canastas de
víveres por el valor de 280 U.S.D cada uno para los niños desnutridos y se
requiere saber la cantidad precisa de niños desnutridos al 99%. A través
de los contactos se sabe que en ultimo censo el año 2010 hubieron 3600
habitantes de los cuales el 25% eran niños y que la población crece a
razón de 5% anual. (La ONG ha prometido una remesa del 3% del total de
las donaciones en efectivo para los investigadores y estadistas)
¿cuántas canastas enviará la ONG a dicha comunidad?
¿cuánto recibirán los investigadores y estadistas?
33. Tabla de valores críticos de T de Student
g.l
Nivel de significación para prueba de una cola
.10 .05 .025 .01 .005 .0005
Nivel de significación para prueba de dos colas
.20 .10 .05 .02 .01 .001
g.l
Nivel de significación para prueba de una cola
.10 .05 .025 .01 .005 .0005
Nivel de significación para prueba de dos colas
.20 .10 .05 .02 .01 .001