1. MUESTREO ESTADÍSTICO
Tipos de muestreo. Tamaño de muestra
Facultad de Ciencias de la Salud
Dr. Mayhuasca Salgado Ronald
Docente
ESTADÍSTICA
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE PSICOLOGÍA
2. Conocer los tipos de muestreo y la forma de hallar una
muestra para estudios de medias y proporciones
Objetivo
3. Problema tipo
En una población de 12000 habitantes se desea determinar el tiempo de actuación de
un fármaco aplicado a fin de combatir la TBC, se calcula una precisión de 90% y un
error tipo II= 0,20. De la referencia bibliográfica se extrae una media de 3 horas y una
desviación estándar de 25 minutos. Los investigadores asumen un error que
representa un 5% de la media. Hallar n para este estudio.
4. Procedimiento para seleccionar una o más
muestras estadísticamente representativas
de la población o poblaciones.
a. Encuestas
b. Diseño y análisis de experimentos
c. Control de calidad
Muestreo estadístico
Usos del muestreo
5. El método elegido debe:
1. Proporcionar una muestra de la mayor representatividad posible . Esto se
logra si en el proceso de selección cada elemento de la población tienen una
probabilidad conocida, diferente de cero, de conformar la muestra.
2. Permitir el cálculo de la precisión de las estimaciones. Esto sólo permiten
las muestras probabilísticas.
3. Ser viable, económico y eficiente: La teoría y la práctica deben estar
juntas y el método elegido debe proporcionar la mayor cantidad de
información a un costo menor.
π = p ± precisión (proporción)
μ = 𝑥 ± precisión (media)
Elección de un método de muestreo
6. No
probabilísticos
Probabilísticos
MÉTODOS
Prácticos y económicos
Dan muestras representativas
• Accidental
• Conveniencia
• Por cuotas
• Bola de nieve
• Aleatorio simple
• Sistemático
• Estratificado
• De conglomerados
Poblaciones homogéneas
Poblaciones
heterogéneas
Ejemplo: enfermedades
en barrio A y C
Métodos de muestreo
8. Son aleatorios. Para el diseño de una
muestra probabilística se tienen en cuenta
tres operaciones básicas:
a. Proceso de selección
b. Tamaño de la muestra
c. Proceso de estimación
Muestreo probabilístico
Requisitos
9. • Los individuos deben estar numerados en un listado
(marco muestral).
• Se usa una tabla de números aleatorios.
• Los individuos deben ser identificables
Requisitos
1. Muestreo aleatorio simple
10. a. Hacer corresponder al número de dígitos que tiene el tamaño
de la población. Si N=300, entonces en la tabla se consideran
tres columnas de números aleatorios.
b. Establecer un punto de arranque aleatorio A(F,C). A(5,8) el
arranque aleatorio se halla en la quinta fila y octava columna.
Muestreo aleatorio simple
Proceso de selección
Proceso de estimación
Por punto o intervalo
Tamaño de la muestra
Dependerá de los parámetros que deseo
estimar.
11. Procedimiento de selección de la muestra
• Siendo la población
homogénea.
• Teniendo el marco
muestral.
El marco muestral es el
registro de la población
del cual se saca la
muestra.
12. Los individuos deben estar identificados pero no
necesariamente enlistados.
Se elige un individuo de cada cierto número de elementos
de modo sistemático. Ese número es la fracción de
muestreo «k»
k= N / n
Requisitos
2. Muestreo aleatorio sistemático
13. • Se tiene una población de 8000 individuos y el tamaño de la muestra es
400, se seleccionará uno de cada 20 individuos, que será la fracción de
muestreo:
k= 8000 / 400
• Entonces se selecciona un número aleatorio, o por sorteo, un número del
1 al 20, y a partir de ello se selecciona a 1 individuo de cada 20.
Ejemplo
Muestreo aleatorio sistemático
14. • Se utiliza cuando los elementos que conforman la población
son heterogéneos.
• Se divide a la población en subgrupos o estratos de acuerdo a
sus características.
• La selección de sujetos dentro de cada estrato se hará
aleatoriamente de acuerdo a sus variables (edad, género,
situación laboral).
• La afijación más conocida es la proporcional y se determina su
propio ES de la media. Su precisión se determina mediante C.V
Requisitos
3. Muestreo aleatorio estratificado
15. • Si se desea efectuar una estratificación por género y se sabe
que en la población la distribución es del 55% de mujeres y
45% de hombres, la muestra debe mantener la misma
proporción. Por tanto si el tamaño de la muestra es 400, se
elegirán aleatoriamente 220 mujeres y 180 hombres.
Ejemplo:
Muestreo aleatorio estratificado
16. • Usada en población amplia y dispersa cuando no se dispone de un
listado para poder aplicar las técnicas anteriores.
• En lugar de individuos se empieza por seleccionar subgrupos o
conglomerados a los que se da el nombre de «unidades de primera
etapa»
• Los conglomerados ya están dispuestos de forma natural (hospitales,
escuelas, etc).
• Luego de los conglomerados se eligen las «unidades de segunda
etapa», así sucesivamente se eligen hasta llegar a las unidades de
análisis componentes de la muestra.
Requisitos
4. Muestreo por conglomerados o polietápico
17. • Se pretende estudiar alguna características oral de las
gestantes que acuden a sus controles a los hospitales públicos
de todo el país.
• En una primera etapa, se eligen aleatoriamente las
departamentos, luego aleatoriamente los hospitales de dicho
departamento (o centros de salud), luego las microrredes y
finalmente de modo aleatorio se eligen el número de mujeres
de cada uno de los servicios.
Ejemplo
Muestreo por conglomerados o polietápico
18. • También se toma en cuenta los tres procesos para el diseño de
la muestra: tamaño de la muestra, proceso de selección y de
estimación.
• Si embargo para el cálculo de tamaño se considera el efecto
del diseño (d multiplica al numerador), este factor la incluye para
compensar la pérdida de precisión que resulta al utilizar un
muestreo por conglomerados en lugar de un M.A.S. Para
efectos de mortalidad se estima que es 1 ó 2.
Muestreo por conglomerados: TIPs
19. • Se seleccionan los sujetos dependiendo si se hallan o no en un
lugar y momento determinados.
• Aunque es parecido al muestreo probabilístico, es evidente
que no todas las personas tienen la misma probabilidad de
estar en ese momento y lugar.
• Ejemplo: un encuestador que espera en la puerta de un
hospital para obtener la muestra.
Requisitos
1. Muestreo accidental o consecutivo
20. • Los investigadores deciden según sus criterios de interés
y conocimientos que tienen sobre la población, en qué
elementos entrarán a formar parte de la muestra de
estudio.
• Se tiene que definir con claridad los criterios de
inclusión y exclusión.
Requisitos
Muestreo accidental o consecutivo
21. • Se selecciona la muestra considerando características
específicas presentes en la población, por lo que las
muestras habrán de tenerlas en la misma proporción.
• Las cuotas se establecen a partir de las variables
consideradas relevantes: grupos de edad, género,
categoría laboral, etc.
Requisitos
2. Muestreo por cuotas
22. • Cuando la población es difícil de identificar o es
complicado acceder a ella porque posee características
que no son muy aceptadas socialmente.
• Se selecciona un elemento que guía hacia otros
elementos que reúnen las características de estudio, de
este modo se reúne el número necesario de individuos.
Requisitos
3. Muestreo por bola de nieve
23. • Para estimar la media poblacional
• Para estimar la proporción poblacional
• Para estimar una diferencia de medias
• Para estimar una media de proporciones
Tamaño de la muestra
24. El tamaño de la muestra está condicionado por:
Los objetivos de estudio que determinarán el diseño, las variables que deben
considerarse y todo el método planeado para dar respuesta a dichos
objetivos.
Si se estudia a más sujetos de los realmente necesarios se estarán
derrochando recursos materiales y humanos.
Si se estudia a pocos sujetos no se tendrá la potencia adecuada o seguridad
suficiente sobre lo que se está haciendo y no detectar diferencias entre dos
grupos.
Tamaño de la muestra
25. Cuando en un estudio se desea conocer la prevalencia, lo que se desea
saber es la proporción y en este caso se habla de «estimación de
parámetros». Los datos que se obtengan de una muestra se llaman
«estadísticos», sirven para conocer los datos de la población llamados
«parámetros»:
Si se busca conocer el tamaño de la muestra necesaria para la estimación
de parámetros se considera una determinada precisión.
En un diseño experimental en el que se desea saber si hay diferencias
entre dos grupos se habla de contrastar hipótesis.
Tamaño de la muestra
26. Al estimar parámetros se trasladan los datos de la muestra a la población
gracias a la INFERENCIA. Es obvio que existan errores:
• Error aleatorio: derivado de trabajar con muestras y se puede
medir, se relaciona con la precisión. A mayor tamaño de muestra
este error disminuye. Si se estudia a toda la población este error
desaparece. Se determina con el “error estándar”
• Error sistemático o sesgo: se relaciona con la validez, es decir si la
muestra representa a la población realmente. Si la muestra no
reúne las características de la población aunque se aumente el
tamaño de la muestra este error se mantiene.
Errores o sesgos
27. ERROR ESTÁNDAR (E.S)
Llamado también error típico, es una medida de la variabilidad de cada
muestra respecto a la media muestral.
Es útil para describir la dispersión de los datos cuando se tiene dos o más
muestras que comparar. También se le llama desviación estándar de la
media o error típico.
Para datos cuantitativos se calcula de la siguiente manera:
Donde Sx: desviación estándar
n: muestra
𝐸. 𝑆. =
𝑆 𝑥
𝑛
𝐸. 𝑆. = 𝑝. 𝑞/𝑛
Para datos cualitativos
28. 1. Para estimar la media poblacional
( Z(1-α) + Z(1-β)2 σ2
E2
n =
Estudio descriptivo
Cuantitativo
Población infinita
nf = n
1 +
𝑛
𝑁
Si se conoce N ( o la fracción n/N es
mayor a 0,01), continuar:
nf = muestra para población finita
Tamaño de una muestra (una población)
29. Donde:
σ2 = varianza esperada, representa la variabilidad de los elementos
de la población de estudio. Se obtiene de:
- Revisión bibliográfica
- Estudio piloto
E = Error absoluto de muestreo o precisión (debe ser
asumido por el investigador), representa [ μ - p]
Error relativo
Er= E/ 𝑥
1. Para estimar la media poblacional
Z(1-α) : Valor correspondiente para un α=0,05 unilateral Z=1,96
Z(1-β) : Valor Z para una potencia de la prueba dada =
0,80; unilateral, entonces Z= 0,84
( Z(1-α) + Z(1-β)2 σ2
E2
n =
90%: 1,64
95%: 1,96
99%: 2,58
99,9%: 3,29
Tamaño de una muestra (una población)
30. La curva significa:
Que el 34,1% del área bajo la
curva queda comprendido
entre la media (µ) y
+ 1 𝜎 …como la curva es
simétrica habrá otro 34,1% por
debajo de la media. Es decir
68,2% del área se halla entre
ambas D.E.
Si tomamos una 𝜎 más
veremos que la suma total
supera el 95% del área total
31. Sobre alfa y beta:
El error tipo I o tipo alfa o falso positivo,
sucede cuando rechazamos una hipótesis nula
cuando ésta es verdadera. Se le denomina
también nivel de significación
El error tipo II o tipo beta o falso negativo,
sucede cuando NO rechazamos una
hipótesis nula cuando ésta es falsa
1- α: a esta diferencia se denomina: NIVEL (o intervalo) DE CONFIANZA.
Es el complemento de α.
α
β
1-β: a esta diferencia se denomina: POTENCIA (o poder) de la prueba
o del contraste. Es el complemento de β
Recuerde:
Valores de Z más usados, según el valor de β
β 0.20 0.10 0.05 0.01
1-β 80% 90% 95% 99%
(potencia)
Zβ 0.84 1.28 1.64 2.32
Valores de Z más usados, según el valor de α
α 0.10 0.05 0.01 0.001
1-α 90% 95% 99% 99.9%
(nivel de confianza)
Zα 1.645 1.960 2.576 3.291
(*) Los valores de alfa, beta o sus diferencias pueden
estar en porcentajes y deben llevarse a decimales
32. Sobre alfa y beta:
DECISIÓN
Planteamiento (situación poblacional)
Ho CIERTA Ho Falsa
Rechazar Ho
Error tipo I
Probabilidad = α (ρ)
«nivel de significación»
Decisión acertada
Probabilidad = (1-β)
«potencia»
No rechazar Ho
Decisión acertada
Probabilidad = (1-α)
«nivel de confianza»
Error tipo II
Probabilidad = β
Ho= hipótesis nula
33. Ejemplo
( Z(1-α) + Z(1-β) )2σ2
E2
n =
Z(1-α= 0,90) = 1,645
Z(1- β=0,80) = 0,84
S = 8,6
E = ±1,5
N = 1200
En una población de 1200 pacientes de consultorios externos de un servicio médico
se desea estimar el tiempo promedio de espera para la atención con un 90% de
confianza y un error tipo II = 0,20. En un estudio piloto con 25 pacientes se encontró
𝑥 = 22,3 y S=8,6 minutos . El investigador asume un E= ±1,5 minutos, calcular n.
Solución:
Datos
( 1,645 + 0,84 )2 (8,6)2
(1,5) 2
n =
nf =
n
1 +
𝑛
𝑁
=
nf > 174
34. 2. Para estimar una proporción poblacional
poqo( Z(1-α/2)+ Z(1-β) p1q1/ poqo )2
(p1-po)2
n =
Cualitativo
po : proporción que se considera en la hipótesis nula
qo : 1 – po
p1 : proporción que se considera en la hipótesis alterna
q1 : 1 – p1
Z(1-α/2) : Nivel de confianza (dos colas)
Z(1-β) : Potencia de la prueba
Tamaño de una muestra (una población)
35. Donde:
Po = proporción esperada de sujetos con la característica de interés en la
población de estudio. Se obtiene de:
- Revisión bibliográfica
- Estudio piloto
- po = qo = 0,5 = 50% (la mitad de individuos pueden o no tener la condición)
E = Error absoluto de muestreo o precisión (debe ser
asumido por el investigador), representa [ μ - p]
El error absoluto= error esperado – error que encontré
2. Para estimar una proporción poblacional
qo : 1 – po = proporción esperada de sujetos sin la
característica de interés en la población
poqo( Z(1-α/2)+ Z(1-β) p1q1/ poqo )2
(p1-po)2
n =
Tamaño de una muestra (una población)
Error relativo
Er= E/p
36. Ejemplo
Z(1-α/2) = 1,96
Z(1- β=0,90) = 1,28
E = ±0,05
po = 0,2
Se desea estimar la prevalencia de asma en una población de escolares de la sierra con
un 95% de confianza y un poder de prueba de 0.90. En la revisión bibliográfica se
encontró: 𝑝= 0,2. . El investigador asume un E= ±5 %, calcular n.
Solución:
Datos
qo = 0, 8
p1 = 0,15
q1 = 0, 85
po qo( Z(1-α/2) + Z(1-β) p1q1/ poqo )2
(p1-po)2
n =
n> 617
Interpretación: Para estimar en la población, la
prevalencia de asma con 95% de confianza, poder de
la prueba de 90% y una precisión de ±5%, se debe
evaluar 617 sujetos como mínimo.
37. Conclusiones
- Los métodos probabilísticos de muestreo son más fiables al
poder determinar se nivel de error
- Las reglas de inferencia para tamaño muestral revelan errores
que se deben considerar tanto para estudios cualitativos y
cuantitavos
38. Ejercicio 01
En una población de 12000 habitantes se desea determinar el tiempo de
actuación de un fármaco aplicado a fin de combatir la TBC, se calcula una
precisión de 90% y un error tipo II= 0,20. De la referencia bibliográfica se extrae
una media de 3 horas y una desviación estándar de 25 minutos. Los
investigadores asumen un error que representa un 5% de la media. Hallar n
para este estudio.
39. Ejercicio 02
Halle n, en un estudio del que se desea estimar la prevalencia de
trastorno bipolar en una población de adolescentes de un centro
universitario, con un intervalo de confianza de 95% y un poder de
prueba de 0,90. En otra institución universitaria se encontró una
proporción de 25%. Se acepta un error de ±5 %.