1. Apuntes sobre Muestreo
APUNTES SOBRE MUESTREO
Elaborado por
Héctor Medina Disla
Santo domingo, D. N.
Septiembre 2009
Elaborado por Héctor Medina Disla. Septiembre 2009 1
2. Apuntes sobre Muestreo
Muestreo y Distribución Muestral
Objetivo de esta unidad
El desarrollo de esta unidad tiene como objetivos fundamentales que los alumnos y
alumnas aprendan sobre:
1. La importancia de trabajar con muestra en lugar de trabajar con la
población completa.
2. Las diferentes tipos de muestras, así como las ventajas y desventajas de
cada una de estas
3. Como seleccionar una muestra a partir de una población determinada
4. La importancia de clasificar la población para reducir variabilidad en la
estimación hecha a partir de los datos muestrales.
En el día a día, en las actividades diarias se toman decisiones, esas decisiones, se
toman luego de un procesamiento interno de una serie datos, los cuales, en la
mayoría de los casos, provienen de una muestra y es así, porque rara vez tenemos
oportunidad de analizar una población completa, por múltiples razones que se
detallaran más adelante en este capítulo. Un ejemplo sencillo es cuando acudimos
al médico para la realización una prueba de laboratorio, una vez que nos
registramos, nos envían a “toma de muestra”, donde alguien se encargara de
nuestro sufrimiento introduciendo una aguja entre nuestras venas, igual
seleccionamos una muestra en un ambiente más agradable, cuando compramos
un perfume, tomamos una pequeña porción y decidimos si el aroma se ajusta a
nuestra piel o no, no esperamos a consumir todo el perfume para luego decidir si
compramos o no el perfume, cuando cocinamos, tomamos una pequeña muestra
para saber si se han colocado los condimentos adecuadamente y así
sucesivamente.
En un ambiente fuera de los laboratorios, la tienda o el hogar, un ambiente como
las organizaciones donde laboramos, nos encontramos en muchas situaciones en
las que se hace necesario analizar el comportamiento de una o múltiples variables
a partir de los datos de una muestra, por ejemplo cuando se analiza la producción
diaria para fines de control de la calidad, cuando se estudia el comportamiento de
los empleados de una empresa, o cuando queremos estudiar la preferencia de los
consumidores por un bien o servicio, cuando queremos evaluar la efectividad de
un programa de entrenamiento, o de un nuevo método de enseñanza en una
escuela , entre otros casos.
En todos estos casos se observa que existe una población a partir de la cual
seleccionamos una muestra a partir de la cual se analiza un fenómeno y se toman
las decisiones que se consideran pertinentes. A ese procedimiento mediante el cual
obtenemos una muestra de una población es lo que denominamos muestreo. De
tal forma, podemos definir el Muestreo como una herramienta de la investigación
Elaborado por Héctor Medina Disla. Septiembre 2009 2
3. Apuntes sobre Muestreo
mediante el cual se selecciona una muestra y su función principal es determinar
que parte de la población en estudio se debe examinar a fin de estimar los
parámetros de dicha población.
Importancia del Muestreo
Existen múltiples razones por las cuales se analiza una población a partir de una
muestra, desde razones de logística del trabajo de campo, (recolección de datos),
hasta razones económicas y de viabilidad y factibilidad de una investigación. Entre
las razones para usar un muestreo y no el análisis de la población completa se
citan:
1. Analizar la población completa no siempre es posible. Realizar un censo
resulta muy costoso en términos de recursos económicos, tiempo y recursos
materiales. Esto imposibilita tener a tiempo información acerca del fenómeno
que está estudiando y por tanto retraza las acciones necesarias para un
mejor resultado.
2. Cuando la población es infinita o tan grande que imposibilita el análisis
completo de dicha población, por ejemplo un proceso de producción
continuo en una empresa, imposibilita analizar la población completa.
3. En muchos casos desconocemos la población total o no se tiene una
ubicación exacta de los elementos que forman dicha población. Por ejemplo
un biólogo marino que quiere estudiar el comportamiento de alguna especie
marina o un psicólogo que quiere estudiar los factores asociados a la
ansiedad, entre otros casos.
4. Cuando las pruebas que se realizan implican la destrucción de las unidades
muestrales, (pruebas destructivas), por ejemplo cuando se prueba un
perfume, o la comida, o cuando se mide la resistencia de circuito, o la
resistencia de los automóviles a un choque de fuerza.
5. Los estudios por muestreo pueden proporcionar información más exacta
sobre el comportamiento de un fenómeno. Esto se debe a que cuando se
realizan estudios por muestreo se pone más empeño, cuidado y supervisión
que cuando se realiza un censo. De igual forma, realizar un estudio por
muestreo conlleva contemplar un margen de error, es decir una diferencia
entre las estimaciones de la muestra y los parámetros poblacionales, cosa
que en el censo no se contempla, sin embargo siempre se cometen errores en
estos procesos.
Desventajas del uso del muestreo.
Elaborado por Héctor Medina Disla. Septiembre 2009 3
4. Apuntes sobre Muestreo
Si bien es cierto que el uso de la técnica de muestreo se hace casi imprescindible
para la realización de investigaciones científicas, no menos cierto es que su uso
presenta tres limitaciones básicas:
1. Cuando se realiza una investigación haciendo uso del muestreo no se tiene
conocimiento sobre la ubicación física de los elementos de la población.
2. Si el procedimiento de muestreo que se utiliza en una investigación no es el
apropiado o no se sigue un procedimiento riguroso en la selección de la
muestra, los resultados proporcionados por la investigación puede que no se
correspondan con la realidad del fenómeno estudiado.
3. El desconocimiento sobre una población determinada impide conocer el nivel
de confiabilidad de las estimaciones hechas a partir del muestreo.
Algunos conceptos de muestreo
Cuando se habla del muestreo, existen una serie de conceptos asociado a este
término, por ejemplo, en las líneas anteriores se ha escrito mucho sobre la
población, la muestra, los parámetros, los estimadores o estadígrafos entre otros y
por ello en la próxima sección se hace una definición de estos conceptos a fin de
lograr una mayor familiaridad con los mismos.
Población: en el muestreo cuando nos referimos a este concepto se hace referencia
a un conjunto de elementos con características parecidas o similares y que es de
interés para realizar un estudio. La población se define en función de los aspectos
que nos interesa estudiar. Por ejemplo, si quisiéramos conocer la preferencia
política de un grupo de persona, la población estaría formada por las personas
mayores de edad y con derecho a ejercer el voto, pero si lo que interesa es estudiar
la desnutrición infantil de una comunidad, la población estaría definida por todos
los niños y niñas de dicha comunidad.
Muestra: una muestra se define, sencillamente, como un subconjunto de la
población. Cuando los elementos que forman la muestra tienen las mismas
características que los elementos de la población de cual se seleccionó se dice que
la muestra es representativa.
Marco muestral: el marco muestral es el listado que contienen los elementos de la
población disponibles para el estudio o la población accesible a la investigación.
Suponga que se desea conocer el nivel de satisfacción de los clientes de un banco
comercial, y se selecciona una muestra de los clientes que asisten durante un
tiempo determinado a dicho banco, la población que asiste durante el tiempo de la
investigación es lo que se llama marco muestral, la población está formada, en este
caso por todos los clientes del banco.
Procedimiento para establecer el marco muestral
Elaborado por Héctor Medina Disla. Septiembre 2009 4
5. Apuntes sobre Muestreo
Una de las dificultades que presenta el muestreo probabilístico es la necesidad de
disponer de un marco muestral y para establecer dicho marco muestral podemos
hacer una de tres cosas:
1. Obtener un listado de todos los elementos de la población
2. Proveerse de una regla para identificarlos, ya que listar los elementos no
siempre es posible, por ejemplo fijar un intervalo de tiempo para la selección de los
elementos.
3. Hacer un listado con los elementos de la población (si se posee)
Limitaciones que se presentan al elaborar un marco muestral
Al elaborar un marco muestral se presentan algunas limitaciones, las cuales se
presentan de acuerdo a la población bajo estudio. Entre las principales
limitaciones se encuentran:
1. Elementos perdidos, lo que provoca un marco muestral inadecuado
2. Elementos extraños en la población, lo que dificulta una buena definición del
marco muestral
3. Agrupaciones, no permiten clasificar claramente cuales son las unidades
muestrales.
4. Duplicaciones, cuando ocurren, no ofrecen un marco muestral realista.
Unidad muestral o unidad de muestro: la unidad de muestreo o unidad muestral
es la unidad que se selecciona en el muestreo, es decir, es cada uno de los posibles
elementos que forman el marco muestral, que puede ser un elemento o un
conjunto de elemento. Todo miembro de la población pertenecerá a una y sólo una
unidad de muestreo. Determinar con claridad la unidad de muestreo es de suma
importancia para la investigación, ya que permite conocer sobre cuales elementos
se tendrá información. Las unidades de muestreo pueden ser personas, viviendas,
unidades producidas, grupo de productos, extensiones de tierra, entre otras.
Unidad de Análisis: se refiere a la unidad específica sobre la cual se toman las
mediciones correspondientes para el análisis. Una unidad muestral puede tener
múltiples unidades de análisis, por ejemplo: Es una encuesta de hogar, se pueden
medir diferentes características, por ejemplo, de la vivienda, de las personas que
habitan la vivienda. Otro ejemplo que pude dejar claro este concepto es cuando se
hace una encuesta sobre la preferencia electoral, en este caso se puede tomar las
viviendas como unidad de muestreo, es decir se seleccionarán viviendas, sin
embargo, dentro de la vivienda puede seleccionarse solo una persona que esté acto
para ejercer el voto.
Parámetro: Es una medida de referencia la cual se calcula a partir de datos de
una población completa. El parámetro se refiere a la medida de una variable en la
Elaborado por Héctor Medina Disla. Septiembre 2009 5
6. Apuntes sobre Muestreo
población. Por ejemplo, cuando se aplican las Pruebas Nacionales y se obtiene el
promedio de las calificaciones, esta medida es un parámetro de las calificaciones
de los estudiantes.
Estimador o Estadígrafo: Es una medida calculada a partir de los datos obtenidos
en una muestra y se utiliza para estimar el valor del parámetro, ya que en la
mayoría de los casos, se hace difícil y muy costoso conocer el valor real o verdadero
de la variable. Por ejemplo cuando se toma una muestra para conocer la
preferencia política de la población, los porcentajes que se obtienen a partir de la
encuesta son estimadores del porcentaje de real de preferencia de todos/as las
votantes.
Tipos de Muestra
Existen dos tipos de procedimiento para seleccionar una muestra, el muestreo no
probabilístico y el muestreo probabilístico, cada uno de estos procedimientos tiene
sus particularidades, área y momento de aplicación como se muestra a
continuación:
I - Muestras no probabilísticas: una muestra no probabilística es aquella en la
que los elementos se seleccionan atendiendo a criterios subjetivos o personales, es
decir que los elementos que se seleccionan para formar la muestra no se
seleccionan atendiendo a un criterio científico y por tal razón no se conoce la
probabilidad que tiene cada uno de ello de ser incluido en la muestra. Aunque las
muestras no probabilísticas no permiten generalizaciones, las mismas tienen las
siguientes ventajas:
1. Permite incluir en la muestra a los elementos de población que se desean
analizar. Es decir que el investigador selecciona los casos que le interesa
estudiar.
2. Resulta de gran utilidad y de bajo costo en estudios exploratorios, que
proporcionan información para estudios más profundos o amplios.
3. La muestra no probabilísticas es menos costosa que una muestra
probabilísticas.
4. Una muestra no probabilística es de fácil selección ya que no requiere de un
marco muestral.
Su principal desventaja es que los resultados que se obtienen a partir de ella no se
pueden inferir a la población, es decir, que solo puede utilizar para describir los
elementos de la muestra.
Las principales técnicas para obtener muestras no probabilísticas son:
Muestreo intencional o por conveniencia.
Muestreo de juicio o de experto.
Muestreo por cuota.
Elaborado por Héctor Medina Disla. Septiembre 2009 6
7. Apuntes sobre Muestreo
Muestre por bola de niveles.
1. Muestreo intencional o por conveniencia
Es aquel en el que cada unidad muestral se selecciona de acuerdo a la intención o
a la conveniencia del investigador. Por ejemplo: un psicólogo que utiliza los
pacientes para investigar sobre algunas características de este, el orientador que
aprovecha la presencia de un grupo de estudiantes en las aulas para analizar las
características de estos, o un reportero que pregunta a las personas que pasan
por una esquina determinada sobre un tema de interés.
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras "representativas" mediante la inclusión en la muestra de grupos
supuestamente típicos. Por ejemplo es frecuente utilizar en sondeos preelectorales,
encuestar a las personas de una determinada zonas que en anteriores votaciones
han marcado tendencias en la intención del voto.
2.- Muestreo de juicio o de experto
Es aquel en el que las unidades muestrales son seleccionadas pro una persona
experta en el tema que se esta investigando, es decir que la inclusión de una
unidad muestral en la muestra depende del nivel de conocimiento que tenga quien
selecciona la muestra de cada elemento de la población. Por ejemplo: Un psicólogo
puede elegir un grupo determinado de niños y niñas para probar un nuevo método
de enseñanza, o el gerente de recursos humanos que en función del conocimiento
que tiene sobre sus empleados selecciona un grupo de estos para entrenarlos en
una tarea específica, entre otros.
La principal limitación de este tipo de muestreo es que depende única y
exclusivamente del nivel de conocimiento del experto que selecciona la muestra, lo
que limita el marco muestral del estudio.
3.- Muestreo por cuota
Es aquel en el que se elige una cantidad determinada de elementos para la
muestra. Este tipo de muestreo se basa de un buen conocimiento de los estratos
de la población o de las unidades muestrales "representativas" o "adecuadas" para
los fines de la investigación. Es muy parecido al muestreo aleatorio estratificado,
pero no tiene el carácter de aleatoriedad de este. En este tipo de muestreo se fijan
unas "cuotas" que consisten en un número de unidades muestrales que reúnen
unas determinadas características, por ejemplo: 20 personas de 25 a 40 años, de
sexo femenino y residentes en una comunidad.
Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas características. Este método se utiliza mucho en las encuestas de
opinión. En el muestreo por cuota se utiliza la asignación proporcional, esto es que
Elaborado por Héctor Medina Disla. Septiembre 2009 7
8. Apuntes sobre Muestreo
a cada grupo de población se asigna una cuota en la muestra proporcional a su
tamaño, así por ejemplo si el grupo A representa el 50.0% de la población, en la
muestra este grupo debe tener 50.0%.
4.- Muestreo por bola de nieve
Es aquel en que las unidades muestrales se seleccionan de acuerdo a las
informaciones suministradas por las demás unidades muestrales. En este tipo de
muestreo las primeras unidades se seleccionan de forma aleatoria o de forma
intencional por el investigador y las demás unidades se seleccionan por la
información dada por las primeras. La segunda unidad se selecciona a partir de la
primera, tercera unidad se selecciona a partir de la información dada por la
segunda, y así sucesivamente. El muestreo por bola de nieve se utiliza en
poblaciones que son muy pequeñas y de la cual se desconoce la ubicación de sus
miembros.
La principal limitación que presenta este tipo de muestreo es que depende
totalmente de la información suministrada por los elementos abordados y por
tanto del nivel de conocimiento de estos sobre la población.
II - Muestreo probabilístico:
El muestreo probabilístico es aquel en el que las unidades muestrales se
seleccionan atendiendo a criterios científicos y cada elemento de la población, cada
unidad muestral tiene una probabilidad determinada de ser incluido en la
muestra. En este tipo de muestreo las unidades muestrales que se incluyen en la
muestra no dependen del juicio o del criterio de una persona en particular. Este
procedimiento le da ciertas ventajas al muestreo probabilístico sobre el no
probabilístico. Las principales ventajas que ofrece el muestreo probabilístico están
las siguientes:
1. Permite obtener muestras representativas, ya que la selección de las
unidades muestrales no se corresponde con criterios personales o subjetivos.
2. Los resultados que se obtienen con este tipo de muestreo permite hacer
generalizaciones, (inferir los resultados) sobre la población.
3. Cada unidad muestral tiene una probabilidad mayor que cero de ser incluido
en la muestra.
4. No requiere de un conocimiento elevado de la población.
Sin embargo, el muestreo probabilístico presenta algunas limitaciones o
desventajas que se deben tomar en consideración a la hora de seleccionar una
muestra a partir de este método. Entre estas limitaciones se pueden citar:
1. El uso del muestreo probabilístico requiere de un marco muestral definido,
es decir, que se requiere tener un listado con cada uno de los elementos que
forman la población.
Elaborado por Héctor Medina Disla. Septiembre 2009 8
9. Apuntes sobre Muestreo
2. El muestreo probabilístico es más costoso que el muestreo no probabilístico.
3. No permite incluir en la muestra unidades muestrales de interés particular.
Técnicas de muestreo probabilístico
Existen cuatro procedimientos para obtener muestras probabilísticas:
1. Muestreo aleatorio simple.
2. Muestreo aleatorio sistemático.
3. Muestreo estratificado.
4. Muestreo por conglomerado.
Para ilustrar el procedimiento para seleccionar una muestra a partir de una de las
técnicas de muestreo probabilístico se parte una población hipotética de 30
estudiantes de los cuales se tiene información sobre cinco variables: la edad, el
sexo, el número de asignaturas cursadas en el semestre, el índice académico del
semestre anterior y el gasto en transporte desde la residencia hasta la universidad.
Para la ilustración se tomará una muestra de 10 estudiantes con el objetivo de
conocer el rendimiento promedio, así como la proporción de estudiante de sexo
femenino.
Tabla 1: Datos personales de 30 estudiantes de Informática
Edad del Sexo del Número de Índice Gasto en
No. estudiante estudiante asignaturas Académico transporte
01 22 M 3 80.0 20
02 24 F 3 77.8 50
03 23 M 4 75.6 60
04 25 M 5 74.6 30
05 21 M 3 82.1 30
06 25 F 3 74.3 50
07 22 M 3 77.7 40
08 21 F 6 80.1 40
09 28 F 3 70.3 40
10 28 F 4 70.3 40
11 29 M 5 73.5 40
12 25 F 3 74.3 20
13 20 M 4 79.8 40
14 30 F 2 73.3 20
15 28 F 3 81.5 40
16 24 F 4 74.4 40
17 28 F 3 78.6 40
18 24 F 6 76.7 40
19 21 F 4 77.7 20
20 24 M 3 79.4 20
21 35 M 2 75.7 40
Elaborado por Héctor Medina Disla. Septiembre 2009 9
10. Apuntes sobre Muestreo
22 21 F 4 83.0 40
23 24 M 3 81.2 50
24 22 F 3 76.8 60
25 21 F 4 80.7 30
26 26 F 3 70.8 50
27 25 F 4 71.3 20
28 24 M 5 74.9 80
29 29 M 3 82.6 30
30 25 F 5 80.6 20
1.- Muestreo aleatorio simple
Una muestra aleatoria simple es aquella en la que todas las unidades muestrales
tienen igual probabilidad de ser incluidas en la muestra. Por la forma de selección
de la muestra, el muestreo aleatorio simple es el muestreo que le garantiza al
investigador una mayor representatividad de la muestra seleccionada. Para obtener
una muestra aleatoria simple, cada elemento en la población debe tener la misma
probabilidad de ser seleccionado y para ello es necesario utilizar un procedimiento
que garantice tal aleatoriedad, siendo el más común la tabla de números
aleatorios.
Para obtener una muestra a partir del muestreo aleatorio simple se siguen los
siguientes pasos.
1. Establecer el marco muestral para la selección de la muestra. Se debe tener una
numeración para cada elemento en la población a estudiar.
2. Se determina el tamaño de la muestra por la cantidad de unidades a investigar.
3. Una vez establecido el tamaño de la muestra y teniendo el marco muestral
disponible se generan los números aleatorios que indiquen cuales elementos de la
población serán incluidos en la muestra.
Los números aleatorios pueden generarse a partir de diferentes procedimiento, por
ejemplo se pueden obtener los número de los elementos cortarlo e introducirlo en
una bolsa o una tómbola, (esto cuando se tiene una población pequeña), se puede
obtener a partir de una tabla de número aleatorios, como la que se muestra al final
del capítulo o a partir de un medio electrónico como la calculadora de bolsillo o a
partir de un programa de computadora.
Ejemplo: suponga que se desea tomar una muestra de 10 estudiantes a partir de
la población hipotética representada en la tabla I. Como la población está
numerada del 01 al 30, en la tabla XII de número aleatorios se inicia con las dos
primeras columnas buscando los números que sean menores de 30 que es el
máximo de la población. Si en las dos primeras columnas no se encuentran los
Elaborado por Héctor Medina Disla. Septiembre 2009 10
11. Apuntes sobre Muestreo
diez números aleatorios menores de 30 se continúa en las dos columnas siguientes
y así sucesivamente.
Observando en las dos primeras columnas, (columna uno y dos) de la tabla de
números aleatorios, se encuentran que el primer número de menor o igual de 30
que aparece es el 17 que esta en la fila uno, luego le siguen el 23, en la fila 19, el
25 en la fila 20, el 18 en la fila 21, el 24 en la fila y el 29 en la fila 40. Como no se
puede completar los diez números aleatorios, se sigue con dos columnas más, en
este caso la columna dos y la columna tres y en estas se observa que el primer
número menor de 30 es el 04 en fila cinco, seguido del 02 en la fila 10, el 15 en la
fila 11 y el 26 en la fila 14, con los que se completa la muestra tamaño 10. Los
números seleccionados en orden ascendente son: 02, 04, 15, 17, 18, 23, 24, 25, 26
y 29. Los datos se muestran en la tabla II.
A partir de los datos obtenidos se obtienen las medidas de interés, como el
promedio, desviación estándar, proporción, entre otras.
Tabla 2: datos de una muestra de 10 estudiantes
Edad del Sexo del Número de Índice Gasto en
No. estudiante estudiante asignaturas Académico transporte
02 24 F 3 77.8 50
04 25 M 5 74.6 30
15 28 F 3 81.5 40
17 28 F 3 78.6 40
18 24 F 6 76.7 40
23 24 M 3 81.2 50
24 22 F 3 76.8 60
25 21 F 4 80.7 30
26 26 F 3 70.8 50
29 29 M 3 82.6 30
2.- Muestreo Aleatorio Sistemático
Es aquel en el que las unidades muestrales se seleccionan sistemáticamente a
partir de un número aleatorio. Una muestra sistemática es obtenida cuando los
elementos son seleccionados en una manera ordenada. La manera de la selección
depende del número de elementos incluidos en la población y el tamaño de la
muestra. El número de elementos en la población, (N) es dividido por el número
deseado en la muestra, (n) a este cociente se denomina Coeficiente de Elevación,
(CE). Este cociente indicará cada cuantos elementos en la población va a ser
seleccionada la muestra. El primer elemento de la muestra es seleccionado al azar.
Por lo tanto, una muestra sistemática puede dar la misma precisión de estimación
acerca de la población que una muestra aleatoria simple cuando los elementos en
la población están ordenados al azar.
Elaborado por Héctor Medina Disla. Septiembre 2009 11
12. Apuntes sobre Muestreo
Para obtener una muestra aleatoria sistemática se siguen los siguientes pasos:
1. Definir el marco austral y determinar el tamaño de la muestra y de la población.
2. Calcular el coeficiente de elevación,
3. Se busca un número aleatorio, (en la tabla de números aleatorios, en la
calculadora o en la computadora o por otro medio que garantice un número
totalmente aleatorio) que sea menor al coeficiente de elevación, y este será el
primer elemento de la muestra o arranque aleatorio.
4. Completar los números aleatorios de forma sistemática, estos se obtienen
sumando el coeficiente de elevación a cada número anterior.
Ejemplo: suponga que de la población hipotética mostrada en la tabla I se desea
tomar una muestra de 10 estudiantes. Como la población está numerada del 01 al
30, ya se tiene el marco austral y el tamaño de la muestra, por lo tanto se procede
a calcular el coeficiente de elevación, el cual se obtiene dividiendo la población
entre la muestra, para este caso, N=30 y n=10, por los tanto el coeficiente de
N 30
elevación es CE 3, ahora se obtiene por cualquier método un número
n 10
aleatorio menor que tres. En la tabla de números aleatorios, utilizando la primera
columna, el primer número menor de tres que se observa es el uno que se
encuentra en la fila uno, luego este será el primer elemento de la muestra o
arranque aleatorio. Los demás números a seleccionar son:
Tabla 3: número de muestra a seleccionar
según un muestreo aleatorio sistemático.
Número de Arranque Número para
orden aleatorio la muestra
01 01 01
02 01 + 3 04
03 04 + 3 07
04 07 + 3 10
05 10 + 3 13
06 13 + 3 16
07 16 + 3 19
08 19 + 3 22
09 22 + 3 25
10 25 + 3 28
Con los números aleatorios se acude a la población para hacer la selección de la
muestra y los datos se muestran en la tabla IV. Al igual que con el muestreo
aleatorio simple, con los datos de la muestra se pueden obtener las medidas o
indicadores de interés.
Elaborado por Héctor Medina Disla. Septiembre 2009 12
13. Apuntes sobre Muestreo
Tabla 4: datos de una muestra de 10 estudiantes
Edad del Sexo del Número de Índice Gasto en
No. estudiante estudiante asignaturas Académico transporte
01 22 M 3 80.0 20
04 25 M 5 74.6 30
07 22 M 3 77.7 40
10 28 F 4 70.3 40
13 20 M 4 79.8 40
16 24 F 4 74.4 40
19 21 F 4 77.7 20
22 21 F 4 83.0 40
25 21 F 4 80.7 30
28 24 M 5 74.9 80
3.- Muestreo Estratificado
En una muestra aleatoria estratificada la población se divide en grupos o estratos
que son iguales a lo interno de ellos, pero diferentes entre ellos. El objetivo del
muestreo estratificado es lograr una mayor representatividad de los grupos que
conforman la población, así como una reducción en los niveles de variabilidad en
las mediciones al analizar grupos que son homogéneos. La principal limitante para
un muestreo aleatorio estratificado es la disponibilidad de información sobre los
diferentes grupos que conforman la población y además no permite la comparación
entre los grupos o estratos ya que estos son diferentes entre ellos.
El número de elementos seleccionado de cada estrato puede ser proporcionar o
desproporcionar al tamaño del estrato en relación con la población.
Específicamente, la cantidad de elementos a seleccionar en cada estrato puede
obtenerse a partir de una de tres procedimientos:
Afijación simple: A cada estrato le corresponde igual número de unidades
muestrales.
Afijación proporcional: La distribución se hace de acuerdo con el peso o tamaño
de la población en cada estrato. Por ejemplo, si un estrato representa el 25.0% de
la población se le asigna el 25.0% de la muestra.
Afijación óptima: Se toma en consideración la variabilidad o dispersión de los
resultados que se obtendrán, de modo que se considera la proporción y la
desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación
estándar de la variable antes de estudiarla.
Para seleccionar una muestra estratificada se siguen los siguientes pasos:
1. Se divide la población en grupos o estratos.
Elaborado por Héctor Medina Disla. Septiembre 2009 13
14. Apuntes sobre Muestreo
2. Determinar el tamaño de la muestra a seleccionar en cada uno de los estratos
3. Seleccionar las unidades de cada estrato utilizando para ello el muestreo
aleatorio simple o aleatorio sistemático.
Ejemplo: suponga que de la población hipotética mostrada en la tabla I se desea
tomar una muestra estratificada por sexo de 10 estudiantes. Como la muestra es
estratificada por sexo se tendrá dos estratos y como en la población el 60.0% es de
sexo femenino y el 40.0% masculino, si se utiliza una asignación proporcional, en
la muestra el 60.0% debe ser de sexo femenino y el 40.0% de sexo masculino.
Tabla 5: Asignación proporcional para la
estratificación de la población por sexo
Sexo Población, Ni Fracción Muestra, ni
Femenina 18 0.60 6
Masculino 12 0.40 4
Total 30 1.00 10
Los datos organizados por sexo se muestran en la tabla 6
Tabla 6: Datos personales de 30 estudiantes de Informática estratificado por sexo
Edad del Sexo del Número de Índice Gasto en
Estrato No. estudiante estudiante asignaturas Académico transporte
1 24 F 3 77.8 50
2 25 F 3 74.3 50
3 21 F 6 80.1 40
4 28 F 3 70.3 40
5 28 F 4 70.3 40
6 25 F 3 74.3 20
7 30 F 2 73.3 20
8 28 F 3 81.5 40
9 24 F 4 74.4 40
Uno
10 28 F 3 78.6 40
11 24 F 6 76.7 40
12 21 F 4 77.7 20
13 21 F 4 83.0 40
14 22 F 3 76.8 60
15 21 F 4 80.7 30
16 26 F 3 70.8 50
17 25 F 4 71.3 20
18 25 F 5 80.6 20
Dos 1 22 M 3 80.0 20
2 23 M 4 75.6 60
3 25 M 5 74.6 30
Elaborado por Héctor Medina Disla. Septiembre 2009 14
15. Apuntes sobre Muestreo
4 21 M 3 82.1 30
5 22 M 3 77.7 40
6 29 M 5 73.5 40
7 20 M 4 79.8 40
8 24 M 3 79.4 20
9 35 M 2 75.7 40
10 24 M 3 81.2 50
11 24 M 5 74.9 80
12 29 M 3 82.6 30
Para la selección de la muestra en cada estrato generan números aleatorios de
acuerdo al tamaño de la muestra, por ejemplo, en estrato de uno hay que
seleccionar seis elementos y como la población de este estrato es de 18 es
necesario tomar en cuenta dos columnas, en el caso del estrato dos, la población
es de 12 y también es necesario tomar en cuenta dos columnas. Para iniciar con el
estrato uno tomamos la columna uno y dos de la tabla de números aleatorios. Los
números menores o igual a 18 son el 17 en la fila uno, seguido del 18 en la fila 21,
como no hay más número menores de 18 en estas dos columna, se sigue con la
columna dos y tres y aquí los números menores de 18 son el 04 en la fila cinco,
seguido del 02 en la fila 10, el 15 en la fila 11 y el 07 en la fila 33. De forma que los
números aleatorios seleccionados son 02, 04, 07, 15, 17 y el 18
Para seleccionar la muestra en el estrato dos se sigue el mismo procedimiento,
tomando los primeros números aleatorios menores o igual a 12. Para buscar los
números se toman las columnas tres y cuatro los números son 07 en la fila 21,
seguido del 06 en la fila 40, el 04 en la fila 50. Como no se completa la muestra se
sigue con las columnas cuatro y cinco y el primer número que aparece es el 12 en
la fila 24. De esta forma los números a incluir en la muestra del estrato dos son
04, 06, 07 y el 12. Los datos de las muestras seleccionadas se muestran en la
tabla VII.
Tabla 7: Datos personales de 30 estudiantes de Informática estratificado por sexo
Edad del Sexo del Número de Índice Gasto en
Estrato No. estudiante estudiante asignaturas Académico transporte
2 25 F 3 74.3 50
4 28 F 3 70.3 40
7 30 F 2 73.3 20
Uno
15 21 F 4 80.7 30
17 25 F 4 71.3 20
18 25 F 5 80.6 20
4 21 M 3 82.1 30
6 29 M 5 73.5 40
Dos
7 20 M 4 79.8 40
12 29 M 3 82.6 30
Elaborado por Héctor Medina Disla. Septiembre 2009 15
16. Apuntes sobre Muestreo
La selección de la muestra en cada estrato se puede hacer mediante un
procedimiento de muestreo aleatorio sistemático, con el cual el proceso de
selección es más rápido y sencillo de realizar. En este caso, el coeficiente de
elevación se obtiene dividiendo la población de cada estrato entre la muestra de
N
cada estrato, esto es, CE i i . Cuando la cantidad de elementos en cada estrato
ni
se hace mediante una asignación proporcional, el coeficiente de elevación es el
mismo para cada estrato.
4. Muestreo por conglomerado
En una muestra por conglomerado, la población se divide en grupos o
conglomerados que son de igual tamaño o que son convenientes para el muestreo,
es decir, que son iguales entre ellos, pero diferentes a lo interno de ellos. El
muestreo por conglomerado permite hacer comparaciones entre grupos que son de
igual tamaño y se utilizan principalmente cuando no se tiene información acerca
de la estructura de la población. Bajo este método, aunque no todos los grupos son
muestreados, cada grupo tiene igual probabilidad de ser seleccionado, por lo tanto
la muestra es aleatoria. Para ilustrar el proceso se ha dividido la población
hipotética en seis conglomerados de cinco elementos cada uno.
Tabla 8. Datos personales de 30 estudiantes divido por conglomerado
Edad del Sexo del Número de Índice Gasto en
Conglomerado No. estudiante estudiante asignaturas Académico transporte
1 22 M 3 80.0 20
2 24 F 3 77.8 50
Uno 3 23 M 4 75.6 60
4 25 M 5 74.6 30
5 21 M 3 82.1 30
6 25 M 3 74.3 50
7 22 M 3 77.7 40
Dos 8 21 F 6 80.1 40
9 28 F 3 70.3 40
10 28 F 4 70.3 40
11 29 M 5 73.5 40
12 25 M 3 74.3 20
Tres 13 20 M 4 79.8 40
14 30 F 2 73.3 20
15 28 F 3 81.5 40
Cuatro 16 24 F 4 74.4 40
17 28 F 3 78.6 40
Elaborado por Héctor Medina Disla. Septiembre 2009 16
17. Apuntes sobre Muestreo
18 24 F 6 76.7 40
19 21 F 4 77.7 20
20 24 M 3 79.4 20
21 35 M 2 75.7 40
22 21 F 4 83.0 40
Cinco 23 24 M 3 81.2 50
24 22 F 3 76.8 60
25 21 F 4 80.7 30
26 26 F 3 70.8 50
27 25 F 4 71.3 20
Seis 28 24 M 5 74.9 80
29 29 M 3 82.6 30
30 25 F 5 80.6 20
Una muestra de conglomerados, usualmente produce un mayor error muestral
(por lo tanto, da menor precisión de las estimaciones acerca de la población) que
una muestra aleatoria simple del mismo tamaño. El muestreo por conglomerados
es un muestreo polietápico ya que se desarrolla en dos o más etapas. En este tipo
de muestreo la unidad primaria de selección es el conglomerado y luego se
seleccionan las unidades de análisis en cada conglomerado. Tanto para la
selección del conglomerado como de las unidades muestrales en cada grupo o
conglomerado se utiliza el muestreo aleatorio simple o el muestreo aleatorio
sistemático.
En el muestreo por conglomerado, una vez que se han seleccionado los
conglomerados, en los mismos se selecciona una muestra, utilizando para ello un
procedimiento de muestreo aleatorio simple o aleatorio estratificado o se pueden
estudiar todos los elementos de dicho conglomerado.
Para la población hipotética de 30 estudiantes se ha divido en seis conglomerados
de cinco elementos cada uno, de forma que si se quiere seleccionar una muestra de
10 estudiantes, se deben tomar dos conglomerados. Para la selección de los
conglomerados se utiliza uno de los procedimientos de muestreo conocido,
aleatorio simple y aleatorio sistemático.
Para el caso de la población que se está estudiando y utilizando la tabla de
números aleatorios para la selección de los conglomerados, tomando la columna
20, este número se elige de manera aleatoria, por ejemplo preguntando a una
persona que se encuentre cerca que diga un número entre uno y 40 que es el
número de columnas que tiene la tabla. En este caso, el primer número aleatorio
menor a seis es el número cuatro que está en la fila uno, seguido del número seis
en la fila dos. Luego los conglomerados a seleccionar para la muestra son el
número cuatro y número seis y los datos se muestran en la tabla siguiente:
Tabla 9. Datos personales de 30 estudiantes divido por conglomerado
Elaborado por Héctor Medina Disla. Septiembre 2009 17
18. Apuntes sobre Muestreo
Edad del Sexo del Número de Índice Gasto en
Conglomerado No. estudiante estudiante asignaturas Académico transporte
16 24 F 4 74.4 40
17 28 F 3 78.6 40
Cuatro 18 24 F 6 76.7 40
19 21 F 4 77.7 20
20 24 M 3 79.4 20
26 26 F 3 70.8 50
27 25 F 4 71.3 20
Seis 28 24 M 5 74.9 80
29 29 M 3 82.6 30
30 25 F 5 80.6 20
Tabla 10: Cuadro comparativo de los procedimientos de muestreo probabilístico
Tipo de
Características Ventajas Inconvenientes
Muestreo
Requiere que se
Sencillo y de fácil posea de
comprensión. antemano un
Se selecciona una
Cálculo rápido de listado completo
muestra de tamaño n
medias y de toda la
de una población de N
varianzas. población. Cuando
Aleatorio unidades, cada
Se basa en la se trabaja con
simple elemento, tiene una
teoría estadística, muestras
probabilidad de
y por tanto existen pequeñas es
inclusión igual y
paquetes posible que no
conocida de n/N.
informáticos para represente a la
analizar los datos población
adecuadamente.
Conseguir un listado de Fácil de aplicar. Si la constante de
los N elementos de la No siempre es muestreo está
población necesario tener un asociada con el
Determinar tamaño listado de toda la fenómeno de
Sistemático muestral n. población. interés, las
Definir Coeficiente de Cuando la estimaciones
Elevación, CE= N/n. población está obtenidas a partir
Elegir un número ordenada de la muestra
aleatorio k, entre 1 y siguiendo una pueden contener
Elaborado por Héctor Medina Disla. Septiembre 2009 18
19. Apuntes sobre Muestreo
CE (k= arranque tendencia sesgo de selección
aleatorio). conocida, asegura
Seleccionar los una cobertura de
elementos de la lista. unidades de todos
los tipos.
Tiende a asegurar
que la muestra sea
En ciertas ocasiones
representativa de
resultará conveniente
la población en
estratificar la muestra
función de las
según ciertas variables
variables
de interés. Para ello se Es necesario
seleccionadas.
deben conocer las conocer la
Se obtienen
características de la estructura de
estimaciones más
población objetivo. Una la población
Estratificado precisas
vez que se establece el para poder
Su objetivo es
tamaño de la muestra, establecer los
conseguir una
se asigna a cada estratos en la
muestra lo más
estrato, generalmente, misma.
semejante posible
de manera proporcional
a la población en
la cantidad de muestra
lo que a la o las
a seleccionar en cada
variables de
uno.
estratificación
utilizadas.
Se realizan varias fases Es muy eficiente
El error
de muestreo sucesivas cuando la
estándar es
(polietápico) población es muy
mayor que en
La necesidad de grande y dispersa.
el muestreo
listados de las No es preciso tener
Conglomerados aleatorio simple
unidades de una etapa un listado de toda
o estratificado.
se limita a aquellas la población, sólo
El cálculo del
unidades de muestreo de las unidades
error estándar
seleccionadas en la primarias de
es complejo.
etapa anterior. muestreo.
Elaborado por Héctor Medina Disla. Septiembre 2009 19