Distribución muestral y estimación de parámetros para una población
Instituto Universitario Politécnico "Santiago Mariño"
Realizado por:
Castillo, Erick
Gallardo, Jean
Rodríguez, José Alejandro
Propuesta para la creación de un Centro de Innovación para la Refundación ...
Estimación de parámetros poblacionales a partir de muestras
1. República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
Instituto Universitario Politécnico “Santiago Mariño”
Ingeniería Industrial
Sede Barcelona
Alumnos:
Erick Castillo C.I: 28.442.861
Jean Gallardo C.I: 28.442.453
José Rodríguez C.I: 28.069.908
Profesor:
Beltrán Pedro
2. La distribución muestral de estadísticas es la distribución de estadísticas
derivadas de una muestra aleatoria de tamaño n, que se considera una variable
aleatoria. Se puede considerar como la distribución estadística de todas las
muestras posibles de la misma población de un tamaño de muestra dado. La
distribución del muestreo depende de la distribución básica de la población, las
estadísticas consideradas, el procedimiento de muestreo utilizado y el número de
muestras utilizadas.
La estimación puntual consiste en atribuir el valor (estimación) al
parámetro general. Si la muestra representa una población, podemos esperar que
las estadísticas calculadas en la muestra tengan valores similares al parámetro de
población, y la estimación incluye asignar el valor de las estadísticas de la muestra
al parámetro de población. La información estadística que utilizamos para obtener
estimaciones se denomina estimador.
3. El estudio de determinadas características de una
población se efectúa a través de diversas muestras que
pueden extraerse de ella.
El muestreo puede hacerse con o sin reposición, y
la población de partida puede ser infinita o finita. Una
población finita en la que se efectúa muestreo con reposición
puede considerarse infinita teóricamente. También, a efectos
prácticos, una población muy grande puede considerarse
como infinita. En todo nuestro estudio vamos a limitarnos a
una población de partida infinita o a muestreo con reposición.
4. En inferencia estadística se llama estimación al conjunto de técnicas
que permiten dar un valor aproximado de un parámetro de una
población a partir de los datos proporcionados por una muestra. Por
ejemplo, una estimación de la media de una determinada característica
de una población de tamaño N podría ser la media de esa misma
característica para una muestra de tamaño n.
La estimación se divide en tres grandes bloques, cada uno de los
cuales tiene distintos métodos que se usan en función de las
características y propósitos del estudio:
•Estimación puntual.
•Estimación por intervalos.
•Estimación bayesiana.
5. En un estudio de las 500 firmas que aparecen en la revista Fortune sobre
los negocios más grandes de la nación, se puede tomar una muestra de n = 50. De
esta manera se puede calcular la tasa de rendimiento promedio 𝑋 para estas 50
firmas. Esta media muestral serviría entonces como un estimado de 𝜇, la tasa de
promedio de rendimiento de la población para todas las 500 firmas.
De esta lista de 500 firmas, sería posible obtener muchas muestras
diferentes de tamaño 50. Específicamente se podría obtener 500C50 muestras
diferentes de tamaño n = 50. Debido a que 500C50 es un número más bien grande, se
asume, que se tiene una población de N = 4 ingresos para cuatro estudiantes
universitarios. Estos ingresos son de US$100, US$200, US$300 y US$400. El ingreso
promedio puede calcularse como 𝜇 = US$250. Sin embargo, para hacer las cosas
aún más simples, se decide seleccionar una muestra de n = 2 observaciones para
estimar el 𝜇 “desconocido”. Se podría entonces seleccionar aleatoriamente una
muestra de 4C2 = 6 posibles muestras. Estas seis muestras distintas y sus medias se
muestran en la tabla a continuación:
6. Muestra Elementos
muestrales 𝑿𝒊
Medias muestrales
𝑿
1 100,200 150
2 100,300 200
3 100,400 250
4 200,300 250
5 200,400 300
6 300,400 350
Tabla 1: Todas las muestras posibles de tamaño n = 2 de una
población de N = 4 ingresos
Salvo las muestras tercera y cuarta, cada muestra tiene una media diferente.
Asumiendo que cada muestra tiene la misma probabilidad de ser seleccionada, la
probabilidad de seleccionar una muestra que dé una 𝑋 igual a la media
poblacional de 250 es solo 2/6 = 33.3%. Cuatro de las seis muestras resultarán
con algún error en el proceso de estimación. Este error de muestreo es la
diferencia entre 𝜇 y la media muestral que se utiliza para estimarlo, ( 𝑋 − 𝜇).
7. Con una población de solo N = 4, se puede enumerar cada media muestral posible
que aparece en la tabla 1, junto con su respectiva probabilidad. Tal listado se le
denomina una distribución muestral, y aparece en la tabla 1.2 y como histograma
en la figura 1.1.
Media muestral 𝑿 Número de muestras
que dan 𝑿
Probabilidad de P ( 𝑿)
150 1 1/6
200 1 1/6
250 2 2/6
300 1 1/6
350 1 1/6
Tabla 1.2: Distribución muestral para muestras de tamaño n = 2 en una población
de N = 4 ingresos
2/6
1/6
𝑃( 𝑋)
𝑋
Figura 1.1:
Distribución
muestral para
muestras de
tamaño n = 2 en
una población de
N = 4 ingresos
8. Por experiencias anteriores se sabe que las estaturas de los soldados tienen una
varianza de 64 cm. a) Con un margen de error del 6%, estime la estatura media
partiendo de un grupo de 100 soldados, tomados al azar, sabiendo que proporcionó
un promedio de 164 cm. b) Manteniendo el mismo intervalo de confianza calculado en
el apartado anterior ¿qué tamaño muestral debe fijarse para que el margen de error
pase a ser α = 0'02?.
a) Estimación de la media con varianza poblacional conocida.
Intervalo de confianza: 𝑥 ± 𝑧 𝛼 ∙
𝜎
𝑛
Intervalo de confianza :
164 ± 1′
88 ∙
64
100
→ 164 ± 1′
504 → 162′
496 , 165′
504
9. b) Para α = 0′02 ; 𝑧𝛼 = ± 2′33
Manteniendo el intervalo anterior, tomemos uno de sus extremos, por ejemplo el
derecho :
165′
504 = 𝑥 + 𝑧 𝛼 ∙
𝜎
𝑛
= 164 + 2′
33 ∙
64
𝑛
De aquí resulta: 𝑛 =
2′33 ∙ 64
165′504 −164
= 12′
3936 → 𝑛 = 153′
60 ~ 154
Para reducir a 0'02 el margen de error, debemos tomar una muestra de 154 soldados.
10. 1. Distribución muestral de dos medias:
Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si
consideramos cada una de estas medias como valores de una variable aleatoria podemos
estudiar su distribución que llamaremos distribución muestral de medias.
•Si tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n, la
distribución muestral de medias sigue también una distribución normal
•Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema
central del límite la distribución muestral de medias se aproxima también a la normal anterior.
11. Las ventas en miles de dólares para East Coast Manufacturing (ECM) durante los
últimos 5 meses fueron de 68, 73, 65, 80 y 72. Asumiendo que estos cinco meses
constituyen la población, la media claramente es 𝜇 = 71.6. Como director de marketing
de ECM, se desea estimar este 𝜇 “desconocido” tomando una muestra de tamaño n =
3. Se espera que el error de muestreo que es probable que ocurra sea relativamente
pequeño. Realice la distribución muestral y calcule la media de la distribución muestral.
Hay 5C3 = 10 muestras en la distribución muestral:
Número de
la muestra
Elementos
de la
muestra 𝑿𝒊
Media
muestral 𝑿
Número de
la muestra
Elementos
de la
muestra 𝑿𝒊
Media
muestral 𝑿
1 68,73,65 68.67 6 68,80,72 73.33
2 68,73,80 73.67 7 73,65,80 72.67
3 68,73,72 71.00 8 73,65,72 70.00
4 68,65,80 71.00 9 73,80,72 75.00
5 68,65,72 68.33 10 65,80,72 72.33
12. La distribución muestral es:
𝑿 𝑷( 𝑿)
68.87 1/10
73.67 1/10
71.00 2/10
68.33 1/10
73.33 1/10
72.67 1/10
70.00 1/10
75.00 1/10
72.33 1/10
La media de la distribución muestral es:
𝑋 =
68.67 + 73.67 + 71.00 + … + 72.33
10
= 71.6 = 𝜇
13. 2. Distribución muestral de proporciones:
En numerosas ocasiones se plantea estimar una proporción o
porcentaje. En estos casos la variable aleatoria toma solamente dos valores
diferentes (éxito o fracaso), es decir sigue una distribución binomial y
cuando la extensión de la población es grande la distribución binomial
B(n,p) se aproxima a la normal .
•Para muestras de tamaño n>30, la distribución muestral de proporciones
sigue una distribución normal
donde p es la proporción de uno de los valores que presenta la variable
estadística en la población y q=1-p.
14. Lugget Furniture pregunta a toda la población N = 4 clientes si vieron el anuncio
publicitario de Lugget en el periódico de esta mañana. Se registró una respuesta de “sí”
como éxito, y de “no” como fracaso. Los cuatro clientes respondieron S1, N2, N3 y S4. La
proporción poblacional de éxitos es 𝜋 = 0.50. Se tomaron muestras de tamaño n = 2, y
la proporción de éxitos se registra en la tabla 1.3.
𝑿𝒊 Número de éxitos p (proporción de
éxitos)
S1, N2 1 0.50
S1, N3 1 0.50
S1, S4 2 1.00
N2, N3 0 0.00
N2, S4 1 0.50
N3, S4 1 0.50
3.00
El valor esperado (media) de la distribución muestral es
𝐸 𝑝 =
𝑝
𝐾
=
3
6
= 0.50 = 𝜋
15. Una estimación puntual de un parámetro poblacional es
cuando se utiliza un único valor para estimar ese parámetro, es decir, se
usa un punto en concreto de la muestra para estimar el valor deseado.
Cuando estimamos un parámetro de forma puntual, podemos
saber con certeza, cual es ese valor. Imaginemos una población de 30
personas de las que seleccionamos una muestra de 20 para las que
conocemos sus edades. Estimar de forma puntual la media de edad,
sería tan sencillo como sumar esos 20 datos y dividirlos entre el total de
la muestra estadística.
16. Con un nivel de confianza del 95%, estimar la media poblacional a partir de 15
observaciones muestrales en las que se calculó : media = 8'5 ; varianza = 3 . Con los
mismos resultados muestrales, estime el valor de la desviación típica de la población
con un margen de error del 1%.
Estimación de la media de la población. Varianza poblacional desconocida y muestra
pequeña.
Intervalo de confianza:
𝑥 ± 𝑡 𝑛 −1,𝑎 ∙
𝑠′
𝑛
con 𝑠′2
=
𝑛
𝑛 − 1
∙ 𝑠2
= covarianza
o bien, sustituyendo en s′: 𝑥 ± 𝑡 𝑛−1,𝑎 ∙
𝑠
𝑛 − 1
Valores tabulados de t de Student para:
1 − 𝛼 = 0′
95 𝛼 = 0′
05
𝜈 = 𝑛 − 1 = 14 grados de libertad
𝑡14,𝑎 = ± 2′144776
El intervalo de confianza para la estimación de la media es:
8′
5 ± 2′
144776 ∙
3
15 − 1
→ 8′
5 ± 0′
993 → (7′
507, 9′
493)
17. Estimación de la desviación típica poblacional.
Realizamos el proceso para la varianza de la población. Una vez calculado el intervalo de
confianza, la raíz cuadrada de sus extremos proporcionará el intervalo correspondiente a la
desviación típica.
Intervalo de confianza :
n∙s2
X1
2
,
n ∙ s2
X2
2
Valores tabulados de 𝜒2 , para 𝛼 = 0′01 𝑦 𝜈 = 𝑛 − 1 = 14 grados de libertad:
Luego el intervalo de confianza para la varianza es:
15 ∙3
31′322266
,
15 ∙3
4′074219
= 1′
4367 , 11′
0451
y el correspondiente a la desviación típica: 1′4367 , 11′0451 = 1′
1986 , 3′
3234
18. La estimación por intervalos consiste en establecer el intervalo de valores donde es más
probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes
consideraciones:
•Si conocemos la distribución muestral del estimador podemos obtener las probabilidades
de ocurrencia de los estadísticos muéstrales.
•Si conociéramos el valor del parámetro poblacional, podríamos establecer la probabilidad
de que el estimador se halle dentro de los intervalos de la distribución muestral.
•El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se
establece alrededor del estimador.
19. 1. En muestras grandes:
Para analizar la eficacia de la aplicación de un tratamiento , se someten al mismo
a 64 pacientes. Finalizado el período de aplicación se observó que remitió la enfermedad en
50 casos. Con un nivel de confianza del 92%, estime el porcentaje de efectividad del
tratamiento objeto de estudio.
Estimación de una proporción.
Intervalo de confianza : 𝑝 ± 𝑧 𝛼 ∙
𝑝 ∙(1 −𝑝)
𝑛
Valor tabulado en N(0,1) para α = 0'08 ( p = 1-α = 0'92 ) :
zα = ± 1'75
Siendo la proporción muestral p = 50 / 64 = 0'78125, el intervalo de confianza es :
0′
78125 ± 1′
75 ∙
0′78125 ∙ 1 − 0′78125
64
→ 0′
78125 ± 0′
09043 → (0′
69082, 0′
87168)
Con un margen de error del 8% podemos afirmar que el tratamiento será efectivo entre el
69'082% y el 87'168% de los casos.
20. 2. En muestras pequeñas:
Observadas las calificaciones en las asignaturas de Filosofía y Lengua se aprecia
una notable diferencia entre ellas. Con el fin de analizarla se seleccionan 20 alumnos de
Filosofía y otros tantos de Lengua, obteniendo :
Filosofía : Media = 6 Varianza = 2
Lengua : Media = 5 Varianza = 1'5
Estime la diferencia media de las calificaciones con un margen de error del 5%. Estimación
de una diferencia de medias con varianzas poblacionales desconocidas y muestras pequeñas
de igual tamaño.
Intervalo de confianza
𝑋1 − 𝑋2 ± 𝑡2𝑛 −2,𝑎
𝑆12 + 𝑆22
𝑛 − 1
con n = n1 = n2
Valores tabulados de la t de Student para α = 0'05 y ν = 2n-2 = 38 grados de libertad:
𝑡2𝑛 − 2, 𝛼 = 𝑡38,0′05 = ± 2′024395
El intervalo pedido es :
6 − 5 ± 2′
024395 ∙
2 + 1′5
20 − 1
→ 1 ± 0′
869 → (0′
131, 1′
869)
La diferencia entre los promedios de calificaciones estará comprendida entre 0'131 y 1'869
puntos.
21. En estadística y probabilidad se
llama distribución normal, distribución de
Gauss, distribución gaussiana o distribución de
Laplace-Gauss, a una de las distribuciones de
probabilidad de variable continua que con más
frecuencia aparece en estadística y en la teoría de
probabilidades. La gráfica de su función de densidad
tiene una forma acampanada y es simétrica
respecto de un determinado parámetro estadístico.
Esta curva se conoce como campana de Gauss y es
el gráfico de una función gaussiana.
22. Consideremos un caso en el cual ToppsWear, un gran fabricante de ropas,
desea estudiar la distribución en la estatura de las personas. Topps Wear reconoció que
el público estaba en constante cambio en su tamaño físico y en sus proporciones. En
un esfuerzo por producir la ropa de mejor ajuste, la gerencia sintió que se necesitaba
un análisis completo de las tendencias actuales en los tamaños de moda. Se supone
que si Topps Wear fuera a medir las estaturas de todos sus clientes potenciales,
encontrarían que las estaturas están distribuidas normalmente alrededor de una media
de 67 pulgadas. Es decir, que mientras la estatura promedio es de 67 pulgadas,
algunas personas son más altas y algunas más bajas. Se asume que la desviación
estándar en las estaturas de los clientes es de 2 pulgadas.
Una gráfica de estas estaturas produciría la habitual forma de campana. La
figura 1.2 muestra esta gráfica, colocando las observaciones individuales en el eje
horizontal, y la frecuencia con la cual cada una de estas observaciones ocurrieron en el
eje vertical. Si los valores son todavía normales (ej: distribuidos normalmente),
entonces aparecerá la curva en forma de campana. Vale la pena recordar que más del
50% de las observaciones (estaturas)están por encima de la media y el 50% de éstas
está debajo de la media. Similarmente el 50% de toda el área bajo la curva normal está
a la derecha de la media y el 50% de esta área está a la izquierda de la media. Esto se
observa también en la figura 1.2.
24. La distribución t (Student) fue desarrollada por William Sealy Gosset,
bajo el seudónimo Student, es una distribución de probabilidad que surge del
problema de estimar la media de una población normalmente distribuida cuando
el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la
determinación de las diferencias entre dos varianzas muestrales y para la
construcción del intervalo de confianza para la diferencia entre las partes de
dos poblaciones cuando se desconoce la desviación típica de una población y
esta debe ser estimada a partir de los datos de una muestra.
25. Elegidas 26 personas al azar de una población y sometidas a un test de “modernismo”
dan como media 𝑋 = 40 y S = 6. Se quiere saber si la verdadera media de la población
puede ser tan alta como 44.
SOLUCIÓN:
-Se trata de una prueba unilateral.
-Trabajemos al nivel de confianza 1%.
-Calculamos el error típico de la media.
𝜎
𝑋 =
𝑆
𝑁−1
=
6
25
=
6
5
=1.20
Hallamos la razón crítica t:
𝑡 =
Estadístico − Parámetro
𝐸𝑟𝑟𝑜𝑟
=
40 −44
1.20
= −3.33
Donde la razón crítica t tiene una distribución t de Student
Consultamos la tabla teniendo en cuenta:
-Los grados de libertad: N − 1 = 26 − 1 = 25
-El nivel de confianza: 1%
26. Para 25 grados de libertad y al nivel de confianza del 1%, t = -2.48. Ahora bien,
la t obtenida = - 0.33 < -2.48 lo cual significa que de ser cierto que la media verdadera
fuese 44, una media tan baja como 40 no podría resultar ni en 1 % de los casos. Luego
con 99 % de probabilidades de acertar podemos decir que la media de la población no
puede ser tan alta como 44 y, en consecuencia, rechazamos la hipótesis nula al nivel de
confianza del 1%.
Si se pregunta por la fiabilidad de la media procederemos, en general,
averiguando la diferencia máxima que estaremos dispuestos a admitir entre la media de
una muestra y la media de la población a un determinado nivel de confianza. Según el
ejemplo anterior, al nivel de confianza del 2 %
𝑋 − 𝑡0.02 × 𝜎 𝑋 < 𝜇 < 𝑋 + 𝑡0.02 × 𝜎 𝑋
𝑋 − 2.48 × 1.20 < 𝜇 < 𝑋 + 2.48 × 1.20
40 − 2.976 < 𝜇 < 40 + 2.976
𝜇
42.976
37.024
27. En estadística el tamaño de la muestra se le conoce como aquel número
determinado de sujetos o cosas que componen la muestra extraída de
una población, necesarios para que los datos obtenidos sean representativos
de la población. Es muy importante para el uso de cantidades grandes, fácil y
rápido.
28. El tiempo de conexión a internet de los alumnos de cierta universidad sigue
una distribución normal con desviación típica de 15 minutos. Para estimar la media del
tiempo de conexión, se quiere calcular un intervalo de confianza que tenga una
amplitud menor o igual a 6 minutos, con un nivel de confianza del 95 %. Determina
cuál es el tamaño mínimo de la muestra que es necesario observar.
29. Podemos concluir que tanto las distribuciones muestrales como las
estimaciones de los parámetros de una población son herramientas muy
efectivas y útiles a la hora de abarcar distintos planteamientos estadísticos.
Las estimaciones por intervalo nos permiten analizar una pequeña
muestra de una población, como también nos ayuda a la hora de realizar un
gran muestreo, según sea el caso. Además, la estimación puntual, puede ser
empleada cuando solo queremos saber el comportamiento de una muestra
específica, sin tener que utilizar el resto.
La distribución normal y la distribución de t Student son otros
recursos muy relevantes que nos sirven tanto para conocer la media de una
población, cada una con sus diferencias (la distribución de t Student se emplea
en muestras muy pequeñas).
Otro gran aporte es sin dudas el tamaño de una muestra, ya que con
el podemos saber que cantidad de individuos se necesitan para realizar alguna
estimación.
Los ejemplos nos han ayudado a entender un poco más lo que nos
expresa la teoría, mediante el empleo de fórmulas y cálculos.
30. Webster, A. (2004). Estadística aplicada los negocios y a economía. (3ª ed.).
Colombia: Mc Graw Hill.
Recuperado el 18 de julio de 2020
https://proyectodescartes.org/uudd/materiales_didacticos/inferencia_estadi
stica_JS/distrib_muestrales.htm
Recuperado el 18 de julio de 2020
https://es.wikipedia.org/wiki/Estimaci%C3%B3n_estad%C3%ADstica
Recuperado el 18 de julio de 2020
https://economipedia.com/definiciones/estimacion-
puntual.html#:~:text=Una%20estimaci%C3%B3n%20puntual%20de%20un,para%20e
stimar%20el%20valor%20deseado.
Recuperado el 19 de julio de 2020
https://www.uv.es/webgid/Inferencial/5_estimacin_por_intervalos.html
31. Recuperado el 19 de julio de 2020
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal
Recuperado el 19 de julio de 2020
https://es.wikipedia.org/wiki/Tama%C3%B1o_de_la_muestra
Recuperado el 19 de julio de 2020
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student