Este documento describe cómo construir intervalos de confianza para la media poblacional y la varianza poblacional cuando la varianza de la población es desconocida. Explica que en este caso se debe usar la distribución t de Student y la distribución chi-cuadrada, respectivamente. Además, proporciona ejemplos numéricos para ilustrar cómo calcular este tipo de intervalos de confianza.
2. Ahora consideraremos un problemas más realista:
Construir un intervalo de confianza para la media
poblacional cuando la varianza (o desviación
estándar) es desconocida.
En este caso es necesario abordar dos aspectos del
problema:
1. El valor de la varianza (desviación estándar) no es
conocida y debe ser estimada.
2. La distribución muestral de la variable obtenida al
reemplazar la varianza de la población por la
varianza obtenida a partir de los datos de la muestra,
no es la distribución normal.
3. Seleccionemos de la
población una muestra
aleatoria de tamaño n .
Entonces el estimador S2
representado en la figura
se le llama varianza
muestral.
A S se le conoce como
desviación estándar
muestral.
4. Cabe aclarar que al haber
dividido el estimador entre (n
– 1) nos permite hace de él
un estimador no sesgado.
Pues bien, al reemplazar σ2
por S2 se crea una nueva
distribución muestral
conocida como “t de
Student” o simplemente una
distribución «t» con (n – 1)
grados de libertad.
5. La variable aleatoria en base a la cual se
construyen la distribución muestral “T” es:
6. 1) Hay un número infinito
de distribuciones “t”,
cada una identificada
por un parámetro γ ,
llamado “grados de
libertad” .
2) El parámetro γ es
siempre positivo y está
relacionado con el
tamaño de la muestra.
3) Cada distribución “T”
tiene; una gráfica
continua, simétrica, en
forma de campana
centrada en cero.
7. Gamma es un parámetro de forma en el sentido de que
cuando γ crece, la varianza de la distribución de muestreo
“Tγ” decrece. De este modo, cuando más grande el número de
grados de libertad, más compacta se vuelve la curva.
8. También cuando el número de grados de libertad crece, la
curva «t» se aproxima a la curva Normal Tipificada.
9. Con todos estos antecedentes estudiados, es tiempo de
presentar el siguiente teorema, que permite construir un
intervalo de confianza de la media de la población con (1 - α)%
de confianza, cuando no se conoce la varianza de la
población.
Sea una muestra aleatoria de tamaño n de una
población que se distribuye en forma normal.
Entonces un intervalo de confianza de la media
poblacional cuando no se conoce la varianza
poblacional y con (1 - α) % de confianza viene dado
por:
10. De una muestra de tamaño 16 de una población normal se han
obtenido los siguientes estimadores:
_
X 1 . 57
2
S 0 . 66
S . 26
Costruir un intervalo de confianza para la media poblacional
con 95% de confianza
11. Calculemos los rangos de valores de la función t para 15
grados de libertad con un 95% de confianza:
12.
13. Los límites del intervalo de confianza son:
El numero de grados de libertad implicados en la búsqueda de
un intervalo de confianza de µ, cuando no se conoce la
varianza poblacional es n -1.
Si hay razón para sospechar que la variable bajo estudio tiene
una distribución que este lejos de la normal no se utilizaran
procedimientos estadísticos basados en la distribución T.
Mas bien se emplearían algunas técnicas de distribución
libre (Estadística no paramétrica).
14. La confianza deseada, que controla el valor de t
La variabilidad de la muestra, que se mide por s
El tamaño de la muestra
15. En la dirección de Internet
http://onlinestatbook.com/stat_sim/conf_interval/index.
html
se puede encontrar la simulación que nos permite
observar la variación de la media de la muestra, a partir
de la selección aleatoria de 100 muestras, ayuda a ilustrar
cómo el ancho del intervalo de confianza depende del
tamaño de la muestra y el nivel de confianza.
Mientras que la simulación trabaja con 100 muestras, un
investigador tiene una sola muestra.
16.
17. En la figura se observa el muestreo de una población con una
media de 50 y una desviación estándar de 10. Los 100 dibujos
de intervalos de confianza fueron generados con muestras de
tamaño 15.
Para cada muestra, los intervalos de confianza del 95% y 99%
sobre la media se calculan en base a la media de la muestra y
la desviación estándar de la muestra.
Los intervalos para las distintas muestras se muestran por
líneas horizontales.
Los intervalos de confianza del 95% están dibujados en color
naranja y el intervalo de confianza del 99% en color azul.
Los intervalos de confianza al 95% que no contienen la media
de la población, y se muestra en rojo.
Los intervalos de confianza al 99% que no contienen la media
de la población, y se muestra en blanco.
18.
19. Supongamos que debe realizarse un estudio para estimar el
peso medio en el momento del nacimiento de niños cuyas
madres son adictas a la cocaína. ¿Cuan grande debe ser una
muestra para estimar esta medida con un margen de ½ libra
y con una confianza del 95 %?
21. Para resolver este problema, hay que recordar que para
muestras grandes, los valores de t pueden aproximarse
mediante los valores de la función de distribución Normal, por lo
que su valor que se puede tomar de t es 1.96
22. Por lo que:
¿Cuánto vale s2?
Hay varias formas de responder a esta pregunta:
Utilizar el estimador de un estudio anterior.
Efectuar un pequeño estudio preliminar o piloto y
utilizar el valor de s2 hallado para ayudar a planificar el
experimento mayor.
23. Ahora bien, si se recuerda que la ley de probabilidad normal
garantiza que la variable aleatoria estará el 95 % de las veces
dentro de 2 desviaciones estándar de su media, el rango de la
variable aleatoria es aproximadamente 4 desviaciones estándar.
Podemos utilizar el rango dividido por 4 para aproximar s.
Para este ejemplo se puede suponer que el peso en el momento
del nacimiento de estos niños probablemente estará entre 2 y 12
libras. Por lo tanto, el rango es 10, y s es aproximadamente
10/4 = 2.5.
El tamaño de muestra requerido
24.
25. En algunas ocasiones el interés de la inferencia se centra, no
sobre la media de la población, sino sobre su varianza.
Por consiguiente, es necesario que seamos capaces, no
solamente de encontrar una estimación puntual de la varianza
poblacional, sino también de construir un intervalo de
confianza relativo a este parámetro.
Para construir un intervalo de confianza de la varianza de la
población se toma como base para el cálculo de probabilidades
la distribución Chi-cuadrado.
Los límites para un intervalo de confianza de la varianza
poblacional del (1 - α) % pueden encontrarse considerando la
partición de la curva de la distribución
26.
27. Se extrajo una muestra
aleatoria de 16 plantas para
estimar la varianza en la
concentración de cobre. Las
plantas fueron quemadas, y se
analizaron las cenizas. Se
obtuvieron las siguientes
observaciones con respecto a x
(concentración de cobre (en
partes por millón) (supóngase
que x está normalmente
distribuida). Para estos datos se
tiene que:
S2 = 377.30.
28. La partición de la curva Chi-cuadrada que se necesita para
construir un intervalo de confianza de un 90 % está
representada en la figura, en donde los dos valores en el
dominio de la función fueron calculados con el programa NCSS