2. Estimación
Una estimación estadística es un proceso
mediante el que establecemos que valor debe
tener un parámetro según deducciones que
realizamos.
Estimar es establecer conclusiones sobre
características poblacionales a partir de
resultados muestrales.
4. Estimador
Un estimador es una función de las variables
muestrales que se utiliza para hacernos una
idea sobre el valor del parámetro objeto de
estudio, actúa como “representante” del
conjunto de variables muestrales.
5. Propiedades de un estimador
• Suficiente: La propiedad de suficiencia indica que el estimador trabaja con todos los datos de la muestra. Por ejemplo, la media no
escoge solo el 50% de los datos. Tiene en cuenta el 100% de los datos para calcular el parámetro.
• Insesgado: La propiedad de insesgadez hace referencia a la centralidad de un estimador. Es decir, la media de un estimador debe
coincidir con el parámetro a estimar. No debemos confundir media de un estimador con el estimador media.
• Consistente: El concepto de consistencia va aparejado del tamaño de la muestra y del concepto de límite. En palabras sencillas,
viene a decirnos que los estimadores cumplen esta propiedad cuando, en caso de que la muestra sea muy grande, puedan estimar
casi sin error.
• Eficiente: La propiedad de eficiencia puede ser absoluta o relativa. Un estimador es eficiente en sentido absoluto cuando la
varianza del estimador es mínima. No debemos confundir varianza de un estimador con estimador varianza.
• Robusto: Se dice que un estimador es robusto en caso de que, a pesar de que la hipótesis de partida sea incorrecta, los resultados
se asemejan mucho a los reales.
6. Estimación
Puntual
Es un procedimiento mediante el cual se
estima el valor del parámetro poblacional
basándose en los datos muestrales y mediante
el uso de un estadístico.
7. Propiedades de interés en un estimador puntual
Insesgado: Si de una característica de una
población se obtuviesen varias muestras de
tamaño n, podríamos obtener un
estimador con cada una de ellas y la media
de los valores de esos estimadores tiene
que coincidir con el valor del parámetro.
Consistencia: Se dice que un estimador es
consistente cuando incrementarse el
tamaño la muestra, el valor del estimador
tiende al valor del parámetro.
Varianza Mínima: al tener menos varianza,
la distribución del estimador es
menos dispersa con lo cual se minimiza el
error el error que se comete en el proceso
de inferencia.
Eficiencia: Se dice que un estimador, es
más eficiente que otro, si se verifica que la
varianza del primero es menor o igual que
la del segundo para cualquier tamaño
muestral.
9. Ejemplo
Uno de los indicadores de la calidad del aire es el número medio de microgramos de partículas en
suspensión por metro cúbico de aire. Para controlar la situación se hace una lectura cada seis días
extrayendo un metro cúbico de aire a través de un filtro y determinando el número de microgramos de
partículas en suspensión concentradas en eĺ. Después de un período de treinta días, se ha generado una
muestra aleatorioa de tamaño 5. Supongamos que los valores observados de estaas variables para el
periodo dado de treinta días son:
x1 = 58 x2 = 70 x3 = 57 x4 = 61 x5 = 59
¿ Cómo pueden utilizarse estas observaciones para estimar el número medio de microgramos de
partículas en suspensión por metro cúbico de aire ?
El sentido común señala la media muestral como un estimador lógico para la media poblacional,
entonces la fórmula matemática (o estimador) que se utilizara será:
X=61
10. Estimación
por intervalo
Es un procedimiento mediante el cual se
realiza una estimación del parámetro
poblacional a través de un intervalo en el que
de forma probable se encuentra el valor del
parámetro, ese intervalo recibe el nombre de
Intervalo de confianza.
11. Consideraciones
en la estimación
por intervalos
• Si conocemos la distribución muestral del estimador
podemos obtener las probabilidades de ocurrencia de los
estadísticos muestrales.
• Si conociéramos el valor del parámetro poblacional, podrí
amos establecer la probabilidad de que el estimador se
halle dentro de los intervalos de la distribución muestral.
• El problema es que el parámetro poblacional es
desconocido, y por ello el intervalo se establece alrededor
del estimador. Si repetimos el muestreo un gran número
de veces y definimos un intervalo alrededor de cada valor
del estadístico muestral, el parámetro se sitúa dentro de
cada intervalo en un porcentaje conocido de ocasiones. Este
intervalo es denominado "intervalo de confianza".
12. Ejemplo
Animales infectados: n1=13 X1 = 972.1 S1 = 245.1
Animales no infectados: n1=16 X1 = 843.4 S1 = 251.2
Se trata de comparar dos poblaciones: P1, lagartos infectados con el parásito, y P2, lagartos no
infectados. Concretamente, nos interesa comparar las medias poblacionales. En consecuencia,
buscamos Iµ1-µ2.
Asumimos que las varianzas poblacionales NO son conocidas. Para verificar si pueden considerarse
iguales o no, como , calculamos S2 > S1
Un grupo de investigadores de Ecología midieron la concentración de células rojas en la
sangre de 29 lagartos capturados en el campo. También observaron si los lagartos estaban
infectados por el parásito de Malaria. Los recuentos de células rojas proporcionaron los
siguientes valores.
13. Pruebas de
Hipótesis
Una prueba de hipótesis es un procedimiento,
con el que se busca tomar una decisión sobre
el valor de verdad de una hipótesis estadística.
Al realizar una prueba de hipótesis decidimos
si rechazar o no rechazar esa hipótesis
estadística, Basando la decisión en la
evidencia muestral.
14. Proceso de la prueba de
hipótesis
• Afirmación Inicial
• Afirmación Alternativa (Negación de la inicial)
Recolección de evidencia muestral relacionada con las
informaciones
De acuerdo a la evidencia muestral se decide si
rechazar o no la afirmación inicial.
15. Ejemplo
Un fabricante de pintura de secado rápido afirma que el tiempo de secado de la misma es de 20 min. El
comprador diseña el siguiente experimento: pinta 36 tableros y decide rechazar el producto si el
promedio de tiempo de secado de los mismos supera los 20.75 min. Si por experiencia õ=2.4 min, se
pregunta cuál es la probabilidad de rechazar la partida aún perteneciendo a una población con media
de 20 min.
La probabilidad de que el promedio de las muestras exceda 20.75 min a causa del azar se calcula del
siguiente modo:
16. con la z anterior, se calcula la probabilidad (área hacia la derecha), resultando 0.0304.
Gráficamente:
Este gráfico está hecho sobre valores reales, no normalizados. Para los cálculo se usan estos últimos
cuando se trabaja con tablas. Entonces, la probabilidad de rechazar erróneamente la hipótesis µ=20
min es de aproximadamente 0.03, o bien 3%.