SlideShare una empresa de Scribd logo
1 de 7
Distribución Normal
Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas.
Su propio nombre indica su extendida utilización, justificada por las frecuencia o normalidad con la que las ciertos
fenómenos tienden a parecerse en su comportamiento a esta distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana.
En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a
fenómenos naturales que siguen el modelo de la normal.
- Caracteres morfológicos de individuos (personas, animales, plantas,…) de una especie.
Por ejemplo: tallas, pesos, envergaduras, diámetros, perímetros,…
- Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono.
- Caracteres sociológicos, por ejemplo: consciente intelectual, grado de adaptación a un medio.
- Errores cometidos al medir ciertas magnitudes.
- Valores estadísticos maestrales, por ejemplo: la media.
- Otras distribuciones como la binomial o la Poisson son aproximaciones normales.
Y en general cualquier característica que se obtenga como suma de mucho factores.




1.
3. Función De Densidad
Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función de densidad que
corresponde a tales distribuciones viene dando por la fórmula




Puede tomar cualquier valor (- ∞ ,+ ∞ )
Son más probables los valores cercanos a uno central que llamados media
Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de igual forma a derecha e izquierda (es
simétrica).
Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de forma más o menos rápida dependiendo
de un parámetro s , que es la desviación típica.
Muestreo
En estadística, es el proceso por el cual se seleccionan los individuos que formarán una muestra.
Para que se puedan obtener conclusiones fiables para la población a partir de la muestra, es importante tanto su
tamaño como el modo en que han sido seleccionados los individuos que la componen.
El tamaño de la muestra depende de la precisión que se quiera conseguir en la estimación que se realice a partir de
ella. Para su determinación se requieren técnicas estadísticas superiores, pero resulta sorprendente cómo, con
muestras notablemente pequeñas, se pueden conseguir resultados suficientemente precisos
Para seleccionar los individuos de la muestra es fundamental proceder aleatoriamente, es decir, decidir al azar qué
individuos de entre toda la población forma parte de la muestra.
Si se procede como si de un sorteo se tratara, eligiendo directamente de la población sin ningún otro condicionante,
el muestreo se llama aleatorio simple o irrestrictamente aleatorio.
Cuando la población se puede subdividir en clases (estratos) con características especiales, se puede mostrar de modo
que el número de individuos de cada estrato en la muestra mantenga la proporción que existía en la población. Una
vez fijado el número que corresponde a cada estrato, los individuos se designan aleatoriamente. Este tipo de muestreo
se denomina aleatorio estratificado con asignación proporcional.
Las inferencias realizadas mediante muestras seleccionadas aleatoriamente están sujetas a errores, llamados errores de
muestreo, que están controlados. Si la muestra está mal elegida - no es significativa - se producen errores sistemáticos
no controlados.
Métodos De Muestreo
Existen dos métodos de muestreo:
El muestreo probabilístico y no probabilístico
Métodos de muestreo probabilístico
Los métodos de muestreo probabilísticas son aquéllos que se basan en el principio de equiprobabilidad. Es decir,
aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una
muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas.
Sólo estos métodos de muestreo probabilísticas nos aseguran la representatividad de la muestra extraída y son, por
tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticas encontramos los siguientes tipos:
Muestreo aleatorio simple
El procedimiento es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio
mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora
u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos
manejando es muy grande.
Muestreo aleatorio sistemático
Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n
números aleatorios solo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los
elementos que integran la muestras son los que ocupan los lugares i ,i+k, i+2k, i+3k,…,i+(n-1)k, es decir se toman los
individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=N/n.
el número i que empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo de este tipo de muestreo está en los casos en que se dan periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10
individuos en los que los 5 primeros son varones y los últimos 5 son mujeres, si empleamos un muestreo aleatorio
sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación
de los dos sexos.
Muestreo aleatorio estratificado.
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos)
que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión,
el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse
de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los
elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado
grandes, pues exige un conocimiento detallado de la población. (tamaño geográfico, sexos, edades…).
La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes
tipos:
Afijación simple
A cada estrato le corresponde igual número de elementos maestrales.
Afijación proporcional
La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.
Muestreo aleatorio por conglomerados
Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es
decir, que las unidades maestrales son los elementos de la población. En el muestreo por conglomerados la unidad
muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las
unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados
naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de
"muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (el
necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a
los conglomerados elegidos.
Para finalizar con esta exposición de los métodos de muestreo probabilístico es necesario comentar que ante lo
compleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos es muy común emplear lo
que se denomina muestreo polietápico. Este tipo de muestreo se caracteriza por operar en sucesivas etapas,
empleando en cada una de ellas el método de muestreo probabilístico más adecuado.
Error Muestral
De estimación o estándar. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de al
variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de
hasta donde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido
por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará
hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que
varían muestra a muestra). Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos
decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.


Cuando se utilizan valores muestrales, o estadísticos para estimar valores poblacionales, o parámetros, pueden
ocurrir dos tipos generales de errores: el error muestral y el error no muestral.
El error muestral se refiere a la variación natural existente entre muestras tomadas de la misma población.
Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran cuidado para asegurar que dos
muestras del mismo tamaño sean representativas de una cierta población, no esperaríamos que las dos sean idénticas
en todos sus detalles. El error muestral es un concepto importante que ayudará a entender mejor la naturaleza de la
estadística inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores muestrales y se denominan
errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia sistemática
inherente a un método de muestreo que da estimaciones de un parámetro que son, en promedio, menores (sesgo
negativo), o mayores (sesgo positivo) que el parámetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización.
La aleatorización se refiere a cualquier proceso de selección de una muestra de la población en el que la selección
es imparcial o no está sesgada; una muestra elegida con procedimientos aleatorios se llama muestra aleatoria.
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio simple, el muestreo
estratificado, el muestreo por conglomerados y el muestreo sistemático.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan la misma probabilidad de
ser seleccionados, la llamamos muestra aleatoria simple.
Error Muestral
Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media poblacional μ, entonces la
media muestral, como medida, conlleva algún error. Por ejemplo, supongamos que se ha obtenido una muestra
aleatoria de tamaño 25 de una población con media μ = 15: si la media de la muestra es x =12, entonces a la
diferencia observada x - μ = -3 se le denomina el error muestral. Una media muestral x puede pensarse como la
suma de dos cantidades, la media poblacional μ y el error muestral; si e denota el error muestral, entonces:
 x = μ+e
Ejemplo 1.5
Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6, para simular una población
"grande" de manera que el muestreo pueda realizarse un gran número de veces, supondremos que éste se hace con
reemplazo, es decir, el número elegido se reemplaza antes de seleccionar el siguiente, además, se seleccionan
muestras ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones es importante, por
tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccionó primero 4
y después 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es posible
seleccionar con reemplazo y también contiene las medias muestrales y los correspondientes errores muestrales. La
media poblacional es igual a
μ= (2+4+6)/3 = 4. Ver la tabla en la siguiente página.
Nótese las interesantes relaciones siguientes contenidas en la tabla:
La media de la colección de medias muestrales es 4, la media de la población de la que se extraen las muestras. Si μ x
denota la media de todas las medias muestrales entonces tenemos:
μ x = (3+4+3+4+5+5+2+4+6)/9 = 4
La suma de los errores muestrales es cero.
e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0
Muestras ordenadas                 x                            Error muestral e = x - μ


(2,2)                              2                            2 – 4 = -2

(2,4)                              3                            3 – 4 = -1
(2,6)                               4                           4–4=0

(4,2)                               3                           3 – 4 = -1

(4,4)                               4                           4–4=0

(4,6)                               5                           5–4=1

(6,2)                               4                           4–4=0

(6,4)                               5                           5–4=1

(6,6)                               6                           6–4=2
En consecuencia, si x se usa para medir, estimar, la media poblacional μ, el promedio de todos los errores muestrales
es cero.
Distribuciones Muestrales
Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se esperaría que
dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la misma media muestral o que
sean completamente parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado a partir
de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la
distribución de todos los valores posibles de un estadístico. Tales distribuciones serán muy importantes en el estudio
de la estadística inferencial, porque las inferencias sobre las poblaciones se harán usando estadísticas muestrales.
Como el análisis de las distribuciones asociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de un
estadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional desconocido.
Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se le puede considerar como
una variable aleatoria con su correspondiente distribución de frecuencias.
La distribución de frecuencia de un estadístico muestral se denomina distribución muestral. En general, la
distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras
del mismo tamaño.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la madia
muestral x para cada muestra; la colección de todas estas medias muestrales recibe el nombre de distribución
muestral de medias, lo que se puede ilustrar en la siguiente figura:




Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se calcula la desviación estándar
de cada una. La colección de todas estas desviaciones estándar muestrales se llama distribución muestral de la
desviación estándar, y lo podemos ver en la siguiente figura:
Ejemplo 1.6
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6. Encuentre:
μ, la media poblaciona.
σ, la desviación estándar poblacional.
μ x, la media de la distribución muestral de medias.
σ, la desviación estándar de la distribución muestral de medias.
Además, grafique las frecuencias para la población y para la distribución muestral de medias.
Solución:
a. La media poblacional es:




b.   La desviación estándar de la población es:



c.   A continuación se listan los elementos de la distribución muestral de la media y la correspondiente distribución de
     frecuencias.
La media de la distribución muestral de medias es:



d) La desviación estándar de la distribución muestral de medias es:




                                                                                                          De aquí


que podamos deducir que:
Como para cualquier variable aleatoria, la dsitribución muestral de medias tiene una media o valor esperado, una
varianza y una desviación estándar, se puede demostrar que la distribución muestral de medias tiene una media igual a
la media poblacional. Esto es:

Distribuciones muestrales
Después de haber realizado el ejercicio anterior se puede ver que una distribución muestral se genera extrayendo
todas las posibles muestras del mismo tamaño de la población y calculándoles a éstas su estadístico.
Si la población de la que se extraen las muestras es normal, la distribución muestral de medias será normal sin
importar el tamaño de la muestra.




Si la población de donde se extraen las muestras no es normal, entonces el tamaño de la muestra debe ser mayor o
igual a 30, para que la distribución muestral tenga una forma acampanada. Mientras mayor sea el tamaño de la muestra,
más cerca estará la distribución muestral de ser normal.
Para muchos propósitos, la aproximación normal se considera buena si se cumple n=30. La forma de la distribución
muestral de medias sea aproximadamente normal, aún en casos donde la población original es bimodal, es realmente
notable.




Distribución de los errores de muestreo

e = x −µ
E(e ) = E( x ) − µ = 0


σ 2 (e) = σ 2 ( x ) = σ 2 / n

Luego si x∼ N(μ, σ2)            e∼ N(o, σ2/n)

Más contenido relacionado

La actualidad más candente

Conceptos BáSicos Estadisticos (Medicion)
Conceptos BáSicos Estadisticos (Medicion)Conceptos BáSicos Estadisticos (Medicion)
Conceptos BáSicos Estadisticos (Medicion)guestfa728c
 
Odonto. 9na muestreo y tamaño de muestra
Odonto. 9na muestreo  y tamaño de muestraOdonto. 9na muestreo  y tamaño de muestra
Odonto. 9na muestreo y tamaño de muestraUniv Peruana Los Andes
 
Clase 2 Curso: Analisis Exploratorio de Datos y Probabilidades
Clase 2 Curso: Analisis Exploratorio de Datos y ProbabilidadesClase 2 Curso: Analisis Exploratorio de Datos y Probabilidades
Clase 2 Curso: Analisis Exploratorio de Datos y ProbabilidadesPablo Ramos
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptivawillypi
 
Informe sobre Estadistica Descriptiva
Informe sobre Estadistica DescriptivaInforme sobre Estadistica Descriptiva
Informe sobre Estadistica DescriptivaJesus Paredes
 
Métodos de Recolección y organización de Datos (MROD)
Métodos de Recolección y organización de Datos (MROD)Métodos de Recolección y organización de Datos (MROD)
Métodos de Recolección y organización de Datos (MROD)Euclides López
 
Conceptos basicos de estadistica
Conceptos basicos de estadisticaConceptos basicos de estadistica
Conceptos basicos de estadisticaJuci Méndez
 
CONCEPTOS BASICOS ESTADISTICA DESCRIPTIVA
CONCEPTOS BASICOS  ESTADISTICA DESCRIPTIVACONCEPTOS BASICOS  ESTADISTICA DESCRIPTIVA
CONCEPTOS BASICOS ESTADISTICA DESCRIPTIVAAlejandra96r
 
Estadistica inferencial, matematica
Estadistica inferencial, matematicaEstadistica inferencial, matematica
Estadistica inferencial, matematicaemelyreina
 
Estadistica
EstadisticaEstadistica
Estadisticawillaris
 
Aspectos básicos de estadística
Aspectos básicos de estadísticaAspectos básicos de estadística
Aspectos básicos de estadísticaStoka Nekus
 
Estadistica tratamiento estadistico de datos
Estadistica    tratamiento estadistico de datosEstadistica    tratamiento estadistico de datos
Estadistica tratamiento estadistico de datosVelmuz Buzz
 

La actualidad más candente (19)

EstadíStica Inferencial
EstadíStica InferencialEstadíStica Inferencial
EstadíStica Inferencial
 
INFERENCIA ESTADISTICA
INFERENCIA ESTADISTICAINFERENCIA ESTADISTICA
INFERENCIA ESTADISTICA
 
Conceptos BáSicos Estadisticos (Medicion)
Conceptos BáSicos Estadisticos (Medicion)Conceptos BáSicos Estadisticos (Medicion)
Conceptos BáSicos Estadisticos (Medicion)
 
Odonto. 9na muestreo y tamaño de muestra
Odonto. 9na muestreo  y tamaño de muestraOdonto. 9na muestreo  y tamaño de muestra
Odonto. 9na muestreo y tamaño de muestra
 
Clase 2 Curso: Analisis Exploratorio de Datos y Probabilidades
Clase 2 Curso: Analisis Exploratorio de Datos y ProbabilidadesClase 2 Curso: Analisis Exploratorio de Datos y Probabilidades
Clase 2 Curso: Analisis Exploratorio de Datos y Probabilidades
 
Introducción a la estadística
Introducción a la estadísticaIntroducción a la estadística
Introducción a la estadística
 
Estadistica ii
Estadistica iiEstadistica ii
Estadistica ii
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Informe sobre Estadistica Descriptiva
Informe sobre Estadistica DescriptivaInforme sobre Estadistica Descriptiva
Informe sobre Estadistica Descriptiva
 
Métodos de Recolección y organización de Datos (MROD)
Métodos de Recolección y organización de Datos (MROD)Métodos de Recolección y organización de Datos (MROD)
Métodos de Recolección y organización de Datos (MROD)
 
Conceptos basicos de estadistica
Conceptos basicos de estadisticaConceptos basicos de estadistica
Conceptos basicos de estadistica
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
CONCEPTOS BASICOS ESTADISTICA DESCRIPTIVA
CONCEPTOS BASICOS  ESTADISTICA DESCRIPTIVACONCEPTOS BASICOS  ESTADISTICA DESCRIPTIVA
CONCEPTOS BASICOS ESTADISTICA DESCRIPTIVA
 
Odonto 2da clase tablas y gráficos
Odonto 2da clase tablas y gráficosOdonto 2da clase tablas y gráficos
Odonto 2da clase tablas y gráficos
 
Estadistica inferencial, matematica
Estadistica inferencial, matematicaEstadistica inferencial, matematica
Estadistica inferencial, matematica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Aspectos básicos de estadística
Aspectos básicos de estadísticaAspectos básicos de estadística
Aspectos básicos de estadística
 
Psico 2da clase tablas y gráficos
Psico 2da clase tablas y gráficosPsico 2da clase tablas y gráficos
Psico 2da clase tablas y gráficos
 
Estadistica tratamiento estadistico de datos
Estadistica    tratamiento estadistico de datosEstadistica    tratamiento estadistico de datos
Estadistica tratamiento estadistico de datos
 

Similar a Distribución normal

Similar a Distribución normal (20)

Elmuestreo
ElmuestreoElmuestreo
Elmuestreo
 
(268083723) el muestreo
(268083723) el muestreo(268083723) el muestreo
(268083723) el muestreo
 
elmuestreo.pdf
elmuestreo.pdfelmuestreo.pdf
elmuestreo.pdf
 
El muestreo (1)
El muestreo (1)El muestreo (1)
El muestreo (1)
 
Elmuestreo
ElmuestreoElmuestreo
Elmuestreo
 
Elmuestreo
ElmuestreoElmuestreo
Elmuestreo
 
Elmuestreo
ElmuestreoElmuestreo
Elmuestreo
 
El muestreo
El muestreoEl muestreo
El muestreo
 
Elmuestreo
ElmuestreoElmuestreo
Elmuestreo
 
Elmuestreo
ElmuestreoElmuestreo
Elmuestreo
 
Elmuestreo
ElmuestreoElmuestreo
Elmuestreo
 
Conceptos generales del muestreo del trabajo
Conceptos generales del muestreo del trabajoConceptos generales del muestreo del trabajo
Conceptos generales del muestreo del trabajo
 
El muestreo
El muestreoEl muestreo
El muestreo
 
Distribución normal estadistica aplicada
Distribución normal estadistica aplicadaDistribución normal estadistica aplicada
Distribución normal estadistica aplicada
 
Distribución normal estadistica aplicada
Distribución normal estadistica aplicadaDistribución normal estadistica aplicada
Distribución normal estadistica aplicada
 
Tipos de muestreo
Tipos de muestreoTipos de muestreo
Tipos de muestreo
 
5to ccll estadistica
5to ccll estadistica5to ccll estadistica
5to ccll estadistica
 
Estimar con estadística v1
Estimar con estadística v1Estimar con estadística v1
Estimar con estadística v1
 
METODOS DE MUESTREO
METODOS DE MUESTREOMETODOS DE MUESTREO
METODOS DE MUESTREO
 
Estadistica ii expo
Estadistica ii expoEstadistica ii expo
Estadistica ii expo
 

Distribución normal

  • 1. Distribución Normal Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su extendida utilización, justificada por las frecuencia o normalidad con la que las ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana. En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal. - Caracteres morfológicos de individuos (personas, animales, plantas,…) de una especie. Por ejemplo: tallas, pesos, envergaduras, diámetros, perímetros,… - Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono. - Caracteres sociológicos, por ejemplo: consciente intelectual, grado de adaptación a un medio. - Errores cometidos al medir ciertas magnitudes. - Valores estadísticos maestrales, por ejemplo: la media. - Otras distribuciones como la binomial o la Poisson son aproximaciones normales. Y en general cualquier característica que se obtenga como suma de mucho factores. 1. 3. Función De Densidad Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función de densidad que corresponde a tales distribuciones viene dando por la fórmula Puede tomar cualquier valor (- ∞ ,+ ∞ ) Son más probables los valores cercanos a uno central que llamados media Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simétrica). Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de forma más o menos rápida dependiendo de un parámetro s , que es la desviación típica. Muestreo En estadística, es el proceso por el cual se seleccionan los individuos que formarán una muestra. Para que se puedan obtener conclusiones fiables para la población a partir de la muestra, es importante tanto su tamaño como el modo en que han sido seleccionados los individuos que la componen. El tamaño de la muestra depende de la precisión que se quiera conseguir en la estimación que se realice a partir de ella. Para su determinación se requieren técnicas estadísticas superiores, pero resulta sorprendente cómo, con muestras notablemente pequeñas, se pueden conseguir resultados suficientemente precisos Para seleccionar los individuos de la muestra es fundamental proceder aleatoriamente, es decir, decidir al azar qué individuos de entre toda la población forma parte de la muestra. Si se procede como si de un sorteo se tratara, eligiendo directamente de la población sin ningún otro condicionante, el muestreo se llama aleatorio simple o irrestrictamente aleatorio. Cuando la población se puede subdividir en clases (estratos) con características especiales, se puede mostrar de modo que el número de individuos de cada estrato en la muestra mantenga la proporción que existía en la población. Una vez fijado el número que corresponde a cada estrato, los individuos se designan aleatoriamente. Este tipo de muestreo
  • 2. se denomina aleatorio estratificado con asignación proporcional. Las inferencias realizadas mediante muestras seleccionadas aleatoriamente están sujetas a errores, llamados errores de muestreo, que están controlados. Si la muestra está mal elegida - no es significativa - se producen errores sistemáticos no controlados. Métodos De Muestreo Existen dos métodos de muestreo: El muestreo probabilístico y no probabilístico Métodos de muestreo probabilístico Los métodos de muestreo probabilísticas son aquéllos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticas nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticas encontramos los siguientes tipos: Muestreo aleatorio simple El procedimiento es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande. Muestreo aleatorio sistemático Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios solo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestras son los que ocupan los lugares i ,i+k, i+2k, i+3k,…,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=N/n. el número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo de este tipo de muestreo está en los casos en que se dan periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los últimos 5 son mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos. Muestreo aleatorio estratificado. Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (tamaño geográfico, sexos, edades…). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos: Afijación simple A cada estrato le corresponde igual número de elementos maestrales. Afijación proporcional La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato. Muestreo aleatorio por conglomerados Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades maestrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos. Para finalizar con esta exposición de los métodos de muestreo probabilístico es necesario comentar que ante lo compleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos es muy común emplear lo que se denomina muestreo polietápico. Este tipo de muestreo se caracteriza por operar en sucesivas etapas, empleando en cada una de ellas el método de muestreo probabilístico más adecuado.
  • 3. Error Muestral De estimación o estándar. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de al variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta donde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad. Cuando se utilizan valores muestrales, o estadísticos para estimar valores poblacionales, o parámetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral. El error muestral se refiere a la variación natural existente entre muestras tomadas de la misma población. Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran cuidado para asegurar que dos muestras del mismo tamaño sean representativas de una cierta población, no esperaríamos que las dos sean idénticas en todos sus detalles. El error muestral es un concepto importante que ayudará a entender mejor la naturaleza de la estadística inferencial. Los errores que surgen al tomar las muestras no pueden clasificarse como errores muestrales y se denominan errores no muestrales. El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia sistemática inherente a un método de muestreo que da estimaciones de un parámetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parámetro real. El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización. La aleatorización se refiere a cualquier proceso de selección de una muestra de la población en el que la selección es imparcial o no está sesgada; una muestra elegida con procedimientos aleatorios se llama muestra aleatoria. Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemático. Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple. Error Muestral Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media poblacional μ, entonces la media muestral, como medida, conlleva algún error. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamaño 25 de una población con media μ = 15: si la media de la muestra es x =12, entonces a la diferencia observada x - μ = -3 se le denomina el error muestral. Una media muestral x puede pensarse como la suma de dos cantidades, la media poblacional μ y el error muestral; si e denota el error muestral, entonces: x = μ+e Ejemplo 1.5 Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6, para simular una población "grande" de manera que el muestreo pueda realizarse un gran número de veces, supondremos que éste se hace con reemplazo, es decir, el número elegido se reemplaza antes de seleccionar el siguiente, además, se seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccionó primero 4 y después 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es posible seleccionar con reemplazo y también contiene las medias muestrales y los correspondientes errores muestrales. La media poblacional es igual a μ= (2+4+6)/3 = 4. Ver la tabla en la siguiente página. Nótese las interesantes relaciones siguientes contenidas en la tabla: La media de la colección de medias muestrales es 4, la media de la población de la que se extraen las muestras. Si μ x denota la media de todas las medias muestrales entonces tenemos: μ x = (3+4+3+4+5+5+2+4+6)/9 = 4 La suma de los errores muestrales es cero. e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0 Muestras ordenadas x Error muestral e = x - μ (2,2) 2 2 – 4 = -2 (2,4) 3 3 – 4 = -1
  • 4. (2,6) 4 4–4=0 (4,2) 3 3 – 4 = -1 (4,4) 4 4–4=0 (4,6) 5 5–4=1 (6,2) 4 4–4=0 (6,4) 5 5–4=1 (6,6) 6 6–4=2 En consecuencia, si x se usa para medir, estimar, la media poblacional μ, el promedio de todos los errores muestrales es cero. Distribuciones Muestrales Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores posibles de un estadístico. Tales distribuciones serán muy importantes en el estudio de la estadística inferencial, porque las inferencias sobre las poblaciones se harán usando estadísticas muestrales. Como el análisis de las distribuciones asociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de un estadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional desconocido. Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribución de frecuencias. La distribución de frecuencia de un estadístico muestral se denomina distribución muestral. En general, la distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras del mismo tamaño. Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la madia muestral x para cada muestra; la colección de todas estas medias muestrales recibe el nombre de distribución muestral de medias, lo que se puede ilustrar en la siguiente figura: Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se calcula la desviación estándar de cada una. La colección de todas estas desviaciones estándar muestrales se llama distribución muestral de la desviación estándar, y lo podemos ver en la siguiente figura:
  • 5. Ejemplo 1.6 Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6. Encuentre: μ, la media poblaciona. σ, la desviación estándar poblacional. μ x, la media de la distribución muestral de medias. σ, la desviación estándar de la distribución muestral de medias. Además, grafique las frecuencias para la población y para la distribución muestral de medias. Solución: a. La media poblacional es: b. La desviación estándar de la población es: c. A continuación se listan los elementos de la distribución muestral de la media y la correspondiente distribución de frecuencias.
  • 6. La media de la distribución muestral de medias es: d) La desviación estándar de la distribución muestral de medias es: De aquí que podamos deducir que: Como para cualquier variable aleatoria, la dsitribución muestral de medias tiene una media o valor esperado, una varianza y una desviación estándar, se puede demostrar que la distribución muestral de medias tiene una media igual a la media poblacional. Esto es: Distribuciones muestrales Después de haber realizado el ejercicio anterior se puede ver que una distribución muestral se genera extrayendo todas las posibles muestras del mismo tamaño de la población y calculándoles a éstas su estadístico. Si la población de la que se extraen las muestras es normal, la distribución muestral de medias será normal sin importar el tamaño de la muestra. Si la población de donde se extraen las muestras no es normal, entonces el tamaño de la muestra debe ser mayor o igual a 30, para que la distribución muestral tenga una forma acampanada. Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución muestral de ser normal.
  • 7. Para muchos propósitos, la aproximación normal se considera buena si se cumple n=30. La forma de la distribución muestral de medias sea aproximadamente normal, aún en casos donde la población original es bimodal, es realmente notable. Distribución de los errores de muestreo e = x −µ E(e ) = E( x ) − µ = 0 σ 2 (e) = σ 2 ( x ) = σ 2 / n Luego si x∼ N(μ, σ2) e∼ N(o, σ2/n)