Este documento describe diferentes tipos de distribuciones estadísticas, incluyendo: 1) la distribución normal, que tiene forma de campana y se utiliza para modelar muchos fenómenos naturales; 2) la distribución binomial, que describe experimentos con dos resultados posibles; y 3) la distribución de Poisson, que modela el número de eventos que ocurren en un intervalo de tiempo o espacio.
2. Distribución normal
Gran número de distribuciones tienen la forma de una campana; es
decir, alejándonos de la media, a derecha e izquierda, el número de
observaciones decrece de forma similar. Esto genera una curva
simétrica.
Se estudió su ecuación, resultando en función de la media y desviación
típica de la distribución. Ante las infinitas posibles medias y
desviaciones, nos encontramos con una infinidad de posibles
distribuciones
normales pero, el proceso de tipificación, permite reducirlas a una única
con media 0 y desviación típica 1. Tal distribución se denomina normal
tipificada y se representa N(0,1). En términos de probabilidad, definimos
igualmente la variable aleatoria normal, como aquella que tiene por
gráfica de su
función de densidad la representada a la izquierda.
El área bajo la curva será igual a la unidad y, con este criterio se
confeccionaron tablas estadísticas que calculan el área para un
cierto intervalo de valores de la variable
3. Distribución normal
estandarizada (tipificación)
la distribución normal estándar, la cual tiene las siguientes tres propiedades:
1. presenta forma de campana
2. posee una media igual a 0;
3. tiene una desviación estándar igual a 1.
En estadística y probabilidad se llama distribución normal, distribución de
Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable
continua que con más frecuencia aparece aproximada en fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto
de un determinado parámetro estadístico. Esta curva se conoce como campana de
Gauss y es el gráfico de una función gaussiana.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos
naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran
parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse
asumiendo que cada observación se obtiene como la suma de unas pocas causas
independientes.
4. Distribución normal estándar
N(0, 1)
La distribución normal estándar, o tipificada o reducida, es aquella que
tiene pormedia el valor cero, μ =0, y por desviación típica la unidad, σ =1.
La probabilidad de la variable X dependerá del área del recinto
sombreado en la figura. Y para calcularla utilizaremos una tabla.
Tipificación de la variable
Para poder utilizar la tabla tenemos que transformar la variable X que sigue
una distribución N(μ, σ) en otra variable Z que siga una distribución N(0, 1).
5. Ejemplos
¿Cuál es la probabilidad de que una persona
que se presenta el examen obtenga una
calificación superior a 72?
6. ¿Cuál es la probabilidad de que entre 35 y 40 hogares tenga cuando
menos dos televisores?
7. Tablas de los porcentajes por debajo de
la curva normal
8. Distribución binomial
Las características de esta distribución son:
a) En los experimentos que tienen este tipo de
distribución, siempre se esperan dos tipos de resultados,
ejem. Defectuoso, no defectuoso, pasa, no pasa, etc,
etc., denominados arbitrariamente “éxito” (que es lo que
se espera que ocurra) o “fracaso” (lo contrario del éxito).
b) Las probabilidades asociadas a cada uno de estos
resultados son constantes, es decir no cambian.
c) Cada uno de los ensayos o repeticiones del
experimento son independientes entre sí.
d) El número de ensayos o repeticiones del
experimento (n) es constante.
9. Ejemplos
A partir de un ejemplo. Desarrollaremos una fórmula que nos permita cualquier
problema que tenga este tipo de distribución.
Ejemplo:
Se lanza al aire una moneda normal 3 veces, determine la probabilidad de que
aparezcan 2 águilas.
Solución:
Antes de empezar a resolver este problema, lo primero que hay que hacer es
identificarlo como un problema que tiene una distribución binomial, y podemos
decir que efectivamente así es, ya que se trata de un experimento en donde solo
se pueden esperar dos tipos de resultados al lanzar la moneda, águila o sello,
cutas probabilidades de ocurrencia son constantes, cada uno de los lanzamientos
es independiente de los demás y el número de ensayos o repeticiones del
experimento son constantes, n = 3.
Para dar solución a este problema, lo primero que hay que hacer es un diagrama
de árbol, en donde representaremos los tres lanzamientos, de ahí se obtendrá el
espacio muestral y posteriormente la probabilidad pedida, usando la fórmula
correspondiente.
11. Distribución de bernoulli
Consiste en realizar un experimento aleatorio una sóla vez y observar si
cierto suceso ocurre o no, siendo p la probabilidad de que esto sea
así (éxito) y q=1-p el que no lo sea (fracaso). En realidad no se trata más que
de una variable dicotómica, es decir que únicamente puede tomar dos
modalidades, es por ello que el hecho de llamar éxito o fracaso a los posibles
resultados de las pruebas obedece más una tradición literaria o histórica, en
el estudio de las v.a., que a la situación real que pueda derivarse del
resultado. Podríamos por tanto definir este experimento mediante una v.a.
discreta Xque toma los valores X=0 si el suceso no ocurre, yX=1 en caso
contrario, y que se denota
12. Experimento de Bernoulli: solo son posibles dos resultados: éxito o fracaso. Podemos
definir una variable aleatoria
discreta X tal que:
éxito 1
fracaso 0
Si la probabilidad de éxito es p y la de
fracaso 1 - p, podemos construir una
función de probabilidad
Un típico experimento de Bernoulli es el lanzamiento de
una moneda con probabilidad p para cara y (1-p) para cruz
Función de
distribución 1 p, para x 0
F ( x)
1, para x 1
13. Distribución de poisson
Características:
En este tipo de experimentos los éxitos buscados son expresados por
unidad de área, tiempo, pieza, etc, etc,:
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por día, hora, minuto,
etc, etc.
- # de bacterias por cm2 de cultivo
- # de llamadas telefónicas a un conmutador por hora, minuto, etc,
etc.
- # de llegadas de embarcaciones a un puerto por día, mes, etc, etc.
Para determinar la probabilidad de que ocurran x éxitos por unidad
de tiempo, área, o producto, la fórmula a utilizar sería:
14. donde:
p(x, ) = probabilidad de que ocurran x éxitos, cuando el número
promedio de ocurrencia de ellos es l
= media o promedio de éxitos por unidad de tiempo, área o producto
e = 2.718
x = variable que nos denota el número de éxitos que se desea que ocurra
Ejemplos:
Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son
donde:es
las probabilidades de que reciba, a) por unidad de tiempo, área oun día
= media o promedio de éxitos cuatro cheques sin fondo en producto
dado, b) 10 cheques sin fondos en cualquiera de dos días consecutivos?
= 2.718
x = variable que nos denota el número de éxitos que se desea que ocurra
Solución:
a) x = variable que nos define el número de cheques sin fondo que
llegan al banco en un día cualquiera = 0, 1, 2, 3, ....., etc, etc.
l = 6 cheques sin fondo por día
e = 2.718
15. Distribución exponencial
La variable aleatoria exponencial, es el tiempo que transcurre hasta que se
da el primer evento de Poisson. Es decir, la distribución exponencial puede
modelar el lapso entre dos eventos consecutivos de Poisson que ocurren de
manera independiente y a una frecuencia constante. Esta distribución se
emplea con bastante frecuencia con objeto de modelar problemas del tipo
"tiempo - falla" y como modelo para el estudio de intervalos en problemas
de espera; por ejemplo, la duración de componentes electrónicos.
Posteriormente se demostrará que la distribución exponencial no tiene
memoria, es decir, la probabilidad de ocurrencia de eventos presentes o
futuros no depende de los que hayan ocurrido en el pasado. De esta forma,
la probabilidad de que una unidad falle en un lapso específico depende nada
más de la duración de éste y no del tiempo en que la unidad ha estado en
operación .
16. Distribución T de student
En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que
surge del problema de estimar la media de una población normalmente distribuida cuando el
tamaño de la muestra es pequeño. Surge, en la mayoría de los estudios estadísticos prácticos,
cuando la desviación típica de una población se desconoce y debe ser estimada a partir de los
datos de una muestra.
Existen dos versiones de la prueba t-Student: una que supone que las varianzas poblacionales son
iguales y otra versión que no asume esto último. Para decidir si se puede suponer o no la igualdad
de varianza en las dos poblaciones, se debe realizar previamente la prueba F-Snedecor de
comparación de dos varianzas.
Un poco de historia.
La prueba t-Student fue desarrollada en 1899 1908 (dato corregido gracias a un usuario del blog)
por el químico inglés William Sealey Gosset (1876-1937), mientras trabajaba en técnicas de control
de calidad para las destilerías Guiness en Dublín . Debido a que en la destilería, su puesto de
trabajo no era inicialmente de estadístico y su dedicación debía estar exclusivamente encaminada
a mejorar los costes de producción, publicó sus hallazgos anónimamente firmando sus artículos
con el nombre de "Student".
17. intervalos de confianza derivados de la distribución
t de Student
El procedimiento para el cálculo del intervalo de
confianza basado en la t de Student consiste en
estimar la desviación típica de los datos S y calcular el
error estándar de la media= S/(raíz cuadrada de n),
siendo entonces el intervalo de confianza para la
media = x media +- t (alfa/2) multiplicado por (S/(raíz
cuadradada de n)).
Si μ es una constante Es este resultado el que se utiliza en el test de
no nula, el cociente es Student: puesto que la diferencia de las medias de
una variable aleatoria muestras de dos distribuciones normales se distribuye
que sigue la también normalmente, la distribución t puede usarse
distribución t de para examinar si esa diferencia puede
Student no central razonablemente suponerse igual a cero.
con parámetro de no- para efectos prácticos el valor esperado y la varianza
centralidad μ. son :
E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para > 3