El documento explica conceptos clave sobre distribuciones de probabilidad, incluyendo distribuciones binomiales, de Bernoulli, de Poisson y normales. Describe cómo calcular probabilidades para variables aleatorias que siguen estas distribuciones y provee ejemplos numéricos.
1. Universidad Tecnológica De Torreón
Procesos Industriales Área Manufactura
Estadística
“Trabajo final de la unidad dos”
Distribuciones de probabilidad
Alejandra Ríos Zamora
2°D
Lic. Edgar Gerardo Mata Ortiz
2. Distribuciones de probabilidad
En teoría de la probabilidad y estadística, la distribución de probabilidad de una
variable aleatoria es una función que asigna a cada suceso definido sobre la
variable aleatoria la probabilidad de que dicho suceso ocurra. La distribución de
probabilidad está definida sobre el conjunto de todos los sucesos, cada uno de los
sucesos es el rango de valores de la variable aleatoria.
Cuando la variable aleatoria toma valores en el conjunto de los números reales, la
distribución de probabilidad está completamente especificada por la función de
distribución, cuyo valor en cada real x es la probabilidad de que la variable
aleatoria sea menor o igual que x.
Por lo tanto una distribución de probabilidad indica toda la gama de valores que
pueden representarse como resultado de un experimento si éste se llevase a
cabo. Es decir, describe la probabilidad de que un evento se realice en el futuro,
constituye una herramienta fundamental para la prospectiva, puesto que se puede
diseñar un escenario de acontecimientos futuros considerando las tendencias
actuales de diversos fenómenos naturales.
3. Distribución Bernoulli
Un ensayo bernoulli es un experimento que tiene dos resultados. Al primero se le
llama “éxito” y al otro “fracaso”. La probabilidad de “éxito” se denota por p.
Por consecuencia, la probabilidad de “fracaso” es 1-p.
Para cualquier ensayo de bernoulli se define a la variable aleatoria x así: si el
experimento propicio “éxito”, entonces X = 1. De lo contrario, X = 0. De ahí que X
sea una variable aleatoria discreta, con función de masa de probabilidad p(X)
definida por
P (0) =P(X = 0) = 1-p
P (1) =P(X = 1) =p
Se dice que la variable aleatoria X sigue una distribución de bernoulli con
parámetro p la notación es X ~ Bernoulli (p)
Media y varianza de una variable aleatoria de Bernoulli.
Media = p
Varianza = p (1-p)
4. Ejemplos:
Cuando se lanza al aire una moneda hay una probabilidad de 0.5 de que caiga en
“cara”. Sea X = 1, si la moneda cae en “cara” y X = 0, si cae en “cruz”. ¿Cuál es la
distribución de X?
Probabilidad de que caiga “cara” = .5 ó 50%
Probabilidad
Eventos Sustituimos la formula Probabilidad
Éxito
X=1 P(1) =P(X = 1) =P 0.5 ó 50%
X=0 P(0) =P(X = 0) = 1-P 0.5 ó 50%
Fracas
o
La probabilidad de éxito, P(X = 1), es igual a 0.5. Por lo tanto,
X~ Bernoulli (0.5)
Media: =P 0.50
Varianza: = P(1-P) 0.25
0.50 (1-0.50)
5. Cuando se lanza un dado hay una probabilidad de 1/6 de que salga 6. Sea X = 1,
si el dado cae seis y X = 0, en cualquier otro caso. ¿Cuál es la distribución de X?
Eventos Probabilidad
X=1 P(1) =P(X = 1) =P 0.16 ó 1/6
X=0 P(0) =P(X = 0) = 1-P 0.83 ó 5/6
La probabilidad de éxito, P(X = 1), es igual a 1/6. Por lo tanto,
X~ Bernoulli (1/6)
Media: =P 0.16 ó 1/6
Varianza: = P(1-P) 0.1344 /36
********************************************************************************
Diez por ciento de los componentes fabricados mediante determinado proceso
esta defectuoso. Se selecciona un componente aleatoriamente. Sea X = 1, si el
componente esta defectuoso y X =0, en cualquier otro caso. ¿Cuál es la
distribución de X?
Eventos Probabilidad
X=1 P(1) =P(X = 1) =P 0.10
X=0 P(0) =P(X = 0) = 1-P 0.90
La probabilidad de éxito, P(X = 1), es igual a 0.1. Por lo tanto,
X~ Bernoulli (0.1)
Media: =P 0.1
Varianza: = P(1-P) 0.09
6. Un jugador de basquetbol está a punto de tirar hacia la parte superior del tablero.
La probabilidad de que anote el tiro es de 0.55. Sea X = 1, si anota el tiro, si no lo
hace, X = 0. Determine la mediana y la varianza de X
Eventos Probabilidad
X=1 P(1) =P(X = 1) =P 0.55
X=0 P(0) =P(X = 0) = 1-P 0.45
La probabilidad de éxito, P(X = 1), es igual a 0.1. Por lo tanto,
X~ Bernoulli (0.55)
Media: =P 0.55
Varianza: = P(1-P) 0.2475
*******************************************************************************
En un restaurante de comida rápida, 25% de las órdenes para beber es una
bebida pequeña, 35% una mediana y 40% una grande.
Sea X = 1 si se escoge aleatoriamente una orden de una bebida pequeña y X= 0
en cualquier otro caso.
Sea Y = 1 si la orden es una bebida median y Y = 0 en cualquier otro caso.
Sea Z = 1 si la orden es una bebida pequeña o mediana y Z = 0 en cualquier otro
caso.
Eventos Si la bebida es pequeña Probabilidad
X=1 P(1) =P(X = 1) =P 0.25
X=0 P(0) =P(X = 0) = 1-P 0.75
7. Media: =P 0.25
Varianza: = P(1-P) 0.1875
Eventos Si la bebida es mediana Probabilidad
Y=1 P(1) =P(Y = 1) =P 0.35
Y=0 P(0) =P(Y = 0) = 1-P 0.65
Media: =P 0.35
Varianza: = P(1-P) 0.2275
Eventos Si la bebida es pequeña o Probabilidad
mediana
Z=1 P(1) =P(Z = 1) =P 0.60
Z=0 P(0) =P(Z = 0) = 1-P 0.40
Media: =P 0.60
Varianza: = P(1-P) 0.24
8. Distribución binomial
Extraer un solo componente de una población y determinar si está o no
defectuosa es ejemplo de un ensayo bernoulli. En la práctica, es posible extraer
varios componentes de una gran población y contar el número de elementos
defectuosos. Esto implica realizar diversos ensayos de bernoulli independientes y
contar el número de éxitos. El número de éxitos es una variable aleatoria, que
tiene una distribución binomial.
Suponga que se lleva a cabo una serie de n ensayos de bernoulli, cada uno con
la misma probabilidad de éxito p. además, suponga que los ensayos son
independientes: esto es, que el resultado de un ensayo no influyen en los
resultados de alguno de los otros ensayos. Sea la variable aleatoria X igual al
número de éxitos en n ensayos, entonces X tiene la distribución binomial con
parámetros n y p. la notación es X~Bin(n,p). X es una variable aleatoria discreta
y sus posibles valores son 0,1……n.
Entonces X tiene la
Cada ensayo tiene distribución
Se realiza un total X es el numero
Los ensayos son la misma binomial con
de n ensayos de de éxitos en los n
independientes probabilidad de parámetros n y p,
bernoulli y si: ensayos
éxito p que se denota
como X~Bin(n,p)
9. Si X ~Bin (n,p), la función de masa de probabilidad de X es:
P(X) = P(X =
**********************************************************************************************
Ejemplos:
Se lanza al aire 8 veces un dado. Determine la probabilidad de que no salga mas
de dos números seis.
Cada lanzamiento del dado es un experimento Bernoulli con una probabilidad de
éxito de 1/6.
Sea X el número de seises en los 8 lanzamientos. Entonces X~ Bin (8 1/6). Se
necesita determinar a P(X=0), P(X=1) y P(X=2)
10. Determine la función de masa de probabilidad de la variable aleatoria X,
Si X ~Bin (10,0.4).
Determine P(X =5)
**********************************************************************************************
Se toma una muestra de cinco elementos de una población grande, en la cual
10% de los elementos esta defectuosa
Sea X~ Bin(5, 0.1). Determine
11. Se lanza una moneda 10 veces y la probabilidad de obtener cara es de .5
Sea X~ Bin (10, 0.5). Determine
13. La distribución poisson
La distribución de poisson se utiliza con frecuencia en el trabajo científico. Una
manera de considerarla es como una aproximación de la distribución binomial
cuando n es grande y p es pequeño. Esto se muestra con un ejemplo:
Una masa contiene 10 000 átomos de una sustancia radiactiva. La probabilidad de
que cierto átomo decaiga en un periodo de un minuto es 0.0002. Sea X el número
de átomos que decae en un minuto. Se puede considerar a cada átomo como un
ensayo de bernoulli, en lo que el éxito ocurre si el átomo decae. Por tanto, X es el
numero de éxitos en 10 000 ensayos de bernoulli independientes, cada uno con
probabilidad de éxito de 0.0002, de tal forma que la distribución de X es Bin (10
000, 0.0002). La media de X es µx =(10 000)(0.0002) = 2.
Otra masa contiene 5 000 átomos y cada uno de estos tiene probabilidad de
0.0004 de decaer en un intervalo de un minuto. Se Y el numero de átomos de
esta masa que decae en un minuto.
Por lo tanto Y ~ Bin(5 000, 0.0004) y µy = (5 000)(0.0004)=2.
En cada uno de estos casos, el número de ensayos n y la probabilidad de éxito p
son diferentes, pero el número promedio de éxitos, que es igual al producto np, es
el mismo. Ahora suponga que se quiere calcular la probabilidad de que solo tres
átomos decaigan en un minuto para cada uno de estas masas. Mediante la
función de masa de probabilidad binomial, se calcula de la siguiente manera:
14. Estas probabilidades son casi iguales entre sí. Aunque a partir de la fórmula de la
función de masa de probabilidad binomial esto no es obvio, cuando n es grande y
p es pequeño la función de masa depende por completo de la media np, y muy
pocos de los valores específicos de n y p. por consiguiente, se puede aproximar
la función de masa binomial con una cantidad que dependa solo del producto np.
Específicamente, si n es grande y p es pequeña, y λ =np, se puede demostrar
mediante métodos avanzados que para toda las X.
Esto conduce a la definición de una nueva función de probabilidad, denominada
función de masa de probabilidad de poisson, que se define mediante
Si X es una variable aleatoria cuya función de masa de probabilidad está dada por
la ecuación entonces X sigue una distribución de poisson con parámetro λ. La
notación es X~ Poisson (λ)
15. Ejemplos:
Si X ~Poisson (3), calcule: P(X = 2), P(X = 10), P(X = 0), P(X = -1) y P(X = O.5)
λ
X no debe ser
negativo
X debe ser un
número
entero
16. Suponga que 0.03% de los contenedores plásticos producidos en cierto proceso
tiene pequeños agujeros que los dejan inservibles. X representa el número de
contenedores en una muestra aleatoria de 10 000 que tiene estos defectos
determine P(X = 1), P(X = 2), P(X = 3), P(X = 4) y P(X = 5)
λ =np =(10 0008)(0.03%)
λ=3
17. Si X ~Poisson (4), calcule: P(X = 0), P(X = 1) y P(X = 2)
**********************************************************************************************
Si X ~Poisson (6), calcule: P(X = 0), P(X = 1), P(X = 2), P(X = 3) y P(X = 4)
18. Si X ~Poisson (5), calcule: P(X = 1), P(X = 2), P(X = 3), P(X = 4) y P(X = 5)
19. Distribución Normal
Una distribución normal de media μ y desviación típica σ se designa por N (μ, σ).
Su gráfica es la campana de Gauss:
El área del recinto determinado por la función y el eje de abscisas es
igual a la unidad.
Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual
a 0.5 a la izquierda y otra igual a 0.5 a la derecha .
La probabilidad equivale al área encerrada bajo la curva.
Distribución normal estándar
N (0, 1)
La distribución normal estándar, o tipificada o reducida, es aquella
que tiene por media el valor cero, μ =0, y por desviación típica la
unidad, σ =1.
La probabilidad de la variable X dependerá del área del recinto
sombreado en la figura. Y para calcularla utilizaremos una tabla.
20. Tipificación de la variable
Para poder utilizar la tabla tenemos que transformar la variable X que
sigue una distribución N (μ, σ) en otra variable Z que siga una
distribución N (0, 1).
Cálculo de probabilidades en distribuciones normales
La tabla nos da las probabilidades de P (z ≤ k), siendo z la variable
tipificada.
Estas probabilidades nos dan la función de distribución Φ (k).
Φ (k) = P (z ≤ k)
21. 1. Determine el área bajo la curva normal
a) Ala derecha de z= -0.85.
b) Entre z = 0.40 y z = 1.30.
c) Entre z =0.30 y z = 0.90.
d) Desde z = - 1.50 hasta z =-0.45
Estos resultados se obtuvieron con las tablas anexas al final de los problemas
a) 1 – 0.1977 = 0.8023
b) 0.9032 – 0.6554 = 0.2478
c) 0.8159 – 0.3821 = 0.4338
d) 0.0668 + (1 – 0.3264) = 0.7404
2- Las puntuaciones de una prueba estandarizada se distribuyen normalmente
con media de 480 y desviación estándar de 90.
a) ¿Cuál es la proposición de puntuaciones mayores a 700?
b) ¿Cuál es el 25º? ¿Percentil de las puntuaciones?
c) Si la puntuación de alguien es de 600. ¿En que percentil se encuentra?
d) ¿Qué proporción de las puntuaciones se encuentra entre 420 y 520?
µ = 480 σ = 90
a) Z = (700-480)/90 = 2.44 el área a la derecha de Z es 0.0073
b) la puntuación de z en el 25 º percentil -0.67
El 25 º percentil es entonces 480 - 0.67 (90) = 419.7
c) z = (600-480)/90 = 1.33 el área a la derecha de z es 0.9082
Por lo que una puntuación de 600 está en el percentil 91
e) z = (420 - 480)/90 = - 0.67
Z = (520 – 480)/90 = 0.44
El área entre z = - 0.67 y z = 0.44 es 0.6700 – 0.2514 = 0.4186
22. 3- La resistencia de una aleación de aluminio se distribuye normalmente con
media de 10 giga pascales (Gpa) desviación estándar de 1.4 Gpa.
a) ¿Cuál es la probabilidad de que una muestra de esta aleación tenga
resistencia mayor a 12 GPa?
b) Determine el primer cuartil de la resistencia de esta aleación.
c) Determine el 95º. Percentil de la resistencia de esta aleación.
RESULTADOS
µ = 10 σ = 1.4
a) z = (12 -10)/1.4 = 1.43 el área ala derecha de z = 1.43 es 1 – 0.9236 = 0.0764
b) la puntuación de z en el 25 º percentil es -0.67
El 25 º percentil es entonces 10 - 0.67 (1.4) = 9.062 Gpa.
c) la puntuación de z en el 95 º percentil es 1.645
El 25 º percentil es entonces 10 + 1.645(1.4) = 12.303 Gpa.
4- La penicilina es producida por el hongo penicillium, que crece en un caldo, cuyo
contenido de azúcar debe controlarse con cuidado. La concentración optima e
azúcar es de 4.9 mg/mL. Si la concentración excede los 6 mg/mL, el hongo muere
y el proceso debe suspenderse todo el día.
a) ¿Si la concentración de azúcar en tandas de caldo se distribuye
normalmente con media 4.9 mg/mL y desviación estándar 0.6 mg/mL
en qué proporción de días se suspenderá el proceso?
b) El distribuidor ofrece vender caldo con una concentración de azúcar
que se distribuye normalmente con medida de 5.2 mg/mL y
desviación estándar de 0.4 mg/mL ¿este caldo surtirá efectos con
menos días de producción perdida?
RESULTADOS
a) (6 – 4.9)/0.6 =1.83 1 – 0.9664 = 0.0336
b) Z = (6 – 5.2)/0.4 = 2.00 1 – 0.9772 = 0.0228
Con este caldo el proceso se suspendería el 2.28% de los días
23. 5- El volumen de las llantas llenadas por cierta maquina se distribuye
con media de 12.05 onzas y desviación estándar de 0.03 onzas.
a) ¿Qué proporción de latas contiene menos de 12 onzas?
b) La medida del proceso se puede ajustar utilizando calibración. ¿En que valor
debe fijarse la media para que el 99% de las latas contenga 12 onzas o mas?
c) Si la media del procesos sigue siendo de 12.05 onzas. ¿En que valor debe
fijarse la media para que el 99% de las latas contenga 12 onzas o mas?
RESULTADOS
a) (12 – 12.05)/0.03 = -1.67 la proporción es 0.0475
b) Z= -2.33 entonces -2.33=(12 - µ)/0.03 despejando µ = 12 .07 onzas
c) – 2.33 = (12-12.05)/ σ despejando σ = 0.0215 onzas
24. Distribución Gamma
La distribución gamma se puede caracterizar del modo siguiente: si se está
interesado en la ocurrencia de un evento generado por un proceso de Poisson de
media lambda, la variable que mide el tiempo transcurrido hasta obtener n
ocurrencias del evento sigue una distribución gamma con parámetros a=
n lambda(escala) y p=n (forma). Se denota
Gamma(a,p).
Por ejemplo, la distribución gamma aparece cuando se realiza el estudio de la
duración de elementos físicos (tiempo de vida).
Esta distribución presenta como propiedad interesante la “falta de memoria”. Por
esta razón, es muy utilizada en las teorías de la fiabilidad, mantenimiento y
fenómenos de espera (por ejemplo en una consulta médica “tiempo que transcurre
hasta la llegada del segundo paciente”).
Ejercicio 1
El número de pacientes que llegan a la consulta de un médico sigue una
distribución de
Poisson de media 3 pacientes por hora. Calcular la probabilidad de que transcurra
menos de una hora hasta la llegada del segundo paciente.
Debe tenerse en cuenta que la variable aleatoria “tiempo que transcurre hasta la
llegada del segundo paciente” sigue una distribución Gamma (6, 2).
Solución:
Cálculo de probabilidades. Distribuciones continuas
Gamma (a
p)
a : Escala 60000
p : Forma 20000
Punto X 10000
Cola Izquierda Pr[X<=k] 0,9826
Cola Derecha Pr[X>=k] 0,0174
Media 0,3333
Varianza 0,0556
Moda 0,1667
La probabilidad de que transcurra menos de una hora hasta que llegue el segundo
paciente es 0,98.
Ejercicio 2
Suponiendo que el tiempo de supervivencia, en años, de pacientes que son
sometidos a una cierta intervención quirúrgica en un hospital sigue una
distribución Gamma con parámetros a=0,81 y p=7,81, calcúlese:
25. 1. El tiempo medio de supervivencia.
2. Los años a partir de los cuales la probabilidad de supervivencia es menor que
0,1.
Cálculo de probabilidades. Distribuciones continuas
Gamma (a,p)
a : Escala 0,8100
p : Forma 7,8100
Cola Izquierda Pr [X<=k] 0,9000
Cola Derecha Pr [X>=k] 0,1000
Punto X 14,2429
Media 9,6420
Varianza 11,9037
Moda 8,4074
El tiempo medio de supervivencia es de, aproximadamente, 10 años.
26.
27. Un fabricante de focos afirma que su producto durará un promedio de 500 horas
de trabajo. Para conservar este promedio esta persona verifica 25 focos cada
mes. Si el valor y calculado cae entre –t 0.05 y t 0.05, él se encuentra satisfecho
con esta afirmación. ¿Qué conclusión deberá él sacar de una muestra de 25 focos
cuya duración fue?:
Aquí se encuentran las muestras que se tomaron para resolver el problema.
Solución:
Para poder resolver el problema lo que se tendrá que hacer será lo siguiente se
aplicara una formula la cual tendremos que desarrollar con los datos con los que
contamos.
Tendremos que sustituir los datos
t= x -μ
SI n α = 1- Nc = 10%
v = n-1 = 24
t = 2.22
Procedimiento: se demostrara la forma en que se sustituirán los datos.
VALOR DE LOS DATOS. APLICACION DE LA FORMULA
µ n=500 h t=505.36-500 t = 2.22
n =25 12.07 25
Nc =90% v = 25 -1 = 24
X=505.36 α = 1- 90% = 10%
S=12.07
28. Distribución T de student
surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de
la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias
entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre
las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe
ser estimada a partir de los datos de una muestra.
La distribución t de Student es la distribución de probabilidad del cociente
Donde
Z tiene una distribución normal de media nula y varianza 1
V tiene una distribución ji-cuadrado con grados de libertad
Z y V son independientes
Si μ es una constante no nula, el cociente es una variable aleatoria que sigue
la distribución t de Student no central con parámetro de no-centralidad .
Aparición y especificaciones de la distribución t de Student
Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con
2
media μ y varianza σ . Sea
la media muestral. Entonces
sigue una distribución normal de media 0 y varianza 1.
Sin embargo, dado que la desviación estándar no siempre es conocida de
antemano, Gosset estudió un cociente relacionado,
donde
29. es la varianza muestral y demostró que la función de densidad de T es
donde es igual a n − 1.
La distribución de T se llama ahora la distribución-t de Student.
El parámetro representa el número de grados de libertad. La distribución
depende de , pero no de o , lo cual es muy importante en la práctica.
1. Sea T ~ t(4,0.5)
a) Determinar
b) Determinar
c) Determinar P(T
P(T
= 1- e –(0.5)(1) - e –(0.5)(1) - e –(0.5)(1) - e (0.5)(1)
=1- 0.60653 -0.30327 -0.075816 -0.012636
=0.000175
d) Determinar P(T
P(T
= e –(0.5)(3) - e –(0.5)(3) - e –(0.5)(3) - e (0.5)(3)
30. =0.22313 + 0.33470+0.25102 +0.12551
=0.9344
2. Sea T ~ Weibull(0.5,3)
a) Determinar
b) Determinar
c) Determinar P(T
P (T>5) =1-P(T 1) = 1 – e-
3. En el articulo “Parameter Estimation with Only One Complete Failure
Observation”se modela la duración en horas, de cierto tipo de cojinete con
la distribución de Weibull con parámetros
a) Determine la probabilidad de que un cojinete dure mas de 1000 horas
b) Determine la probabilidad de que un cojinete dure menos de 2000 horas
P(T<2000)= P(T
c) La función de riesgo se definio en el ejercicio 4 ¿Cuál es el riesgo en
T=2000 horas?
h(t) =
4. La duración de un ventilador, en horas , que se usa en un sistema
computacional tiene una distribución de Weibull con
a) ¿Cuáles la probabilidad de que un ventilador dure mas de 10 000
horas?
P(T>10 000 ) =1 –(1- =0.3679
31. b) ¿Cuál es la probabilidad de que un ventilador dure menos de 5000
horas?
P(t<5000) =P(T
5. Un sistema consiste de dos componentes conectados en serie. El sistema fallara cuando alguno
de los componentes falle. Sea T el momento en el que el sistema falla. Sean X1 y X2 las duraciones
de los dos componentes. Suponga que X1 y X2 son independientes y que cada uno sigue una
distribución Weibull con 2
a) Determine P(
P(
b) Determine P(T 5)
P(T =0.8647
c) T Tiene una distribución de Weibull= si es Asi ¿Cuáles son sus
parametros?
Si, T~ Weibull (2,