Este documento presenta varios ejercicios relacionados con pruebas de bondad de ajuste utilizando las pruebas de χ2, Shapiro-Wilk, Kolmogorov-Smirnov y Weibull. Se proporcionan datos y se pide calcular estadísticos de contraste, valores p y decidir si los datos se ajustan a distribuciones teóricas específicas. Los ejercicios implican contrastar si datos siguen distribuciones como Poisson, exponencial, normal y Weibull.
Las marcas automotrices con más ventas de vehículos (2024).pdf
Contraste de bondad de ajuste χ2, Shapiro-Wilk y Kolmogorov-Smirnov
1. R PR´ACTICA III
Bondad de Ajuste
Secci´on III.1
Contraste χ2
29.
Se lanza un dado 1200 veces y se obtienen los siguientes resultados:
Xi 1 2 3 4 5 6
Oi: frecuencia 175 215 220 190 170 230
a) Calcular el estad´ıstico de contraste χ2
. χ2
b) Hallar el nivel de significaci´on (P-valor) de la prueba y decidir si se acepta que el dado es
regular.
p − value χ2
g.l.
30.
El fichero pi.digitos.txt contiene los 1000 primeros decimales del n´umero. Contrasta la hip´otesis de
que todos los d´ıgitos aparecen con la misma probabilidad.
p − value χ2
31.
Durante la Segunda Guerra Mundial se dividi´o el mapa de Londres en cuadr´ıculas de 1/4 km y se
cont´o el n´umero de bombas ca´ıdas en cada cuadr´ıcula durante un bombardeo alem´an. Los resultados
fueron:
x: Impactos en cuadr´ıcula 0 1 2 3 4 5
Oi: frecuencia 229 211 93 35 7 1
Se quiere contrastar la hip´otesis de que los datos siguen una distribuci´on de Poisson. Se pide:
a) Abrir un nuevo conjunto de datos o data.frame de nombre londres.
13
2. CAP´ITULO III. BONDAD DE AJUSTE
b) Dise˜nar las columnas adecuadas que registren las frecuencias observadas y las esperadas.
c) Calcular el estad´ıstico de contraste χ2
.
d) Hallar el nivel de significaci´on (P-value) de la prueba y decidir si se acepta que los datos de la
muestra se ajustan a la distribuci´on te´orica.
p − valor
32.
El tiempo de vida de 70 motores se registra en la siguiente tabla:
A˜nos de funcionamiento (0, 1) (1, 2) (2, 3) (3, 4) ≥ 4
Oi: frecuencia 30 23 6 5 6
Contrastar la hip´otesis de que los datos siguen una distribuci´on exponencial con el estad´ıstico de
contraste χ2
.
Secci´on III.2
Contraste de Shapiro-Wilk
33.
Con Datos - Conjunto de datos en paquetes Leer conjunto de datos.. del paquete datasets cargar el
fichero de nombre trees.
a) Efectuar el contraste de normalidad para la variable volumen de madera Volumen.
W
b) Efectuar el contraste de normalidad para la variable logaritmo del volumen de madera Volumen.
W
Secci´on III.3
Contraste de Kolmogorov-Smirnov
34.
Vamos a realizar el contraste de normalidad de la variable PESO del fichero pesoaltura.rdat. Dado
que el n´umero de individuos es grande, n = 100, se utilizar´a el test de Kolmogorov-Smirnov.
a) Con Datos - Importar datos - desde archivo... incorporamos el fichero pesoaltura.rdat en Rcom-
mander con el nombre de peso.altura.
b) Calculamos los estimadores de µ y σ,resultando
x = s =
c) A continuaci´on se contrastan las diferencias entre la funci´on de distribuci´on emp´ırica muestral
y la distribuci´on te´orica normal de par´ametros, N(µ; σ). Para ello se emplear´a el procedimiento
ks.test, y
Universidad de Cantabria. Alberto Luce˜no y Fco. Javier Glez Ortiz 14
3. III.3. CONTRASTE DE KOLMOGOROV-SMIRNOV
1) resulta una distancia de Kolmogorov. D
2) un p-valor de p − value
3) Concluir si los datos se ajustan a la distribuci´on normal.
35.
En el fichero Pulso Se pide:
a) Contrastar si la variable aleatoria peso de los hombres PesoH se ajusta a una distribuci´on
normal.
b) Contrastar si la variable aleatoria peso de las mujeres PesoM se ajusta a una distribuci´on
normal.
c) Contrastar si la variable aleatoria altura de los hombres AlturaH se ajusta a una distribuci´on
normal.
d) Contrastar si la variable aleatoria altura de las mujeres AlturaM se ajusta a una distribuci´on
normal.
36.
Los siguientes datos corresponden a la duraci´on de diez pilas de cierta marca en cientos de horas.
i 1 2 3 4 5 6 7 8 9 10
xi 0.023 0.406 0.538 1.267 2.343 2.563 3.334 3.491 5.088 5.587
Se quiere contrastar si la variable aleatoria duraci´on de vida de las pilas se ajusta a una distribuci´on
de tipo exponencial. Se pide:
a) Sabiendo que la funci´on de distribuci´on exponencial es FX(x) = 1 − e−α x
, determinar su
expresi´on si α se estima con ˆα = ¯x−1
.
ˆα
b) Determinar la distancia de Kolmogorov. D
c) Concluir si los datos se ajustan a la distribuci´on exponencial dada.
37.
Los siguientes datos corresponden a la presi´on de rotura de determinado tipo de vidrio en unidades
de lb/pulg2
.
i 1 2 3 4 5 6
xi 4.90 8.60 11.42 15.46 19.19 20.69
i 7 8 9 10 11 12
xi 40.29 41.19 43.55 44.62 53.56 77.61
Se quiere contrastar si la variable aleatoria presi´on de rotura del vidrio se ajusta a una distribuci´on
de tipo Weibull con par´ametro de forma β = 2 y par´ametro θ desconocida. Se pide:
a) Sabiendo que la funci´on de distribuci´on de tipo Weibull es FX(x) = 1 − e−(x/θ)β
, determinar
su expresi´on si θ se estima con
ˆθβ
=
1
n
n
i=1
xβ
i .
ˆθ
Universidad de Cantabria. Alberto Luce˜no y Fco. Javier Glez Ortiz 15
4. CAP´ITULO III. BONDAD DE AJUSTE
b) Determinar la distancia de Kolmogorov D
c) Decidir si los datos se ajustan a la distribuci´on de Weibull dada.
d) Para realizar este contraste, ¿con qu´e m´etodo deben estimarse los par´ametros?
38.
Losa siguientes datos corresponden al peso de unos gr´anulos de cobre en unidades de 10−4
gramos.
i 1 2 3 4 5 6 7 8 9 10
xi 2 3 3.1 4.3 4.4 4.8 4.9 5.1 5.4 5.7
i 11 12 13 14 15 16 17 18 19 20
xi 6.1 6.6 7.3 7.6 8.3 9.1 11.2 14.4 16.7 19.8
Se quiere contrastar si la variable aleatoria peso de los gr´anulos de cobre se ajusta a una distribuci´on
de tipo logar´ıtmico normal, es decir si los logaritmos de los pesos se ajustan a una distribuci´on
normal. Se pide:
a) Dise˜nar las columnas apropiadas en R para efectuar el contraste.
b) Sea Y = Ln X, siendo X el peso. Hallar
¯Y SY
c) Determinar la distancia de Kolmogorov. D
d) Concluir si los datos se ajustan a la distribuci´on supuesta.
Soluciones
29. a) 15.75 b) 0.007595
30. X-squared = 4.74, df = 9, p-value = 0.8564
31. c) 1.0118 d) 0.908
33. a) 0.8876 b) 0.9643
34. b) x = 73, 37 s = 12, 69 c) D = 0.136, p-value = 0.04939
36. a) α = 0.4058442 b) D = 0.2136, p-value = 0.677
37. a) θ = 38.03854 b) D = 0.2439, p-value = 0.4075
Universidad de Cantabria. Alberto Luce˜no y Fco. Javier Glez Ortiz 16