Este documento presenta información sobre un servicio de asesoría en línea llamado "Maestros Online" que ofrece solución de ejercicios y actividades relacionadas con estadística, probabilidad y series de tiempo. Incluye dos actividades de ejemplo para practicar conceptos como pruebas de hipótesis, intervalos de confianza, correlación y pronósticos. El documento proporciona instrucciones detalladas para que los estudiantes resuelvan los ejercicios propuestos de manera individual o en equipo y compartan sus resultados.
Estadistica y pronostico para la toma de decisiones
1. Maestros Online
www.maestronline.com
Solicita una cotización a través de nuestros
correos
Maestros Online
Estadística y
pronóstico para la
toma de decisiones
Grupo de
problemas
Servicio de asesorías y solución de ejercicios
Envía tus actividades a
ciencias_help@hotmail.com
2. Maestros Online
www.maestronline.com
Actividad 1: ¿Quién tienen mayor peso, los
hombres o las mujeres?
Instrucciones:
La estatura de una persona está relacionada con su peso, por lo que puede sugerirse, en
términos generales, que a mayor estatura de una persona esta tendrá más peso. Para tener
una idea de cómo es esta relación, realiza lo siguiente:
1. De manera individual pregunta a 10 personas diferentes la siguiente información:
a. Su género (hombre o mujer)
b. Su estatura en centímetros
c. Su peso en kilogramos
2. Con base en la información recolectada, determina:
a. ¿Quiénes presentan mayor estatura, hombres o mujeres?
b. ¿Quiénes presentan mayor peso, hombres o mujeres?
c. ¿Cuál es la mayor estatura?, ¿cuál la menor?
d. ¿Cuál es el promedio de las estaturas? ¿cuál el del peso?
e. ¿Cuál es la varianza del conjunto de datos?
f. Determina la varianza por género.
3. Comparte tus resultados en el foro del equipo.
4. Utilicen Excel para elaborar una base de datos donde se incluya la información de todos
los miembros del equipo.
5. Determinen lo siguiente:
a. El promedio general tanto de estatura como de peso.
b. Para ambas variables determinar la mediana.
c. Calcular la varianza y la desviación estándar.
6. Verifiquen lo anterior utilizando herramientas de análisis de Excel.
7. Al finalizar, reflexionen sobre las siguientes preguntas y preparen un documento que
integre las respuestas de todo el equipo a manera de conclusiones. Compartan el
documento en el foro.
a. ¿Cuál es el promedio general, tanto para peso como para estatura?
b. ¿Cuál es el promedio por género (hombre, mujer)?
c. ¿Cuál es la desviación estándar para todo el conjunto de datos?
d. ¿Cuál es la desviación estándar por género?
e. ¿Cuál de los dos géneros es el de mayor estatura?, ¿cuál el de mayor peso?
f. ¿Qué genero presenta mayor variabilidad en ambas características (estatura y peso)?
g. ¿En qué otras áreas podrían aplicar estos conceptos?
3. Maestros Online
www.maestronline.com
Realiza lo siguiente:
1. Determina cuál de las siguientes es una distribución de probabilidad. En caso de que no
sea función de probabilidad explicar por qué no lo es.
a.
x
1
2
3
4
p(x) 0.4 0.2 0.3 0.2
c.
x
-2
-1
1
2
p(x) 0.1 0.2 0.6 0.1
e.
x
0
2
4
6
p(x) -0.1 0.3 0.1 0.5
g.
x
1
2
3
4
p(x) 0.4 0.2 0 .3 0.2
2. El gerente de una planta utiliza datos históricos para construir una función de distribución
de probabilidad de X, el número de empleados ausentes en un día dado; los datos se
presentan a continuación:
x
0
1
2
3
4
5
6
7
p(x) 0.001 0.025 0.350 0.300 0.200 0.090 0.029 0.005
Determinar lo siguiente:
a. P(X=1)
4. Maestros Online
www.maestronline.com
b. P(X>5)
c. P(X≥5)
d. P(X=6)
3. Supón que X representa el número de personas en una vivienda. La distribución de
probabilidad es como sigue:
X
1
2
3
4
5
6
7
p(x) 0.26 0.31 0.19 0.14 0.05 0.03 0.02
4.
a. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga menos de 3
personas?
b. ¿Cuál es la probabilidad de que una casa seleccionada al azar tenga más de 5
personas?
c. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga entre 2 y 4
(inclusive) personas? Determínese P (2≤X≤4).
Escribe con tus propias palabras el proceso de prueba de hipótesis y los intervalos de
confianza.
5. Una muestra aleatoria de 10 observaciones se extrajo de una población normal. Los datos
son los siguientes:
3
6
3
5 6
2
6
5 5
4
a. Establecer un intervalo de confianza al 90%.
b. Establecer un intervalo de confianza al 95%.
c. Establecer un intervalo de confianza al 99%.
5. Del experimento para determinar los grados centígrados necesarios para llevar el punto
de ebullición un litro de agua, se obtuvieron los siguientes resultados:
100.0 100.2 99.7
99.0
99.4
99.5
99.5
100.3
99.9 100.2 100.1
99.8
a. Prueba la hipótesis de que la media es igual a 100 (H 0: μ = 100) contra la alternativa
de que la media poblacional es diferente a 100 (H a: μ ≠ 100). El nivel de significancia
es del 1% (α = 0.01). Realiza todas las etapas de una prueba de hipótesis.
b. Establece intérprete el intervalo de confianza al 99% para la media de ebullición μ.
5. Maestros Online
www.maestronline.com
6. Por un período de varios años, un dentífrico ha recibido una puntuación media de 5.9, en
una escala de 7 puntos, en cuanto a la satisfacción general del cliente con el producto.
Debido a un cambio no anunciado en el producto, existe la preocupación de que quizás
haya cambiado la satisfacción del cliente. Supón que las puntuaciones para una muestra
de 25 clientes tienen una media de 5.60 y una desviación estándar de 0.87. ¿Indican
estos datos que la satisfacción del cliente es diferente de 5.9?
a. Prueba la hipótesis con α = 0.05.
b. Obtén un intervalo de confianza al 95% para la media μ.
Actividad 2: Nicotina en cigarrillos
Instrucciones:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
De manera individual, escribe el proceso de la prueba de hipótesis.
Reúnanse en equipos de trabajo (foro, Skype, Google Docs, chat, etc.).
Comenten sobre el proceso de las pruebas de hipótesis.
Una muestra aleatoria de 50 jóvenes adultos se selecciona y a cada persona se le
pregunta cuántos minutos ven diariamente de deportes. La media muestral que se
encontró fue de = 64. Supón que σ = 20.
Prueben la hipótesis de que existe suficiente evidencia estadística para inferir que la
media poblacional es superior a 60 minutos. Utilicen un nivel de significancia de 0.05.
Repitan el ejercicio 4 con n =75
Repitan el ejercicio 4 con n =100
Repitan el ejercicio 4 con σ = 10.
Repitan el ejercicio 4 con σ = 40.
Repitan el ejercicio 4 con = 62.
Repitan el ejercicio 4 con = 68.
Realicen un resumen de los ejercicios 4 a 10 describiendo qué pasa al valor de la
estadística de prueba cuando pasa lo siguiente:
a. El tamaño de muestra se incrementa.
b. La desviación estándar disminuye.
c. El valor de
se incrementa.
1. Describe con tus propias palabras qué significa una serie de tiempo.
2. Enlista y define las componentes de una serie de tiempo.
3. ¿Cuál de las cuatro componentes de una serie de tiempo se utilizaría para describir el
efecto de las ventas navideñas de una tienda departamental de menudeo?
4. ¿Por qué es más fácil pronosticar valores para una serie de tiempo que contiene un
componente estacional que uno que posee un componente cíclico?
5. Los datos que se presentan a continuación corresponden al número de autos de
pasajeros (en miles) en Francia durante los años 1970 a 2006.
6. Maestros Online
www.maestronline.com
Año
1970
1975
1979
1980
1981
1982
1983
1984
1985
1986
Númer
o de
autos
(miles)
1247
0
1552
0
1844
0
1913
0
1975
0
2030
0
2060
0
2080
0
2109
0
2150
0
Año 1987
1988
1989
1990
1991 1992
1993
1994
1995
1996
Númer
o de
autos
(miles)
2197
0
2252
0
2301
0
2355
0
2381
0
2402
0
2438
5
2490
0
2510
0
2550
0
Año
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
Númer
o de
autos
(miles)
2609
0
2681
0
2748
0
2806
0
2870
0
2916
0
2956
0
2990
0
3010
0
3040
0
6. Grafica el número de autos contra los años (utiliza Excel o cualquier paquete estadístico
como Minitab).
7. ¿Qué componentes de la series de tiempo parecen estar presentes en esta serie?
Actividad 3: ¿Existe relación entre el tamaño de la
casa y los metros de terreno? ¿Existe
7. Maestros Online
www.maestronline.com
autocorrelación en la serie de datos de los
CETES?
Instrucciones:
1. En forma individual define lo que significa los términos de:
a. Serie de tiempo
b. Componentes de una serie de tiempo
c. Correlación
d. Autocorrelación
2. En equipos (por Skype, chat, Google Docs, etc.) lleguen a una definición común e
indiquen en que situaciones de la vida diaria se pueden aplicar estos conceptos, den un
ejemplo de cada término.
3. Busquen información de 20 casas en venta en donde las variables son: Y (metros de
construcción) y X (metros de terreno); y realicen lo que se indica:
a. Realicen y describan el diagrama de dispersión
b. Calculen e interpreten el coeficiente de correlación muestral r
c. Respondan a la siguiente cuestión en un terreno urbano, ¿a mayor cantidad en metros
de construcción es mayor el precio de la vivienda?
4. Busquen información de los CETES a 28 DÍAS – SEMANAL, periodicidad diaria, datos del
Banco de México; consideren las últimas 20 cotizaciones de los CETES y realicen lo que
se indica:
a. Determina el coeficiente de autocorrelación r1
b. Determina la prueba la hipótesis de que:
i.
Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)
ii.
Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero)
iii.
Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k
5. Den respuesta a la siguiente cuestión: ¿Qué significa el término autocorrelación? ¿Existe
autocorrelación entre los rendimientos de los CETES a 28 días?
6. Con los conceptos vistos y puestos en práctica den una respuesta justificada a cada una
de las siguientes cuestiones:
a. ¿Qué significa el coeficiente de correlación?
b. ¿Cómo se interpreta el coeficiente de correlación?
c. ¿Para qué sirve el coeficiente de autocorrelación?
¿Bajo qué condiciones es un promedio móvil simple apropiado para pronosticar?
8. Maestros Online
www.maestronline.com
1. Los datos de la demanda anual de bolsas de fertilizante de una empresa agrícola se
muestran en la siguiente tabla.
Año
t
Demanda de Pronóstico
fertilizante
(miles de bolsas)
1
4
-
2
6
-
3
4
-
4
5
4.7
5
10
6
8
7
7
8
9
9
12
10
14
11
15
a. Grafica la serie de tiempo.
b. Encuentra el valor de pronóstico para la demanda de fertilizante para cada año,
comenzando por el año 4 por medio de un promedio móvil de k=3 años.
2. Aplica el suavizamiento exponencial con una constante de suavizamiento de α = 0.1 y un
valor inicial de 38 para pronosticar el valor del año 11 para el siguiente conjunto de datos.
Período Yt Ŷt
T
1
3838
2
43
3
42
9. Maestros Online
www.maestronline.com
4
45
5
46
6
48
7
50
8
49
9
46
10
45
3. Las ventas de equipos de cocina han aumentado durante los últimos cinco años.
AñoVentas Yt Ŷt
1
400
2
455
3
468
4
513
5
534
360
6
a. El gerente había pronosticado, antes de iniciar el negocio, que las ventas del primer
año serían de 360 equipos de cocina. Por medio de un suavizamiento exponencial con
α = 0.40, desarrolla los pronósticos para el periodo comprendido entre los años 2 y 6.
5. Las ventas trimestrales de una cadena de tiendas departamentales se registraron para los
años 1986-1989:
Año Trimestre Ventas Pronóstico
(millones)
Ŷt
Yt
1986
1
18
2
33
18
11. Maestros Online
www.maestronline.com
6. Se utilizaron dos modelos de pronóstico para producir los valores futuros de una serie de
tiempo; estos valores (Ŷt) se muestran en la tabla siguiente, junto con los valores reales
observados (Yt).
Valores de pronóstico Ŷt
Valor observado Yt Modelo 1
Modelo 2
6.0
7.5
6.3
6.6
6.3
6.7
7.3
5.4
7.1
9.4
8.2
7.5
a. Calcula el DAM y el ECM para determinar cuál es más preciso.
8. Determina DAM y ECM para los siguientes pronósticos.
Valor
Pronóstico Ŷt
observado Yt
57
63
60
72
70
86
75
71
70
60
8. Se utilizaron tres técnicas de pronóstico para predecir los valores de una serie de tiempo.
Estos valores se dan en la siguiente tabla. Calculen el DAM y el ECM para cada técnica
para determinar cuál es el más preciso.
Valores de pronóstico Ŷt
12. Maestros Online
www.maestronline.com
Valor observado Yt TécnicaTécnica 2Técnica 3
1
19
21
22
17
24
27
24
20
28
29
26
25
32
31
28
31
38
35
30
39
¿Cuánto tiempo dedica una persona en promedio a Internet?
Para tener una idea de esto, realiza lo siguiente:
1. Pregunta de manera individual a 10 personas del género masculino y a 10 personas del
género femenino la siguiente información:
a. Su edad
b. Tiempo que dedica diariamente a Internet
2. Con una calculadora de bolsillo y con base en esta información determina:
a. En promedio, ¿quién dedica más tiempo a Internet, hombres o mujeres?
b. ¿Cuál es el promedio de edad de las mujeres?, ¿de los hombres?
c. Para los géneros por separado determina la mediana de la edad y del tiempo
dedicado a Internet.
d. Para el total de datos determina la varianza y la desviación estándar del tiempo que
dedican a Internet y de la edad.
3. Utiliza Excel para elaborar una base de datos donde incluyas toda la información. Con una
calculadora de bolsillo contesta lo siguiente:
a. ¿Cuál es el promedio general de tiempo dedicado a Internet y de la edad?
b. ¿Cuál es la mediana para los datos en general, tanto para el tiempo dedicado a
Internet como de la edad?
c. ¿Cuál es la varianza y la desviación estándar de todos los datos para el tiempo
dedicado a Internet y para la edad?
4. Verifica lo anterior utilizando herramientas de análisis de Excel.
5. Para finalizar, reflexiona sobre las siguientes preguntas y prepara un documento con
respuestas a manera de conclusiones.
6. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco
de México y realiza lo que se indica:
a. Considera las últimas 12 cotizaciones de la TIIE
b. Determina el coeficiente de autocorrelación r1
13. Maestros Online
www.maestronline.com
c. Determina la prueba la hipótesis de que:
Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)
Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero)
Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k
7. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco
de México, considera las últimas 24 cotizaciones de la TIIE y realiza lo que se indica,
a. Determina el valor de pronóstico para el rendimiento del bono, comenzando en 4to
periodo, por medio de un promedio móvil de k= 3 meses.
b. Determina el valor de pronóstico para el rendimiento del bono para cada mes,
comenzando en el periodo 6, mediante un promedio móvil de k=5 meses.
c. Utiliza el suavizamiento exponencial con una constante de suavizamiento α = 0.2 y un
valor inicial igual a la primera lectura del TIIE 28 DÍAS.
d. Evalúa estos métodos de pronóstico por medio de Desviación Absoluta Media (DAM),
Error Cuadrático Medio (ECM), Error Porcentual Absoluto Medio (EPAM) y Error
Porcentual Medio (EPM).
e. Pronostica el rendimiento para el periodo 25 por medio de la mejor técnica.
Actividad 4: Obtención de la recta de regresión
ajustada por medio del método de mínimos
cuadrados.
Instrucciones:
Preparación para la actividad colaborativa (de forma individual)
1. Define los siguientes términos:
a. Análisis de la regresión simple.
b. Estimadores de mínimos cuadrados.
c. Intervalo de confianza.
d. Coeficiente de regresión.
e. Coeficiente de correlación.
f. Coeficiente de determinación.
2. Comparte tus definiciones a través del foro de grupo virtual que se estableció para el
desarrollo de la actividad.
Durante la actividad colaborativa
14. Maestros Online
www.maestronline.com
2. En equipos reporten al foro el desarrollo de los siguientes ejercicios y respuesta de las
preguntas planteadas:
a. En una compañía fabricante de helados se sospecha que el almacenar el helado a
temperaturas bajas durante largos periodos tiene un efecto lineal en la pérdida de
peso del producto. En la planta de almacenamiento de la compañía se obtuvieron los
siguientes datos:
Pérdida de peso (gr) Y
37
36
30
28
36
35
Tiempo (semanas) X
i.
ii.
iii.
iv.
v.
28
26
32
35
27
25
31
30
Ajusten e interpreten un modelo de regresión lineal simple a los datos.
Prueben la significancia de la pendiente β1.
Calculen e interpreten R2.
Elaboren un intervalo de confianza del 90% para β1.
Pronostiquen la pérdida cuando el tiempo es de 33 semanas.
3. Con los conceptos vistos y puestos en práctica, den una respuesta justificada a cada una
de las siguientes cuestiones:
a. ¿Para qué utilizarías la regresión lineal simple en un problema de tu especialidad?
b. ¿Qué relación tiene con la correlación?
c. ¿Cómo medirías el ajuste del modelo de regresión lineal obtenido?
d. ¿Qué es el coeficiente de determinación?
e. ¿Por qué crees que se llama regresión lineal?
f. ¿Cuál es la relación de la prueba de hipótesis con el intervalo de confianza en la
regresión?
I.
Realiza lo siguiente:
1.
En un estudio de variables que afectan la productividad en el negocio de abarrotes al
menudeo, W. S. Good usa el valor agregado por hora de trabajo para medir la
productividad de tiendas de abarrotes al menudeo. Él define el “valor agregado” como
el “excedente [dinero generado por el negocio] disponible para pagar mano de obra,
muebles accesorios y equipo”. Los datos de acuerdo con la relación del valor
agregado por hora de trabajo Y y el tamaño X de la tienda de abarrotes descrita en el
artículo de Good para diez tiendas de abarrotes ficticias se muestran enseguida. Se
establecerá un modelo para relacionar Y con X.
Datos en relación con el tamaño de tienda y el valor agregado
Tienda
Valor agregado
por hora de trabajo
Tamaño de la tienda
(miles de pies cuadrados)
15. Maestros Online
www.maestronline.com
Y
1
23.0
5.40
14.0
3
5.51
27.2
4
5.09
12.4
5
4.92
33.9
6
3.94
9.8
7
6.11
22.6
8
5.16
17.5
9
5.75
27.0
10
2.
6.08
2
a.
b.
c.
X
5.60
21.1
Realiza un diagrama de dispersión de los datos para Y contra X.
Calcula las rectas de mínimos cuadrados para Y contra X.
Obtén una gráfica de residuales contra el valor ajustado de Y, ya sea por medio
de Minitab. Observa la gráfica. ¿Qué patrón parecen seguir los datos? Éste es un
ejemplo de análisis de residuales.
En un experimento con conejos se tomaron en cuenta las siguientes variables:
Y: Proporción del peso final al peso inicial.
X: Gramos diarios de alimento por kg de peso inicial.
Proporción de peso Gramos diarios
final al
de alimento por kg
peso inicial
de peso inicial
Proporción de peso final Gramos diarios de
al
alimento por kg de
peso inicial
peso
inicial
Y
X
Y
X
0.91
10
1.16
33
0.88
15
0.96
35
0.90
18
1.08
36
0.79
19
1.13
37
0.94
20
1.00
39
0.88
21
1.10
42
16. Maestros Online
www.maestronline.com
0.95
45
24
1.18
54
0.88
25
1.26
56
1.01
27
1.29
56
0.95
28
1.36
59
0.95
30
1.40
59
1.05
30
1.32
60
1.05
d.
1.11
0.97
a.
b.
c.
21
31
1.47
64
Realiza un diagrama de dispersión de los datos para Y contra X.
Calcula las rectas de mínimos cuadrados para Y contra X.
Prueba la hipótesis de que la pendiente es cero. Realiza todas las etapas de la
prueba de hipótesis (α = 0.01).
Calcula las predicciones Ŷ para los siguientes valores de X 0: 0, 5, 15, 25, 30, 35.5,
39, 45, 60, 70, 80, 90.
Calcula el intervalo de confianza de los valores particulares de Y para los valores dados
de X0 del inciso anterior.
Realiza los siguientes ejercicios (utiliza Excel o un paquete de software estadístico como
Minitab).
3.
Una empresa ha estado buscando los factores que influyen en la cantidad de acero
(en millones de toneladas) que puede vender cada año. La administración sospecha
que los siguientes son los factores principales: la tasa anual de inflación del país, el
precio promedio por tonelada de acero importado que acota los precios (en dólares) y
el número de automóviles (en millones) que los fabricantes de autos planean producir
ese año. Se recolectaron los datos de los últimos siete años:
Millones
de tons.
vendidas
Y
Tasa de
Cota de Importaciones
Número de
inflación X1
X2
automóviles (millones) X3
4.2
3.1
3.10
6.2
3.1
3.9
5.00
5.1
4.0
7.5
2.20
5.7
17. Maestros Online
www.maestronline.com
4.7
7.1
15.5
4.35
6.5
3.7
13.0
2.60
6.1
3.5
4.
4.50
4.3
a.
b.
10.7
11.0
3.05
5.9
Estima la ecuación de regresión múltiple.
Interpreta los coeficientes de regresión estimados.
Se llevó a cabo un conjunto de ensayos experimentales para determinar una forma de
predecir el tiempo de cocimiento en minutos Y a varios niveles de amplitud del horno,
pies X1 y temperatura de cocción, grados Celsius X2. Los datos obtenidos fueron
registrados como se muestra a continuación:
Tiempo de
cocimiento
Y
1.32
1.15
15.05
2.69
3.40
18.75
3.56
4.10
30.25
4.41
8.75
44.85
5.35
14.82
48.94
6.20
15.15
51.55
7.12
15.32
61.50
8.87
18.18
100.44
9.80
35.19
111.42
b.
Temperatura
en grados Cº
X2
6.40
a.
b.
Niveles de amplitud
del horno, pies X1
10.65
40.40
Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
Pronostica el tiempo de cocimiento cuando el nivel de amplitud del horno es de 5
pies y la temperatura de cocción es de 20 grados Celsius.
El supervisor de una empresa está examinando la relación existente entre la
calificación que obtiene un empleado en una prueba de aptitud, su experiencia previa
y el éxito en el trabajo. Se estudia y se pondera la experiencia de un empleado en
18. Maestros Online
www.maestronline.com
trabajos anteriores y se obtiene una calificación entre 2 y 12. La medida del éxito en el
empleo se basa en un sistema de puntuación que incluye producción total y eficiencia,
con valor máximo posible de 50. El supervisor tomó una muestra de seis empleados
con menos de un año de antigüedad, y obtuvo lo siguiente:
Evaluación Resultado de la Experiencia en
del
prueba
trabajos
desempeño de aptitud X1 anteriores (años) X2
Y
28
5
33
87
11
21
69
4
40
93
9
38
71
7
46
a.
b.
74
97
10
Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
Si un empleado obtuvo 83 puntos en la prueba de aptitud y tenía una experiencia
en trabajos anteriores de 7 años, ¿qué evaluación de desempeño puede esperar?
Actividad 5: ¿Existe relación entre la cantidad de
Kilómetros y los caballos de fuerza y el peso
total?
Instrucciones:
Revisa la siguiente información y resuelve lo que se indica.
1. Se tomó una muestra de 20 automóviles con relación al número de kilómetros por litro (Y),
caballos de fuerza X1 y peso total en kg X2.
Kilómetros por litro,
Y
Caballos de
Fuerza,
X1
Peso en kg
X2
20. Maestros Online
www.maestronline.com
18
424
36
280
19
356
37
245
20
310
39
396
21
349
42
278
21
365
45
297
24
245
54
224
25
373
56
346
27
395
56
141
28
156
59
139
30
243
59
424
30
150
60
316
31
463
64
379
a. Estimen la ecuación de regresión.
b. Calculen las predicciones para los siguientes valores de X0: 11, 12, 15, 25, 30,
35.5, 39, 45, 60, 70, 80, 90.
c. Obtengan los intervalos de confianza al 99 para cada valor de Y para los
diferentes valores de X0.
Ejercicio 1
1. La energía eléctrica consumida Y cada mes por una planta química se considera
relacionada con la temperatura ambiente promedio en grados Fahrenheit X1, número de
días al mes X2, la pureza promedio del producto en porciento X3 y las toneladas obtenidas
del producto X4. Se dispone de los datos históricos del año anterior, lo cuales se presentan
enseguida:
Temperatura en Días Porcentaje de Toneladas
grados Fahrenheit X2
pureza
de producto
Y
X1
X3
X4
240
25
24
91
100
236
31
21
90
95
290
45
24
88
110
274
60
25
87
88
301
65
25
91
94
21. Maestros Online
www.maestronline.com
316
72
26
94
99
300
80
25
87
97
296
84
25
86
96
267
75
24
88
110
276
60
25
91
105
288
50
25
90
100
261
38
23
89
98
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Interpreta los coeficientes de regresión en el contexto del problema.
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las
etapas de una prueba de hipótesis.
d. Prueba la significancia de los coeficientes de regresión individuales; realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
e. Calcula e interpreta R2 en el contexto del problema.
f. Calcula el error estándar de estimación.
g. Pronostica la energía eléctrica consumida Y cuando la temperatura ambiente
promedio X1 es de 30, el número de días al mes X2 es de 25 grados Fahrenheit, la
pureza promedio del producto en porciento X3 es de 92 y las toneladas obtenidas del
producto X4 es de 95.
h. Calcula R2.
i. Construye un intervalo de confianza para las pendientes de la población β1, β2 , β3 y β4.
Ejercicio 2
2. Un negocio de ventas por catálogo de computadoras
personales, software y hardware mantiene un almacén centralizado para la distribución de
los productos ordenados. La administración examina el proceso de distribución y está
interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una
pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos
de los últimos 24 meses, que indican los costos de distribución Y, las ventas X 1 y el
número de órdenes recibidas X2. Los resultados son los siguientes:
Costo de
Distribución
(miles de dólares)
Y
Ventas
(miles de
dólares)
X1
Órdenes
X2
23. Maestros Online
www.maestronline.com
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
e. Calcula e interpreta R2 en el contexto del problema.
f. Calcula el error estándar de estimación.
g. Pronostica los costos de distribución mensuales promedio para el almacén cuando las
ventas son de 400,000 dólares y el número de órdenes es de 4,500.
h. Calcula R2ajustada.
i. Construye un intervalo de confianza para las pendientes de la población (β 1 y β2).
Ejercicio 3
3. Una cadena de comida rápida ha experimentado un cambio importante en sus ventas
como resultado de una campaña de publicidad exitosa. En consecuencia, la gerencia
ahora necesita un nuevo modelo de regresión para sus ventas. Los siguientes datos se
recolectaron en las doce semanas posteriores al inicio de la campaña de publicidad.
Tiempo
Semanas
(X)
Ventas
(miles de dólares)
(Y)
1
4,618
2
3,741
3
5,836
4
4,367
5
5,118
6
8,887
7
19,746
8
34,215
9
50,306
10
65,717
11
86,434
12
105,464
a. Usa Excel o Minitab para determinar la ecuación que mejor se ajuste a sus ventas.
b. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.
24. Maestros Online
www.maestronline.com
c. ¿Estás satisfecho con el modelo como pronosticador de ventas Y? Explica. Realiza
todas las etapas de una prueba de hipótesis con α = 0.05.
d. Transforma la variable independiente X2, luego corre de nuevo el modelo con X y
X2 como variables explicativas. ¿Es este modelo cuadrático un mejor ajuste para los
datos? Explica. Realiza todas las etapas de una prueba de hipótesis con α = 0.05.
e. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.
Compáralo con el obtenido en el inciso b, ¿cuál modelo prefieres?, ¿por qué?
Revisa la siguiente información nutricional de las ensaladas:
1. Enseguida se presentan las siguientes variables que se registraron en diferentes tipos de
ensaladas. Las variables son:
a. Y: Calorías
b. X1: Grasa (g)
c. X2:Carbohidratos (g)
d. X3: Proteínas (g)
Ensalada
(porciones
de 100 g)
Grasa (g) X1Carbohidratos (g) X2Proteínas (g) X3Calorías
Y
César
14.7
6.52
5.03
170
Atún
11.02
6.96
14.27
184
Atún con queso
14.72
6.87
14.44
217
Atún con huevo
12.93
6.96
13.71
196
Macarrones o pasta
10.63
22.98
3.76
202
Macarrones u otra pasta con pollo
13.34
15.00
10.11
221
Macarrones u otra pasta con atún
9.14
19.49
7.07
18.9
Ensalada de huevo
30.26
1.93
9.20
318
Ensalada de papas
8.20
11.17
2.68
143
Ensalada de papas con huevo
7.05
15.96
2.77
136
Ensalada de papas estilo alemán
1.24
16.66
2.52
88
Información obtenida de http://www.fatsecret.cl/.../ solo para fines educativos.
2. Estos datos se deben ingresar a Excel o Minitab y llevar a cabo lo siguiente:
a. Estima e interpreta en el contexto del problema los coeficientes de la ecuación de
regresión múltiple.
25. Maestros Online
www.maestronline.com
b. Prueben la significancia de los coeficientes de regresión individuales. Realicen todas
las etapas de una prueba de hipótesis para cada uno de los coeficientes.
c. Calculen e interpreten R2 en el contexto del problema.
d. Calculen el error estándar de estimación.
e. Estimen la cantidad promedio de calorías cuando el contenido de grasa es de 50 g, la
cantidad de carbohidratos es de 10 g y la cantidad de proteínas es de 8 g.
f. Calculen R2ajustada.
g. Construyan un intervalo de confianza para las pendientes de la población (β 1, β2 y β3).
Ejercicio 1
1. Un negocio de ventas por catálogo de computadoras
personales, software y hardware mantiene un almacén centralizado para la distribución de
los productos ordenados. La administración examina el proceso de distribución y está
interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una
pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos
de los últimos 24 meses que indican los costos de distribución Y, las ventas X 1 y el
número de órdenes recibidas X2. Los resultados son los siguientes:
Costo de
Distribución
(miles de dólares)
Y
Ventas
(miles de dólares)
X1
Órdenes
X2
52.95
386
4015
71.66
446
3806
85.58
512
5309
63.69
401
4262
72.81
457
4296
68.44
458
4097
52.46
301
3213
70.77
484
4809
82.03
517
5237
74.39
503
4732
70.84
535
4413
54.08
353
2921
62.98
372
3977
26. Maestros Online
www.maestronline.com
72.30
328
4428
58.99
408
3964
79.38
491
4582
94.44
527
5582
59.74
444
3450
90.50
623
5079
93.24
596
5735
69.33
463
4269
53.71
389
3708
89.18
547
5387
66.80
415
4161
a. Realiza una regresión múltiple.
b. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
c. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
d. Determina el VIF para cada variable explicativa en el modelo. ¿Existe alguna razón
para sospechar que existe multicolinealidad?
Ejercicio 2
2. Una organización de consumidores desea desarrollar un modelo para predecir el
rendimiento de gasolina de automóvil, medido en cantidad de millas recorridas [millas por
galón (mpg)] de acuerdo a los caballos de fuerza del motor y el peso del auto en kg. Se
seleccionó una muestra de 50 modelos con los siguientes resultados:
mpg Y
Caballos de fuerza X1
Peso X2
43.1
48
1985
19.9
110
3365
19.2
105
3535
17.7
165
3445
18.1
139
3205
28. Maestros Online
www.maestronline.com
44.6
67
1850
32.9
100
2615
38
67
1965
24.2
120
2930
38.1
60
1968
39.4
70
2070
25.4
116
2900
31.3
75
2542
34.1
68
1985
34
88
2395
31
82
2720
27.4
80
2670
22.3
88
2890
28
79
2625
17.6
85
3465
34.4
65
3465
20.6
105
3380
a. Realiza un modelo de regresión lineal múltiple.
b. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
c. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
d. Determina el factor de inflación de varianza (VIF) para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
Ejercicio 3
1. El director de operaciones de transmisión de una estación de televisión desea estudiar el
aspecto de las “horas de espera” en la que los artistas gráficos sindicalizados se les paga
por no realizar actividades. Las variables a considerar son:
a. Horas de espera (Y): número total de horas por semana
b. Personal presente total (X1): total semanal de días-persona los 7 días a la semana
29. Maestros Online
www.maestronline.com
c. Horas remotas (X2): número total de horas trabajadas por empleados fuera de la
planta central
d. Los resultados para un periodo de 26 semanas son:
Horas en espera
Y
Personal presente
X1
Horas remotas
X2
245
338
414
177
333
598
271
358
656
211
372
631
196
339
528
135
289
409
195
334
382
118
293
399
116
325
343
147
311
338
154
304
353
146
312
289
115
283
388
161
307
402
274
322
151
245
335
228
201
350
271
183
339
440
237
327
475
175
328
347
152
319
449
188
325
336
188
322
267
197
317
235
30. Maestros Online
www.maestronline.com
261
315
164
232
331
270
e. Ajusta un modelo de regresión lineal múltiple.
f. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
g. Prueba la significancia de los coeficientes de regresión individuales; realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
h. Determina el factor de inflación de varianza (VIF) para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
Analiza y resuelve los siguientes ejercicios, sin olvidar incluir los procedimientos utilizados que
te llevaron a la respuesta.
Concluye con una reflexión sobre la utilización de la regresión y correlación en la vida
cotidiana. ¿Qué tipo de problemas pudieras resolver con los conocimientos adquiridos en este
módulo?
1. ¿Existe alguna relación entre el tiempo en minutos que se utiliza para llegar a un centro
comercial y la distancia desde la casa en donde tú vives? Entrevista a 20 compañeros y
pregúntales el tiempo que tardan en llegar al centro comercial y la distancia a su casa.
Después denomina a la variable tiempo en minutos como Y y a la distancia en km como X.
a. Contesta lo siguiente:
i.
Realiza el diagrama de dispersión y describe el comportamiento de ambas
variables. ¿Qué clase de relación crees que existe entre estas dos variables? ¿A
mayor distancia es mayor el tiempo?
ii.
Calcula la recta de regresión de mínimos cuadrados.
iii.
¿Existe evidencia que indique que a mayor distancia es mayor el tiempo en
llegar? Prueba la significancia de la recta de regresión con un nivel de
significancia α = 0.01.
iv.
¿Es significativa esta regresión? Realiza todas las etapas de una prueba de
hipótesis. Concluye en el contexto del problema.
v.
Pronostica el tiempo en llegar al centro comercial si la distancia es de 3, 4 y 6
kilómetros de distancia.
vi.
Calcula el coeficiente de correlación.
vii.
Determina e interpreta el coeficiente de determinación en el contexto del
problema.
viii.
Realiza un breve resumen de los hallazgos.
31. Maestros Online
www.maestronline.com
2. ¿Existe relación entre el peso de una persona y la medida de su cintura en centímetros?
Selecciona 10 personas del género masculino y 10 personas del género femenino y
pídeles que te den su peso en kilogramos y la medida de su cintura en centímetros.
Posteriormente denomina a la variable peso como Y y a la medida de la cintura como X.
a. Contesta lo siguiente:
i.
Realiza el diagrama de dispersión y describe el comportamiento de ambas
variables. ¿Qué clase de relación crees que existe entre estas dos variables? ¿A
mayor medida de la cintura es mayor el peso?
ii.
Calcula la recta de regresión de mínimos cuadrados. ¿Existe evidencia que
indique que a mayor medida de la cintura es mayor el peso? Prueba la
significancia de la recta de regresión con un nivel de significancia α = 0.01. ¿Es
significativa esta regresión? Realiza todas las etapas de una prueba de hipótesis.
Concluye en el contexto del problema.
iii.
Pronostica el peso si las medidas de cintura son de 66, 80 y 86 centímetros.
iv.
Calcula el coeficiente de correlación.
v.
Determina e interpreta el coeficiente de determinación en el contexto del
problema.
vi.
Realiza un breve resumen de los hallazgos.
3. Busca información de 20 casas en venta en donde las variables son Y (metros de
construcción) y X (metros de terreno), y realiza lo que se te indica:
a. Contesta lo siguiente:
i.
Realiza el diagrama de dispersión y describe el comportamiento de ambas
variables.
ii.
¿Qué clase de relación crees que existe entre estas dos variables?
iii.
Calcula la recta de regresión de mínimos cuadrados.
iv.
Prueba la significancia de la recta de regresión con un nivel de significancia α =
0.01.
v.
¿Es significativa esta regresión? Explica. Concluye en el contexto del problema.
Realiza todas las etapas de una prueba de hipótesis.
vi.
Pronostica los metros de construcción cuando los metros de terreno son de 90,
100 y 150 metros.
vii.
Calcula el coeficiente de correlación.
viii.
Determina e interpreta el coeficiente de determinación en el contexto del
problema.
ix.
Realiza un breve resumen de los hallazgos.
4. Revisa la siguiente información tomada de la sección de avisos de ocasión.
Precio
Metros de Metros de
Número de
(miles de pesos) terreno X1 construcción X2recámaras X3
33. Maestros Online
www.maestronline.com
a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la ecuación de
regresión lineal múltiple.
b. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
c. Pronostica el precio para los siguientes datos:
Metros de Metros de Número de
terreno construcción recámaras
( X1 )
(X2 )
( X3 )
180
390
4
200
250
3
230
200
4
250
180
2
100
120
3
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
e. Calcula el error estándar de estimación.
f. Construye un intervalo de confianza para las pendientes de la población (β1, β2 y β3).
g. Calcula e interpreta R2 en el contexto del problema.
h. Calcula R2ajustada.
i. Determina el Factor de Inflación de Varianza (VIF) para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
j. Finalmente prepara un documento presentando un resumen de tus hallazgos.