Tinciones simples en el laboratorio de microbiología
Regresión Lineal múltiple
1. Estadística Aplicada a la ingeniería
REGRESIÓN LINEAL MULTIPLE
MII. Paloma Serrano Ruiz
Héctor Armando García Cárdenas
Ing. Tecnologías de la Producción
7 - A
2. 1. Dados los siguientes conjuntos de datos:
a. Dibujar el diagrama de dispersión de cada uno de los conjuntos de datos.
b. Calcular la recta de regresión de cada uno de los conjuntos de datos y dibujarla en el
diagrama de dispersión, considerando como variables independientes las variables U, W, X.
c. Calcular el coeficiente de correlación lineal para cada uno de los conjuntos.
R²Ajustado = 0.8769 R² = 0.1286 R² = 0.229
d. ¿Qué podemos observar?
El conjunto de datos V/U tiene una correlación notablemente más fuerte que los otros dos
U 1 2 3 4 5 6 7 8 9 10
V 3 5 6 5 7 9 10 9 10 10
W 4.543 4.543 4.543 4.543 4.543 4.543 4.543 4.543 4.543 14.117
X 6.646 6.646 6 6 6 7 7 5.684 8.838 14.186
1086420
10
9
8
7
6
5
4
3
U
V
Gráfica de dispersión de V vs. U
1412108642
14
13
12
11
10
9
8
7
6
5
W
X
Gráfica de dispersión de X vs. W
3. 2.- Un gerente de recursos humanos desea determinar el salario que debe pagar a cierta categoría de
obreros. Para determinar dicho salario que debe pagara cierta categoría deobreros. Serealiza un estudio
en el que intervienen las variables Salario Mensual (en miles de pesos), Nivel de Producción Anual en la
Empresa (en millones de pesos) y Nivel de especialización Media del Trabajador (de 0 a 10). El gerente
obtiene esta serie de resultados:
a) Calcular el plano deregresión lineal mínimo cuadrático queexplica el salario en función de la producción y
del nivel de especialización.
b) Estudia la validez de la función obtenida en el apartado anterior por medio de una medida descriptiva.
¿Cuánto vale la varianza residual?
c) Calcula el coeficiente de correlación parcial para dos variables explicativas.
d) ¿Qué salario sedebería pagar si el nivel de producción fuese de 315 millones de pesos y el nivel medio de
especialización de 6.6?
A) Y = a0 + a1 x1 + a2 x2 --------> Y=56.22 + 0.1584 . X1 + 3.6522 . X2 ...
B)
C)
D) 0.1584*315+3.6522*6.6+56.22 = 130.22
Aunque este pronóstico no esdemasiado fiable puestoque R^2 Ajustado es demasiadobajo
Salario 123.4 135.7 115.9 100.6 98.7 150.4 124.6 110 138.6 123.4
Producción 300.5 325.9 298.6 200.9 300.4 359.8 279.6 215.6 250 300
Especialización 4.3 5.5 7.8 4.9 4.3 8.5 6.4 5.6 5.3 5
4. Coeficiente de correlaciónpara producción y
especializaciónporseparado
360320280240200
150
140
130
120
110
100
87654
Producción
Salario
Especialización
Gráfica de dispersión de Salario vs. Producción, Especialización
5. 3.- Los ahorros S y losingresosY mensualesencientosde eurosde unamuestrade 10 familias
de una determinada región se presentan en la siguiente tabla:
Ahorros 1.9 1.8 2 2.1 1.9 2 2.2 2.3 2.7 3
Ingresos 20.5 20.8 21.2 21.7 22.1 22.3 22.2 22.6 23.1 23.5
e. Ajustar los datos anterioresa un modelo lineal que explique lo ahorros familiares en
función de los ingresos de la región dada.
Y = - a0 + a1 . X1 y = −5,4 + 0,34.y
f. ¿Qué ahorro se puede prever para una familia de la región que ingrese 2500 (141.8
euros) pesos mensuales?
= −5,4 + 0,34y ---- 5.4 + 0.34 * 141.8 = 42.78
R^2 = 0.7242
3.02.82.62.42.22.01.8
24.0
23.5
23.0
22.5
22.0
21.5
21.0
20.5
Ahorros
Ingresos
Gráfica de dispersión de Ingresos vs. Ahorros
6. 4.- Se considera que la energía eléctrica que consume una planta química cada mes está relacionada con
la temperatura ambiente promedio (x1), el número de días del mes(x2), la pureza promedio del producto
(x3) y las toneladas de producto fabricadas (x4). Se dispone de los datos históricos del año pasado y se
presentan en la siguiente tabla:
g. Ajuste un modelo de regresión lineal múltiple con el conjunto de datos anterior.
Y = -103 + 0.605.X1 + 8.92.X2 + 1.44.X3 + 0.014.X4
h. Pronosticar el consumo de energía para un mes en el que x1=75 °F, x2= 24 días, X3= 90
pureza promedio y x4= 98 toneladas.
Para un pronóstico para el consumo de energíacon una temperaturade 75°F, 24 días, 90 pureza
promedioy 98 toneladas de producto fabricado esde:
-103+ (0.605*75)+ (8.92*24)+ (1.44*90)+ (0.014*98) = 287.4 de consumo de energíaeléctrica.
PRONOSTICO CALCULADO POR MINTAB
Y X1 X2 X3 X4
240 25 24 91 100
236 31 21 90 95
290 45 24 88 110
274 60 25 87 88
301 65 25 91 94
316 72 26 94 99
300 80 25 87 97
296 84 25 86 96
267 75 24 88 110
276 60 25 91 105
288 50 25 90 100
261 38 23 89 98
7. En las gráficas de
dispersiónse observa que
la variable con mayor
relaciónal consumo de
energíaeléctrica,en
donde los datos se ajustan
más a la recta de energía
eléctricason los días del
mes(X2)
En el análisis de correlación vemos que X2 tiene un coeficiente
de 0.803, siendo también la variable X1 con una R^2 de 0.751
80604020 262422
320
300
280
260
240
95.092.590.087.585.0
320
300
280
260
240
1101051009590
X1
Y
X2
X3 X4
Gráfica de dispersión de Y vs. X1, X2, X3, X4
8. 5.- Se llevó a cabo un estudio sobre el desgaste de un cojinete y su relación con x1= viscosidad del aceite
y x2= carga. Se obtienen los siguientes datos.
i. Estime los parámetros de la ecuación de regresión lineal múltiple.
Y = a0 – a1 . X1 – a2 . X2 parámetros estimados Y = 351 - 1.27 * 20 - 0.1539 * 1200
j. Pronostique el uso de la viscosidad del aceite es 20 y la carga de 1200
El pronóstico de desgaste con los siguientespredictores: viscosidadde 20 y una carga de 1200 es
de: R = 140.92
Y =351-1.27*20-0.1539*1200 = 140.92
En ambas variables
tenemos una
correlaciónnegativa
masomenos fuerte,
para viscosidad: -
0.852
Y para carga: - 0.898
Lo que nos indica
que conforme
aumentan la velocidady
la carga el desgaste es
menor
Y X1 X2
193 1.6 851
230 15.5 816
172 22 1058
91 43 1201
113 33 1357
125 40 1115
403020100
250
225
200
175
150
125
100
140012001000800
viscocidad
desgaste
carga
Gráfica de dispersión de desgaste vs. viscocidad, carga