2. REGRESIÓN LINEAL
FORMULACIÓN DEL PROBLEMA DE LA REGRESIÓN
Dados n puntos (x1, y1), (x2, y2), … , (xn, yn) hallar la función
y= f(x), que se ajuste mejor a ellos.
El criterio que normalmente se usa para establecer el mejor
ajuste es el de mínimos cuadrados que consiste en minimizar
la suma de los cuadrados de los errores residuales.
El error residual para el punto i, se define como:
i yi f ( xi )
La suma de los cuadrados de los errores residuales se
expresa como:
n
n
2
Sr i yi a0 a1 xi
i 1
2
2
i 1
3. REGRESIÓN LINEAL
Dados n puntos (x1, y1), (x2, y2), … , (xn, yn) hallar la
función y a0 a1 x que se ajuste mejor a ellos.
Para este caso el error residual para el dato i se puede
expresar como:
εi yi a0 a1 xi
La suma de los cuadrados de los errores residuales, en
este caso, sería:
n
n
2
Sr i yi a0 a1 xi
i 1
3
2
i 1
4. REGRESIÓN LINEAL
Las constantes a0 y a1, del modelo lineal serán aquellas que
minimicen a Sr, lo cual requieres derivar Sr con respecto a cada uno de
los coeficientes:
n
S r
2 yi a0 a1 xi 1 0
a0
i 1
n
S r
2 yi a0 a1 xi xi 0
a1
i 1
Lo cual puede escribirse como:
n
n
n
a a x y
i 1
0
n
i 1
n
1 i
a x a x
i 1
0 i
i 1
1 i
2
i 1
n
i
yi xi
i 1
5. REGRESIÓN LINEAL
n
Teniendo en cuenta a 0 na 0 se obtiene:
i 1
n
n
i 1
i 1
na0 a1 xi yi
n
n
a x a x
i 1
0 i
i 1
1 i
2
n
yi xi
i 1
Que se puede expresar matricialmente como;
n
n
x
i
i 1
5
n
xi
yi
a0
i 1
ni 1
n
a
xi2 1 yi xi
i 1
i 1
n
6. REGRESIÓN LINEAL
Aplicando la regla de Crámer, para resolver este
sistema, se ontiene
n
y
i 1
n
a0
n
x
i
yx
i
i 1
i
n
x
2
i
i 1
n
x
n
n
x
i 1
i
i 1
n
i
n
y x
i 1
i 1
n
yi xi xi
i 1
i 1
n
i 1
i 1
2
i
a0
n
n
n
x y x x y
i 1
2
i
i 1
i 1
n
i 1
x
n
i
i 1
i
i 1
2
n
n x xi
i 1
i 1
n
2
i
6
i
n
n xi2 xi xi
i
i 1
n
n
2
i
i
i
7. REGRESIÓN LINEAL
n
y
i 1
n
a0
n
x
i
yx
i
i 1
i
i 1
n
n
x
2
i
i 1
n
xi
n
n
x
i 1
i
i
n
y x
i
i 1
i 1
n
n
yi xi xi
i 1
n
i 1
i 1
x
i 1
2
i
a0
n
n
n
x y x x y
i 1
2
i
n
i 1
n
n xi2 xi xi
i 1
n
n
i 1
i
i 1
i
i 1
2
n
n x xi
i 1
i 1
n
2
i
7
2
i
i
i
i 1
8. REGRESIÓN LINEAL
n
y
n
i 1
n
n
a1
x
yx
i
i 1
i 1
n
i
n
x
i
i 1
n
n
i
x
n
i 1
i
i
n
n
i 1
n
i 1
n
i 1
n
n yi xi xi yi
n xi2 xi xi
i 1
i 1
x
i 1
2
i
n
a1
n
n
i 1
i 1
i 1
n xi yi xi yi
n
2
n xi xi
i 1
i 1
n
2
i 1
9. EJEMPLO
Tomado del texto: Chapra, Steven C y Canale, Raymond. Métodos Numéricos para
ingeniero. Quinta edición
Se sabe que el esfuerzo a la
tensión de un plástico se
incrementa como función del
tiempo que recibe tratamiento
a base de calor. Se obtuvieron
los datos que se muestran en
la tabla.
Ajuste una línea recta a estos
datos y utilice una ecuación
para determinar el esfuerzo a
la tensión en un tiempo de 32
minutos
Contador
Tiempo
(min)
Esfuerzo a la
tensión(N/cm2)
i
xi
yi
1
10
5
2
15
20
3
20
18
4
25
40
5
40
33
6
50
54
7
55
70
8
60
60
9
75
78
10. EJEMPLO
esfuerzo a la tensión(N/cm 2)
90
Esfuerzo a la tensión(N/cm2
80
70
60
50
40
30
20
10
0
0
10
20
30
40
50
60
70
80
Tiempo(min)
GRÁFICO DE DISPERSIÓN PARA: Esfuerzo a la tensión vs. Tiempo
11. EJEMPLO
La solución básicamente consiste en hallar los coeficientes de la
ecuación de la recta de mejor ajuste. Para el problema planteado, la
forma de la ecuación de la recta sería:
y a0 a1 x
Donde y= esfuerzo a la tensión(N/cm2)
x= tiempo(min)
Para determinar los coeficientes a0 y a1, del modelo lineal, se utiliza
el procedimiento de regresión lineal, para lo cual se deben calcular las
siguientes cantidades:
n
xi yi
i 1
n
xi2
i 1
n
x
i 1
i
n
y
i 1
i
12. EJEMPLO
Teniendo en cuenta que para este problema, n=9 datos, entonces:
9
x y
i
i 1
i
9
x y
i 1
i i
x1 y1 x2 y2 x3 y3 x4 y4 x5 y5 x6 y6 x7 y7 x8 y8 x9 y9
10 5 15 20 20 18 25 40 40 33 50 54 55 70 60 60 75 78
9
x y
i 1
9
x x x
i
i 1
1
2
i i
19030
x3 x4 x5 x6 x7 x8 x9
9
x 10 15 20 25 40 50 55 60 75
i 1
i
9
x 350
i 1
i
13. EJEMPLO
9
y
i
i 1
9
y
i
i 1
y1 y2 y3 y4 y5 y6 y7 y8 y9
5 20 18 40 33 54 70 60 78
9
x 378
i
i 1
9
x
i 1
9
x
i 1
2
i
2
i
2
2
2
2
2
2
2
x12 x2 x3 x4 x5 x6 x7 x82 x9
102 152 202 252 402 502 552 602 752
9
xi2 17700
i 1
14. EJEMPLO
Con estas cantidades calculadas, se pueden utilizar las
fórmulas para los coeficientes, obtenidas anteriormente:
n
a0
n
n
n
x y x x y
2
i
i 1
i 1
i
i
i 1
n
n x xi
i 1
i 1
n
2
i
n
a1
i 1
2
n
n
i 1
i 1
i 1
n xi yi xi yi
n
n x xi
i 1
i 1
n
2
i
2
i
i
15. EJEMPLO
Reemplazando:
9
x y
i 1
i i
19030
9
x 350
i 1
i
9
xi 378
i 1
9
x
i 1
Se obtiene:
a0
17700 378 350 19030
9 17700 350
a1
2
9 19030 350 378
9 17700 350
2
0.81793478
1.05896739
2
i
17700
16. EJEMPLO
Reemplazando estos valores en el modelo lineal, se obtiene
la ecuación de la recta de mejor ajuste:
y a0 a1 x
y 0.81793478+1.05896739x
Remplazando y, x por los nombre reales de las
variables, quedaría:
Esfuerzo a la tensión( N / cm2 ) 0.81793478+1.05896739 tiempo min
En la siguiente diapositiva se presenta una gráfica de los
datos iniciales con la recta de regresión
17. EJEMPLO
esfuerzo a la tensión(N/cm 2)
90
Esfuerzo a la tensión(N/cm2
80
y = 1,059x + 0,8179
70
60
50
40
30
20
10
0
0
10
20
30
40
50
60
70
Tiempo(min)
Datos originales con la recta de regresión obtenida
80
18. EJEMPLO
Para estimar el valor del esfuerzo a la tensión para un
tiempo igual a 32 minutos, se utiliza la ecuación
obtenida:
Esfuerzo a la tensión(32) 0.81793478+1.05896739 32
Esfuerzo a la tensión(32) 34.7048913
En la siguiente figura se ilustra gráficamente la
obtención del esfuerzo para tiempo=32 minutos
19. EJEMPLO
esfuerzo a la tensión(N/cm 2)
90
Esfuerzo a la tensión(N/cm2
80
y = 1,059x + 0,8179
70
60
50
x=34.7048913
40
30
20
10
x=32
0
0
10
20
30
40
Tiempo(min)
50
60
70
80