Regresion linealr

REGRESIÓN E INTERPOLACIÓN

REGRESIÓN LINEAL

MÉTODOS NUMÉRICOS

REGRESIÓN LINEAL
FORMULACIÓN DEL PROBLEMA DE LA REGRESIÓN
Dados n puntos (x1, y1), (x2, y2), … , (xn, yn) hallar la función
y= f(x), que se ajuste mejor a ellos.
El criterio que normalmente se usa para establecer el mejor
ajuste es el de mínimos cuadrados que consiste en minimizar
la suma de los cuadrados de los errores residuales.
El error residual para el punto i, se define como:

i  yi  f ( xi )

La suma de los cuadrados de los errores residuales se
expresa como:
n

n

2

Sr    i    yi  a0  a1 xi 
i 1

2

2

i 1

REGRESIÓN LINEAL
Dados n puntos (x1, y1), (x2, y2), … , (xn, yn) hallar la
función y  a0  a1 x que se ajuste mejor a ellos.
Para este caso el error residual para el dato i se puede
expresar como:
εi  yi  a0  a1 xi 

La suma de los cuadrados de los errores residuales, en
este caso, sería:
n

n

2

Sr    i    yi  a0  a1 xi 
i 1

3

2

i 1

REGRESIÓN LINEAL
Las constantes a0 y a1, del modelo lineal serán aquellas que
minimicen a Sr, lo cual requieres derivar Sr con respecto a cada uno de
los coeficientes:
n
S r
 2  yi  a0  a1 xi  1  0
a0
i 1
n
S r
 2  yi  a0  a1 xi  xi   0
a1
i 1

Lo cual puede escribirse como:
n

n

n

a  a x   y
i 1

0

n

i 1
n

1 i

a x  a x
i 1

0 i

i 1

1 i

2

i 1
n

i

  yi xi
i 1

REGRESIÓN LINEAL
n

Teniendo en cuenta  a 0  na 0 se obtiene:
i 1

n

n

i 1

i 1

na0   a1 xi   yi
n

n

a x  a x
i 1

0 i

i 1

1 i

2

n

  yi xi
i 1

Que se puede expresar matricialmente como;

 n
n
 x
 i
 i 1

5


 n

xi 
yi 
 a0   
i 1
     ni 1 
n
a
xi2   1   yi xi 
 
 i 1

i 1



n

REGRESIÓN LINEAL
Aplicando la regla de Crámer, para resolver este
sistema, se ontiene
n

y
i 1
n

a0 

n

x

i

yx
i

i 1

i

n

x

2
i

i 1
n



x

n
n

x
i 1

i

i 1
n

i

n

y x
i 1

i 1
n

  yi xi  xi

i 1

i 1
n

i 1

i 1

2
i

a0 

n

n

n

x y x x y
i 1

2
i

i 1

i 1

n

i 1

x

n

i

i 1

i

i 1
2

 n 
n x   xi 
i 1
 i 1 
n

2
i

6

i

n

n xi2   xi  xi

i

i 1
n

n

2
i

i

i

REGRESIÓN LINEAL
n

y
i 1
n

a0 

n

x

i

yx
i

i 1

i

i 1
n

n

x

2
i

i 1
n



 xi

n
n

x
i 1

i

i

n

y x
i

i 1

i 1
n

n

  yi xi  xi
i 1
n

i 1

i 1

x
i 1

2
i

a0 

n

n

n

x y x x y
i 1

2
i

n

i 1

n

n  xi2   xi  xi

i 1
n

n

i 1

i

i 1

i

i 1
2

 n 
n x   xi 
i 1
 i 1 
n

2
i

7

2
i

i

i

i 1

REGRESIÓN LINEAL
n

y

n

i 1
n

n

a1 

x

yx

i

i 1

i 1
n

i

n

x

i

i 1
n

n

i

x

n

i 1

i



i

n

n

i 1
n

i 1
n

i 1
n

n  yi xi   xi  yi
n  xi2   xi  xi
i 1

i 1

x
i 1

2
i

n

a1 

n

n

i 1

i 1

i 1

n xi yi  xi  yi
n

2 
n xi   xi 
i 1
 i 1 
n

2

i 1

EJEMPLO
Tomado del texto: Chapra, Steven C y Canale, Raymond. Métodos Numéricos para
ingeniero. Quinta edición

Se sabe que el esfuerzo a la
tensión de un plástico se
incrementa como función del
tiempo que recibe tratamiento
a base de calor. Se obtuvieron
los datos que se muestran en
la tabla.
Ajuste una línea recta a estos
datos y utilice una ecuación
para determinar el esfuerzo a
la tensión en un tiempo de 32
minutos

Contador

Tiempo
(min)

Esfuerzo a la
tensión(N/cm2)

i

xi

yi

1

10

5

2

15

20

3

20

18

4

25

40

5

40

33

6

50

54

7

55

70

8

60

60

9

75

78

EJEMPLO
esfuerzo a la tensión(N/cm 2)
90

Esfuerzo a la tensión(N/cm2

80
70
60
50
40
30
20

10
0
0

10

20

30

40

50

60

70

80

Tiempo(min)

GRÁFICO DE DISPERSIÓN PARA: Esfuerzo a la tensión vs. Tiempo

EJEMPLO
La solución básicamente consiste en hallar los coeficientes de la
ecuación de la recta de mejor ajuste. Para el problema planteado, la
forma de la ecuación de la recta sería:

y  a0  a1 x
Donde y= esfuerzo a la tensión(N/cm2)
x= tiempo(min)

Para determinar los coeficientes a0 y a1, del modelo lineal, se utiliza
el procedimiento de regresión lineal, para lo cual se deben calcular las
siguientes cantidades:
n

 xi yi
i 1

n

xi2

i 1

n

x
i 1

i

n

y
i 1

i

EJEMPLO
Teniendo en cuenta que para este problema, n=9 datos, entonces:
9

x y
i

i 1

i

9

x y
i 1

i i

 x1 y1  x2 y2  x3 y3  x4 y4  x5 y5  x6 y6  x7 y7  x8 y8  x9 y9
 10  5  15  20  20 18  25  40  40  33  50  54  55  70  60  60  75  78
9

x y
i 1

9

x  x  x
i

i 1

1

2

i i

 19030

 x3  x4  x5  x6  x7  x8  x9

9

 x  10  15  20  25  40  50  55  60  75
i 1

i

9

 x  350
i 1

i

EJEMPLO
9

y

i

i 1
9

y

i

i 1

 y1  y2  y3  y4  y5  y6  y7  y8  y9
 5  20  18  40  33  54  70  60  78
9

 x  378
i

i 1

9

x
i 1

9

x
i 1

2
i

2
i

2
2
2
2
2
2
2
 x12  x2  x3  x4  x5  x6  x7  x82  x9

 102  152  202  252  402  502  552  602  752
9

xi2  17700

i 1

EJEMPLO
Con estas cantidades calculadas, se pueden utilizar las
fórmulas para los coeficientes, obtenidas anteriormente:
n

a0 

n

n

n

x y x x y
2
i

i 1

i 1

i

i

i 1

 n 
n x   xi 
i 1
 i 1 
n

2
i

n

a1 

i 1
2

n

n

i 1

i 1

i 1

n xi yi  xi  yi
 n 
n x   xi 
i 1
 i 1 
n

2
i

2

i

i

EJEMPLO
Reemplazando:
9

x y
i 1

i i

 19030

9

 x  350
i 1

i

9

 xi  378
i 1

9

x
i 1

Se obtiene:
a0 

17700  378  350 19030
9 17700  350 

a1 

2

9 19030 350  378
9 17700   350 

2

 0.81793478

 1.05896739

2
i

 17700

EJEMPLO
Reemplazando estos valores en el modelo lineal, se obtiene
la ecuación de la recta de mejor ajuste:
y a0  a1 x

y  0.81793478+1.05896739x
Remplazando y, x por los nombre reales de las
variables, quedaría:
Esfuerzo a la tensión( N / cm2 )  0.81793478+1.05896739  tiempo  min 

En la siguiente diapositiva se presenta una gráfica de los
datos iniciales con la recta de regresión

EJEMPLO
90


80

y = 1,059x + 0,8179

70
60
50
40
30
20

10
0
0

10

20

30

40

50

60

70

Tiempo(min)

Datos originales con la recta de regresión obtenida

80

EJEMPLO
Para estimar el valor del esfuerzo a la tensión para un
tiempo igual a 32 minutos, se utiliza la ecuación
obtenida:
Esfuerzo a la tensión(32)  0.81793478+1.05896739  32
Esfuerzo a la tensión(32)  34.7048913

En la siguiente figura se ilustra gráficamente la
obtención del esfuerzo para tiempo=32 minutos

EJEMPLO
90


80

y = 1,059x + 0,8179

70
60
50

x=34.7048913

40
30
20

10

x=32

0
0

10

20

30

40

Tiempo(min)

50

60

70

80

Regresion linealr

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Ähnlich wie Regresion linealr

Ähnlich wie Regresion linealr (20)

Mehr von Pervys Rengifo

Mehr von Pervys Rengifo (15)

Kürzlich hochgeladen

Kürzlich hochgeladen (20)

Regresion linealr