1. 5 AJUSTE DE CURVAS POR MÍNIMOS QUADRADOS
5.1 Introdução
O ajuste de curvas é muito utilizado para, a partir de dados conhecidos, fazer-se
extrapolações. Por exemplo, conhece-se os dados de consumo anual de carga elétrica de
uma cidade. A partir destes dados conhecidos, pode-se fazer projeções para o futuro e com
isso, fazer-se um planejamento para que a cidade seja suprida de forma adequada nos anos
subsequentes. A idéia é ajustar uma curva que melhor se ajusta aos dados disponíveis.
Conhecida a equação da curva, pode-se determinar valores fora do intervalo conhecido.
Os dados conhecidos podem ser tabelados e obtidos por meio de experimentos.
Como exemplo, seja os dados da tabela abaixo.
x 1,3 3,4 5,1 6,8 8,0
)(xf 2,0 5,2 3,8 6,1 5,8
A partir dos dados disponíveis, pode-se desejar saber uma estimativa do valor da função
)(xf em 9=x .
A partir dos dados disponíveis, pode-se construir um diagrama de dispersão,
que é a representação em gráfico dos dados disponíveis.
O objetivo é encontrar uma função )(xϕ que seja uma boa aproximação para
os valores tabelados de )(xf e que nos permita extrapolar com uma certa margem de
segurança.
5.2 Formulação Matemática
1
0 1 2 3 4 5 6 7 8 9 10
0
1
2
3
4
5
6
7
8
9
10
f(x)
x
2. Seja o diagrama de dispersão anterior. A partir de uma análise do diagrama de
dispersão deve-se definir uma curva para ser ajustada aos dados. No caso, ajusta-se os
dados por uma reta dada pela função xx 21)( ααϕ += .
A questão é como definir a reta. Define-se para mk ,...,1= onde m é o número
de pontos da amostra o desvio:
)()( kkk xxfd ϕ−=
Uma primeira maneira de definir a reta seria minimizar a soma dos desvios, ou
seja, minimizar ∑=
m
k
kd
1
. O valor de kd pode ser positivo ou negativo, assim, o somatório
não seria representativo dos desvios. Uma primeira solução seria utilizar o somatório dos
valores absolutos de kd , ou seja ∑=
m
k
kd
1
, entretanto o manuseio de expressões que
aparecem valor absoluto é extremamente complexo. A solução mais factível é a utilização
da somo dos desvios ao quadrado, definido por:
[ ]
2
11
2
)()(∑∑ ==
−==
m
k
kk
m
k
k xxfdD ϕ
Para o exemplo a ajuste será feita por uma reta dada por: xx 21)( ααϕ += .
Substituindo na equação acima, tem-se:
2
0 1 2 3 4 5 6 7 8 9 10
0
1
2
3
4
5
6
7
8
9
10
f (x)
x
f i (x)=alfa1+(alfa2)x
3. [ ] ( )[ ] ( )21
2
1
21
2
11
2
,)()()( ααααϕ FxxfxxfdD
m
k
kk
m
k
kk
m
k
k =+−=−== ∑∑∑ ===
O valor de ( )21 ,ααF depende de 21 αα e , ou seja, da reta escolhida para
aproximar a função f(x) tabelada.
Como pode-se definir a reta?
Uma solução é encontrar 1α e 2α , tais que ( )21 ,ααF seja mínimo.
Minimizando ( )21 ,ααF , está-se minimizando os desvios quadráticos. Em função deste
procedimento ,é que adota-se o nome de ajuste de curvas por mínimos quadrados.
A condição necessária para que ( )21 ,ααF seja um mínimo de ( )21 ,ααF é que
as derivadas parciais de ( )21 ,ααF em relação a 1α e 2α sejam zero.
Como ( )21 ,ααF é descrito pela equação:
( ) ( )[ ]
2
1
2121 )(, ∑=
+−=
m
k
kk xxfF αααα
[ ]∑=
=−−−=
∂
∂ m
k
kk xxf
F
1
21
1
0)(2 αα
α
[ ]∑=
=−−−=
∂
∂ m
k
kkk xxxf
F
1
21
2
0)(2 αα
α
Rearranjando as equações chega-se:
∑ ∑∑= ==
=−−
m
k
m
k
k
m
k
k xxf
1 1
2
1
1 0)( αα
∑ ∑∑= ==
=−−
m
k
m
k
k
m
k
kkk xxxxf
1 1
2
2
1
1 0)( αα
Isolando as variávies dos termos constantes, tem-se:
∑∑ ==
=+
m
k
k
m
k
k xfxm
1
2
1
1 )()( αα
∑∑∑ ===
=+
m
k
kk
m
k
k
m
k
k xfxxx
11
2
2
1
1 )()()( αα
Observe que resulta num sistema de equações lineares. Essas equações são
conhecidas como equações normais. Para [ ]T
2ααα = , solução das equações normais,
( )21 ,ααF apresenta seu menor valor.
Solucionando para os valores numéricos do exemplo, tem-se:
3
5. 5.3 Generalização do Método dos Mínimos Quadrados
Seja a função generalizada )(xϕ a ser ajustada:
)(...........)()()()( 332211 xgxgxgxgx nnααααϕ ++++=
Sejam os pontos diponibilizados por meio de uma sequência histórica, ou
obtidos através de experimentos ou medições.
1x 2x 3x ....................................... mx
)( 1xf )( 2xf )( 3xf ....................................... )( mxf
O objetivo é encontrar os coeficientes nαααα ..,,.........,, 321 , tais que a
função )(...........)()()()( 332211 xgxgxgxgx nnααααϕ ++++= se aproxime ao
máximo de )(xf .
O ajuste de )(xϕ pelo método dos mínimos quadrados, consiste em escolher
os ,,...,1, njj =α de tal forma que: [ ]
2
11
2
)()(∑∑ ==
−==
m
k
kk
m
k
k xxfdD ϕ seja mínimo.
Os coeficientes ,,...,1, njj =α que fazem com que )(xϕ se aproxime ao
máximo de f(x) são os que minimizam a função:
( ) [ ] [ ]
2
1
2211
2
1
21 )(...........)()()()()(,....., ∑∑ ==
−−−−=−=
m
k
knnkkk
m
k
kkn xgxgxgxfxxfF αααϕααα
Para determinação dos coeficientes ,,...,1, njj =α acha-se as derivadas
parciais e iguala-se a zero. Nos pontos de mínimo tem-se:
nj
F
j
,...,1,0 ==
∂
∂
α
Derivando a função F, tem-se:
[ ][ ] njxgxgxgxgxf
F m
k
kjknnkkk
j
,...,1,)()(...........)()()(2
1
2211 =−−−−−=
∂
∂
∑=
ααα
α
Impondo a condição necessária para o mínimo, tem-se:
[ ][ ] njxgxgxgxgxf
m
k
kjknnkkk ,...,1,0)()(...........)()()(
1
2211 ==−−−−∑=
ααα
5
6. De forma explícita, tem-se:
[ ][ ]
[ ][ ]
[ ][ ] 0)()(...........)()()(
0)()(...........)()()(
0)()(...........)()()(
1
2211
1
22211
1
12211
=−−−−
=−−−−
=−−−−
∑
∑
∑
=
=
=
m
k
knknnkkk
m
k
kknnkkk
m
k
kknnkkk
xgxgxgxgxf
xgxgxgxgxf
xgxgxgxgxf
ααα
ααα
ααα
Separando os somatórios e isolando os termos com variáveis dos termos
constantes, tem-se:
∑∑∑∑
∑∑∑∑
∑∑∑∑
====
====
====
=
++
+
=
++
+
=
++
+
m
k
knkn
m
k
knkn
m
k
knk
m
k
knk
m
k
kkn
m
k
kkn
m
k
kk
m
k
kk
m
k
kkn
m
k
kkn
m
k
kk
m
k
kk
xgxfxgxgxgxgxgxg
xgxfxgxgxgxgxgxg
xgxfxgxgxgxgxgxg
11
2
1
21
1
1
1
2
1
22
1
221
1
21
1
1
1
12
1
121
1
11
)()()()(......)()()()(
)()()()(......)()()()(
)()()()(.......)()()()(
ααα
ααα
ααα
As equações acima formam um sistema de equações lineares que de forma
matricial pode ser representado por:
bA =α
Onde:
=
=
=
nnnnnn
n
n
b
b
b
b
aaa
aaa
aaa
A
2
1
2
1
21
22221
11211
α
α
α
α
cujos valores dos elementos da matriz de coeficientes e do vetor independente são
determinados por:
njeniparaxgxgaa kj
m
k
kijiij ,...,1,...,1)()(
1
==== ∑=
;
6
7. niparaxgxfb ki
m
k
ki ,...,1)()(
1
== ∑=
;
n é o número de termos da função )(xϕ a ser ajustada;
m é o número de pontos da amostra conhecida.
Exemplo:
Seja os valores da função apresentados na tabela abaixo. Através do Método de
Mínimos Quadrados determine a equação da curva que melhor ajuste os pontos dados.
x -1,0 -0,75 -0,6 -0,5 -0,3 0,0 0,2 0,4 0,5 0,7 1
f(x) 2,0 1,153 0,45 0,4 0,5 0,0 0,2 0,6 0,512 1,2 2,05
Representando os pontos através do seu diagrama de dispersão tem-se:
Pode-se observar que uma boa possibilidade é ajustar os pontos a uma parábola
passando pela origem.
Portanto, procura-se a função 2
)( xx αϕ = que melhor represente f(x). Para a
notação utilizada, 2
)( xxg = .
A partir das equações do método, tem-se:
7
-1.5 -1 -0.5 0 0.5 1 1.5
-0.5
0
0.5
1
1.5
2
2.5
f (x)
x
8. )()()]([
11
1
11
1
2
k
k
k
k
k xgxfxg ∑∑ ==
=α
Substituindo:
k
k
k
k
k xxfx ⋅=⋅ ∑∑ ==
11
1
11
1
22
)(][ α
como ∑=
=
11
1
22
8464,2][
k
kx e 8756,5)(
11
1
=⋅∑=
k
k
k xxf , tem-se a equação linear:
0642,28756,58464,2 =⇒= αα
A equação 2
0642,2)( xx =ϕ é a parabola que melhor aproxima a função
tabelada através do Método de Mínimos Quadrados.
Exemplo:
Aproximar a função tabelada apresentada no exemplo anterior por uma função do tipo:
2
321)( xxx αααϕ ++=
x -1,0 -0,75 -0,6 -0,5 -0,3 0,0 0,2 0,4 0,5 0,7 1
f(x) 2,0 1,153 0,45 0,4 0,5 0,0 0,2 0,6 0,512 1,2 2,05
Deve-se montar o sistema linear bA =α , onde:
3,...,13,...,1)()(
11
1
==== ∑=
jeiparaxgxgaa kj
k
kijiij ;
3,...,1)()(
11
1
== ∑=
iparaxgxfb ki
k
ki .
Para a função )(xϕ proposta, tem-se:
2
321 )(,)(,1)( xxgexxgxg ===
Chega-se portanto a:
111
11
1
2
11 == ∑=k
a
∑=
⋅==
11
1
2112 1
k
kxaa
8
9. ∑=
⋅==
11
1
2
3113 1
k
kxaa
∑=
=
11
1
2
22
k
kxa
∑=
⋅==
11
1
2
3223
k
kk xxaa
∑=
=
11
1
22
33
k
kk xxa
∑=
=
11
1
1 )(
k
kxfb
∑=
=
11
1
2 )(
k
kk xfxb
∑=
=
11
1
2
3 )(
k
kk xfxb
Para facilitar os cálculos, pode-se construir a tabela:
Valores Tabelados ∑
x -1,0 -0,75 -0,6 -0,5 -0,3 0,0 0,2 0,4 0,5 0,7 1 -0,35
f(x) 2,05 1,153 0,45 0,4 0,5 0,0 0,2 0,6 0,512 1,2 2,05 9,115
2
x 1,0 0,5625 0,36 0,25 0,09 0,0 0,04 0,16 0,25 0,49 1 4,2025
3
x -1,0 -0,4218 -0,216 -0,125 -0,027 0,0 0,008 0,064 0,125 0,343 1 -0,2498
4
x 1,0 0,3164 0,1296 0,0625 0,0081 0,0 0,0016 0,0256 0,0625 0,2401 1 2,8464
kk xxf )( -2,05 -0,8647 -0,270 -0,200 -0,150 0,0 0,04 0,24 0,256 0,84 2,05 -0,1087
2
)( kk xxf 2,05 0,6486 0,162 0,100 0,045 0,0 0,008 0,096 0,128 0,588 2,05 5,8756
Com os valores calculados, chega-se ao sistema linear:
−=
−
−−
−
8756,5
1087,0
115,9
8464,22498,02025,4
2498,02025,435,0
2025,435,011
3
2
1
α
α
α
Resultando em:
=
9377,1
0970,0
0914,0
α
A equação da parábola ajustada é dada por:
9
10. 2
9377,10970,00914,0)( xxx ++=ϕ
Exemplo:
Ajuste os dados apresentados na tabela abaixo, utilizando o Método dos
Mínimos Quadrados por:
a) Uma reta.
b) Uma parábola do tipo
2
321)( xxx αααϕ ++= .
c) Como você compararia as duas curvas com relação aos dados.
x 1 2 3 4 5 6 7 8
f(x) 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0
O diagrama de dispersão é dado pela figura:
Constrói-se a tabela:
Valores Tabelados ∑
10
0 1 2 3 4 5 6 7 8 9
0
0.5
1
1.5
2
2.5
f (x)
x