Método dos Mínimos Quadrados

Transcrição

Método dos Mínimos Quadrados
Método dos Mínimos
Quadrados: um resumo
Uma mãe deseja saber o peso1 de seu filho. Na UBS
informaram que é F=12kg. Para verificar isso, ela pesou-se
com o filho no colo, obtendo M+F=79kg. Posteriormente,
pesou-se sem o filho, obtendo M=71kg. Resumindo, aqui
estão os resultados (em kg)
M+F=79
M=71
F=12
Essas equações são inconsistentes! Que valores devemos
atribuir para os pesos da mãe e do filho?
1 – De fato, a massa. Mas tentar desfazer essa confusão é uma batalha perdida
Otaviano Helene
Curso de extensão oferecido no IFUSP em julho/2010
1 – Solução para um problema sem
solução: o MMQ
• M+F=79
• M=71
• F=12.
Procure valores para M e F
que minimizem as diferenças
entre os valores calculados e
os valores experimentais.
Mas ... minimizar com que
critério?
Solução do MMQ: minimizar as diferenças quadráticas.
Primeira dívida: por que essa forma de minimização
Q( M , F ) = ( M + F − 79) 2 + ( M − 71) 2 + ( F − 12) 2
∂Q
∂M
~ ~
F ,M
=0
e
∂Q
=0
∂F F~ , M~
⇓
~ ~
~
2(M + F - 79) + 2(M - 71) = 0
~ ~
~
2(M + F - 79) + 2(F - 12) = 0
Eqs. (1)
Solução:
~
M = 69,7
e
~
F = 10,7
• E se os dados tiverem diferentes precisões?.
Resultados
• M+F=79
• M=71
• F=12
desvio padrão
(incerteza)
3,0
2,0
1,0
Neste caso, minimize
Q( M , F ) =
( M + F − 79)
3
2
2
+
( M − 71)
2
2
2
+
( F − 12)
2
12
Segunda dívida: por que essa forma de ponderação?
Como estimar o desvio padrão
• Exemplo: medidas de um comprimento
• 40,9 40,2 40,5 39,8 40,3 40,4
1
2
σ ≈
( xi − x )
∑
n -1
2
Nesse exemplo, o desvio padrão
dos dados é aproximadamente 3,8.
O desvio padrão da média é
σ
0,36
σx =
≈
= 0,15
n
6
O resultado experimental é 40,35±0,15
Mais dívidas
A origem mais comum dos desvios padrões é a
propagação de incertezas
Pode haver (e isso é comum) covariâncias entre os dados
O MMQ não vale apenas para dados gaussianos
Os resultados do MMQ só tem as propriedades ótimas
quando conhecemos os valores verdadeiros dos desvios
padrões (ou se todos são iguais)
MMQ: Um exemplo, consumo de
combustível
Distância na
cidade (km)
Distância na
estrada (km)
Consumo
(litros)
100
300
39
300
100
49
10
200
22
200
10
29
100
100
22
Qual o rendimento desse veículo (em litros por
quilômetro) na estrada e na cidade? (Suponha que
todos os desvios padrões são iguais.)
Ajuste de parâmetros de funções:
exemplo de uma reta
5
4
3
2
y
O MMQ é muito
usado para o ajuste
de parâmetros em
funções conhecidas
Exemplo: (x; y)
 (1,0; 3,2),
(2,0; -0,2), (3,0; 0,0)
e (4,0; -1,2). Todos
os y’s com o mesmo
desvio padrão 1,0.
1
0
-1
-2
-3
0.5
1
1.5
2
2.5
x
3
3.5
4
4.5
y = a + bx
Q ( a, b) = ∑
Parâmetros a ajustar: a e b
( yi − a − bxi ) 2
O que devemos minimizar
σ i2
Como minimizar 
~ xi
~
1
=
a
+
b
∑ σ i2 ∑ σ i2
σ i2
∑
yi
∑
xi yi
σ i2
x
= a~ ∑ i
σ i2
yi

  1 2
2
∑

σi   ∑ σi
 xy
 = x
∑ i i 2 ∑ i 2
σi  

σi
~ xi2
+b∑
xi
∑ σ
x
∑ σ
2
i
σ i2

  a~
 ⋅  ~
b 
2
i 
2
i
~
∂Q(a~ , b )
=0
~
∂a
~
∂Q(a~ , b )
=0
~
∂b
Equações lineares
A minimização pode ser feita algebricamente,
numericamente ou graficamente
curvas de nivel de Q(a,b) - de 0,5 em0,5
6
5.5
5
a
4.5
4
3.5
3
2.5
2
-2
-1.8
-1.6
-1.4
-1.2
b
-1
-0.8
-0.6
-0.4
Resultado da função ajustada
5
4
3
y
2
1
0
-1
-2
-3
0.5
1
1.5
2
2.5
x
3
3.5
4
4.5
2 – O MMQ não é tendencioso
Uma medida é não-tendenciosa quando o valor
esperado do resultado é igual ao valor da grandeza
medida.
Exemplo: Um detector conta o número de partículas
durante um certo intervalo de tempo. Se a é o número
médio de partículas que em média esperaríamos
observar naquele intervalo de tempo, então a
probabilidade que sejam observados n eventos é dada
por um distribuição de Poisson, Pa(n)=e-aan/n!. É fácil
mostrar que o valor esperado de n é igual a a: <n>=a.
Assim, o número de eventos observado, n, é uma
medida não tendenciosa de a.
Os experimentos em ciências devem ser
tais que os valores esperados das
grandezas medidas sejam iguais a elas.
Exemplo: Se medimos um comprimento
usando réguas não tendenciosas e
procedimentos também não tendenciosos,
o resultado é uma medida não
tendenciosa do objeto medido; os valores
obtidos flutuarão em torno do valor
verdadeiro da grandeza.
Contra exemplo: uma medida
tendenciosa
Suponha que queiramos estimar a área de um
quadrado. Para tal, medimos o lado do do
quadrado (vamos chamar de l o resultado
da medida) por um processo não
tendencioso. Assim, l será igual a l0, o valor
verdadeiro do lado, mais um erro de
medida, e: l=l0+e. Se o valor esperado
desse erro é nulo, <e>=0, então
<l>=<l0+e>=<l0>+<e>=l0+0.
Note que o valor esperado de uma constante é ela mesma e o valor
esperado do produto de uma constante por alguma coisa que
varia é o produto da constante pelo valor esperado daquilo que
varia.
Mas, e a área?
Veja a sequência de equações abaixo.
a = l = ( l0 + e )
2
<a
2
>=< l0
<a
2
>= l0
2
2
= l0
+ 2l0e + e
2
2
> + < 2l0e > + < e >
2
+ 2l0 < e > + < e >
2
< a >= a0 + 0+ < e >≠ a0
E o MMQ?
Vamos voltar ao exemplo inicial (Eqs. (1). Note que as
soluções adotados para M e F dependem linearmente
dos valores medidos, 12, 71 e 79. Assim, se esses
valores são não tendenciosos, então os valores
ajustados pelo MMQ também serão não-tendenciosos.
~ ~
~
2(M + F - 79) + 2(M - 71) = 0
~ ~
~
2(M + F - 79) + 2(F - 12) = 0
~ ~
2M + F = 71 + 79
~
~
M + 2 F = 12 + 79
Conclusão
• O MMQ é não tendencioso no caso linear (as grandezas
medidas dependem linearmente dos dados
experimentais).
• Verifique que os valores ajustados dos parâmetros de
uma reta dependem linearmente dos dados
experimentais (valores de y da equação abaixo)

1

∑
σ i2
 a~  
 ~  =
 b   ∑ xi
2

σ

i

∑ σ2
i 
xi2 
∑ σ2
i 
xi
−1
yi


 ∑
2 
σ
i 

 xi yi

∑
2

σ

i 
Exemplo: não-tendenciosidade e
tendenciosidade
x=
x0-1 p=1/3
x0
p=1/3
x0+1 p=1/3
x é uma medida não tendenciosa de x0:
< x >= (1 / 3)( x0 − 1) + (1 / 3) x0 + (1 / 3)( x0 + 1) = x0
Mas ... a área dada por x2 é
tendenciosa:
(x0-1)2 p=1/3
(x0)2
p=1/3
(x0+1)2 p=1/3
a=
< x >= (1 / 3)( x0 − 1)
2
+ (1 / 3) x02
2
+ (1 / 3)( x0 + 1) =
x02
2
2
+ = a0
3
3
3 – Simplificando as equações do MMQ
 a b  x   ax + by 

  = 

 c d  y   cx + dy 
−1
 a b   a b  1 0

 
 = 

 c d   c d  0 1
t
a b  a c 

 = 

c d  b d 
c
( a b )   = (ac + bd )
d 
a
( a b ) =  
b
t
Formalismo matricial (parece
complicado ... mas simplifica e
facilita generalizações)
M+F=79
M=71
F=12
Forma mais rigorosa:
M0+F0+e1=79
M0+e2=71
F0+e3=12
 79   1 1 
 e1 
  
  M0   
 +  e2 
 71  =  1 0  ⋅ 
 12   0 1   F0   e 
  

 3
Q( M , F ) = ( M + F − 79) 2 + ( M − 71) 2 + ( F − 12) 2
essa equação é idêntica a
t
 79   1 1 
  79   1 1 

  
  M    
  M 

Q( M , F ) =  71  −  1 0  ⋅   ⋅  71  −  1 0  ⋅  
F
F










 12   0 1 
  12   0 1 

Parece que complicou?
• No caso linear, a equação básica do MMQ
sempre pode ser escrita na forma
x

y
 1   11
y 
x21

2
 =
  
 y  
 n   xn1
x12
x22

xn 2
x1m   a10   
 
e1

x2 m   a20   
⋅
+
e


2
  



 
  
xnm   am0   e 
 n
Y=X·A0+e
(dados)=(planejamento)(parâmetros)+(erros)
e
Q(a1,a2,...)=(Y-XA)t·(Y-XA)
∂Q
=0
∂ai a~ , a~ ...
1
2
~
t
−1 t
A = (X X) X Y
Exemplo
(x, y)
(1,0; 3,2)
(2,0; 0,2)
(3,0; 0,0)
(4,0; -1,2)

 1
 3,2  

 1
 0,2  = 
 0,0  1

 1
 − 1,2 
y = a + bx
1
 e1 

2   a0   e2 
 


⋅
+
3   b0   e3 

e 
 4
4
Exemplo
Considere um experimento para determinar a aceleração
da gravidade no qual foram medidas posições e
velocidades em alguns instantes de tempo (dados abaixo).
Adote x(t)=x0+v0t+gt2/2 e v(t)=v0+gt
Construir a equação básica do MMQ e ajustar x0, v0 e g
t(s)
1
2
3
4
5
x(m)
5,1
v(m/s)
10,7
20,8
45,9
40,1
50,4
Exercício: como aproveitar uma
informação aparentemente
incompleta
• Na pesagens mãe e filho obteve-se os
valores 69,7kg e 10,7 kg. Suponha os
dados originais que deram origem a esses
resultados tenham sido descartados e que
a mãe encontrou uma outra balança e
pesando-se com o filho no colo obteve 81
kg. É possível incluir essa nova
informação – insuficiente para estimar os
pesos das duas pessoas – e obter novas
estimativas para os pesos?
• Sim! Veja como:
Y = XA 0 + e
 66,7   1 0 
e 

 
 M0   1 
 +  e2 
 10,7  =  0 1  ⋅ 
 81   1 1   F0   e 

 

 3
  1 0 t  1 0  
~


 M  
 ~  =   0 1   0 1  
 F    1 1   1 1  



−1
t
 1 0   66,7 



 0 1   10,7 
 1 1   81 



Os novos valores a serem adotados são 67,9 e 11,9
4 – Variâncias e covariâncias
• Para usar plenamente o MMQ precisamos
conhecer variâncias e covariâncias.
Vamos lá
• A variância é formalmente definida como
o valor esperado do quadrado da
diferença entre um dado experimental e o
valor verdadeiro medido:
• σ2=<(x-x0)2>
Exemplo
• Considere um equipamento que fornece
como resultado os seguintes valores:
x=
x0-1
p=0,25
x0
p=0,50
x0+1 p=0,25
Note que isso
corresponde a
medida não
tendenciosa
de x.
A variância da medida dessa grandeza é
σ2=(0,25)(x0-1-x0)2+(0,50)(x0-x0)2+(0,25)(x0+1-x0)2=0,50
O desvio padrão é 0,71
Às vezes, precisamos estimar as variâncias a
partir de um conjunto de dados experimentais
40,9 40,2 40,5
39,8 40,3 40,4
1
2
σ ≈
(
x
−
x
)
∑
i
n -1
2
σ
0,36
σx =
≈
= 0,15
n
6
Às vezes, conhecemos muito bem as
variâncias por medidas anteriores:
equipamento usado muitas vezes em
medidas anteriores
Rev. Ensino de Física,13, 1991, O que é uma medida? O. Helene, S.P. Tsai, R.R.P. Teixeira, p.12
Propagação de incertezas (exata no caso linear)
• Veja a sequência de equações
σ x2 = ( x − x0 ) 2 conhecido
y = ax + b , a e b conhecidos
σ y2 = ( y − y0 ) 2 = ( ax + b − ax0 − b ) 2
= ( ax − ax0 ) 2 = a 2 ( x − x0 ) 2 = a 2σ x2
se y = y( x, z , w...)
2
2
 ∂y 
 ∂y 
σ y2 =   σ x2 +   σ z2 + ...
 ∂x 
 ∂z 
Propagação de incertezas: caso não linear 
aproximação
σ x2 conhecido
y = x2
σ y2
=
(
( y − y0 )
2
= ( x0 + e) −
σ y2 ≈ 4 x02σ x2
σ y2
2
 dy 
≈ 
 dx  xexp
2
(
2
= x −
)
2 2
x0
=
(
)
2 2
x0
x02
2
+ 2ex0 + e −
)
2 2
x0
(
= 2ex0 + e
)
2 2
Covariâncias
Origem: dois resultados experimentais são
covariantes se há uma ou mais fontes de
erros que afetem a ambos
Exemplos:
(a) Duas medidas feitas com a mesma
régua: os resultados serão covariantes
(b) Seções de choque medidas no mesmo
acelerador
Matriz de covariâncias
x1, x2, ... xn são n dados experimentais
 σ x2

cov(
x
,
x
)

cov(
x
,
x
)
1 2
1 n 
1

 cov( x2 , x1 )
σ x22
cov( x2 , xn ) 
Vx = 





2
 cov( x , x ) cov( x , x ) 

σ
n 1
n 2
xn


Propagação de variâncias e
covariâncias
y1 ( x1 , x2 ,...xn )
y2 ( x1 , x2 ,...xn )
Vy = DVx D
ym ( x1 , x2 ,...xn )
Di , j
∂yi
=
∂x j
t
5 – Mais resultados
a – O MMQ deve usar o matriz de
covariância dos dados experimentais,
V, o que não foi feito ainda. É fácil
(mas trabalhoso) mostrar que a
solução é
~
t −1 −1 t −1
A = (X V X) X V Y
Exemplo: média de dois dados
x1 e x1 são dois resultados
σ12
para uma mesma grandeza e V = 
 0
0 
σ 22 
o valor a ser adotado para a grandeza, dada pelo
MMQ, pode ser obtido como segue:

2
 x1  1
 e1 


σ
0

1
~
  =  ( x0 ) +   ⇒ x = (1 1) 


 0 σ2
 x  1
e 

2
 2
 2

x1
σ 12
+
−1
1 
  
1 
−1
x2
σ 22
=
1
1
+
σ 12 σ 22
e (propagação variância)
σ ~x2
=
1
1
1
+
σ 12 σ 22
 σ 12 0 

(1 1) 
2
 0 σ2 
−1
 x1 
 =
x 
 2
b – Matriz de covariância dos
parâmetros ajustados
Se
~
t −1 −1 t −1
A = (X V X) X V Y
então, usando
Vy = DVx D
t
podemos mostrar que a matriz de covariância dos
parâmetros ajustados é dada por
VA~
t
−1
−1
= (X V X)
c – As estimativas do MMQ são as de menor variância
entre todas as estimativas lineares. Vamos ilustrar.
Considere dois dados experimentais x1, σ1 e x2, σ2 , não
covariantes, correspondentes a medidas de uma mesma
grandeza. A solução do MMQ é
x1
σ 12
+
x2
2
σ
2
~
x=
1
1
+ 2
2
σ1 σ 2
Procure outra combinação linear de x1 e x2, x’=α x1+(1-α)x2.
É possível mostrar que a menor variância de x’ é obtida
quando a ponderação ocorre como na equação acima
d – O MMQ é não-tendencioso
A equação linear que relaciona os parâmetros aos dados
experimentais é Y=X·A0+e. Como <e>=0 (dados não
tendencioso), então <Y>=XA0. Usando esse resultado em
~
A = (Xt V −1X)−1 Xt V −1Y
temos
~
A = (Xt V −1X)−1 X t V −1 Y =
= (X t V −1X)−1 X t V −1XA 0 = A 0 .
e – A medida de uma grandeza pode afetar o valor
adotado de outra grandeza
Vamos fazer um exemplo numérico. Considere duas grandezas
cujos valores são s1=10 e s2=10, com matriz de covariância
 3 2
V = 

 2 3
Suponha que a primeira dessas grandezas tenha sido medida de
forma independente, obtendo-se o valor s’1=15, com variância
igual a 3 e independente dos resultados anteriores. A matriz de
covariância dos três dados é
Vs1 s 2 s1′
 3 2 0


=  2 3 0
 0 0 3


É fácil mostrar, usando o MMQ, que os novos valores a serem adotados
para s duas grandezas são 12,5 e 11,7. Ou seja, a medida da primeira
grandeza (s1) alterou o valor adotado para a segunda.

Documentos relacionados