Modelagem computacional de dados estocásticos de

Transcrição

XII Simpósio Brasileiro de Automação Inteligente (SBAI)
Natal – RN, 25 a 28 de outubro de 2015
MODELAGEM COMPUTACIONAL DE DADOS ESTOCÁSTICOS DE SÉRIE
TEMPORAL MULTIVARIÁVEL NO ESPAÇO DE ESTADO PELO MÉTODO DE
AKAIKE: ANÁLISE E APLICAÇÃO
MARLENY A. CHARAGUA JAVIER∗ ANGIE J. FORERO∗ CELSO P. BOTTURA∗
∗
DSIF-FEEC-UNICAMP, Av. Albert Einstein - 400, Cidade Universitária Zeferino Vaz
Distrito Barão Geraldo
Campinas, SP, 13083-852, Brasil
Email: [email protected],[email protected],[email protected]
Abstract— The state-space realization theory of dynamical systems developed by Kalman received important
contributions to the stochastic case of Faurre and Akaike. In this paper first we present some aspects of the
theory of stochastic realization by Akaike. Then we present the method due to Akaike implemented in MATLAB
and apply it to the computational modeling of stochastic data of multivariate time séries. At the end we analyze
the results.
Keywords—
Data modeling, Stochastic Realization, Akaike, Multivariate Time Series.
Resumo— A teoria da realização no espaço de estado de sistemas dinâmicos desenvolvida por Kalman recebeu
importantes contribuições para o caso estocástico de Faurre e de Akaike. Neste trabalho primeiramente tratamos
de alguns aspectos da teoria de realização estocástica de Akaike. Em seguida apresentamos o método de Akaike
implementado em MATLAB e o aplicamos na modelagem computacional de dados estocásticos de séries temporais
multivariadas. Para finalizar fazemos uma análise dos resultados obtidos.
Palavras-chave—
1
Modelagem de dados, Realização Estocástica, Akaike, Séries Temporais Multivariádas
Introdução
no espaço de estado na forma inovativa Kalman
(1960), a construção das matrizes de Hankel e Toeplitz a partir das covariâncias do futuro e do passado da série temporal; depois mostra-se a abordagem geométrica de Akaike. Nela, de forma especial, definimos os espaços preditores, os vetores
base x e x̆, bem como apresentamos o cálculo associado à análise de correlação canônica entre o
futuro e o passado da série temporal pela decomposição em valores singulares da matriz de Hankel
e a solução aproximada da equação algébrica de
Ricatti. Em seguida é calculada a tripla (A, C, K)
do modelo inovativo.
Finalmente o algoritmo apresentado é aplicado em dois exemplos de séries temporais multivariadas.
A série temporal multivariada estocástica constitui um processo estocástico vetorial, e os modelos
dessas séries podem ser descritos no espaço de estado.
A modelagem computacional de dados de séries temporais tem sido abordada por diversas
áreas de estudo, devido à grande importância de
encontrar modelos matemáticos que possam descrever o comportamento dinâmico da série temporal. Alguns trabalhos relacionados com a modelagem de séries temporais e a identificação de
sistemas multivariáveis no espaço de estado desenvolvidos no Laboratorio de Controle e Sistemas Inteligentes -LCSI- UNICAMP podem ser vistos em
Torrico Cáceres (2005), Clavijo (2008), Tamariz
(2005), Barreto (2002), Giesbrecht (2013), Tobar
(2013), Alegria (2015), Serra (2005).
A teoria da realização estocástica de Akaike
(1974) está baseada na teoria da realização de sistemas lineares desenvolvida por Kalman (1963),
no algoritmo de realização determinı́stica de Ho
e Kalman (1966) e no algoritmo de realização estocástica de Faurre (1976). O método proposto
por Akaike trata o problema da realização estocástica com uma abordagem geométrica, onde a
partir dos dados da série temporal são gerados os
espaços preditores do futuro e do passado. Aplicando a análise de correlação canônica aos espaços preditores são obtidos os vetores base ortonormais, os quais são usados como vetores de estado
na representação Markoviana, ver Akaike (1975).
Neste artigo apresentamos de forma breve,
o problema da realização estocástica, o modelo
2
O Problema de Realização Estocástica
Dada uma série temporal y(t) para t = 0, ±1, . . .
com média zero e matriz de covariância descrita
por:
Λ(l) = E{y(t + l)y T (t)},
l = 0 ± 1, . . . (1)
onde E{·} é o operador esperança matemática, o
problema da realização estocástica é encontrar um
modelo Markoviano no espaço de estado com a
forma inovativa, a partir das matrizes de covariância (1) da saı́da y(t):
x(t + 1)
y(t)
= Ax(t) + Ke(t)
= Cx(t) + e(t)
(2)
onde x(t) ∈ Rn é o vetor de estado, K ∈ Rn×p é
o ganho de Kalman , A ∈ Rn×n e C ∈ Rp×n são
1830
as matrizes do sistema, e e(t) ∈ Rp é o processo
de inovação, expresso como um ruido branco com
media zero e matriz de covariância:
4 = E{e(t)eT (t)}
3
Neste trabalho o problema de modelagem computacional de dados estocásticos de série temporal
multivariada é abordado pela teoria da realização
estocástica baseada em correlações canônicas proposta por Akaike (1974), Akaike (1976).
Nesta teoria, a partir de y(t) é gerado o espaço
Yt definido por:
(3)
Para o modelo descrito em (2), definimos a matriz
de observabilidade estendida dada por:
O=
h
CT
AT C T
AT
2
CT
···
i
(4)
Yt = span{y(t), t = 0, ±1, 2, . . .}
e a matriz de controlabilidade estendida dada por:
C=
onde
C̄ T
AC̄ T
A2 C̄ T
···
onde span{· · · } representa o espaço fechado de
Hilbert gerado pelos elementos infinitos {· · · }.
O espaço Yt é dividido nos subespaços do futuro Yt+ e do passado Yt− , dados por:
(5)
C̄ T = E{x(t + 1)y(t)T }
Yt+ = span{y(t), y(t + 1), . . .},
Yt− = span{y(t − 1), y(t − 2), . . .}
A matriz de Hankel é calculada com as matrizes de observabilidade e controlabilidade estendidas, da seguinte forma:
H = OC
A estimativa de variância minima do futuro
baseado no passado ŷf |p é calculada mediante a
projeção ortogonal do futuro f (t) sobre o subespaço do passado Yt− , como é mostrado na figura
1.
(6)
A partir dos dados da série temporal y(t),
definem-se os vetores do futuro e do passado como:


y(t)


f (t) := y(t + 1) ,
..
.


y(t − 1)


p(t) := y(t − 2)
..
.
f (t)
A matriz de Hankel de covariância é calculada a
partir da matriz de covariância cruzada do futuro
e do passado, da forma:

Λ(1)
Λ(2)

H = E{f (t)pT (t)} = Λ(3)

..
.
Λ(2)
Λ(3)
Λ(4)
..
.
Λ(3)
Λ(4)
Λ(5)
..
.
0
=
=
E{f (t)f T (t)}

Λ(0) ΛT (1)
Λ(1) Λ(0)

Λ(2) Λ(1)

..
..
.
.

ΛT (2) . . .
ΛT (1) . . .

Λ(0) . . .

..
..
.
.
...
. . .

. . .

..
.
Figura 1: Projeção ortogonal do futuro no passado
Assim a equação da estimativa de variância
minima do futuro baseado no passado é dada por:
ŷf |p = Ê{f (t) | Yt− }
= E{p(t)pT (t)}

Λ(0)
Λ(1) Λ(2)
ΛT (1) Λ(0) Λ(1)

= ΛT (2) ΛT (1) Λ(0)

..
..
..
.
.
.

...
. . .

. . .

..
.
(10)
onde Ê{·} representa o operador projeção ortogonal.
Da mesma forma, a estimativa de variância
minima do passado baseada no futuro ŷp|f é calculada mediante a projeção ortogonal do passado
p(t) sobre o subespaço do futuro Yt+ , como é mostrado na figura 2.
A equação da estimativa de variância minima
do passado baseado no futuro é dada por:
(8)
e a matriz de covariância do passado é definida
como a matriz de Toeplitz do passado, da forma:
T−
ŷf |p
Yt−

(7)
A matriz de covariância do futuro é definida como
a matriz de Toeplitz do futuro, da forma:
T+
Modelagem Computacional Estocástica
pelo Método de Akaike
y̆p|f = Ê{p(t) | Yt+ }
(9)
(11)
Com as estimativas de variância minima de
(10) e (11) são gerados o espaço preditor do futuro
1831
onde p é o numero de saı́das, N o numero de
amostras da serie temporal e k é o numero de
linhas das matrizes bloco do futuro Yf e do
passado Yp ; k é escolhido com a condição k n.
p(t)
Com as matrizes do passado Yp e do futuro
Yf obtemos as matrizes de covariâncias Σf f , Σpp
e as matrizes de covariâncias cruzadas Σf p e Σpf :
1 Yp T
Σpp Σpf
T
Yp Yf =
Σ f p Σf f
N Yf
ŷp|f
0
Yt+
Para calcular as matrizes de covariâncias aplicamos a fatoração LQ da forma:
T
1 Yp
L11
0
Q1
√
=
(14)
Y
L
L
QT2
f
21
22
N
Figura 2: Projeção ortogonal do passado no futuro
X̂t+ e do passado X̆t− , como segue:
X̂t+ := Ê{Yt+ | Yt− }
= span{ŷf |p (t + h) | h = 0, 1, . . .}
X̆t− := Ê{Yt− | Yt+ }
= span{y̆p|f (t − l) | l = 1, 2, . . .}
Assim, elas podem ser calculadas em função das
componentes da matriz L em (14):
(12)
(13)
Obtendo os vetores base ortonormais dos espaços
preditores do futuro e do passado temos uma representação no espaço de estado do sistema estocástico. Estes vetores base são chamados vetores
de estado do futuro x̂(t) e do passado x̆(t). A
caracterização especifica da estrutura do vetor de
estado define a representação canônica de um sistema linear estocástico; esta representação canônica é obtida escolhendo o vetor de estado como
o primeiro conjunto máximo de elementos linearmente independentes entre as estimativas de variância minima.
Devido a que as matrizes de covariância de
estado do futuro x̂(t) e do passado x̆(t) são iguais à
matriz de correlação canônica Σ, E{x̂(t)x̂(t)T } =
E{x̆(t)x̆(t)T } = Σ, pode-se usar qualquer um dos
vetores de estado x̂(t) ou x̆(t) indiferentemente,
ver Katayama (2005). Neste trabalho será usado
o vetor de estado do futuro x̂(t) e será denotado
como x(t) no modelo de Markov apresentado em
(2).
Σf p
=
L21 LT11 ,
Σf f
=
L21 LT21 + L22 LT22 ,
Σf f
=
L21 LT21 + L22 LT22
Aplicando a decomposição em valores singulares SVD, obtem-se as correlações canônicas do
futuro e do passado da série temporal, como se
mostra a seguir:
−1/2
Σf f
Σf p ΣTpp/2 = U ΣV T ' Û Σ̂V̂ T
(15)
onde a dimensão do vetor de estado é dada pela
dimensão de Σ̂ e o vetor de estado estimado X k é
dado pela equação (16):
X k = Σ̂1/2 V̂ T Σ−1/2
Yp ∈ Rn×N
pp
(16)
Σ̂ e Σ̄ são as soluções aproximadas das equações algébricas de Ricatti para o futuro e para o
passado respectivamente:
Σ̂
= AΣ̂AT + (C̄ T − AΣ̂C T )
×(Λ(0) − C Σ̂C T )
×(C̄ T − AΣ̂C T )T
(17)
e
3.1
Algoritmo
Σ̄ = AT Σ̄A + (C T − AT Σ̄C̄ T )
Com os dados da série temporal y(t), construı́mos
as matrizes do passado Yp ∈ Rkp×N e do futuro
Yf ∈ Rkp×N , da forma:


y(k − 1)
y(k)
. . . y(N + k − 2)
y(k − 2) y(k − 1) . . . y(N + k − 3)


Yp := 

..
..
..


.
.
.
y(0)
y(1)
...
y(N − 1)

y(k)
y(k + 1)
 y(k + 1) y(k + 2)
Yf := 
 ...
...
y(2k − 1)
y(2k)
×(Λ(0) − C̄ Σ̄C̄ T )−1
×(C − C̄ Σ̄A)
(18)
Os valores singulares de Σ̂ e Σ̄ são as correlações
canônicas do futuro e do passado do processo
estacionário y(t).

. . . y(k + N − 1)
...
y(k + N ) 


...
...
. . . y(N + 2k − 2)
1832
A partir da decomposição em valores singulares, obtemos a observabilidade Ok e a controlabilidade Ck , como:
−1/2
Ok = Σf f
Û Σ̂1/2 ,
Ck = Σ̂1/2 V T ΣTpp/2
(19)
As matrizes A, C e C̄ T são calculadas a partir das matrizes de observabilidade e controlabilidade, da forma:
A partir da série temporal y(t) são estimadas as matrizes (As , Ks , Cs ) pelo algoritmo de
Akaike
A = O†k Ok , C = Ok (1 : p, :), C̄ = Ck (:, 1 : p)
(20)
onde:
Ok = Ok (1 : (k − 1)p, :)
As =
Ks =
e
Ok = Ok (p + 1 : kp :)
Cs =
O ganho de Kalman é:
K = (C̄ T − AΣ̂C T )(Λ(0) − C Σ̂C T )−1
−0.8314
−0.3738
0.3364
−0.4580
−0.0798
−0.945
0.1805
−0.6320
1.9227
−2.5746
−3.2490
1.3082
(21)
Para avaliação dos resultados obtidos, comparamos a sequência calculada ys (t) gerada com
as matrizes estimadas (As , Cs , Ks ) Figura 3 (B e
E) com a sequência vetorial y(t), Figura 3 (A e
D). Consideramos, também, a diferença entre as
duas saı́das y(t) − ys (t), Figura 3 (E e F).
onde Λ(0) = Σf f (1 : p, 1 : p).
3.2
Sı́ntese do Metodo
O método de Akaike passo a passo é o seguinte:
1. Calcule a decomposição LQ de (14)
2. Calcule a SVD segundo (15)
A) Saida y1 Real
20
Amplitude
3. Calcule as matrizes de observabilidade e de
controlabilidade dadas por (19)
4. Calcule as matrizes A, C e C̄ T com (20)
10
0
−10
−20
0
2
4
6
8
10
8
10
B) Saida y1 Estimada
5. Calcule o ganho de Kalman K como na equação (21).
Amplitude
20
6. Finalmente represente o modelo de espaço de
estado na forma inovativa (2).
10
0
−10
−20
0
2
4
6
C) Erro de estimacão y(1)−yest(1)
4
1
Exemplos de modelagem de dados de
séries temporais multivariáveis
0.5
0
−0.5
O algoritmo da realização estocástica devido ao
Akaike é aplicado na modelagem computacional
de dados de séries temporais multivariadas. Dois
casos são apresentados a seguir.
−1
0
2
4
6
8
10
8
10
8
10
D) Saida y2 Real
10
Caso 1
Amplitude
4.1
Considerando o seguinte modelo de segunda
ordem ”benckmark” no espaço de estado com a
forma inovativa:
−0.735 −0.363
A=
0.333 −0.565
−1.502 −0.949
K=
−0.945 −0.088
−1.438 −0.680
C=
1.067 −0.531
5
0
−5
−10
0
2
4
6
E) Saida y2 Estimada
Amplitude
10
5
0
−5
−10
0
2
4
6
F) Erro de estimacão y(2)−yest(2)
1
0.5
0
geramos a série temporal multivariada da seguinte
forma:
y1 (t)
y(t) =
, com t=1 ,2, 3. . . 1000,
y2 (t)
perı́odo de amostragem de 1 × 10−2 s e 10s de
duração.
−0.5
−1
0
2
4
6
8
10
Tempo em s
Figura 3: Comparação dos resultados do caso 1.
1833
4.2
Caso 2
A) Saida y1 Real
20
Amplitude
Considerando o seguinte modelo de ordem 3 no
espaço de estado com a forma inovativa:


−0.5465 0.6630 −0.1199
A =  −0.8468 −0.8542 −0.0653 
−0.2463 −1.2013 0.4853


−0.5955 −0.0793
K =  −0.1497 1.5352 
−0.4348 −0.6065
−1.3474 −0.9036 −0.6275
C=
0.4694
0.0359
0.5354
0
−10
−20
0
2
4
6
8
10
8
10
B) Saida y1 Estimada
Amplitude
20
10
0
−10
−20
0
2
4
6
C) Erro de estimacão y(1)−yest(1)
1
0.5
geramos a série temporal multivariada da seguinte
forma:
y1 (t)
y(t) =
, com t=1 ,2, 3. . . 1000, pey2 (t)
rı́odo de amostragem de 1 × 10−2 s e 10s de duração.
A partir da série temporal y(t) são estimadas
as matrizes (As , Ks , Cs ) pelo algoritmo de Akaike


−0.7290 0.6587
0.0107
As =  −0.6686 −0.7028 −0.0512 
0.0051
0.1667
0.5013


−0.1438 −0.1276
0.2162 
Ks =  0.1175
0.3473
0.9298
−1.9481 −5.1173 0.4378
Cs =
0.3995
1.5113 −0.5956
0
−0.5
−1
0
2
4
6
8
10
8
10
8
10
D) Saida y2 Real
Amplitude
10
5
0
−5
−10
0
2
4
6
E) Saida y2 Estimada
Amplitude
10
5
0
−5
−10
0
2
4
6
F) Erro de estimacão y(2)−yest(2)
1
0.5
Para avaliação dos resultados obtidos, comparamos a sequência calculada ys (t) gerada com as
matrizes estimadas (As , Cs , Ks ) Figura 4 (B e E)
com a sequência vetorial y(t),Figura 4 (A e D).
Consideramos, também, a diferença entre as duas
saı́das y(t) − ys (t), Figura 4 (E e F).
5
10
0
−0.5
−1
0
2
4
6
8
10
Tempo em s
Figura 4: Comparação dos resultados do caso 2.
Conclusões
Referências
Com os dados das séries temporais multivariadas
dos dois casos apresentados 1 e 2, obtivemos através do método de Akaike para cada um deles a
realização estocástica (A, K, C) na forma inovativa através do método de Akaike. Vemos que os
erros calculados são desprezı́veis.
Akaike, H. (1974). Stochastic theory of minimal
realization., IEEE Trans. Automatic control
AC-19: 667–674.
Akaike, H. (1975). Markovian representation of
stochastic processes by canonical variables,
SIAM J. control 13: 162–173.
Agradecimentos
Akaike, H. (1976). Canonical correlation analysis
of time series and the use of an information
criterion., System identication: Advances and
case studies (R. Mehra and D.Lainiotis, eds)
pp. 27–96.
Os autores agradecem ao MSc. Jorge Andrés Puerto Acosta por sua ajuda neste trabalho.
Alegria, E. O. J. (2015). Estimação on-line de
parâmetros dependentes do estado (state dependent parameter - sdp) em modelos de regresão não lineares, Master’s thesis, Universidade Estadual de Campinas UNICAMP.
1834
Aoki, M. (1987). State space modeling of time
series, Universitext, Springer, Berlin, Heidelberg, New York.
Soares, A. and Bottura, C. P. (2011). Identificação de séries temporais multivariadas no espaço de estado pelo método de akaike baseado em correlações canônicas com parâmetro
iterativo, Anais do X Simpósio Brasileiro de
Automação Inteligente, Universidade Federal
de São João del-Rei, São João del-Rei, MG,
Brasil, pp. 314–319.
Barreto, G. (2002). Modelagem Computacional
Distribuı́da e Paralela de Sistemas e de Séries Temporais Multivariáveis no Espaço de
Estado, PhD thesis, Universidade Estadual
de Campinas.
Tamariz, A. D. R. (2005). Modelagem Computacional de Dados e Controle Inteligente no
Espaço de Estado, PhD thesis, Universidade
Estadual de Campinas.
Chiuso, A. and Picci, G. (2001). Some algorithmic aspects of subspace identification with
inputs, Int. J. Applied Math and Computer
Science 11(1): 55–75.
Tobar, J. B. Q. (2013). Propostas para modelagem
computacional de series temporais e de sistemas multivariaveis variantes no tempo no espaço de estado, Master’s thesis, Universidade
Estadual de Campinas.
Clavijo, D. G. (2008). Metodos de subespaços para
identificação de sistemas: Propostas de alterações, implementações e avaliações, Master’s thesis, Universidade Estadual de Campinas.
Torrico Cáceres, A. F. (2005). Identificação e Controle Estocásticos Descentralizados de Sistemas Interconectados Multivariáveis no Espaço de Estado, PhD thesis, Universidade Estadual de Campinas.
Faurre, P. (1976). Stochastic realization algorithms, in R. K. Mehra and D. G. Lainiotis (eds), System Identification Advances and
Case Studies, Vol. 126 of Mathematics in Science and Engineering, Elsevier, pp. 1 – 25.
Van Overschee, P. and De Moor, B. (1996).
Subspace Identification for Linear Systems,
Kluwer Academic Pub.
Giesbrecht, M. (2013).
Propostas imunoinspiradas para identificação de sistemas e
realização de séries temporais multivariáveis
no espaço de estado, PhD thesis, Universidade Estadual de Campinas.
Verhaegen, M. (1994). Identification of the deterministic part of mimo state space models
given in innovations from input-output data,
Automatica 30(1): 61–74.
Ho, B. and Kalman, R. E. (1966). Effective
construction of linear, state-variable models
from input/output functions, Regelungstechnik 14: 545–548.
Kalman, R. E. (1960). A new approach to linear filtering and prediction problems, Trans.
ASME J. Basic Engineering 82D: 34–45.
Kalman, R. E. (1963). Mathematical description
of linear dynamical systems, Journal of the
Society for Industrial and Applied Mathematics Series A Control 1(2): 152–192.
Katayama, T. (2005). Subspace Methods for System Identification, Springer.
Lindquist, A. and Picci, G. (1996a). Canonical correlation analysis, approximate covariance extension, and identification of stationary time series, Automatica 32(5): 709–733.
Lindquist, A. and Picci, G. (1996b). Geometric
methods for state space identification, The
Science of Learning Models from Data 50: 1–
69.
Serra, G. L. O. (2005). Propostas de metodologias para Identificação e Controle Inteligentes, PhD thesis, Universidade Estadual de
Campinas.
1835

Modelagem computacional de dados estocásticos de

Transcrição

Documentos relacionados

anexo

Espaço linha de uma matriz

Teoria das Probabilidades

SHELLAC 78`

LISTA 2 DE INTROD `A TOPOLOGIA 2011 Espaços métricos e

EXAME DE QUALIFICAÇ ÃO (TEORIA ERG ÓDICA) (1) Teorema

Reitores na Moncloa - Duvi

Aula2

T´ıtulo Modelagem espaço-temporal de contagens de ovos de

Teorema de Ptolomeu

Comunicação à Imprensa Patheon Italia, a

Tinteiro compatÃ vel BROTHER SÃ©rie 123 com chip

Hough-Circles: Um Módulo de Detecç ˜ao de Circunferências para o