Inferência para Cadeias de Markov

Transcrição

57a. Reunião Anual da RBras
Inferência para Cadeias de Markov
Nancy L. Garcia
Universidade Estadual de Campinas - UNICAMP
[email protected], www.ime.unicamp.br/˜nancy
1
Piracicaba- 05 a 09 de maio de 2012
Inferência clássica
Seja uma amostra aleatória X0 , X1 , X2 , . . . , Xn :
• X0 , X1 , X2 , . . . , Xn são i.i.d.
• distribuição de probabilidade conjunta:
P(X0 ∈ A0 , . . . , Xn ∈ An ) =
n
Y
P(Xi ∈ Ai ) =
i=0
n
Y
P(X ∈ Ai ),
i=0
onde X tem a mesma distribuição das Xi ’s.
Considere a sequência de v.a’s Xi.j onde Xi,j = 1 se chove no
i-ésimo dia do j-ésimo ano e Xi,j = 0 se não chove no i-ésimo dia
do j-ésimo ano.
Faz sentido pensar que estas v.a’s são i.i.d.?
2
Ferrugem asiática:
• Doenáa que está atacando as culturas de soja causando muito
prejuı́zo aos produtores e demanda aplicaáões de fungicida
causando danos ao meio ambiente e excessivos gastos.
• Um dos fatores que influenciam para a ocorrência da doenáa é
o molhamento foliar superior a oito horas.
• Molhamento foliar – acúmulo de água lı́quida causado por
precipitaáão ou condensaáão da umidade atmosférica na forma
de orvalho - superior a 8 horas.
3
As variáveis coletadas em quatro estaáões meteorológicas:
1. molhamento foliar (codificada como 1 se há molhamento
superior a oito horas e 0 caso contrário),
2. velocidade do vento em m/s,
3. umidade relativa do ar,
4. precipitaáão em mm e temperatura média em ◦ C.
Esse dados foram enviados diariamente para o CEPAGRI Unicamp (Centro de Pesquisas Meteorológicas e Climáticas
Aplicadas à Agricultura).
4
Fonsechi (2006)
• Modelo de Regressão Logı́stico
• variáveis dependem do tempo anterior, por exemplo, se choveu
no tempo t − 1 influencia se haverá molhamento ou não no
tempo t. Obviamente não podemos esperar independência de
um tempo para o outro.
5
Processos Estocásticos
de v.a’s
Um processo estocástico é uma coleção
{Xα , α ∈ T }
onde T é um conjunto de ı́ndices que pode ser discreto contı́nuo.
Em geral, T = N ou [0, ∞).
Neste caso, sempre é possı́vel escrever a distribuição conjunta de
um número finito destas v.a.’s
P(X0 ∈ A0 , . . . , Xn ∈ An ) =
n
Y
P(Xi ∈ Ai |X0 ∈ A0 , . . . , Xi−1 ∈ Ai−1 ).
P(X0 ∈ A0 )
i=1
6
A teoria de Processos Estocásticos estuda diversas especificações
para as probabilidades condicionais acima e obtém resultados
similares aos clássicos:
• Lei dos Grandes Números (Teorema Ergódico);
• Teorema Central do Limite;
• Lei Assintótica;
• Estimação de máxima verossimilhança;
• Testes de hipóteses;
• Estimação não paramétrica.
7
1. Xt : número de terremotos com magnitude maior que 5 que
ocorrem na região de São Francisco no perı́odo de (0, t], onde 0
é o inı́cio do registro, por exemplo, 0:00hs do dia 01/01/1950.
Processo a tempo contı́nuo com espaço de estados
discreto.
2. (Xk , Yk ): número de nascimento e mortes, respectivamente,
ocorridos no dia k em uma colônia de vetores transmissores de
doença de Chagas. Processo a tempo discreto com espaço
de estados discreto.
3. Xy,t : espessura da camada de ozônio na locação y no tempo t.
Aqui temos T = R2 × [0, ∞). Processo a tempo contı́nuo
com espaço de estados contı́nuo.
8
4. Xt : a intensidade de um sinal a uma distância t da origem.
Processo a tempo contı́nuo com espaço de estados
contı́nuo. além disso, “tempo” é a distância.
5. Clientes chegam a uma fila de supermercado de acordo com um
processo de Poisson. Os clientes são atendidos por um caixa
que atende cada cliente de acordo a uma distribuição
exponencial de parâmetro 1. Seja Xt o número de clientes na
fila.
6. Temos duas caixas com um total de d bolas numeradas de 1 a
d. Em cada experimento selecionamos uma bola ao acaso e a
trocamos de caixa. Seja Xt o número de bolas na caixa 1 no
instante t. Processo a tempo discreto com espaço de
estados discreto.
9
• Espaço de estados discreto e tempo discreto
• X0 , X1 , . . . v.a.’s discretas com valores possı́veis I enumerável.
Propriedade de Markov
P(Xn = x|X0 = x0 , X1 = x1 , . . . , Xn−1 = xn−1 )
=
P(Xn = x|Xn−1 = xn−1 )
para todo n ≥ 1 e todos os valores de x, x0 , x1 , . . . , xn−1 ∈ I.
Portanto,
P(X0 = x0 , X1 = x1 , . . . , Xn = xn )
=
P(X0 = x0 )P(X1 = x1 |X0 = x0 )P(X2 = x2 |X1 = x1 ) × . . .
×P(Xn−1 = xn−1 |Xn−2 = xn−2 )P(Xn = xn |Xn−1 = xn−1 ).
10
Aplicação:
O “PageRank” de uma página da web como usado pelo Google é
completamente definido através de uma cadeia de Markov.
Se N é o número de páginas conhecidas e uma página i tem ki
”links”, então a página tem probabilidade de transição
α
1−α
+
ki
N
para todas as páginas às quais está ”linkada”e
1−α
N
para todas as páginas as quais não está ”linkada”. O parâmetro α
utilizado é aproximadamente 0.85.
11
Exemplo 1: Sejam Y0 , Y1 , . . . v.a.’s discretas i.i.d.. Defina
Sn = Y0 + . . . + Yn
Neste caso,
P(Sn = x|S0 = x0 , S1 = x1 , . . . , Sn−1 = xn−1 )
12
=
P(Sn−1 + Yn = x|S0 = x0 , S1 = x1 , . . . , Sn−1 = xn−1 )
=
P(xn−1 + Yn = x|S0 = x0 , S1 = x1 , . . . , Sn−1 = xn−1 )
=
P(xn−1 + Yn = x) = P(Sn = x|Sn−1 = xn−1 ).
Definições equivalentes
P(Xn = x|Xn0 = x0 , Xn1 = x1 , . . . , Xnk = xk ) = P(Xn = x|Xnk = xk )
para todo n ≥ 1 e n0 < n1 < . . . < nk ≤ n − 1.
P(Xn+m = x|X0 = x0 , X1 = x1 , . . . , Xn = xn ) = P(Xn = x|Xn = xn )
para todo n ≥ 1 e todos os valores de x, x0 , x1 , . . . , xn−1 ∈ I.
13
• Cadeia de Markov homogênea
P(Xn = j|Xn−1 = i) = P(X1 = j|X0 = i) := pij
para todo n ≥ 1 e todos os valores de i, j ∈ I.
• Matriz de transição
P = (pij )
A matriz de transição é uma matriz estocástica, i.e.,
X
pij ≥ 0,
,
pij = 1.
j
• Matriz de transição em n-passos
Pn = (pij (n))
onde
pij (n) = P(Xn = j|X0 = i)
14
Note que P1 = P, mais ainda
pij (2)
= P(X2 = j|X0 = i)
X
=
P(X2 = j, X1 = k|X0 = i)
k∈I
=
X
P(X2 = j|X1 = k)P(X1 = k|X0 = i)
k∈I
=
X
pkj pik .
k∈I
Portanto, P2 = P2 .
15
Equações de Chapman-Kolmogorov
P
pij (n + m) =
k pkj (n)pik (m)
Consequentemente, Pn+m = Pn Pm e Pn = Pn .
16
Distribuições marginais Defina
(n)
µi
= P(Xn = i).
e
(n)
µ(n) = (µi , i ∈ I).
Note que
(1)
µi
= P(X1 = i) =
X
P(X1 = i, X0 = k)
k
=
X
P(X1 = i|X0 = k)P(X0 = k)
k
=
X
(0)
pki µk
k
17
(2)
µi
=
P(X2 = i) =
X
P(X2 = i, X1 = j)
j
=
X
P(X2 = i|X1 = j)P(X1 = j)
j
=
X
(1)
pji µj
j
=
X
j
pji
X
(0)
pkj µk
k
Em geral,
µ(n+m) = µ(m) Pn
18
e
µ(n) = µ(0) Pn
Exemplo: Snoqualmie Falls
• dados diários para se choveu ou não, pelo menos, 0,01 cm
• 36 anos
• Janeiro para obter um sistema homogêneo e estacionário.
I = {0, 1} Matriz de transição

P = 
p00
p10
p01
p11


Será que os dados não são independentes?
19
Hoje
0
1
0
186 (91)
123 (223)
309
1
128 (223)
643 (543)
771
314
766
1080
Ontem
Os valores entre parenteses são os valores esperados sob a hipótese
de independência. X 2 = 202, 89 e χ21;1% = 6, 63.
20
Função de verossimilhança
L(P, x) = P(X0 = x0 )
n−1
Y
P(Xi+1 = xi+1 |Xi = xi )
i=0
= P(X0 = x0 )
n−1
Y
pxi ,xi+1
i=0
= P(X0 = x0 )
Y
n
pk,lk,l
k,l∈I
onde nk,l = número de vezes em que Xi = k, Xi+1 = l.
21
No exemplo de Snoqualmie Falls,


36
Y
123 128 643
L(P, x) = 
P(X0,j = x0,j ) p186
00 p01 p10 p11 .
j=1
Assuma que os x0,j são fixos e P(X0,j = x0,j ) = 1, se não, podemos
usar as 36 amostras para estimar esta probabilidade.
• p00 + p01 = 1 e p10 + p11 = 1,
P̂1,0 = n1,0 /(n0,0 + n1,0 )
e
P̂1,1 = n1,1 /(n0,1 + n1,1 )
As estimativas de MV são dadas por:
p̂1,0 = 123/309 = 0, 398
22
p̂1,1 = 643/771 = 0, 834
Modelos para evolução de uma população. Em geral, difı́ceis
matematicamente.
Processos de ramificação Simplificações interessantes e
matematicamente tratáveis.
• Se originou de um “puzzle” matematico colocado por Sir
Francis Galton, o primo de Charles Darwin, no the Educational
Times de 1 April 1873.
• Podem ser vistos como a representação matemática da
evolução de uma população onde os mecanismos de reprodução
e morte estão sujeitas a leis aletórias simples.
• Aplicações:
– Propagação de espécies e genes
– Reação nucleares
– Fenômeno de cascata eletrônica
– Modelos epidêmicos
23
O problema proposto por Galton:
• Uma grande nação com N adultos homens e cada um tendo um
sobrenome distinto, colonizam um distrito.
• A lei de tal população é que, em cada geração,
P0 porcento de adultos homens tem nenhum filho homem,
P1 tem somente um filho homem, P2 tem 2 filhos homens, até
P5 que tem 5 filhos homens.
• Ache (1) Qual a proporção de sobrenomes que se extinguirão
após r gerações; e
(2) em quais casos haverá o mesmo sobrenome para m pessoas.
A solução proposta por Rev. Henry William Watson em
seu artigo de 1874 conjuntamente com Galton, onde a teoria dos
processos de ramificação foram desenvolvidas.
24
Processo de ramificação Bienayme-Galton-Watson
• Inicia no tempo 0 com Z(0) partı́culas.
• Cada uma delas se divide independentemente em um número
aleatório de filhos que constituem a primeira geração.
• Cada partı́cula da primeira geração se divide
independentemente em um número aleatório de filhos (todos
com a mesma lei) que constituem a segunda geração , e assim
por diante.
• O número de filhos produzidos por cada partı́cula são v.a.’s
i.i.d., independentemente da história do processo e de todas as
outras partı́culas presentes.
25
Um processo de Galton-Watson {Xn ; n = 0, 1, 2, . . .} é uma cadeia
de Markov com espaço de estados {0, 1, . . .} tais que:
• Sejam ξ1,1 , ξ1,2 , . . ., ξ2,1 , ξ2,2 , . . ., . . . v.a’s i.i.d. com função de
probabilidade f (k) = P(ξi,j = k);
• X0 = N para N fixo ou aleatório;
• X1 = ξ1,1 + ξ1,2 + . . . + ξ1,N
X2 = ξ2,1 + ξ2,2 + . . . + ξ2,X1
Xn = ξn,1 + ξn,2 + . . . + ξn,Xn−1
• Neste caso,
P (0, 0) = 1,
, P (x, y) = P (ξ1,1 + ξ1,2 + . . . + ξ1,x = y).
• Em particular, P (1, y) = f (y).
26
Seja m = E(ξ1,1 ) a média de filhos por indivı́duo ou taxa de infeção.
Caso subcrı́tico (m < 1): Extinção do processo, tempo de extinção
com esperança finita;
Caso crı́tico (m = 1): Extinção do processo, tempo de extinção
com esperança infinita;
Caso supercrı́tico (m > 1): Probabilidade de extinção menor que
um.
O problema de estimação de m aparece quando se lida com polı́tica
de vacinação e prevenção de epidemias e pandemias.
27
Urna de Ehrenfest
• Modelo para troca de calor ou gases entre dois corpos isolados.
• Temos duas caixas com um total de d bolas numeradas de 1 a d.
• Inicialmente algumas destas bolas estão na caixa 1 e o restante
na caixa 2.
• Em cada experimento selecionamos uma bola ao acaso (i.e,
selecionamos ao acaso um número entre 1 e d) e a trocamos de
caixa.
• Repita o procedimento sequencialmente. Seja Xn o número de
bolas na caixa 1 no instante n.
28
Xn é uma cadeia de Markov com espaço de estados {0, 1, . . . , d} e
matriz de transição


(x/d), y = x − 1,


P (x, y) =
1 − (x/d), y = x + 1,



0, caso contrário
29
Um estado a de uma cadeia de Markov é dito ser absorvente se
P (a, y) = 0, para y 6= a.
Ruı́na do jogador
• Um jogador começa com um capital inicial de i reais e faz uma
sequência de apostas de R$ 1,00.
• Assuma que ele tem probabilidade p de ganhar e probabilidade
1 − q de perder a cada aposta independentemente das apostas
anteriores.
• Se seu capital chegar a zero ele se arruinará e seu capital
continuará zero para sempre.
30
Esta é uma CM com espaço de estados {0, 1, . . .} onde 0 é um
estado absorvente e para x ≥ 1



 1 − p, y = x − 1,
P (x, y) =
p, y = x + 1,



0, caso contrário
Se houver um adversário que inicia o jogo com d − i reais e o jogo
termina quando o capital do 1o. jogador atinge 0 ou d o espaço de
estados é {0, 1, . . .} onde 0 e d são estado absorventes e para
1≤x≤d−1



 1 − p, y = x − 1,
P (x, y) =
p,



31
y = x + 1,
0, caso contrário
Cadeias de nascimento e morte
• Considere uma CM com espaço de estados I = {0, 1, . . .} ou
I = {0, 1, . . . , d}.
• Estando no estado x no próximo passo somente poderá estar
em x, x + 1 ou x − 1.
• Considere que a matriz de transição seja:


qx , y = x − 1,




 p , y = x + 1,
x
P (x, y) =

rx , y = x,




 0, caso contrário
onde para cada x, px , qx , rx ≥ 0, px + qx + rx = 1.
32
Classificação de estados: Seja A um subconjunto do espaço de
estados I. O tempo de chegada a A é definido como:

 min{n > 0; X ∈ A}, se X atinge A,
n
n
TA =

∞,
caso contrário
Notaçao:
A = {a} usamos a notação: Ta .
Denotaremos por Px (·) as probabilidades dos diversos eventos
quando o estado inicial da cadeia for x. Assim,
Px (X1 = a, X2 = b) = P(X1 = a, X2 = b|X0 = x).
33
Estados recorrentes e transientes
• ρxy = Px (Ty < ∞) = probabilidade que uma CM começando
em x consiga atingir o estado y em tempo finito.
• ρyy = probabilidade que uma CM começando em y alguma vez
retorne a y.
• Um estado y é dito ser:
1. recorrente se ρyy = 1;
2. transiente se ρyy < 1.
• Se y é um estado absorvente, então Py (T1 = y) = 1 e ρyy = 1 e
y é recorrente.
34
Para cada estado y ∈ I defina a v.a.
N (y) =
∞
X
1y (Xn )
n=1
o número de vezes que a CM visita o estado y.
Note que:
Px (N (y) ≥ 1) = Px (Ty < ∞) = ρxy .
É fácil ver que a propriedade de Markov diz que: a probabilidade
da cadeia começando em x visitar pela primeira vez y após m
passos e retornar a y n passos depois é
Px (Ty = m)Py (Ty = n).
35
Portanto,
Px (N (y) ≥ 2) =
=
∞ X
∞
X
Px (Ty = m)Py (Ty = n)
m=1 n=1
∞
X
!
Px (Ty = m)
m=1
∞
X
!
Py (Ty = n)
n=1
= ρxy ρyy .
Similarmente,
Px (N (y) ≥ m) = ρxy ρm−1
yy ,
m ≥ 1.
Usando o fato que
Px (N (y) = m) = Px (N (y) ≥ m) − Px (N (y) ≥ m + 1).
Px (N (y) = m) = ρxy ρm−1
yy (1 − ρyy ),
m ≥ 1.
e
Px (N (y) = 0) = (1 − ρxy ).
36
Observe que
Ex (N (y))
∞
X
= Ex
!
1y (Xn )
n=1
=
=
∞
X
n=1
∞
X
Ex (1y (Xn ))
P n (x, y).
n=1
Defina
G(x, y) = Ex (N (y)) =
37
P∞
n
P
(x, y).
n=1
O seguinte teorema descreve a diferença fundamental entre estados
transientes e estados recorrentes:
Teorema: (i) Seja y um estado transiente. Então:
Px (N (y) < ∞) = 1
e
ρxy
G(x, y) =
.
1 − ρyy
(ii) Seja y um estado recorrente. Então:
Py (N (y) = ∞) = 1
e
G(y, y) = 1.
Mais ainda,
Px (N (y) = ∞) = Px (Ty < ∞) = ρxy .
Se ρxy = 0 então G(x, y) = 0 enquanto que ρxy > 0 implica que
G(x, y) = ∞.
38
Seja y um estado transiente. Como
∞
X
n=1
P n (x, y) = G(x, y) < ∞
⇒
lim P n (x, y) = 0.
n
Uma CM é dita ser transiente se todos os seus estados são
transientes e recorrente se todos os seus estados são recorrentes.
É fácil ver que toda CM finita precisa ter pelo menos um estado
recorrente, i.e. não pode ter todos os seus estados transientes:
39
Decomposição do espaço de estados:
x → y,
se
Sejam x e y ∈ I
ρxy > 0.
• x → y se, e somente se, P n (x, y) > 0 para algum n.
• x → y e y → z então x → z.
• Teorema: Seja x um estado recorrente e suponha que x → y.
Então y é recorrente e ρxy = ρyx = 1.
40
• Um conjunto não vazio C ⊂ I é dito ser fechado se nenhum
estado de dentro de C leva a um estado fora de C, i.e., se
ρxy = 0,
x ∈ C, y 6∈ C.
• Equivalentemente, C é fechado se, e somente se,
P n (x, y) = 0,
x ∈ C, y 6∈ C, para todo n ≥ 1.
• Se C é um conjunto fechado então uma CM começando em C
ficará em C com probabilidade 1.
• Se A é um estado absorvente, então {a} é fechado.
41
• Um conjunto fechado é dito ser irredutı́vel se x → y para
todos x, y ∈ C.
• Segue do teorema anterior que se C é uma classe
fechada e irredutı́vel, então ou todo estado de C é
recorrente, ou todo estado de C é transiente.
• Seja C uma classe fechada irredutı́vel de estados recorrentes.
então ρxy = 1, Px (N (y) = ∞) = 1 e G(x, y) = ∞ para todas as
escolhas de x, y ∈ C.
• Uma cadeia de Markov irredutı́vel é uma cadeia cujo espaço de
estados I é fechado e irredutı́vel. Segue que tais cadeias ou são
transientes ou são recorrentes.
42
Teorema: Seja C um conjunto finito de estados. Então todos os
estados em C são recorrentes.
Considere uma CM com um número finito de estados.
• Se a CM é irredutı́vel, deve ser recorrente.
• Se a CM não é irredutı́vel verificamos quais são as classes
irredutı́veis e quais estados são recorrentes e transientes.
43
Exemplo: I = {0, 1, 2, 3, 4, 5}

1 0

 1 1
 4 2

 0 1

5

 0 0


 0 0

0 0
44
0
1
4
2
5
0
0
0
0

0
0
0
0
1
5
1
6
1
2
1
4
0

0 


1 
5 

1 
2 

1 
2 
1
3
0
0
3
4
Note que a matriz abaixo
x → y, i.e, ρxy > 0.

+

 +


 +


 0


 0

0
traz os valores + e 0 de acordo com
0
0
0
0
0













+
+ +
+ +
+
+ +
+ +
0
0
+
+
+
0
0
+
+
+
0
0
+
+
+
Obviamente, se P (x, y) > 0 então ρxy > 0, mas a recı́proca não é
verdadeira pois P (2, 0) = 0 e ρ20 > 0 pois
1
11
=
> 0.
P (2, 0) = P (2, 1)P (1, 0) =
54
20
2
45
• 0 é um estado absorvente, portanto é recorrente.
• Também vemos pela matriz acima que {3, 4, 5} é uma classe
finita, fechada e irredutı́vel portanto todos os seus estados são
recorrentes.
• 2 → 0 e 1 → 0 mas 0 6→ 2 e 0 6→ 1, sendo assim 1 e 2 tem que
ser estados transientes.
46
Sejam:
IT o conjunto de estados transientes;
IR o conjunto de estados recorrentes.
Neste exemplo, IT = {1, 2} e IR = {0} ∪ {3, 4, 5}.
Sempre é possı́vel decompor IR numa união disjunta (finita ou
enumerável) de classes irredutı́veis.
47
Cadeias de nascimento e morte
• CM irredutı́vel: ou todos os estados recorrentes, ou todos
estados transientes.
• CM irredutı́vel finita: todos os estados recorrentes.
• O que fazer no caso I infinito?
48
• Considere uma CM com espaço de estados I = {0, 1, . . .} ou
I = {0, 1, . . . , d}.
• Estando no estado x no próximo passo somente poderá estar
em x, x + 1 ou x − 1.
• Considere que a matriez de







P (x, y) =






transição seja:
qx ,
y = x − 1,
px ,
y = x + 1,
rx ,
y = x,
0, caso contrário
onde para cada x, px , qx , rx ≥ 0, px + qx + rx = 1. Note que
q0 = 0 e pd = 0 se d < ∞.
• Assuma que px , qx > 0 para 0 < x < d.
49
Para a < b ∈ I, seja
u(x) = Px (Ta < Tb ),
a<x<b
e
u(a) = 1,
u(b) = 0.
Portanto, é fácil ver que
u(y) = qy u(y − 1) + ry u(y) + py u(y + 1),
a < y < b.
Como ry = 1 − py − qy temos
u(y + 1) − u(y) =
50
qy
(u(y) − u(y − 1)),
py
a < y < b.
Defina γ0 = 1 e
γy =
q1 ···qy
p1 ···py ,
0 < y < d.
Temos,
Pb−1
u(x) =
y=x γy
Pb−1 ,
y=a γy
a < x < b.
Portanto, da definição de u(x) temos
Px (Ta < Tb ) =
Px (Tb < Ta ) =
51
Pb−1
Py=x
b−1
γy
y=a
γy
Px−1
γy
y=a
γy
Py=a
b−1
,
a < x < b.
,
a < x < b.
Exemplo:
• Um jogador na roleta faz uma sequência de apostas de $1.00.
• Ele tem probabilidades 9/19 e 10/19 de ganhar e perder
respectivamente.
• O jogador decide que ele pára de jogar se ele lucra $25.00 ou se
ele perde $10.00.
(a) Ache a probabilidade dele parar de jogar ganhando.
(b) Ache sua perda esperada.
52
• Xn : capital do jogador no tempo n com X0 = 10.
• Xn é uma cadeia de nascimento e morte com I = {0, 1, . . . , 35}
• taxas px = 9/19, 0 < x < 35 e qx = 10/19, 0 < x < 35.
• Os estados 0 e 35 são aobsorventes.
Aplicar a fórmula para a = 0, x = 10, b = 35. Portanto,
γy = (10/9)y ,
Probabilidade de ganhar:
P9
P10 (T35 < T0 ) =
0 ≤ y ≤ 34,
y
y=0 (10/9)
P34
y
y=0 (10/9)
(10/9)10 − 1
=
= 0.047.
(10/9)35 − 1
Perda esperada: 10 − 35 × (0.047) = 8.36.
53
Distribuição estacionária
• Seja Xn , n ≥ 0 uma CM com espaço de estados I e matriz de
transição P .
• Uma distribuição estacionária π(x), x ∈ I satisfaz:
1. π(x) ≥ 0, x ∈ I;
P
2.
x∈I π(x) = 1;
P
3.
x∈I π(x)P (x, y) = π(y), y ∈ I.
54
Distribuição limite
• Suponha que temos
lim P n (x, y) = π(y),
n→∞
y ∈ I.
• Neste capı́tulo queremos determinar quando temos distribuição
estacionária, quando temos distribuição limite e quando elas
são iguais.
55
Propriedades de distribuições estacionárias Seja π uma
distribuição estacionária para P . Então:
X
X
X
2
π(x)P (x, y) =
π(x)
P (x, z)P (z, y)
x∈I
z
x∈I
!
=
X X
=
X
z
π(x)P (x, z) P (z, y)
x
π(z)P (z, y) = π(y).
z
Portanto, por indução, usando a fórmula
X
n+1
P
(x, y) =
P n (x, z)P (z, y),
z
temos
P
56
x∈I
π(x)P n (x, y) = π(y),
y ∈ I.
• Se π0 = π temos que
P (Xn = y) = π(y),
y∈I
e a distribuição de Xn é independente de n.
• Suponha reciprocamente que πn não dependa de n, então a
distribuição de X0 e X1 são idênticas e
P
π0 (y) = π1 (y) =
x π0 (x)P (x, y). Consequentemente, π0 é
distribuição estacionária.
• A distribuição de Xn é independente de n se, e
somente se, π0 é estacionária.
57
Suponha que π é distribuição estacionária e
y ∈ I.
n→∞
então P(Xn = y) =
P
x
π0 (x)P n (x, y),
y ∈ I.
Tirando o limite nos dois lados da equação e passando o limite
dentro do somatório, temos
X
n
lim P (x, y) =
π0 (x)π(y), y ∈ I.
n→∞
Como
P
x
x
π0 (x) = 1 temos
limn→∞ P n (x, y) = π(y),
58
y ∈ I.
• Temos que se π é uma distribuição estacionária e
n→∞
y∈I
, a distribuição πn se aproxima de π independemtemente da
distribuição inicial.
• Portanto, π é a única distribuição estacionária, senão
usarı́amos a outra distribuição para π0 e terı́amos π = π0 .
• Suponha que observamos nosso sistema por um tempo longo,
digamos n0 passos e seja
Yn = Xn0 +n ,
As v.a.’s Yn formam uma CM com a mesma matriz de
transição P . Se N0 for suficientemente grande, podemos supor
que a distribuição marginal de Yn é a mesma da distribuição
estacionária π.
59
Exemplo 1:

P =
1−p
q
p
1−q


Se p + q > 0 temos
q
π(0) =
p+q
60
p
π(1) =
.
p+q
Cadeias de nascimento e morte Considere uma cadeia de
nascimento e morte com I = {0, 1, . . .}. Vamos assumir que a
cadeia é irredutı́vel i.e.,
px > 0,
0≤x<∞
qx > 0,
0 < x < ∞.
O sistema de equações
X
π(x)P (x, y) = π(y)
x
será:
r0 π(0) + q1 π(1) = π(0)
py−1 π(y − 1) + ry π(y) + qy+1 π(y + 1) = π(y),
61
y ≥ 1.
Como px + rx + q + x = 1, temos
(1 − p0 )π(0) + q1 π(1) = π(0)
py−1 π(y − 1) + (1 − py − qy )π(y) + qy+1 π(y + 1) = π(y),
y ≥ 1.
Portanto,
qy+1 π(y + 1) − py π(y) = qy π(y) − py−1 π(y − 1),
y≥1
e consequentemente, por indução
qy+1 π(y + 1) − py π(y) = 0,
y ≥ 0.
Neste caso, obtemos
π(y + 1) =
62
py
qy+1 π(y).
Usando novamente indução é fácil ver que:
π(x) =
p0 · p1 · · · px−1
π(0).
q1 · q2 · · · qx
Finalmente, se chamamos
π0 = 1,
p0 · p1 · · · px−1
, πx =
,
q1 · q2 · · · qx
x ≥ 1,
temos
π(x) = πx π(0),
63
x ≥ 0.
Temos que verificar se as soluções de (1) satisfazem
P
Caso 1:
x πx < ∞.
P
x
π(x) = 1.
!
1 =
X
π(x) =
x
X
πx
π(0)
x
Portanto,
π(0) =
P1
x
Caso 2:
P
x
πx ,
π(x) =
x
x ≥ 1.
πx = ∞.
!
X
Pπx
x πx
π(x) =
X
x
πx

 0,
π(0) =
 ∞,
se π(0) = 0
se π(0) > 0
Portanto, não existe distribuição estacionária.
Todas as deduções anteriores valem para o caso de cadeias de
nascimento e morte finitas, i.e. d < ∞.
64
Urna de Ehrenfest d = 3

0
1

 1/3 0

P = 
 0 2/3

0
0
0

0

2/3
0 


0 1/3 

1
0
Esta é uma cadeia de nascimento e morte irredutı́vel com
π0 = 1,
π1 = 3,
π2 = 3,
π3 = 1.
Portanto, a única distribuição estacionária é dada por:
π(0) = 1/8,
π(1) = 3/8,
π(2) = 3/8,
π(3) = 1/8.
Note que neste caso, P n (x, y) = 0 para valores ı́mpares de n.
Assim,
P n (x, x) 6→ π(x).
65
Urna de Ehrenfest modificada: Suponha que temos o mesmo
esquema da urna de Ehrenfest, mas a cada troca jogamos
independentemente uma moeda e se esta sair cara decidimos não
mudar a bola de urna.


1/2 1/
0
0


 1/6 1/2 2/6
0 


P = 

 0
2/ 1/2 1/6 


0
0
1/2 1/2
Entretanto, π0 = 1,
π1 = 3,
π2 = 3,
π3 = 1.
Portanto, a única distribuição estacionária é dada por:
π(0) = 1/8,
π(1) = 3/8,
π(2) = 3/8,
π(3) = 1/8.
Neste caso, veremos mais tarde,
P n (x, y) → π(y),
66
para todo y, quando n → ∞.
Estados recorrentes positivos e recorrentes nulos Um
estado é recorrente se
ρyy = Py (Ty < +∞) = 1
Se y é recorrente então:
y é recorrente positivo se my = Ey (Ty ) < +∞;
y é recorrente nulo se my = Ey (Ty ) = +∞;
67
Número médio de visitas a um estado recorrente: Defina
Nn (y) o número de visitas ao estado y nos instantes 1, 2, . . . , n. Isto
Pn
é, Nn (y) = m=1 1y (Xm ).
Defina Gn (x, y) o número médio de visitas ao estado y dado que
X0 = x durante os instantes 1, 2, . . . , n
Gn (x, y) =
n
X
m=1
68
Ex [1y (Xm )] =
n
X
P m (x, y).
m=1
1.- Seja y um estado transiente. então
lim Nn (y) = N (y) < ∞ com probabilidade 1,
n
e
lim Gn (x, y) = G(x, y) < +∞.
n
Portanto,
Nn (y)
lim
= 0 com probabilidade 1,
n
n
e
Gn (x, y)
lim
= 0, x ∈ S.
n
n
69
Seja y um estado recorrente. Então:
lim
n
1T <∞
Nn (y)
= y
com probabilidade 1,
n
my
e
Gn (x, y)
ρxy
lim
=
, x ∈ S.
n
n
my
Intuição: Uma vez que a cadeia chega ao estado y ela retorna a y,
“em média uma vez a cada my unidades de tempo”. Assim, se y
pode ser alcançado eventualmente e n é grande, a proporção de
tempo que a cadeia gasta no estado y é aproximadamente 1/my .
70
Corolário: Seja C um conjunto fechado irredutı́vel de estados
recorrentes. Então,
Gn (x, y)
1
lim
=
, x, c ∈ C
n
n
my
e se P (X0 ∈ C) = 1,
Nn (y)
1
lim
=
com probabilidade 1.
n
n
my
Note que as fórmulas valem para my = +∞.
71
Teorema: Seja x um estado recorrente positivo e suponha que
x → y. então y é recorrente positivo.
Portanto, em uma classe de estados fechada, irredutı́vel ou todos os
estados são transientes, ou todos os estados são recorrentes
positivos ou todos os estados são recorrentes nulos.
72
• Se C é uma classe fechada e finita então C tem pelo menos um
estado recorrente positivo.
• Se C é uma classe fechada, irredutı́vel e finita de estados então
todo estado é recorrente positivo.
• Uma cadeia de Markov irredutı́vel com um número finito de
estados é recorrente positiva.
• Uma cadeia de Markov tendo um número finito de estados não
tem estados recorrentes nulos.
Note que se y é um estado recorrente, então y está contido
numa classe fechada de estados recorrentes. Como esta classe é
necessariamente finita, ela contém pelo menos um estado
recorrente positivo e portanto todos são recorrentes positivos.
73
Existência e unicidade das distribuições estacionárias
Teorema: Seja π uma distribução estacionária. Se x é transiente
ou recorrente nulo, então π(x) = 0.
Prova: Se x é transiente ou recorrente nulo então
Gn (z, x)
lim
= 0, z ∈ S.
n
n
Portanto, se pudermos trocar a ordem da soma e do limite:
π(x) lim
n
X
z
π(z) lim
n
Gn (z, x)
= 0.
n
Teorema: Seja uma cadeia de Markov irredutı́vel, recorrente
positiva então existe uma única distribuição estacionária π dada
por:
1
π(y) =
, y ∈ S.
my
74
Consequências:
Uma cadeia de Markov é positiva recorrente é irredutı́vel se, e
somente se tem uma única distribuição estacionária.
Se uma cadeia de Markov tem um número finito de estados e é
irredutı́vel então ela tem uma única distribuição estacionária.
Seja Xn , n ≥ 0 uma cadeia de Markov irredutı́vel, recorrente
positiva com distribuição estacionária π. então com
probabilidade 1,
min
n
75
Nn (y)
= π(y),
n
y ∈ S.
Cadeia redutı́veis:
Teorema: Seja C um conjunto irredutı́vel fechado de estados
recorrentes positivos. Então a cadeia de Markov tem uma única
distribuição estacionária concentrada em C, isto é, π(x) = 0, se
x 6∈ C e π(x) = 1/mx se x ∈ C.
Suponha que a cadeia tenha dois conjuntos irredutı́veis fechados de
estados recorrentes positivos C0 e C1 . então a cadeia tem uma
distribuição estacionária π0 concentrada em C0 e uma distribuição
estacionária π1 concentrada em C1 . Mais ainda, as distribuições
πα (x) = (1 − α)π0 (x) + απ1 (x)
também são estacionárias para a CM.
76
Teoria de verossimilhança para Cadeias de Markov
L(P, x) = P(X0 = x0 )
n−1
Y
P(Xi+1 = xi+1 |Xi = xi )
i=0
= P(X0 = x0 )
n−1
Y
pxi ,xi+1
i=0
= P(X0 = x0 )
Y
N
pk,lk,l
(n)
k,l∈I
onde Nk,l (n) = número de vezes em que Xi = k, Xi+1 = l nos
instantes 1, . . . , n.
77
L(π0 , P, x) = π0 (x0 )
n−1
Y
P(Xi+1 = xi+1 |Xi = xi )
i=0
= π0 (x0 )
n−1
Y
pxi ,xi+1 = π0 (x0 )
i=0
= π0 (x0 )
Y
Y
N
pk,lk,l
(n)
k,l∈I
Lk (P)
k∈I
Q
N
(n)
onde Lk (P) = l∈I pk,lk,l
depende somente dos elementos na
k-ésima linha da matrix P.
Seja l(π0 , P, x) = log L(π0 , P, x). Então temos as equações,
X
l(π0 , P, x) = l0 (π0 , x0 ) +
lk (P, x).
k∈I
78
Queremos maximizar l sujeita a condições que
X
X
π0 (x) = 1e que
P (k, j) = 1
x
j∈I
para todo k ∈ I. Usando multiplicadores de Lagrange e escrevendo
P
ni = j∈I temos as estimativas de MV
p̂ij
nij
=
quando ni > 0
ni
π̂0 (i) = 1(i = x0 ).
Se ni = 0 colocamos p̂ij = 0, j 6= i.
Seja
Î = {i ∈ I : ni > 0}
a porção observada do espaço de estados. Obviamente, Î é finito.
Note que (p̂ij , i, j ∈ Î) é uma matriz estocástica sobre Î. Denote
esta matriz por P̂.
79
Teorema: Se (Xn ) é uma cadeia de Markov ergódica (irredutı́vel,
recorrente positiva), então P̂ij → pij com probabilidade 1 para todo
i, j ∈ S independentemente da distribuição inicial.
Lembre-se que
1
Nij (n) → π(i)pij
n
e
1
Ni (n) → π(i).
n
80
Teorema: Se (Xn ) é uma cadeia de Markov ergódica, então
independentemente da distribuição inicial
hp
i
Ni (n)(P̂ij (n) − pij )
→ N (0, Σ)
i,j∈I
onde
σij,kl =



 pij (1 − pij ), (i.j) = (k, l)
−pij pil ,



0,
i = k, j 6= l
caso contrário.
Obs.: A covariância assintótica tem uma estrutura multinomial
dentro das linhas e independência entre as linhas.
81
Aplicação a Snoqualmie Falls
Usando o resultado do Teorema anterior vemos que P̂01 e P̂11 são
assintóticamente independentes. Mais ainda
P̂11 ≈ N (p11 , p11 (1 − p11 )/nπ(1))
onde π é a distribuição estacionária da CM.
Podemos estimar a variância usando
N11
N1
P̂11 =
e π̂(1) =
N1
n
onde
N11 =
36
X
(i)
N11 , . . .
i=1
Como n11 = 643, n1 = 771, n01 = 123, n0 = 309 e n = 1080,
intervalos de confiança assintóticos de 95%:
IC(p11 , 95%) = (0.808; 0.860)
82
IC(p01 , 95%) = (0.343; .453).
Note que cada intervalo tem 95% de confiança, mas conjuntamente,
usando a independência assintótica, (.95)2 = .903. a fim de
encontrar uma região de confiança com 95% devemos usar
intervalos individuais com 97.5%, obtendo o retângulo:
(.775; .893) × (.272; .524).
Algumas vezes, é natural parametrizar o modelo.
83
Eugen Onegin
O próprio Markov deu um exemplo de Cadeia de Markov em 1924.
Markov estudou um extrato de um poema de Puskin chamado
Eugen Onegin e classificou 20.000 caracteres consecutivos em
vogais e consoantes.
84
Vogal seguinte
Consoante seguinte
Total
Vogal
1106
7536
8638
Consoante
7533
3829
11362
Total
8639
11361
20000
É bastante óbvio que a escolha de vogal e consoante para a letra
seguinte não é independente da letra atual. Um modelo muito
simples é assumir que a troca se faz de forma constante, isto é a
matrix de transição é:


1−p
p


P =
p
1−p
85
Teoria assintótica
Por simplicidade no caso paramétrico vamos assumir espaço de
estados finito. Assuma que as probabilidades de transição
dependam somente de um parâmetro θ, tomando valores em um
espaço paramétrico Θ ⊂ Rr . Vamos assumir as seguintes condições
de regularidade:
1. D = {(i, j); pij > 0} não depende de θ.
2. Cada pij (θ) é 3-vezes continuamente diferenciável.
3. A matriz de dimensão d × r, ∂pij (θ)/∂θk , i, j ∈ D, k = 1, . . . , r
e d é a cardinalidade de D, tem posto r.
4. Para cada θ existe somente uma classe ergódica e nenhum
estado transiente.
86
Podemos escrver a verossimilhança como
X
l(θ, x) =
nij log pij (θ).
D
Diferenciando esta expressão obtemos as equações de
verossimilhança:
X ni j ∂pij (θ)
∂
ln (θ) =
= 0,
∂θk
pij (θ) ∂θk
k = 1, . . . , k.
D
Seja θ 0 o verdadeiro valor do parâmtro.
87
Teorema: Assuma as condições de regularidade:
(i) Existe uma solução θ̂ das equações de verossimilhança que é
consistente;
√
(ii) n(θ̂ − θ 0 ) → N (0, I −1 (θ 0 )), onde I é a matriz de
informação:
Iuv (θ 0 ) =
X π(i, θ 0 ) ∂pij (θ 0 ) ∂pij (θ 0 )
.
pij (θ 0 ) ∂θu
∂θv
(i,j)∈D
√
(iii) Var n(θ̂ − θ 0 ) pode ser estimada de forma consistente pelo
inverso da informação observada
−1
Nij 2
∇ log pij (θ̂)
.
−
n
88
Exemplo: Eugen Onegin
Estimamos p pela equação:
l(p) = (n00 + n11 ) log(1 − p) + (n01 + n10 ) log p,
onde 0 = vogal e 1 = consoante. O máximo é obtido em:
N01 + N10
7532 + 7533
e p̂ =
= 0.753.
n
20000
A segunda derivada da verossimilahnça é:
P̂ =
n00 + n11
n01 + n10
l (p) = −
+
(1 − p)2
p2
00
Portanto, o erro padrão assintótico estimado é
−1/2
(−l00 (p̂))
= (p̂(1 − p̂)/n)1/2 = (.753 × .247/20000)1/2 . O que nos
dá um IC de nı́vel 95% como:
(.747; .759)
Note que nem p̂01 = .872 nem p̂10 = .663 pertence a este intervalo,
indicando que o modelo de um parmâmetro não é adequado.
89
Teorema: Assuma as condições de regularidade. Seja θ̂ o EMV
sob a hipótse paramétrica H0 . Também, seja P̂ o EMV não
paramétrico e θ 0 o verdadeiro valor do parâmetro, quando H0 é
verdadeira.
Então:
D
(i) 2 l(θ̂) − l(θ 0 ) → χ2 (r);
D
(ii) 2 l(P̂) − l(θ̂) → χ2 (d(d − 1) − r);
(iii) As estatı́sticas em (i) e (ii) são assintóticqamente
independentes.
90
Teorema: Assuma as condições de regularidade. Sejam θ̂ 0 o EMV
sob a hipótese paramétrica H0 : θ ∈ Θ0 e θ̂ 1 o EMV sob a hipótese
θ ∈ Θ0 ∪ Θ1 . Então para se testar H0 : θ ∈ Θ0 vs. H1 : θ ∈ Θ1 a
estatı́stica do teste a ser utilizada é:
D
−2 l(θ̂ 0 ) − l(θ̂ 1 ) → χ2 (s)
onde s = dim(Θ1 ∪ Θ0 ) − dim(Θ0 ).
91
Teste para independência: Suponha que queremos testar a
hipótese de que a seqüência X1 , X2 , . . . tomando valores em
I = {0, 1, . . . , K} é independente vs. a hipótese de que pertença a
uma CM de ordem 1. Em termos de parametrização simplesmente
colocamos: H0 : pij = θj para todo i, j ∈ I.
Neste caso, precisamos calcular o máximo sob as duas hipóteses
(independência e CM de ordem 1).
92
CM de ordem 1: P̂ij = Nij /Ni .
Sob a hipótese de independência temos uma distribuição
P
multinomial, com n.j = i nij observações da categoria com
probabilidade θj . A verossimilhança é:
l(θ) =
K−1
X
j=0
n.j θj + n.K (1 −
K−1
X
θj ),
j=0
a qual é maximizada por θˆj = N.j /n. Portanto, a estatı́stica da
razão de verossimilhança é dada por:
X
Nij /Ni
2 l(P̂) − l(θ̂) = 2
Nij log
N.j /n
i,j
a qual assintoticamente tem uma distribuição χ2 com
K(K + 1) − K = K 2 graus de liberdade. No modelo de Snoqualmie
Falls K = 1.
93
Em Inferência usamos o teste chi-quadrado de Pearson:
X (Nij − Ni p0ij )2
X =
Ni p0ij
Eugen Onegin Queremos testar a hipótese H0 : p01 = p10
Os valores esperados para a estatı́stica de Pearson são calculados
multiplicando-se as somas das linhas (n0 , n1 ) = (8.638; 11.362) pela
matriz de transição estimada sob H0 :


0.247 0.753


P̂ =
0.753 0.247
obtendo

(Eij ) = 
94
2131.4
8558.4
6506.6
2803.6


A Estatı́stica chiquadrado para testar a hipótese uni-dimensional é:
X (nij − ni p̂0ij )2
χ =
= 1217.7.
0
n
p̂
i ij
ij
2
O valor exato da estatı́stica exata da verossimilhança é 1217.7.
(Aproximação excelente!!!)
95
Ferrugem asiática
Variáveis coletadas:
• Molhamento foliar (codificada como 1 se há molhamento
superior a oito horas e 0 caso contrário),
• Velocidade do vento em m/s
• Umidade relativa do ar
• Precipitação em mm
• Temperatura média em ¡C.
Quatro estações meteorológicas - Lucas do Rio Verde (MT), Rio
Verde (GO), Passo Fundo (RS) e Holambra (SP).
Esse dados foram enviados diariamente para o CEPAGRI Unicamp
96
Fonsechi(2006) analisou os dados através de um MLR, cujas
variáveis regressoras dependem do tempo anterior, por exemplo, se
choveu no tempo t − 1 influencia se haverá molhamento ou não no
tempo t. Obviamente não podemos esperar independência de um
tempo para o outro.
Modelo Logı́stico Regressivo para Observações Binárias
A decomposição da probabilidade de Y dado X, sendo (Y) o vetor
com a variável resposta e (X) a matriz de covariáveis no MLR é:
P (Y/X) = P (Yi |Y1 , Y2 , ..., Yi−1 , X)
97
(0.1)
Pode-se definir o i-ésimo logito como:
θ = log
P (Yi = 1|Y1 , . . . , Yi−1 , Xi )
P (Yi = 0|Y1 , . . . , Yi−1 , Xi )
(0.2)
e assumir que θi é função linear de Y1 , . . . , Yi−1 , X.
Temos, então, um problema de regressão no qual a resposta Yi é
binária, mas o conjunto de valores da variável explicativa muda de
acordo com i.
98
Para introduzir dependência no modelo é necessário criar variáveis
auxiliares. Considere Zi = Zi (Yi ) funções lineares dos Yi0 s dadas
por:

 2Y − 1, se Y = 0 ou 1
i
i
Zi =
 0,
se Yi é desconhecido.
Definimos a regressão logı́stica da seguinte forma:
θ1
θi
= α + βX1
= α+
i−1
X
γj Zj + βXi , i = 1, . . . , n
j=1
Temos:
P (Y |X) =
99
n
Y
θ i Yi
e
.
θ
i
(1 + e )
i=1
(0.3)
Para (j < i)
• Se Yj = 1, a chance do dia i ter molhamento (Yi = 1) aumenta
em eγj ,
• Yj desconhecido não muda a chance,
• Yj =0 diminui a chance em eγj e
• um aumento de uma unidade em Xi aumenta a chance do dia i
ter molhamento em eβ .
100
O modelo na forma matricial fica:
0
θ = [θ1 . . . θn ] ,
0
Z = [Z1 . . . Zn ] ,
0
λ = [α γ1 γ2 . . . γn−1 β] ,





A=




1
0
1
Z1
1
..
.
Z1
..
.
1
Z1
0
...
0
0
X1





.




...
0
X2
..
.
0
..
.
X3
..
.
..
.
Z2 . . .
Zn−1
Xn
Z2
...
Então o modelo torna-se:
θ = Aλ
101
Estruturas Markovianas de Dependência
Com a estrutura de primeira ordem (para o de segunda é analogo),
o modelo torna-se:
P (Y|X) = P (Y1 |X)
n
Y
P (Yi |Yi−1 , X)
(0.4)
i=2
Portanto, a probabilidade de ter molhamento foliar no dia i só
depende da resposta do dia imediatamente anterior. Nesse caso, os
logitos acima podem ser escritos como:
θi = α + γZi−1 + βXi .
102
(0.5)
Método de Análise
• Foi utilizado o software livre R (www.r-project.org)
• Para as quatro estações testou-se o modelo com estrutura
Markoviana de dependência de primeira e segunda ordem.
• Ajustou-se primeiramente um modelo com todas as covariáveis
(Modelo completo) e depois selecionou-se as covariáveis
significativas ao modelo (Modelo reduzido).
• Para verificar a adequação do modelo foi utilizado a estatı́stica
”deviance”(−2logL, sendo L a funcão de verossimilhança),
• Distribuição χ2n−p−1 , sendo n − p − 1 o graus de liberdade, n é
o número de observações e p é o número de parâmetros.
103
Passo Fundo - Estrutura Markoviana de 1a ordem
Tabela 1: Passo Fundo - Estrutura Markoviana de primeira ordem
(Modelo Completo)
104
Parâmetro
Estimação
teste-t
Intercepto
-13.80594
6.03e-06
Z
0.68004
0.00104
UR
0.15166
2.50e-08
Temp média
0.0995
0.12957
Velocidade Vento
-0.24003
0.28894
Chuva
0.05070
0.28251
Tabela 2: Passo Fundo - Estrutura Markoviana de primeira ordem
(Modelo Reduzido)
Parâmetro
Estimação
teste-t
Intercepto
-15.67279
5.97e-08
Z
0.66143
0.00103
UR
0.16491
4.24e-11
Temp média
0.10751
0.09699
Para Passo Fundo, com estrutura markoviana com dependência de
primeira ordem a deviance foi 161,1 e o valor tabelado da χ2223 é
189.43, ou seja, pelo teste de bondade de ajuste esse modelo é
adequado.
105
Tabela 3: Passo Fundo - Estrutura Markoviana de segunda ordem
(Modelo Completo)
106
Parâmetro
Estimação
teste-t
Intercepto
-13.80594
8.99e-06
Z1
0.52782
0.0197
Z2
0.36670
0.0960
UR
0.15069
4.24e-08
Temp média
0.10047
0.1332
Velocidade Vento
-0.25198
0.2793
Chuva
0.055070
0.2512
Tabela 4: Passo Fundo - Estrutura Markoviana de segunda ordem
(Modelo Reduzido)
107
Parâmetro
Estimação
teste-t
Intercepto
-15.79363
6.88e-08
Z1
0.51292
0.0204
Z2
0.34475
0.1150
UR
0.16604
5.61e-11
Temp média
0.10841
0.100
Conclusão
• Verificou-se a eficiência da utilização do Modelo Logı́stico
Regressivo para a estimação de molhamento foliar na cultura
da soja.
• Para as quatro estações testadas, o modelo que melhor ajusta
aos dados meteorológicos é o logı́stico regressivo com estrutura
markoviana de primeira ordem, ou seja, o modelo que leva em
consideração a dependência do dia anterior para a ocorrência
de molhamento foliar.
• Com as previsões meteorológicas e o uso do modelo proposto
será possı́vel um melhor monitoramento da cultura da soja,
acionando os produtores de soja para alertá-los quando houver
indı́cios da ocorrência de molhamento foliar superior a 8 horas,
ajudando assim o momento certo para aplicação de fungicida.
108

Inferência para Cadeias de Markov

Transcrição

Documentos relacionados

A distribuiç ˜ao Weibull inversa generalizada na modelagem de

Estruturas - Nicolau Corção Saldanha

Teorema de Ptolomeu

Tópicos de matrizes e Distribuiç˜ao Normal Multivariada

Groove na Pressão

Bolo do Caco Bimby: 27 min Ingredientes: 1 c. café sal

Curso de F´ısica Estat´ıstica

Probabilidade para Finanças

A distribuiç ˜ao Weibull inversa generalizada na

Jovens criam micro satélite que permite estudar a radiação solar