3 Heteroskedastizität und Autokorrelation

Transcrição

3 Heteroskedastizität und Autokorrelation
3
3.1
Heteroskedastizität und
Autokorrelation
Konsequenzen für OLS
Der OLS-Schätzer bleibt erwartungstreu, verliert jedoch die
Minimumvarianz. Ausgehend von ((A) für Ausgangsgleichung)
(A)
y = Xβ + ε
mit E{ε} = 0 und V {ε} = σ 2 Ψ, wobei z.B.



1

0
h21 0



 ρ


Ψ =  0 . . . 0  oder Ψ = 
..




.

0
0 h2N
ρN −1
ρ
1
···
···
···
..
.
ρ
N −1
ρ
N −2
ρ
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
..
.
1








14
erhalten wir für den OLS-Schätzer
n
o
−1
′
′
E{b} = E (X X) X y
n
o
−1
= E (X ′ X) X ′ (Xβ + ε)


=IK


}|
{
z

−1
−1
′
′
′
′
= E (X X) X X β + (X X) X ε




=0
=
z }| {
−1
′
′
β + (X X) X E {ε} = β
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
15
V {b} =
=
=
=
n
o
−1
′
′
V (X X) X y
n³
´
−1
′
′
E (X X) X (Xβ + ε) − β
³
´′ ¾
−1
× (X ′ X) X ′ (Xβ + ε) − β
½³
´³
´′ ¾
−1
−1
′
′
′
′
(X X) X ε (X X) X ε
E
o
n
−1
−1
′
′ ′
′
E (X X) X εε X (X X)
=V {ε|X}
′
−1
= (X X)
−1
= (X ′ X)
z }| {
−1
X E {εε′ } X (X ′ X)
′
−1
X ′ σ 2 ΨX (X ′ X)
−1
6= σ 2 (X ′ X)
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
16
Wir haben zur Behebung des Problems zwei Möglichkeiten:
(1) Effizienter Schätzer herleiten −→ β̂
(ii) Die Kovarianzmatrix der Parameterschätzung anpassen,
−→ V̂ {b}.
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
17
3.2
Generalisierte Kleinsquadratschätzung
(GLS)
Angenommen wir kennen Ψ, dann können wir die Matrix zerlegen:
Ψ−1 = P ′ P
Dies kann z.B. durch eine Cholesky-Dekomposition erreicht werden.
Wenn wir Ψ nun mit P vor- bzw. mit P ′ nachmultiplizieren,
erhalten wir
=IN
=IN
z }| { z }| {
−1
−1
P ΨP ′ = P (P ′ P ) P ′ = P P −1 P ′ P ′ = IN
Dies nützen wir in der Regressionsgleichung aus. Durch die
Transformation
Py
=
P Xβ + P ε
(T ) y ∗
=
X ∗ β + ε∗
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
18
erhalten wir ein System, dessen Fehlerterme die
OLS-Effizienzbedingungen erfüllen.
E {P ε} =
V {P ε|P X} =
P E {ε} = 0
P V {ε|X} P ′ = σ 2 P ΨP ′ = σ 2 IN
OLS auf das transformierte Modell (T ) ergibt
¡
¢−1 ∗ ′ ∗ ¡ ′ −1 ¢−1 ′ −1
β̂ = X ∗ ′ X ∗
X y = XΨ X
XΨ y
n o
¡
¢−1
¡
¢−1
= σ2 X ∗ ′ X ∗
= σ 2 X ′ Ψ−1 X
V β̂
³
´′ ³
´
1
∗
∗
∗
∗
2
y − X β̂
y − X β̂
σ̂ =
N −K
³
´′
³
´
1
−1
=
y − X β̂ Ψ
y − X β̂
N −K
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
19
3.2.1
Exkurs: Cholesky-Dekomposition
Dies ist eine Möglichkeit, die Matrix Ψ−1 in P ′ P zu spalten. Am
Beispiel einer 2 × 2 Matrix:



p
p11 0
p12
  11

Ψ−1 = P ′ P = 
0 p22
p12 p22




2
p11
ψ
ψ12
p11 p12
 = 

 11
2
2
ψ12 ψ22
p11 p12 p12 + p22
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
20
Dies ergibt 3 Gleichungen für 3 Parameter mit der Lösung:
p
p11 =
ψ11
p
ψ12
ψ11 p12 −→ p12 = √
ψ12 =
ψ11
s
2
2
ψ12
ψ12
2
ψ22 =
+ p22 −→ p22 = ψ22 −
ψ11
ψ11
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
21
3.3
Heteroskedastizität
Von Heteroskedastizität spricht man, wenn die Varianz der
Residuen nicht konstant ist (bei konstanter Varianz spricht man
von homoskedastischen Fehlern).
V {εi |X} = σ 2 h2i
D.h. die Matrix Ψ ist diagonal mit den Elementen h2i auf der
Diagonalen:


2
h
0
0
 1



.
.
Ψ= 0
. 0 


2
0
0 hN
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
22
Daten, in denen Heteroskedastizität höchstwahrscheinlich ist, sind:
• Querschnitt: Konsum in Abhängigkeit vom Einkommen (Je
höher das Einkommen umso höher die Schwankungen im
Konsum)
• Zeitreihen: Hochfrequente Finanzmarktvariablen wie
wöchentliche Beobachtungen des Aktienindex, Wechselkurse
(Autokorrelation in der Volatilität)
3.3.1
Schätzung bei bekanntem Ψ
Das transformierte Modell für y lautet in diesem Fall:
(T )
yi∗
=
1
yi
hi
=
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
x∗i ′ β + ε∗i
1 ′
1
xi β + εi
hi
hi
23
Der OLS-Schätzer auf (T ) ergibt:
¢−1 ∗ ′ ∗
¡
X y
β̂ = X ∗ ′ X ∗
!−1 Ã N
!
ÃN
X 1
X 1
=
xi x′i
x′i yi
2
2
h
h
i=1 i
i=1 i
Jede Beobachtung wird gewichtet mit hi , wenn die Varianz in der
Beobachtung (relativ) gross ist, wird sie geringer gewichtet als eine
Beobachtung, deren Varianz (relativ) kleiner ist. GLS wird deshalb
auch
gewichtete Kleinsquadratschätzung genannt. Die Varianz
n o
V
β̂
ist gegeben durch
n o
V β̂ = σ 2
Ã
N
X
1
xi x′i
2
h
i=1 i
!−1
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
24
wobei für σ 2 dessen Schätzung eingesetzt werden kann:
³
´2
′
N
X yi − xi β̂
1
2
σ̂ =
N − K i=1
h2i
Die Anpassung bringt den Vorteil, dass Hypothesentests mit der t-,
F - oder Wald-Statistik überprüft werden können.
Der “Nachteil”von GLS ist, dass die Gewichtungsmatrix Ψ−1
bekannt sein (oder konsistent geschätzt werden) muss.
3.3.2
Schätzung bei unbekanntem Ψ
Wenn der Ursprung der Heteroskedastizität nicht bekannt ist, kann
die Kovarianzmatrix der OLS-geschätzten Parameter b konsistent
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
25
geschätzt werden (White, 1980):
−1
−1
V {b|X} = (X ′ X) X ′ σ 2 ΨX (X ′ X)
ÃN
!−1 Ã N
!Ã N
!−1
X
X
X
=
xi x′i
σi2 xi x′i
xi x′i
i=1
i=1
i=1
wobei der Mittelterm
NS =
N
X
e2i xi x′i
i=1
geschätzt werden kann. ei sind dabei die Residuen der
OLS-Schätzung der Ausgangsgleichung (A).
In Standardprogrammen wird die Kovarianzmatrix V {b|X} oft
¡
¢
durch den vereinfachten Schätzer geschätzt (s2 X ′ X)−1 ). Deshalb
muss bei Verdacht auf Heteroskedastizität die Schätzung der
Parameterkovarianzmatrix angepasst werden. Dies ist oft durch
eine Zusatzoption implementiert.
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
3.3.3
26
Testen auf Homoskedastizität
Der Breusch-Pagan (1980) Test ist ein Lagrange-Multiplier Test
und basiert auf einer Hilfsregression der OLS-Residuen der
Ausgangsgleichung (A) auf potenzielle Variablen, welche die
Heteroskedastizität enthalten können:
(H) e2i = α0 + α1 Z1i + · · · + αq Zqi + νi
Die Variablen Z·i müssen bestimmt werden. Standardmässig
werden für Z·i die erklärenden Variablen X, deren Quadrate und
ev. auch deren Kreuzprodukte eingesetzt (dies ist dann der
White-Test, 1980).
Bei konstanter Varianz müssen in der Regression alle Koeffizienten
gleich null sein, α1 = · · · = αq = 0. Die Nullhypothese der
Homoskedastie wird gegenüber der Alternativen der
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
27
Heteroskedastizität,
H0 :
α1 = · · · = αq = 0
H1 :
α1 6= · · · =
6 αq = 0
mit der LM -Statistik getestet:
LM = N R2 ∼ χ2q
wobei N die Anzahl Beobachtungen in der Ausgangsgleichung (A)
ist und das R2 aus der Hilfsregression (H) stammt. Die Statistik is
2(0.05)
χ2 -verteilt mit q Freiheitsgraden. Wenn LM > χq
wird die
Hypothese der Homoskedastie abgelehnt.
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
3.4
28
Autokorrelation
Autokorrelation in den Fehlertermen tritt auf, wenn Zeitreihen eine
erhebliche Persistenz aufweisen wie z.B. die Inflationsrate,
Zinssätze. Sie kann ebenfalls auftreten, wenn y auch von
verzögerten Werten y−1 oder X−1 abhängt. Angenommen die
Fehlerterme seien autokorreliert erster Ordnung (AR(1), und t wird
hier für i substituiert, um explizit auf Zeitreihen hinzuweisen):
yt = x′t β + εt
mit
εt = ρεt−1 + νt ,
V {νt } = σν2
Daraus ergibt sich für
σν2
V {εt } =
1 − ρ2
σν2
AC(s) = E (εt εt−s ) = ρ
1 − ρ2
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
s
29
Die Matrix Ψ nimmt in dem Fall die Form

1
ρ ···


ρ
1 ···
1 

Ψ=
.
..
1 − ρ2 
 ..
.

ρT −1
···
T −1
ρ
T −2
ρ
..
.
ρ
1
an.
3.4.1








Schätzen unter Autokorrelation
Für diese Form der Autokorrelation (sowie dementsprechend für
Autokorrelation höherer Ordnung) lässt sich die Inverse Ψ−1 und
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
30
ihre Dekomposition P explizit herleiten:
 p
1 − ρ2 0


−ρ
1

P′ = 
..

..

.
.

0
···
···
0
···
..
.
0
..
.
−ρ
1
Das transformierte Modell








(T ) y ∗ + X ∗ β + ν
nimmt folgende Form an (Prais und Winsten, 1954):
p
p
y1∗ = 1 − ρ2 y1 ,
x∗1 = 1 − ρ2 x1
yt∗ = yt − ρyt−1 ,
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
x∗t = xt − ρxt−1 , t > 1
31
Falls ρ nicht bekannt ist, kann es aus einer Regression der
OLS-Residuen aus (A) auf eigene verzögerte Werte, et = ρet−1 + νt ,
geschätzt werden. Das geschätzte ρ, ρ̂, kann benützt werden, um
das System zu (T ) zu transformieren und dieses mit OLS zu
schätzen. Über diese zwei Schritte kann auch iteriert werden.
Eine Möglichkeit besteht auch darin, die verzögerten Werte von y
und X direkt in die Gleichung einzubeziehen (Cochrane und
Orcutt, 1949):
¢
¡
yt − ρyt−1 = x′t − ρx′t−1 β + νt
β̃
yt
=
z}|{
x′t β − x′t−1 βρ +ρyt−1 + νt
Die Gleichung kann unbeschränkt geschätzt werden, speziell im
EViews mit folgendem Befehl
Y X(0to-1) Y(-1) c.
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
32
Falls die Koeffizienten-Restriktionen implementiert werden sollen,
steht der Befehl
Y X c AR(1)
zur Verfügung.
Bei Autokorrelation höherer Ordnung wird die entsprechende
Anzahl verzögerter Werte einbezogen.
3.4.2
Eine spezielle Art der Autokorrelation
Autokorrelation, die nach einer gewissen Zeit abbricht, tritt auf,
wenn Beobachtungen mit einer höheren Frequenz als deren
Fristigkeit gemessen werden, z.B.: Ein Dreimonats-Zinssatz wird
monatlich gemessen. Ein Schock in Periode t wird damit auch die
auslaufenden Verträge in t + 1 und t + 2 beeinflussen. Ein anderes
Beispiel liefert Datenaggregation von z.B. halbjährlichen zu
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
33
jährlichen Daten, Schocks aus zwei Perioden beeinflussen die
Aggregierte Zeitreihe. Die Fehlerterme folgen in diesen Fällen
einem Moving Average M A(q) Prozess. Im einfachsten Fall M A(1):
εt = νt + ανt−1
Daraus ergibt sich für
V {εt }
=
AC(1) =
¡
¢
σν2 1 + α2
E (εt εt−1 ) = ασν2 , AC(s) = 0, s > 1
Die Matrix Ψ nimmt in dem Fall die Form

α
1
···
1+α2

..
 α
.

¢
¡
1
2
1+α
Ψ = 1 + α2 
 .
..
..
 ..
.
.

0
an.
···
0
..
.
α
1+α2
α
1+α2
1








Angewandte Ökonometrie, Sylvia Kaufmann, FS09
34
Die Inverse hat keine einfache Struktur mehr. Deshalb wird dieses
Modell mit Maximum Likelihood oder mit der nichlinearen
Kleinstquadratmethode geschätzt.
3.4.3
Newey-West Anpassung der
Parameterkovarianzmatrix
Falls die Autokorrelation in den Residuen relativ schnell nach null
geht, kann die Kovarianzmatrix der Parameter b analog zur
White-Methode angepasst werden (Newey und West, 1987):
!−1
!−1
à T
à T
X
X
T S∗
xt x′t
V ∗ {b|X} =
xt x′t
t=1
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
t=1
35
wobei S ∗ durch
T
T
H−1
X
¡
¢
1X 2
1 X
′
S =
et xt xt +
wj
es es−j xs x′s−j + xs−j x′s
T t=1
T j=1
s=j+1
∗
geschätzt werden kann. Wenn wj = 0 ist, erhalten wir die White
Kovarianzmatrix. Die Gewichte für die Kovarianzmatrizen, wj ,
sollen monoton in j abnehmen, z.B. wj = 1 − j/H (Bartlett
Gewichte).
Diese Anpassung nennt man auch Heteroskedastizitäts- und
Autokorrelationskonsistente Schätzung der Kovarianzmatrix
(HAC-Anpassung).
3.4.4
Testen auf Unkorreliertheit
Hierbei sind drei verschiedene Fälle zu unterscheiden. Wenn keine
verzögerten Werte der abhängigen Variablen miteinbezogen sind,
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
36
d.h. wenn yt−1 , . . . , yt−p nicht als Rechthand-Variablen auftreten,
dann kann ein asymptotischer Test auf Autokorrelation erster
Ordnung durchgeführt werden. Die Nullhypothese der
Unkorreliertheit wird gegenüber der Alternativen von Korrelation,
H0 : ρ = 0,
mit der Statistik
t≈
H1 : ρ 6= 0
√
T ρ̂
überprüft, wobei ρ̂ aus der Hilfsregression der Residuen der
OLS-Schätzung von (A), et , auf den eigenen vergangenen Wert
stammt:
(H) et = ρet−1 + νt
t ist t-verteilt, deshalb wird die Nullhypothese dann abgelehnt,
(0.025)
wenn |t| > tT
.
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
37
Eine Alternative bietet der Durbin-Watson Test (Durbin und
Watson, 1950). Die Statistik d basiert ebenfalls auf ρ̂:
PT
2
t=2 (et − et−1 )
d=
PT
2
t=1 et
Bei vielen Beobachtungen konvergiert d gegen
d −→ 2(1 − ρ)
In Abhängigkeit von der Korrelation ergibt sich:
H1 : ρ < 0
wenn ρ = −1 → d = 4
wenn ρ = 0
→d=2
wenn ρ = 1
→d=0
H0 : ρ = 0
ր
ց
H1 : ρ > 0
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
38
Falls d also nahe bei 2 ist, kann die Nullhypothese keiner
Autokorrelation nicht verworfen werden. Die Alternativen sind:
d < 2 (positive Autokorrelation), d > 2 (negative Autokorrelation).
Der kritische Wert hängt von der Anzahl der Variablen in X und
von deren Eigenschaften ab. Er kann allerdings eingegrenzt werden
und es ergeben sich auf dem Intervall (0 4) folgende Abschnitte:
Abbildung 7: Intervalle beim Durbin-Watson test
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
39
Wenn die Statistik d in die grau markierten Intervalle fällt, kann
keine Entscheidung getroffen werden. dL and dU sind dabei
tabellierte Grenzwerte, die von T und K abhängen (siehe Verbeek,
Tabelle 4.8, S. 111).
Bei den tabellierten Werten muss stets beachtet werden, ob K die
Konstante mitzählt oder nicht!!!
Wenn verzögerte Werte der abhängigen Variable als
Rechthandvariablen einbezogen sind, d.h. wenn
(A) yt = x′t β + yt−1 γ + εt , εt = ρεt−1 + νt
dann ist OLS (ohne Berücksichtigung der Autokorrelation)
inkonsistent, d.h. die Schätzung von β, γ ist verzerrt und
verschwindet auch bei zunehmender Beobachtungsanzahl nicht. In
diesem Fall ist die Durbin-Watson Statistik gegen 2 (keine
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
40
Autokorrelation) verzerrt und Durbin-h muss berechnet werden:
s
T −1
Durbin−h = ρ̂
1 − (T − 1)V {bγ }
Die Varianz V {bγ } ist die Varianz des Koeffizienten γ und T − 1
wird im Nenner eingesetzt, da wir eine Beobachtung verlieren. Der
geschätzte Wert ρ̂ kann aus der Beziehung zwischen d and ρ
abgeleitet werden:
1
d = 2 − 2ρ −→ ρ = 1 − d.
2
Bei vielen Beobachtungen ist h unter der Nullhypothese N (0, 1)
verteilt. Deshalb verwerfen wir die Nullhypothese auf einem 5%
Signifikanzniveau, wenn h > 1.96, und auf einem 1%
Signifikanzniveau, wenn h > 2.58.
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
41
Wenn Autokorrelation höherer Ordnung vorliegt, testen wir auf
Unkorreliertheit mittels der Hilfsregression
(H) et = ρ1 et−1 + ρ2 et−2 + · · · + ρp et−p + νt ,
wobei die Nullhypothese H0 : ρ1 = ρ2 = · · · = ρp = 0 und die
6 ρp 6= 0 sind. Der Breusch-Godfrey
Alternative H1 : ρ1 6= ρ2 6= · · · =
(beide 1978) LM -Test berechnet sich als
LM = T · R2 ,
wobei T die Anzahl Beobachtungen im Ausgangsmodell (A) ist und
das R2 aus der Hilfsregression (H) stammt.
2(0.05)
LM ist χ2 -verteilt mit p Freiheitsgraden. Falls LM > χp
die Nullhypothese keiner Autokorrelation abgelehnt.
Angewandte Ökonometrie, Sylvia Kaufmann, FS09
wird
42