Life expectancy

Transcrição

Life expectancy
Methoden der Empirische Wirtschaftsforschung I
Online-Exercise: Life expectancy
Herbert Stocker
Die durchschnittliche Lebenserwartung hat in den meisten Ländern über die letzten fünf
Dekaden mehr oder weniger stark zugenommen. Im Rahmen dieser Übung sollen Sie die
durchschnittliche Zunahme der Lebenserwartung pro Jahr für ein bestimmtes Land schätzen
und einige Hypothesen testen.
Die Angabe, für welches Land Sie die Berechnungen durchführen sollen, sowie weitere Angaben finden Sie im Login-Bereich der Kursseite http://www.hsto.info/econometrics/
login.php.
Als Datengrundlage verwenden wir die ‘World Development Indicators’ (WDI) der Weltbank, die eine große Zahl von Entwicklungsindikatoren für (fast) alle Länder dieser Welt
enthalten. Die World Development Indicators (WDI) finden Sie auf der Homepage der Weltbank http://databank.worldbank.org/
Suchen Sie in dieser Datenbank folgende Datenreihe für ‘Ihr’ Land
• Life expectancy at birth, total (years)
→
• GDP per capita (constant 2005 US$)
GDPpC
→
LE
Achten Sie darauf, dass die Daten tatsächlich als Zeitreihendaten eingelesen werden!
Geben Sie der ersten Datenreihen Life expectancy at birth den Namen LE und der zweiten Datenreihe GDP per capita (constant 2005 US$) den Namen GDPpC.
Link: zur Berechnung der Lebenserwartung (klicken).
Legen Sie allen folgenden Berechnungen – sofern nichts anderes angegeben wird – ein Signifikanzniveau von 5 Prozent (α = 0.05) zugrunde und geben Sie alle numerische Eingaben
mindestens auf 3 Kommastellen genau ein.
Für minus Unendlich (−∞) geben Sie bitte −999 und für plus Unendlich (+∞) +999 ein.
Zum Einlesen der Daten ist es zweckmäßig, die Rohdaten zuerst mit einem Editor oder
mit Excel anzusehen sie in eine ‘rechteckige Form’ zu bringen, sodass in den Zeilen die
Jahre/Individuen und in den Spalten die Variablen stehen, mit gültigen Variablennamen in
der ersten Zeile. Variablennamen sollten kurz und sprechend sein und dürfen keine Leeroder Sonderzeichen enthalten. Besonders zu achten ist auf fehlende Variablen (‘missings’ ).
Im Folgenden nehmen wir an, dass die Variablen aus Excel (mit deutschen Einstellungen)
in das csv-Format exportiert wurden (csv steht für comma separated values).
Es empfiehlt sich die Daten for dem importieren mit einem Editpr anzusehen
Time;LE;GDPpC
1960;34,78317073;552,0642295
1961;35,04626829;553,3919645
1962;35,35412195;548,6742032
...
2012;60,20639024;275,6845029
2013;60,53187805;299,4491726
2014;..;..
Mit den deutschen Spracheinstellungen verwendet Excel ein Komma (,) als Dezimaltrennzeichen und einen Strichpunkt um die Felder zu trennen. In diesem Beispiel fehlen die Werte
für 2014, und fehlende Werte werden in diesem Beispiel durch zwei Punkte gekennzeichnet.
R
MyDF <- read.table("MyData.csv", dec = ",", sep = ";",
header = TRUE, na.strings = "..", stringsAsFactors = FALSE)
MyDF <- na.omit(MyDF)
head(MyDF)
Stata
insheet using MyData.csv, delimiter(";") names clear
destring, replace force dpcomma
list in 1/5
1. Berechnen Sie eine Regression
LE = βb1 + βb2 Trend + ε
(1)
wobei LE die Variable ‘Life expectancy at birth, total (years)’ und ‘Trend’ eine Trendvariable ist, die bei Null beginnt, d.h. Trend = 0, 1, 2, . . . , T .
Geben Sie das Interzept von Gleichung (1) ein.
Hinweise:
EViews:
series Trend = @trend
equation eq1 .ls LE c Trend
show eq1
R
Trend <– (1:nrow(MyDF ))-1
eq1 <– lm(LE ∼ Trend, data=MyDF)
Stata:
tsset Time, yearly
gen Trend = n-1
reg LE Trend
2. Geben Sie den Steigungskoeffizienten von Gleichung (1) ein.
Hinweis: auf geschätzte Koeffizienten zugreifen können Sie z.B. mit
EViews: eq1 .@coefs(1), eq1 .@coefs(2), . . .
oder kürzer für die zuletzt geschätzte Gleichung: c(1), c(2), . . .
R: coef(eq1 )[1], coef(eq1 )[2], . . .
Stata: b[ cons], b[Trend ], . . .
3. Geben Sie das normale Bestimmtheitsmaß (R2 ) von Gleichung (1) ein.
Hinweis: auf das R2 können Sie mit folgenden Befehlen zugreifen:
EViews: myeq1 .@r2;
2
R: summary(eq1)$r.squared);
Stata: e(r2); mit ereturn list erhalten Sie eine Liste aller zugreifbaren Werte der
letzten Regression.
4. Berechnen Sie nun das Konfidenzintervall für den Steigungskoeffizienten βb2 und geben
Sie den unteren (linken) Wert davon ein (α = 0.05).
Hinweis: die kritischen Werte können Sie berechnen mit
EViews: @qtdist(0.025,eq1.@df)
Stata: invttail(e(df_r,0.025) R: qt(0.025,eq1$df)
Auf die Standardfehler können Sie ebenfalls zugreifen:
EViews: eq1.@stderrs(2);
R: das Objekt summary(eq1 )$coefficients gibt eine Matrix zurück, in deren Spalten
der Reihe nach Koeffizient, Standardfehler, t-Wert und p-Wert stehen, z.B.
> summary(eq1)$coefficients
Estimate Std. Error
t value
Pr(>|t|)
(Intercept) 51.3690546 0.85027747 60.414460 2.101860e-48
TREND
0.1430955 0.02873642 4.979586 7.975862e-06
Mit dem folgenden Befehl können Sie z.B. auf den Standardfehler des Trends zugreifen:
summary(eq1 )$coefficients[2,2]
Einen Vektor se mit allen Standardfehlern erhalten Sie z.B. mit
se <- sqrt(diag(vcov(eq1)))
Stata: _se[trend]
5. Geben Sie den oberen (rechten) Wert des obigen Konfidenzintervalls für den Steigungskoeffizienten βb2 ein.
6. Wenn Sie mittels t-Test die Hypothese testen möchten, ob sich die erwartete Lebenserwartung über den betrachteten Zeitraum verändert hat, wieviele Freiheitsgrade legen
Sie diesem Test zugrunde?
7. Geben Sie den linken (unteren) Wert des Akzeptanzbereichs für die Nullhypothese ein,
dass sich die Lebenserwartung nicht verändert hat (α = 0.05).
8. Geben Sie den den rechten (oberen) Wert des Akzeptanzbereichs für obige Nullhypothese ein (α = 0.05).
9. Geben Sie den empirischen Wert der t-Statistik für den Test obiger Nullhypothese ein.
10. Berechnen Sie den empirischen Wert der t-Statistik die Nullhypothese H0 : β2 = β0
und geben Sie diesen ein.
‘Ihren’ Wert für β0 finden Sie im Login-Bereich der Kursseite.
Hinweis: Verwenden Sie die internen Werte für die Koeffizienten und Standardfehler,
siehe Frage 4. z.B. für β0 = 0.5
EViews: show (eq1.@coefs(2) - 0.5)/eq1.@stderrs(2)
R: myCoef <- summary(eq1)$coefficients
TS <- (myCoef[2,1] - 0.5)/myCoef[2,2]
Stata: dis (_b[trend] - 0.5)/_se[trend]
3
11. Geben Sie den linken (unteren) Wert des Verwerfungsbereichs für diese Nullhypothese
β2 = β0 ein (geben Sie −999 für −∞ und +999 für +∞ ein; α = 0.05).
12. Geben Sie den rechten (oberen) Wert des Verwerfungsbereichs für diese Nullhypothese
ein (geben Sie −999 für −∞ und +999 für +∞ ein; α = 0.05).
13. Berechnen Sie den p-Wert für diese Nullhypothese H0 : β2 = β0 .
14. Angenommen Ihre Anfangsvermutung ist, dass die durchschnittliche Lebenserwartung
in ‘Ihrem’ Land über den betrachteten Zeitraum pro Jahr um weniger als β0 Jahre
zugenommen hat (‘Ihren’ Wert für β0 finden Sie im Login-Bereich der Kursseite).
Die Nullhypothese ist die Gegenhypothese zu Ihrer Anfangsvermutung, also H0 : β2 ≥
β0 , bzw. β2 − β0 ≥ 0. Wenn die Nullhypothese richtig ist, dann ist es sehr unwahrscheinlich einen stark negativen Schätzwert für βb2 − β0 zu erhalten.
Geben Sie den empirischen Wert der betreffenden t-Statistik für diese Nullhypothese
ein.
15. Geben Sie den linken (unteren) Wert des Verwerfungsbereichs für diese Nullhypothese
ein (geben Sie −999 für −∞ und +999 für +∞ ein; α = 0.05).
16. Geben Sie den rechten (oberen) Wert des Verwerfungsbereichs für diese Nullhypothese
ein (geben Sie −999 für −∞ und +999 für +∞ ein; α = 0.05).
17. Berechnen Sie den p-Wert für den Test dieser Nullhypothese H0 : β2 ≥ β0 .
18. Angenommen, Ihre Anfangsvermutung wäre gewesen, dass die durchschnittliche Lebenserwartung in ‘Ihrem’ Land über den betrachteten Zeitraum pro Jahr um mehr
als β0 Jahre zugenommen hat (‘Ihren’ Wert für β0 finden Sie im Login-Bereich der
Kursseite).
Formulieren Sie die dazugehörige Nullhypothese und geben Sie den empirischen Wert
der betreffenden t-Statistik ein.
19. Geben Sie den linken Wert des Verwerfungsbereichs für diese Nullhypothese ein (geben
Sie −999 für −∞ und +999 für +∞; α = 0.05).
20. Geben Sie den rechten Wert des Verwerfungsbereichs für diese Nullhypothese ein (geben Sie −999 für −∞ und +999 für +∞ ein).
21. Berechnen Sie den p-Wert für den Test dieser Nullhypothese.
22. Legen Sie eine neue Trendvariable T60 an, die im Jahr 1960 den Wert 1960 hat und
bis zum letzten Jahr läuft (T60 = 1960, 1961, . . .) und regressieren Sie diesen neuen
Trend T60 auf die Lebenserwartung LE (d.h. LE = βb1 + βb2 T60 + ε).
Vergleichen Sie das Ergebnis mit der Schätzung von Gleichung (1) und geben Sie das
Interzept der neuen Schätzung ein.
23. Geben Sie den Steigungskoeffizienten der neuen Schätzung LE = βb1 + βb2 T60 + ε ein.
4