Bestimmung der Regressionsgeraden

Transcrição

Bestimmung der Regressionsgeraden
Lineare Regression – Anleitung zur Bestimmung einer
Regressionsgeraden
1. Gerade nach Augemaß
è Formuliere Erwartungen ohne das Datenmaterial.
è Nutze die Daten zur Beantwortung der Frage (Punktdiagramm zeichnen!).
è Lege eine Ausgleichsgerade durch die Punktwolke, durch die der von Dir
festgestellte Trend deutlich wird.
wichtig:
Eine Regression muss nicht unbedingt linear (Annäherung durch eine
Gerade) erfolgen. Grundsätzlich kann man beliebige Funktionstypen eine
Regression auswählen, wenn man dies begründen kann. Im vorliegenden
Beispiel könnte man sich zum Beispiel auch überlegen, eine exponentielle
Ausgleichsfunktion zu wählen. Wir beschränken uns an dieser Stelle aber auf
eine lineare Regression, da sie am einfachsten zu berechnen ist und für den
betrachteten Zeitausschnitt durchaus der Realität nahe kommt.
è Hast Du eine Ausgleichsgerade „nach Augenmaß“ durch die Punktwolke
gelegt, überlege Dir, wie Du die Regression verbessern kannst, d. h. wie Du
die Lage der Geraden verändern musst, damit sie möglichst gut den Trend
der vorliegenden Daten widerspiegelt.
Im Folgenden wird erläutert, wie man eine Regressionsgerade direkt aus den Daten
mit der gängigen „Methode der kleinsten Quadrate“ (kQ) bestimmt.
2. Idee der Bestimmung der Geraden mit der Methode der kleinsten
Quadrate (kQ)
è Bestimme die Geradengleichung Deiner Ausgleichsgeraden „nach Augenmaß“
aus der Zeichnung.
Einführung
f:
(xi, yi):
f(xi):
von im Folgenden verwendeten Bezeichnungen:
zur Geraden nach Augenmaß gehörige Funktion
nummerierte Datenpunkte für i=1,…,8
zu xi gehöriger Modellwert
è Zeichne die Lote von den Datenpunkten auf die Gerade in Dein Diagramm
ein, d. h. zeichne jeweils die Verbindungen der Punkte (xi, yi) und (xi, f(xi))
ein.
Bei der kQ-Methode fordert man, dass die Differenzen yi – f(xi) insgesamt
möglichst klein sein sollen.
An dieser Stelle sind auch andere Möglichkeiten denkbar. Der Grund für die
Wahl dieses Kriteriums besteht darin, dass man die yi möglichst gut aus den
xi vorherbestimmen möchte (geringe Abweichung).
Nahe liegend wäre es an dieser Stelle eine möglichst gute Regression zu
bestimmen, indem man versucht, die durchschnittlichen absoluten
Abweichungen zu minimieren.
Wie bei der Streuung (Varianz, Standardabweichung!) verwendet man für die
Bestimmung der Regressionsgeraden mit der kQ-Methode jedoch quadratische
Abweichungen (daher auch der Name der Methode). Man möchte also eine
Gerade bestimmen, so dass die Summe
2
2
2
2
2
1
8 [( y1 - f (x1 )) + (y 2 - f (x 2 )) + (y 3 - f (x3 )) + (y 4 - f (x 4 )) + (y 5 - f (x 5 ))
+(y 6 - f (x 6 ))2 + (y 7 - f (x 7 ))2 + (y 8 - f (x8 ))2 ]
minimal ist. Der Vorteil dieses Weges ist, dass man auf jeden Fall eine
eindeutige Gerade bekommt, was im nicht quadratischen Fall nicht sein muss.
Führt man diesen Weg fort, erhält man ein Verfahren, mit dem man eine
Regressionsgerade direkt aus den Daten bestimmen kann. Dies soll an dieser
Stelle nicht erläutert werden, ist aber vor allem für zukünftige LK-ler
interessant. (Für entsprechendes Material sprecht mich bitte an!)
3. Bestimmung der Geraden mit der kQ-Methode
Man kann zeigen, dass der Schwerpunkt der Punktwolke S (x , y ) auf einer so
bestimmten Regressionsgeraden liegt. Die Gerade selbst hat die Gleichung
y = m × (x - x ) + y . Die Steigung m ergibt sich mit der kQ-Methode wie folgt:
S
m = xy mit
Sxy = 81 [(x1 - x ) × (y1 - y ) + ... + (x8 - x ) × (y 8 - y )] und
Sxx
Sxx = 81 [(x1 - x )2 + ... + (x8 - x )2 ] .
Für die praktische Berechnung bedient man sich am besten einer Tabelle:
i
xi
yi
(xi - x )
(xi - x )2
( yi - y )
(xi - x ) ( yi - y )
1
2
3
4
5
6
7
8
x =
y =
Sxx =
Sxy =
è Berechne die Regressionsgerade nach der kQ-Methode, zeichne sie in Dein
Diagramm ein und vergleiche Sie mit Deiner Geraden „nach Augenmaß“.