Ad-hoc-Erläuterungen zu G*Power

Transcrição

Ad-hoc-Erläuterungen zu G*Power
GP3 07
1
1
G*Power 3
Dies Dokument enthält ad hoc zusammengestellte Hinweise zur Benutzung der
Programms G*Power 3.0 von Franz Faul, Edgar Erdfelder, Albert Lang und Axel
Buchner. Die Anordnung ist völlig unsystematisch; sie folgt etwa dem Gang der
Veranstaltung.
1.1
Installation
Das Programm kann heruntergeladen werden von
http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3
Die Installation geht wie üblich (Hinweise finden sich auf der genannten Seite):
Rechter Mausklick auf die zip-Datei, Alle Extrahieren....
Danach findet man in dem Ordner GPower3Windows die Datei setup.exe, die wie
üblich das Programm installiert.
Danach befindet sich das Programm GPowerNT.exe im Ordner GPower 3.0 und
kann wie gewohnt mit Doppelklick gestartet werden.
1.2
Chi-Quadrat
α-Fraktile bestimmen
Einstellungen: Test family: χ2 tests, Statistical test: - Generic χ2 test, Type of
power analysis: Post hoc: ...
• Noncentrality parameter auf 0 (ist hier irrelevant)
• α eingeben
• df einstellen
• Calculate drücken
• Kritischen Wert bei Critical χ2 ablesen
1.2 Chi-Quadrat
GP3 07
2
Alternative:
• Im Menü auf Calculator drücken
• Ein neues Fenster erscheint
• Dort chi2inv(1−α,n) eingeben (für α, n natürlich konkrete Werte einsetzen)
• Calculate drücken
• Ergebnis unter Result ablesen
Bemerkung: inv steht für Inverse‘ (der Verteilungsfunktion), chi2inv(α,n) gibt
’
also den Wert an, an dem die Verteilungsfunktion den Wert α annimmt, mit
andern Worten: das α-Quantil der Verteilung. Da hier nach dem Fraktil gefragt
ist, ist α durch 1 − α zu ersetzen.
Bemerkung: Zahlen kleiner 1 müssen als 0.xxx eingegeben werden, .xxx funktioniert nicht. Die führende 0 darf also nicht weggelassen werden. Beispielsweise
muss für das 5%-Fraktil von χ213 die Eingabe chi2inv(0.95, 13) lauten und nicht
chi2inv(.95, 13), was zu einer Fehlermeldung führt.
Anzeigen von Dichtefunktionen verschiedener χ2 -Verteilungen:
Einstellungen: Test family: χ2 tests, Statistical test: - Generic χ2 test, Type of
power analysis: Post hoc: ...
• Noncentrality parameter auf 0 (ist hier irrelevant)
• α so lassen (ist hier irrelevant)
• df einstellen
• Calculate drücken
• Dichtefunktion bewundern
Powerbestimmung, falls Verteilung unter H1 gestreckte χ2 -Verteilung
ist
Gesucht ist die Wahrscheinlichkeit, mit der bei einer χ2 -Verteilung mit n df ein
Wert x überschritten wird
1.3
t
GP3 07
3
• Im Menü auf Calculator drücken
• Ein neues Fenster erscheint
• Dort 1-chi2cdf(x, n) eingeben (für x, n natürlich konkrete Werte einsetzen)
• Calculate drücken
• Ergebnis unter Result ablesen
Bemerkung: cdf steht für cumulative density function‘, das ist die Verteilungs’
funktion. chi2cdf(x, n) gibt den Wert der Verteilungsfunktion der χ2n -Verteilung
an der Stelle x an.
Anzeigen von Dichtefunktionen verschiedener nonzentraler
χ2 -Verteilungen:
Einstellungen: Test family: χ2 tests, Statistical test: - Generic χ2 test, Type of
power analysis: Post hoc: ...
• Noncentrality parameter einstellen
• α so lassen (ist hier irrelevant)
• df einstellen
• Calculate drücken
• Dichtefunktion bewundern
1.3
t
Alles analog zu χ2 ; Einstellungen jetzt: Test family: t tests, Statistical test: Generic t tests, Type of power analysis: Post hoc: ...
Tail(s) kann auf One gesetzt werden.
Die Funktion für die Quantile heißt hier tinv(α,n).
Aus irgendwelchen Gründen sind die x-Achsen nicht symmetrisch um 0, was sich
besonders bei kleinen dfs bemerkbar macht.
1.4
F
GP3 07
4
Die Verteilungsfunktion erhält man als tcdf(x, n), wobei n die df sind und x der
Wert, an dem man den Wert der Verteilungsfunktion ermitteln will.
Das α-Quantil der nonzentralen tn,δ -Verteilung erhält man mit dem Calculator
mit Hilfe der Funktion nctinv(α,n,δ).
Die Verteilungsfunktion der nonzentralen tn,δ -Verteilung an der Stelle x liefert im
Calculator die Funktion nctcdf(x,n,δ).
1.4
F
Alles analog zu χ2 ; Einstellungen jetzt: Test family: F tests, Statistical test: Generic F tests, Type of power analysis: Post hoc: ...
Die Funktion für die Quantile heißt hier finv(α, m, n) (m und n sind dabei
natürlich die Zähler- und Nennerdf).
Die Verteilungsfunktion erhält man als fcdf(x, m, n), wobei m und n die df sind
und x der Wert, an dem man den Wert der Verteilungsfunktion ermitteln will.
Das α-Quantil der nonzentralen Fm,n,δ2 -Verteilung erhält man mit dem Calculator
mit Hilfe der Funktion ncfinv(α, m, n, δ 2 ).
Die Verteilungsfunktion der nonzentralen Fm,n,δ2 -Verteilung an der Stelle x liefert
im Calculator die Funktion ncfcdf(x, m, n, δ 2 ).
1.5
G*Power beim t-Test
Die Ergebnisse für die Beispiele sind hier im Vergleich zum Programm gerundet.
Ein Hinweis: Die Ergebnisse der Einzelrechnungen werden protokolliert und können unter dem Reiter Protocol of power analyses abgerufen werden. Man kann
sich also das Notieren von Ergebnissen weitgehend sparen. Es gibt auch die
Möglichkeit, das Protokoll abzuspeichern.
Powerberechnungen
Zunächst Bestimmung der Power beim Einstichproben-t-Test. Vorbereitung im
Telegrammstil Test family: t tests; Statistical tests: Means: Difference from con-
1.5
G*Power beim t-Test
GP3 07
5
stant (one sample case); Type of power analysis: Post hoc...
Nun ein Beispiel. Wie groß ist die Power eines einseitigen t-Tests der Hypothesen
H0 : µ = 50, H1 : µ > 50, wenn das wahre µ gleich 53 und das wahre σ gleich 6
ist, und wenn der Test auf dem 5%-Niveau mit einer Stichprobe vom Umfang 17
durchgeführt wird?
Zunächst ist hier die Effektstärke zu berechnen: (µ − µ0 )/σ = (53 − 50)/6 =
.5. Dieser Wert ist bei Effect size d einzutragen. Bei Alpha ist natürlich .05
einzugeben. Die Stichprobengröße ist 17; dieser Wert muss bei Total sample size
eingegeben werden. Schließlich ist noch bei Tail(s) One zu setzen. Nun kann das
Ergebnis mit Return oder Calculate abgerufen werden. Als Power ergibt sich
.6287, also 62.87%. Die Aufgabe ist damit gelöst.
Anmerkungen: 1. Auch der kritische t-Wert wird ausgegeben: das 5%-Fraktil der
t16 -Verteilung ist 1.7459. Die Anzahl der Freiheisgrade ist 17 − 1 = 16; dies findet
man bei Df.
√
√
2. Zur Kontrolle findet man auch den NZP δ, der sich ja als nd = 17 · .5 =
2.0616 errechnet (d steht für die Effektstärke). Falls Sie nachrechnen wollen: Rufen
Sie den Calculator auf (aus dem Menü), geben Sie sqrt(17)*0.5 ein (sqrt steht
natürlich für square root - Quadratwurzel; beachten Sie auch, dass die 0 bei 0.5
eingegeben werden muss) und drücken Sie dann die Calculate-Taste; das Ergebnis
wird dann unten angezeigt.
3. Auch die Effektstärke braucht man nicht von Hand zu berechnen. Drückt man
auf die Schaltfläche Determine links von Effect size d, so öffnet sich rechts ein
Zusatzfenster. Dort kann man die Mittelwerte unter H0 und H1 eingeben sowie
die Streuung σ. Die Calculate Taste liefert die Effektstärke, die Taste Calculate
and transfer to main window überträgt das Ergebnis zusätzlich ins Hauptfenster.
Beim zweiseitigen t-Test im Einstichprobenfall verfahren Sie ganz genauso, außer
dass jetzt Tail(s) auf Two zu setzen ist.
Nun zum Zweistichprobenfall (unabhängige Stichproben). Auch hier ein Beispiel:
Getestet werden soll H0 : µ2 = µ1 , H1 : µ2 6= µ1 , diesmal zur Abwechslung auf
dem .1-Niveau und mit Stichproben vom Umfang 13 aus der ersten Population
und vom Umfang 24 aus der zweiten Population. Es sei unterstellt, dass µ1 = 12,
µ2 = 10 und σ = 5 die wahren theoretischen Kennwerte sind. Wie groß ist die
Power?
1.5
G*Power beim t-Test
GP3 07
6
Zur Lösung gibt es zwei Möglichkeiten. Zunächst die, die näher an der inhaltlichen
Formulierung der Fragestellung liegt: Einstellungen wie zuvor, nur bei Statistical tests jetzt Means: Difference between two independent means (two groups).
Ferner natürlich Two bei Tail(s). Als Effektstärke ergibt sich (10 − 12)/5 = −.4
(man kann dies auch wieder mit der Taste Determine vom Programm ausrechnen
lassen; hierzu muss man die obere Möglichkeit n1 ! = n2 anwählen – ! =‘ steht
’
dabei für 6=‘, was aber hier nicht weiter interessiert. Das Programm gibt anschei’
nend nur positive Effektstärken aus, hier also .4, was aber wegen der Symmetrie
der t-Verteilung die gleiche Power liefert wie −.4). Nun sind noch für α der Wert
.1 und für Sample size group 1 bzw. 2 die beiden Gruppengrößen 13 und 24 einzutragen; Calculate oder Return liefert dann als Power .3092. Nebenbei erhält man
auch δ = −1.1615 und den zweiseitigen kritischen Wert −1.6896 (gemeint ist
natürlich, dass die kritischen Werte 1.6896 und −1.6896 sind, das Minuszeichen
liegt wohl an der negativen Effektstärke). Auch die Anzahl der Freiheitsgrade
(35) ist richtig.
Man kann hier (analog übrigens ebenso im Einstichprobenfall) auch direkt am
NZP orientiert vorgehen; man ist dabei in gewisser Weise dichter an den Verteilungen, dafür jedoch weiter von der inhaltlichen Frage entfernt. Dazu wählt
man bei Statistical test die Möglichkeit Generic t test q
aus (die anderen Einsteln2
lungen bleiben). Der NZP ergibt sich nach der Formel nn11+n
d zu δ = −1.1615
2
(diese Zahl bestimmt man beispielsweise mit dem Calculator, indem man dort
sqrt(13*24/(13+24))*-0.4 eingibt). Nun ist nur noch für Tail(s) Two anzugeben,
für α der Wert .1 und für Df die Zahl 35. Das Resultat erhält man dann mit Return
oder Drücken der Calculate-Taste. Wegen der Symmetrie der t-Verteilung erhält
man übrigens dieselbe Power, wenn man das Minuszeichen beim NZP weglässt.
Der Fall abhängiger Stichproben ist ganz analog zu behandeln; die einzige wesentliche Änderung besteht darin, dass bei Statistical test jetzt Means: Difference
between two dependent means (matched pairs) zu wählen ist. Auch hier kann die
Effektstärke (sie heißt im Programm dz) mit Determine bestimmt werden (wobei die Option besteht, mit den Kennwerten der beiden Bedingungen zu rechnen
(unten) oder gleich mit den Kennwerten der Differenz D (oben)). Man kann aber
auch hier mit Generic t test dicht bei den Formeln arbeiten und muss dann den
NZP selbst bestimmen.
Bestimmung von Stichprobengrößen
Beispiel für unabhängige Stichproben: Diesmal sei die Effektstärke von vornherein
1.6
G*power in der einfaktoriellen Varianzanalyse
GP3 07
7
gegeben: d = .3. Gefragt ist, wie groß man die beiden Stichproben machen muss,
um beim zweiseitigen t-Test auf dem 5%-Niveau eine Power von mindestens .7 zu
erhalten. Diese Aufgabe ist so noch nicht ganz eindeutig, es gibt viele Lösungen,
wenn man ungleiche Stichprobengrößen zulässt. Daher soll zusätzlich gefordert
werden, dass beide Stichproben gleich groß sind.
Lösung: Test famliy: t tests; Statistical tests: Means: Difference between two
independent means (two groups); Type of power analysis: A priori, ... Für Tail(s)
ist dann Two auszuwählen. Effect size: .3, α: .05, und Power: .7 sind einzusetzen
(die Effektstärke kann auch wie zuvor mit Determine bestimmt werden, wenn sie
nicht wie hier schon von Anfang an vorliegt). Bei Allocation ratio (Verhältnis
der Stichprobengrößen) ist 1 einzugeben. Calculate oder Return liefert rechts das
Ergebnis: neben anderen Angaben die Größe 139 für jede der beiden Gruppen. Bei
Actual Power sieht man, dass der Wert von .7 etwas überschritten ist; das ist auch
nicht anders zu erwarten, da die Stichprobengrößen ja nur diskrete ganzzahlige
Werte sein können.
Sie können nun kontrollieren, indem Sie für die Stichprobengrößen von 139 die
Power wie oben ermitteln. Machen Sie nun den Vergleich mit Stichproben, die
jeweils um 1 kleiner sind!
Der Einstichprobenfall geht genauso, nur dass für Statistical tests: die Möglichkeit
Means: Difference from constant (one sample case) zu wählen ist.
Der Zweistichprobenfall für abhängige Stichproben ist ebenfalls ganz analog, nur
ist hier bei Statistical tests die Option Means: Difference between two dependent
means (matched pairs) zu wählen.
1.6
G*power in der einfaktoriellen Varianzanalyse
Bestimmung von kritischen F-Werten
Kritische F -Werte kann man (analog übrigens auch kritische t-Werte) statt mit
dem Calculator auch mit dem Hauptprogramm bestimmen.
Beispiel: Aufgabe ist es, das .005-Fraktil der F7,24 -Verteilung zu bestimmen, also
den Wert, der bei der F7,24 -Verteilung rechts .5% abschneidet.
Lösung: Test family: F tests, Statistical test: Generic F test, Type of power ana-
1.6
G*power in der einfaktoriellen Varianzanalyse
GP3 07
8
lysis: Post hoc... Bei Numerator df (Zähler) 7 eingeben und bei Denominator df
(Nenner) 24, bei alpha .005. Die anderen Werte sind hier gleichgültig. Calculate
liefert als kritischen Wert Critical F: 3.9905.
Powerberechnungen
Beispiel: In einer Varianzanalyse mit drei Gruppen seien die Erwartungswerte
der Gruppen 3, 5 und 8, die (wahre) Streuung innerhalb der Gruppen sei 2. Die
Gruppengrößen seien 3, 4 und 2. Wie groß ist die Power, wenn auf 5%-Niveau
getestet wird?
Es gibt verschiedene Möglichkeiten, diese Aufgabe zu lösen. Am einfachsten ist
wohl die jetzt als erste beschriebene. Test family: F tests, Statistical test: ANOVA:
Fixed effects, omnibus, one-way. Type of power analysis: Post hoc... Dann bei
alpha: .05. Total sample size: 3 + 4 + 2 = 9. Number of groups: 3.
Nun ist die Effektstärke f zu berechnen (Achtung: es geht hier um f und nicht
um f 2 ). Eine Möglichkeit ist die Bestimmung von Hand: Für µ ergibt sich hier
(3 · 3 + 4 · 5 + 2 · 8)/9 = 5. Es folgt α1 = −2, α2 = 0 und α3 = 3. Daraus folgt:
f 2 = ((3/9)(−2)2 + (4/9)(0)2 + (2/9)(3)2 ))/4 = 5/6 (als praktische Rechnung ist
natürlich (3 · (−2)2 + 4 · (0)2 + 2 · (3)2 ))/(9 · 4) vorzuziehen) und f = .91287.
Nebenbei ergibt sich auch δ 2 als 15/2 = 7.5 (man muß nur im Vergleich zu f 2
die Division durch 9 weglassen). Diese Effektstärke kann nun bei Effect size f
eingegeben werden.
Die einfachere Alternativmöglichkeit besteht darin, die Effektstärke von Gpower
bestimmen zu lassen: Hierzu ist Determine vor Effect size f zu drücken. In dem
sich öffnenden Seitenfenster müsste Number of groups schon richtig mit 3 eingetragen sein; andere Werte erhält man, wenn man auf die kleinen Tasten mit
den nach oben bzw. unten weisenden Dreiecken in dem Eingabefeld drückt. Für
SD sigma within each group ist 2 einzugeben (Achtung: es geht wirklich um die
Streuung und nicht um die Varianz). Nun Erwartungswerte (Mean) und Gruppengrößen (size) in der Tabelle darunter eingeben. Calculate liefert die richtige Effektstärke f und zur Kontrolle die Gesamtstichprobengröße. Mit Calculate
and transfer to main window wird die Effektstärke gleich in das Hauptfenster
übertragen.
Nun liefert schließlich Calculate (im Hauptfenster – oder einfach Return) die
Ergebnisse. Die Power ist .4605, der kritische F -Wert wird auch noch einmal
ausgegeben, und schließlich findet man zur Kontrolle auch den NZP, der hier λ
1.6
G*power in der einfaktoriellen Varianzanalyse
GP3 07
9
heißt.
Nun eine Alternativmöglichkeit, deren Kenntnis für kompliziertere Fälle nützlich
ist: Test family: F tests, Statistical test: Generic F test. Type of power analysis:
Post hoc... Zähler- und Nennerfreiheitsgrade bei Numerator und Denominator df
eingeben, also hier 2 und 6. Alpha ist wieder .05. Bei dem Noncentrality parameter
λ (unser δ 2 ) ist der oben schon bestimmte Wert 7.5 einzutragen.
Bestimmung von Stichprobengrößen
Beispiel: Für vier Bedingungen werden folgende Erwartungswerte unterstellt: 2,
4, 6, 8. Als wahre Streuung innerhalb der Bedingungen vermutet man 3. Wie
groß müssen die Stichproben gewählt werden, damit die Power mindestens 80%
beträgt (bei Signifikanzniveau 1%)?
Hier gibt es natürlich viele Lösungen, zur Einschränkung wird gefordert, daß die
vier Stichproben gleich groß sein sollen.
Lösung: Test family: F tests, Statistical test: ANOVA: Fixed effects, omnibus,
one-way. Type of power analysis: A priori...
Zunächst ist die Effektstärke zu berechnen (Achtung: dies ist hier f und nicht
f 2 ). Da die Gruppen gleich groß sein sollen, ist dies hier einfach die Streuung der
Erwartungswerte dividiert durch die Streuung innerhalb der Zellen. Der Mittelwert der Erwartungswerte ist 5, die Varianz also 20/4 = 5. Die Wurzel daraus
ist noch durch 3 (Streuung innerhalb der Gruppen) zu dividieren. Ergebnis ist
.745356. Diese Zahl ist bei Effect size f einzugeben.
Auch hier wieder eine einfachere Alternative mit Determine vor Effect size f .
Bevor man auf diese Taste drückt, sollte man bei Number of groups 4 eintragen,
damit die Tabelle für die Gruppenerwartungswerte richtig vorbereitet wird. Man
kann diese Zahl aber auch durch Drücken auf den kleinen Tasten im Eingabefeld
Number of groups im Nebenfenster korrigieren; beim späteren Übertrag in das
Hauptfenster wird man gegebenenfalls auf die Diskrepanz aufmerksam gemacht
und kann korrigieren lassen. Für SD σ within each group ist die Streuung 3 einzugeben. Für die Gruppengröße kann man nach Equal n irgendeine Zahl eingeben
(überlegen Sie sich anschließend, warum immer dasselbe Ergebnis herauskommt),
zum Beispiel sogar 1. Wenn man dann Equal n drückt, wird die Spalte size in der
Tabelle schon richtig ausgefüllt. Nun am einfachsten Vierfachklicks auf die Zahlen
in der Spalte mean, dann kann direkt der entsprechende Wert richtig eingegeben
werden. Anschließend Calculate und das richtige f steht da. Mit Calculate and
1.6
G*power in der einfaktoriellen Varianzanalyse
GP3 07
10
transfer to main window kann es wieder direkt übertragen werden.
Nun noch Alpha (.01) und Power (.8) eingeben, Calculate oder Return. Man
erhält eine Gesamtstichprobengröße von 36, die noch durch 4 (Zahl der Gruppen)
zu dividieren ist. Die Stichprobengröße pro Zelle ist also 9. Man prüft leicht nach,
daß eine Verminderung auf 8 zu einer Power führt, die zu klein ist.

Documentos relacionados