Kontrolle in Experimenten

Transcrição

Kontrolle in Experimenten
Empirische Softwaretechnik
Prof. Dr. Walter F. Tichy
Dr. Matthias Müller
Sommersemester 2006
1
Kontrolle in Experimenten
Literatur: L.B. Christensen, Experimental Methodology, Allyn
and Bacon, 2001, Kap. 7
2
Wozu Kontrolle?
ƒ
Interne Gültigkeit eines Experiments liegt vor, wenn man
gerechtfertigt ist anzugeben, dass die unabhängige
Variable den beobachteten Effekt hervorgerufen hat. Falls
der Effekt nur durch Variation der unabhängigen Variablen
verursacht wird, hat man interne Gültigkeit erreicht und
einen kausalen Zusammenhang beobachtet.
ƒ
Es gibt aber noch viele andere Variablen, die einen Einfluss
haben können, sog. Störvariablen. Deren Einfluss ist zu
kontrollieren oder überwachen.
ƒ
Eliminierung des Einflusses einer Störvariablen ist oft nicht
möglich. Statt dessen kann aber der Einfluss dieser
Variablen konstant gegenüber den Variationen der
unabhängigen Variable gehalten werden.
3
Wozu Kontrolle?
ƒ
Wenn der Einfluss von Störvariablen nicht konstant
gehalten werden kann (z.B. Motivation oder
Aufmerksamkeit), dann kann man u.U. trotzdem ihren
differenziellen Effekt eliminieren.
ƒ
Beispiel: Wir untersuchen, ob Nachhilfe (unabhängige
Variable) die Noten (abhängige Variable) verbessert. Falls
die Schüler mit Nachhilfe diejenigen waren, die gescheiter
sind, könnte der Notenunterschied durch diese Eigenschaft
und nicht durch Nachhilfe hervorgerufen sein. Man kann
aber Intelligenz nicht Ein- und Ausschalten, d.h. ihren Effekt
nicht eliminieren.
ƒ
Es folgen einige Störvariablen, die zu kontrollieren sind.
4
Historie (History)
Vortest
Nachtest
Im Zeitinterval zw. Vor- und Nachtest
können Ereignisse die Messung im
Nachtest beeinflussen. D.h. eine
rivalisierende Hypothese entsteht.
Je länger die Zeitperiode zw. Vor- und Nachtest, desto eher wird die
Historie zu einer alternativen Hypothese. Auch bei kurzen Experimenten
kann Historie einen Einfluss haben, z.B. wenn in einem
Gruppenexperiment jemand einen schlechten Witz oder eine
herabsetzende Bemerkung macht.
Im vorigen Beispiel könnte eine Änderung in der Familie (Scheidung,
5
Krankheit) die Nachhilfe beeinflussen.
Reifung (Maturation)
ƒ
Reifung bezieht sich auf Änderungen der internen
Konstitution eines Individuums im Laufe der Zeit
(ohne Einfluss spezifischer, externer Ereignisse).
Eingeschlossen sind biologische und
psychologische Änderungen, z.B. Alter, Lernen,
Müdigkeit, Langeweile, Hunger. Wenn diese das
Antwortverhalten unter den experimentellen
Bedingungen ändern, dann gefährden sie die
interne Gültigkeit.
ƒ
Im Beispiel könnten Schüler auch ohne Nachhilfe
mit der Zeit etwas reifer werden und sich besser
anstrengen. (Kontrollgruppe erforderlich)
6
Instrumentierung
(Instrumentation)
Mit Instrumentierung meint man Änderungen in der
Messung der abhängigen Variablen mit der Zeit.
ƒ
ƒ
Menschliche Beobachter unterliegen Müdigkeit,
Langeweile, und Lernprozessen
ƒ
Mit der Zeit kann ein Experimentator besser werden und
genauere, zuverlässigere Testergebnisse liefern.
ƒ
Daher: benutze mehrere Beobachter, trainiere sie vorher!
7
Selektion (Selection)
ƒ
Bei unterschiedlichen Selektionsmethoden für die
Vergleichsgruppen kann Ungültigkeit
eingeschleppt werden.
ƒ
Z.B. könnte man für Nachhilfe unterschiedliche
Gruppen zusammenstellen--eine, die schwach in
Mathe ist, eine andere die hyperaktiv ist. Dann
könnten Unterschiede in den Noten auf anderen
Eigenschaften beruhen als die Nachhilfe.
ƒ
Es kann auch Interaktion zw. Selektion und
Historie, Reifung und Instrumentierung geben.
8
Sterblichkeit (Mortality)
ƒ
Sterblichkeit bedeutet unterschiedlichen Verlust
von Teilnehmern in den Gruppen.
ƒ
Teilnehmer erscheinen nicht oder habe eine lange
Party am Vorabend oder nehmen nicht an allem
teil...
ƒ
Damit kann es Unterschiede zwischen Gruppen
geben, die nicht von der unabhängige Variablen
herrühren.
9
Subjekt-Effect (Subject Effect)
Positive Selbstdarstellung: Subjekte interpretieren den Sinn
des Experiments und zeigen sich von ihrer besten Seite.
ƒ
ƒ
ƒ
Z.B. sagen Lernaufgaben etwas über Intelligenz aus. Da
viele Teilnehmer intelligent erscheinen wollen, bemühen
sie sich, im Experiment möglichst rasch zu lernen.
ƒ
Wenn ein Experiment etwas über emotionale Stabilität
impliziert, werden manche Teilnehmer besonders stabil
erscheinen wollen.
Damit sind Ergebnisse evtl. beeinflusst vom Motiv der
Teilnehmer, sich positiv darzustellen.
10
Subjekt-Effekt (2)
ƒ
Ein Experiment von Carlston und Cohen zeigte
einen Fall, in dem diejenigen Subjekte, die an die
Experiment-Hypothese glaubten, Ergebnisse
lieferten, die die Hypothese stützten, und die
Gruppe, die die Hypothese nicht glaubte, lieferte
gegenteilige Ergebnisse.
ƒ
Wenn man Subjekt-Effekt nicht ausschließen kann,
muss man ihn möglichst konstant halten.
11
Subjekt-Effekt (3)
ƒ
Intertreatment interaction: Subjekte interpretieren
unterschiedliche Aufgaben bzgl. positiver
Selbstdarstellung unterschiedlich. Z.B. kann man
Subjekten den Eindruck vermitteln, sich bei widrigen
Umständen besonders anzustrengen um sie zu
überwinden. Bei der nächsten Aufgabe kann man
Subjekten vermitteln, sich trotz positiver Bedingungen
nicht anzustrengen, weil sie sonst als zwanghaft oder
verbohrt erscheinen würden.
ƒ
Intratreatment interaction: Verschiedene Subjekte
interpretieren die Möglichkeit der positiven
Selbstdarstellung in der gleichen Aufgabe unterschiedlich
(siehe Beispiele zwei Folien früher)
12
Experimentator-Effekt
(Experimenter Effect)
Experimentatoren haben Vorlieben, Meinungen,
Erwartungen. Insbesondere haben sie Vorstellungen über
das Ergebnis des Experiments. Wenn diese den
Teilnehmern bekannt werden, verhalten sie sich anders als
normal (positive Selbstdarstellung).
ƒ
ƒ
Beispiel: Hans, das rechnende Pferd (1911). Hans konnte
das Ergebnis von Rechenaufgaben durch Hufklopfen
angeben. Allerdings stellte man fest, dass der Eigentümer
durch Aufschauen dem Pferd mitteilte, wann es zu
klopfen aufhören sollte.
13
Experimentator-Effekt (2)
Ferner kann die Erwartung des
Experimentators ihn selbst beeinflussen.
ƒ
ƒ
Messungen ungenau in einer Richtung
ƒ
Fallenlassen „unmöglicher“ Werte
ƒ
tendenziöse Interpretation der Daten
Eliminierung durch
ƒ
ƒ
neutrale Formulierung der Aufgaben
ƒ
Doppel-Blind-Versuche oder minimalem Kontakt
mit Experimentator (automatische Zuweisung
14
von Aufgaben mit Rechnern)
Folge-Effekt (Sequencing
Effect)
Man hat zwei Möglichkeiten,Teilnehmer einzusetzen:
ƒ
ƒ
a) Jeder Teilnehmer nimmt an genau einem Versuch teil.
Der Wert der unabhängigen Variable wird dabei zufällig
gewählt. Dann tritt kein Folge-Effekt auf.
ƒ
b) Jeder Teilnehmer nimmt an mehreren Versuchen teil,
wobei er mit unterschiedlichen Werten der unabhängigen
Variablen konfrontiert wird (z.B. eine Aufgabe mit
Entwurfsmuster, eine Aufgabe ohne Entwurfsmuster
lösen). Hierbei kann ein Folge-Effekt auftreten.
15
Folge-Effekt (2)
ƒ
Ein Folge-Effekt (auch Übertragungseffekt)
tritt auf, wenn die Teilnahme unter einer
Versuchsbedingung das Verhalten in einer
zweiten Versuchsbedingung beeinflusst.
(z.B. könnte der Teilnehmer beim zweiten
Mal gezielt nach Entwurfsmustern suchen
oder sie einzusetzen versuchen)
16
Techniken zum Erreichen
von Konstanz
in Experimenten
Literatur: L.B. Christensen, Experimental Methodology, Allyn
and Bacon, 2001, Kap. 8, 9, 10
17
Wozu Konstanz?
Um interne Gültigkeit zu erreichen, muss man
Techniken benutzen, die den differenziellen
Einfluss von Störvariablen ausschalten.
Möglichkeiten dazu:
ƒ
ƒ
statistische Technik wie Varianzanalyse (nicht besprochen)
ƒ
Kontrolltechniken
ƒ
Versuchsaufbau
18
I. Kontrolltechniken
ƒ
Kontrolltechniken halten den Einfluss von
Störvariablen konstant für den
Variationsbereich der unabhängigen
Variablen.
ƒ
Sie werden in Versuchsaufbauten eingesetzt
(siehe diese)
19
Randomisierung
ƒ
Randomisierung ist die wichtigste und
grundlegendste Technik, um zu vermeiden,
dass Störvariablen (bekannte und
unbekannte) das Ergebnis systematisch
beeinflussen.
1. Zufällige Selektion der Teilnehmer
2. Zufällige Zuweisung der Teilnehmer zu
Versuchsbedingungen.
20
Randomisierung: Selektion
Zunächst ist man bemüht, eine repräsentative Stichprobe
einer Population als Teilnehmer zu bekommen.
ƒ
ƒ
Beispiele: weibliche Professoren, Schüler unter 12, Autofahrer/innen,
Informatikstudenten, Programmierer.
ƒ
Eine randomisierte, repräsentative Selektion ist meist sehr
teuer; wenn sie nicht gelingt, dann ist das Ergebnis nicht
generalisierbar. Für die Kontrolle von Störvariablen ist
randomisierte Selektion nicht erforderlich.
ƒ
Die (mehr oder weniger) zufällig selektierten Teilnehmer
werden dann echt zufällig auf Versuchsbedingungen
verteilt.
21
Randomisierung: Zuweisung
ƒ
Zufällige Zuweisung der Teilnehmer an
Versuchsbedingungen erzielt eine zufällige Verteilung aller
Störgrößen, die zufällig auftreten. Daher sollte der Einfluss
dieser Störvariablen (bekannt oder unbekannt) in allen
Versuchsbedingungen etwa gleich sein.
ƒ
Randomisierung reicht nicht aus bei Subjekt- und
Experimentator-Effekt. Diese sind nicht zufällig verteilt.
ƒ
Natürlich kann man trotz Randomisierung eine
ungleichmäßige Verteilung erhalten. Dies kann man bei
bekannten Störvariablen überprüfen, z.B. bei Intelligenz
durch IQ-Test oder Noten.
ƒ
Man soll auch bei kleinen Gruppen zufällig zuweisen, da
damit die Wahrscheinlichkeit eines systematischen
Einflusses der Störvariablen sinkt.
22
Angleichung (Matching)
ƒ
Wenn der zu beobachtende Effekt sehr klein ist,
kann Randomisierung zu insensitiv sein. D.h. der
Ausschlag der abhängigen Variablen ist so klein,
dass er im Rauschen untergeht.
ƒ
Durch Angleichung der Teilnehmer in den Gruppen
kann die Empfindlichkeit des Experiments erhöht
werden.
ƒ
Angleichung ist aber kein Ersatz für
Randomisierung, sondern ein Zusatz.
23
Angleichung:
Störvariable konstant halten
Wenn möglich kann man den Einfluss einer
Störvariablen minimieren, in dem man sie festhält.
ƒ
ƒ
Wenn z.B. das Geschlecht der Teilnehmer eine Störvariable
sein könnte, könnte man nur männliche Teilnehmer aus der
Stichprobe wählen und diese dann zufällig auf die
Versuchsbedingungen verteilen.
ƒ
Nachteil 1: nicht generalisierbar auf Populationen,
für die die Störvariable andere Werte annimmt.
ƒ
Nachteil 2: die Stichprobe kann zu klein werden.
24
Angleichung: Einschließung der
Störvariable in den
Versuchsaufbau.
ƒ
Die Störvariable wird dann zu einer weiteren unabhängigen
Variablen.
ƒ
Beispiel: wir wollen bestimmte Lernstrategien untersuchen. Die
Intelligenz ist aber ein Störfaktor. Also variieren wir nicht nur die
Lernstrategie, sondern auch den IQ-Wert (ähnlich für Alter)
Strat. A Strat. B
Stichprobe
mit IQ 90-99
Stichprobe
mit IQ von 90-120
Stichprobe
mit IQ 100-109
Stichprobe
mit IQ 110-120
25
Angleichung durch Paarung
ƒ
Man formt Paare, die in den wesentlichen Störfaktoren
ähnlich sind, z.B. im Alter, Geschlecht, IQ, etc.
ƒ
Die Paare werden dann zufällig auf die Gruppen verteilt.
ƒ
(ähnlich wie vorige Methode, nur dass sich die Anzahl der
Gruppen nicht erhöht).
ƒ
D.h. für jede Kombination von Störfaktoren gibt es einen
weiteren Teilnehmer mit der gleichen Kombination in der
anderen Gruppe
ƒ
Nachteile: was sind die wesentlichen Variablen? Paarung
bei vielen Variablen kann schwierig werden.
26
Angleichung der
Häufigkeitsverteilung
ƒ
Gruppen werden so gewählt, dass sie ähnliche
Verteilung der Störvariablen haben.
ƒ
Beispiel 1: wähle eine erste Gruppe. Bestimme IQ
Mittelwert, Varianz, Verteilung der IQ-Werte.
Selektiere daraufhin eine weitere Gruppe mit
ähnlichen Werten.
ƒ
Beispiel 2: Stratifzierung: Bestimme die 20% der
Teilnehmer mit der besten Vorbildung. Verteile
diese auf die verschiedenen Gruppen. Wiederhole
für eine oder zwei weitere Vorbildungsniveaus.
(benutze z.B. die Dauer der praktischen Erfahrung
27
in der Programmierung)
Subjekt-Effekt (1)
ƒ
Wir benötigen eine Konstanz dessen, wie
Teilnehmer ihr Bedürfnis der positiven
Selbstdarstellung meinen erfüllen zu können.
ƒ
Doppel-blinder Versuch mit Placebo:
ƒ
erzeuge Variationen die allen Beteiligten unter allen
Umständen als gleich erscheinen.
ƒ
Subjekte erhalten entweder eine echte Behandlung oder
eine Scheinbehandlung (Placebo). Alle Subjekte glauben,
sie haben die gleiche Behandlung erfahren.
ƒ
Experimentator weiß nicht, welche Behandlung gewählt
wurde, kann dies also nicht kommunizieren.
28
Subjekt-Effekt (2)
Doppel-blinde Versuche sind oftmals nicht möglich, da nicht
alle Versuchsbedingungen so gestaltet werden können,
dass sie gleich erscheinen. Behelf:
ƒ
ƒ
ƒ
Bewusste Irreführung: Den Teilnehmern wird eine plausibler
Zweck des Experiments angegeben, der aber unabhängig von der
wirklich getesteten Hypothese ist. Damit haben alle den gleichen
Anreiz, sich positiv darzustellen, der aber (hoffentlich) das
Ergebnis nicht beeinflusst.
ƒ
Verborgenes Experiment: Teilnehmer wissen nicht, dass sie an
einem Experiment teilnehmen, z.B. als Teil einer Klausur oder in
dem man Leute auf der Straße in ein Gespräch verwickelt.
Ethische Problem mit beiden.
29
Subjekt-Effekt (3)
Wenn Subjekt-Effekte konstant gehalten wurden,
muss man trotzdem wissen, welche Werte sie
hatten. Das macht man mit einem Fragebogen am
Ende des Experiments. Fragen:
ƒ
ƒ
ƒ
Was war der Zweck des Experiments?
ƒ
Was wollte der Experimentator herausfinden?
ƒ
Welche Arten von Antworten haben Sie gegeben und
warum?
ƒ
Wie haben andere auf das Experiment reagiert?
Antworten auf diese Fragen helfen, die Annahmen
der Teilnehmer zu bestimmen und ob dadurch
30
Fehler im Experiment auftraten.
Experimentator-Effekt
ƒ
Messfehler: automatische Erfassung oder Erfassung durch
einen Unbeteiligten oder durch mehrere Erfasser, die ihre
Werte abstimmen müssen.
ƒ
Blinder Versuch: Experimentator kennt die Zuordnung der
Teilnehmer zu den Gruppen nicht (Zuteilung automatisch
oder durch einen Unbeteiligten).
ƒ
partiell blinder Versuch: Experimentator kennt die
Zuordnung nicht bis zum letzt möglichen Moment. Z.B.
könnte er die Anweisungen allen geben und dann als
letztes die Zuteilung randomisiert durchführen.
31
Folge-Effekt
Wenn Teilnehmer unter mehreren,
aufeinanderfolgenden Versuchsbedingungen
arbeiten, können Folge-Effekte auftreten.
ƒ
ƒ
ƒ
Lernen (Methoden und Werkzeuge)
ƒ
Vertrautheit mit der Versuchsanordnung, Umgebung
ƒ
Übertragungseffekt von einer Bedingung auf die nächste.
Gegenmaßnahmen: Zunächst Ausbildung der
Teilnehmer an Werkzeugen und Methoden,
vertraute Umgebung benutzen.
32
Folge-Effekt:
Gegenbalanzierung(1)
Intra-Subjekt Gegenbalanzierung: bei zwei
Versuchsbedingungen (A und B), gib jedem
Teilnehmer beide Reihenfolgen: ABBA.
ƒ
ƒ
Beispiel: Coca Cola vs. Pepsi Cola Geschmackstest.
ƒ
Angenommen, bei jedem wiederholten Versuch steigt die
Bewertung um einen konstanten Wert, dann ist die Summe
der Bewertungen für A und B gleich. Damit ist der FolgeEffekt neutralisiert.
Bedingung
A B B A
Bewertung
0 1 2 3
Bewertung A: 3
Bewertung B: 3
33
Folge-Effekt: Gegenbalanzierung (2)
ƒ
Wenn die Steigerung der Bewertung nicht linear ist
(z.B. 0, 4, 6, 8), dann kann man den
Ordnungseffekt damit kontrollieren, indem man die
andere Hälfte der Teilnehme die Reihenfolge
BAAB durchführen lässt.
Bedingung
A B B A
B A A B
Bewertung
0 4 6 8
0 4 6 8
Bewertung A: 18
Bewertung B: 18
Gegen Effekte, die durch Übertragung entstehen (dadurch, dass man einen Test
gemacht hat, verhält man sich beim nächsten anders, ist meist außer Training
wenig zu machen)
34
Folge-Effekt: Gegenbalanzierung (3)
Anstelle von Intra-Subjekt-Gegenbalanzierung
kann man auch Inter-Gruppen Gegenbalanzierung
anwenden. D.h. eine Gruppe führt AB aus, die
andere BA.
ƒ
ƒ
ƒ
Angenommen, wir untersuchen den Effekt von
Entwurfsmustern. Eine Gruppe bekommt erst eine
Aufgabe ohne Entwurfsmuster, dann eine mit (AB); die
zweite Gruppe in umgekehrter Reihenfolge (BA).
Allerdings braucht man hierzu jeweils andere Aufgaben.
Man kann innerhalb einer Gruppe nicht die gleiche
Aufgabe zweimal verwenden. Dabei kann es einen
Folgeeffekt durch die Reihenfolge der Aufgaben geben.
D.h. man muss dann auch die Aufgaben in beiden
Reihenfolgen stellen, was zu insgesamt vier Gruppen
führt.
35
II Versuchsaufbau
(Research Design)
ƒ
Der Versuchsaufbau beschreibt den Plan,
wie man eine Forschungsfrage beantworten
wird
ƒ
Wichtiger Aspekt ist Kontrolle über
ungewollte Variablen, aber auch die
Messungen und Aufteilung in Gruppen
ƒ
Der Aufbau bestimmt, ob sinnvolle und
objektive Aussagen getroffen werden
können.
36
Ungeeignete Aufbauten
Einzelne Gruppe mit Vor- und Nachtest
ƒ
ƒ
Vortest --> Behandlung --> Nachtest
ƒ
Beispiel: Behandlung ist eine spezielle
Ausbildung, Vor- und Nachtest sind
standardisierte Tests.
ƒ
Ergebnis: Leistungssteigerung
ƒ
Schwächen dieses Aufbaus ?
ƒ
Ausgleich der Schwächen ?
37
Nichtäquivalente Gruppen
ƒ
Zugehörigkeit zu einer Gruppe nicht zufällig
festgelegt
ƒ
Unterschiede in unabhängigen Variablen die
Folge
ƒ
Beispiel: Teilnehmer entscheiden selber in
welche Gruppe sie gehen
38
Anforderungen an
Versuchsaufbau
1. Der Aufbau muss erlauben, die Forschungsfrage
zu beantworten. Einfach nur irgendwelche Daten
zu sammeln ist selten zielführend.
2. Störvariablen müssen kontrolliert werden, um
sicher zu sein, ob der beobachtete Effekt auf die
unabhängige Variable zurückzuführen ist.
Alternative Hypothesen können mit
Kontrollmethoden (z.B. Randomisierung) oder
einer Kontrollgruppe eliminiert werden.
39
Anforderungen an
Versuchsaufbau
3. Ergebnis muss auf andere Individuen oder
Gruppen als die Teilnehmer generalisierbar sein.
40
Mögliche Aufbauten
ƒ
Versuchsgruppe erhält die unabhängige
Variable zu einem gewissen Maß.
ƒ
Kontrollgruppe wird entweder einer
unabhängigen Variablen nicht ausgesetzt oder
erhält einen standardisierten oder typischen
Wert für diese Variable.
ƒ
Kontrollgruppe dient als Vergleichsbasis und
als Kontrolle für rivalisierende Hypothesen. Sie
muss dazu alle Störvariablen möglichst
genauso wie die Versuchsgruppe erhalten
41
haben.
Geeignete Versuchaufbauten
Inter-Subjekt-Experiment mit Nachtest
Versuchsgruppe
Stichprobe
von
Teilnehmern
Behandlung
Messung
X
Y
zufällig
verteilt
auf
Vergleich
Kontrollgruppe
Y
Beispiel: Käufer akzeptieren einen höheren Preis, wenn sie vorher einem
Kauf zugestimmt haben. Untersucht mit einem Experiment, das um Teilnahme an einem
Experiment bittet. Versuchsgruppe wird vorher nicht gesagt, dass das Experiment schon
um 7:00 morgens stattfindet, Kontrollgruppe schon. Von der Versuchsgruppe erscheinen
42
mehr, weil sie vorher Teilnahme schon zugesagt hatten.
Eigenschaften
ƒ
Mit genügend vielen Teilnehmern erzeugt
die Randomisierung gleichwertige Gruppen
ƒ
Nachteile:
ƒ
möglicherweise nicht empfindlich genug
ƒ
möglicherweise keine Gleichwertigkeit der
Gruppen erreicht
ƒ
Ausgleich: Angleichung der Gruppen. Allerdings
braucht man hierzu mehr Teilnehmer.
43
Angeglichenes Inter-SubjektExperiment mit Nachtest
Stichprobe
von
Teilnehmern
Versuchsgruppe
Jeder Teilnehmer
wird mit einem
anderen gepaart
Paare
zufällig
verteilt
auf
Behandlung
Messung
X
Y
Vergleich
Kontrollgruppe
Y
44
Einfaches randomisiertes
Experiment
(Inter-Subjekt, Nachtest)
Behandlung
Messung
Y
Kontrollgruppe
X1
Versuchsgruppe 1
Y
R
Vergleich
Versuchsgruppe 2
X2
Y
Versuchsgruppe 3
X3
Y
Für mehr als zwei unterschiedliche Werte oder Niveaus der
unabhängigen Variable. (R bedeutet zufällige Zuweisung.)
Z.B. die verschiedenen Arten, eine Inspektion durchzuführen.
45
Faktorielles Experiment
Zwei oder mehr Variablen werden gleichzeitig
untersucht, um ihre unabhängigen Auswirkungen
und ihre Interaktionen zu bestimmen.
Angenommen, Variable A hat drei Werte A1, A2, A3;
Variable B habe zwei Werte (B1, B2); sechs
Gruppen erforderlich.
B1
B2
A1
A2
A3
A1 B1
A2 B1
A3 B1
Mittel B1
A1 B2
A2 B2
A3 B2
Mittel B2
Mittel A1 Mittel A2 Mittel A3
Haupteffekt A
Haupteffekt B
46
Interaktionen beim faktoriellen
Entwurf
B1
B2
B2
B1
A1
A2
A3
A1
a) nur Haupteffekt A
A2
A3
b) nur Haupteffekt B
B1
B2
B1
B2
A1
A2
A3
c) nur Interaktion (Spaltensummen
gleich und Zeilensummen gleich)
A1
A2
A3
d) Haupteffekt A und B,
keine Interaktion (Parallelen)
47
Interaktionen (2)
B2
B2
B1
A1
A2
B1
A3
A1
e) Haupteffekt A und Interaktion
(Zeilensummen gleich)
B2
B1
A1
A2
A3
A2
A3
f) Haupteffekt B und Interaktion
(Spaltensummen gleich)
Wenn Haupteffekt oder Interaktion allein
signifikant sind, werden diese interpretiert.
Wenn gemischt, dann hauptsächlich die
Interaktion interpretieren.
g) Haupteffekt A und B und
Interaktion
48
Intra-Subjekt-Experiment mit
Nachtest
ƒ
Alle Teilnehmer nehmen an allen
Behandlungen teil.
Behandlung
P1, P2, P3, P4, ...., Pn
X1
Messung
Y
Vergleich
P1, P2, P3, P4, ...., Pn
X2
Y
P1, P2, P3, P4, ...., Pn
X3
Y
49
Intra-Subjekt-Experiment (2)
Vorteile
ƒ
perfekte Angleichung: jeder Teilnehmer ist seine
eigene Kontrolle; daher hohe Empfindlichkeit.
ƒ
Variablen wie Alter, Geschlecht, Erfahrung
bleiben konstant für das gesamte Experiment.
ƒ
weniger Teilnehmer erforderlich als beim InterSubjekt-Experiment.
50
Intra-Subjekt-Experiment (3)
Nachteile
Folge-Effekte:
ƒ
ƒ
ƒ
lineare Folgeeffekte durch Gegenbalanzierung
ausgleichen
ƒ
nicht-lineare Folgeeffekte durch Gegenbalanzierung
nicht ausgleichbar
Einfluss von Reifung und Historie nicht
feststellbar.
51
Experiment mit Vor- und
Nachtest
ƒ
Kontrolliert Historie und Reifung, da alle
Teilnehmer normalerweise Historie und Reifung
gleich unterliegen.
Versuchsgruppe
Vortest
Behandlung
Nachtest
Y
X
Y
Unterschied
Vor-Y - NachY
R
Kontrollgruppe
Vergleich
Y
Y
Vor-Y - NachY
52
Quasi-Experiment
Von einem Quasi-Experiment spricht man,
wenn nicht alle Forderungen an einen
experimentellen Versuchsaufbau erfüllt
werden können, z.B. Randomisierung
ƒ
dies ist oft bei Experimenten außerhalb des
Labors der Fall
ƒ
Hier muss man darauf achten, dass die
Gefährdungen der Gültigkeit durch andere
Maßnahmen gering gehalten werden.
53
Quasi-Experiment
Wichtige Gefährdungen der Gültigkeit:
ƒ
ƒ
ƒ
Selektion
ƒ
Historie (auch lokale Historie, d.h., die nur auf
eine Gruppe wirkt)
ƒ
Reifung
Ein Aufbau wie das Experiment mit Vor- und
Nachtest, aber ohne zufällige Zuweisung
erlaubt es, Selektion und Historie wenigstens
zu beobachten.
54
Quasi-Experiment mit Vor-und
Nachtest
ƒ
Wenn die Kontrollgruppe im Vor- und Nachtest
gleich bleibt, dann können Änderungen in der
Versuchsgruppe auf einen Selektions- oder lokale
Historie zurückzuführen sein.
ƒ
Wenn Kontroll- und Versuchsgruppe
unterschiedlich starke Änderungen vom Vortest
zum Nachtest aufweisen, kann es sich um ein
Selektionseffekt (unterschiedliche Reifung) oder
lokale Historie handeln, die dem wahren Effekt
überlagert ist (Unter- oder Überschätzung).
55
Quasi-Experiment mit Vor-und
Nachtest (2)
ƒ
Nur wenn es eine Überkreuzung gibt, kann
man einigermaßen sicher sein, dass es sich
nicht um einen Selektionseffekt handelt. Bei
einer Überkreuzung hat die schwächere
Versuchsgruppe im Vortest schlechtere, im
Nachtest bessere Ergebnisse als die
Kontrollgruppe.
Versuchsgruppe
Kontrollgr.
Vortest
Nachtest
56
Wichtige Begriffe
ƒ
Versuchsaufbau
ƒ
nichtäquivalente Gruppen mit Nachtest
ƒ
Einzelne Gruppe mit Vor- und Nachtest
ƒ
Inter-Subjekt-Experiment mit Nachtest
ƒ
Angeglichenes Inter-Subjekt-Experiment
ƒ
Einfaches randomisertes Experiment
ƒ
Faktorielles Experiment, Haupteffekt, Interaktionseffekt, Zelle
ƒ
Intra-Subjekt-Experiment mit Nachtest
ƒ
Experiment mit Vor- und Nachtest
ƒ
Quasi-Experiment
57

Documentos relacionados