Kennwerte zur Charakterisierung von Datenreihen Mittelwerte

Transcrição

Kennwerte zur Charakterisierung von Datenreihen Mittelwerte
Kennwerte zur Charakterisierung von Datenreihen
Um die häufig großen Datenmengen von Stichproben übersichtlich zu machen, lassen sich Kennwerte berechnen,
welche diese Daten repräsentieren und charakterisieren. Dies können Kennwerte zur Charakterisierung der
mittleren Lage oder Kennwerte zur Charakterisierung der Streuung sein. •
Kennwerte zur Charakterisierung der mittleren Lage (Mittelwerte):
Sie geben eine zentrale Tendenz der Daten an. Dazu gehören u. a. das arithmetische Mittel, das geometrische
Mittel, das Dichtemittel, der Medianwert und das harmonische Mittel.
Kennwerte zur Charakterisierung der Streuung (Variation):
Sie geben Auskunft über die Verteilung (Streuung) der Daten. Dazu gehören u.a. die Variationsbreite die
Standardabweichung und der Variationskoeffizient.
Mittelwerte
Arithmetischer Mittelwert x
Der arithmetische Mittelwert x (mean) der Stichprobe, auch
arithmetisches Mittel oder einfach nur Mittelwert genannt, ist ein
"Schätzwert" für den arithmetischen Mittelwert der Grundgesamtheit
(„Erwartungswert").
Das arithmetische Mittel ist zur Charakterisierung der zentralen
Tendenz eine normalverteilten Stichprobe gut geeignet
Gewogenes arithmetisches Mittel x w
Das gewogene arithmetische Mittel x w (weighted arithmetic mean
value) repräsentiert eine Stichprobe besser als das arithmetische Mittel,
wenn die Einzelwerte eine unterschiedliche Gewichtung haben sollen.
In der Formel ist fi die Häufigkeit des Merkmals xi, sie wird auch Frequenz genannt.
Beispiel: Der Hämoglobingehalt im Blut wurde jeweils bei einer Gruppe weiblicher und männlicher Mäuse
bestimmt. Folgende Mittelwerte wurden berechnet
Stichprobe 1 (weibliche Mäuse):
x 1 = 124 g/L, n = 12
Stichprobe 2 (männliche Mäuse):
x 2 = 142 g/L, n = 28
Berechnen Sie das gewogene arithmetische Mittel und das arithmetische Mittel aus den beiden
Stichprobenmittelwerten.
Das gewogene arithmetische Mittel x w berücksichtigt, dass der Stichprobenumfang der Stichprobe 2 größer ist
als derjenige der Stichprobe 1.
Modalwert
Der Modalwert (modal value), auch Dichtemittel genannt, ist der Wert einer Stichprobe, der am häufigsten
auftritt. Der Modalwert kann sowohl bei qualitativen als auch bei quantitativen Daten angewendet werden. Es
können durchaus zwei (bimodal) oder mehr Werte (polymodal) mit auffallender Häufigkeit in einer Stichprobe
auftreten. Seine Berechnung ist nur bei umfangreichen Stichproben sinnvoll.
Der Modalwert kann mit Hilfe einer Häufigkeitstabelle aus der Stichprobe bestimmt werden.
Beispiel: Die Leukozyten in einem gefärbten Blutausstrich werden mikroskopisch differenziert und die
Ergebnisse in eine Häufigkeitstabelle eingetragen. Welcher Zelltyp kommt am häufigsten vor?
Häufigkeitstabelle:
Leukozytenart
Anzahl (Strichliste)
Summe
Stabkeimige neutrophile Granulozyten
////
4
Segmentkernige neutrophile Granulozyten
///// ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// ////
59
Eosinophile Granulozyten
////
4
Basophile Granulozyten
/
1
Lymphozyten
///// ///// ///// ///// /
26
Monozyten
///// /
6
Lösung: Die segmentkernigen neutrophilen Granulozyten stellen mit 59 Werten den Modalwert der
Leukozyten dieser Blutprobe.
Median ~
x
Der Median ~
x (median) ist der mittlere Wert der aufsteigend nach Größe
geordneten Reihe von Mess- oder Zahlwerten einer Stichprobe.
Bei asymmetrisch verteilten Daten ist der Medianwert aussagekräftiger
als der arithmetische Mittelwert, da er nicht die Extremwerte
berücksichtigt. Ist die Anzahl der Einzelwerte ungerade, so ist der Median
der Wert in der Mitte der Rangfolge. Bei einer geraden Anzahl n von
Einzelwerten wird der Median durch das arithmetische Mittel der beiden Werte in der Mitte der Rangfolge
definiert.
Beispiel: Bestimmen Sie den Median der folgenden Datenreihe (Urliste, ungeordnet):
Urliste (ungeordnet)
12
15
8
28
22
32
17
14
Geordnete Stichprobe
Rang
8
1
12
2
14
3
15
4
17
5
22
6
28
7
32
8
Lösung: Die Zahl der Einzelwerte ist gerade, n = 8.
Harmonisches Mittel x H
Wenn Mess- oder Zählwerte als Quotient zu verrechnen sind, wird das
harmonische Mittel x H (harmonic mean) als Kennwert verwendet. Es wird
mit der nebenstehenden Gleichung berechnet. Es kommt zur Anwendung,
wenn die Zeit ein Beobachtungsmerkmal ist, z.B. bei Geschwindigkeiten.
Mit dem harmonischen Mittel können auch „unendlich lange Zeiten"
verrechnet werden. Es kommt auch zur Anwendung, wenn „unendlich
große Werte" vorkommen, wie beispielsweise bei der Berechnung der mittleren Überlebenszeit in
Tierversuchen.
Beispiel: Bei einer Versuchsreihe wurde die Langzeitwirkung eines Toxins auf 10 Mäuse untersucht. Nach 120
Tagen (d) wurden folgende Ergebnisse festgestellte
Langzeitwirkung eines Toxins
Tier Nr.
i
2
3
Überlebenszeit
110 d Über- 115d
lebt
4
96d
5
8
7
8
9
10
105 d Über- Über- 118 d 102 d 82 d
lebt
lebt
Bei den Überlebenden Tieren wird die Überlebenszeit als unendlich (∞ ) festgelegt, es gilt 1 = 0 .
∞
Berechnen Sie das harmonische Mittel.
Geometrisches Mittel x G
Wenn sich Mess- oder Zählwerte in Abhängigkeit von der Zeit ändern und
diese Änderung nicht proportional, sondern exponentiell verläuft, wird das
geometrische Mittel x G (geometric mean) als Kennwert verwendet. Es
darf nur angewendet werden, wenn alle Mess- oder Zählwerte größer als
Null sind.
Es wird mit der nebenstehenden Gleichung berechnet In der Formel ist Π
(griechischer Großbuchstabe Pi) das Produktzeichen. Es sind die
Produkte aller xi-Werte von i = 1 bis i = n zu bilden, wobei n der letzte Wert
der Reihe ist.
4
Beispiel: Eine Bakterienkultur hat einen Anfangskeimgehalt K/V von 6,2 • 10 K/mL. Nach einer, zwei, drei und
vier Stunden Bebrütung bei 37 "C wird der Keimgehalt (K/mL) bestimmt. Es ergaben sich folgende Werte:
Bestimmung der Keimentwicklung einer Bakterienkultur
zu Beginn der
Keimgehalt (K/mL) Zum Ende der
1. Stunde
6,2 • 10
2. Stunde
3. Stunde
4. Stunde
4
1. Stunde
4
24,8 • 10
5
10,4 •10
5
39.6 •10
2. Stunde
3. Stunde
4. Stunde
Keimgehalt (K/mL) Vermehrungsfaktor
4
4,0
5
4,2
3,8
4,4
24.8 •10
10,4 •10
5
39.6 •10
5
17,4 •10 '
a) Berechnen Sie den mittleren Vermehrungsfaktor mildem geometrischen Mittelwert und daraus den
rechnerischen Keimgehalt nach 4 Stunden Bebrütung.
b) Führen Sie die Berechnung mit dem arithmetischen Mittelwert des Vermehrungsfaktors durch.
Der mit dem geometrischen Mittelwert der Vermehrungsfaktoren berechnete Keimgehalt stimmt mit dem im
Experiment erhaltenen Wert überein. Der mit dem arithmetischen Mittelwert berechnete Wert ergibt ein größeres
Keimwachstum als im Experiment. Der arithmetische Mittelwert ist für diese Aufgabenstellung nicht geeignet.
Aufgaben:
1. In einer Tüte Bonbons befinden sich:
Geschmack W(Zucker)/%
16 Zitronen-, 10 Himbeer-, 18 Blaubeer- und 6 Erdbeerbonbons.
Zitrone
16
unterschiedlich:
Himbeer
24
Berechnen Sie den mittleren Zuckergehalt der Bonbons!
Blaubeer
20
Erdbeer
30
Der Zuckergehalt der verschiedenen Geschmacksrichtungen ist
2. Würfeln Sie mit 2 Würfeln 100 mal und notieren Sie jedes Mal die Summe der
Augen in Form einer Strichliste.
a) Bestimmen Sie anschließend den Modalwert und das gewogene arithmetische Mittel.
b) Welche Augenzahl(en) fällt (fallen) am häufigsten?
c) Stellen Sie das Ergebnis des Versuchs in einem aussagekräftigem Diagramm dar.
.
5
3. Die Probe einer frischen Milch enthielt 1,2 10 Milchsäurebakterien pro Milliliter.
Ende der
Keimzahl
1. Stunde
9,72 10
a) Berechnen Sie das geometrische Mittel des Vermehrungsfaktors.
2. Stunde
80,7 10
b) Berechnen Sie die Keimzahl nach 6 Stunden mit dem geometrische Mittel
3. Stunde
629 10
4. Stunde
485.106
5. Stunde
388 10
6. Stunde
318 10
Die Probe wurde anschließend bei 37 °C bebrütet und jeweils nach 1 Stunde
erneut die Keimzahl bestimmt.
des Vermehrungsfaktors und vergleichen Sie das Ergebnis mit dem gemessenen Wert.
c) Stellen Sie das Keimwachstum im Diagramm dar und fügen Sie die richtige
Trendlinie hinzu.
.
5
.
5
.
5
.
7
.
8
Zu 3.
0
1,20E+05
1
9,72E+05
8,10
2
8,07E+06
8,30
3
6,29E+07
7,79
4
4,85E+08
7,71
5
3,88E+09
8,00
6
3,18E+10
8,20
265000
nach 6h
Geom. Mittel
8,014
3,18E+10
Arithm. Mittel
8,017
3,19E+10