Kennwerte zur Charakterisierung von Datenreihen Mittelwerte
Transcrição
Kennwerte zur Charakterisierung von Datenreihen Mittelwerte
Kennwerte zur Charakterisierung von Datenreihen Um die häufig großen Datenmengen von Stichproben übersichtlich zu machen, lassen sich Kennwerte berechnen, welche diese Daten repräsentieren und charakterisieren. Dies können Kennwerte zur Charakterisierung der mittleren Lage oder Kennwerte zur Charakterisierung der Streuung sein. • Kennwerte zur Charakterisierung der mittleren Lage (Mittelwerte): Sie geben eine zentrale Tendenz der Daten an. Dazu gehören u. a. das arithmetische Mittel, das geometrische Mittel, das Dichtemittel, der Medianwert und das harmonische Mittel. Kennwerte zur Charakterisierung der Streuung (Variation): Sie geben Auskunft über die Verteilung (Streuung) der Daten. Dazu gehören u.a. die Variationsbreite die Standardabweichung und der Variationskoeffizient. Mittelwerte Arithmetischer Mittelwert x Der arithmetische Mittelwert x (mean) der Stichprobe, auch arithmetisches Mittel oder einfach nur Mittelwert genannt, ist ein "Schätzwert" für den arithmetischen Mittelwert der Grundgesamtheit („Erwartungswert"). Das arithmetische Mittel ist zur Charakterisierung der zentralen Tendenz eine normalverteilten Stichprobe gut geeignet Gewogenes arithmetisches Mittel x w Das gewogene arithmetische Mittel x w (weighted arithmetic mean value) repräsentiert eine Stichprobe besser als das arithmetische Mittel, wenn die Einzelwerte eine unterschiedliche Gewichtung haben sollen. In der Formel ist fi die Häufigkeit des Merkmals xi, sie wird auch Frequenz genannt. Beispiel: Der Hämoglobingehalt im Blut wurde jeweils bei einer Gruppe weiblicher und männlicher Mäuse bestimmt. Folgende Mittelwerte wurden berechnet Stichprobe 1 (weibliche Mäuse): x 1 = 124 g/L, n = 12 Stichprobe 2 (männliche Mäuse): x 2 = 142 g/L, n = 28 Berechnen Sie das gewogene arithmetische Mittel und das arithmetische Mittel aus den beiden Stichprobenmittelwerten. Das gewogene arithmetische Mittel x w berücksichtigt, dass der Stichprobenumfang der Stichprobe 2 größer ist als derjenige der Stichprobe 1. Modalwert Der Modalwert (modal value), auch Dichtemittel genannt, ist der Wert einer Stichprobe, der am häufigsten auftritt. Der Modalwert kann sowohl bei qualitativen als auch bei quantitativen Daten angewendet werden. Es können durchaus zwei (bimodal) oder mehr Werte (polymodal) mit auffallender Häufigkeit in einer Stichprobe auftreten. Seine Berechnung ist nur bei umfangreichen Stichproben sinnvoll. Der Modalwert kann mit Hilfe einer Häufigkeitstabelle aus der Stichprobe bestimmt werden. Beispiel: Die Leukozyten in einem gefärbten Blutausstrich werden mikroskopisch differenziert und die Ergebnisse in eine Häufigkeitstabelle eingetragen. Welcher Zelltyp kommt am häufigsten vor? Häufigkeitstabelle: Leukozytenart Anzahl (Strichliste) Summe Stabkeimige neutrophile Granulozyten //// 4 Segmentkernige neutrophile Granulozyten ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// //// 59 Eosinophile Granulozyten //// 4 Basophile Granulozyten / 1 Lymphozyten ///// ///// ///// ///// / 26 Monozyten ///// / 6 Lösung: Die segmentkernigen neutrophilen Granulozyten stellen mit 59 Werten den Modalwert der Leukozyten dieser Blutprobe. Median ~ x Der Median ~ x (median) ist der mittlere Wert der aufsteigend nach Größe geordneten Reihe von Mess- oder Zahlwerten einer Stichprobe. Bei asymmetrisch verteilten Daten ist der Medianwert aussagekräftiger als der arithmetische Mittelwert, da er nicht die Extremwerte berücksichtigt. Ist die Anzahl der Einzelwerte ungerade, so ist der Median der Wert in der Mitte der Rangfolge. Bei einer geraden Anzahl n von Einzelwerten wird der Median durch das arithmetische Mittel der beiden Werte in der Mitte der Rangfolge definiert. Beispiel: Bestimmen Sie den Median der folgenden Datenreihe (Urliste, ungeordnet): Urliste (ungeordnet) 12 15 8 28 22 32 17 14 Geordnete Stichprobe Rang 8 1 12 2 14 3 15 4 17 5 22 6 28 7 32 8 Lösung: Die Zahl der Einzelwerte ist gerade, n = 8. Harmonisches Mittel x H Wenn Mess- oder Zählwerte als Quotient zu verrechnen sind, wird das harmonische Mittel x H (harmonic mean) als Kennwert verwendet. Es wird mit der nebenstehenden Gleichung berechnet. Es kommt zur Anwendung, wenn die Zeit ein Beobachtungsmerkmal ist, z.B. bei Geschwindigkeiten. Mit dem harmonischen Mittel können auch „unendlich lange Zeiten" verrechnet werden. Es kommt auch zur Anwendung, wenn „unendlich große Werte" vorkommen, wie beispielsweise bei der Berechnung der mittleren Überlebenszeit in Tierversuchen. Beispiel: Bei einer Versuchsreihe wurde die Langzeitwirkung eines Toxins auf 10 Mäuse untersucht. Nach 120 Tagen (d) wurden folgende Ergebnisse festgestellte Langzeitwirkung eines Toxins Tier Nr. i 2 3 Überlebenszeit 110 d Über- 115d lebt 4 96d 5 8 7 8 9 10 105 d Über- Über- 118 d 102 d 82 d lebt lebt Bei den Überlebenden Tieren wird die Überlebenszeit als unendlich (∞ ) festgelegt, es gilt 1 = 0 . ∞ Berechnen Sie das harmonische Mittel. Geometrisches Mittel x G Wenn sich Mess- oder Zählwerte in Abhängigkeit von der Zeit ändern und diese Änderung nicht proportional, sondern exponentiell verläuft, wird das geometrische Mittel x G (geometric mean) als Kennwert verwendet. Es darf nur angewendet werden, wenn alle Mess- oder Zählwerte größer als Null sind. Es wird mit der nebenstehenden Gleichung berechnet In der Formel ist Π (griechischer Großbuchstabe Pi) das Produktzeichen. Es sind die Produkte aller xi-Werte von i = 1 bis i = n zu bilden, wobei n der letzte Wert der Reihe ist. 4 Beispiel: Eine Bakterienkultur hat einen Anfangskeimgehalt K/V von 6,2 • 10 K/mL. Nach einer, zwei, drei und vier Stunden Bebrütung bei 37 "C wird der Keimgehalt (K/mL) bestimmt. Es ergaben sich folgende Werte: Bestimmung der Keimentwicklung einer Bakterienkultur zu Beginn der Keimgehalt (K/mL) Zum Ende der 1. Stunde 6,2 • 10 2. Stunde 3. Stunde 4. Stunde 4 1. Stunde 4 24,8 • 10 5 10,4 •10 5 39.6 •10 2. Stunde 3. Stunde 4. Stunde Keimgehalt (K/mL) Vermehrungsfaktor 4 4,0 5 4,2 3,8 4,4 24.8 •10 10,4 •10 5 39.6 •10 5 17,4 •10 ' a) Berechnen Sie den mittleren Vermehrungsfaktor mildem geometrischen Mittelwert und daraus den rechnerischen Keimgehalt nach 4 Stunden Bebrütung. b) Führen Sie die Berechnung mit dem arithmetischen Mittelwert des Vermehrungsfaktors durch. Der mit dem geometrischen Mittelwert der Vermehrungsfaktoren berechnete Keimgehalt stimmt mit dem im Experiment erhaltenen Wert überein. Der mit dem arithmetischen Mittelwert berechnete Wert ergibt ein größeres Keimwachstum als im Experiment. Der arithmetische Mittelwert ist für diese Aufgabenstellung nicht geeignet. Aufgaben: 1. In einer Tüte Bonbons befinden sich: Geschmack W(Zucker)/% 16 Zitronen-, 10 Himbeer-, 18 Blaubeer- und 6 Erdbeerbonbons. Zitrone 16 unterschiedlich: Himbeer 24 Berechnen Sie den mittleren Zuckergehalt der Bonbons! Blaubeer 20 Erdbeer 30 Der Zuckergehalt der verschiedenen Geschmacksrichtungen ist 2. Würfeln Sie mit 2 Würfeln 100 mal und notieren Sie jedes Mal die Summe der Augen in Form einer Strichliste. a) Bestimmen Sie anschließend den Modalwert und das gewogene arithmetische Mittel. b) Welche Augenzahl(en) fällt (fallen) am häufigsten? c) Stellen Sie das Ergebnis des Versuchs in einem aussagekräftigem Diagramm dar. . 5 3. Die Probe einer frischen Milch enthielt 1,2 10 Milchsäurebakterien pro Milliliter. Ende der Keimzahl 1. Stunde 9,72 10 a) Berechnen Sie das geometrische Mittel des Vermehrungsfaktors. 2. Stunde 80,7 10 b) Berechnen Sie die Keimzahl nach 6 Stunden mit dem geometrische Mittel 3. Stunde 629 10 4. Stunde 485.106 5. Stunde 388 10 6. Stunde 318 10 Die Probe wurde anschließend bei 37 °C bebrütet und jeweils nach 1 Stunde erneut die Keimzahl bestimmt. des Vermehrungsfaktors und vergleichen Sie das Ergebnis mit dem gemessenen Wert. c) Stellen Sie das Keimwachstum im Diagramm dar und fügen Sie die richtige Trendlinie hinzu. . 5 . 5 . 5 . 7 . 8 Zu 3. 0 1,20E+05 1 9,72E+05 8,10 2 8,07E+06 8,30 3 6,29E+07 7,79 4 4,85E+08 7,71 5 3,88E+09 8,00 6 3,18E+10 8,20 265000 nach 6h Geom. Mittel 8,014 3,18E+10 Arithm. Mittel 8,017 3,19E+10