Arithmetisches, geometrisches und harmonisches Mittel
Transcrição
Arithmetisches, geometrisches und harmonisches Mittel
Arithmetisches, g eo metrisches und ha rmo nisches M ittel Seminararbeit Studienrichtung „Mathematik Lehramt“ Paris Lodron Universität Salzburg Eingereicht von Peter Baxrainer Matr.Nr. 0120058 bei ao. Univ. Prof. Ferdinand Österreicher im Rahmen der Lehrveranstaltung „Mathematisches Seminar I für Lehramt“ (2 SSt.) im Sommersemester 2003 Zusammenfassung Die vorliegende Arbeit befasst sich mit der parametrischen Darstellung eindimensionaler Daten, einem Teilgebiet der beschreibenden Statistik. Dabei beschränkt sich die Darstellung auf die drei Parameter arithmetisches Mittel x , geometrisches Mittel xG und harmonisches Mittel x H , die zuerst jeweils definiert und erklärt werden, um danach ihre mathematischen Eigenschaften zu betrachten. Abschließend wird der Zusammenhang x ≥ xG ≥ x H mit Hilfe der vollständigen Induktion nach Cauchy bewiesen. Inhaltsverzeichnis 1 Aufgaben und Merkmale von Mittelwerten 3 2 2.1 Das arithmetische Mittel Eigenschaften des arithmetischen Mittels 4 5 3 3.1 Das geometrische Mittel Eigenschaften des geometrischen Mittels 7 8 4 4.1 Das harmonische Mittel Eigenschaften des harmonischen Mittels 10 12 5 Die Ungleichung der Mittelwerte 12 Bibliografie 15 2 1 Aufgaben und Merkmale von Mittelwerten Das arithmetische, geometrische und harmonische Mittel sind Parameter oder Kenngrößen eindimensionaler Daten, also Maßzahlen, die in komprimierter Form möglichst gut die Lage eines gesamten Datensatzes einer statistischen Erhebung charakterisieren sollen. Sie haben daher dieselbe Dimension wie das durch die Daten erfasste Material. So lassen sich insbesondere große Datensätze leichter miteinander vergleichen, als durch eine Gegenüberstellung ihrer Häufigkeitsverteilungen und Häufigkeitssummenfunktionen. Formal lässt sich ein Parameter θ für einen Datensatz als Funktion definieren, die den Beobachtungen x1 , L , x n oder den Merkmalsausprägungen x1 , L , x m und ihren absoluten Häufigkeiten n1 , L , n m genau eine reelle Zahl zuordnet. θ = θ ( x1 , L , x n ) bzw. θ = θ ( x1 , L , x m , n1 , L , n m ) Für solche Lageparameter werden bestimmte Mindestanforderungen aufgestellt, die intuitiv plausibel sind und die axiomatische Grundlage für deren Konstruktion bilden. 1. Identitätsaxiom Haben bei einem Datensatz alle n Beobachtungen denselben Wert c, soll auch der Lageparameter θ diesen Wert annehmen. x1 = x 2 = L = x n = c ⇒ θ = c . 2. Inklusionsaxiom Der Parameter soll zwischen der kleinsten und größten Beobachtung liegen. x(1) = min x j ≤ θ ≤ max x j = x(n ) j =1, ,n j =1, , n 3. Translationsaxiom Eine Verschiebung des gesamten Datensatzes um d ≠ 0 soll den Parameter θ ebenfalls um d verschieben. θ ( x1 + d , L , x n + d ) = θ ( x1 , L , x n ) + d 3 4. Homogenitätsaxiom Eine Veränderung aller absoluten Häufigkeiten ni mit i = 1, L, m mit dem Faktor λ > 0 soll sich nicht auf den Lageparameter auswirken. Dieses Axiom sichert, dass Datensätze mit gleichen relativen Häufigkeitsverteilungen auch gleiche Lageparameter besitzen. θ ( x1 , L , x m , n1 , L , n m ) = θ ( x1 , L , x m , λn1 , L , λn m ) Die Konstruktion von Parametern hängt wesentlich von der Fragestellung und der Skalierung der statistischen Variablen ab. Es werden vorwiegend Parameter für Merkmale erstellt, die metrisch skaliert sind. Neben Median und Modus sind das arithmetische, das geometrische und das harmonische Mittel die wichtigsten Lageparameter, die im Folgenden untersucht werden. 2 Das arithmetische Mittel Der Lageparameter, der am häufigsten Verwendung findet, ist das arithmetische Mittel x , das auch als Durchschnittswert, Stichprobenmittel oder Mittelwert bezeichnet wird. Es ist definiert als Summe aller Beobachtungen, dividiert durch ihre Anzahl. Je nach Datenlage lassen sich für die Berechnung des arithmetischen Mittels unterschiedliche Formeln angeben. Sind die Daten als Einzelbeobachtungen x j mit j = 1, L , n gegeben, gilt x= 1 n ∑xj , n j =1 sind sie als Häufigkeitsverteilung ( x i , ni ) mit i = 1, L , m gegeben, gilt x= m 1 m x n = xi hi , ∑ i i ∑ n i =1 i =1 (*) da die absoluten Häufigkeiten ni nach Division durch n in relative Häufigkeiten hi übergehen. Diese erleichtern zwar den Vergleich verschiedener Datensätze, jedoch geht die Information über die Anzahl n der Beobachtungen verloren. 4 ∑n n Es gelten i =1 i = n und ∑h n i i =1 = 1. Nach (*) berechnet man also das arithmetische Mittel, indem jede Merkmalsausprägung xi des Datensatzes mit ihrer relativen Häufigkeit hi multipliziert wird. Man bezeichnet diese Gleichung auch als die gewogene Form des arithmetischen Mittels. Hilfreich und wichtig für ein angemessenes Verständnis und die sinnvolle Anwendung dieses Parameters sind seine Eigenschaften. 2.1 Eigenschaften des arithmetischen Mittels 1. Werden alle Beobachtungen als Abweichungen vom arithmetischen Mittel (x j − x ) gemessen, hat die Summe aller Abweichungen den Wert null. ∑ (x n j =1 j − x ) = 0 , da ∑x n j =1 j = nx . Diese Eigenschaft des arithmetischen Mittels heißt Nulleigenschaft oder Schwerpunkteigenschaft. 2. Transformiert man die Originaldaten x j linear in y j = α + β x j , unterliegt auch x dieser Transformation, sodass y = α + β x gilt. Dies lässt sich ebenso einfach wie die Schwerpunkteigenschaft beweisen. Aus ∑ y j =∑ (α + β x j ) = nα + β ∑ x j n n n j =1 j =1 j =1 folgt nach Division durch n y =α + β 1 n ∑xj =α + β x . n j =1 3. Die Minimierungseigenschaft des arithmetischen Mittels besagt, dass von keinem anderen Wert die Summe der Abstandsquadrate der x j geringer ist als von x . Bildet man die Summe S der quadrierten Abweichungen aller Beobachtungen von einer beliebigen Zahl a, erhält man S = ∑ (x j − a ) 2 . n j =1 5 Um zu zeigen, dass diese Funktion in a ein Minimum hat, wenn a dem arithmetischen Mittel der Beobachtungen x j entspricht, ermittelt man die kritischen Stellen der Funktion, also die Werte für a, bei denen die erste Ableitung null wird. Ausgehend von folgender Gleichung n dS = −2∑ (x j − a ) = 0 . da j =1 1 n ∑ x j = x . Da S eine n j =1 nichtnegative quadratische Funktion in a ist, muss sie an der kritischen Stelle erhält man nach a aufgelöst das arithmetische Mittel a = a = x ein Minimum besitzen. Dies zeigt aber auch das Vorzeichen der zweiten Ableitung an, da d 2S = 2n > 0 ∀a ist. da 2 Die Einhaltung der ersten drei Axiome durch das arithmetische Mittel ist bereits mit dem Nachweis seiner Eigenschaften gezeigt. Aus der Schwerpunkteigenschaft folgen die ersten beiden Axiome, das dritte resultiert für α = d und β = 1 aus der Transformationseigenschaft. Das vierte Axiom ist schließlich definitionsgemäß erfüllt, weil eine proportionale Änderung aller absoluten Häufigkeiten die relativen Häufigkeiten unverändert lässt. Das arithmetische Mittel reagiert empfindlich auf statistische Ausreißer und kann, wenn solche vorkommen, irreführend sein. Wegen seiner Eigenschaft, die Summe der quadrierten Abweichungen, nicht aber die der Beträge zu minimieren, üben große bzw. sehr kleine Beobachtungen einen starken Einfluss auf x aus. Lässt sich begründen, dass die Ausreißer untypisch sind und nur selten vorkommen, ist es ratsam, sie zu eliminieren oder ihren Einfluss durch eine geringe Gewichtung zu reduzieren. Man erhält auf diese Weise robuste arithmetische Mittel. Sollen aus einem Datensatz α ⋅ 100 % der kleinsten und α ⋅ 100 % der größten Beobachtungen bei der Berechnung ausgeschlossen werden, bestimmt man die Anzahl der zu eliminierenden Beobachtungen mit g = int (αn ) .1 Aus den der Größe nach 1 Die Abkürzung int steht für Integer (ganze Zahl); so ist z.B. int(2,1) = 2 und int (6,92 ) = 6 . 6 geordneten Daten x (1) , L , x ( n ) werden jetzt die g kleinsten und g größten Beobachtungen entfernt und das arithmetische Mittel der verbleibenden n − 2 g Daten berechnet. xα = 1 n − 2g ∑x n− g j = g +1 ( j) Man bezeichnet xα als das α-getrimmte arithmetische Mittel. 3 Das geometrische Mittel Trotz seines breiten Anwendungsbereiches gibt das arithmetische Mittel bei bestimmten Merkmalen nicht den richtigen Durchschnitt an. Dies ist bei zeitabhängigen Messzahlen der Fall, wo zwei Beobachtungen mit unterschiedlichem Zeitbezug, aber für dieselbe statistische Variable in Verhältnis gesetzt werden. Solche Messzahlen heißen Wachstums- bzw. Aufzinsungsfaktoren, wobei sie meist für äquidistante Zeitpunkte erstellt werden. Liegen äquidistant erhobene Beobachtungen y 0 , y1 ,L, y n vor, sind die entsprechenden Wachstumsfaktoren aa xj y pro Periode j definiert als x j = j mit j = 1, L, n . Der Gesamtwachstumsy j −1 y faktor beträgt n . Wegen y0 yn y y y = 1 ⋅ 2 ⋅ L ⋅ n = x1 ⋅ x 2 ⋅ L ⋅ x n y 0 y 0 y1 y n −1 lässt sich y n darstellen als n yn = y0 ∏ x j . j =1 Der durchschnittliche Wachstumsfaktor ist nun derjenige Vervielfachungskoeffizient xG , der über alle Perioden konstant bleibt und y 0 auf den Endwert y n anwachsen lässt. Für diesen gilt y 0 ( x G ) n = y n , oder nach xG aufgelöst n n xG = n x1 ⋅L ⋅ xn = ∏ x j . j =1 1 7 Man bezeichnet xG als geometrisches Mittel. Oft finden sich auch die Schreibweisen x̂ , x̂ n oder g. Es ist nur für x1 , L , x n ≥ 0 definiert, d.h. wenn die Beobachtungen y j über die Zeit j monoton wachsen. Das geometrische Mittel lässt sich jedoch auch bei monoton fallenden Beobachtungsreihen berechnen. Anstelle der jetzt negativen Wachstumsfaktoren verwendet man ihren Betrag | x j |. Sind einige Wachstumsfaktoren gleich groß, kann statt den Beobachtungen x j wieder die Häufigkeitsverteilung ( x i , ni ) mit i = 1, L , m angegeben werden. Das gewogene geometrische Mittel berechnet man sodann nach m n xG = ∏ xi i i =1 m n h = ∏ xi i . i =1 1 3.1 Eigenschaften des geometrischen Mittels Das geometrische Mittel lässt sich durch Logarithmustransformation auf das arithmetische Mittel zurückführen. Aus der Definition folgt dann nach den Rechenregeln des Logarithmus ln xG = 1 n ∑ ln x j . n j =1 (**) Der Logarithmus des geometrischen Mittels entspricht also dem arithmetischen Mittel der logarithmierten Beobachtungen. Aufgrund dieses Zusammenhangs lassen sich die Eigenschaften des geometrischen Mittels aus denen des arithmetischen Mittels entwickeln. Dies sei für zwei wichtige Eigenschaften gezeigt. Wegen der Schwerpunkteigenschaft von x muss gelten ∑ ln x n j =1 j − 1 n ln x j = 0 . ∑ n j =1 Bei Substitution nach Gleichung (**) erhält man ∑ (ln x n j =1 j − ln xG ) = 0 , 8 n entlogarithmisiert ergibt sich daraus xj ∏x j =1 = 1. G Werden also alle Beobachtungen durch das geometrische Mittel dividiert, ist das Produkt der so gebildeten Verhältniszahlen gleich eins. Auch die Minimierungseigenschaft kann auf diese Weise erkannt werden. Die Summe S = ∑ (ln x j − ln a ) 2 n wird minimal bezüglich a, wenn ln a dem arith- j =1 metischen Mittel der logarithmierten Beobachtungen entspricht. Nach Gleichung (**) ist dies bei a = xG der Fall. Das lässt sich durch Ableiten von S nach a auch wie folgt direkt zeigen. dS 2 n = − ∑ (ln x j − ln a ) = 0 da a j =1 ⇔ ∑ ln x n j =1 ⇔ j − n ln a = 0 ln a = 1 n ∑ ln x j = ln xG n j =1 ∑ (x n So wie das arithmetische Mittel die Summe j =1 j − a ) 2 für a = x minimiert, xj minimiert also das geometrische Mittel die Summe ∑ ln a j =1 n für a = xG . 2 Das geometrische Mittel erfüllt das Identitäts-, Inklusions- und Homogenitätsaxiom, nicht jedoch das Translationsaxiom. Da dieses Mittel, wie wir bereits gesehen haben, aus Verhältniszahlen xj = yj y j −1 berechnet wird, ist das Translationsaxiom aus sachlogischen Erwägungen überflüssig. Ein dazu analoges Axiom für Verhältniszahlen müsste fordern, dass eine Vervielfachung aller 9 Wachstumsfaktoren mit dem Faktor λ ≠ 0 auch das geometrische Mittel mit diesem Faktor erhöht. n λx1 ⋅ λx 2 ⋅ L ⋅ λx n = λxG Dieses für Verhältniszahlen modifizierte Translationsaxiom wird von xG erfüllt. 4 Das harmonische Mittel Zahlreiche Beobachtungsmerkmale besitzen eine Dimension, die als Quotient zweier anderer Dimensionen entsteht. Das Merkmal „Geschwindigkeit“ hat beispielsweise im Zähler die Dimension „Länge“ und im Nenner die Dimension „Zeit“. Bei solchen Merkmalen können die Häufigkeiten die Dimension des Zählers oder des Nenners aufweisen. Haben sie die Dimension des Zählers, ist das harmonische Mittel heranzuziehen. Es setzt voraus, dass das Merkmal nur positive Werte für x1 , L, x n > 0 annimmt. Das harmonische Mittel ist bei Einzelbeobachtungen bzw. häufigkeitsverteilten Daten auf die zwei Arten n xH = 1 ∑ j =1 x j und xH = n = ni ∑ i =1 xi 1 hi ∑ i =1 xi n m m definierbar. Es finden sich auch die Bezeichnungen ~ x und h für das harmonische Mittel. Das folgende Beispiel verdeutlicht die Zusammenhänge. Ein Auto fährt eine Strecke von 1000 km mit den in der folgenden Tabelle festgehaltenen Geschwindigkeiten und der dazugehörigen Dauer. km/h Stunden km 60 1,5 90 100 3 300 10 110 5 550 120 0,5 60 Kennt man von dieser Tabelle die ersten zwei Zeilen, ist die Durchschnittsgeschwindigkeit als gewogenes arithmetisches Mittel zu berechnen, da die Dauer, mit der eine bestimmte Geschwindigkeit gefahren wird, in der Dimension Zeit vorliegt, die das Merkmal Geschwindigkeit im Nenner hat. Da die gesamte Fahrzeit n = 10 Stunden beträgt, ergibt sich x= 1 4 1 1 xi ni = (60 ⋅1,5 + 100 ⋅ 3 + 110 ⋅ 5 + 120 ⋅ 0,5) = 1000 = 100 (km/h). ∑ n i =1 10 10 Liegen die Angaben so vor, dass man die erste und dritte Zeile kennt, stellen die gefahrenen Kilometer die Häufigkeiten der vier Merkmalsausprägungen dar. Da diese Häufigkeiten die Dimension Länge aufweisen, die bei dem Merkmal Geschwindigkeit im Zähler steht, ist die durchschnittliche Geschwindigkeit mit dem harmonischen Mittel zu berechnen. xH = n 1000 = = 100 (km/h) 90 300 550 60 ni + + + ∑ 60 100 110 120 i =1 xi 4 Nach dem arithmetischen Mittel erhält man x= 1 (60 ⋅ 90 + 100 ⋅ 300 + 110 ⋅ 550 + 120 ⋅ 60) = 103,1 (km/h). 1000 Dies ist offensichtlich falsch, da die gesamte Fahrzeit 10 Stunden beträgt und so mit dem arithmetischen Mittel als Durchschnittsgeschwindigkeit nicht 1000 km, sondern 1031 km zurückgelegt würden. Andere Merkmale, bei denen das harmonische Mittel zum Einsatz kommen kann, sind die Dichte ρ (V ) = Stromstärke I ( R) = U R m V , die , die Wellenlänge bei harmonischen Schwingungen T ( f ) = 1f , die physikalische Leistung P(t ) = Wt , das nominale Sozialprodukt mit den Dimensionen „Geld“ im Zähler und „Zeit“ im Nenner und viele mehr. 11 4.1 Eigenschaften des harmonischen Mittels Das harmonische Mittel ist definitionsgemäß gleich dem Kehrwert des arithmetischen Mittels der Kehrwerte der Beobachtungen. 1 n 1 xH = n = ∑ 1 n j =1 x j ∑ j =1 x j n −1 Aufgrund dieses Zusammenhangs folgt aus den entsprechenden Eigenschaften des arithmetischen Mittels, dass 1 ∑ x n j =1 − j 1 xH 1 1 − ∑ a j =1 x j n =0 gilt, und dass die Summe 2 für a = x H ein Minimum annimmt. Auch das harmonische Mittel erfüllt das Identitäts-, das Inklusions- und das Homogenitätsaxiom. Aus den gleichen Gründen wie beim geometrischen Mittel gilt das Translationsaxiom nur in abgewandelter Form. Multipliziert man alle Beobachtungen x j mit λ > 0 , erhöht sich auch x H um diesen Faktor. n 1 ∑ j =1 λ x j n = n 1 ∑ λ j =1 x j 1 n =λ n 1 ∑ j =1 x j n = λ xH 5 Die Ungleichung der Mittelwerte Behauptung: x ≥ xG ≥ x H , d.h. für positive Beobachtungswerte x1 , L , x n > 0 gilt n n 1 n ∏ x j ≥ x ≥ ∑ j n j =1 j =1 1 n ∑x n j =1 mit Gleichheit genau dann, wenn x1 = x 2 = L = x n . 12 1 j Beweis: Um diese Ungleichungskette zu beweisen, reicht es, die Ungleichung x ≥ xG zu xG ≥ x H betrachten, da die Ungleichung mit der Ungleichung zwischen 1 arithmetischem und geometrischem Mittel der Kehrwerte y j = mit j = 1,L , n xj identisch ist. x H ≤ xG n n ≤ x ∏ n 1 j =1 j ∑ j =1 x j 1 n ⇔ n ⇔ ≤ ∑ yj n j =1 1 n n ∏ y j j =1 1 ⇔ n n 1 ∏ y j y ≥ ∑ j n j =1 j =1 ⇔ y ≥ yG . 1 n Der von Cauchy stammende Beweis für die Ungleichung zwischen arithmetischem und geometrischem Mittel verwendet zunächst das Prinzip der vollständigen Induktion für n = 2 m , um daraus den allgemeinen Fall abzuleiten.2 Für den Fall n = 2 m , ist zunächst zu zeigen, dass 2 ∏ y j j =1 m 1 / 2m 1 ≤ m 2 ∑y 2m j =1 j . Induktionsanfang m = 1 (n = 2) : y1 y 2 ≤ ( y1 + y 2 ) / 2 ⇔ ⇔ y1 y 2 ≤ ( y1 + y 2 ) / 4 2 0 ≤ ( y1 − y 2 ) 2 2 Es existiert dazu eine Fülle von Beweisvarianten; eine Auswahl bietet Bullen, P.S. et al (Hg.): Means and Their Inequaltities, Dordrecht 1988. 13 Induktionsschluss m → m + 1 (2 m → 2 m+1 ) : 1 1 2 1 y = y + m m +1 ∑ j m ∑ j 2 2 2 j =1 2 j =1 1 2 m +1 m 1 2 ≥ m ∑ y j 2 j =1 1/ 2 m 2 ≥ ∏ y j j =1 m 1 / 2 m +1 ∑y 2 m +1 j j = 2 m +1 1 ⋅ m 2 ∑m y j j = 2 +1 2 m +1 2 m+1 ⋅ ∏ yj m j = 2 +1 1 / 2 m +1 1/ 2 2 = ∏ y j j =1 m +1 1 / 2 m +1 Im ersten Schritt wird die Summe aufgespalten, um auf die beiden Teile den Induktionsanfang anzuwenden. Danach findet die Induktionsvoraussetzung zwei Mal Verwendung, wobei sicherzustellen ist, dass auch die zweite Summe von j = 2m + 1 bis 2m +1 genau 2m Summanden hat. 2m +1 − (2m + 1) + 1 = 2m +1 − 2m = 2m Fasst man schließlich die Produkte zusammen, ist y ≥ yG für n = 2m bewiesen. Nun definieren wir die positiven, reellen Zahlen y1 ,L, yn folgenderweise. xj y j := 1 n xj n∑ j =1 für j = 1 ,L , n für j = n + 1,L,2 n Vom bewiesenen Spezialfall kommen wir zur gewünschten Ungleichung, indem wir in den ersten beiden Umformungen zunächst die y j substituieren und die Ausdrücke vereinfachen. Danach multiplizieren wir mit n1−n / 2 > 0 , dividieren n anschließend durch die linke Summe, und durch Vereinfachen und Potenzieren mit 2n in der letzten Umformung erreichen wir die gewünschte Form. n 14 2 ∏ yj j =1 n ⇔ ∏ xj j =1 1/ 2n n n ∏ xj j =1 1 ⋅ ∑ x j n j =1 ⋅ n ∏ xj j =1 1/ 2n ⇔ 2n −n 1 n 2n − n n ≤ n ∑ xj + ∑ xj 2 j =1 n i =1 2n n ∑ xj j =1 n n ⋅ ∑ x j j =1 ≤ 1 n ∑ xj n j =1 ≤ 1 1− n / 2 n n ∏ xj j =1 1/ 2n ⇔ n 1− n / 2 n 1 n1− n / 2 1 2 ≤ n ∑ yj 2 j =1 n 1/ 2n ⇔ 1/ 2n n ∏ xj j =1 ⇔ j =1 j 1 n ≤ n / 2 n ∑ x j n j =1 1/ n ⇔ nn / 2 ∑x n n ≤ n / 2n 1 n ∑ xj n j =1 xG ≤ x Bibliografie Assenmacher, W.: Deskriptive Statistik, Berlin Heidelberg New York 1996. Bamberg, G., Baur, F.: Statistik, München Wien 81993. Bullen, P.S. et al (Hg.): Means and Their Inequaltities, Dordrecht 1988. Härtter, E.: Wahrscheinlichkeitsrechnung, Statistik und mathematische Grundlagen. Begriffe, Definitionen und Formeln, Göttingen 1987. Pinnekamp, H.-J., Siegmann, F.: Deskriptive Statistik. Mit einer Einführung in das Programmpaket Statgraphics, München 31993. Plachky, D.: Mathematische Grundbegriffe und Grundsätze der Stochastik, Berlin 2001. Schlittgen, R.: Einführung in die Statistik, München Wien 51995. 15