Date post: | 06-Apr-2015 |
Category: |
Documents |
Upload: | rannulf-kapler |
View: | 107 times |
Download: | 0 times |
1
STATISIK
LV Nr 0028
SS 2005
9Mai 2005
2
Literatur
bull Bleymuumlller Gehlert Guumllicher bdquoStatistik fuumlr Wirtschaftswissenschaftlerldquo Verlag Vahlen
bull Hartung bdquoStatistik Lehr- und Handbuch der angewandten Statistikldquo Oldenburg Verlag Muumlnchen Wien
3
Einfuumlhrung
bull bdquoStatistikldquo Abgeleitet vom neulateinischen Begriff bdquostatusldquo (Bed bdquoStaatldquo bdquoZustandldquo)
bull 18 und 19 Jhdt bdquoLehre von der Zustandsbeschreibung des Staatesldquo (Sammeln und verbales oder numerisches Beschreiben von Daten)
bull Heute im doppelten Sinne gebrauchtndash Quantitative Informationen (zB
Bevoumllkerungsstatistik)ndash Formale Wissenschaft
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich telefonisch)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va in Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Fragestellung
bull Klarer Aufbau Struktur
bull Offene oder geschlossene Frage
bull Fragen exakt und neutral formulieren
bull Antwortalternativen klar und ausgewogen
bull Reihenfolge der Antwortalternativen
bull Suggestive Fragestellungen vermeiden
bull Kontrolle sinngemaumlszlig gleiche Fragen
8
Einfuumlhrung
Schriftliche Befragung- Befragungssituation nicht
kontrollierbar
- Keine Zusatzauskuumlnfte Erklaumlrungen usw
- Antworten nicht spontan
- Reihenfolge der Fragenbeantwortung
- Ruumlcklaufquote oft gering
Muumlndliche Befragung- Aufhebung der
Anonymitaumlt
- Interviewereffekt
- Zeitlicher Antwortdruck
9
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
2
Literatur
bull Bleymuumlller Gehlert Guumllicher bdquoStatistik fuumlr Wirtschaftswissenschaftlerldquo Verlag Vahlen
bull Hartung bdquoStatistik Lehr- und Handbuch der angewandten Statistikldquo Oldenburg Verlag Muumlnchen Wien
3
Einfuumlhrung
bull bdquoStatistikldquo Abgeleitet vom neulateinischen Begriff bdquostatusldquo (Bed bdquoStaatldquo bdquoZustandldquo)
bull 18 und 19 Jhdt bdquoLehre von der Zustandsbeschreibung des Staatesldquo (Sammeln und verbales oder numerisches Beschreiben von Daten)
bull Heute im doppelten Sinne gebrauchtndash Quantitative Informationen (zB
Bevoumllkerungsstatistik)ndash Formale Wissenschaft
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich telefonisch)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va in Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Fragestellung
bull Klarer Aufbau Struktur
bull Offene oder geschlossene Frage
bull Fragen exakt und neutral formulieren
bull Antwortalternativen klar und ausgewogen
bull Reihenfolge der Antwortalternativen
bull Suggestive Fragestellungen vermeiden
bull Kontrolle sinngemaumlszlig gleiche Fragen
8
Einfuumlhrung
Schriftliche Befragung- Befragungssituation nicht
kontrollierbar
- Keine Zusatzauskuumlnfte Erklaumlrungen usw
- Antworten nicht spontan
- Reihenfolge der Fragenbeantwortung
- Ruumlcklaufquote oft gering
Muumlndliche Befragung- Aufhebung der
Anonymitaumlt
- Interviewereffekt
- Zeitlicher Antwortdruck
9
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
3
Einfuumlhrung
bull bdquoStatistikldquo Abgeleitet vom neulateinischen Begriff bdquostatusldquo (Bed bdquoStaatldquo bdquoZustandldquo)
bull 18 und 19 Jhdt bdquoLehre von der Zustandsbeschreibung des Staatesldquo (Sammeln und verbales oder numerisches Beschreiben von Daten)
bull Heute im doppelten Sinne gebrauchtndash Quantitative Informationen (zB
Bevoumllkerungsstatistik)ndash Formale Wissenschaft
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich telefonisch)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va in Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Fragestellung
bull Klarer Aufbau Struktur
bull Offene oder geschlossene Frage
bull Fragen exakt und neutral formulieren
bull Antwortalternativen klar und ausgewogen
bull Reihenfolge der Antwortalternativen
bull Suggestive Fragestellungen vermeiden
bull Kontrolle sinngemaumlszlig gleiche Fragen
8
Einfuumlhrung
Schriftliche Befragung- Befragungssituation nicht
kontrollierbar
- Keine Zusatzauskuumlnfte Erklaumlrungen usw
- Antworten nicht spontan
- Reihenfolge der Fragenbeantwortung
- Ruumlcklaufquote oft gering
Muumlndliche Befragung- Aufhebung der
Anonymitaumlt
- Interviewereffekt
- Zeitlicher Antwortdruck
9
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich telefonisch)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va in Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Fragestellung
bull Klarer Aufbau Struktur
bull Offene oder geschlossene Frage
bull Fragen exakt und neutral formulieren
bull Antwortalternativen klar und ausgewogen
bull Reihenfolge der Antwortalternativen
bull Suggestive Fragestellungen vermeiden
bull Kontrolle sinngemaumlszlig gleiche Fragen
8
Einfuumlhrung
Schriftliche Befragung- Befragungssituation nicht
kontrollierbar
- Keine Zusatzauskuumlnfte Erklaumlrungen usw
- Antworten nicht spontan
- Reihenfolge der Fragenbeantwortung
- Ruumlcklaufquote oft gering
Muumlndliche Befragung- Aufhebung der
Anonymitaumlt
- Interviewereffekt
- Zeitlicher Antwortdruck
9
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich telefonisch)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va in Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Fragestellung
bull Klarer Aufbau Struktur
bull Offene oder geschlossene Frage
bull Fragen exakt und neutral formulieren
bull Antwortalternativen klar und ausgewogen
bull Reihenfolge der Antwortalternativen
bull Suggestive Fragestellungen vermeiden
bull Kontrolle sinngemaumlszlig gleiche Fragen
8
Einfuumlhrung
Schriftliche Befragung- Befragungssituation nicht
kontrollierbar
- Keine Zusatzauskuumlnfte Erklaumlrungen usw
- Antworten nicht spontan
- Reihenfolge der Fragenbeantwortung
- Ruumlcklaufquote oft gering
Muumlndliche Befragung- Aufhebung der
Anonymitaumlt
- Interviewereffekt
- Zeitlicher Antwortdruck
9
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich telefonisch)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va in Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Fragestellung
bull Klarer Aufbau Struktur
bull Offene oder geschlossene Frage
bull Fragen exakt und neutral formulieren
bull Antwortalternativen klar und ausgewogen
bull Reihenfolge der Antwortalternativen
bull Suggestive Fragestellungen vermeiden
bull Kontrolle sinngemaumlszlig gleiche Fragen
8
Einfuumlhrung
Schriftliche Befragung- Befragungssituation nicht
kontrollierbar
- Keine Zusatzauskuumlnfte Erklaumlrungen usw
- Antworten nicht spontan
- Reihenfolge der Fragenbeantwortung
- Ruumlcklaufquote oft gering
Muumlndliche Befragung- Aufhebung der
Anonymitaumlt
- Interviewereffekt
- Zeitlicher Antwortdruck
9
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
7
Fragestellung
bull Klarer Aufbau Struktur
bull Offene oder geschlossene Frage
bull Fragen exakt und neutral formulieren
bull Antwortalternativen klar und ausgewogen
bull Reihenfolge der Antwortalternativen
bull Suggestive Fragestellungen vermeiden
bull Kontrolle sinngemaumlszlig gleiche Fragen
8
Einfuumlhrung
Schriftliche Befragung- Befragungssituation nicht
kontrollierbar
- Keine Zusatzauskuumlnfte Erklaumlrungen usw
- Antworten nicht spontan
- Reihenfolge der Fragenbeantwortung
- Ruumlcklaufquote oft gering
Muumlndliche Befragung- Aufhebung der
Anonymitaumlt
- Interviewereffekt
- Zeitlicher Antwortdruck
9
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
8
Einfuumlhrung
Schriftliche Befragung- Befragungssituation nicht
kontrollierbar
- Keine Zusatzauskuumlnfte Erklaumlrungen usw
- Antworten nicht spontan
- Reihenfolge der Fragenbeantwortung
- Ruumlcklaufquote oft gering
Muumlndliche Befragung- Aufhebung der
Anonymitaumlt
- Interviewereffekt
- Zeitlicher Antwortdruck
9
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
9
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
10
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
11
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
12
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
13
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
14
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
15
Stichprobenerhebung
bull Aufgabe Aussagen uumlber Grundgesamtheitbull Stichprobe (Kosten Zeit Moumlglichkeit)
ndash Zufallsstichprobe (theoretisch fundierte Aussagen uumlber Zuverlaumlssigkeit der Ergebnisse sind moumlglich)
ndash Quotenstichprobe (keine theoretisch fundierten Aussagen uumlber die Zuverlaumlssigkeit der Ergebnisse)
bull Stpr heiszligt repraumlsentativ wenn ein Schluss auf Grundgesamtheit erlaubt ist
bull Stichprobe bdquoverkleinertes Abbildldquo der Grundgesamtheit
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
16
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
17
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
18
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
19
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
20
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
21
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
22
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
23
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
25
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
26
Darstellungsformen
bull Grafik HistogrammKoumlrpergroumlszlige in cm
0
2
4
6
8
10
12
14
141-160 161-170 171-180 181-200
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
27
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
28
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
29
Darstellungsformen
bull Liniendiagramm Familienmitglieder
0
5
10
15
20
25
0 1 2 3 4 5 6
Anzahl der Familienmitglieder
Hauml
ufi
gk
eit
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
30
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
31
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1(i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
32
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
33
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
34
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
35
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
36
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
37
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
38
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
39
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
40
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
41
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
42
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
43
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
44
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
46
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
47
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
48
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also a025 = a(k) = a(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also a075 = a(k) = a(8) = 184
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
49
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
50
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
51
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
52
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung 6
061261071041111102a 44g
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
53
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
54
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
55
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh