Date post: | 06-Apr-2015 |
Category: |
Documents |
Upload: | heiner-apel |
View: | 106 times |
Download: | 3 times |
1
STATISIK
LV Nr.: 1852
WS 2005/06
22. Dezember 2005
2
Anteilstests
• Einstichprobentest für den Anteilswert – Hat der Anteil einen bestimmten Wert, bzw.
liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer
einzigen Stichprobe.
• Zweistichprobentest für Anteilswerte– Unterscheiden sich die Anteile zweier
unabhängiger Gruppen?– Entscheidung basiert auf zwei Stichproben
3
Anteilstest - Einstichprobentest
Einstichprobentest für den Anteilswert:
• Einseitige Hypothesen: – H0: θ ≤ θ0 gegen H1: θ > θ0
– H0: θ ≥ θ0 gegen H1: θ < θ0
• Zweiseitige Hypothesen: – H0: θ = θ0 gegen H1: θ ≠ θ0
4
Anteilstest - Einstichprobentest
Vorgehensweise:
• Teststatistik bestimmen
• Testverteilung bestimmen
• Entescheidung über Annahme oder Ablehnung von H0.
5
Anteilstest - Einstichprobentest
• Anteilswert einer Stichprobe: P = x / n
• Unter H0 ist P, wenn nθ0(1-θ0) ≥ 9, approximativ N-Vt., mit Parametern – E(P) = θ0
– Var(P) = θ0(1-θ0)/n · [(N-n)/(N-1)]• Vernachlässigung der Endlichkeitskorrektur wenn
n/N < 0,05.
6
Anteilstest - Einstichprobentest
Prüfgröße / Teststatistik:
• Standardisierte Zufallsvariable Z:
0
P
P-θZ=
σ
7
Anteilstest - Einstichprobentest
Testverteilung:
• Teststatistik Z ist unter H0 N(0,1) verteilt.
• Daher: Testverteilung ist die Standardnormalverteilung.
8
Anteilstest - Einstichprobentest
Kritischer Bereich:• α festlegen (z.B. α = 0,05) • Kritischer Wert: α – Quantil der N(0,1)-Vt. • Entscheidung: H0 ablehnen, wenn Teststatistik im
kritischen Bereich. p-Wert: • α festlegen (z.B. α = 0,05)• p-Wert: Niveau, bei dem der Test gerade noch die
H0 ablehnen würde. • Entscheidung: H0 ablehnen, wenn p-Wert < α
9
Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten
• Approximation durch N-Vt. zulässig, da unter H0 nθ0(1-θ0) = 18,25 ≥ 9.
• 1. Einseitige Tests:– H0: pw ≤ 0,5 gegen H1: pw > 0,5 und α=0,05
– H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05
• 2. Zweiseitiger Test: – H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05
10
Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten
• H0: pw 0,5 gegen H1: pw > 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =
0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritischer Wert 1,64– p-Wert: 0,1461
11
Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten
• H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =
0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritischer Wert -1,64– p-Wert: 0,8539
12
Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten
• H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =
0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritische Werte -1,96
und +1,96 – p-Wert: 0,2922
13
Anteilstest - Zweistichprobentest
Test für die Differenz zweier Anteilswerte
• Stichprobe 1: Anteil P1 = x / n1
• Grundgesamtheit 1: Anteil θ1
• Stichprobe 2: Anteil P2 = x / n2
• Grundgesamtheit 2: Anteil θ2
• H0: Anteilswerte der beiden Grundgesamtheiten sind gleich.
H0: θ1 = θ2 (=θ) gegen H1: θ1 ≠ θ2
14
Anteilstest - Zweistichprobentest
Teststatistik:
(Unter Vernachlässigung der Endlichkeitskorrektur und wenn Voraussetzungen für eine N-Vt. erfüllt sind)
• Verteilung der Teststatistik unter H0:
Z ~ N(0,1)
1 2
1 2
1 2
(P -P )Z=
n +nθ(1-θ)
n n
15
Anteilstest - Zweistichprobentest
Entscheidung:
• Bestimmung des kritischen Bereichs. – Z > |c| lehne H0 ab
• Bestimmung des p-Wertes– p-Wert < α lehne H0 ab
• Interpretation: Wird H0 abgelehnt, dann sind die Anteile in den beiden Gruppen signifikant verschieden.
16
Test für arithmetisches Mittel
• Einstichprobentest für das arithm. Mittel: – Hat das arithm. Mittel einen bestimmten Wert,
bzw. liegt es in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer
einzigen Stichprobe.
• Zweistichprobentest für das arithm. Mittel– Unterscheiden sich die Mittelwerte zweier
Gruppen?– Entscheidung basiert auf zwei Stichproben
17
Test für arithmetisches Mittel
• Einstichprobentest für das arithm. Mittel: – Varianz der Grundgesamtheit ist bekannt.– Varianz der Grundgesamtheit ist unbekannt.
18
Test für arithmetisches Mittel
• Einstichprobentest für das arithm. Mittel:
• Zweiseitige Hypothese:
H0: µ = µ0 gegen H1: µ ≠ µ0
• Festlegen des Signifikanzniveaus
19
Test für arithmetisches Mittel
• Varianz der Grundgesamtheit ist bekannt.
• Unter H0 ist das arithm. Mittel der Stichprobe N-Vt. mit E=µ und Var=σ²/n
• Teststatistik:
• Testverteilung: N(0,1)n
σμX
σ
μXZ
X
20
Test für arithmetisches Mittel
• Bestimmung des kritischen Bereichs bzw. Berechung des p-Wertes
• Entscheidung
• Interpretation
21
Test für arithmetisches Mittel
• Varianz der Grundgesamtheit ist unbekannt.
• Schätzwert für unbekanntes σ²: Stichprobenvarianz s².
• Teststatistik:
• Testverteilung: tn-1
• t-Test
n
sμX
T
22
Test für arithmetisches Mittel
• Bestimmung des kritischen Bereichs: kritische Werte: α/2-Quantile der t-Vt., symmetrische Vt. daher tc
u = -tco
• Berechung des p-Wertes:
• Entscheidung:
|t| > tc, lehne H0 ab
p-Wert < α, lehne H0 ab
• Interpretation
23
Test für arithmetisches Mittel
Bsp. mittlere Körpergröße (n = 73)
• H0: µ = 170 gegen H1: µ 170, α = 0,05
• Arithm. Mittel der Stpr: 173,4
• Standardabweichung der Stichprobe: 9,5
• Teststatistik T = (173,4-170) / 9,5/73 = 3,1
• Kritische Werte: -1,96 und +1,96
• p-Wert: 0,0021
• Mittlere Körpergröße ist signifikant 170
24
Test für arithmetisches Mittel
• Zweistichprobentest für die Differenz zweier arithmetischer Mittel– Unterscheiden sich die Mittelwerte zweier
Grundgesamtheiten?– Unterscheiden sich die Mittelwerte zweier
verbundener Stichproben?
25
Test für arithmetisches Mittel
• Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen.
• Voraussetzung: – Stichproben unabhängig– Stichproben stammen aus einer N-vt.
Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig
– Endlichkeitskorrektur ist vernachlässigbar
26
Test für arithmetisches Mittel
• Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht.
• Varianzen verschieden, σ1² σ2² :
• Teststatistik:
• Testverteilung: Z asymptotisch N(0,1)-vt.
2
22
1
21
21
n
S
n
S
)XX(Z
27
Test für arithmetisches Mittel
• Varianzhomogenität, σ1² = σ2² = σ²:
• Teststatistik:
wobei
• Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden
21
21
21
nn
nnS
)XX(T
2nn
1)S(n1)S(nS
21
222
211
28
Test für arithmetisches Mittel
• Verbundene Stichproben (abhängige oder gepaarte Stpr.)– Tritt auf, wenn z.B. die Merkmalsausprägungen
der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen.
• Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.
29
Test für arithmetisches Mittel
• Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD²
• Teststatistik:
• Testverteilung: T~tv mit v=n-1
n
SδD
TD
n n2
i D ii 1 i 1
1 1D D und S (D D)
n n 1
30
Test für Varianz
• Einstichprobentest für die Varianz: – Hat die Varianz einen bestimmten Wert, bzw.
liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer
einzigen Stichprobe.
• Zweistichprobentest für die Varianz– Unterscheiden sich die Varianzen zweier
Gruppen?– Entscheidung basiert auf zwei Stichproben
31
Test für Varianz
Einstichprobentest für die Varianz:• Annahme: Grundgesamtheit normalverteilt• H0: σ² = σ0² gegen H1: σ² σ0²• Teststatistik:
• Testverteilung: χ²v mit v=n-1• Entscheidung:
– χ² > χ²co oder χ² < χ²c
u, lehnen H0 ab – p-Wert < α, lehne H0 ab
2
22
σ
1)s(nχ
32
Test für Varianz
Zweistichprobentest für den Quotienen zweier Varianzen:
• Annahme: Grundgesamtheit normalverteilt• H0: σ1² = σ2² gegen H1: σ1² σ2²• Teststatistik:
• Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1• Entscheidung:
– F > Fco oder F < Fc
u, lehnen H0 ab – p-Wert < α, lehne H0 ab
22
21
S
SF
33
Nichtparametrische Tests
• Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist).
• Rangtests für Lageparameter– Zeichentest– Wilcoxon Vorzeichenrangtest für das
Symmetriezentrum einer Verteilung
• Verteilungsfreie Lokationsvergleiche– Wilcoxon Rangsummentest oder
Mann-Whitney U Test
34
Rangtests für Lageparameter
Zeichentest (Ordinalskala ausreichend)– Annahme: unabhängige Beobachtungen x1, ..., xn
stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F.
• Test für den Median ξ0,5 der Grundgesamtheit
• Einseitige Hypothesen:– H0: ξ0,5 ξ0 gegen H1: ξ0,5 > ξ0
– H0: ξ0,5 ξ0 gegen H1: ξ0,5 < ξ0
• Zweiseitige Hypothese: – H0: ξ0,5 = ξ0 gegen H1: ξ0,5 ξ0
35
Rangtests für Lageparameter
• Vorgehensweise:
• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0
• Bestimmung von yi
– yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0
36
Rangtests für Lageparameter
• Teststatistik:
Unter H0 ist T ~ B(n, ½) • Approximation durch N(0,1):
• Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung
n
1iiyT
n2
12
ny
2
11
2
1n
2
1ny
Z
n
1ii
n
1ii
37
Rangtests für Lageparameter
• Beispiel für Zeichentest (Hartung, S. 243):– Alter von Frauen bei der Geburt des ersten
Kindes. H0: ξ0,5 25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern.
i Alter xi xi‘ yi
1 30,6 5,6 1
2 17,8 -7,2 0
: : : :
35 20 -5 0
36 23,5 -1,5 0
38
Rangtests für Lageparameter
• Beispiel
• Approximation durch N-Vt
• Entscheidung (bei α=0,05): Z < 1,645
Lehne H0: ξ0,5 25 nicht ab.
n
ii 1
1y 36
20 182Z 0,667
1 3362
39
Rangtests für Lageparameter
• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit – Basiert auf Rangzahlen der Beobachtungen– Annahme: n unabhängige Beobachtungen
(x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F
• Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?
40
Rangtests für LageparameterVerteilungsfunktion F(x)
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-3 -2 -1 0 1 2 3
F(ξ0-y)
1-F(ξ0+y)
ξ0 ξ0+yξ0-y
41
Rangtests für Lageparameter
• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit
• Einseitige Hypothesen:– H0: F symmetrisch um ξ ξ0
– H0: F symmetrisch um ξ ξ0
• Zweiseitige Hypothese: – H0: F symmetrisch um ξ = ξ0
42
Rangtests für Lageparameter
• Vorgehensweise:
• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0
• Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert).
• Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i
43
Rangtests für Lageparameter
• Teststatistik:
mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
• Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)
n
1iiiRcT~
44
Rangtests für Lageparameter
• Approximation durch N(0,1) Verteilung:
• Teststatistik T* (keine Bindungen):
mit E T+ = n(n+1) / 4
und Var T+ = n(n+1)(2n+1) / 24(Beim Auftreten von Bindungen: T* laut Hartung, S. 246)
• Vergleich von T* mit kritischen Werten der N(0,1) Verteilung
+ +*
+
T -E TT =
Var T
45
Rangtests für Lageparameter
• Beispiel Wilcoxon VorzeichenrangtestPsychologischer Test, Bewertung durch Punkte xi
H0: F symmetrisch um ξ = ξ0 = 61, α = 0,05
• Teststatistik:
ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
n
1iiiRcT~
46
Rangtests für Lageparameter
• Beispiel:
• T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53
i xi xi‘ = xi- ξ0 Ri R� i
1 72 11 10,5 10,5
2 55 -6 3 -3
3 67 6 3 3
4 53 -8 7 -7
5 69 8 7 7
6 71 10 9 9
7 55 -6 3 -3
8 68 7 5 5
9 65 4 1 1
10 72 11 10,5 10,5
11 69 8 7 7
47
Rangtests für Lageparameter
• Beispiel:
• Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54
• Entscheidung:
w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975
Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.
48
Vt.-freie Lokationsvergleiche
• Wilcoxon Rangsummentest oder Mann-Whitney U Test
• Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht).
• Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?
49
Vt.-freie LokationsvergleicheVerteilungsfunktionen
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-5 -4 -3 -2 -1 0 1 2 3 4 5 6
50
Vt.-freie Lokationsvergleiche
• Einseitige Hypothesen:– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und
für mind. ein x gilt: F1(x) < F2(x)
– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und für mind. ein x gilt: F1(x) > F2(x)
• Zweiseitig Hypothese: – H0: F1(x) = F2(x) gegen H1: F1(x) F2(x)
51
Vt.-freie Lokationsvergleiche
• Vorgehensweise: • Gemeinsame Rangzahlen der beiden
Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2
• Teststatistik:
• Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)
1n
n1,n1 ii=1
W = r
52
Vt.-freie Lokationsvergleiche
• Entscheidung: – H0: F1(x) F2(x),
H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α
– H0: F1(x) F2(x),
H0 verwerfen falls Wn1,n2 < Wn1;n2;α
• Zweiseitig Hypothese: – H0: F1(x) = F2(x)
H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2
53
Vt.-freie Lokationsvergleiche
• Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht?
Behand-lung Rangz.
Behand-lung Rangz. Kontrolle Rangz. Kontrolle Rangz.
27 19 26,5 18 18 7 17 6
34 22,5 22 14 14,5 5 18,5 8
20,5 12 24,5 17 13,5 3 9,5 1
29,5 21 34 22,5 12,5 2 14 4
20 10,5 35,5 24 23 15
28 20 19 9 24 16
20 10,5 21 13
54
Vt.-freie Lokationsvergleiche
• Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05.
• Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220.
• Kritischer Wert: wn1;n2;0,95 = 191• Entscheidung: 220 > 191 => H0 ablehnen.
D.h. die Behandlung führt zu einem signifikant höheren Gewicht.