1 STATISIK LV Nr.: 1852 WS 2005/06 22. Dezember 2005.

1

STATISIK

LV Nr.: 1852

WS 2005/06

22. Dezember 2005

2

Anteilstests

• Einstichprobentest für den Anteilswert – Hat der Anteil einen bestimmten Wert, bzw.

liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer

einzigen Stichprobe.

• Zweistichprobentest für Anteilswerte– Unterscheiden sich die Anteile zweier

unabhängiger Gruppen?– Entscheidung basiert auf zwei Stichproben

3

Anteilstest - Einstichprobentest

Einstichprobentest für den Anteilswert:

• Einseitige Hypothesen: – H0: θ ≤ θ0 gegen H1: θ > θ0

– H0: θ ≥ θ0 gegen H1: θ < θ0

• Zweiseitige Hypothesen: – H0: θ = θ0 gegen H1: θ ≠ θ0

4


Vorgehensweise:

• Teststatistik bestimmen

• Testverteilung bestimmen

• Entescheidung über Annahme oder Ablehnung von H0.

5


• Anteilswert einer Stichprobe: P = x / n

• Unter H0 ist P, wenn nθ0(1-θ0) ≥ 9, approximativ N-Vt., mit Parametern – E(P) = θ0

– Var(P) = θ0(1-θ0)/n · [(N-n)/(N-1)]• Vernachlässigung der Endlichkeitskorrektur wenn

n/N < 0,05.

6


Prüfgröße / Teststatistik:

• Standardisierte Zufallsvariable Z:

0

P

P-θZ=

σ

7


Testverteilung:

• Teststatistik Z ist unter H0 N(0,1) verteilt.

• Daher: Testverteilung ist die Standardnormalverteilung.

8


Kritischer Bereich:• α festlegen (z.B. α = 0,05) • Kritischer Wert: α – Quantil der N(0,1)-Vt. • Entscheidung: H0 ablehnen, wenn Teststatistik im

kritischen Bereich. p-Wert: • α festlegen (z.B. α = 0,05)• p-Wert: Niveau, bei dem der Test gerade noch die

H0 ablehnen würde. • Entscheidung: H0 ablehnen, wenn p-Wert < α

9


Bsp: Anteil der weiblichen Studenten

• Approximation durch N-Vt. zulässig, da unter H0 nθ0(1-θ0) = 18,25 ≥ 9.

• 1. Einseitige Tests:– H0: pw ≤ 0,5 gegen H1: pw > 0,5 und α=0,05

– H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05

• 2. Zweiseitiger Test: – H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05

10



• H0: pw 0,5 gegen H1: pw > 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =

0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritischer Wert 1,64– p-Wert: 0,1461

11



• H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =

0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritischer Wert -1,64– p-Wert: 0,8539

12



• H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =

0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritische Werte -1,96

und +1,96 – p-Wert: 0,2922

13

Anteilstest - Zweistichprobentest

Test für die Differenz zweier Anteilswerte

• Stichprobe 1: Anteil P1 = x / n1

• Grundgesamtheit 1: Anteil θ1

• Stichprobe 2: Anteil P2 = x / n2

• Grundgesamtheit 2: Anteil θ2

• H0: Anteilswerte der beiden Grundgesamtheiten sind gleich.

H0: θ1 = θ2 (=θ) gegen H1: θ1 ≠ θ2

14


Teststatistik:

(Unter Vernachlässigung der Endlichkeitskorrektur und wenn Voraussetzungen für eine N-Vt. erfüllt sind)

• Verteilung der Teststatistik unter H0:

Z ~ N(0,1)

1 2

1 2

1 2

(P -P )Z=

n +nθ(1-θ)

n n

15


Entscheidung:

• Bestimmung des kritischen Bereichs. – Z > |c| lehne H0 ab

• Bestimmung des p-Wertes– p-Wert < α lehne H0 ab

• Interpretation: Wird H0 abgelehnt, dann sind die Anteile in den beiden Gruppen signifikant verschieden.

16

Test für arithmetisches Mittel

• Einstichprobentest für das arithm. Mittel: – Hat das arithm. Mittel einen bestimmten Wert,

bzw. liegt es in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer


• Zweistichprobentest für das arithm. Mittel– Unterscheiden sich die Mittelwerte zweier

Gruppen?– Entscheidung basiert auf zwei Stichproben

17


• Einstichprobentest für das arithm. Mittel: – Varianz der Grundgesamtheit ist bekannt.– Varianz der Grundgesamtheit ist unbekannt.

18


• Einstichprobentest für das arithm. Mittel:

• Zweiseitige Hypothese:

H0: µ = µ0 gegen H1: µ ≠ µ0

• Festlegen des Signifikanzniveaus

19


• Varianz der Grundgesamtheit ist bekannt.

• Unter H0 ist das arithm. Mittel der Stichprobe N-Vt. mit E=µ und Var=σ²/n

• Teststatistik:

• Testverteilung: N(0,1)n

σμX

σ

μXZ

X

20


• Bestimmung des kritischen Bereichs bzw. Berechung des p-Wertes

• Entscheidung

• Interpretation

21


• Varianz der Grundgesamtheit ist unbekannt.

• Schätzwert für unbekanntes σ²: Stichprobenvarianz s².

• Teststatistik:

• Testverteilung: tn-1

• t-Test

n

sμX

T

22


• Bestimmung des kritischen Bereichs: kritische Werte: α/2-Quantile der t-Vt., symmetrische Vt. daher tc

u = -tco

• Berechung des p-Wertes:

• Entscheidung:

|t| > tc, lehne H0 ab

p-Wert < α, lehne H0 ab

• Interpretation

23


Bsp. mittlere Körpergröße (n = 73)

• H0: µ = 170 gegen H1: µ 170, α = 0,05

• Arithm. Mittel der Stpr: 173,4

• Standardabweichung der Stichprobe: 9,5

• Teststatistik T = (173,4-170) / 9,5/73 = 3,1

• Kritische Werte: -1,96 und +1,96

• p-Wert: 0,0021

• Mittlere Körpergröße ist signifikant 170

24


• Zweistichprobentest für die Differenz zweier arithmetischer Mittel– Unterscheiden sich die Mittelwerte zweier

Grundgesamtheiten?– Unterscheiden sich die Mittelwerte zweier

verbundener Stichproben?

25


• Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen.

• Voraussetzung: – Stichproben unabhängig– Stichproben stammen aus einer N-vt.

Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig

– Endlichkeitskorrektur ist vernachlässigbar

26


• Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht.

• Varianzen verschieden, σ1² σ2² :

• Teststatistik:

• Testverteilung: Z asymptotisch N(0,1)-vt.

2

22

1

21

21

n

S

n

S

)XX(Z

27


• Varianzhomogenität, σ1² = σ2² = σ²:

• Teststatistik:

wobei

• Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden

21

21

21

nn

nnS

)XX(T

2nn

1)S(n1)S(nS

21

222

211

28


• Verbundene Stichproben (abhängige oder gepaarte Stpr.)– Tritt auf, wenn z.B. die Merkmalsausprägungen

der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen.

• Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.

29


• Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD²

• Teststatistik:

• Testverteilung: T~tv mit v=n-1

n

SδD

TD

n n2

i D ii 1 i 1

1 1D D und S (D D)

n n 1

30

Test für Varianz

• Einstichprobentest für die Varianz: – Hat die Varianz einen bestimmten Wert, bzw.

liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer


• Zweistichprobentest für die Varianz– Unterscheiden sich die Varianzen zweier

Gruppen?– Entscheidung basiert auf zwei Stichproben

31

Test für Varianz

Einstichprobentest für die Varianz:• Annahme: Grundgesamtheit normalverteilt• H0: σ² = σ0² gegen H1: σ² σ0²• Teststatistik:

• Testverteilung: χ²v mit v=n-1• Entscheidung:

– χ² > χ²co oder χ² < χ²c

u, lehnen H0 ab – p-Wert < α, lehne H0 ab

2

22

σ

1)s(nχ

32

Test für Varianz

Zweistichprobentest für den Quotienen zweier Varianzen:

• Annahme: Grundgesamtheit normalverteilt• H0: σ1² = σ2² gegen H1: σ1² σ2²• Teststatistik:

• Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1• Entscheidung:

– F > Fco oder F < Fc

u, lehnen H0 ab – p-Wert < α, lehne H0 ab

22

21

S

SF

33

Nichtparametrische Tests

• Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist).

• Rangtests für Lageparameter– Zeichentest– Wilcoxon Vorzeichenrangtest für das

Symmetriezentrum einer Verteilung

• Verteilungsfreie Lokationsvergleiche– Wilcoxon Rangsummentest oder

Mann-Whitney U Test

34

Rangtests für Lageparameter

Zeichentest (Ordinalskala ausreichend)– Annahme: unabhängige Beobachtungen x1, ..., xn

stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F.

• Test für den Median ξ0,5 der Grundgesamtheit

• Einseitige Hypothesen:– H0: ξ0,5 ξ0 gegen H1: ξ0,5 > ξ0

– H0: ξ0,5 ξ0 gegen H1: ξ0,5 < ξ0

• Zweiseitige Hypothese: – H0: ξ0,5 = ξ0 gegen H1: ξ0,5 ξ0

35


• Vorgehensweise:

• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0

• Bestimmung von yi

– yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0

36


• Teststatistik:

Unter H0 ist T ~ B(n, ½) • Approximation durch N(0,1):

• Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung

n

1iiyT

n2

12

ny

2

11

2

1n

2

1ny

Z

n

1ii

n

1ii

37


• Beispiel für Zeichentest (Hartung, S. 243):– Alter von Frauen bei der Geburt des ersten

Kindes. H0: ξ0,5 25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern.

i Alter xi xi‘ yi

1 30,6 5,6 1

2 17,8 -7,2 0

: : : :

35 20 -5 0

36 23,5 -1,5 0

38


• Beispiel

• Approximation durch N-Vt

• Entscheidung (bei α=0,05): Z < 1,645

Lehne H0: ξ0,5 25 nicht ab.

n

ii 1

1y 36

20 182Z 0,667

1 3362

39


• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit – Basiert auf Rangzahlen der Beobachtungen– Annahme: n unabhängige Beobachtungen

(x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F

• Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?

40

Rangtests für LageparameterVerteilungsfunktion F(x)

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-3 -2 -1 0 1 2 3

F(ξ0-y)

1-F(ξ0+y)

ξ0 ξ0+yξ0-y

41


• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit

• Einseitige Hypothesen:– H0: F symmetrisch um ξ ξ0

– H0: F symmetrisch um ξ ξ0

• Zweiseitige Hypothese: – H0: F symmetrisch um ξ = ξ0

42


• Vorgehensweise:

• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0

• Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert).

• Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i

43


• Teststatistik:

mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0

• Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)

n

1iiiRcT~

44


• Approximation durch N(0,1) Verteilung:

• Teststatistik T* (keine Bindungen):

mit E T+ = n(n+1) / 4

und Var T+ = n(n+1)(2n+1) / 24(Beim Auftreten von Bindungen: T* laut Hartung, S. 246)

• Vergleich von T* mit kritischen Werten der N(0,1) Verteilung

+ +*

+

T -E TT =

Var T

45


• Beispiel Wilcoxon VorzeichenrangtestPsychologischer Test, Bewertung durch Punkte xi

H0: F symmetrisch um ξ = ξ0 = 61, α = 0,05

• Teststatistik:

ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0

n

1iiiRcT~

46


• Beispiel:

• T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53

i xi xi‘ = xi- ξ0 Ri R� i

1 72 11 10,5 10,5

2 55 -6 3 -3

3 67 6 3 3

4 53 -8 7 -7

5 69 8 7 7

6 71 10 9 9

7 55 -6 3 -3

8 68 7 5 5

9 65 4 1 1

10 72 11 10,5 10,5

11 69 8 7 7

47


• Beispiel:

• Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54

• Entscheidung:

w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975

Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.

48

Vt.-freie Lokationsvergleiche

• Wilcoxon Rangsummentest oder Mann-Whitney U Test

• Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht).

• Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?

49

Vt.-freie LokationsvergleicheVerteilungsfunktionen

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-5 -4 -3 -2 -1 0 1 2 3 4 5 6

50


• Einseitige Hypothesen:– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und

für mind. ein x gilt: F1(x) < F2(x)

– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und für mind. ein x gilt: F1(x) > F2(x)

• Zweiseitig Hypothese: – H0: F1(x) = F2(x) gegen H1: F1(x) F2(x)

51


• Vorgehensweise: • Gemeinsame Rangzahlen der beiden

Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2

• Teststatistik:

• Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)

1n

n1,n1 ii=1

W = r

52


• Entscheidung: – H0: F1(x) F2(x),

H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α

– H0: F1(x) F2(x),

H0 verwerfen falls Wn1,n2 < Wn1;n2;α

• Zweiseitig Hypothese: – H0: F1(x) = F2(x)

H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2

53


• Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht?

Behand-lung Rangz.

Behand-lung Rangz. Kontrolle Rangz. Kontrolle Rangz.

27 19 26,5 18 18 7 17 6

34 22,5 22 14 14,5 5 18,5 8

20,5 12 24,5 17 13,5 3 9,5 1

29,5 21 34 22,5 12,5 2 14 4

20 10,5 35,5 24 23 15

28 20 19 9 24 16

20 10,5 21 13

54


• Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05.

• Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220.

• Kritischer Wert: wn1;n2;0,95 = 191• Entscheidung: 220 > 191 => H0 ablehnen.

D.h. die Behandlung führt zu einem signifikant höheren Gewicht.

Date post:	06-Apr-2015
Category:	Documents
Upload:	heiner-apel
View:	106 times
Download:	3 times

1 STATISIK LV Nr.: 1852 WS 2005/06 22. Dezember 2005.

Documents