+ All Categories
Home > Documents > Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity...

Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity...

Date post: 18-Oct-2020
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
35
Statistik II f¨ ur Betriebswirte Vorlesung 3 Dr. Andreas W¨ unsche TU Bergakademie Freiberg Institut f¨ ur Stochastik 28. Oktober 2019 Dr. Andreas W¨ unsche Statistik II f¨ ur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 1
Transcript
Page 1: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Statistik II fur BetriebswirteVorlesung 3

Dr. Andreas Wunsche

TU Bergakademie FreibergInstitut fur Stochastik

28. Oktober 2019

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 1

Page 2: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

4.3.2 Tests fur zwei verbundene Stichproben

I Liegen zwei Stichproben vor, deren Werte einander paarweisezugeordnet sind, spricht man von verbundenen Stichproben.

I Diese entstehen z.B. dann, wenn man jeweils zwei Merkmale an einund demselben statistischen Objekt beobachtet.

I Beispiele:I Messwerte fur die Wirkungen jeweils zweier Medikamente fur jeweils

ein und denselben Patienten;I Wert der Bestellungen einer Kundengruppe vor (1. Stichprobe) und

nach (2. Stichprobe) einer Werbeaktion.

I Die mathematische Modellierung erfolgt uber zwei endliche FolgenX1,X2, . . . ,Xn und Y1,Y2, . . . ,Yn von jeweils n Zufallsgroßen.

I Dabei sind die Zufallsgroßen innerhalb einer Folge stochastischunabhangig, aber fur jedes i = 1, . . . , n konnen die ZufallsgroßenXi und Yi abhangig sein.

I Eine verbundene (mathematische) Stichprobe wird also durchunabhangige Zufallsvektoren (X1,Y1), . . . , (Xn,Yn) modelliert.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 2

Page 3: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Erwartungswertvergleich verbundener normalverteilterStichproben

I Geg.: zwei abh. Merkmale X ∼ N(µX , σ2X ) , Y ∼ N(µY , σ

2Y ) ;

entsprechend verbundene Stichprobe vom Umfang n , d.h.(X1,Y1), . . . , (Xn,Yn) .

I Grundlage: Ist der Zufallsvektor (X ,Y ) normalverteilt, dann ist dieDifferenz D = X − Y normalverteilt mit dem Erwartungswert

µD = ED = EX − EY = µX − µY .

I Ein Test zum Beispiel mit

H0 : µX = µY , HA : µX 6= µY ,

kann dann als Test

H0 : µD = 0 , HA : µD 6= 0 ,

fur die normalverteilte Stichprobe D1, . . . ,Dn durchgefuhrt werden(Einstichproben-t-Test).

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 3

Page 4: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Vorzeichentest fur verbundene Stichprobe

I Voraussetzung: Verbundene Stichprobe (X1,Y1), . . . , (Xn,Yn) , sodass die Differenzzufallsgroßen Di = Xi − Yi eine stetigeVerteilungsfunktion FD besitzen.

I Man bildet Differenzen: Di = Xi − Yi , i = 1, . . . , n .

I Hypothesen: H0 : D0.5 = 0 , HA : D0.5 6= 0 (zweiseitiger Test).

I Man verwendet den Vorzeichentest von oben zur Stichprobe derDifferenzen D1, . . . ,Dn mit Median gleich 0 .

I Treten Stichprobenwerte auf, die mit dem Median ubereinstimmen,konnen diese (z.B.) weggelassen werden. Dann bleibt der Testkonservativ, d.h. die Irrtumswahrscheinlichkeit 1. Art wird nichtvergroßert.

I Vorzeichentests konnen auch fur nichtstetige Zufallsgroßendurchgefuhrt werden. Dann testet man z.B. die HypotheseH0 : P(D > 0) = P(D < 0) .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 4

Page 5: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.5: Returns von 2 Fonds

I Returns in % von 2 Fonds (Fond A, Fond B) in 15 Monaten.

I Daten: (Quelle: Aczel, Sounderpandian: Complete BusinessStatistics, 2006, S.645)

A: 12 11 14 10 12 8 16 13 12 10 6 9 16 13 10

B: 14 15 16 9 10 8 18 12 17 13 10 12 15 19 14

Sign(A−B): − − − + + − + − − − − + − −

I Aufgabe: Durchfuhrung des Vorzeichentests zur Untersuchung, obbeide Fonds

”gleich“ sind.

I Hypothesen: H0 : D0.5 = 0 , HA : D0.5 6= 0 mit D = A− B .

I 4 Monate A > B ; 1 Monat A = B ; 10 Monate A < B .

I Damit ist t = 4.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 5

Page 6: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.5: Returns von 2 Fonds

I Kritischer Bereich fur n′ = 14 = 15− 1 , α = 0.05 :

K = {0, 1, 2} ∪ {12, 13, 14} .

I t = 4 6∈ K =⇒ H0 wird angenommen =⇒ Zwischen denbeiden Fonds gibt es keine signifikanten Unterschiede.

I in Statgraphics :

Hypothesis Tests for Fond A - Fond B

sign test

Null hypothesis: median = 0

Alternative: not equal

Number of values below hypothesized median: 10

Number of values above hypothesized median: 4

Large sample test statistic = 1,33631 (continuity correction applied)

P-Value = 0,181449

Do not reject the null hypothesis for alpha = 0,05.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 6

Page 7: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Vorzeichen-Rangtest nach Wilcoxon

I Mit dem Vorzeichen-Rangtest (Symmetrie-Test) nach Wilcoxon(oder Wilcoxon-Vorzeichen-Rangtest) kann man die Verteilung einerZufallsgroße auf Symmetrie untersuchen.

I Die Verteilung von X ist symmetrisch zum Punkt M, falls furbeliebige x ∈ R gilt: P(X < M − x) = P(X > M + x) .In diesem Fall ist M auch der Median der Zufallsgroße.

I Ist fur zwei verbundene Stichproben die Differenzzufallsgroßesymmetrisch zum Median verteilt, kann der Test fur stetigeDifferenzzufallsgroßen wie der einfache Vorzeichentest furverbundene Stichproben durchgefuhrt werden, d.h. z.B.H0 : D0.5 = 0 , HA : D0.5 6= 0 .

I Die Gute dieses Tests ist besser als die Gute eines entsprechendeneinfachen Vorzeichentests, da hier die Große der Differenzen mitberucksichtigt wird.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 7

Page 8: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Wilcoxon-Vorzeichen-Rangtest: Rangzahlen

I Vorgehen: Man ordnet die Betrage der Differenzen und vergibtRangzahlen R+

i . Dabei erhalt der kleinste Wert die Rangzahl 1und der großte Wert die Rangzahl n . Tritt ein Wert mehrfach auf,erhalten (z.B.) alle diese Werte den arithmetischen Mittelwert derzugehorigen Ordnungsnummern als Rangzahl.

I Außerdem verwendet man die Indikatorgroßen

Zi :=

{1 , falls Di > 0 ,0 , falls Di < 0 .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 8

Page 9: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.6: Bestellungen vor und nach einer Werbeaktion

I Wert von Bestellungen vor und nach einer Werbeaktion:

vor (Xi ) 171.2 332.9 230.6 200.7 238.7

nach (Yi ) 238.7 260.1 203.1 133.2 171.2

Differenz (Di = Xi − Yi ) -67.5 72.8 27.5 67.5 67.5

Betrage Differenz 67.5 72.8 27.5 67.5 67.5

Ordnungsnummern 2-4 5 1 2-4 2-4

Rangzahlen (R+i ) 3 5 1 3 3

Indikatorgroßen Zi 0 1 1 1 1

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 9

Page 10: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Wilcoxon-Vorzeichen-Rangtest: Testgroße, krit. Bereich

I Testgroße: T = W+n :=

n∑i=1

R+i · Zi .

I Es giltn∑

i=1

R+i =

n∑i=1

i =n(n + 1)

2.

I Kritischer Bereich: K = {t : t ≤ w+n;α/2} ∪ {t : t ≥ w+

n,1−α/2} .

I Die Quantile w+n;α/2 und w+

n,1−α/2 kann man aus Tabellen ablesen

(z.B. im Anhang der Formelsammlung).

I Es gilt w+n,1−α/2 =

n(n + 1)

2− w+

n;α/2 .

I Fur große n (n ≥ 20) gilt: T =W+

n −n(n+1)

4√n(n+1)(2n+1)

24

ist naherungsweise standardnormalverteilt ⇒ Quantile derStandardnormalverteilung konnen genutzt werden.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 10

Page 11: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.6: Bestellungen vor und nach einer Werbeaktion

I Wert von Bestellungen vor und nach einer Werbeaktion:

vor (Xi ) 171.2 332.9 230.6 200.7 238.7

nach (Yi ) 238.7 260.1 203.1 133.2 171.2

Differenz (Di = Xi − Yi ) -67.5 72.8 27.5 67.5 67.5

Betrage Differenz 67.5 72.8 27.5 67.5 67.5

Rangzahlen (R+i ) 3 5 1 3 3

Indikatorgroßen Zi 0 1 1 1 1

I H0 : D0.5 = 0 , HA : D0.5 6= 0 ; α = 0.1 .

I Aus der Tabelle: w+5;0.95 = 5·6

2 − w+5;0.05 = 15− 0 = 15

⇒ K = {0} ∪ {15} .

I W+5 = 3 + 1 + 5 + 3 = 12 6∈ K ⇒ H0 wird nicht abgelehnt, die

Unterschiede sind nicht signifikant.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 11

Page 12: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

4.4 Verteilungstests

I Eine weitere Klasse von Tests beschaftigt sich mit der Prufung, obdie Werte der Stichprobe aus einer Grundgesamtheit mit einerspeziellen hypothetischen Verteilungsfunktion stammen.

I Ausfuhrlicher wird hier der χ2−Anpassungstest behandelt.

I Kurz vorgestellt werden auch der Kolmogorow-Smirnow-Test (auchKolmogorow-Anpassungstest genannt) und der Shapiro-Wilk-Test.

I Weitere Tests, die zum Teil fur ganz bestimmte Typen vonVerteilungsfunktionen entwickelt wurden, kann man in der Literaturfinden.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 12

Page 13: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Der χ2−Anpassungstest

I Test, ob die vorliegende Stichprobe aus einer Grundgesamtheit miteiner hypothetischen Verteilungsfunktion F0 entstammt .

I Prinzipielles Vorgehen:I Klasseneinteilung der Stichprobe;I Vergleich mit der hypothetischen Verteilung;I falls die Abweichungen zu groß sind, erfolgt eine Ablehnung der

Nullhypothese.

I Dieser Test ist ein asymptotischer Test, d.h. man rechnet mit derasymptotischen Verteilung (fur n→∞) der Testgroße unter H0 .

I Hypothesen:

H0 : F (x) = F0(x) , x ∈ R , F0 ist eine Verteilungsfunktion,

z.B. F0(x) = Φ

(x − µσ

)falls X ∼ N(µ, σ2) ;

HA : F (x) 6= F0(x) fur mindestens ein x ∈ R .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 13

Page 14: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

χ2−Anpassungstest Grafik

Tests for Normality for Nennmaß

Test Statistic P-Value

Shapiro-Wilk W 0,979963 0,4061

Goodness-of-Fit Tests for Nennmaß

Kolmogorov-Smirnov Test

Normal

DPLUS 0,0485841

DMINUS 0,0550786

DN 0,0550786

P-Value 0,753039

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 14

Page 15: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

χ2−Anpassungstest – Testgroße T

I Einteilung der gesamten Merkmalsachse in k KlassenA1 = (−∞, a1),A2 = [a1, a2), . . . ,Ak = [ak−1,∞) .

I Bestimmung der absoluten Klassenhaufigkeiten H1,H2, . . . ,Hk

(Anzahl der Stichprobenwerte in der jeweiligen Klasse).

I Bestimmung der theoretischen Wahrscheinlichkeiten fur dieKlassenzugehorigkeiten unter der Annahme der Gultigkeit von H0 ,

p1 = PH0(A1) = PH0(X < a1) = F0(a1) ,

p2 = PH0(A2) = PH0(a1 ≤ X < a2) = F0(a2)− F0(a1) ,

. . .

pk = PH0(Ak) = PH0(ak−1 ≤ X ) = 1− F0(ak−1).

I Testgroße: T =k∑

j=1

(Hj − npj)2

npj(”χ2−Abstandsfunktion“),

diese Große ist unter H0 asymptotisch χ2k−1−verteilt.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 15

Page 16: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

χ2−Anpassungstest – Kritischer Bereich

I Kritischer Bereich: K = {t ∈ R : t > χ2k−1;1−α} .

I Bemerkungen:I Der Stichprobenumfang n sollte nicht zu klein sein.

I Die Anzahl und die Große der Klassen Aj sollten so sein, dassnpj = nPH0(X ∈ Aj) > 1 fur alle j = 1, . . . , k gilt (und zusatzlichnpj ≥ 5 fur mindestens 80% der Klassen; ggf. Klassenzusammenfassen oder gesamte Klasseneinteilung andern).

I Bei diskreten Verteilungen und nicht zu kleinenEinzelwahrscheinlichkeiten sollte pro Merkmalswert jeweils eine Klassegewahlt werden.

I Modifikation:Unbekannte Parameter in der Verteilungsfunktion F0 konnen durch(Maximum-Likelihood-)Schatzungen ersetzt werden.Sind m Parameter zu schatzen, so ist anstelle derχ2k−1−Verteilung die χ2

k−m−1−Verteilung zu benutzen.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 16

Page 17: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.7: Test auf gerechten Wurfel

Anhand einer Stichprobe von n = 90 Wurfelergebnissen soll mitα = 0.05 getestet werden, ob der Wurfel gerecht ist, d.h. ob fur dieAugenzahl X gilt: H0 : pi = P(X = i) = 1/6 , i = 1, . . . , 6 .

● ● ● ● ● ●

1 2 3 4 5 6

05

1015

20

Würfel Beispiel 4.7

Augenzahl

abso

lute

Häu

figke

iten

●●

beobachtete Häfigkeitenerwartete Häufigkeiten

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 17

Page 18: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.7: Test auf gerechten Wurfel

I Daten:Augenzahl 1 2 3 4 5 6

Hj 19 13 14 12 17 15

npj 15 15 15 15 15 15

I Wert der Testgroße:

t =(19− 15)2

15+

(13− 15)2

15+

(14− 15)2

15+

(12− 15)2

15+

(17− 15)2

15+

(15− 15)2

15

=16

15+

4

15+

1

15+

9

15+

4

15+

0

15=

34

15= 2.26 .

I Kritischer Bereich: K = (χ25;0.95 ,∞) = (11.07 ,∞) .

I Testentscheidung: t 6∈ K , H0 wird nicht abgelehnt.

I Testergebnis: Die Abweichungen der beobachteten Haufigkeitenvon einer diskreten Gleichverteilung sind nicht signifikant.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 18

Page 19: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.7: Statgraphics

Goodness-of-Fit Tests for Würfel

Chi-Square Test

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

at or below 1,0 19 15,00 1,07

2,0 2,0 13 15,00 0,27

3,0 3,0 14 15,00 0,07

4,0 4,0 12 15,00 0,60

5,0 5,0 17 15,00 0,27

6,0 15 15,00 0,00

Chi-Square = 2,26667 with 3 d.f. P-Value = 0,518933

I Testentscheidung: p = 0.519 > 0.05 = α , H0 wird nichtabgelehnt.

I Testergebnis: Die Abweichungen der beobachteten Haufigkeitenvon einer diskreten Gleichverteilung sind nicht signifikant.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 19

Page 20: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.8: technisches Nennmaß

I X . . . technisches Nennmaß;

X ∼ N(µ, σ2) wird getestet.

I H0 : F (x) = Φ

(x − µσ

), x ∈ R;

HA : F (x) 6= Φ

(x − µσ

)fur mindestens ein x ∈ R .

I α = 0.05 .

I n = 150 Messungen,

µ = x = 40.43 , σ = s = 5.93 ⇒ m = 2 Schatzparameter.

Sei k = 8 (Anzahl der Klassen); zj =aj − x

s, j = 1, . . . , k .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 20

Page 21: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.8: technisches Nennmaß – Daten und Test

I

aj Hj zj Φ(zj) pj npj

. . . 30.5 6 -1.67 0.0475 0.0475 7.1230.5 . . . 33.5 13 -1.17 0.1210 0.0735 11.0333.5 . . . 36.5 17 -0.66 0.2546 0.1336 20.0436.5 . . . 39.5 30 -0.16 0.4364 0.1818 27.2739.5 . . . 42.5 30 0.35 0.6368 0.2004 30.0642.5 . . . 45.5 28 0.85 0.8023 0.1655 24.8345.5 . . . 48.5 13 1.36 0.9131 0.1108 16.6148.5 . . . 13 0.0869 13.04

150 1.0000

I t =k∑

j=1

(Hj − npj)2

npj= 2.45 , K = (χ2

8−2−1;0.95 = 11.1,∞) ,

t 6∈ K , H0 wird nicht abgelehnt, zum Niveau von 5% sind dieAbweichungen zur Normalverteilung nicht signifikant.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 21

Page 22: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.8: Statgraphics

Goodness-of-Fit Tests for Nennmaß

Chi-Square Test

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

at or below 30,5 6 7,05 0,16

30,5 33,5 13 11,14 0,31

33,5 36,5 17 19,88 0,42

36,5 39,5 30 27,61 0,21

39,5 42,5 30 29,83 0,00

42,5 45,5 28 25,08 0,34

45,5 48,5 13 16,41 0,71

above 48,5 13 12,99 0,00

Chi-Square = 2,14148 with 5 d.f. P-Value = 0,829243

Goodness-of-Fit Tests for Nennmaß

Chi-Square Test

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

at or below 30,5 6 7,05 0,16

30,5 33,5 13 11,14 0,31

33,5 36,5 17 19,88 0,42

36,5 39,5 30 27,61 0,21

39,5 42,5 30 29,83 0,00

42,5 45,5 28 25,08 0,34

45,5 48,5 13 16,41 0,71

above 48,5 13 12,99 0,00

Chi-Square = 2,14148 with 5 d.f. P-Value = 0,829243

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 22

Page 23: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Der Kolmogorow-Smirnow-Test

I Der Kolmogorow-Smirnow-Test (Kolmogorow-Anpassungstest)basiert auf der empirischen Verteilungsfunktion Fn zur Stichprobe(vom Umfang n):

Fn(x) :=Anzahl Stichprobenwerte < x

n, x ∈ R .

I Voraussetzung: Die hypothetische Verteilungsfunktion F0 iststetig und enthalt keine unbekannten Parameter.

I Hypothesen:H0 : F (x) = F0(x) , x ∈ R ;

HA : F (x) 6= F0(x) fur mindestens ein x ∈ R .

I Testgroße: T = supx∈R|Fn(x)− F0(x)| .

I Der Test wird gunstigerweise mit einem Computerprogrammdurchgefuhrt.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 23

Page 24: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Kolmogorow-Smirnow-Test im Beispiel 4.8:

x

25 30 35 40 45 50 55

0.0

0.2

0.4

0.6

0.8

1.0

empirische Verteilungsfunktionhypothetische Verteilungsfunktion

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 24

Page 25: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.8: Statgraphics

Tests for Normality for Nennmaß

Test Statistic P-Value

Shapiro-Wilk W 0,979963 0,4061

Goodness-of-Fit Tests for Nennmaß

Kolmogorov-Smirnov Test

Normal

DPLUS 0,0485841

DMINUS 0,0550786

DN 0,0550786

P-Value 0,753039

p = 0.753039 > 0.05 = α =⇒ H0 wird nicht abgelehnt, zum Niveauvon 5% sind die Abweichungen zur Normalverteilung nicht signifikant.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 25

Page 26: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Bemerkungen zum Kolmogorow-Smirnow-Test

I Der Kolmogorow-Smirnow-Test (kurz auch”K-S-Test“) ist im

Gegensatz zum χ2−Anpassungstest auch fur kleine Stichprobenanwendbar und das Testergebnis hangt nicht von einerKlasseneinteilung ab.

I Man kann einseitige Tests mit dem K-S-Test durchfuhren.

I Es gibt Verallgemeinerungen des K-S-Tests, bei denen stattfestgelegter Parameterwerte der hypothetischen Verteilung F0geeignete Schatzwerte eingesetzt werden(z.B. der Lilliefors-Test im Fall von Normalverteilungen).

I Man kann mit einer Version des K-S-Testes auch prufen, ob zweiStichproben aus einer Grundgesamtheit stammen, alsoubereinstimmende Verteilungen zugrundeliegen.

I Der K-S-Test kann auch fur diskrete Verteilungen genutzt werden,besitzt dann aber eine geringere Gute.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 26

Page 27: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Der Shapiro-Wilk-Test zur Normalverteilungsprufung

I Der Shapiro-Wilk-Test pruft ausschließlich, ob bei einer Stichprobeeine Normalverteilung vorliegt.

I Dieser Test besitzt eine hohe Gute, insbesondere auch im Fall vonkleinen Stichprobenumfangen.

I Grundlage des Tests sind bestimmte Eigenschaften derOrdnungsstatistiken einer Stichprobe aus einer normalverteiltenGrundgesamtheit.

I Der Test ist sehr rechenintensiv und sollte mit Statistik-Softwaredurchgefuhrt werden.

I Statgraphics-Ergebnis in Beispiel 4.8:

Tests for Normality for Nennmaß

Test Statistic P-Value

Shapiro-Wilk W 0,979963 0,4061

Goodness-of-Fit Tests for Nennmaß

Kolmogorov-Smirnov Test

Normal

DPLUS 0,0485841

DMINUS 0,0550786

DN 0,0550786

P-Value 0,753039

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 27

Page 28: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

4.5 χ2−Unabhangigkeitstest; Homogenitatstest

I Mit dem χ2−Unabhangigkeitstest uberpruft man, ob zwei MerkmaleX und Y stochastisch unabhangig sind, d.h. ob fur beliebige(zulassige) Mengen A ,B gilt:

P(X ∈ A ,Y ∈ B) = P(X ∈ A) · P(Y ∈ B) .

I Konkreter pruft man, ob die relativen Haufigkeiten (berechnet auseiner verbundenen Stichprobe) naherungsweise diese Produktregelerfullen.

I Hypothesen: H0 : X und Y sind stochastisch unabhangig,HA : X und Y sind abhangig.

I Verbundene Stichproben: x1 , x2 , . . . , xn ;y1 , y2 , . . . , yn .

I Einteilung der Merkmalsachsen in Klassen:fur X : A1, . . . ,Ak ; fur Y : B1, . . . ,B` .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 28

Page 29: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Kontingenztafel

I Absolute Haufigkeiten:Hij : Anzahl der Beobachtungen, bei denen das Merkmal X in derKlasse Ai und gleichzeitig das dazugehorige Merkmal Y in Bj

liegt.

I Randhaufigkeiten: Hi• =∑j=1

Hij , H•j =k∑

i=1

Hij .

I Kontingenztafel: X\Y B1 . . . B`A1 H11 H1` H1•...Ak Hk1 Hk` Hk•

H•1 H•` n

I Im Fall k = ` = 2 wird eine solche Tafel auch Vierfeldertafel oder2× 2−Felder-Tafel genannt. Sie wird haufig bei nominellenMerkmalen mit zwei Auspragungen (dichotome Merkmale) benutzt.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 29

Page 30: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

χ2−Unabhangigkeitstest – Testgroße, kritischer Bereich

I Testgroße: (”empirische Kontingenz“)

T =k∑

i=1

∑j=1

(Hij −

Hi•H•jn

)2Hi•H•j

n

.

I Fur eine Vierfeldertafel kann die Testgroße einfacher berechnetwerden durch

T =n (H11H22 − H12H21)2

H1•H2•H•1H•2.

I Kritischer Bereich: K = {t ∈ R : t > χ2(k−1)(`−1);1−α} .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 30

Page 31: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

χ2−Unabhangigkeitstest – Bemerkungen

I Von den Klassenhaufigkeiten sollten hochstens 20% kleiner als 5sein, aber alle mindestens gleich 1.

I Der χ2−Unabhangigkeitstest mit Hilfe einer Vierfeldertafel solltefur Stichprobenumfange n < 20 nicht verwendet werden (sondernder

”exakte Test von Fisher“).

I Fur 20 ≤ n ≤ 60 eignet sich die nach Yates korrigierte Teststatistik

T =n(|H11H22 − H12H21| − n

2

)2H1•H2•H•1H•2

.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 31

Page 32: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.9: Eignung versus Studienabschluss

I 30 Wirtschaftsingenieure (b1), 35 graduierte Betriebswirte (b2) und35 Diplomkaufleute (b3), die sich bei einem Unternehmen beworbenhaben, werden nach einer Eignungsprufung in die Kategorien

”geeignet“ (a1) und

”ungeeignet“ (a2) eingeordnet. Ist diese

Eignung vom Studienabschluss abhangig oder nicht:

I Merkmal X (Eignung), Merkmal Y (Studienabschluss); α = 0.05 .

I Hypothesen:H0 : Merkmal X und Merkmal Y sind unabhangig,HA : Merkmal X und Merkmal Y sind abhangig.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 32

Page 33: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.9: Eignung versus Studienabschluss

I Kontingenztafel: (Quelle: Bleymuller, Gehlert, Gulicher: Statistikfur Wirtschaftswissenschaftler, 2004, Abschn. 19.2.)

Y \X a1 a2b1 14 16 30b2 10 25 35b3 16 19 35

40 60 100

Frequency Table

geeignet ungeeignet Row Total

Wirtschaftsingenieure 14 16 30

12,00 18,00 30,00%

graduierte Betriebswirte 10 25 35

14,00 21,00 35,00%

Diplomkaufleute 16 19 35

14,00 21,00 35,00%

Column Total 40 60 100

40,00% 60,00% 100,00%

Cell contents:

Observed frequency

Expected frequency

Tests of Independence

Test Statistic Df P-Value

Chi-Square 2,937 2 0,2303

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 33

Page 34: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.9: Testgroße, Testentscheidung

I Kontingenztafel:

X\Y b1 b2 b3a1 14 10 16 40a2 16 25 19 60

30 35 35 100

I Berechnung Testgroße:Hi•H•j

n:

12 14 1418 21 21

t =(14− 12)2

12+

(10− 14)2

14+

(16− 14)2

14+

(16− 18)2

18+

(25− 21)2

21+

(19− 21)2

21= 2.937 < χ2

2;0.95 = 5.99 .

I Die Hypothese H0 :”A und B sind unabhangig“ wird nicht

abgelehnt, man kann nicht davon ausgehen, dass die Eignungsignifikant vom Studienabschluss abhangt.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 34

Page 35: Statistik II für Betriebswirte Vorlesung 3 · Large sample test statistic = 1,33631 (continuity correction applied) P-Value = 0,181449 Do not reject the null hypothesis for alpha

Beispiel 4.9: Statgraphics

Frequency Table

geeignet ungeeignet Row Total

Wirtschaftsingenieure 14 16 30

12,00 18,00 30,00%

graduierte Betriebswirte 10 25 35

14,00 21,00 35,00%

Diplomkaufleute 16 19 35

14,00 21,00 35,00%

Column Total 40 60 100

40,00% 60,00% 100,00%

Cell contents:

Observed frequency

Expected frequency

Tests of Independence

Test Statistic Df P-Value

Chi-Square 2,937 2 0,2303

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 35


Recommended