+ All Categories
Home > Documents > 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

Date post: 06-Apr-2015
Category:
Upload: liese-stitzel
View: 108 times
Download: 0 times
Share this document with a friend
68
1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006
Transcript
Page 1: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

1

STATISIK

LV Nr.: 1852

WS 2005/06

10. Jänner 2006

Page 2: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

2

Inhalt

• Wiederholung

• Nichtparametrische Tests

• Varianzanalyse– Einfache Varianzanalyse– Zweifache Varianzanalyse

• Nichtparametrische Varianzanalyse

Page 3: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

3

Wiederholung

• Statistische Tests (bisher):

• Verteilungsannahme (Normalverteilung)– Mittelwertstest (t-Test)– Anteilstest– Test der Varianz

Page 4: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

4

Nichtparametrische Tests

• Nichtparametrische Tests - v.a. wenn Annahme der Normalverteilung nicht erfüllt ist

• Rangtests für Lageparameter– Zeichentest– Wilcoxon Vorzeichenrangtest für das

Symmetriezentrum einer Verteilung

• Verteilungsfreie Lokationsvergleiche– Wilcoxon Rangsummentest oder

Mann-Whitney U Test

Page 5: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

5

Rangtests für Lageparameter

Zeichentest (Ordinalskala ausreichend)– Annahme: unabhängige Beobachtungen x1, ..., xn

stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F.

• Test für den Median ξ0,5 der Grundgesamtheit

• Einseitige Hypothesen:– H0: ξ0,5 ξ0 gegen H1: ξ0,5 > ξ0

– H0: ξ0,5 ξ0 gegen H1: ξ0,5 < ξ0

• Zweiseitige Hypothese: – H0: ξ0,5 = ξ0 gegen H1: ξ0,5 ξ0

Page 6: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

6

Rangtests für Lageparameter

• Vorgehensweise:

• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0

• Bestimmung von yi

– yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0

Page 7: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

7

Rangtests für Lageparameter

• Teststatistik:

Unter H0 ist T ~ B(n, ½) • Approximation durch N(0,1):

• Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung

n

1iiyT

n2

12

ny

2

11

2

1n

2

1ny

Z

n

1ii

n

1ii

Page 8: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

8

Rangtests für Lageparameter

• Beispiel für Zeichentest (Hartung, S. 243):– Alter von Frauen bei der Geburt des ersten

Kindes. H0: ξ0,5 25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern.

i Alter xi xi‘ yi

1 30,6 5,6 1

2 17,8 -7,2 0

: : : :

35 20 -5 0

36 23,5 -1,5 0

Page 9: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

9

Rangtests für Lageparameter

• Beispiel

• Approximation durch N-Vt

• Entscheidung (bei α=0,05): Z < 1,645

Lehne H0: ξ0,5 25 nicht ab.

n

ii 1

1y 36

20 182Z 0,667

1 3362

Page 10: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

10

Rangtests für Lageparameter

• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit – Basiert auf Rangzahlen der Beobachtungen– Annahme: n unabhängige Beobachtungen

(x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F

• Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?

Page 11: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

11

Rangtests für LageparameterVerteilungsfunktion F(x)

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-3 -2 -1 0 1 2 3

F(ξ0-y)

1-F(ξ0+y)

ξ0 ξ0+yξ0-y

Page 12: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

12

Rangtests für Lageparameter

• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit

• Einseitige Hypothesen:– H0: F symmetrisch um ξ ξ0

– H0: F symmetrisch um ξ ξ0

• Zweiseitige Hypothese: – H0: F symmetrisch um ξ = ξ0

Page 13: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

13

Rangtests für Lageparameter

• Vorgehensweise:

• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0

• Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert).

• Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i

Page 14: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

14

Rangtests für Lageparameter

• Teststatistik:

mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0

• Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)

n

1iiiRcT~

Page 15: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

15

Rangtests für Lageparameter

• Approximation durch N(0,1) Verteilung:

• Teststatistik T* (keine Bindungen):

mit E T+ = n(n+1) / 4

und Var T+ = n(n+1)(2n+1) / 24(Beim Auftreten von Bindungen: T* laut Hartung, S. 246)

• Vergleich von T* mit kritischen Werten der N(0,1) Verteilung

+ +*

+

T -E TT =

Var T

Page 16: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

16

Rangtests für Lageparameter

• Beispiel Wilcoxon VorzeichenrangtestPsychologischer Test, Bewertung durch Punkte xi

H0: F symmetrisch um ξ = ξ0 = 61, α = 0,05

• Teststatistik:

ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0

n

1iiiRcT~

Page 17: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

17

Rangtests für Lageparameter

• Beispiel:

• T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53

i xi xi‘ = xi- ξ0 Ri R� i

1 72 11 10,5 10,5

2 55 -6 3 -3

3 67 6 3 3

4 53 -8 7 -7

5 69 8 7 7

6 71 10 9 9

7 55 -6 3 -3

8 68 7 5 5

9 65 4 1 1

10 72 11 10,5 10,5

11 69 8 7 7

Page 18: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

18

Rangtests für Lageparameter

• Beispiel:

• Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54

• Entscheidung:

w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975

Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.

Page 19: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

19

Vt.-freie Lokationsvergleiche

• Wilcoxon Rangsummentest oder Mann-Whitney U Test

• Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht).

• Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?

Page 20: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

20

Vt.-freie LokationsvergleicheVerteilungsfunktionen

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-5 -4 -3 -2 -1 0 1 2 3 4 5 6

Page 21: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

21

Vt.-freie Lokationsvergleiche

• Einseitige Hypothesen:– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und

für mind. ein x gilt: F1(x) < F2(x)

– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und für mind. ein x gilt: F1(x) > F2(x)

• Zweiseitig Hypothese: – H0: F1(x) = F2(x) gegen H1: F1(x) F2(x)

Page 22: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

22

Vt.-freie Lokationsvergleiche

• Vorgehensweise: • Gemeinsame Rangzahlen der beiden

Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2

• Teststatistik:

• Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)

1n

n1,n2 ii=1

W = r

Page 23: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

23

Vt.-freie Lokationsvergleiche

• Entscheidung: – H0: F1(x) F2(x),

H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α

– H0: F1(x) F2(x),

H0 verwerfen falls Wn1,n2 < Wn1;n2;α

• Zweiseitig Hypothese: – H0: F1(x) = F2(x)

H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2

Page 24: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

24

Vt.-freie Lokationsvergleiche

• Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht?

Behand-lung Rangz.

Behand-lung Rangz. Kontrolle Rangz. Kontrolle Rangz.

27 19 26,5 18 18 7 17 6

34 22,5 22 14 14,5 5 18,5 8

20,5 12 24,5 17 13,5 3 9,5 1

29,5 21 34 22,5 12,5 2 14 4

20 10,5 35,5 24 23 15    

28 20 19 9 24 16    

20 10,5     21 13    

Page 25: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

25

Vt.-freie Lokationsvergleiche

• Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05.

• Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220.

• Kritischer Wert: wn1;n2;0,95 = 191• Entscheidung: 220 > 191 => H0 ablehnen.

D.h. die Behandlung führt zu einem signifikant höheren Gewicht.

Page 26: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

26

Varianzanalyse

Varianzanalyse od. ANOVA

• Frage: Hat ein Faktor Einfluss auf ein Merkmal?

• Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen

• Merkmal (durch Faktor beeinflusst): Metrische Größe

Page 27: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

27

Varianzanalyse

Varianzanalyse

• Einfache Varianzanalyse: Ein Faktor

• Zweifache Varianzanalyse: Zwei Faktoren

• …

Page 28: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

28

Varianzanalyse

• Test, für arithmetische Mittel von zwei oder mehr Grundgesamtheiten. – Test, ob die Differenz der arithmetischen Mittel

von zwei oder mehr als zwei Grundgesamtheiten signifikant von Null verschieden ist.

Page 29: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

29

Varianzanalyse

• Modellannahmen der Varinazanalyse: – Unabhängigkeit der Stichproben (i=1,…,r)

– Normalverteilung der Merkmale mit µi und σi²

– Varianzhomogenität (Homoskedastizität), d.h. σi² = σ²

Page 30: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

30

Varianzanalyse

• Nullhypothese: Alle Gruppen haben den gleichen Mittelwert µ

H0: µ1 = µ2 = … = µ

• Alternativhypothese: Nicht alle Gruppen haben den gleichen Mittelwert µ

H1: mindestens zwei µi sind ungleich

Page 31: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

31

Varianzanalyse

• Frage: Beeinflusst der Faktor (nominal-skalierte Größe) das Merkmal (metrisch-skalierte Größe)?

• Unter H0: µi = µ für alle i (i = 1,…,r Faktorstufen).

• Abweichung, die dem Faktor zuzuschreiben sind: αi = µi - µ (i = 1,…,r) heißen wahre Effekte auf der i-ten Ebene.

Page 32: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

32

Varianzanalyse

• Modell der einfachen Varianzanalyse:

• xij = µ + αi + eij – µ … Gesamtmittelwert

– αi … Effekt auf der i-ten Ebene

– eij … Versuchsfehler = die Abweichung eines zufällig aus der i-ten Ebene des Faktors herausgegriffenen Beobachtungswertes xik vom Mittelwert µi dieser Ebene.

eij = xij – µi = xij – (µ + αi)

Page 33: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

33

Varianzanalyse

• Beispiel: Zugfestigkeit von r = 3 Drahtsorten überprüfen, je Sorte 6 Proben, unabhängig voneinander und N(µi,σ²)-vt. Frage: Bestehen signifikante Unterschiede in der Zugfestigkeit?

i   Drahtsorte  

j 1 2 3

1 9 7,3 18

2 15,4 15,6 9,6

3 8,2 14,2 11,5

4 3,9 13 19,4

5 7,3 6,8 17,1

6 10,8 9,7 14,4

Page 34: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

34

Varianzanalyse

Vorgehensweise:

• Gesamtmittelwert aller Faktorstufen und Mittelwerte der Faktorstufen bestimmen

• Bestimmung der Abweichungen

• Zerlegung der Abweichungsquadratsumme

• Teststatistik und Testverteilung bestimmen

• Entscheidung, Interpretation

Page 35: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

35

Varianzanalyse

• Gesamtmittelwert über alle Faktorstufen r

• Mittelwerte der r Faktorstufen

inr

iji=1 j=1

1x = x

N

in

i ijj=1i

1x = x

n

Page 36: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

36

Varianzanalyse

• Beispiel: Drahtsorteni   Drahtsorte    

j 1 2 3 x..

1 9 7,3 18  

2 15,4 15,6 9,6  

3 8,2 14,2 11,5  

4 3,9 13 19,4  

5 7,3 6,8 17,1  

6 10,8 9,7 14,4  

xi. 9,1 11,1 15 11,7

Page 37: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

37

Varianzanalyse

• Abweichungen: Quadratsumme der Abweichungen (Sum of Squares)– Abweichungen der Beobachtungen vom

Gesamtmittelwert.

– Summe der Quadratischen Abweichungen– Bezeichnungen: SST (Total), SSG (Gesamt)

inr2

iji=1 j=1

SST= (x -x )

Page 38: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

38

Varianzanalyse

• Sum of Squares:– Abweichungen der Beobachtungen der

einzelnen Messreihen vom Mittelwert der jeweiligen Messreihe.

– Summe der Quadratischen Abweichungen des Restes, Maß für die nicht durch den Faktor beeinflusste Restvariabilität

– Bezeichnungen: SSW (Within), SSE (Error), SSR (Residual).

inr2

ij ii=1 j=1

SSW= (x -x )

Page 39: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

39

Varianzanalyse

• Sum of Squares:– Abweichungen der Mittelwerte der einzelnen

Messreihen vom Gesamtmittelwert.

– Mit Stichprobengröße multiplizierte Summe der Quadratischen Abweichungen der Stichprobenmittelwerte vom Gesamtmittelwert, also der beobachteten Effekte des Faktors.

– Bezeichnungen: SSB (Between), SSE (Explained), SSM (Model), SST (Treatment),

r2

i ii=1

SSB= n (x -x )

Page 40: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

40

Varianzanalyse

• Quadratsummenzerlegung:

• SST = SSB + SSW

• Interpretation: Gesamtvarianz (SST) setzt sich aus der Variation zwischen den Messreihen (SSB) und der Variation innerhalb der Messreihen (SSW) zusammen.

i in nr r r2 2 2

ij i i ij ii=1 j=1 i=1 i=1 j=1

(x -x ) n (x -x ) (x -x )

Page 41: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

41

Varianzanalyse

• Idee für Test: – Vergleich der Variation zwischen den

Messreihen mit der Variation innerhalb der Messreihen

– Ist die Variation zwischen den Messreihen größer als jene innerhalb der Messreihen, schließe auf Unterschied zwischen den Messreihen (Faktoreffekt).

Page 42: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

42

Varianzanalyse

• Teststatistik – Idee: – Aus den Beobachtungswerten werden zwei

voneinander unabhängige Schätzwerte für sW² und sB² für die Varianzen der Beobachtungswerte innerhalb und zwischen den Stichproben bestimmt.

– Liegen keine wahren Effekte vor (Gültigkeit von H0), sind sW² und sB² (bis auf zufällige Abweichungen) gleich.

– Bei Vorhandensein von wahren Effekten (H1) ist sB² systematisch größer als sW².

Page 43: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

43

Varianzanalyse

• Erwartungstreuer Schätzer für die Varianz innerhalb der Messreihen (Restvarianz):

• Erwartungstreuer Schätzer für die Varianz zwischen den Messreihen (Faktoreffekt)

inr2 2W ij i

i=1 j=1

1s = (x -x )

N-r

r2 2B i i

i=1

1s = n (x -x )

r-1

Page 44: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

44

Varianzanalyse

• Mittlere Quadratsummen (MSS = Mean Sum of Squares):

• Quadratsummen dividiert durch entsprechende Freiheitsgrade

• MSB und MSW sind erwartungstreue Schätzer der Varianz zwischen- und innerhalb der Messreihen.

Page 45: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

45

Varianzanalyse

• Varianzanalysetafel (r Messreihen):

Streuungs-ursache

Freiheits-grade (DF)

Quadrat-summe (SS)

Mittlere Quadratsumme (MS)

Unterschied zw Messreihen

r-1 SSB (Between)

MSB = SSB / (r-1)

Zufälliger Fehler

N-r SSW

(Within)

MSW = SSW / (N-r)

Gesamt N-1 SST

(Total)

Page 46: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

46

Varianzanalyse

Teststatistik:

• F = MSB / MSW

• F ~ F(r-1),(N-r)

• Entscheidung: Ist F ≤ Fc, lehne H0 nicht ab (Fc = kritischer Wert der F-Verteilung mit (r-1) und (N-r) Freiheitsgraden).

Page 47: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

47

Varianzanalyse

• Beispiel: Drahtsorten• Quadratsummenzerlegung: SST = SSB + SSW

– 324,62 = 108,04 + 216,58

• Mittlere Quadratsummen: – MSB = 108,04 / (3-1) = 54,02– MSW = 216,58 / (18-3) = 14,44

• Teststatistik: – F = MSB / MSW = 3,74

• Kritischer Wert der F2;15 Vt. 3,68• Entscheidung: 3,74 > 3,68 => H0 ablehnen, d.h. es

besteht ein signifikanter Unterschied zw. den Sorten

Page 48: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

48

Varianzanalyse

• Zweifache Varianzanalyse: – 2 Faktoren (A und B, wobei r Faktorstufen bei

A und p Faktorstufen bei B)– 1 metrische Variable

• Unterscheidung: – Modell ohne Wechselwirkungen zw. den

Faktoren– Modell mit Wechselwirkungen zw. den

Faktoren

Page 49: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

49

Varianzanalyse

• Modell ohne Wechselwirkungen zw. den Faktoren

• xijk = µ + αi + βj + eijk (für i=1,…,r, j=1,…,p, k=1,…,n)– µ gemeinsamer Mittelwert– α, β Faktoreffekte

– eijk zufällige Fehler

Page 50: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

50

Varianzanalyse

• Mittelwerte:

• Gesamt

• Faktor A

• Faktor B

pr n

ijki=1 j=1 k=1

1x = x

rpn p n

i ijkj=1 k=1

1x = x

pn r n

j ijki=1 k=1

1x = x

rn

Page 51: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

51

Varianzanalyse

• Schätzer für Gesamtmittel und Effekte

• Gesamtmittel

• Effekt von Faktor A

• Effekt von Faktor B

m=x

i ia =x -m

j jb =x -m

Page 52: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

52

Varianzanalyse

• Quadratsummen

• SSR = SST – SSE(A) – SSE(B)

pr n2

ijki=1 j=1 k=1

SST= (x -x )r

2i

i=1

SSE(A)=pn ap

2j

j=1

SSE(B)=rn b

Page 53: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

53

Varianzanalyse

• Quadratsummenzerlegung– SST = SSE(A) + SSE(B) + SSR

• Mittlere Quadratsummen:– MSE(A) = SSE(A) / (r-1)– MSE(B) = SSE(B) / (p-1)– MSR = SSR / (rpn-r-p+1)

Page 54: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

54

Varianzanalyse

• Prüfgrößen und kritische Werte:

• Faktor A: – F(A) = MSE(A) / MSR

– Fr-1,(nrp-r-p+1);1-α

• Faktor B: – F(B) = MSE(B) / MSR

– Fp-1,(nrp-r-p+1);1-α

Page 55: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

55

Varianzanalyse

• Beispiel: 2 Faktoren (Erreger, Antibiotikum)Erreger i

(A)   Antibiotikum j (B)    

    1 2 3 Mittelwerte Schätzer ai

  k          

1 1 38 40 38    

  2 35 41 39 38,5 0,667

2 1 42 39 33    

  2 45 33 34 37,7 -0,167

3 1 38 38 33    

  2 41 38 36 37,3 -0,500

Mittelwerte   39,8 38,2 35,5 37,8  

Schätzer bj   2,000 0,333 -2,333    

Page 56: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

56

Varianzanalyse

• Modell mit Wechselwirkungen zw. den Faktoren

• xijk = µ + αi + βj + (αβ)ij + eijk (für i=1,…,r, j=1,…,p, k=1,…,n)– µ gemeinsamer Mittelwert– α, β Faktoreffekte– αβ Wechselwirkung

– eijk zufällige Fehler

Page 57: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

57

Varianzanalyse

• Mittelwerte:

• Gesamt

• Faktor A

• Faktor B

• Wechselwirkung

pr n

ijki=1 j=1 k=1

1x = x

rpn p n

i ijkj=1 k=1

1x = x

pn r n

j ijki=1 k=1

1x = x

rn n

ij ijkk=1

1x = x

n

Page 58: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

58

Varianzanalyse

• Gesamtmittel und Effekte

• Gesamtmittel

• Effekt von Faktor A

• Effekt von Faktor B

• Effekt der Wechselwirkung

m=x

i ia =x -m

j jb =x -m

ij ij i j(ab) =x -a -b -m

Page 59: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

59

Varianzanalyse

• Quadratsummen

SSR = SST – SSE(A) – SSE(B) – SSE(AB)

pr n2

ijki=1 j=1 k=1

SST= (x -x )r

2i

i=1

SSE(A)=pn ap

2j

j=1

SSE(B)=rn bpr

2ij

i=1 j=1

SSE(AB)=n (ab)

Page 60: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

60

Varianzanalyse

• Quadratsummenzerlegung– SST = SSE(A) + SSE(B) + SSE(AB) + SSR

• Mittlere Quadratsummen:– MSE(A) = SSE(A) / (r-1)– MSE(B) = SSE(B) / (p-1)– MSE(AB) = SSE(AB) / (p-1)(r-1)– MSR = SSR / (rpn-r-p+1)

Page 61: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

61

Varianzanalyse

• Prüfgrößen und kritische Werte: • Faktor A:

– F(A) = MSE(A) / MSR

– Fr-1, pr(n-1); 1-α

• Faktor B: – F(B) = MSE(B) / MSR

– Fp-1, pr(n-1); 1-α

• Wechselwirkung: – F(AB) = MSE(AB) / MSR

– F(p-1)(r-1), pr(n-1); 1-α

Page 62: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

62

Varianzanalyse

• Beispiel: 2 Faktoren + Wechselwirkung

Erreger i   Antibiotikum j (Faktor B)    

(Faktor A)   1 2 3 xi.. ai

  k xi1k xi1. (ab)i1 xi2k xi2. (ab)i2 xi3k xi3. (ab)i3    

1 1 38

36,5 -4,000

40

40,5 1,667

38

38,5 2,333

   

  2 35 41 39 38,5 0,667

2 1 42

43,5 3,833

39

36 -2,000

33

33,5 -1,833

   

  2 45 33 34 37,7 -0,167

3 1 38

39,5 0,167

38

38 0,333

33

34,5 -0,500

   

  2 41 38 36 37,3 -0,500

x.j.   39,8     38,2     35,5     37,8  

bj   2,000     0,333     -2,333        

Page 63: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

63

Varianzanalyse

• Beispiel: Varianzanalysetafel

• Faktor Erreger: kein Effekt

• Faktor Antibiotikum: Effekt

• Interaktion: Effekt (impliziert, dass auch Faktor Erreger eine Wirkung hat).

Streuungs-ursache

Freiheits-grade

Quadrat-summe

Mittlere Quadrats.

Test-statistik

Kritischer Wert

Erreger 2 4,33 2,16667 0,52 4,26

Antibiotikum 2 57,33 28,6667 6,88 4,26

Interaktion 4 93,33 23,3333 5,60 3,63

Fehler 9 37,50 4,16667    

Total 17 192,5      

Page 64: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

64

VarianzanalyseErreger - Antibiotikum

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

0 1 2 3 4

Antibiotikum

Mit

telw

ert

e

Erreger 1

Erreger 2

Erreger 3

Page 65: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

65

Nichtparametrische ANOVA

• Kruskal-Wallis Test• Unterscheiden sich die Mittelwerte von p

Messreihen (n1, …, np)? • Voraussetzungen:

– Stetige Verteilung der Messreihen – Mindestens Ordinalskala – Setzt weder Normalverteilung, noch

Varianzhomogenität voraus.

• Hypothese: – H0: Mittelwerte der p Messreihen sind gleich – H1: Mittelwerte unterscheiden sich

Page 66: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

66

Nichtparametrische ANOVA

• Vorgehensweise:– N Messwerten X11, …, Xpnp werden Rangzahlen

rij zugewiesen.

– Summe der Ränge der einzelnen Messreihen berechnen:

– Bindungen (mehrere Messwerte sind gleich): Mittelwert der Ränge

in

i ijj=1

r = r

Page 67: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

67

Nichtparametrische ANOVA

• Prüfgröße:

– g … Anzahl der verschiedenen Messwerte– t … wie oft tritt ein Messwert auf– Treten keine Bindungen auf, ist B = 1

p2i

i=1 i

1 12 1H= r -3(N+1)

B N(N+1) n

g

3l3

i=1

1B=1- (t -t)

N -N

Page 68: 1 STATISIK LV Nr.: 1852 WS 2005/06 10. Jänner 2006.

68

Nichtparametrische ANOVA

• Entscheidung:– H0 ablehnen, wenn H > hp(n1,…,np);1-α

– h … kritische Werte (Tabelle, z.B. Hartung S. 615)

• Approximation durch χ²p-1,1-α Verteilung: – H0 ablehnen, wenn H > χ²p-1,1-α (Quantile der χ²

Verteilung)


Recommended