+ All Categories
Transcript
Page 1: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Biostatistik, Sommer 2019Vergleich zweier Stichproben:

Gepaarter, Ungepaarter t-Test, Welch Test

Prof. Dr. Achim Klenke

https://www.aklenke.de

11. Vorlesung: 05.07.2019

1/57

Page 2: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Inhalt

1 Vergleich zweier StichprobenGepaarter t-TestUngepaarter t-TestUngepaarter t-Test bei unterschiedlicher Varianz, WelchTestVergleich: Gepaarter vs ungepaarter t-Test

2/57

Page 3: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Grundproblem

Bei n Individuen soll eine Messgroße x unter zweiVersuchsbedingungen gemessen werden.Unterscheiden sich die Mittelwerte der Messungen?

3/57

Page 4: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Modellierung

Unter Versuchsbedingung 1 sind die Messwerte x (1)1 , . . . , x (1)

n

unabhangig mit Erwartungswert µ1.Unter Versuchsbedingung 2 sind die Messwerte x (2)

1 , . . . , x (2)n

unabhangig mit Erwartungswert µ2.

Annahme (Hoffnung!!!): Die Differenzenx (2)

1 − x (1)1 , . . . , x (2)

n − x (1)n sind (ungefahr) normalverteilt mit

unbekannter Varianz σ2 (und Erwartungswert µ2 − µ1).

Nullhypothese (H0): µ1 = µ2.

Alternative (H1): µ1 6= µ2 (beidseitig)µ1 < µ2 (rechtsseitig)µ1 > µ2 (linksseitig).

4/57

Page 5: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

VerfahrenUnter der Nullhypothese sind die Differenzen xk = x (2)

k − x (1)k

unabhangig und normalverteilt mit unbekannter Varianz σ2 undErwartungswert µ = µ2 − µ1 = 0.Also verfahren wir jetzt wie im bekannten t-Test: Teststatistik

T (x) =x

sn−1/√

n,

wobei

x =1n

n∑k=1

xk =1n

n∑k=1

(x (2)k − x (1)

k )

ist und

s2n−1 =

1n − 1

n∑k=1

(xk − x)2.

5/57

Page 6: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Linksseitige Alternative

Verwerfungsregel

Nullhypothese (H0): µ2 = µ1

Alternative (H1): µ2 < µ1.

Verwirf H0 zugunsten von H1, falls T (x) ≤ −tn−1;1−α.

p-Wert

p(x) = tn−1(T (x)) = 1− tn−1(−T (x)).

tn−1 Verteilungsfunktion der tn−1-Verteilung (Tabelle T4).

Berechnung mit Rt.test(x2 - x1, alternative = "less")

6/57

Page 7: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Rechtsseitige Alternative

Verwerfungsregel

Nullhypothese (H0): µ2 = µ1

Alternative (H1): µ2 > µ1.

Verwirf H0 zugunsten von H1, falls T (x) ≥ tn−1;1−α.

p-Wert

p(x) = tn−1(−T (x)) = 1− tn−1(T (x)).

tn−1 Verteilungsfunktion der tn−1-Verteilung (Tabelle T4).

Berechnung mit Rt.test(x2 - x1, alternative = "greater")

7/57

Page 8: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Beidseitige Alternative

Verwerfungsregel

Nullhypothese (H0): µ2 = µ1

Alternative (H1): µ2 6= µ1.

Verwirf H0 zugunsten von H1, falls |T (x)| ≥ tn−1;1−α/2.

p-Wert

p(x) = 2(1− tn−1(|T (x)|)).

tn−1 Verteilungsfunktion der tn−1-Verteilung (Tabelle T4).

Berechnung mit Rt.test(x2 - x1, alternative = "two.sided")

8/57

Page 9: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Beispiel: Orientierung von Zugvogeln

Zugvogel werden einer Beleuchtung mit bestimmter Farbe (grunoder blau) ausgesetzt.Ist die Genauigkeit der Orientierung (magnetischer Kompass)abhangig von der Farbe?

Nullhypothese: Nein.Alternative: Doch.

9/57

Page 10: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Beispiel: Orientierung von ZugvogelnVersuchsanordnung

Es werden n = 17 Trauerschnapper inKafigen einer Beleuchtung mit blauemLicht ausgesetzt (Versuchsbedingung 1)und jeweils in mehreren Durchgangenihre Flugrichtung ermittelt.

Die Flugrichtung wird als Punkt auf einem Kreis dargestellt. Ausallen Punkten auf dem Kreis wird der Schwerpunktvektorermittelt.

Danach der gleiche Versuch mit grunem Licht (Bedingung 2).

10/57

Page 11: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Beispiel: Orientierung von ZugvogelnBestimmung des Schwerpunktvektors

Je variabler die Richtungen, destokurzer der Pfeil!

11/57

Page 12: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Beispiel: Orientierung von ZugvogelnAnsatz des Tests

Fur jeden Vogel i = 1, . . . ,17 bezeichnen wir mit x (1)i die Lange

des Schwerpunktvektors bei blauem Licht und mit x (2)i die Lange

des Schwerpunktvektors bei grunem Licht.

xi = x (2)i − x (1)

i .

Festlegung des Niveaus: α = 5%.Schwerpunktvektoren sind Mittelwerte vieler zufalligerBeobachtungen, also etwa normalverteilt (zentralerGrenzwertsatz). Also: Gepaarter t-Test mit beidseitigerAlternative und Niveau 5%.Verwerfe H0, falls

|T (x)| > tn−1;1−α/2 = t16;0.975 = 2.12.

12/57

Page 13: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Beispiel: Orientierung von ZugvogelnDaten und Durchfuhrung

Differenzen xi :

−0.05 0.00 0.05 0.10 0.15 0.20

Mittelwert und Streuung:

x = 0.0518 sn−1 = 0.0912.

t-Statistik T (x) =x

sn−1/√

n=

0.05180.0912/

√17≈ 2.34.

Also ist |T (x)| = 2.34 > 2.12 = t16;0.975.p-Wert:

p(x) = 2(1−tn−1(|T (x)|)) = 2(1−t16(2.34)) = 2(1−0.983) = 0.034.

13/57

Page 14: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Gepaarter t-Test

Beispiel: Orientierung von ZugvogelnFazit

Wir konnen die Hypothese, dass die Farbe des Lichtes keineRolle fur die Orientierungsgenauigkeit der Trauerschnapperspielt, zum Niveau 5% verwerfen.

14/57

Page 15: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von Hipparions

(c): public domain

15/57

Page 16: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsDie Daten

77 Backenzahne

gefunden in den Chiwondo Beds, Malawi,

jetzt in den Sammlungen desHessischen Landesmuseums, Darmstadt

16/57

Page 17: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsZuordnung

Die Zahne wurden zwei Arten zugeordnet:

Hipparion africanum≈ 4 Mio. Jahre, 39 Zahne

Hipparion libycum≈ 2,5 Mio. Jahre, 38 Zahne

17/57

Page 18: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsGeologischer Hintergrund

Vor 2,8 Mio. Jahren kuhlte sich das Klima weltweit ab.

Das Klima in Ostafrika:warm-feucht −→ kuhl-trocken

Hipparion:Laubfresser −→ Grasfresser

18/57

Page 19: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsFrage

Hipparion:Laubfresser −→ Grasfresser

andere Nahrung −→ andere Zahne?

Messungen: mesiodistale Lange

Lasst sich die Nullhypothese, dass die Zahne gleich sind, zumNiveau 1% verwerfen?

19/57

Page 20: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Die Theorie

Annahme: Wir haben zwei unabhangige Stichprobenx1,1, . . . , x1,n1 und x2,1, . . . , x2,n2.

Die x1,i stammen aus einer Normalverteilung mit (unbekanntem)Mittelwert µ1 und unbekannter Varianz σ2 > 0, die x2,i aus einerNormalverteilung mit (unbekanntem) Mittelwert µ2 undderselben Varianz σ2.

20/57

Page 21: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Die Theorie

Seien

x1 =1n1

n1∑i=1

x1,i und x2 =1n2

n2∑i=1

x2,i

die jeweiligen Stichprobenmittelwerte,

s1 =

√√√√ 1n1 − 1

n1∑i=1

(x1,i − x1)2,

s2 =

√√√√ 1n2 − 1

n2∑i=1

(x2,i − x2)2,

die (korrigierten) Stichprobenstreuungen.

21/57

Page 22: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Die TheorieWir mochten die Hypothese H0 : ”µ1 = µ2“ prufen.Wenn µ1 = µ2 gilt, so sollte x1 = x2 ”bis aufZufallsschwankungen“ gelten, denn E[x1] = µ1, E[x2] = µ2.Was ist die Skala der typischen Schwankungen von x2 − x1?Var(x1 − x2) = σ2

(1n1

+ 1n2

)Problem (wie bereits im ein-Stichproben-Fall): Wir kennen σ2 nicht.Wir schatzen es im zwei-Stichproben-Fall durch die gepoolteStichprobenvarianz

s2 =(n1 − 1)s2

1 + (n2 − 1)s22

n1 + n2 − 2und bilden die Teststatistik

T (x) =x2 − x1

s√

1n1

+ 1n2

.

22/57

Page 23: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Die Theorie

Wenn µ1 = µ2 gilt, so ist

T (x) =x2 − x1

s√

1n1

+ 1n2

tn1+n2−2-verteilt.

23/57

Page 24: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Die TheorieLinksseitige Alternative

Verwerfungsregel

Nullhypothese (H0): µ2 = µ1

Alternative (H1): µ2 < µ1.

Verwirf H0 zugunsten von H1, falls T (x) ≤ −tn1+n2−2;1−α.

p-Wert

p(x) = tn1+n2−2(T (x)) = 1− tn1+n2−2(−T (x)).

tn1+n2−2 Verteilungsfunktion der tn1+n2−2-Verteilung (Tabelle T4).

Berechnung mit Rt.test(x2, x1, var = TRUE, alternative = "less")

24/57

Page 25: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Die TheorieRechtsseitige Alternative

Verwerfungsregel

Nullhypothese (H0): µ2 = µ1

Alternative (H1): µ2 > µ1.

Verwirf H0 zugunsten von H1, falls T (x) ≥ tn1+n2−2;1−α.

p-Wert

p(x) = tn1+n2−2(−T (x)) = 1− tn1+n2−2(T (x)).

tn1+n2−2 Verteilungsfunktion der tn1+n2−2-Verteilung (Tabelle T4).

Berechnung mit Rt.test(x2, x1, var = TRUE, alternative = "greater")

25/57

Page 26: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Die TheorieBeidseitige Alternative

Verwerfungsregel

Nullhypothese (H0): µ2 = µ1

Alternative (H1): µ2 6= µ1.

Verwirf H0 zugunsten von H1, falls |T (x)| ≥ tn1+n2−2;1−α/2.

p-Wert

p(x) = 2(1− tn1+n2−2(|T (x)|)).

tn1+n2−2 Verteilungsfunktion der tn1+n2−2-Verteilung (Tabelle T4).

Berechnung mit Rt.test(x2, x1, var = TRUE, alternative = "two.sided")

26/57

Page 27: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsDie Daten als Tabelle

Africanum30.0 24.0 26.0 23.0 23.0 23.0 29.0 29.0 26.5 24.024.5 23.0 27.0 27.0 27.0 27.0 27.0 25.0 24.5 26.027.0 26.0 25.0 23.0 23.5 24.0 25.0 27.0 25.0 24.026.5 24.0 28.5 31.0 28.0 31.0 27.5 24.0 25.0

Libycum23.0 25.0 30.0 26.0 28.5 28.5 25.5 24.0 35.0 23.025.0 27.0 26.0 26.0 40.0 32.0 33.0 30.0 26.0 35.024.0 32.5 25.0 26.0 27.0 30.0 36.0 25.0 34.0 29.022.0 26.0 37.0 25.5 29.0 30.5 26.5 27.0

27/57

Page 28: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsDie Daten als Grafik

25 30 35 40

H. l

ibyc

umH

. afr

ican

um

mesiodistale Länge [mm]

xA == 25.9, sA == 2.2

xL == 28.4, sL == 4.3

xA ++ sAxA −− sA

xL ++ sLxL −− sL

28/57

Page 29: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsDie Daten

nA = 39, xA = 25.9, sA = 2.2nL = 38, xL = 28.4, sL = 4.3

Gepoolte Stichprobenstreuung

s =

√(nA − 1)s2

A + (nL − 1)s2L

nA + nL − 2

=

√38× 2.22 + 37× 4.32

39 + 38− 2= 3.402.

Es folgt

T (x) =xL − xA

s√

1nA

+ 1nL

=28.4− 25.9

3.402×√

1/39 + 1/38= 3.22.

29/57

Page 30: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsDurchfuhrung des Tests

Nullhypothese µ1 = µ2, Alternative µ1 6= µ2 (beidseitig).Test verwirft zum Niveau α = 1%, wenn

|T (x)| > tnA+nL−2;1−α/2 = t75;0.995 ≈ 2.65.

Tatsachliche Daten: |T (x)| = |3.22| > 2.65.p-Wert

p(x) = 2(1− tnA+nL−2(|T (x)|)) = 2(1− t75(3.22))= 2(1− 0.998) = 0.002.

Diesen p-Wert sollte man nicht glauben, weil dieModellanahmen zu optimistisch waren.

30/57

Page 31: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsFazit

Der ungepaarte Zweistichproben-t-Test verwirft dieNullhypothese, dass die mesiodistale Lange der Backenzahnebei Hipparion africanum und Hipparion libycum gleichenErwartungswert hatten, zu Gunsten der zweiseitigen Alternativezum Niveau 1%.

31/57

Page 32: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsRechnung mit R / Dateneingabe

> africanum <- c(

30.0, 24.0, 26.0, 23.0, 23.0, 23.0, 29.0, 29.0,

26.5, 24.0, 24.5, 23.0, 27.0, 27.0, 27.0, 27.0,

27.0, 25.0, 24.5, 26.0, 27.0, 26.0, 25.0, 23.0,

23.5, 24.0, 25.0, 27.0, 25.0, 24.0, 26.5, 24.0,

28.5, 31.0, 28.0, 31.0, 27.5, 24.0, 25.0)

> libycum <- c(

23.0, 25.0, 30.0, 26.0, 28.5, 28.5, 25.5, 24.0,

35.0, 23.0, 25.0, 27.0, 26.0, 26.0, 40.0, 32.0,

33.0, 30.0, 26.0, 35.0, 24.0, 32.5, 25.0, 26.0,

27.0, 30.0, 36.0, 25.0, 34.0, 29.0, 22.0, 26.0,

37.0, 25.5, 29.0, 30.5, 26.5, 27.0)

32/57

Page 33: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsRechnung mit R / Statistik und p-Wert

> sa <- sd(africanum)

> sl <- sd(libycum)

> (na <- length(africanum))

[1] 39> (nl <- length(libycum))

[1] 38> (xa.quer <- mean(africanum))

[1] 25.91026> (xl.quer <- mean(libycum))

[1] 28.43421> (s <- sqrt(((na-1)*sa∧2+(nl-1)*sl∧2)/(na+nl-2)))[1] 3.429327> (t <- (xl.quer - xa.quer)/(s*sqrt(1/na + 1/nl)))

[1] 3.228875> (p.wert <- 2*(1-pt(df=75, t)))

[1] 0.00184498433/57

Page 34: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test

Beispiel: Backenzahne von HipparionsRechnung mit R / Automatischer Test

Der Schalter var=TRUE erzwingt, dass in beiden Stichproben diegleiche Varianz angenommen wird.> t.test(libycum, africanum, var=TRUE,

alternative="two.sided")

Two Sample t-test

data: libycum and africanumt = 3.2289, df = 75, p-value = 0.001845alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:0.9667634 4.0811448sample estimates:mean of x mean of y28.43421 25.91026

34/57

Page 35: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Die Theorie (Welch Test)

Annahme: Wir haben zwei unabhangige Stichprobenx1,1, . . . , x1,n1 und x2,1, . . . , x2,n2.

Die x1,i stammen aus einer Normalverteilung mit (unbekanntem)Mittelwert µ1 und unbekannter Varianz σ2

1 > 0, die x2,i aus einerNormalverteilung mit (unbekanntem) Mittelwert µ2 undmoglicherweise anderer Varianz σ2

2.

35/57

Page 36: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Die Theorie (Welch Test)

Seien

s1 =

√√√√ 1n1 − 1

n1∑i=1

(x1,i − x1)2,

s2 =

√√√√ 1n2 − 1

n2∑i=1

(x2,i − x2)2,

die (korrigierten) Stichprobenstreuungen.

36/57

Page 37: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Die Theorie (Welch Test)

Unter der Hypothese µ1 = µ2 ist die Teststatistik

T (x) =x2 − x1√

s21

n1+

s22

n2

ungefahr t-verteilt mit f Freiheitsgraden, wobei f aus den Datengeschatzt wird:

f =

(s2

1n1

+s2

2n2

)2

s41

n21(n1−1) +

s42

n22(n2−1)

.

37/57

Page 38: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Die Theorie (Welch Test)Linksseitige Alternative

Verwerfungsregel

Nullhypothese (H0): µ2 = µ1

Alternative (H1): µ2 < µ1.

Verwirf H0 zugunsten von H1, falls T (x) ≤ −tf ;1−α.

p-Wert

p(x) = tf (T (x)) = 1− tf (−T (x)).

tf Verteilungsfunktion der tf -Verteilung (Tabelle T4).

Berechnung mit Rt.test(x2, x1, alternative = "less")

38/57

Page 39: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Die Theorie (Welch Test)Rechtsseitige Alternative

Verwerfungsregel

Nullhypothese (H0): µ2 = µ1

Alternative (H1): µ2 > µ1.

Verwirf H0 zugunsten von H1, falls T (x) ≥ tf ;1−α.

p-Wert

p(x) = tf (−T (x)) = 1− tf (T (x)).

tf Verteilungsfunktion der tf -Verteilung (Tabelle T4).

Berechnung mit Rt.test(x2, x1, alternative = "greater")

39/57

Page 40: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Die Theorie (Welch Test)Beidseitige Alternative

Verwerfungsregel

Nullhypothese (H0): µ2 = µ1

Alternative (H1): µ2 6= µ1.

Verwirf H0 zugunsten von H1, falls |T (x)| ≥ tf ;1−α/2.

p-Wert

p(x) = 2(1− tf (|T (x)|)).

tf Verteilungsfunktion der tf -Verteilung (Tabelle T4).

Berechnung mit Rt.test(x2, x1, alternative = "two.sided")

40/57

Page 41: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVersuchsaufbau im Pflanzenphysiologischen Praktikum

In vier Petrischalen werden jeweils exakt 100 SamenGartenkresse ausgebracht. Gewassert wird mit

(A) Aqua dest. (zur Kontrolle)(B) ABS Losung(C) Saccharose-Losung(D) Saccharose-ABS-Losung

Nach zwei Tagen wird gezahlt, wie viele Samen gekeimt haben.

41/57

Page 42: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungIm Praktikum wird jeder Versuch dreimal durchgefuhrt.

Versuch A B C DKeime Schale 1 90 85 45 25Keime Schale 2 88 87 44 27Keime Schale 3 91 75 45 29

A B C D

020

6010

0

42/57

Page 43: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur Keimhemmung

A B C D

020

6010

0

(A) Aqua dest.(B) ABS(C) Saccharose(D) Saccharose-

ABS

FragenIst die Hemmung bei B schon vorhanden?Hemmt Saccharose (C)?Hemmt Saccharose mit ABS (D) starker als Saccharose?Ist die Wirkung von Saccharose und ABS gleich?

43/57

Page 44: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen D

Vermutung: Hemmung bei ABS+Saccharose (D) starker als beiSaccharose (C).

Test zum Niveau α = 1% soll Klarheit schaffen.

Nullhypothese: (D) genauso wie (C)Alternative: (D) hemmt starker.

44/57

Page 45: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test

DatenxC,1 = 45, xC,2 = 44, xC,3 = 45

xD,1 = 25, xD,2 = 27, xD,3 = 29

Idee: Daten etwa normalverteilt mit unbekannten MittelwertenµC und µD und unbekannten Varianzen σ2

C, σ2D.

Nullhypothese (H0) µC = µD

Alternative (H1) µC > µD.Linksseitiger Zwei-Stichproben t-Test mit unterschiedlichenVarianzen (Welch Test).

45/57

Page 46: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test

xC,1 = 45, xC,2 = 44, xC,3 = 45

xD,1 = 25, xD,2 = 27, xD,3 = 29

xC = 44.67, xD = 27.

sC =

√√√√12

3∑i=1

(xC,i − xC)2

=

√12((45− 44.67)2 + (44− 44.67)2 + (45− 44.67)2)

= 0.57735.

46/57

Page 47: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test

xC,1 = 45, xC,2 = 44, xC,3 = 45

xD,1 = 25, xD,2 = 27, xD,3 = 29

xC = 44.67, xD = 27.

sD =

√√√√12

3∑i=1

(xD,i − xD)2

=

√12((25− 27)2 + (27− 27)2 + (29− 27)2) = 2.

47/57

Page 48: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test

xC = 44.67, xD = 27.

sC = 0.57735, sD = 2.

t-Statistik

T (x) =xD − xC√

s2C

nC+

s2D

nD

=27− 44.67√

0.57352

3 + 22

3

= −14.7.

Freiheitsgrade

f =

(s2

CnC

+s2

DnD

)2

s4C

n2C(nC−1) +

s4D

n2D(nD−1)

= . . . = 2.331.

48/57

Page 49: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test

t-StatistikT (x) = −14.7.

Freiheitsgradef = 2.331.

Der linksseitige Test zum Niveau α = 0.01 verwirft H0, falls

T (x) < −tf ,1−α = −t2.331;0.99 ≈ −5.77.

(Alternativ: Tabellenwert t2;0.99 = 6.96)Wegen T (x) = −14.7 < −5.77 verwirft der Test zum Niveau 1%die Nullhypothese.p-Wert

p(x) = t2.331(−14.7) = 0.0012.

Alternativ: Tabellenwert p(x) ≤ t2(−14.7) = 0.0023.49/57

Page 50: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Ergebnis

Mit Hilfe eines ungepaarten einseitigen t-Tests beiunterschiedlichen Varianzen (Welch Test) wird dieNullhypothese (Saccharose hemmt die Keimung gleich gut wieeine Losung mit Saccharose und ABS) auf dem Niveau 1%gegen die Alternative (S hemmt nicht so gut wie S+ABS)verworfen.Der p-Wert betragt p ≤ 0.0023 (bzw. p = 0.0012, wenn manexakt mit dem Computer rechnet, statt den p-Wert nach derTabelle der t2-Verteilung anzunahern).

50/57

Page 51: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Berechnung mit R

Ohne die Option var=TRUE wird der Welch-Test durchgefuhrt.> xA <- c(90, 88, 91)

> xB <- c(85, 87, 75)

> xC <- c(45, 44, 45)

> xD <- c(25, 27, 29)

> t.test(xD, xC, alternative="less") # D.h. xD < xC ??

Welch Two Sample t-test

data: xD and xCt = -14.6996, df = 2.331, p-value = 0.001188alternative hypothesis: true difference in means is less than 095 percent confidence interval:-Inf -14.47462sample estimates:mean of x mean of y27.00000 44.66667

51/57

Page 52: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen B

Hemmt Saccharose (C) genauso gut wie ABS (B)?Zweiseitiger ungepaarter t-Test bei unterschiedlichen Varianzen(Welch Test) zum Niveau α = 1%.

52/57

Page 53: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen B, Daten

xC = 44.67, xB = 82.333.sC = 0.57735, sB = 6.4291.

t-StatistikT (x) =

xB − xC√s2

CnC

+s2

BnB

= 10.1.

Freiheitsgradef = 2.032.

Beidseitiger Test verwirft, falls

|T (x)| > t2.032;0.995 ≈ t2;0.995 = 9.92.

Wegen |T (x)| = 10.1 verwirft der Test zum Niveau 1%.

p-Wert 2(1− t2.032(10.1)) ≈ 2(1− t2(10.1)) = 0.0097 ≈ 0.01.53/57

Page 54: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen B, Ergebnis

Der zweiseitige ungepaarte t-Test bei unterschiedlicher Varianz(Welch Test) verwirft die Nullhypothese (Saccharose hemmtKeimung gleich gut wie ABS) gegen die beidseitige Alternativezum Niveau 1%. Der p-Wert ist etwa 0.01.

54/57

Page 55: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Versuch zur KeimhemmungVergleich C gegen B, Berechnung mit R

> t.test(xB, xC, alternative="two.sided")

Welch Two Sample t-test

data: xB and xCt = 10.107, df = 2.032, p-value = 0.009142alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:21.87307 53.46027sample estimates:mean of x mean of y82.33333 44.66667

55/57

Page 56: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test

Beispiel: Backenzahne des HipparionsBerechnung ohne Annahme der gleichen Varianz

Die Annahme, dass bei den Hipparions beide Stichprobengleiche Varianz haben, ist eigentlich durch nichts begrundet.Sauberer ware daher der Welch-Test.> t.test(libycum, africanum, alternative="two.sided")

Welch Two Sample t-test

data: libycum and africanumt = 3.2043, df = 54.975, p-value = 0.002255alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:0.9453745 4.1025338sample estimates:mean of x mean of y28.43421 25.91026Der p-Wert ist großer als bei Annahme gleicher Varianz(0.001845).

56/57

Page 57: Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier Stichproben: Gepaarter, Ungepaarter t-Test, Welch Test Prof. Dr. Achim Klenke  11.

Vergleich zweier Stichproben Vergleich: Gepaarter vs ungepaarter t-Test

Vergleich: Gepaarter vs ungepaarter t-Test

Wenn die Stichprobenlange unterschiedlich ist,ergibt ”gepaart“ keinen Sinn.

Wenn die Stichprobenlange gleich ist:Sind die Stichproben unabhangig voneinander?Falls ja, dann ungepaart testen. Ein gepaarter Test wurdesinnlose Abhangigkeiten unterstellen und hatte auch einegeringere Scharfe.Sind die Stichproben voneinander abhangig?(z.B. Messungen von denselben Individuen bzw. Objekten)Falls ja, dann ist ein gepaarter Test sinnvoll. Bei starkerAbhangigkeitsstruktur hat der gepaarte t-Test großereScharfe (da der Test von Variabilitat zwischen denIndividuen bereinigt ist)

57/57


Top Related