Post on 04-Sep-2020
transcript
Hypothesentests fรผr
Erwartungswert und Median
fรผr D-UWIS, D-ERDW, D-USYS und D-HEST โ SS15
Normalverteilung
2
๐ โผ ๐(๐, ๐2) :
ยซ๐ ist normalverteilt mit Erwartungswert ๐ und Varianz ๐2ยป
pdf:
๐ ๐ฅ =1
๐ 2๐exp โ
๐ฅ โ ๐ 2
2๐2
cdf: ziemlich umstรคndlich
Zentraler Grenzwertsatz (CLT):
๐๐ โผ ๐น ๐. ๐. ๐. mit ๐ธ ๐๐ = ๐ und ๐๐๐ ๐๐ = ๐2, dann giltโฆ
๐๐ โผ ๐ฉ ๐,๐2
๐, falls ๐ โ โ
๐๐ = ๐=1๐ ๐๐ โผ ๐ฉ(๐๐, ๐๐2), falls ๐ โ โ
CLT: Normalapproximation des Binomialtests
1. Modell: n Lose kaufen, gleiche Gewinnchance, unabh.
jedes Los ๐๐: 1 mit Wโkeit ๐, 0 mit Wโkeit 1 โ ๐
๐ธ ๐๐ = ๐, ๐๐๐ ๐๐ = ๐ 1 โ ๐
๐: Anzahl Gewinne, ๐ = ๐1 + ๐2 + โฏ+ ๐๐
2. โ0: ๐ = ๐0; โ๐ด: ๐ < ๐0
3. Teststatistik T: CLT ๐ โผ ๐ฉ(๐๐0, ๐๐0(1 โ ๐0))
4. Signifikanzniveau: ๐ผ = 0.05
3
CLT: Normalapproximation des Binomialtests
5. Verwerfungsbereich: ๐พ = 0, ๐
Finde c, sodass ๐ ๐ โค ๐ = 0.05 (mit Computer oderโฆ
Standardisiere & verwende Tabelle:
๐ ๐ โค ๐ = ๐ ๐ โค ๐ = 0.05 mit ๐ =๐โ๐๐0
๐๐0(1โ๐0)
aus Tabelle: ๐ = โ1.64
nach ๐ auflรถsen: ๐ = ๐๐0 โ 1.64 ๐๐0(1 โ ๐0)
6. Testentscheid
4
Lernziele heute
z-Test
t-Test
Vorzeichentest
Wilcoxon-Test
Hausaufgaben
Skript: Kapitel 4.7 lessen
Serie 9 lรถsen
Quiz 9 bearbeiten
etutoR 7
5
Reaktionszeit
Reagiert man mit der Haupthand schneller, wie mit der Nebenhand?
Experiment: Population: Alle StudentInnen der Vorlesung
Stichprobe: 70 zufรคllig ausgewรคhlte StudentInnen
Messmethode: Reaktionszeittest auf dem Internet
Testlauf mit beiden Hรคnden (Reihenfolge randomisiert)
Messung mit beiden Hรคnden (5 Messungen)
Robustheit: jeweils bestes und schlechtestes Resultat streichen, Rest mitteln
Differenz aus HH und NH berechnen
Anreiz: Verlosung eines Kinogutscheins
6http://www.bbc.co.uk/science/humanbody/sleep/sheep/
Daten sammeln mit Schafenโฆ
7
Ergebnis
70 StudentInnen angeschrieben
Rรผcklauf: 37
Haupthand ist im Mittel 8 ms schneller, der Median liegt bei
10 ms schneller
8
Stichprobe versus Population
In der Stichprobe war die Haupthand 8 ms schneller
Kรถnnen wir daraus schliessen, dass die Haupthand in der
ganzen Population im Mittel schneller ist?
Eine Antwort liefern:
z-Test
t-Test
Wilcoxon-Test (Mann-Whitney-U-Test)
Vorzeichen-Test
9
z-Test (๐๐ฟ bekannt)
1. Modell: ๐๐ kontinuierliche Messgrรถsse;๐1, ๐2, โฆ , ๐๐ ๐. ๐. ๐. ,๐ ๐, ๐๐ฟ
๐ , ๐๐ฟ bekannt
2. Nullhypothese: โ0: ๐ = ๐0Alternative: โ๐ด: ๐ โ ๐0 (oder < oder >)
3. Teststatistik:
๐ =( ๐๐ โ ๐0)
๐ ๐๐
=๐( ๐๐ โ ๐0)
๐๐=
beobachtet โ erwartet
StandardfehlerVerteilung unter โ0: ๐ โผ ๐ฉ(0,1)
4. Signifikanzniveau: ๐ผ
5. Verwerfungsbereich fรผr die Teststatistik:
๐พ = (โโ,โ ฮฆโ1 1 โ ๐ผ/2 โช ฮฆโ1 1 โ ๐ผ/2 ,โ)
๐พ = โโ,โฮฆโ1 1 โ ๐ผ bei โ๐ด: ๐ < ๐0
๐พ = ฮฆโ1 1 โ ๐ผ ,โ) bei โ๐ด: ๐ > ๐0
6. Testentscheid: Liegt beobachteter Wert ๐ง der Teststatistik in ๐พ
11
Problem in der Praxis: ๐๐ฟ ist nicht bekannt!
Schรคtze die Varianz:
๐๐2 =
1
๐ โ 1
๐=1
๐
๐๐ โ ๐๐
Neue Teststatistik:
๐ = ๐๐ โ ๐0
๐๐
๐
Verteilung von ๐, falls โ0 stimmt:
๐ โผ ๐ก๐โ1
12
ยซStudentโsยป t-Verteilung โ
kleiner Abstecher im Verteilungszoo!
Annahme:
๐1, ๐2, โฆ , ๐๐ โผ ๐ฉ(๐, ๐๐2) und unabhรคngig
๐๐2 =
1
๐โ1 ๐=1
๐ ๐๐ โ ๐๐2 ist die geschรคtzte Varianz
Die Teststatistik
๐ = ๐๐ โ ๐
๐๐
๐
โผ ๐ก๐
folgt einer
ยซt-Verteilung mit n Freiheitsgradenยป
Falls ๐ = โ, dann ist ๐กโ = ๐ฉ(0,1)
13
William
Sealy
Gosset
Umso weniger df,
umso meht Streuung
t-Test (๐๐ฟ unbekannt)
14
1. Modell: ๐๐ kontinuierliche Messgrรถsse;๐1, ๐2, โฆ , ๐๐ ๐. ๐. ๐. ,๐ ๐, ๐๐ฟ
๐ , ๐๐ wird mit ๐๐ geschรคtzt
2. Nullhypothese: โ0: ๐ = ๐0Alternative: โ๐ด: ๐ โ ๐0 (oder < oder >)
3. Teststatistik:
T =( ๐๐ โ ๐0)
๐ ๐๐
=๐( ๐๐ โ ๐0)
๐๐=
beobachtet โ erwartet
geschรคtzter StandardfehlerVerteilung unter โ0: T โผ ๐ก๐โ1
4. Signifikanzniveau: ๐ผ
5. Verwerfungsbereich fรผr die Teststatistik:
๐พ = (โโ,โ ๐ก๐โ1;1โ
๐ผ2
โช ๐ก๐โ1;1โ๐ผ2, โ)
๐พ = โโ,โ๐ก๐โ1;1โ๐ผ bei โ๐ด: ๐ < ๐0
๐พ = ๐ก๐โ1;1โ๐ผ , โ) bei โ๐ด: ๐ > ๐0
6. Testentscheid:Liegt beobachteter Wert ๐ก der Teststatistik in ๐พ
t.test
power.t.test
Beispiel t-Test
1. Modell: ๐๐ Differenz in der Reaktionszeit von HH und NH von
StudentIn ๐
2. Nullhypothese: โ0: ๐ = 0 ๐๐ Alternative: โ๐ด: ๐ โ 0 ๐๐
3. Teststatistik:
๐ =๐( ๐๐ โ ๐0)
๐๐โ ๐ก =
37(โ8.03 โ 0)
41.13= โ1.19
4. Signifikanzniveau: ๐ผ = 0.05
5. Verwerfungsbereich:
๐พ = โโ,โ๐ก36;0.975 โช ๐ก36;0.975, โ = โโ,โ2.03 โช 2.03,โ)
6. Testentscheid: ๐ก โ ๐พ โ โ0 kann nicht verworfen werden
15
P-Wert
ยซKleinstes Signifikanzniveau, bei dem โ0 gerade nochverworfen wird.ยป z.B. P-Wert = 0.03 ๐ผ = 0.05 ๐ผ = 0.01
โ๐ด: ๐ โ ๐0 und der beobachtete Wert ๐ก = ๐| ๐๐โ๐0|
๐๐
P-Wert berechnet sichโฆ
๐ ๐ > ๐ก = ๐ ๐ < โ ๐ก + ๐ ๐ > ๐ก = 2 โ ๐ ๐ > ๐ก =
= 2 โ 1 โ ๐ ๐ โค ๐ก =
= 2 โ 1 โ ๐น๐ก๐โ1๐ก = 2 โ 1 โ ๐น๐ก๐โ1
๐ ๐๐โ๐0
๐๐
wobei ๐น๐ก๐โ1die kumulative Verteilungsfunktion der ๐ก-Verteilung mit
๐ โ 1 Freiheitsgraden
16
(๐ โ ๐ถ)-Vertrauensintervall fรผr ๐
รquivalente Definitionen:
Enthรคlt wahren Wert ๐ mit Wahrscheinlichkeit 1 โ ๐ผ
Enthรคlt alle Werte ๐0, bei denen โ0: ๐ = ๐0 vs โ๐ด: ๐ โ ๐0 mit Signifikanzniveau ๐ผ nicht verworfen wird
im t-Test Schritt 5: Nicht verwerfen, fallsโฆ
๐๐ โ ๐ ๐๐
๐
< ๐ก๐โ1;1โ๐ผ/2
โฆ und das nach ๐ auflรถsen.
CI: ๐ฅ๐ โ ๐ก๐โ1;1โ๐ผ
2โ ๐๐ฅ
๐; ๐ฅ๐ + ๐ก๐โ1;1โ
๐ผ
2โ ๐๐ฅ
๐
Bsp. Reaktionszeit:
โ8.03 โ 2.03 โ 41.1
36; โ8.03 + 2.03 โ
41.1
36= โ22.2; 5.61 ms
17
Vorzeichentest = Binomialtest
18
1. Modell: ๐1, ๐2, โฆ , ๐๐ ๐. ๐. ๐., die ๐๐ kรถnnen beliebig verteilt sein
2. Nullhypothese: โ0: ๐ = ๐0, ๐ ist der Median
Alternative: โ๐ด: ๐ โ ๐0 (oder einseitig)
3. Teststatistik:
๐: Anzahl ๐๐โs mit ๐๐ > ๐0
Verteilung unter โ0: V โผ Bin(๐, ๐0) mit ๐0 = 0.5
4. Signifikanzniveau: ๐ผ
5. Verwerfungsbereich fรผr die Teststatistik:
๐พ = 0, ๐๐ข โช ๐๐, ๐
Die Grenzen ๐๐ข und ๐๐ mรผssen mit der Binomialverteilung oder der
Normalapproximation berechnet werden.
6. Testentscheid:
Liegt beobachteter Wert ๐ฃ der Teststatistik in ๐พ
Bsp. Vorzeichentest
Angenommen: โ0: ๐ = ๐0 = 10,โ๐ด: ๐ โ 10
Beobachtet: ๐ฅ1 = 13, ๐ฅ2 = 9, ๐ฅ3 = 17, ๐ฅ4 = 8, ๐ฅ5 = 14
Vorzeichen von ๐ฅ๐ โ ๐0: +, -, +, -, +
Mache Binomialtest mit
โ0: ๐ = 0.5,โ๐ด: ๐ โ 0.5๐ = 5, ๐ฃ = 3
Der Vorzeichentest kann genau dann verworfen werden,
wenn der entsprechende Binomialtest verworfen wird.
19
Keine Annahme andie Verteilung
Kleinere Macht
Wilcoxon-Test
Mischung von Vorzeichen- und t-Test
Annahme: ๐๐ โผ โฑ ๐. ๐. ๐. , โฑ ist symmetrisch
Teste Median ๐ = ๐0
(einseitig oder zweiseitig)
20
Bsp. Wilcoxon-Test
โ0: ๐0 = 0
Beobachtet: -1.9, 0.2, 2.9, -4.1, 3.9
Absolutbetrรคge: 1.9, 0.2, 2.9, 4.1, 3.9
Rรคnge der Absolutbetrรคge: 2, 1, 3, 5, 4
Rangsumme der positiven Gruppe: 1+3+4=8
Minimale Rangsumme: 0
Maximale Rangsumme: 1+2+3+4+5=15
Mit :
21
Wilcoxon-Test
Mischung von Vorzeichen- und t-Test
Annahme: ๐๐ โผ โฑ ๐. ๐. ๐. , โฑ ist symmetrisch
Teste Median ๐: โ0: ๐ = ๐0(einseitig oder zweiseitig)
Intuition der Teststatistik
Sortiere ๐ฅ๐ โ ๐0 โ ๐๐ Rรคngen ursprรผngliches Vorzeichen von ๐ฅ๐ โ ๐0 geben
(engl. signed ranks)
Teststatistik ๐: Summe aller Rรคnge mit ๐ฅ๐ โ ๐0 positiv
Falls โ0 stimmt, sollte die Rangsumme nicht zu gross und nicht zu klein sein
22
รbersicht der Tests
Annahmen๐๐๐๐ bei
๐ถ = ๐. ๐๐
Macht
fรผr
Beispiel๐๐ฟ
bekannt๐ฟ๐ โผ ๐
symm.
Verteilungi.i.d.
z-Test โ โ โ โ 1 89%
t-Test โ โ โ 2 79%
Wilcoxon โ โ 6 79%
Vorzeichen โ 5 48%
23
Verwendetes Beispiel:
โข ๐๐ โผ ๐ฉ ๐, ๐2 , ๐ = 10
โข โ0: ๐ = 0; โ๐ด: ๐ โ 0; ๐ผ = 0.05
โข Macht berechnet mit konkreter Alternative: ๐๐ โผ ๐ฉ(1,1)
Stichprobengrรถsse
Annahme:
๐๐ โผ ๐ฉ ๐, ๐2 ๐. ๐. ๐.
๐๐ aus Pilotstudie bekannt
Forderung:
Breite von CI kleiner gleich 2 โ ๐
Gesucht:
๐ =?
Faustregel fรผr 95%-CI:
๐ โฅ 4 โ ๐
๐
2
24
Bsp. Reaktionszeit:
๐ = 41.1 ๐๐
๐ = 10 ๐๐
๐ โฅ 4 โ 41.1
10
2
= 4 โ 16.9 โ 68
Zusammenfassung
25
z-Test - ๐๐ bekannt
t-Test - ๐๐ unbekannt
Vorzeichentest - teste Median!
Wilcoxon-Test - egal welche Verteilung
Hausaufgaben
Skript: Kapitel 4.7 lessen
Serie 9 lรถsen
Quiz 9 bearbeiten
etutoR 7