Statistikpraktikum
Carsten Rezny
Institut fur angewandte MathematikUniversitat Bonn
Sommersemester 2016
Hypothesen
Uberprufung von Hypothesen mit statistischen Tests
Definition
Eine zu prufende Aussage uber Daten einer Stichprobe heißtHypothese.
Hypothesen
Arten von Hypothesen
Unterschiedshypothese Parameter verschiedener(Teil-)Populationen sind verschieden
Beispiel
µ1 6= µ2
Zusammenhangshypothese Es besteht ein Zusammenhangzwischen Merkmalen einer Population
Beispielµ1 ∼ µ2
Hypothesen
gerichtete Hypothese macht eine Richtungsaussage
Beispielµ1 < µ2
ungerichtete Hypothese macht keine Richtungsaussage
Beispiel
µ1 6= µ2
Hypothesen
unspezifische Hypothese qualitative Aussage
Beispielσ1 < σ2
spezifische Hypothese quantitative Aussage
Beispiel
µ1 − µ2 > ∆
Aquivalenzhypothese Spezialfall der gerichteten spezifischenUnterschiedshypothese
Beispiel
|µ1 − µ2| < ∆
Test von Hypothesen
Testkonstruktion mit zwei komplementaren Hypothesen:
Alternativhypothese H1 die vermutete/zu bestatigende Aussage
Nullhypothese H0 Negation von H1:”kein Effekt“
Beispiel (Vergleich der Mittelwerte zweier Populationen)
H1 : µ1 < µ2
H0 : µ1 ≥ µ2
Test von Hypothesen
Definition
Statistischer Test: Entscheidung uber die Ablehnung oderNichtablehnung von H0
Zwei mogliche Ergebnisse
H0 verwerfen (also H1 annehmen)
H0 nicht verwerfen (also H1 nicht annehmen)→keine Aussage uber Gultigkeit von H0
Test von Hypothesen
Aussage uber Populationen auf Grundlage von Stichproben→Wahrscheinlichkeitsaussage
Mogliche Fehler
Fehler 1. Art H0 verworfen, obwohl wahr
Fehler 2. Art H0 beibehalten, obwohl falsch
Gauß-Test
Bedingung fur Behalten/Verwerfen von H0 aufstellenAnnahme: X1,X2, . . . gemaß N(m, σ2) normalverteilt;σ bekannt, m unbekannt
Beispiel
H1 : m 6= µ0
H0 : m = µ0
H0 verwerfen, wenn |x − µ0| > c
→Bestimme c
Gauß-TestWie wahrscheinlich ist Fehler 1. Art?Betrachte P(Stichprobe widerspricht H0 | H0 wahr).
Wahle Signifikanzniveau α: maximal akzeptableWahrscheinlichkeit, einen Fehler 1. Art zu begehen;
gesucht ist c , so dass
P(|X − µ0| > c) = α
Gauß-Test
Mit N(0, 1)-verteilter Teststatistik Zn = |X−µ0|σX
√n
ergibt sich:
Fur |x − µ0| > c gilt: Zn > z1−α/2 →H0 wird verworfen,fur |x − µ0| ≤ c gilt: Zn ≤ z1−α/2 →H0 wird behalten.
zp: p-Quantil der Standardnormalverteilung N(0, 1)
Gauß-Test
Bislang: ungerichtete Hypothese, also symmetrischerAkzeptanzbereich fur H0
→”zweiseitige Fragestellung“
Gerichtete Hypothesen :”einseitige Fragestellung“
H0 : m ≥ µ0 →Verwerfen wenn Zn < zαH0 : m ≤ µ0 →Verwerfen wenn Zn > z1−α
p-Wert
Bisher: Bestimmung von Grenzen fur x bei gegebenem α
Alternative: Bestimmung des sogenannten p-Wertes(Uberschreitungswahrscheinlichkeit)
Definition
Der p-Wert ist die Wahrscheinlichkeit, bei Gultigkeit von H0 denbeobachteten Wert der Teststatistik oder einen in Richtung von H1
extremeren Wert zu erhalten.
p-Wert
Einseitige Fragestellung: p = Pµ0(X ≥ x)
p-Wert
Entsprechend bei zweiseitiger Fragestellung:p = Pµ0(X ≥ µ0 + d) + Pµ0(X ≤ µ0 − d)
mit d = |x − µ0|
p-Wert
Entscheidung uber H0: Vergleich mit vorher festgelegtem α
p ≤ α H0 verwerfen
p > α H0 beibehalten
p-Wert
p-Wert fur Gauß-Test in Excel/OpenOffice
GTEST(data; my; sigma) = 1− Φ(√n(x−µ0)σ ) =: q
(englisch: ZTEST(...))
einseitige Fragestellung:
p1 = MIN(q; 1-q)
zweiseitige Fragestellung:
p2 = 2p1
t-Test
Bei unbekannter Standardabweichung σ:Verwendung der Schatzung der korrigierten StandardabweichungS∗ anstatt σ
Teststatistik
T =X − µ0
S∗√
n
ist t-verteilt.→einfacher t-Test
t-Test
Einfacher t-Test mit Excel/OpenOfficeBei einseitiger Fragestellung:
n = ANZAHL(data)
t = (MITTELWERT(data)− µ0) ∗WURZEL(n)/STABW(data)
p = TVERT(ABS(t);n-1;1)
Bei zweiseitiger Fragestellung:
p = TVERT(ABS(t);n-1;2)
t-Test
Vergleich zweier Stichproben
zwei Messgroßen als Folgen von Zufallsvariablen:X = {X1,X2, . . . ,Xn1}Y = {Y1,Y2, . . . ,Yn2}daraus zwei unabhangige Stichproben xi (i = 1, . . . , n1) undyi (i = 1, . . . , n2)
X und Y normalverteilt mit Mittelwerten µX und µYunbekannt
gleiche Standardabweichungen: σX = σY =: σ unbekannt
mogliche Alternativhypothesen:
µ1 6= µ2
µ1 > µ2
µ1 < µ2
t-Test
Bestimmung des p-Wertes
H0 : µ1 = µ2 p = P(|T | ≥ |t|)p = TTEST(data1; data2; 2; 2)
H0 : µ1 ≤ µ2 p = P(T ≥ t)
H0 : µ1 ≥ µ2 p = P(T ≤ t)p = TTEST(data1; data2; 1; 2)
t-Test
Die Funktion TTEST(data1; data2; tails; type)
data1, data2 zu vergleichende Stichproben
tails 1: einseitiger Test2: zweiseitiger Test
type 1: abhangige (gepaarte) Stichproben2: unabhangige Stichproben mit gleicherStandardabweichung
t-Test
Gepaarte Stichproben
Zufallsvariablen Xi ,Yi seien N(m, σ2)-verteilt
zwei gepaarte Stichproben (xi , yi ) (i = 1, . . . , n)
die paarweisen Differenzen Xdi = yi − xi (i = 1, . . . , n) sindnormalverteilt
Teststatistik t = xdsd
√n
Bestimmung des p-Wertes
H0 : µ1 = µ2 p = P(|T | ≥ |t|)p = TTEST(data1; data2; 2; 1)
H0 : µ1 ≤ µ2 p = P(T ≥ t)
H0 : µ1 ≥ µ2 p = P(T ≤ t)p = TTEST(data1; data2; 1; 1)
VerteilungsfunktionenNormalverteilung in Excel/OpenOffice
NORMVERT(x;m;s;C) Normalverteilung mit m = µ, s = σC=0: WahrscheinlichkeitsdichtefunktionC=1: Verteilungsfunktion (default)
STANDNORMVERT(x) Standardnormalverteilung (µ = 0, σ = 1)
STANDNORMINV(p) p-Quantil der Standardnormalverteilung
STANDNORMINV(p)
STANDNORMVERT(x)
NORMVERT(x;m;s;0)
-4 -2 2 4
-1.0
-0.5
0.5
1.0
1.5
2.0
Verteilungsfunktionen
TVERT(x;n;m)
x Argument der t-Verteilung, ≥ 0
n Zahl der Freiheitsgrade
m”Modus“ ∈ {1, 2}
”Tail-Funktion“
Verteilungsfunktionen
Quantile der t-Verteilung in Excel/OpenOffice
tn,p =
{-TINV(-2*p,n) 0 < p ≤ 1
2
TINV(2*(1-p),n) 12 < p ≤ 1
TINVHp; nL = tn ,1-p�2
tn ,p
0.2 0.4 0.6 0.8 1.0
-3
-2
-1
1
2
3
4