+ All Categories
Home > Documents > 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

Date post: 06-Apr-2015
Category:
Upload: hannelore-adank
View: 107 times
Download: 0 times
Share this document with a friend
84
1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005
Transcript
Page 1: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

1

STATISIK

LV Nr.: 1852

WS 2005/06

15. Dezember 2005

Page 2: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

2

Theorie

• Verteilungen– Diskrete Verteilungen– Stetige Verteilungen

• Stichproben– Verteilung– Grenzwertsätze

• Schätzen

Page 3: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

3

Theoretische Verteilungen• Diskrete Verteilungen

– Binomialverteilung– Hypergeometrische Verteilung– Poissonverteilung– ...

• Stetige Verteilungen– Gleichverteilung– Exponentialverteilung– Normalverteilung– Chi-Quadrat Verteilung– t-Verteilung (Studentverteilung)– F-Verteilung– ...

Page 4: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

4

Binomialverteilung

• Wahrscheinlichkeiten für die Häufigkeit des Eintreffens bestimmter Ereignisse bei Bernoulli-Experimenten berechnen.

• Bernoulli-Experiment: Folge von Bernoulli-Versuchen. Urnenmodell mit Zurücklegen– Es gibt nur 2 mögliche Ausgänge: A und Ā– Wahrscheinlichkeiten für Eintreten von A (θ)

und Ā (1- θ) sind konstant– Versuche sind voneinander unabhängig.

Page 5: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

5

Binomialverteilung

• Bsp. Bernoulli-Experiment: – fünfmaliges Werfen einer Münze,

Zufallsvariable X „Anzahl der Zahlen“, Realisation x = 0, 1, 2, 3, 4, 5

– Wahrscheinlichkeiten für Eintreten von A: W(X=x) = f(x) = ?

Page 6: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

6

Binomialverteilung

• Wahrscheinlichkeit des Auftretens einer bestimmten Realisation x: W(X=x) = f(x)

• Wahrscheinlichkeitsfunktion der Binomialverteilung:

n0,1,...,xfür

sonst0

θ)(1θx

nθ)n,(x;f

xnx

B

Page 7: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

7

Binomialverteilung

• Bsp. Münzwurf (n=5), Wahrscheinlichkeit dass genau 2-mal Zahl geworfen wird: W(X=2)

0,31250,5)(10,52

5(2;5,0.5)f 252

B

Page 8: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

8

Binomialverteilung

• Wahrscheinlichkeit, dass die Zufallsvariable X höchstens den Wert x annimmt: Verteilungsfunktion FB(x;n,θ)

xi n-i

Bi 0

nF (x;n,θ) θ (1 θ)

i

Page 9: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

9

Binomialverteilung

• Bsp. Münzwurf (n=5), Wahrscheinlichkeit dass höchstens 2-mal Zahl geworfen wird: W(X 2)

2i 5-i

Bi 0

5F (2;5,0.5) 0,5 (1 0,5) 0,5

i

Page 10: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

10

Binomialverteilung

• Erwartungswert der Binomialverteilung:

E(X) = n·θ

• Varianz der Binomialverteilung:

Var(X) = n·θ·(1-θ)

• Bsp. Münzwurf: – E(X) = 5·0,5 = 2,5– Var(X) = 5·0,5·(1-0,5) = 1,25

Page 11: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

11

Hypergeometrische Verteilung

• Urnenmodell Ziehen ohne Zurücklegen:– Urne mit N Kugeln (M schwarze, N-M weiße)– Zufallsstichprobe: ziehe n Kugeln ohne

Zurücklegen – Wahrscheinlichkeit, dass unter den n

gezogenen Kugeln genau x schwarze zu finden sind?

• Ziehen ohne Zurücklegen, keine Berücksichtigung der Reihenfolge.

Page 12: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

12

Hypergeometrische Verteilung

• Urnenmodell: – Aus M schwarzen Kugeln genau x auswählen: Anzahl

der Kombinationen

– Aus N-M weißen Kugeln genau n-x auswählen: Anzahl der Kombinationen

– Jede mögl. Stpr. „x schwarze aus M“ kann mit jeder mögl. Stpr. „n-x weiße aus N-M“ kombiniert werden.

– Daher: Gesamtzahl der Möglichkeiten genau x schwarze zu ziehen:

– Gesamtzahl der Möglichkeiten aus N Kugeln n zu ziehen:

M

x

N-M

n-x

N

n

M N-M

x n-x

Page 13: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

13

Hypergeometrische Verteilung

• Wahrscheinlichkeit genau x schwarz Kugeln zu ziehen:

• Wahrscheinlichkeitsfunktion der Hypergeometrischen Verteilung:

M N-M

x n-x

N

n

H

M N-M

x n-x

Nf (x;N,n,M)= für x=0,1,...,n

n

0 sonst

Page 14: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

14

Hypergeometrische Verteilung

• Verteilungsfunktion: Summation der Einzelwahrscheinlichkeiten

• Liefert Wahrscheinlichkeit für „höchstens x schwarze Kugeln“

Page 15: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

15

Hypergeometrische Verteilung

• Bsp. Sortiment von N=8 Dioden, es werden n=3 zufällig gezogen (ohne Zurücklegen), M=5 der Dioden sind defekt.

• Ges: Wahrscheinlichkeit, dass genau 2 (=x) der 3 gezogenen Dioden defekt sind.

M N-M 5 8-5

x n-x 2 3-2 10 3P(X=x)= = = =0,5357

N 8 56

n 3

Page 16: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

16

Hypergeometrische Verteilung

• Erwartungswert:

E(X) = n · M/N

• Varianz

Var(X) = n · M/N · (N-M)/N · (N-n)/(n-1)

• Approximation durch Binomialverteilung: – Wenn N, M, N-M groß und n klein, Parameter

der Binomialverteilung: θ = M/N– Faustregel: Approximation, wenn n/N < 0,05

Page 17: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

17

Poissonverteilung

• Verteilung seltener Ereignisse

• Große Zahl von Versuchen n, Wahrscheinlichkeit θ für Auftreten eines Ereignisses sehr klein

• Wahrscheinlichkeitsfunktion: x -μ

P

μ ef (x;μ)= für x=0,1,...x!

0sonst

Page 18: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

18

Poissonverteilung

• Erwartungswert: E(X) = μ• Varianz: Var(X) = μ• Approximation der Binomialverteilung

durch die Poissonverteilung: – n groß und θ klein, Parameter μ = n·θ– Faustregel: n > 10 und θ < 0,05.

• Approximation der Hypergeometrischen Vt.– M/N = θ klein, N im Vergleich zu n groß,

Parameter μ = n · M/N – Faustregel: M/N < 0,05 und n/N < 0,05

Page 19: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

19

Poissonverteilung

• Bsp. Wahrscheinlichkeit bei einer Prüfung von n=2000 Buchungen genau 3 (=x) Fehlbuchungen zu finden, Anteil der Fehlbuchungen: θ=0,001.

• Poissonverteilung: μ = n·θ = 2x -μ 3 -2μ e 2 e

W(X=x)= = =0,1804x! 3!

Page 20: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

20

Gleichverteilung

• Diskrete Zufallsvariable:

• Jede der k möglichen Ausprägungen hat gleiche Wahrscheinlichkeit

P(X=xi) = 1/k (i=1,…,k)

• Bsp. Wahrscheinlichkeitsverteilung der Augenzahl eines idealen Würfels:

P(X=xi) = 1/6 (i=1,…,6)

Page 21: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

21

Gleichverteilung

• Stetige Zufallsvariable:

• Realisationen der stetigen Zufallsvariablen X liegen im Intervall [a;b]

• Dichtefunktion:

• P(x X x+Δx) = 1/(b-a) · Δx

G

1für a x b

f (x;a,b)= b-a0 sonst

Page 22: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

22

GleichverteilungStetige Gleichverteilung

0

0,2

0 14

x

f(x

;a,b

)

a b

1/(b-a)

x x+Δx

P(xXx+Δx) = 1/(b-a) · Δx

Page 23: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

23

Gleichverteilung

• Verteilungsfunktion (Integration der Dichte)

G

0 für x<a

x-aF (x;a,b)= für a x b

b-a1 für x>b

Page 24: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

24

GleichverteilungStetige Gleichverteilung

0

0,2

0,4

0,6

0,8

1

1,2

0 14

x

F(x

;a,b

)

a b

Page 25: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

25

Gleichverteilung

• Erwartungswert: E(X) = (a+b)/2

• Varianz: Var(X) = (b-a)² / 12

• Bsp. Wegzeit ist gleichverteilt im Intervall [30;40]. Ges. Wahrscheinlichkeit zw. 32 und 35 Min. zu benötigen.

P(32 X 35) = 1/(b-a) · Δx

= 1/(40-30) · (35-32) = 0,3

Durchschnittlich benötigte Zeit: E(X) = 35

Page 26: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

26

Normalverteilung

• Wichtigste theoretische Verteilung:

• Normalverteilung: – stetige Verteilung – symmetrische Dichtefunktion– S-förmige Verteilungsfunktion– Erwartungswert: E(X) = µ– Varianz: Var(X) = σ²– Maximum der Dichte bei x=µ– Wendepunkte bei x=µσ

Page 27: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

27

Normalverteilungen

• Normalverteilung:

• Dichtefunktion (für -∞<x<+∞ und σ>0) :

• Verteilungsfunktion:

21 x μ

2 2 σn 2

1f (x;μ,σ ) e

2πσ

21 v μx

2 2 σn 2

1F (x;μ,σ ) e dv

2πσ

Page 28: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

28

Normalverteilung

• Normalverteilungen mit unterschiedlichen Parametern

Normalverteilung

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-6 -4 -2 0 2 4 6 8 10 12

x

f(x

)

N(4,3) N(0,1) N(2,2)

Page 29: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

29

Normalverteilung

• VerteilungsfunktionVerteilungsfunktion Normalverteilung

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-4 -3 -2 -1 0 1 2 3 4

x

F(x

)

µµ-σ µ+σµ-2σ µ+2σµ-3σ µ+3σ

Page 30: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

30

Normalverteilung

• Standardnormalverteilung:– Erwartungswert µ = 0– Varianz σ² = 1

• Dichtefunktion: 2z

2

1

n e2π

1(z;0,1)f

Page 31: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

31

Normalverteilung

• StandardnormalverteilungStandardnormalverteilung

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

-4 -3 -2 -1 0 1 2 3 4

z

f(z)

68,27%95,45%

99,73%

WP WP

Page 32: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

32

Normalverteilung

• Approximation durch Normalverteilung: Mit wachsendem n nähern sich viele theoretische Vt. der Normalverteilung

• Empirische Verteilungen lassen sich ebenfalls oft durch die N-Vt. annähern.

Page 33: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

33

Normalverteilung

• Reproduktionseigenschaft (od. Additivitäts- eigenschaft) der Normal-Vt.

• Additionstheorem der Normalverteilung: – Die Summe (X) von n unabhängig normalverteilten

Zufallvariablen X1,…,Xn ist ebenfalls normalverteilt.

X = X1 + … + Xn – Der Erwartungswert von X ist die Summe der einzelnen

Erwartungswerte μ1,…,μn

E(X) = μ = μ1 + … + μn – Die Varianz von X ist die Summe der einzelnen

Varianzen σ1²,…σn

²

Var(X) = σ² = σ1² + … + σn

²

Page 34: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

34

Stichproben

• Arithmetische Mittel der Stichprobe:

• Varianz der Stichprobe:

• Anteilswert P einer Stichprobe:

n

1iix

n

1x

n

1i

2i

2 )x(x1n

1s

n

xp

Page 35: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

35

Stichprobenverteilung

• Verteilung des arithmetischen Mittels der Stichprobe (Zufallsstichprobe): – Zufallsvariable X1,…,Xn

– Konkrete Realisation: x1,…,xn

• Arithmetische Mittel:

– Arithm. Mittel von ZV ist wieder eine ZV (Funktion von n ZV)

n

1iiX

n

1X

Page 36: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

36

Stichprobenverteilung

• Erwartungswert der Verteilung des arithmetischen Mittels:

• Varianz der Verteilung des arithm. Mittels

• Standardabweichung od. Standardfehler

μXn

1E)XE(

n

1ii

n

σX

n

1Var)XVar(

2n

1ii

n

σ)XVar(σX

Page 37: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

37

Stichprobenverteilung

• Erwartungswert u. Varianz bekannt

• Verteilung des arithm. Mittels?

• Annahme: Grundgesamtheit ist N(μ,σ²)-vt. – Reproduktionseigenschaft der N-Vt: Summe

von n unabhängig normal-vt. ZV ist wieder n-vt– Daher ist auch das arithm. Mittel normalverteilt

Page 38: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

38

Grenzwertsätze

Verhalten des Mittelwert von n unabhängig identisch verteilten (i.i.d.) ZV X1,…,Xn, wenn n laufend erhöht wird (n→∞)

• Gesetz der Großen Zahlen

• Satz von Glivenko-Cantelli

• Zentraler Grenzwertsatz

Page 39: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

39

Grenzwertsätze

• Gesetz der Großen Zahlen:

• Beinhaltet die Aussage, dass sich der Mittelwert mit wachsendem n immer mehr um den gemeinsamen Erwartungswert µ der Xi konzentriert.

0εWerteallefür0εμXn

1W

n

n

1ii

0εμXWnn

Page 40: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

40

Grenzwertsätze

• Gesetz der Großen Zahlen:

• Beinhaltet die Aussage, dass der Wert der empirischen Verteilungsfunktion an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X konvergiert.

n X nW S (t)-F (t) ε 0 für alle Werte ε>0

Page 41: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

41

Grenzwertsätze

• Satz von Glivenko-Cantelli:

• Wert der empirischen Verteilungsfunktion konvergiert an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X.

10(t)F(t)SsupWnXn

t

Page 42: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

42

Grenzwertsätze

• Zentraler Grenzwertsatz:

• Aussage über die Form der Verteilung des Mittelwertes (standardisierte ZV Zn). Die Verteilungsfunktion von Zn konvergiert gegen die Standardnormalverteilung

(Φ … Vt-Fkt. der N(0,1) Vt.)

1)Var(Z und 0)E(Zmit σ

μXnZ nn

nn

Φ(z)z)W(Znn

Page 43: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

43

Grenzwertsätze

• Aus dem Zentralen Grenzwertsatz folgt: Die Verteilung des arithm. Mittels von n unabhängig identisch verteilten Zufallsvariablen Xi (X1,…,Xn) strebt mit wachsendem Stichprobenumfang n gegen eine Normalverteilung mit dem Erwartungswert µ und Varianz σ²/n.

• Gleichbedeutend: Das arithmetische Mittel ist „asymptotisch normalverteilt“.

• Faustregel: n > 30, N-Vt. ist gute Näherung für die Vt. des arithmetischen Mittels der Stichprobe.

Page 44: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

44

Stichprobenverteilung

• Verteilung der Varianz S² der Stichprobe:

• Annahme: Grundgesamtheit ist N(µ,σ²)-vt. Xi sind n unabhängige normal-vt. ZV mit E(Xi)=µ und Var(Xi)= σ² (i=1,…,n)

• Stichprobenvarianz S² ist eine Funktion von n ZV Xi und somit wieder eine ZV.

n

1i

2i

2 )X(X1n

1S

Page 45: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

45

Stichprobenverteilung

• Verteilung der Varianz S² der Stichprobe:

• Chi-Quadrat Verteilung mit v=n-1 Freiheitsgraden, χ²n-1

• Es gilt:

Ist Z² = Xi² + … + Xn² (Summe von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi), dann folgt Z² einer Chi-Quadrat Verteilung mit v Freiheitsgraden.

Page 46: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

46

Stichprobenverteilung

• χ²v Verteilung: – Erwartungswert: E(Z²)=v– Varianz: Var(Z²)=2v

– Mit wachsendem v nähert sich die χ²v Vt. einer N-Vt. mit Parametern µ=v und σ²=2v.

Page 47: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

47

Stichprobenverteilung

• Anteilswert P einer Stichprobe (P=X/n)

• 2 Modelle: – Ziehen mit Zurücklegen– Ziehen ohne Zurücklegen

• Bsp. Urne, N Kugeln, M schwarz, (N-M) weiße, ziehe n Kugeln (mit bzw. ohne Zurücklegen der gezogenen Kugeln), θ ist die Wahrscheinlichkeit für das Ziehen einer schwarzen Kugel.

Page 48: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

48

Stichprobenverteilung

• Ziehen mit Zurücklegen– Exakte Verteilung: Binomialverteilung

Wahrscheinlichkeitsfunktion der ZV X:

– Erwartungswert: E(X) = nθ– Varianz: Var(X) = nθ(1- θ)

xnxB θ)(1θ

x

nθ)n,(x;f

Page 49: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

49

Stichprobenverteilung

• Ziehen mit Zurücklegen– Erwartungswert des Stichprobenanteilswertes

P: E(P) = 1/n E(x) = θ– Varianz des Stichprobenanteilswertes P:

Var(P) = 1/n² Var(X) = θ(1- θ) / n– Standardfehler des Anteilswertes:

n

θ)θ(1σP

Page 50: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

50

Stichprobenverteilung

• Approximation durch Normalverteilung (Faustregel: nθ(1- θ) ≥ 9)

• Erwartungswert: E(P) = µ = nθ

• Varianz: Var(P) = σP² = nθ(1- θ)

Page 51: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

51

Stichprobenverteilung

• Ziehen ohne Zurücklegen– Exakte Verteilung: Hypergeometrische Vt. – Wahrscheinlichkeitsfunktion der ZV X:

– Erwartungswert: E(X) = n M/N– Varianz: Var(X) = nθ(1- θ) · (N-n)/(N-1)

n

N

xn

MN

x

M

M)n,N,(x;fH

Page 52: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

52

Stichprobenverteilung

• Ziehen ohne Zurücklegen:– Erwartungswert des Stichprobenanteilswertes:

E(P) = 1/n E(X) = θ – Varianz des Stichprobenanteilswertes:

Var(P) = 1/n² Var(X) = θ(1- θ)/n · (N-n)/(N-1)– Standardfehler des Anteilswertes:

– Endlichkeitskorrektur = 1 setzen, wenn n bzgl. N sehr klein ist (Faustregel: n/N < 0,05)

1N

nN

n

θ)θ(1σP

Page 53: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

53

Stichprobenverteilung

• Approximation durch Normalverteilung

µ = E(P) = θ

σ² = Var(P) = θ(1- θ)/n · (N-n)/(N-1)

Page 54: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

54

Stichprobenverteilung

• Die Stichprobenverteilungen des arithmetischen Mittels, der Varianz und des Anteilswertes können also durch die Normalverteilung approximiert werden.

Page 55: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

55

Stichprobenverteilung

• Differenz zweier arithmetischer Mittel:

• Annahmen: – 2 unabhängige Stichproben– Beide Grundgesamtheiten sind annähernd N-vt

• Stichprobenverteilung der Differenz: N-Vt – Erwartungswert:

– Varianz:

212121 μμ)XE()XE()XXE(E(D)

2

22

1

21

2121 n

σ

n

σ)XVar()XVar()XXVar(Var(D)

Page 56: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

56

Stichprobenverteilung• Differenz zweier Anteilswerte:

• Annahmen: – 2 unabhängige Stichproben

– P1, P2 annähernd n-vt. und N1, N2 so groß, dass Endlichkeitskorrektur vernachlässigbar ist.

• Stichprobenverteilung: N-Vt – Erwartungswert:

– Varianz: 212121 θθ)E(P)E(P)PE(PE(D)

2

22

1

1121 n

)θ(1θ

n

)θ(1θ)PVar(PVar(D)

Page 57: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

57

Stichprobenverteilung

• Quotient zweier Varianzen:

• Annahmen: – 2 unabhängige Stichproben (n1, n2)

– σ1² und σ2² aus n-vt Grundgesamtheiten

– Quotient:

22

22

21

21

/σS

/σSF

Page 58: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

58

Stichprobenverteilung

• Stichprobenverteilung: F-Verteilung mit v1 und v2 Freiheitsgraden, Fv1,v2. Für v2 > 2 gilt:– Erwartungswert: E(F) = v2 / (v2-2)

– Varianz:

4)(v2)(vv

2)v(v2vVar(F)

22

21

2122

Page 59: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

59

Schätzverfahren

• Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss)

• Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss)

• Unterscheidung: – Punktschätzer (einziger Schätzwert)– Intervallschätzer (Konfidenzintervall)

Page 60: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

60

Schätzverfahren

• Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. – Bsp. Schätze das unbekannte arithm. Mittel einer

Grundgesamtheit μ durch das arithm. Mittel der Stichprobe

• Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein.

x

Page 61: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

61

Schätzverfahren

• Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall).

• Irrtumswahrscheinlichkeit ≤ α

• Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall)

Page 62: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

62

Schätzverfahren

• Ges: Konfidenzintervall für das arithm. Mittel: ZV

• Symmetrische Wahrscheinlichkeitsintervall

• Symmetrie: z(α /2) = –z(1-α/2)

daher: z = –z(1-α/2) und –z = z(α /2) und

α α1

2 2

X-μW(z n z ) 1- α

σ

2X~N(μ,σ )

α1)zσμXzσW(μ XX

Page 63: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

63

Schätzverfahren

• In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α.

• Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. – Varianz σ² der Grundgesamtheit bekannt– Varianz σ² der Grundgesamtheit unbekannt

Page 64: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

64

Schätzverfahren

• Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit:

Konkreter Stichprobenmittelwert XX zσxμzσx

x

Page 65: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

65

Schätzverfahren

• Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit:

• Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet.

• Zufallsvariable:

T ist t- verteilt mit v=n-1 Freiheitsgradenn

SμX

T

Page 66: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

66

Verteilungen

• Es gilt:– Ist T der Quotient einer Standardnormalverteilung und

der Quadratwurzel des Mittelwerts von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi, dann folgt T einer t-Verteilung mit v=n Freiheitsgraden.

• Zufallsvariable:

T ist t- verteilt mit v=n Freiheitsgraden T~tn

• t-Verteilung ist symmetrisch

0

n2i

i=1

XT=

1X

n

Page 67: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

67

Verteilungen

• t- Verteilung mit v Freiheitsgraden:– Erwartungswert (für n>1):

E(T) = 0– Varianz (für n>2):

Var(T) = n / (n-2)

• Für n→∞ geht die t-Verteilung in die N(0,1) über.

• Approximation durch N(0,1)-Vt für n ≥ 30

Page 68: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

68

• Wahrscheinlichkeitsintervall für das arithm. Mittel bei unbekannter Varianz:

• Wobei t = t(1-α/2);n-1 = – t(α/2);n-1 die Punkte sind, bei denen die Verteilungsfunktion der t- Verteilung mit n-1 Freiheitsgraden die Werte 1-α/2 bzw. α/2 besitzt.

Schätzverfahren

α α;n-1 1- ;n-1

2 2

X-μW(t t ) 1- α

S

n

Page 69: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

69

• Konfidenzintervall für das arithm. Mittel bei unbekannter Varianz:

Konkreter Stichprobenmittelwert

Konkrete Stichprobenvarianz

Schätzverfahren

x

XX σ̂txμσ̂tx

Xσ̂

Page 70: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

70

Schätzverfahren

• Konfidenzintervall für den Anteilswert:

• Ann. genügend großer Stichprobenumfang, d.h. Approximation durch N-Vt möglich, E(P) = θ und Var(P) = σP

²

• Standardisierte ZV:

2P

P-θZ=

σ

Page 71: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

71

Schätzverfahren

• Wahrscheinlichkeitsintervall:

• Konfidenzintervall:

• Ist σP unbekannt, verwendet man stattdessen die Stichprobenvarianz des Anteilswertes als Schätzer.

α α1

P2 2

P-θW(z z ) 1- α

P Pp-zσ θ p+zσ

Page 72: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

72

Schätzverfahren

• Konfidenzintervall für die Varianz

• ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1 Freiheitsgraden

• Wahrscheinlichkeitsintervall:

• Konfidenzintervall:

22 2α α

;n-1 1- ;n-1P2 2

(n-1)SW(χ χ ) 1- α

σ

2 2

2 2α α

1- ;n-1 ;n-12 2

(n-1)S (n-1)S;

χ χ

Page 73: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

73

Stichprobenumfang

• Bisher: – Geg: Stichprobenumfang n, Sicherheitsgrad 1-α– Ges: Konfidenzintervall

• Jetzt: – Geg: Konfidenzintervall, Sicherheitsgrad 1-α– Ges: Stichprobenumfang

• Absoluter Fehler Δμ = zσX ist ein Maß für die Genauigkeit der Schätzung

• Breite des Konfidenzintervalls: 2Δμ

Page 74: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

74

Stichprobenumfang

• Frage: Welchen Stichprobenumfang benötigt man, um einen Parameter (arithm. Mittel) bei vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?

2

22

μ)(

σzn

Page 75: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

75

Eigenschaften von Schätzern

Eigenschaften von Schätzfunktionen:

• Erwartungstreue

• Effizienz

• Konsistenz

• Suffizienz

Page 76: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

76

Eigenschaften von Schätzern

• Erwartungstreue

• Eine Schätzfunktion heißt erwartungstreu (unverzerrt, unbiased), wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt.

• Bedingung:

• Es gilt:

Θ)Θ̂E(

μ)XE( 22 σ)E(S

Page 77: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

77

Eigenschaften von Schätzern

• Effizienz:

• Von 2 erwartungstreuen Schätzfunktionen gilt jene als effizienter (wirksamer), die die kleinere Varianz aufweist.

• Eine Schätzfunktion heißt effizient, wenn folgende Bedingungen erfüllt sind:

Θ)Θ̂E( )Θ̂Var()Θ̂Var( *

tionSchätzfunk treueerwartungsbeliebigeΘ̂*

Page 78: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

78

Eigenschaften von Schätzern

• Konsistenz:

• Eine Schätzfunktion heißt konsistent, wenn der Schätzwert bei laufender Vergrößerung des Stichprobenumfangs (n→∞ oder n→N) mit dem zu schätzenden Parameter zusammenfällt.

Page 79: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

79

Eigenschaften von Schätzern

• Suffizienz:

• Eine Schätzfunktion heißt suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden Parameter, welche die Stichprobe enthält ausschöpft.

Page 80: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

80

Schätzverfahren

• Methode der Kleinsten Quadrat

• Maximum Likelihood

• Momentenmethode

Page 81: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

81

Konfidenzintervall

• Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1-α) liegt.

Page 82: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

82

Konfidenzintervall

• Bsp. Arithmetisches Mittel (ist bei N-Vt. Grundgesamtheit bzw. bei genügend großem Stichprobenumfang N-Vt.). Der wahre Parameter µ liegt mit der Wahrscheinlichkeit (1-α) im Intervall

XX

zσX;zσX

Page 83: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

83

KonfidenzintervallKonfidenzintervall für den Parameter µ (bei N-Vt. des Stichprobenmittelwertes)

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Stichprobenmittelwert

Dic

hte

der

N(0

,1)

1-α = 0,95

α/2 = 0,025

Konfidenzintervall

α/2 = 0,025

x-z(α/2)σ x+z(1-α/2)σ

Page 84: 1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005.

84

Konfidenzintervall

• Bsp. Körpergröße: – Mittelwert =173,42– Standardabweichung = 9,54 – N = 73– 2-seitiges KI zum Niveau α=0,05

Wahrscheinlichkeit, dass der wahre Parameter im KI liegt ist 0,95. Quantile der t-Vt: t=±1,99 Quantil der N(0,1)-Vt: z=±1,96

KI [171,19 ≤ µ ≤ 175,65] t-VtKI [171,23 ≤ µ ≤ 175,61] N(0,1)-Vt


Recommended