Download - Sitzung 1 ZEW - Expertenseminar: Einführung in die Ökonometrie WS 2007/2008 Alexander Spermann Universität Freiburg.

Transcript

Sitzung 1

ZEW - Expertenseminar: „Einführung in die

Ökonometrie“

WS 2007/2008Alexander SpermannUniversität Freiburg

Sitzung 1

Alexander SpermannWS 2007/2008

Agenda

1.Grundlagen: Varianz, Kovarianz; Erwartungswert, Korrelationskoeffizient

2. Einfache Regressionsanalyse: Methode der Kleinsten Quadrate

3. Gauss-Markov-Bedingungen: unverzerrter, konsistenter und effizienter Schätzer

4. Hypothesentests: Signifikanzniveau, Konfidenzintervall, t-Test, F-Test, Bestimmtheitsmaß, Standardfehler, Fehler vom Typ 1 und 2, einseitiger und zweiseitiger Test

5. Multiple Regressionsanalyse

6. Dummy-Variablen

7. Problem fehlender Variablen

8. Multikollinearität

Sitzung 1

Alexander SpermannWS 2007/2008

Fragestellung: Wie hoch ist das durchschnittliche Nettoeinkommen eines Haushaltes einer

Stadt? 1. Möglichkeit: Nettoeinkommen aller Haushalte dieser Stadt

(Grundgesamtheit) wird in die Berechnung miteinbezogen.

Durchschnitt wird ausgerechnet.PROBLEM: eine Erhebung ist zu teuer.

2. Möglichkeit: Stichprobe wird gezogen.

Grundgesamtheit und Stichprobe 1

Sitzung 1

Alexander SpermannWS 2007/2008

Grundgesamtheit: Gesamte Menge numerischer Informationen einer

(population) bestimmten Größe, die der Wissenschaftler beobachtet.

Beispiel: Nettoeinkommen aller Haushalte.

Stichprobe: Beobachtete Teilmenge der Werte einer(sample) Grundgesamtheit.

Beispiel: Nettoeinkommen von z.B. 1% aller Haushalte

wird beobachtet. Diese Haushalte werden zufällig gezogen.

Grundgesamtheit und Stichprobe 2

Sitzung 1

Alexander SpermannWS 2007/2008

Mittelwert Summe der numerischen Werte der

(= Durchschnittswert) : Beobachtungen geteilt durch die Anzahl der

(mean) Beobachtungen.

Mittelwert (1)

Sitzung 1

Alexander SpermannWS 2007/2008

Notation: N = Anzahl der Beobachtungen

x1, x2, x3,…,xn – Beobachtungen der Grundgesamtheit

Beispiel: Gegeben sind 7 Monatsgehälter von

Geschäftsführern in Euro: 325033803410

3600329030703450

765

4321

xxx

xxxx

3000€ 3200€ 3600€3400€

Mittelwert (2)

Sitzung 1

Alexander SpermannWS 2007/2008

Durchschnittswert der Grundgesamtheit ist:

Im Beispiel:

i1 2 N i 1

xx x ... x

N N

ii 1

x3450 3070 ... 3250

33507 7

Mittelwert (3)

Sitzung 1

Alexander SpermannWS 2007/2008

Notation: n – Anzahl der Beobachtungen

x1, x2, …, xn – Beobachtungen der Stichprobe

Durchschnittswert der Stichprobe ist:

Beispiel: Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr

sahen wie folgt aus :

13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3%

i1 2 n i 1

xx x ... x

xn n

ii 1

x13,6 25,5 43,6 ( 19,8) ( 13,8) 12,0 36,3 14,3

x 13,968 8

Mittelwert (4)

Sitzung 1

Alexander SpermannWS 2007/2008

Median (median): mittlerer Wert einer geordneten Datenreihe

Beispiel: Gehälter der 7 Geschäftsführer sind nach der Größe wie folgt geordnet::

Median = Wert in der „Mitte“ rechts und

links davon sind jeweils 3 Werte

Median: N ungerade: der mittlere Wert bei einer Reihe nach der Größe geordneten Beobachtungen

N gerade: Durchschnitt der 2 mittleren Werte bei einer Reihe der Größe nach geordneten Beobachtungen

3 070€

3 250€

3 290€

3 380€

3 410€

3 450€

3 600€

Median 1

Sitzung 1

Alexander SpermannWS 2007/2008

Berechnung des Median:

Fall 1: N ungerade: Im Beispiel:

Fall 2: N gerade:

Im Beispiel:

N 1

N N 2

2 2

1(x x )

3000€ 3200€ 3400€ 3600€

Durchschnittswert der Grundgesamtheit, 3350€ = µ

7 1 4

x x VierterbeobachteterWert

Median

Median 2

Sitzung 1

Alexander SpermannWS 2007/2008

Wann Median und wann Mittelwert?

Sollen die Ausreißer einer Stichprobe automatisch aus der

Mittelwertberechnung eliminiert werden, ist die Anwendung des Median eine gute Alternative.

Beispiel: Ermittlung der durchschnittlichen Einkommens- bzw.

Vermögenssituation in einer Stadt.

Einbeziehung der extrem Vermögenden würde das tatsächliche Einkommensbild verzerren!

Median 3

Sitzung 1

Alexander SpermannWS 2007/2008

Neues Beispiel: 7 Geschäftsführer eines zweiten Unternehmens haben folgende Monatsgehälter:

Mittelwert und Median des 1. Unternehmens = Mittelwert und Median des 2. Unternehmens

Die Streuung ist jedoch unterschiedlich:

2 750€

3 160€

3 170€

3 380€

3 490€

3 530€

3 970€

2700€ 3100€ 3500€ 3900€

Unt. 1

Unt. 2

Streuungsmaße

Sitzung 1

Alexander SpermannWS 2007/2008

Streuung: Abweichungen der Beobachtungen vom Durchschnittswert.

(dispersion) x 1- μ, x2 – μ, …,xN- μ

Da manche der Werte kleiner bzw. größer als μ sind, ist

Da das Vorzeichen der Abweichung unwichtigist und alle Werte gleich behandelt werden Betrachtung der quadrierten Werte

Varianz: Durchschnitt der quadrierten Abweichungen(variance) der beobachteten Werte von ihrem Mittelwert.

Varianz ist für den Vergleich zweier oder mehrerer Mengen der Beobachtungen nützlich.

ii 1

(x ) 0

Varianz

Sitzung 1

Alexander SpermannWS 2007/2008

Formel für Varianz:

N N

i i2 i 1 i 1

x x ²µ²

N N

3 450€ 100 10 000

3 070€ -280 78 400

3 290€ -60 3 600

3 600€ 250 62 500

3 410€ 60 3 600

3 380€ 30 900

3 250€ -100 10 000

Σ=0 Σ=169 000

i 11x ( 3.350)i1x i 11(x )²

3 490€ 140 196 00

2 750€ -600 360 000

3 160€ -190 36 100

3 970€ 620 384 400

3 530€ 180 32 400

3 380€ 30 900

3 170€ -180 32 400

Σ=0 Σ=865 800

i2x i 22x ( 3.350) i 22(x )²

169000² 24142,86

Unternehmen 1 Unternehmen 2

Im Beispiel:

865800² 123685,71

Varianz der Grundgesamtheit

Sitzung 1

Alexander SpermannWS 2007/2008

Mit der Standardabweichung (standard deviation) kann man interpretieren, wie weit die beobachteten Werte vom Mittelwert tatsächlich entfernt sind.

Beispiel:

² weichungStandardabVarianz

€4,15586,24142²11

€7,35171,123685²22

Standardabweichung der Grundgesamtheit

Sitzung 1

Alexander SpermannWS 2007/2008

Die Abweichungen der beobachteten Werte vom Mittelwert einer Stichprobe sind:

und die quadrierten Werte entsprechend:

Die Varianz der Stichprobe ist dann:

1 2 nx x,x x,...,x x

n n2

i i2 i 1 i 1

x x x ² nx²s

n 1 n 1

1 2 n(x x)²,(x x)²,...,(x x)²

Da bei der Berechnung der Stichprobenvarianz nicht der Mittelwert der Grundgesamtheit µ, sondern der Mittelwert der Stichprobe als Schätzer (proxy) verwendet wird, dividiert man als „Kompensation“ durch (n -1), anstatt durch n.

Varianz der Stichprobe 1

Sitzung 1

Alexander SpermannWS 2007/2008

n 8 x 13,96%

ii 1

x ² (13,6)² (25,2)² ... (14,3)² 4984,83

ii 1

x ² nx²4984,83 (8)(13,9625)²

s ² 489,3170n 1 7

Beispiel: Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr sahen wie

folgt aus :

13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3%

Die Summe der Quadrate der beobachteten Werte ist:

Die Varianz der Stichprobe:

Varianz der Stichprobe 2

Sitzung 1

Alexander SpermannWS 2007/2008

Notation:

Standardabweichung der Stichprobe aus dem Beispiel ist:

xx xxs ² s

xx xxs s ² 489,3170 22,1

Standardabweichung der Stichprobe

Sitzung 1

Alexander SpermannWS 2007/2008

Zufallsexperiment: Vorgang, der zu einer von

(random experiment) mindestens 2 möglichen Ausprägungen führt,

wobei es unbekannt ist, zu welcher.

Stichprobenraum S: Menge aller möglichen (sample space) Ausprägungen.

Es können nicht gleichzeitig zwei Ausprägungen auftreten, aber eine muss auftreten.

Zufallsexperiment 1

Sitzung 1

Alexander SpermannWS 2007/2008

Beispiele:

Ein Vorgang wird beobachtet:• Werfen einer Münze• Werfen eines Würfels

Mögliche Ausprägungen:• entweder Kopf oder Zahl• 1,2,3,4,5,6

Stichprobenraum:• S=(Kopf, Zahl)• S=(1,2,3,4,5,6)

Zufallsexperiment 2

Sitzung 1

Alexander SpermannWS 2007/2008

Ereignis: Eine Teilmenge möglicher Ausprägungen mit dem

(event) gleichen Merkmal.

Notation: Großbuchstaben, z.B. A, B,...,Z

Beispiel:Ereignis A/B: Eintreten einer ungeraden

/geraden Zahl beim Werfen eines Würfels.

Ergebnis eines Würfelwurfs z.B. 3 Ereignis A eingetreten.

Zufallsexperiment 3

Sitzung 1

Alexander SpermannWS 2007/2008

Bezeichnung: P (probability)

Ein Zufallsexperiment soll stattfinden.Wie groß ist die Wahrscheinlichkeit P bzw. die Chance, dass ein Ereignis

eintritt?

1. Wahrscheinlichkeit als relative Häufigkeit : P liegt immer zwischen 0 und 1: 0: ein Ereignis tritt auf

keinen Fall ein1: ein Ereignis tritt sicher ein

Beispiel: Münze wird geworfen.Ereignis A: Kopf, zu 50%Ereignis B: Zahl, zu 50%

In beiden Fällen P=0,5

Wahrscheinlichkeit

Sitzung 1

Alexander SpermannWS 2007/2008

Was tun, wenn ein Experiment gar nicht oder zumindest nicht unter gleichen

Umweltbedingungen wiederholt werden kann – Bsp. Konjunktur?

2. Wahrscheinlichkeit als subjektive Wahrscheinlichkeit :

Bezeichnung: Psubj

Die subjektive Wahrscheinlichkeit beschreibt den rein individuellen Glauben über die Chance, dass ein bestimmtes Ereignis bei begrenzter Anzahl der Experiment eintritt. Zudem hängt sie von den gegebenen Informationen sowie

ihrer persönlichen Interpretation ab. Gutes Bsp. sind Investitionsentscheidungen bezüglich entsprechender Gewinnerwartungen.

Subjektive Wahrscheinlichkeit

Sitzung 1

Alexander SpermannWS 2007/2008

Zufallsvariablen: Ausprägungen eines Zufallsexperimentes: (random variable) 1. diskret: gutes / defektes Produkt (gut = 1,

defekt = 2) 2. stetig: Familieneinkommen

Wichtige Unterscheidung zwischen:einer Zufallsvariable X und dem Wert x, den sie annimmt.

Zufallsvariable 1

Sitzung 1

Alexander SpermannWS 2007/2008

Beispiel 1: Beispiel 2:Werfen eines Würfels ProduktionZufallsvariable X = Augenzahl Zufallsvariable X = Qualität des

Produktes6 Ausprägungenx = 1, x = 2, ..., x =6 2 Ausprägungen: x = 1,

x = 2

wobei 1=gut, 2=defekt

Diskrete Zufallsvariable: Nimmt nur eine abzählbare Anzahl an Ausprägungen an.

Zufallsvariable 2

Sitzung 1

Alexander SpermannWS 2007/2008

Wahrscheinlichkeitsfunktion: gibt die Wahrscheinlichkeit wieder, dass eine =Dichtefunktion diskrete Zufallsvariable X die Ausprägung x

(probability function) annimmt: Px ( x ) = P( X = x )

Die Wahrscheinlichkeiten aller Ausprägungen summieren sich auf 1:

Beispiel: X = Augenzahl bei geworfenem Würfel

1P(X 1) P(X 2) ... P(X 6)

P (X) P(X x) für x 1,2,3,...,66

Wahrscheinlichkeits-/ Dichtefunktion für das Bsp. mit unabhängigen Ereignissen

P (x) 1

1 2 3 4 5 60

1/6

XP (x)

Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable

Sitzung 1

Alexander SpermannWS 2007/2008

Beziehung zwischen Wahrscheinlichkeitsfunktion und kumulierter Wahrscheinlichkeitsfunktion (cumulative probability function) ist gegeben als:

Die kumulierte Wahrscheinlichkeitsfunktion des Würfelbeispiels:

X 0 0

0 wenn x 1

jF (x ) wenn j x j 1 (j 1,2,...,5)

61 wenn x 6

1 2 3 4 5 60

1/2

Grafik der kumulierten Wahrscheinlichkeitsfunktion aus dem Beispiel:

X 0F (x )

X 0 0 Xx x

F (x ) P(X x ) P (x)

Für P(X3) = Px(X=1)+Px(X=2)+Px(X=3)= 0,5

Kumulierte Wahrscheinlichkeitsfunktion

einer diskreten Zufallsvariablen 1

Sitzung 1

Alexander SpermannWS 2007/2008

Beispiel: Korrektur einer Stichprobe von Büchern, Zufallsvariable X =Tippfehler auf einer Seite• 81% der Seiten hatten keinen Tippfehler der Wert der

Zufallsvariable x = 0• 17% hatten einen Tippfehler x = 1• 2% hatten zwei Tippfehler x = 2

Dies kann man schreiben als:

Px (0) = 0,81 Px (1) = 0,17 Px (2) = 0,02

Um einen repräsentativen Mittelwert zu bekommen, müssen die jeweiligen Werte mit ihren Wahrscheinlichkeiten gewichtet werden Erwartungswert (expected value)

Erwartungswert einer diskreten Zufallsvariable 1

Sitzung 1

Alexander SpermannWS 2007/2008

Durch das Berechnen des Erwartungswertes erhalten wir den mittleren Wert einer diskreten Zufallsvariable. E(X) wird dann der Mittelwert der diskreten Zufallsvariable genannt.

Notation:

Beispiel:

X Xx

E(X) xP (x)

XE(X Tippfehler) 0*0,81 1*0,17 2*0,02 0,21

d.h. dass im Mittel auf jeder Seite 0,21 Tippfehler bzw.auf etwa jeder 5. Seite ein Tippfehler zu erwarten ist

Erwartungswert einer diskreten Zufallsvariable 2

Sitzung 1

Alexander SpermannWS 2007/2008

Varianz: Der Erwartungswert der quadrierten Streuung (X – μ x)² gewichtet mit der Wahrscheinlichkeit

Notation:

Standardabweichung: Quadratwurzel der Varianz

Notation: σx

X X X Xx

² E (X )² (x )²P (x)

Erwartungswert, Varianz und Standardabweichung 1

Sitzung 1

Alexander SpermannWS 2007/2008

Beispiel: Tippfehler Um die Varianz zu finden, muss zuerst der Erwartungswert

gefunden werden:

Varianz:

und die Standardabweichung entsprechend:

XE(X Tippfehler) 0,21

X X Xx

² (x µ )²P (x)

(0 0,21)² * 0,81 (1 0,21)² * 0,17 (2 0,21)² * 0,02 0,2059

X X ² 0,2059 0,45

Erwartungswert, Varianz und Standardabweichung 2

Sitzung 1

Alexander SpermannWS 2007/2008

Stetige Zufallsvariablen: Nicht abzählbare Anzahl an Werten

(continuous random variable) auf einem ‚Wertestrahl‘ (Kontinuum).

Beispiele: Zeit, Entfernung, Temperatur.

Verteilungsfunktion einer stetigen Zufallsvariable:Wahrscheinlichkeit, dass X den Wert x nicht übersteigt.

Notation:

Verteilungsfunktion einer stetigen Zufallsvariable entspricht der kumulierten Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable.

XF (x) P(X x)

Verteilungsfunktion einer stetigen Zufallsvariable 1

Sitzung 1

Alexander SpermannWS 2007/2008

Beispiel: Nehmen wir an, dass ein Tunnel genau 1 km lang ist. Es werden die Unfälle im Tunnel beobachtet. Zufallsvariable: X = Entfernung vom Eingang des Tunnels zum Zeitpunkt des Unfalls.Die Wahrscheinlichkeit, dass ein Unfall passiert, ist für jede Teilstrecke gleich.

Verteilungsfunktion dieser Grafik zum Beispiel:

Zufallsvariable ist:

0 für x 0

F (x) x für 0 x 1

1 für x 1

0 1

x in km

Fx(

Verteilungsfunktion einer stetigen Zufallsvariable 2

Sitzung 1

Alexander SpermannWS 2007/2008

Es ist unmöglich, die Wahrscheinlichkeit für einen bestimmten Wert, den die Zufallsvariable annimmt, zu berechnen.

Es kann nur die Wahrscheinlichkeit berechnet werden, dass die Zufallsvariable einen Wert zwischen den Werten a und b annimmt.

Diese Wahrscheinlichkeit ist: P (a < x < b) = Fx (b) – Fx (a)

Im Beispiel: Da die Zufallsvariable zwischen 0 und 1 einheitlich verteilt ist, ist die Verteilungsfunktion in diesem Bereich:

F x(x) = x

Für a=1/4 und b=3/4 ist die Wahrscheinlichkeit, dass ein Unfall in diesem Bereich liegt:

P (1/4< x < 3/4) = Fx (3/4) – Fx (1/4) = 3/4 – 1/4= 1/2

Verteilungsfunktion einer stetigen Zufallsvariable 3

Sitzung 1

Alexander SpermannWS 2007/2008

Die Dichtefunktion für eine stetige Zufallsvariable X ist eine Funktion mit folgenden Eigenschaften:

fX (x) ≥ 0 für alle x - Werte

Grafik der Dichtefunktion: a und b sind Werte der Zufallsvariable X,wobei a<b. Die Wahrscheinlichkeit, dass x zwischen a und b liegt, ist der Bereich unter der Kurve zwischen diesen zwei Werten.

Beispiel:

fx(x

)

a b

Dichtefunktion einer stetigen Zufallsvariable 1

Sitzung 1

Alexander SpermannWS 2007/2008

Eigenschaften der Dichtefunktion:

• Die Fläche unter der Dichtefunktion entspricht dem Wert 1.

• Die Fläche unter der Kurve der Dichtefunktion, fX (x) , links von dem Wert x0 ist F x(x0) , wobei x0 irgendein Wert ist, den die Zufallsvariable annehmen kann.

Dichtefunktion einer stetigen Zufallsvariable 2

Sitzung 1

Alexander SpermannWS 2007/2008

Gesamtfläche = 1

1/4

1/2

3/4

a b 1

= 0,5

Fx(x)

F(b)=3/4

F(a)=1/4

1/4

1/2

3/4

=0,5 (50%)

0 b ¾*1km=750m

a¼*1km=250m

Gesamtfläche = 1xf (x)

Dichte- und Verteilungsfunktion einer stetigen Zufallsvariable 3 –

laut Beispiel

Sitzung 1

Alexander SpermannWS 2007/2008

Stetige Verteilung, die in der Statistik eine zentrale Rolle spielt.

Eine Zufallsvariable X ist normalverteilt wenn ihre Dichtefunktion wie folgt aussieht:

Und:

•

(x µ)² / 2 ²X

1f (x) e für x

2 ²

2µ 0

e 2,71828...; 3,14159...

fx(x

)

xµ

, wobei die Varianz immer positiv ist.

Die Normalverteilung 1

Sitzung 1

Alexander SpermannWS 2007/2008

Eigenschaften:

• Der Mittelwert der Zufallsvariable ist µ,

also: E (X) = μ• Die Varianz der Zufallsvariable ist σ²

also:

• mit Standardabweichung: = σ wobei gilt: je kleiner σ² , desto „enger“ liegt die Verteilung um den

wahren Wert• Die Form der Dichtefunktion ist eine symmetrische Glockenkurve mit

dem Zentrum im Mittelwert µ.

Notation: X~ N (µ ,σ²)

Var(X) E (X µ)² ²

Die Normalverteilung 2

Sitzung 1

Alexander SpermannWS 2007/2008

0,05

0,1

0,15

0,2

0,25

0,3

-5 -4 -3 -2 -1 0 1 2 3 4 5 6 7

Dich

te f(x

)

0,1

0,2

0,3

0,4

0,5

-5 -4 -3 -2 -1 0 1 2 3 4 5

Dich

te f(x

)

Standardnormalverteilung

mit =1 und =0

2=1,44 und =0

2=4 und =0

2=2,25 und =3

=2,25 und =1

)(xf X )(xf X

Die Normalverteilung 3

Sitzung 1

Alexander SpermannWS 2007/2008

Gezogene Zufallsstichproben der Grundgesamtheit sind:

X1,X2,X3,…,Xn

Der Stichprobenmittelwert ist dann:

Es gilt, dass der Erwartungswert der Summe der Stichprobe gleich der Summe der Erwartungswerte ist:

Da jede Zufallsstichprobe Xi den Mittelwert μX hat, können wir schreiben:

ii 1

1X X

)(...)()()( 211

ii XEXEXEXE

i Xi 1

E( X ) nµ

Stichprobe und Grundgesamtheit:Erwartungswert 1

Sitzung 1

Alexander SpermannWS 2007/2008

Der Erwartungswert des Mittelwertes der Stichprobe ist dann:

Also entspricht der Erwartungswert des Mittelwertes der Stichprobe dem Mittelwert der Grundgesamtheit. Das heißt, dass der Mittelwert der Stichprobe ein erwartungstreuer Schätzer für den Mittelwert der Grundgesamtheit ist.

n n

Xi i X

i 1 i 1

nµ1 1E(X) E( X ) E( X ) µ

n n n

Stichprobe und Grundgesamtheit:Erwartungswert 2

Sitzung 1

Alexander SpermannWS 2007/2008

Erwartungswert des Schätzers = wahrer Wert, d.h. unverzerrt (unbiased).

)(xf n = 100

n=25

100x

Dichtefunktionen der Normalverteilung für wahre Stichprobenmittelwertevom Umfang n=25 und n=100 Beobachtungen, mit der Standardabweichung=5.

Stichprobe und Grundgesamtheit:Erwartungswert 3

Sitzung 1

Alexander SpermannWS 2007/2008

Beispiel: Es sollen Arbeitsteams aus jeweils 4 Beschäftigten mit Berufserfahrung von 2 bis 8Jahren zusammengestellt werden. Es werden fünfzehn Stichproben von vierBeobachtungswerten aus einer Grundgesamtheit von sechs „Werten“: 2,4,6,6,7,8,gezogen.

•

Stichprobe Mittelwert Stichprobe

Mittelwert

2,4,6,6 4,5 2,6,7,8 5,75

2,4,6,7 4,75 2,6,7,8 5,75

2,4,6,8 5 4,6,6,7 5,75

2,4,6,7 4,75 4,6,6,8 6

2,4,6,8 5 4,6,7,8 6,25

2,4,7,8 5,25 4,6,7,8 6,25

2,6,6,7 5,25 6,6,7,8 6,75

2,6,6,8 5,5

Der wahre Mittelwert (sample mean) dieser Grundgesamtheit ist der Durchschnitt dieser

sechs Werte: μX =5,5

Stichprobe und Grundgesamtheit:Erwartungswert 4

Sitzung 1

Alexander SpermannWS 2007/2008

Die Häufigkeitsverteilung der Wahrscheinlichkeiten von Mittelwerten der Stichproben (sampling distribution of the sample mean) ist:

Der Erwartungswert des Mittelwertes der Stichprobe entspricht dem Mittelwert der Grundgesamtheit:

1 2 1E(X) xP (x) 4,5 4,75 * ... 6,75 * 5,5

15 15 15

1)75,6(

2)25,6(

1)6(

3)75,5(

1)5,5(

2)25,5(

2)5(

2)75,4(

1)5,4(

XXX

PPP

Stichprobe und Grundgesamtheit:Erwartungswert 5

Sitzung 1

Alexander SpermannWS 2007/2008

Es werden n Beobachtungen X1,X2,X3,…,Xn aus der Grundgesamtheit zufälliggezogen, wobei der wahre Mittelwert und die wahre Varianz unbekannt sind. Die Varianz der Grundgesamtheit ist:

Da aber μX unbekannt ist, wird es durch (= Mittelwert der Stichprobe) geschätzt.

Die Varianz der Stichprobe lautet:

Mit Hilfe dieser Definition der SXX² kann gezeigt werden, dass

Das bedeutet, dass der erwartete Wert der Stichprobenvarianz der Varianz derGrundgesamtheit entspricht. Man sagt dann, dass der Schätzer für die Varianzerwartungstreu ist.

)²(² XX µXE

)²(1

1²

iiXX XX

²²)( XXXsE

Stichprobe und Grundgesamtheit:Varianz 1

Sitzung 1

Alexander SpermannWS 2007/2008

Kovarianz einer Stichprobe:

XY i ii 1

1s (x x)(y y)

n 1

wegen der Approximation von µ durch und ŷ wird als „Kompensation“ durch (n-1), anstatt durch n dividiert, d.h es wird ein Freiheitsgrad „aufgegeben“.

Kovarianz

Sitzung 1

Alexander SpermannWS 2007/2008

Erläuterung: S : Anzahl der Jahre in Ausbildung Y : Stundenlohn in Dollar (1992)

Quelle:Dougherty

Kovarianz einer Stichprobe – ein Beispiel

Sitzung 1

Alexander SpermannWS 2007/2008

Illustration der Kovarianz:

Quelle:Dougherty

294,152 SYs

Interpretation von SSY2 = 15,294 :

es liegt positiver Zusammenhang vors= 14,225 undy = 13,250

Kovarianz einer Stichprobe – ein Beispiel

Sitzung 1

Alexander SpermannWS 2007/2008

•

Quelle: Dougherty

Nach Multiplikation von Y mit 100, SSY‘

2 = 1529,4 d.h. trotz Änderung der Dimension bleibt der Zusammenhang unverändert und wird lediglich in eine andere Größenordnung (*100) transformiert.

Vergleich Kovarianz und Korrelationskoeffizient – ein Beispiel