Sitzung 1
ZEW - Expertenseminar: „Einführung in die
Ökonometrie“
WS 2007/2008Alexander SpermannUniversität Freiburg
2
Sitzung 1
Alexander SpermannWS 2007/2008
Agenda
1.Grundlagen: Varianz, Kovarianz; Erwartungswert, Korrelationskoeffizient
2. Einfache Regressionsanalyse: Methode der Kleinsten Quadrate
3. Gauss-Markov-Bedingungen: unverzerrter, konsistenter und effizienter Schätzer
4. Hypothesentests: Signifikanzniveau, Konfidenzintervall, t-Test, F-Test, Bestimmtheitsmaß, Standardfehler, Fehler vom Typ 1 und 2, einseitiger und zweiseitiger Test
5. Multiple Regressionsanalyse
6. Dummy-Variablen
7. Problem fehlender Variablen
8. Multikollinearität
3
Sitzung 1
Alexander SpermannWS 2007/2008
Fragestellung: Wie hoch ist das durchschnittliche Nettoeinkommen eines Haushaltes einer
Stadt? 1. Möglichkeit: Nettoeinkommen aller Haushalte dieser Stadt
(Grundgesamtheit) wird in die Berechnung miteinbezogen.
Durchschnitt wird ausgerechnet.PROBLEM: eine Erhebung ist zu teuer.
2. Möglichkeit: Stichprobe wird gezogen.
Grundgesamtheit und Stichprobe 1
4
Sitzung 1
Alexander SpermannWS 2007/2008
Grundgesamtheit: Gesamte Menge numerischer Informationen einer
(population) bestimmten Größe, die der Wissenschaftler beobachtet.
Beispiel: Nettoeinkommen aller Haushalte.
Stichprobe: Beobachtete Teilmenge der Werte einer(sample) Grundgesamtheit.
Beispiel: Nettoeinkommen von z.B. 1% aller Haushalte
wird beobachtet. Diese Haushalte werden zufällig gezogen.
Grundgesamtheit und Stichprobe 2
5
Sitzung 1
Alexander SpermannWS 2007/2008
Mittelwert Summe der numerischen Werte der
(= Durchschnittswert) : Beobachtungen geteilt durch die Anzahl der
(mean) Beobachtungen.
Mittelwert (1)
6
Sitzung 1
Alexander SpermannWS 2007/2008
Notation: N = Anzahl der Beobachtungen
x1, x2, x3,…,xn – Beobachtungen der Grundgesamtheit
Beispiel: Gegeben sind 7 Monatsgehälter von
Geschäftsführern in Euro: 325033803410
3600329030703450
765
4321
xxx
xxxx
3000€ 3200€ 3600€3400€
Mittelwert (2)
7
Sitzung 1
Alexander SpermannWS 2007/2008
Durchschnittswert der Grundgesamtheit ist:
Im Beispiel:
N
i1 2 N i 1
xx x ... x
N N
7
ii 1
x3450 3070 ... 3250
33507 7
Mittelwert (3)
8
Sitzung 1
Alexander SpermannWS 2007/2008
Notation: n – Anzahl der Beobachtungen
x1, x2, …, xn – Beobachtungen der Stichprobe
Durchschnittswert der Stichprobe ist:
Beispiel: Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr
sahen wie folgt aus :
13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3%
n
i1 2 n i 1
xx x ... x
xn n
8
ii 1
x13,6 25,5 43,6 ( 19,8) ( 13,8) 12,0 36,3 14,3
x 13,968 8
Mittelwert (4)
9
Sitzung 1
Alexander SpermannWS 2007/2008
Median (median): mittlerer Wert einer geordneten Datenreihe
Beispiel: Gehälter der 7 Geschäftsführer sind nach der Größe wie folgt geordnet::
Median = Wert in der „Mitte“ rechts und
links davon sind jeweils 3 Werte
Median: N ungerade: der mittlere Wert bei einer Reihe nach der Größe geordneten Beobachtungen
N gerade: Durchschnitt der 2 mittleren Werte bei einer Reihe der Größe nach geordneten Beobachtungen
3 070€
3 250€
3 290€
3 380€
3 410€
3 450€
3 600€
Median 1
10
Sitzung 1
Alexander SpermannWS 2007/2008
Berechnung des Median:
Fall 1: N ungerade: Im Beispiel:
Fall 2: N gerade:
Im Beispiel:
N 1
2
x
N N 2
2 2
1(x x )
2
3000€ 3200€ 3400€ 3600€
Durchschnittswert der Grundgesamtheit, 3350€ = µ
7 1 4
2
x x VierterbeobachteterWert
Median
Median 2
11
Sitzung 1
Alexander SpermannWS 2007/2008
Wann Median und wann Mittelwert?
Sollen die Ausreißer einer Stichprobe automatisch aus der
Mittelwertberechnung eliminiert werden, ist die Anwendung des Median eine gute Alternative.
Beispiel: Ermittlung der durchschnittlichen Einkommens- bzw.
Vermögenssituation in einer Stadt.
Einbeziehung der extrem Vermögenden würde das tatsächliche Einkommensbild verzerren!
Median 3
12
Sitzung 1
Alexander SpermannWS 2007/2008
Neues Beispiel: 7 Geschäftsführer eines zweiten Unternehmens haben folgende Monatsgehälter:
Mittelwert und Median des 1. Unternehmens = Mittelwert und Median des 2. Unternehmens
Die Streuung ist jedoch unterschiedlich:
2 750€
3 160€
3 170€
3 380€
3 490€
3 530€
3 970€
2700€ 3100€ 3500€ 3900€
2700€ 3100€ 3500€ 3900€
Unt. 1
Unt. 2
Streuungsmaße
13
Sitzung 1
Alexander SpermannWS 2007/2008
Streuung: Abweichungen der Beobachtungen vom Durchschnittswert.
(dispersion) x 1- μ, x2 – μ, …,xN- μ
Da manche der Werte kleiner bzw. größer als μ sind, ist
Da das Vorzeichen der Abweichung unwichtigist und alle Werte gleich behandelt werden Betrachtung der quadrierten Werte
Varianz: Durchschnitt der quadrierten Abweichungen(variance) der beobachteten Werte von ihrem Mittelwert.
Varianz ist für den Vergleich zweier oder mehrerer Mengen der Beobachtungen nützlich.
N
ii 1
(x ) 0
Varianz
14
Sitzung 1
Alexander SpermannWS 2007/2008
Formel für Varianz:
N N
2
i i2 i 1 i 1
x x ²µ²
N N
3 450€ 100 10 000
3 070€ -280 78 400
3 290€ -60 3 600
3 600€ 250 62 500
3 410€ 60 3 600
3 380€ 30 900
3 250€ -100 10 000
Σ=0 Σ=169 000
i 11x ( 3.350)i1x i 11(x )²
3 490€ 140 196 00
2 750€ -600 360 000
3 160€ -190 36 100
3 970€ 620 384 400
3 530€ 180 32 400
3 380€ 30 900
3 170€ -180 32 400
Σ=0 Σ=865 800
i2x i 22x ( 3.350) i 22(x )²
1
169000² 24142,86
7
Unternehmen 1 Unternehmen 2
Im Beispiel:
2
865800² 123685,71
7
Varianz der Grundgesamtheit
15
Sitzung 1
Alexander SpermannWS 2007/2008
Mit der Standardabweichung (standard deviation) kann man interpretieren, wie weit die beobachteten Werte vom Mittelwert tatsächlich entfernt sind.
Beispiel:
² weichungStandardabVarianz
€4,15586,24142²11
€7,35171,123685²22
Standardabweichung der Grundgesamtheit
16
Sitzung 1
Alexander SpermannWS 2007/2008
Die Abweichungen der beobachteten Werte vom Mittelwert einer Stichprobe sind:
und die quadrierten Werte entsprechend:
Die Varianz der Stichprobe ist dann:
1 2 nx x,x x,...,x x
n n2
i i2 i 1 i 1
xx
x x x ² nx²s
n 1 n 1
1 2 n(x x)²,(x x)²,...,(x x)²
Da bei der Berechnung der Stichprobenvarianz nicht der Mittelwert der Grundgesamtheit µ, sondern der Mittelwert der Stichprobe als Schätzer (proxy) verwendet wird, dividiert man als „Kompensation“ durch (n -1), anstatt durch n.
x
Varianz der Stichprobe 1
17
Sitzung 1
Alexander SpermannWS 2007/2008
n 8 x 13,96%
8
ii 1
x ² (13,6)² (25,2)² ... (14,3)² 4984,83
n
ii 1
xx
x ² nx²4984,83 (8)(13,9625)²
s ² 489,3170n 1 7
Beispiel: Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr sahen wie
folgt aus :
13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3%
Die Summe der Quadrate der beobachteten Werte ist:
Die Varianz der Stichprobe:
Varianz der Stichprobe 2
18
Sitzung 1
Alexander SpermannWS 2007/2008
Notation:
Standardabweichung der Stichprobe aus dem Beispiel ist:
xx xxs ² s
xx xxs s ² 489,3170 22,1
Standardabweichung der Stichprobe
19
Sitzung 1
Alexander SpermannWS 2007/2008
Zufallsexperiment: Vorgang, der zu einer von
(random experiment) mindestens 2 möglichen Ausprägungen führt,
wobei es unbekannt ist, zu welcher.
Stichprobenraum S: Menge aller möglichen (sample space) Ausprägungen.
Es können nicht gleichzeitig zwei Ausprägungen auftreten, aber eine muss auftreten.
Zufallsexperiment 1
20
Sitzung 1
Alexander SpermannWS 2007/2008
Beispiele:
Ein Vorgang wird beobachtet:• Werfen einer Münze• Werfen eines Würfels
Mögliche Ausprägungen:• entweder Kopf oder Zahl• 1,2,3,4,5,6
Stichprobenraum:• S=(Kopf, Zahl)• S=(1,2,3,4,5,6)
Zufallsexperiment 2
21
Sitzung 1
Alexander SpermannWS 2007/2008
Ereignis: Eine Teilmenge möglicher Ausprägungen mit dem
(event) gleichen Merkmal.
Notation: Großbuchstaben, z.B. A, B,...,Z
Beispiel:Ereignis A/B: Eintreten einer ungeraden
/geraden Zahl beim Werfen eines Würfels.
Ergebnis eines Würfelwurfs z.B. 3 Ereignis A eingetreten.
Zufallsexperiment 3
22
Sitzung 1
Alexander SpermannWS 2007/2008
Bezeichnung: P (probability)
Ein Zufallsexperiment soll stattfinden.Wie groß ist die Wahrscheinlichkeit P bzw. die Chance, dass ein Ereignis
eintritt?
1. Wahrscheinlichkeit als relative Häufigkeit : P liegt immer zwischen 0 und 1: 0: ein Ereignis tritt auf
keinen Fall ein1: ein Ereignis tritt sicher ein
Beispiel: Münze wird geworfen.Ereignis A: Kopf, zu 50%Ereignis B: Zahl, zu 50%
In beiden Fällen P=0,5
Wahrscheinlichkeit
P
23
Sitzung 1
Alexander SpermannWS 2007/2008
Was tun, wenn ein Experiment gar nicht oder zumindest nicht unter gleichen
Umweltbedingungen wiederholt werden kann – Bsp. Konjunktur?
2. Wahrscheinlichkeit als subjektive Wahrscheinlichkeit :
Bezeichnung: Psubj
Die subjektive Wahrscheinlichkeit beschreibt den rein individuellen Glauben über die Chance, dass ein bestimmtes Ereignis bei begrenzter Anzahl der Experiment eintritt. Zudem hängt sie von den gegebenen Informationen sowie
ihrer persönlichen Interpretation ab. Gutes Bsp. sind Investitionsentscheidungen bezüglich entsprechender Gewinnerwartungen.
Subjektive Wahrscheinlichkeit
24
Sitzung 1
Alexander SpermannWS 2007/2008
Zufallsvariablen: Ausprägungen eines Zufallsexperimentes: (random variable) 1. diskret: gutes / defektes Produkt (gut = 1,
defekt = 2) 2. stetig: Familieneinkommen
Wichtige Unterscheidung zwischen:einer Zufallsvariable X und dem Wert x, den sie annimmt.
Zufallsvariable 1
25
Sitzung 1
Alexander SpermannWS 2007/2008
Beispiel 1: Beispiel 2:Werfen eines Würfels ProduktionZufallsvariable X = Augenzahl Zufallsvariable X = Qualität des
Produktes6 Ausprägungenx = 1, x = 2, ..., x =6 2 Ausprägungen: x = 1,
x = 2
wobei 1=gut, 2=defekt
Diskrete Zufallsvariable: Nimmt nur eine abzählbare Anzahl an Ausprägungen an.
Zufallsvariable 2
26
Sitzung 1
Alexander SpermannWS 2007/2008
Wahrscheinlichkeitsfunktion: gibt die Wahrscheinlichkeit wieder, dass eine =Dichtefunktion diskrete Zufallsvariable X die Ausprägung x
(probability function) annimmt: Px ( x ) = P( X = x )
Die Wahrscheinlichkeiten aller Ausprägungen summieren sich auf 1:
Beispiel: X = Augenzahl bei geworfenem Würfel
x
1P(X 1) P(X 2) ... P(X 6)
61
P (X) P(X x) für x 1,2,3,...,66
Wahrscheinlichkeits-/ Dichtefunktion für das Bsp. mit unabhängigen Ereignissen
Xx
P (x) 1
1 2 3 4 5 60
1/6
XP (x)
x
Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable
27
Sitzung 1
Alexander SpermannWS 2007/2008
Beziehung zwischen Wahrscheinlichkeitsfunktion und kumulierter Wahrscheinlichkeitsfunktion (cumulative probability function) ist gegeben als:
Die kumulierte Wahrscheinlichkeitsfunktion des Würfelbeispiels:
0
X 0 0
0
0 wenn x 1
jF (x ) wenn j x j 1 (j 1,2,...,5)
61 wenn x 6
1 2 3 4 5 60
1/2
1
Grafik der kumulierten Wahrscheinlichkeitsfunktion aus dem Beispiel:
X 0F (x )
x
0
X 0 0 Xx x
F (x ) P(X x ) P (x)
Für P(X3) = Px(X=1)+Px(X=2)+Px(X=3)= 0,5
Kumulierte Wahrscheinlichkeitsfunktion
einer diskreten Zufallsvariablen 1
28
Sitzung 1
Alexander SpermannWS 2007/2008
Beispiel: Korrektur einer Stichprobe von Büchern, Zufallsvariable X =Tippfehler auf einer Seite• 81% der Seiten hatten keinen Tippfehler der Wert der
Zufallsvariable x = 0• 17% hatten einen Tippfehler x = 1• 2% hatten zwei Tippfehler x = 2
Dies kann man schreiben als:
Px (0) = 0,81 Px (1) = 0,17 Px (2) = 0,02
Um einen repräsentativen Mittelwert zu bekommen, müssen die jeweiligen Werte mit ihren Wahrscheinlichkeiten gewichtet werden Erwartungswert (expected value)
Erwartungswert einer diskreten Zufallsvariable 1
29
Sitzung 1
Alexander SpermannWS 2007/2008
Durch das Berechnen des Erwartungswertes erhalten wir den mittleren Wert einer diskreten Zufallsvariable. E(X) wird dann der Mittelwert der diskreten Zufallsvariable genannt.
Notation:
Beispiel:
X Xx
E(X) xP (x)
XE(X Tippfehler) 0*0,81 1*0,17 2*0,02 0,21
d.h. dass im Mittel auf jeder Seite 0,21 Tippfehler bzw.auf etwa jeder 5. Seite ein Tippfehler zu erwarten ist
Erwartungswert einer diskreten Zufallsvariable 2
30
Sitzung 1
Alexander SpermannWS 2007/2008
Varianz: Der Erwartungswert der quadrierten Streuung (X – μ x)² gewichtet mit der Wahrscheinlichkeit
Notation:
Standardabweichung: Quadratwurzel der Varianz
Notation: σx
X X X Xx
² E (X )² (x )²P (x)
Erwartungswert, Varianz und Standardabweichung 1
31
Sitzung 1
Alexander SpermannWS 2007/2008
Beispiel: Tippfehler Um die Varianz zu finden, muss zuerst der Erwartungswert
gefunden werden:
Varianz:
und die Standardabweichung entsprechend:
XE(X Tippfehler) 0,21
X X Xx
² (x µ )²P (x)
(0 0,21)² * 0,81 (1 0,21)² * 0,17 (2 0,21)² * 0,02 0,2059
X X ² 0,2059 0,45
Erwartungswert, Varianz und Standardabweichung 2
32
Sitzung 1
Alexander SpermannWS 2007/2008
Stetige Zufallsvariablen: Nicht abzählbare Anzahl an Werten
(continuous random variable) auf einem ‚Wertestrahl‘ (Kontinuum).
Beispiele: Zeit, Entfernung, Temperatur.
Verteilungsfunktion einer stetigen Zufallsvariable:Wahrscheinlichkeit, dass X den Wert x nicht übersteigt.
Notation:
Verteilungsfunktion einer stetigen Zufallsvariable entspricht der kumulierten Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable.
XF (x) P(X x)
Verteilungsfunktion einer stetigen Zufallsvariable 1
33
Sitzung 1
Alexander SpermannWS 2007/2008
Beispiel: Nehmen wir an, dass ein Tunnel genau 1 km lang ist. Es werden die Unfälle im Tunnel beobachtet. Zufallsvariable: X = Entfernung vom Eingang des Tunnels zum Zeitpunkt des Unfalls.Die Wahrscheinlichkeit, dass ein Unfall passiert, ist für jede Teilstrecke gleich.
Verteilungsfunktion dieser Grafik zum Beispiel:
Zufallsvariable ist:
X
0 für x 0
F (x) x für 0 x 1
1 für x 1
0 1
x in km
Fx(
x)
1
Verteilungsfunktion einer stetigen Zufallsvariable 2
34
Sitzung 1
Alexander SpermannWS 2007/2008
Es ist unmöglich, die Wahrscheinlichkeit für einen bestimmten Wert, den die Zufallsvariable annimmt, zu berechnen.
Es kann nur die Wahrscheinlichkeit berechnet werden, dass die Zufallsvariable einen Wert zwischen den Werten a und b annimmt.
Diese Wahrscheinlichkeit ist: P (a < x < b) = Fx (b) – Fx (a)
Im Beispiel: Da die Zufallsvariable zwischen 0 und 1 einheitlich verteilt ist, ist die Verteilungsfunktion in diesem Bereich:
F x(x) = x
Für a=1/4 und b=3/4 ist die Wahrscheinlichkeit, dass ein Unfall in diesem Bereich liegt:
P (1/4< x < 3/4) = Fx (3/4) – Fx (1/4) = 3/4 – 1/4= 1/2
Verteilungsfunktion einer stetigen Zufallsvariable 3
35
Sitzung 1
Alexander SpermannWS 2007/2008
Die Dichtefunktion für eine stetige Zufallsvariable X ist eine Funktion mit folgenden Eigenschaften:
fX (x) ≥ 0 für alle x - Werte
Grafik der Dichtefunktion: a und b sind Werte der Zufallsvariable X,wobei a<b. Die Wahrscheinlichkeit, dass x zwischen a und b liegt, ist der Bereich unter der Kurve zwischen diesen zwei Werten.
Beispiel:
fx(x
)
x
a b
Dichtefunktion einer stetigen Zufallsvariable 1
36
Sitzung 1
Alexander SpermannWS 2007/2008
Eigenschaften der Dichtefunktion:
• Die Fläche unter der Dichtefunktion entspricht dem Wert 1.
• Die Fläche unter der Kurve der Dichtefunktion, fX (x) , links von dem Wert x0 ist F x(x0) , wobei x0 irgendein Wert ist, den die Zufallsvariable annehmen kann.
Dichtefunktion einer stetigen Zufallsvariable 2
37
Sitzung 1
Alexander SpermannWS 2007/2008
Gesamtfläche = 1
0
1/4
1/2
3/4
1
a b 1
= 0,5
Fx(x)
F(b)=3/4
F(a)=1/4
0
1/4
1/2
3/4
1
=0,5 (50%)
0 b ¾*1km=750m
a¼*1km=250m
1
Gesamtfläche = 1xf (x)
Dichte- und Verteilungsfunktion einer stetigen Zufallsvariable 3 –
laut Beispiel
38
Sitzung 1
Alexander SpermannWS 2007/2008
Stetige Verteilung, die in der Statistik eine zentrale Rolle spielt.
Eine Zufallsvariable X ist normalverteilt wenn ihre Dichtefunktion wie folgt aussieht:
Und:
•
(x µ)² / 2 ²X
1f (x) e für x
2 ²
2µ 0
e 2,71828...; 3,14159...
fx(x
)
xµ
, wobei die Varianz immer positiv ist.
Die Normalverteilung 1
39
Sitzung 1
Alexander SpermannWS 2007/2008
Eigenschaften:
• Der Mittelwert der Zufallsvariable ist µ,
also: E (X) = μ• Die Varianz der Zufallsvariable ist σ²
also:
• mit Standardabweichung: = σ wobei gilt: je kleiner σ² , desto „enger“ liegt die Verteilung um den
wahren Wert• Die Form der Dichtefunktion ist eine symmetrische Glockenkurve mit
dem Zentrum im Mittelwert µ.
Notation: X~ N (µ ,σ²)
Var(X) E (X µ)² ²
Die Normalverteilung 2
40
Sitzung 1
Alexander SpermannWS 2007/2008
0
0,05
0,1
0,15
0,2
0,25
0,3
-5 -4 -3 -2 -1 0 1 2 3 4 5 6 7
Dich
te f(x
)
0
0,1
0,2
0,3
0,4
0,5
-5 -4 -3 -2 -1 0 1 2 3 4 5
Dich
te f(x
)
Standardnormalverteilung
mit =1 und =0
2=1,44 und =0
2=4 und =0
2=2,25 und =3
=2,25 und =1
)(xf X )(xf X
Die Normalverteilung 3
41
Sitzung 1
Alexander SpermannWS 2007/2008
Gezogene Zufallsstichproben der Grundgesamtheit sind:
X1,X2,X3,…,Xn
Der Stichprobenmittelwert ist dann:
Es gilt, dass der Erwartungswert der Summe der Stichprobe gleich der Summe der Erwartungswerte ist:
Da jede Zufallsstichprobe Xi den Mittelwert μX hat, können wir schreiben:
n
ii 1
1X X
n
)(...)()()( 211
n
n
ii XEXEXEXE
n
i Xi 1
E( X ) nµ
Stichprobe und Grundgesamtheit:Erwartungswert 1
42
Sitzung 1
Alexander SpermannWS 2007/2008
Der Erwartungswert des Mittelwertes der Stichprobe ist dann:
Also entspricht der Erwartungswert des Mittelwertes der Stichprobe dem Mittelwert der Grundgesamtheit. Das heißt, dass der Mittelwert der Stichprobe ein erwartungstreuer Schätzer für den Mittelwert der Grundgesamtheit ist.
n n
Xi i X
i 1 i 1
nµ1 1E(X) E( X ) E( X ) µ
n n n
Stichprobe und Grundgesamtheit:Erwartungswert 2
43
Sitzung 1
Alexander SpermannWS 2007/2008
Erwartungswert des Schätzers = wahrer Wert, d.h. unverzerrt (unbiased).
)(xf n = 100
n=25
100x
Dichtefunktionen der Normalverteilung für wahre Stichprobenmittelwertevom Umfang n=25 und n=100 Beobachtungen, mit der Standardabweichung=5.
Stichprobe und Grundgesamtheit:Erwartungswert 3
44
Sitzung 1
Alexander SpermannWS 2007/2008
Beispiel: Es sollen Arbeitsteams aus jeweils 4 Beschäftigten mit Berufserfahrung von 2 bis 8Jahren zusammengestellt werden. Es werden fünfzehn Stichproben von vierBeobachtungswerten aus einer Grundgesamtheit von sechs „Werten“: 2,4,6,6,7,8,gezogen.
•
Stichprobe Mittelwert Stichprobe
Mittelwert
2,4,6,6 4,5 2,6,7,8 5,75
2,4,6,7 4,75 2,6,7,8 5,75
2,4,6,8 5 4,6,6,7 5,75
2,4,6,7 4,75 4,6,6,8 6
2,4,6,8 5 4,6,7,8 6,25
2,4,7,8 5,25 4,6,7,8 6,25
2,6,6,7 5,25 6,6,7,8 6,75
2,6,6,8 5,5
Der wahre Mittelwert (sample mean) dieser Grundgesamtheit ist der Durchschnitt dieser
sechs Werte: μX =5,5
Stichprobe und Grundgesamtheit:Erwartungswert 4
45
Sitzung 1
Alexander SpermannWS 2007/2008
Die Häufigkeitsverteilung der Wahrscheinlichkeiten von Mittelwerten der Stichproben (sampling distribution of the sample mean) ist:
Der Erwartungswert des Mittelwertes der Stichprobe entspricht dem Mittelwert der Grundgesamtheit:
xX
1 2 1E(X) xP (x) 4,5 4,75 * ... 6,75 * 5,5
15 15 15
15
1)75,6(
15
2)25,6(
15
1)6(
15
3)75,5(
15
1)5,5(
15
2)25,5(
15
2)5(
15
2)75,4(
15
1)5,4(
XXX
XXX
XXX
PPP
PPP
PPP
Stichprobe und Grundgesamtheit:Erwartungswert 5
46
Sitzung 1
Alexander SpermannWS 2007/2008
Es werden n Beobachtungen X1,X2,X3,…,Xn aus der Grundgesamtheit zufälliggezogen, wobei der wahre Mittelwert und die wahre Varianz unbekannt sind. Die Varianz der Grundgesamtheit ist:
Da aber μX unbekannt ist, wird es durch (= Mittelwert der Stichprobe) geschätzt.
Die Varianz der Stichprobe lautet:
Mit Hilfe dieser Definition der SXX² kann gezeigt werden, dass
Das bedeutet, dass der erwartete Wert der Stichprobenvarianz der Varianz derGrundgesamtheit entspricht. Man sagt dann, dass der Schätzer für die Varianzerwartungstreu ist.
)²(² XX µXE
X
)²(1
1²
1
n
iiXX XX
ns
²²)( XXXsE
Stichprobe und Grundgesamtheit:Varianz 1
47
Sitzung 1
Alexander SpermannWS 2007/2008
Kovarianz einer Stichprobe:
n
XY i ii 1
1s (x x)(y y)
n 1
wegen der Approximation von µ durch und ŷ wird als „Kompensation“ durch (n-1), anstatt durch n dividiert, d.h es wird ein Freiheitsgrad „aufgegeben“.
x
Kovarianz
48
Sitzung 1
Alexander SpermannWS 2007/2008
Erläuterung: S : Anzahl der Jahre in Ausbildung Y : Stundenlohn in Dollar (1992)
Quelle:Dougherty
Kovarianz einer Stichprobe – ein Beispiel
49
Sitzung 1
Alexander SpermannWS 2007/2008
Illustration der Kovarianz:
Quelle:Dougherty
294,152 SYs
S
Y
Interpretation von SSY2 = 15,294 :
es liegt positiver Zusammenhang vors= 14,225 undy = 13,250
Kovarianz einer Stichprobe – ein Beispiel
50
Sitzung 1
Alexander SpermannWS 2007/2008
•
Quelle: Dougherty
Nach Multiplikation von Y mit 100, SSY‘
2 = 1529,4 d.h. trotz Änderung der Dimension bleibt der Zusammenhang unverändert und wird lediglich in eine andere Größenordnung (*100) transformiert.
Vergleich Kovarianz und Korrelationskoeffizient – ein Beispiel
51
Sitzung 1
Alexander SpermannWS 2007/2008
Korrelationskoeffizient
Formel:
Beispiel:
Vorteil des Korrelationskoeffizienten gegenüber der Kovarianz:
dimensionslosmit :
XYXY
XX YY
s ²r
s ²s ²
SY 'SY '
SS Y ' Y '
s ² 15,294r 0,55
s ²s ² 10,888 771080
11 , yxr
gegeben
52
Sitzung 1
Alexander SpermannWS 2007/2008
Dougherty, Christopher; Introduction to Econometrics
Gujarati, Damodar; Basic Econometrics (4th Edition)
Wooldridge, Jeffrey; Introductory Econometrics
Datensätze und weitere Infos vom und zum Autor auch unter:
http://wooldridge.swcollege.com
Chiang, Alpha C.; Fundamental Methods of Mathematical Economics
Simon, Carl and Lawrence Blume; Mathematics for Economists
Literatur