Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
Roger Wolf26. Juli 2018
Nach Rößler, Ungerer, Statistik für Wirtschaftswissenschaftler.
1/23
Wirtschaftsstatistik
Kapitel 3: Deskriptive Statistik: Bivariate Verteilungen
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
Abschnitt 3.1:
Maßzahlen des rechnersichen Zusammenhangs
2/23
Zurück zur Zusammenfassung
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
3/23
Beziehungen von Merkmalen zueinander
● Der Zusammenhang zweier Merkmale kann die folgenden Eigenschaften haben:
x y x y x y x y
z
Einseitig, „x bedingt y“
Einseitig, „y bedingt x“
Beidseitig, „x und y bedingen sich gegenseitig“
Beidseitig, „x und y werden durch z bedingt“
● Die Darstellung rechnerischer Zusammen-hänge erfolgt paarweise z.B. durch den Eintrag in Kontingenztabellen:
● Zusammenhänge erkennbar durch Häufungen der .
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
4/23
Höherdimensionale Dichteverteilung
● Ist die statistische Gesamtmasse durch mehr als ein Merkmal charakterisiert, ist die Häufigkeitsver-teilung (oder Dichte) ebenfalls höherdimensional.
y0 1 2 3 4 5 6 7 8 9 10
(y)
yp
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
x0 1 2 3 4 5 6 7 8 9 10
(x)
xp
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
AB
Projektion auf y-Achse
Pro
jektio
n a
uf x-A
chse
● In der praktischen Darstellung betrachtet man zwei Dimensionen (hier dargestellt in Bild AB):
B
A AB
● Die in Bild A und B dargestellten 1d Verteilungen bezeichnet man als Randverteilungen.
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
5/23
Unabhängigkeit
● Das Merkmal Y heißt (statistisch/stochastisch) von X unabhängig, wenn die Dichte von Y nicht vom Wert von X abhängt:
● Beispiel: Abhängigkeit X von Y.
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
6/23
Test auf Unabhängigkeit
● Sind X und Y unabhängig, dann gilt:
(Unabhängigkeit für Häufigkeitsverteilungen diskret verteilter Merkmale)
(Unabhängigkeit für Dichten stetig verteilter Merkmale)
● Sie können X und Y auf Unabhängigkeit testen, indem Sie (z.B. in der Kongruenz-tabelle) mit vergleichen. Sie können dies z.B. mit Hilfe eines Tests tun:
( Koeffizient)
● Je niedriger desto höher die Wahrscheinlichkeit für Unabhängigkeit.
● Erwartung bei Unabhäng-igkeit in unserem Bsp.: .
Zurück zur Zusammenfassung
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
6/23
Test auf Unabhängigkeit
● Sind X und Y unabhängig, dann gilt:
(Unabhängigkeit für Häufigkeitsverteilungen diskret verteilter Merkmale)
(Unabhängigkeit für Dichten stetig verteilter Merkmale)
● Sie können X und Y auf Unabhängigkeit testen, indem Sie (z.B. in der Kongruenz-tabelle) mit vergleichen. Sie können dies z.B. mit Hilfe eines Tests tun:
( Koeffizient)
# Ausprägungen von X
# Ausprägungen von Y
Maß für erwartete Abweichungen
Maß für tatsächliche Abweichungen
● Je niedriger desto höher die Wahrscheinlichkeit für Unabhängigkeit.
● Erwartung bei Unabhäng-igkeit in unserem Bsp.: .
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
7/23
Test auf Unabhängigkeit
● Nimmt große Werte an, wenn Hypothese der Unabhängigkeit nicht stimmt. Ungefähr gleich , wenn Hypothese der Unabhängigkeit stimmt.
( Koeffizient)
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
8/23
Test auf Unabhängigkeit
● Nimmt große Werte an, wenn Hypothese der Unabhängigkeit nicht stimmt. Ungefähr gleich , wenn Hypothese der Unabhängigkeit stimmt.
● Auf das Intervall skaliert erhält man den:
( Koeffizient)
(C-Koeffizient nach Pearson)
●
●
● Je niedriger desto höher die Wahrscheinlichkeit für Unabhängigkeit.
● Erwartung bei Unabhäng-igkeit: .
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
9/23
Test auf Unabhängigkeit
● Nimmt große Werte an, wenn Hypothese der Unabhängigkeit nicht stimmt. Ungefähr gleich , wenn Hypothese der Unabhängigkeit stimmt.
● Auf das Intervall skaliert erhält man den:
( Koeffizient)
(C-Koeffizient nach Pearson)
●
●
● Auf das Intervall skaliert erhält man den:
(korrigierter C-Koeffizient)
● Je niedriger desto höher die Wahrscheinlichkeit für Unabhängigkeit.
● Erwartung bei Unabhäng-igkeit: .
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
10/23
Test in der Kontingenztabelle
Rand-verteilung
● Berechnen Sie und für die Merkmale „Mathematiknote“ und „Vertiefungsfach“
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
11/23
Kandells
● Eine Größe, die sich bei ordinalen (=sortierbaren) Merkmalen berechnen lässt ist Kandells :
(Kandells )
● Bei n statistischen Einheiten bei denen zwei ordinale Merkmale erhoben werden gibt es
mögliche Wertepaare mit der folgenden Klassifika-tion:
„Tie
s“
Zurück zur Zusammenfassung
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
11/23
Kandells
● Eine Größe, die sich bei ordinalen (=sortierbaren) Merkmalen berechnen lässt ist Kandells :
(Kandells )
● Bei n statistischen Einheiten bei denen zwei ordinale Merkmale erhoben werden gibt es
mögliche Wertepaare mit der folgenden Klassifika-tion:
Positiver ZusammenhangNegativer Zusammenhang
„Tie
s“
● +1→ neg. Zusammenhang.● +0→ kein Zusammenhang.● +1→ pos. Zusammenhang.
-
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
12/23
Kandells
● Berechnen Sie für die Merkmale „Mathematiknote“ (X) und „erwartete Leistung in Statistik“ (Y):
Konkordante Paare: Diskordante Paare: „Ties“:
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
12/23
Kandells
● Berechnen Sie für die Merkmale „Mathematiknote“ (X) und „erwartete Leistung in Statistik“ (Y):
Konkordante Paare: Diskordante Paare: „Ties“:
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
13/23
Somers‘
● Ist Y die abhängige Variable, dann lässt sich auch einfacher der Koeffizient:
bestimmen.
(Somers‘ )
● Im vorherigen Beispiel ist
● +1→ neg. Zusammenhang.● +0→ kein Zusammenhang.● +1→ pos. Zusammenhang.
-
Zurück zur Zusammenfassung
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
14/23
Kovarianz
● Bei zwei metrischen Merkmalen X und Y kann die Richtung des Zusammenhangs durch das arithmetische Mittel der Produkte der Differenzen und für bestimmt werden:
(Kovarianz)
Wenn aus der Kontingenzta-belle bestimmt
Wenn aus Be-obachtungs-werten bestim-mt
Zurück zur Zusammenfassung
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
15/23
Korrelationskoeffizient
● Normiert auf das Intervall nennt man die Kovarianz Korrelationskoefizient der Merkmale X und Y:
(Korrelationskoeffizient nach Bravais/Pearson)
● r misst die Stärke des linearen Zusammenhangs von X und Y:
Vgl. VL-03 Folie 16
Zurück zur Zusammenfassung
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
16/23
Korrelationskoeffizient
● Berechnen Sie den Korrelationskoeffizienten der Merkmale „Einkommen“ (X) und „Ausgaben für Kopien“ (Y):
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
17/23
Abschätzung des Zusammenhangs
● Stellen Sie sich vor, Sie haben eine Verteilung zweier Variablen X und Y der Form:
● Sie können einen funktionalen Zusammen-hang zwischen und abschätzen, für den z.B. die Abstände zum vor-hergesagten Wert minimal werden ( -Methode vgl. VL-11).
● In diesem Beispiel testen wir einen linearen Zusammenhang:
● Die Varianz der Werte
ist groß. Das ist im Bsp. zum Teil auf den Zusammenhang zwischen X und Y zurück-zuführen.
... ...
Residuen
Zurück zur Zusammenfassung
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
18/23
Varianzzerlegung
● Durch eine Varianzzerlegung können Sie bestimmten, welcher Anteil der Varianz durch den abgeschätzten Zusammenhang zwischen X und Y erklärt werden kann:
Eigenschaft der Abschätzung
Anteil an der nicht durch Zusammenhang erklärt werden kann.
Anteil an der durch Zusammenhang erklärt werden kann.
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
19/23
Bestimmtheitsmaß
● Man definiert den Anteil des geschätzten Zusammenhangs an der Varianz von Y ( ) als Bestimmtheitsmaß :
... ...
Kann durch Zusammenhang erklärt werden
Residuen
(Bestimmtheitsmaß)
● Für einen linearen Zusammenhang gilt für die Abschätzung (lineare Regression):
(Abschätzung der Steigung)
(vgl. VL-11)
Zurück zur Zusammenfassung
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
20/23
Bestimmtheitsmaß
● In Worten: Das Quadrat des Korrelationskoeffizienten nach Bravais/Pearson gibt an, welcher Anteil der Varianz sich durch einen optimal geschätzten linearen Zu-sammenhang zu einer weiteren Variablen erklärt werden kann.
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
21/23
-Koeffizient
● Lässt sich die Varianz eines metrischen Merkmals Y durch den Zusammenhang mit einem nominalen Merkmal X erklären, dann kann man aus der Varianzzerle-gung nach den Merkmalsausprägungen von X den durch X erklärten Anteil an durch den -Koeffizienten quantifizieren:
( -Koeffizient)
● Definition und Motivation analog zum Bestimmtheitsmaß.
Zurück zur Zusammenfassung
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) – PHYSICS FACULTY
22/23
-Koeffizient
● Lässt sich die Varianz eines metrischen Merkmals Y durch den Zusammenhang mit einem nominalen Merkmal X erklären, dann kann man aus der Varianzzerle-gung nach den Merkmalsausprägungen von X den durch X erklärten Anteil an durch den -Koeffizienten quantifizieren:
( -Koeffizient)
● Definition und Motivation analog zum Bestimmtheitsmaß.
● Berechnen Sie den -Koeffizienten der Merkmale „Geschlecht“ (X) und „Anzahl der Fachbücher“ (Y):
d.h. 27,08% der zu erklärenden Varianz der Anzahl der geliehenen/gekauften Fachbücher können durch das Merkmal Geschlecht erklärt werden.
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
Zusammenfassung
● Höherdimensionale Dichteverteilungen.
23/23
Zur Nachbereitung lesen Sie Kapitel 3.2 aus Rößler, Ungerer, Statistik für Wirtschaftswissenschaftler.
● -Test auf Unabhängigkeit.
● Kandells und Somers‘ d.
● Kovazianz und Korrelationskoeffizient.
● Abschätzung des Zusammenhangs und Bestimmtheitsmaß.
● -Koeffizient.
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
Zusammenfassung
● Höherdimensionale Dichteverteilungen.
23/23
Zur Nachbereitung lesen Sie Kapitel 3.2 aus Rößler, Ungerer, Statistik für Wirtschaftswissenschaftler.
● -Test auf Unabhängigkeit.
● Kandells und Somers‘ d.
● Kovazianz und Korrelationskoeffizient.
● Abschätzung des Zusammenhangs und Bestimmtheitsmaß.
● -Koeffizient.
Testet ohne Richtung einfach auf Unabhängigkeit
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
Zusammenfassung
● Höherdimensionale Dichteverteilungen.
23/23
Zur Nachbereitung lesen Sie Kapitel 3.2 aus Rößler, Ungerer, Statistik für Wirtschaftswissenschaftler.
● -Test auf Unabhängigkeit.
● Kandells und Somers‘ d.
● Kovazianz und Korrelationskoeffizient.
● Abschätzung des Zusammenhangs und Bestimmtheitsmaß.
● -Koeffizient.
Testet ohne Richtung einfach auf Unabhängigkeit
Quantifizierung von Richtung und Maß des Zusammen-hangs
Priv. Doz. Dr. Roger Wolf http://ekpwww.physik.unikarlsruhe.de/~rwolf/
Zusammenfassung
● Höherdimensionale Dichteverteilungen.
23/23
Zur Nachbereitung lesen Sie Kapitel 3.2 aus Rößler, Ungerer, Statistik für Wirtschaftswissenschaftler.
● -Test auf Unabhängigkeit.
● Kandells und Somers‘ d.
● Kovazianz und Korrelationskoeffizient.
● Abschätzung des Zusammenhangs und Bestimmtheitsmaß.
● -Koeffizient.
Testet ohne Richtung einfach auf Unabhängigkeit
Quantifizierung von Richtung und Maß des Zusammen-hangs
Abschätzungen/Erklärungen des Zusammenhangs