Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
1
Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel
I
i
J
j ij
ijijI
i
J
j ji
ji
ij
e
en
n
nnn
nnn
1 1
2
1 1
2
2
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
2
Korrelation zweier stetiger Merkmale X und Y
• Grafische Darstellung zweier Merkmale als Punktewolke / Scatterplot / Streudiagramm / X-Y-Diagramm
• Geht man davon aus, dass X auf Y wirkt im Sinne einer Ursache-Wirkungs-Beziehung, so ist es sinnvoll, X auf der x-Achse und Y auf der y-Achse der Grafik abzutragen (wie bei einer mathematischen Funktion)
• Beispiel: siehe Vorlesung vom 20.10.2005, EKG bei Leguanen
• X: Temperatur, Y: Elek. Herzachse
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
3
Scatterplot / Streudiagramm
15,0 20,0 25,0 30,0 35,0
Temperatur
0,0
50,0
100,0
150,0
Ele
k. H
erza
chse
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
4
Korrelation nach Bravais-Pearson
• Die Korrelation nach Bravais-Pearson ist ein Maß für den linearen Zusammenhang von X und Y
• Exakter linearer Zusammenhang: y = a + bx (Gerade)• Exakte lineare Zusammenhänge sind bei empirischen
Daten nicht zu erwarten. Bestenfalls erhält man eine Punktewolke, die einen approximativen linearen Zusammenhang nahe legt
• Beispiel (nächste Folie): Linearer Zusammenhang in rechter Grafik „stärker“ als in linker Grafik
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
5
Korrelation nach Bravais-Pearson II
0,00 1,00 2,00 3,00
Gewicht
0,200000
0,400000
0,600000
0,800000
1,000000
II R
T In
terv
all
15,0 20,0 25,0 30,0 35,0
Temperatur
0,0
50,0
100,0
150,0
Ele
k. H
erza
chse
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
6
Korrelation nach Bravais-Pearson III
• Visuelle Beurteilung genügt nicht. Wir brauchen eine Maßzahl• Der Korrelationskoeffizient nach Bravais-Pearson ist eine
solche normierte Maßzahl• Definition:
n
i
n
iii
n
iii
XY
yyxx
yyxxr
1 1
22
1
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
7
Korrelation nach Bravais-Pearson IV
• Der Korrelationskoeffizient nimmt Werte im Bereich
-1 ≤ rXY ≤ +1
an.
• rXY = +1 : Perfekter positiver linearer Zusammenhang, d.h. alle Punkte liegen exakt auf einer Geraden y = a+bx mit b>0
• rXY = -1 : Perfekter negativer linearer Zusammenhang, d.h. alle Punkte liegen exakt auf einer Geraden y = a+bx mit b<0
Y von Mittel chesArithmetis :y
X von Mittel chesArithmetis:x
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
8
Korrelation nach Bravais-Pearson V
• rXY=0: Die Merkmale sind linear unabhängig
• Hypothetische Datenbeispiele zur Veranschaulichung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
9
Beispiel 1: rXY=+1, exakter positiver linearer Zusammenhang
Daten:x y
1 122 143 164 185 206 22
y=10+2 x
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
10
Beispiel 2: rXY=-1, exakter negativer linearer Zusammenhang
Daten:x y1 82 63 44 25 06 -2
y=10-2 x
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
11
Beispiel 3: rXY=0.72, starker positiver linearer Zusammenhang
Daten:x y
1 122 153 134 185 176 16
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
12
Beispiel 4: rXY≈ 0, kein linearer Zusammenhang
Daten:x y1 102 123 94 105 8.336 12
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
13
Beispiel 5: rXY= 0, kein linearer Zusammenhang
Daten:x y1 3.1252 1.1253 0.1254 0.1255 1.1256 3.125
2)(5.0 xxy
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
14
Alternative: Rangkorrelationskoeffizient nach Spearman rSp
• Alternative zum Korrelationskoeffizienten nach Bravais-Pearson, wenn– X metrisch, Y ordinal– Y metrisch, X ordinal– X ordinal, Y ordinal– der Fokus nicht auf der Linearität des
Zusammenhangs liegt, sondern nur interessiert, ob der Zusammenhang monoton ist
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
15
Definition von rSp
• Vorarbeit: Die Originaldaten werden durch Rangzahlen ersetzt
• Die Berechnung erfolgt wie beim Korrelationskoeffizienten nach Bravais-Pearson, indem statt den Originaldaten ihre Ränge verwendet werden:
n
i
n
iii
n
iii
XY
yyxx
yyxxr
1 1
22
1
)Rang()Rang()Rang()Rang(
)Rang()Rang()Rang()Rang(
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
16
Fortsetzung Beispiel 3 (Seite 11)
i Originaldaten Rangdaten
x y Rang(x) Rang(y)
1 1 12 1 1
2 2 15 2 3
3 3 13 3 2
4 4 18 4 6
5 5 17 5 5
6 6 16 6 4
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
17
Fortsetzung Beispiel 3 (II)
71.05.17/5.12
5.1717.517.5
:Nenner
5.121.25 2.25 1.25 0.75 0.75 6.25
)5.34()5.36()5.35()5.35()5.36()5.34(
)5.32()5.33()5.33()5.32()5.31()5.31(
:Zähler
6/)654321(5.3)Rang()Rang(
Spr
yx
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
18
Hinweise
• -1 ≤ rSp ≤ +1
• Sind alle (Original-)Werte von X und Y verschieden, so sind die Rangzahlen eindeutig zu vergeben. Man sagt: es treten keine Bindungen (no ties) auf
• Kommen (Original-)Werte von X und/oder Y doppelt oder mehrmals vor, so wird folgender „Trick“ angewendet (Verwendung von Durchschnittsrängen):
Datenreihe y: 12 13 13 14 15 15 15 16
Rangzahlen : 1 2.5 2.5 4 6 6 6 8
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
19
Hinweise (II)
• Kommen keine Bindungen vor, so kann rSp einfacher berechnet werden:
iii
n
ii
Sp
yxd
nn
dr
RangRangmit
)1(
61
21
2
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
20
Fortsetzung (II) Beispiel 3 (Seite 11)
71.0)16(6
1061
10
404110
)46()55()64(
)23()32()11(
2
222
2226
1
2
Sp
ii
r
d
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
21
Noch ein Beispiel
• Datenreihe x: 1 2 3 4 5 6• Datenreihe y: 1 4 9 16 25 36• y=x2
• Zusammenhang ist monoton (quadratisch), aber nicht linear
• Rang(xi)=Rang(yi)
• rSp=1 (da di=0 für alle Paare i)
• r nach Bravais-Pearson ist 0.98
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
22
Scheinkorrelationen (Nonsens-Korr.)
• Klassiker: Positive Korrelation zwischen der Anzahl beobachteter Störche und der Anzahl der Geburten in Regionen in Deutschland (Korrelation ≠ Kausalität)
• Confounder-Problematik (u.a.)• Im Storchenbeispiel: es gibt andere Variablen
(Urbanität, Sozialverhalten), die ihrerseits assoziert sein können und mit den untersuchten Variablen (Anzahl Störche, Anzahl Geburten) in Verbindung stehen
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
23
Weitere Anmerkungen
• Auch das Gegenteil von Scheinkorrelation kann auftreten: Tatschlich vorhandene Korrelationen werden nicht erkannt
• Vorzeichenumkehr: in der Gesamtpopulation wird eine (z.B.) positive Korrelation beobachtet. Zerlegt man die Gesamtpopulationen in Teilpopulationen, so kann der Fall eintreten, dass in jeder Teilpopulation eine negative Korrelation beobachtet wird
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
24
Zusammenfassung I (was Sie wissen sollten)
• Der Korrelationskoeffizient nach Bravais-Pearson ist ein Maß für den linearen Zusammenhang von zwei stetigen Merkmalen (grafisch: Streudiagramm). Wert in [-1;1]
• Der Rangkorrelationskoeffizient nach Spearman ist ein Maß für den monotonen Zusammenhang. Die beiden Merkmale können stetig und ordinal sein (alle Kombinationen erlaubt: stetig/stetig, stetig/ordinal, ordinal/ordinal). Er verwendet Ränge statt Originalwerte (Berechnungsformel wie bei Bravais-Pearson bzw. vereinfachte Formel, wenn keine Bindungen vorkommen)
• Problematik: Schein-/verdeckte Korr., Vorzeichen
Vorlesung: Biometrie für Studierende der Veterinärmedizin
15.12.2005
25
Zusammenfassung II (was Sie können sollten)
• Streudiagramm zeichnen• Korrelationskoeffizient nach Bravais-Pearson
berechnen• Ränge bilden (auch: bei Bindungen)• Korrelationskoeffizient nach Spearman berechnen• Interpretation: linearer Zusammenhang, monotoner
Zusammenhang, positiver/negativer Zusammenhang