Universität zu Kiel Institut für Sportwissenschaft
Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik
Dr. Jan-Peter Brückner
R.216Tel. 880 4717
Universität zu Kiel Institut für Sportwissenschaft
Deskriptive Statistik - Ziele
• Beschreiben der Daten• Zusammenfassen der Daten• Überblick über die Daten• Datenanalyse• Fehlerprüfung/Plausibilitätsprüfung
Universität zu Kiel Institut für Sportwissenschaft
Beispiel
83349910293xj
10987654321j
Eine Stichprobe von N=10 Schüler absolviert einen Fitness-Test.Die Leistung X wird mit 0 (schlechte Fitness) bis 10 Punkten (sehr gute Fitness) bewertet
Rohdaten (Beispiel 1):
sortierte Rohdaten:
10999843332xi
10987654321i
Universität zu Kiel Institut für Sportwissenschaft
Deskriptive Statistik - Kennwerte
• Häufigkeiten und Häufigkeitsverteilung• Maße der zentralen Tendenz• Streuungsmaße• Zusammenhangsmaße• Unterschiedsmaße
Universität zu Kiel Institut für Sportwissenschaft
Häufigkeit
N
ahaf
)()( =
)(ah axi =Häufigkeit für (i = 1, 2, 3, … N)
Absolute Häufigkeit
Relative Häufigkeit
Universität zu Kiel Institut für Sportwissenschaft
Häufigkeitsverteilung
h(p)
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9 10
131131h(p)
109876543210p
0,10,30,10000,10,30,100f(p)
p: Punkte im Fitness-Test
Universität zu Kiel Institut für Sportwissenschaft
Maße der zentralen Tendenz
Modalwert, Median, Arithmetisches Mittel: Wann welcher Wert? Arithmetisches Mittel:• bei Intervallskalierung• symmetrische Verteilungbei Verallgemeinerungen von der Stichprobe auf die Grundgesamtheit • bei Verallgemeinerungen von der Stichprobe auf die GrundgesamtheitMedian:• bei Ordinalskalierung• bei Extremwerten• bei Abweichungen von der NormalverteilungModalwert (Modus):• bei Ordinalskalierung• bei mehrgipfligen Verteilungen• grober Überblick
Universität zu Kiel Institut für Sportwissenschaft
Maße der zentralen Tendenz
• Arithmetisches Mittel, Mittelwert• Median• Modalwert (Modus)
Universität zu Kiel Institut für Sportwissenschaft
Arithmetisches Mittel - Mittelwert
∑=
=N
i
ix xN
M1
1
• Auch: AM oder x• erfordert Intervallskalenniveau• keine Aussage über die Verteilung/Abweichungder Einzelwerte
10999843332xi
10987654321i
660*10
1 ==xM
Beispiel:
Universität zu Kiel Institut für Sportwissenschaft
Median - Modus
• Median Md:50% der Werte liegen über,50% der Werte unter dem Median.
• Modus Mo (auch: Mod):Häufigster Wert der Verteilung
Wo liegen Median und Modus im Verhältnis zum Mittelwert??? � Symmetrie der Verteilung (Schiefe)
Universität zu Kiel Institut für Sportwissenschaft
h(p)
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9 10
Md=5
M=4,6 Mo=5Mo=6
Universität zu Kiel Institut für Sportwissenschaft
h(p)
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9 10
h(p)
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9 10
6=M
Beispiel 1:
Beispiel 2:
Universität zu Kiel Institut für Sportwissenschaft
Streuungsmaße
• Range• Perzentilen• Varianz• Standardabweichung• Variationskoeffizient
Universität zu Kiel Institut für Sportwissenschaft
Spannweite
minmax xxRange −=• erfordert Intervallskalenniveau• Anfällig gegenüber Ausreißern• Insbesondere angeben bei Personendaten (Alter,…)
Beispiel 1:
xmax = 10
xmin = 2
Range = 10 – 2 = 8
Beispiel 2:
xmax = 7
xmin = 5
Range = 7 – 5 = 2
Universität zu Kiel Institut für Sportwissenschaft
Varianz
)²(1
²1
x
N
i
i MxN
SDX −= ∑=
• Auch: SD², s², Var(X)• SD² ist immer positiv• Extremwerte haben einen besonders großen Einfluss
Summe der Abweichungs-quadrate
Universität zu Kiel Institut für Sportwissenschaft
Standardabweichung
²XX SDSD =
)²(1
1
x
N
i
i MxN
SDX −= ∑=
• Auch: s• Extremwerte haben einen besonders großen Einfluss• Achtung: In Statistiksoftware wird häufig durch N-1 geteilt!Diese Berechnung ist nur sinnvoll, wenn die Stichprobe zurSchätzung der Varianz/Standardabweichung auf Populations-ebene genutzt wird!
Universität zu Kiel Institut für Sportwissenschaft
Var(X) = 9,494169994499916(xi-M)²
043332-2-3-3-3-4xi-M
M = 66010999843332xi
Summe10987654321i
1,34,9)( ≈== XVarSDX
Beispiel 1:
Universität zu Kiel Institut für Sportwissenschaft
h(p)
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9 10
h(p)
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9 10
6=M
Beispiel 1:
Beispiel 2:
SD=3,1
SD=0,8
Universität zu Kiel Institut für Sportwissenschaft
Variationskoeffizient
X
X
MSDXV =)(
Ist die Standardabweichung hoch oder niedrig?� Standardisierung am Mittelwert:
� Vergleichen der Streuungen von unterschiedlichskalierten Variablen
Universität zu Kiel Institut für Sportwissenschaft
z-Standardisierung
X
Xii
SDMxz −=
Wie stark weicht ein Wert xi im Vergleich zu anderen Wertenvom Mittelwert ab?� Standardisierung an Mittelwert und Standardabweichung:
� Vergleich verschiedener Werte xi und xj (Person i mit Person j)� Vergleich der Merkmalsausprägungen xi und yi einer Person i auf verschiedenenVariablen X und Y
Universität zu Kiel Institut für Sportwissenschaft
h(p)
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9 10
h(p)
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9 10
6=M
Beispiel 1:
Beispiel 2:
SD=3,1
SD=0,8
z= (5-6)/3,1 = -0,32
z= (5-6)/0,8 = -1,25
Universität zu Kiel Institut für Sportwissenschaft
Kovarianz
„Gemeinsame Varianz“ zweier Variablen X und Y:
In wiefern ist X hoch ausgeprägt, wenn Y hoch (niedrig) ausgeprägt ist?
wöchentliche Sportstunden
Lebens-zufriedenheit
Beispiel aus der Einheit „Untersuchungsplanung“:
Universität zu Kiel Institut für Sportwissenschaft
Kovarianz
„Gemeinsame Varianz“ zweier Variablen X und Y:
In wiefern ist X hoch ausgeprägt, wenn Y hoch (niedrig) ausgeprägt ist?
Testleiter 1
Testleiter 2
Beispiel zur Objektivität eines Tests:
Universität zu Kiel Institut für Sportwissenschaft
Kovarianz
„Gemeinsame Varianz“ zweier Variablen X und Y:
In wiefern ist X hoch ausgeprägt, wenn Y hoch (niedrig) ausgeprägt ist?
Test
Retest/
Paralleltest
Beispiel zur Reliabilität eines Tests:
Universität zu Kiel Institut für Sportwissenschaft
Kovarianz
„Gemeinsame Varianz“ zweier Variablen X und Y:
In wiefern ist X hoch ausgeprägt, wenn Y hoch (niedrig) ausgeprägt ist?
Test
Kriterium
Beispiel zur Validität eines Tests:
Universität zu Kiel Institut für Sportwissenschaft
Kovarianz
)()(1
),(1
yi
N
i
xi MyMxN
YXCOV −−= ∑=
„Gemeinsame Varianz“ zweier Variablen X und Y:
• COV(X,Y) ist von Var(X) und Var(Y) abhängig• Interpretation nur unter Berücksichtigung von Var(X) und Var(Y) möglich
Universität zu Kiel Institut für Sportwissenschaft
Korrelationskoeffizient
)(*)(
),(,
YVARXVAR
YXCOVr YX =
YX SDSD
YXCOV
*
),(=
• Auch: r oder Kor(X,Y)• Wertebereich: -1 ≤ r ≤ 1• r > 0: positiver Zusammenhang• r = 0: kein Zusammenhang• r < 0: negativer Zusammenhang• Voraussetzung: Intervallskalenniveau
Standardisierung der Kovarianz an der Varianz von X und Y:
Universität zu Kiel Institut für Sportwissenschaft
Korrelationskoeffizient
)(*)(
),(),(,
YVARXVAR
YXCOVYXKORr YX ==
YXYX
SDSD
YXCOVYXKORr
*
),(),(, ==
Universität zu Kiel Institut für Sportwissenschaft
Korrelationskoeffizient
)²(1
*)²(1
)()(1
11
1,
y
N
i
ix
N
i
i
yi
N
i
xi
YX
MyN
MxN
MyMxN
r
−−
−−=
∑∑
∑
==
=
)(*)(
),(,
YVARXVAR
YXCOVr YX =
)²(*)²(
)()(
11
1,
y
N
i
ix
N
i
i
yi
N
i
xi
YX
MyMx
MyMxr
−−
−−=
∑∑
∑
==
=
→
→
Universität zu Kiel Institut für Sportwissenschaft
Berechnung des Korrelationskoeffizienten
1,071,41Wurzel
1,331,142,004,23,0M
8,006,8312,002518Summe
3,673,364,001,832,00656
-0,170,031,00-0,171,00445
0,830,691,000,831,00544
0,170,031,00-0,17-1,00423
1,171,361,00-1,17-1,00322
2,331,364,00-1,17-2,00311
(xi-M)*(yi-M)(yi-M)²(xi-M)²yi-Mxi-M
wöch.Sport-
stunden
Lebens-zufrieden-
heiti
YX
r = = 0,881,33
1,41 * 1,07 SD SD Cov
Universität zu Kiel Institut für Sportwissenschaft
Testgütekriterien
Hauptgütekriterien Nebengütekriterien
Objektivität (anwenderunabhängig) • Durchführung
• Auswertung
• Interpretation
NormierungVergleichbarkeit
Nicht-Verfälschbarkeit
Reliabilität (zuverlässig) • Paralleltest
• Retest• Innere Konsistenz (Testhalbierung)
Ökonomie
Nützlichkeit
Zumutbarkeit
Validität (gültig) • inhaltlich / Experten
• Konstrukt
• kriterienbezogen
Fairness
Universität zu Kiel Institut für Sportwissenschaft
Beurteilung von Testkennwerten
niedrig mittel hoch
Schwierigkeit >.80 .80-.20 <.20
Trennschärfe
(korrigiert)<.30 .30-.50 >.50
Objektivität (Auswerter)
<.60 .60-.90 >.90
Reliabilität <.80 .80-.90 >.90
Validität(unkorrigiert)
<.40 .40-.60 >.60
Eichstichprobe N<150 150<N<300 N>300
(Fisseni, 1997, S. 124)
Universität zu Kiel Institut für Sportwissenschaft
AUFGABE
N=5 Schüler werden zu Ihren Sportnoten und zur Einstellung zum Sport (0: sehr negative Einstellung; 5: sehr positive Einstellung) befragt:
Berechne jeweils M, SD, Var, Range und Md sowie Kov und r für den Zusammenhang der beiden Variablen! (Einschl. Rechenweg!)
Abgabe bis Di, 05.06., 10:15 him Fach von J.-P. Brücknermit Angabe des Namens, und des Tutors und Tutoriums (rechts oben)
22354Einstellung
43221Sportnote
54321i