Date post: | 05-Apr-2015 |
Category: |
Documents |
Upload: | hrodulf-strahl |
View: | 104 times |
Download: | 0 times |
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
1
Der Median
50% der Daten sind kleiner oder gleich med
50% der Daten sind größer oder gleich med
Zahlganzen
kfallsxx
Zahlganzen
kfallsx
hk
k
2)(
2
12
1
)1()(
)(
)()1( nxx
med =
sind geordnete Werte
Definition: Wert für den gilt
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
2
Eigenschaften des Median
• anschaulich• stabil gegenüber monotonen Transformationen• geeignet für ordinale Daten• stabil gegenüber Ausreißern
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
3
Beispiel Median
Statistiken
Hämatokrit80
40
40,00
40
Gültig
Fehlend
N
Median
Modus
Hämatokrit
3 2,5 3,8 3,8
7 5,8 8,8 12,5
3 2,5 3,8 16,3
9 7,5 11,3 27,5
16 13,3 20,0 47,5
18 15,0 22,5 70,0
12 10,0 15,0 85,0
5 4,2 6,3 91,3
6 5,0 7,5 98,8
1 ,8 1,3 100,0
80 66,7 100,0
40 33,3
120 100,0
35
36
37
38
39
40
41
42
43
44
Gesamt
Gültig
SystemFehlend
Gesamt
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
4
Das Quantil (Perzentil)
Anteil p der Daten sind kleiner oder gleich xp
Anteil 1-p der Daten sind größer oder gleich xp
Zahlganzenpkfallsxx
nphlkleinsteZakundZahlganzekeinenpfallsx
hk
k
)(2
1 )1()(
)(
Definition: Wert für den gilt
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
5
Fünf-Punkte Zusammenfassung
Minimum, 25%-Quantil, Median,75%-Quantil,Maximum
Statistiken
Hämatokrit80
40
40,00
36,00
38,00
40,00
41,00
42,00
44,00
Gültig
Fehlend
N
Median
10
25
50
75
90
99
Perzentile
Hämatokrit
3 2,5 3,8 3,8
7 5,8 8,8 12,5
3 2,5 3,8 16,3
9 7,5 11,3 27,5
16 13,3 20,0 47,5
18 15,0 22,5 70,0
12 10,0 15,0 85,0
5 4,2 6,3 91,3
6 5,0 7,5 98,8
1 ,8 1,3 100,0
80 66,7 100,0
40 33,3
120 100,0
35
36
37
38
39
40
41
42
43
44
Gesamt
Gültig
SystemFehlend
Gesamt
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
6
Der Mittelwert (arithmetisches Mittel)
n
inx
1
1
• bekanntestes Lagemaß
• instabil gegen extreme Werte • geeignet für Intervallskalierte Daten
ix
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
7
Beispiel Mittelwert
Hämatokrit
3 2,5 3,8 3,8
7 5,8 8,8 12,5
3 2,5 3,8 16,3
9 7,5 11,3 27,5
16 13,3 20,0 47,5
18 15,0 22,5 70,0
12 10,0 15,0 85,0
5 4,2 6,3 91,3
6 5,0 7,5 98,8
1 ,8 1,3 100,0
80 66,7 100,0
40 33,3
120 100,0
35
36
37
38
39
40
41
42
43
44
Gesamt
Gültig
SystemFehlend
Gesamt
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
Deskriptive Statistik
80 35 44 39,48 2,093
80
Hämatokrit
Gültige Werte(Listenweise)
N Minimum Maximum MittelwertStandardabweichung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
8
Die Spannweite (Range)
minmax xxq Definition:
• „Bereich in dem die Daten liegen“ • Wichtig für Datenkontrolle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
9
Der Quartilsabstand
25,075,0 xxq Definition:
• „Größe des Bereichs in dem die mittlere Hälfte der Daten liegt“• Geeignet für ordinal skalierte Daten• Zentraler 50%-Bereich
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
10
Standardabweichung
Definition:
2
22 )(1
1
SS
xxn
S i
• „Mittlere Abweichung vom Mittelwert“• Manchmal auch 1/n statt 1/(n-1)• Intervallskala Voraussetzung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
11
Variationskoeffizient
• Varianz und Streuung sind von der Skala abhängig, auf der gemessen wird
Beispiele:
• Temperatur in °Celsius oder Fahrenheit• Gewicht in mg oder µg
Daher bezieht man die Streuung oftmals auf deren Lage und berechnet den Variationskoeffizienten als Standardabweichung / Mittelwert
X
SVK
X
• VK ist ein dimensionsloses Maß
• „Standardabweichung in Mittelwertseinheiten“
• Nur sinnvoll für positive
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
12
Lage und Streuung: Zusammenfassung
Lage und Streuung sind die wichtigsten Parameter einer Häufigkeitsverteilung von Daten
Sie sind Bestandteil
JEDER BIOMETRISCHEN AUSWERTUNG
• Ein wichtiges Instrument der Datenbeschreibung ist aber auch die graphische Darstellung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
13
Datendarstellung
• „Ein Bild sagt mehr als Tausend Worte“• Allgemeine Kriterien:• Wahl der Skala incl. Bereich• Wahl des Prinzips (Längentreue, Flächentreue)• Einbringen von anderen Visualisierungen (Piktogramme etc.)• Angemessene Wahl der Variablen• Wichtige Typen:• Stab-, Balken- und Säulendiagramm• Kreis (Torten)-Diagramm• Histogramm
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
14
Boxplot
Beispiel: Hämatokrit bei Mastenten
Maximum75%-QuantilMedian25%-Quantil
Ausreißer
ExtremwerteMinimum
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
15
Boxplot
1. x0.25 = Anfang der Schachtel (Box)x0.75 = Ende der Schachteld = Länge der Schachtel
2. Der Median wird durch den Strich in der Box markiert3. Zwei Linien („whiskers“) außerhalb der Box gehen bis zu xmin und
xmax.
Modifizierter BoxplotDie Linien außerhalb der Schachtel werden nur bis zu xmin bzw. xmax gezogen, falls xmin und xmax innerhalb des Bereichs [zu,zo] der Zäune liegen. zu = x0.25 +1.5d ,zo x= x0.75 +1.5d
Ansonsten gehen die Linien nur bis zum kleinsten bzw. größten Wert innerhalb der Zäune, die außerhalb liegenden Werte werden individuell eingezeichnet.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
16
Beispiele:Gewicht von Ferkeln
am 70. Tag
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
17
Kreisdiagramm, Tortendiagramm
Darstellung der relativen (absoluten) Häufigkeiten als
Fläche eines Kreises
Anwendung: • Nominale Merkmale• Ordinale Merkmale (Problem: Ordnung nicht korrekt
wiedergegeben)• Gruppierte Daten
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
18
Beispiele: Körpertemperaturveränderung bei Ferkeln
8 h nach Zweitimpfung8 h nach Erstimpfung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
19
Varianten in SPSS
Beispiel: Körpertemperaturveränderung bei Ferkeln 8 h nach
Zweitimpfung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
20
Säulendiagramm
Darstellung der absoluten oder relativen Häufigkeitenals Höhen (Längen)
x-Achse: Ausprägungen des Merkmalsy-Achse: Absolute / Relative Häufigkeiten
Anwendungen:• Ordinale Merkmale• Metrische Merkmale mit wenigen Ausprägungen• Nominale Merkmale (Problem: Ordnung nicht
vorhanden)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
21
Beispiele: Mastenten
Anzahl trinkender Tiere beobachtet in 3165 5-Minuten-Intervallen
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
22
Stapeldiagramm
Darstellen der absoluten oder relativen Häufigkeiten als Länge. Die
Abschnitte werden übereinander in verschiedenen Farben gestapelt.
Eindimensionale Darstellung
Anwendungen:
• Ordinale Daten
• Gruppierte Daten
• Metrische Daten mit wenigen Ausprägungen
Besonders geeignet für den Vergleich verschiedener Gruppen durch
Nebeneinander liegende Stapel. Zu beachten ist dann die Unterscheidung
relative Häufigkeit absolute Häufigkeit
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
23
Beispiele:Körpertemperaturveränderung bei Ferkeln 8 h nach Zweitimpfung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
24
Beispiele:Körpertemperaturveränderung bei Ferkeln 8 h nach Zweitimpfung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
25
Körpertemperaturveränderung bei Ferkeln 8 h nach Zweitimpfung
Vergleich mit Kreisdiagramm:
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
26
Vergleich mit Kreisdiagramm:
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
27
Das Histogramm
Darstellung der relativen Häufigkeiten durch Flächen
(Prinzip der Flächentreue)
Vorgehen:
1. Aufteilung in Klassen (falls die Daten noch nicht gruppiert sind)
2. Bestimmung der relative Häufigkeiten
3. Bestimmung der Höhen hi , so dass gilt:
wobei bi: Breite der Klasse i.iii fhb
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
28
Beispiel:
Gewicht von Ferkeln am 1. LebenstagGewicht gruppiert in Abständen von 0,5 kg
Tabelle:
Häufigkeit fi bi hi
[0,5 – 1,0] 6 9,7% 10 0,0097
(1,0 – 1,5] 32 51,6% 10 0,0516
(1,5 – 2,0] 18 29,0% 10 0,0290
(2,0 – 2,5] 6 9,7% 10 0,0097
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
29
Gewicht in Abständen von 0,5 kg
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
30
Gewicht in Abständen von 0,250 kg
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
31
Histogramm mit Standardeinstellung aus SPSS
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
32
Histogramm
• Anwendung bei metrischen Daten
• Beachte: Abhängigkeit von der Breite
• Klasse inhaltlich vorgeben
• verschiedene Varianten ansehen
• Vorsicht bei Rändern
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
33
Stamm-Blatt-Diagramm
(English: stem and leaf plot)
Spezielles Histogramm mit:
• Klassen nach Dezimalsystem• Einzeldaten reproduzierbar
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
34
Beispiel:
Temperatur von Ferkeln am 11. Lebenstag
Stem-and-Leaf Plot
Frequency Stem & Leaf
2,00 38 . 88 6,00 39 . 002224 3,00 39 . 567 1,00 40 . 2
Stem width: 1,0Each leaf: 1 case(s)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
23.11.2006
35
Empirische Verteilungsfunktion
Beispiel: Gewicht von
Ferkeln am 70. Lebenstag
genBeobachtunderGesamtzahl
xgenBeobachtunderAnzahlxF
)(