Vorlesung: Biometrie für Studierende der Veterinärmedizin 23.11.2006 1 Der Median 50% der Daten...

Post on 05-Apr-2015

104 views 0 download

transcript

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

1

Der Median

50% der Daten sind kleiner oder gleich med

50% der Daten sind größer oder gleich med

Zahlganzen

kfallsxx

Zahlganzen

kfallsx

hk

k

2)(

2

12

1

)1()(

)(

)()1( nxx

med =

sind geordnete Werte

Definition: Wert für den gilt

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

2

Eigenschaften des Median

• anschaulich• stabil gegenüber monotonen Transformationen• geeignet für ordinale Daten• stabil gegenüber Ausreißern

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

3

Beispiel Median

Statistiken

Hämatokrit80

40

40,00

40

Gültig

Fehlend

N

Median

Modus

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

4

Das Quantil (Perzentil)

Anteil p der Daten sind kleiner oder gleich xp

Anteil 1-p der Daten sind größer oder gleich xp

Zahlganzenpkfallsxx

nphlkleinsteZakundZahlganzekeinenpfallsx

hk

k

)(2

1 )1()(

)(

Definition: Wert für den gilt

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

5

Fünf-Punkte Zusammenfassung

Minimum, 25%-Quantil, Median,75%-Quantil,Maximum

Statistiken

Hämatokrit80

40

40,00

36,00

38,00

40,00

41,00

42,00

44,00

Gültig

Fehlend

N

Median

10

25

50

75

90

99

Perzentile

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

6

Der Mittelwert (arithmetisches Mittel)

n

inx

1

1

• bekanntestes Lagemaß

• instabil gegen extreme Werte • geeignet für Intervallskalierte Daten

ix

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

7

Beispiel Mittelwert

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Deskriptive Statistik

80 35 44 39,48 2,093

80

Hämatokrit

Gültige Werte(Listenweise)

N Minimum Maximum MittelwertStandardabweichung

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

8

Die Spannweite (Range)

minmax xxq Definition:

• „Bereich in dem die Daten liegen“ • Wichtig für Datenkontrolle

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

9

Der Quartilsabstand

25,075,0 xxq Definition:

• „Größe des Bereichs in dem die mittlere Hälfte der Daten liegt“• Geeignet für ordinal skalierte Daten• Zentraler 50%-Bereich

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

10

Standardabweichung

Definition:

2

22 )(1

1

SS

xxn

S i

• „Mittlere Abweichung vom Mittelwert“• Manchmal auch 1/n statt 1/(n-1)• Intervallskala Voraussetzung

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

11

Variationskoeffizient

• Varianz und Streuung sind von der Skala abhängig, auf der gemessen wird

Beispiele:

• Temperatur in °Celsius oder Fahrenheit• Gewicht in mg oder µg

Daher bezieht man die Streuung oftmals auf deren Lage und berechnet den Variationskoeffizienten als Standardabweichung / Mittelwert

X

SVK

X

• VK ist ein dimensionsloses Maß

• „Standardabweichung in Mittelwertseinheiten“

• Nur sinnvoll für positive

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

12

Lage und Streuung: Zusammenfassung

Lage und Streuung sind die wichtigsten Parameter einer Häufigkeitsverteilung von Daten

Sie sind Bestandteil

JEDER BIOMETRISCHEN AUSWERTUNG

• Ein wichtiges Instrument der Datenbeschreibung ist aber auch die graphische Darstellung

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

13

Datendarstellung

• „Ein Bild sagt mehr als Tausend Worte“• Allgemeine Kriterien:• Wahl der Skala incl. Bereich• Wahl des Prinzips (Längentreue, Flächentreue)• Einbringen von anderen Visualisierungen (Piktogramme etc.)• Angemessene Wahl der Variablen• Wichtige Typen:• Stab-, Balken- und Säulendiagramm• Kreis (Torten)-Diagramm• Histogramm

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

14

Boxplot

Beispiel: Hämatokrit bei Mastenten

Maximum75%-QuantilMedian25%-Quantil

Ausreißer

ExtremwerteMinimum

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

15

Boxplot

1. x0.25 = Anfang der Schachtel (Box)x0.75 = Ende der Schachteld = Länge der Schachtel

2. Der Median wird durch den Strich in der Box markiert3. Zwei Linien („whiskers“) außerhalb der Box gehen bis zu xmin und

xmax.

Modifizierter BoxplotDie Linien außerhalb der Schachtel werden nur bis zu xmin bzw. xmax gezogen, falls xmin und xmax innerhalb des Bereichs [zu,zo] der Zäune liegen. zu = x0.25 +1.5d ,zo x= x0.75 +1.5d

Ansonsten gehen die Linien nur bis zum kleinsten bzw. größten Wert innerhalb der Zäune, die außerhalb liegenden Werte werden individuell eingezeichnet.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

16

Beispiele:Gewicht von Ferkeln

am 70. Tag

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

17

Kreisdiagramm, Tortendiagramm

Darstellung der relativen (absoluten) Häufigkeiten als

Fläche eines Kreises

Anwendung: • Nominale Merkmale• Ordinale Merkmale (Problem: Ordnung nicht korrekt

wiedergegeben)• Gruppierte Daten

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

18

Beispiele: Körpertemperaturveränderung bei Ferkeln

8 h nach Zweitimpfung8 h nach Erstimpfung

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

19

Varianten in SPSS

Beispiel: Körpertemperaturveränderung bei Ferkeln 8 h nach

Zweitimpfung

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

20

Säulendiagramm

Darstellung der absoluten oder relativen Häufigkeitenals Höhen (Längen)

x-Achse: Ausprägungen des Merkmalsy-Achse: Absolute / Relative Häufigkeiten

Anwendungen:• Ordinale Merkmale• Metrische Merkmale mit wenigen Ausprägungen• Nominale Merkmale (Problem: Ordnung nicht

vorhanden)

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

21

Beispiele: Mastenten

Anzahl trinkender Tiere beobachtet in 3165 5-Minuten-Intervallen

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

22

Stapeldiagramm

Darstellen der absoluten oder relativen Häufigkeiten als Länge. Die

Abschnitte werden übereinander in verschiedenen Farben gestapelt.

Eindimensionale Darstellung

Anwendungen:

• Ordinale Daten

• Gruppierte Daten

• Metrische Daten mit wenigen Ausprägungen

Besonders geeignet für den Vergleich verschiedener Gruppen durch

Nebeneinander liegende Stapel. Zu beachten ist dann die Unterscheidung

relative Häufigkeit absolute Häufigkeit

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

23

Beispiele:Körpertemperaturveränderung bei Ferkeln 8 h nach Zweitimpfung

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

24

Beispiele:Körpertemperaturveränderung bei Ferkeln 8 h nach Zweitimpfung

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

25

Körpertemperaturveränderung bei Ferkeln 8 h nach Zweitimpfung

Vergleich mit Kreisdiagramm:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

26

Vergleich mit Kreisdiagramm:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

27

Das Histogramm

Darstellung der relativen Häufigkeiten durch Flächen

(Prinzip der Flächentreue)

Vorgehen:

1. Aufteilung in Klassen (falls die Daten noch nicht gruppiert sind)

2. Bestimmung der relative Häufigkeiten

3. Bestimmung der Höhen hi , so dass gilt:

wobei bi: Breite der Klasse i.iii fhb

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

28

Beispiel:

Gewicht von Ferkeln am 1. LebenstagGewicht gruppiert in Abständen von 0,5 kg

Tabelle:

Häufigkeit fi bi hi

[0,5 – 1,0] 6 9,7% 10 0,0097

(1,0 – 1,5] 32 51,6% 10 0,0516

(1,5 – 2,0] 18 29,0% 10 0,0290

(2,0 – 2,5] 6 9,7% 10 0,0097

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

29

Gewicht in Abständen von 0,5 kg

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

30

Gewicht in Abständen von 0,250 kg

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

31

Histogramm mit Standardeinstellung aus SPSS

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

32

Histogramm

• Anwendung bei metrischen Daten

• Beachte: Abhängigkeit von der Breite

• Klasse inhaltlich vorgeben

• verschiedene Varianten ansehen

• Vorsicht bei Rändern

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

33

Stamm-Blatt-Diagramm

(English: stem and leaf plot)

Spezielles Histogramm mit:

• Klassen nach Dezimalsystem• Einzeldaten reproduzierbar

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

34

Beispiel:

Temperatur von Ferkeln am 11. Lebenstag

Stem-and-Leaf Plot

Frequency Stem & Leaf

2,00 38 . 88 6,00 39 . 002224 3,00 39 . 567 1,00 40 . 2

Stem width: 1,0Each leaf: 1 case(s)

Vorlesung: Biometrie für Studierende der Veterinärmedizin

23.11.2006

35

Empirische Verteilungsfunktion

Beispiel: Gewicht von

Ferkeln am 70. Lebenstag

genBeobachtunderGesamtzahl

xgenBeobachtunderAnzahlxF

)(