Grundlagen der Schulmathematik SoSe 2009
1
Beschreibende Statistik Daten graphisch darstellen
21. April 2009Dr. Katja Krüger
Universität Paderborn
2
Die rasche und sichere Übermittlung von Daten ist in unserer vom Austausch von Informationen geprägten Welt von entscheidender Bedeutung.Umfangreiches Zahlenmaterial lässt sich graphisch einfach, übersichtlich und einprägsam vermitteln.Vorsicht: Gefahr von Fehlinterpretationen und Missverständnissen.Nur bei genauer Kenntnis alternativer Darstellungen lässt sich eine passende Darstellungsart auswählen.
Daten graphisch darstellen –
warum?
Grundlagen der Schulmathematik SoSe 2009
3
Inhalt
DiagrammartenAnalyse von Daten mittels geeigneter Diagramme−
Arbeitslosendaten
−
TV-Daten−
Taschengeld-Daten
Glockenförmige Häufigkeitsverteilungen Manipulierte Diagramme
Umgang mit Daten und Häufigkeiten schon in der Grundschule
Daten erfassen und darstellen•
in Beobachtungen, Untersuchungen und einfachen Experimenten Daten sammeln, strukturieren und in Tabellen, Schaubildern und Diagrammen darstellen.
•
aus Tabellen, Schaubildern und Diagrammen Informationen entnehmen.
Quelle: Das Zahlenbuch 1. Klett 2004, S. 115
5
Am Ende der Primarstufe sollten Schülerinnen und Schüler erste Erfahrungen im Erfassen und Aufbereiten von Daten mit Strichlisten Häufigkeits-
tabellen, Strecken-
und Streifendiagrammen besitzen…www.mathematik.uni-dortmund.de/ak-stoch/stellung.html
Daten graphisch darstellen -
aber wie?
Anzahl der Jungen und Mädchen in der Waldschule
Quelle: Beispielaufgabe 6 aus den KMK-Bildungs- standards für die Primarstufe
Absolute Häufigkeiten
6
Daten graphisch darstellen -
aber wie?
Am Ende der Sekundarstufe I sollten Schüler folgende Möglichkeiten zur grafischen Darstellung von eindimensionalen Daten kennen und in der Lage sein, angemessene grafische Darstellungen für Daten auszuwählen und in einfachen Fällen zu erstellen:
•
Kreisdiagramm, •
Streckendiagramm (Stabdiagramm),
•
Streifendiagramm (Balken-
oder Säulendiagramm), •
Liniendiagramm (Kurvendiagramm, Streckenzug, …
•
…
und Bilddiagramm (Piktogramm).“•
www.mathematik.uni-dortmund.de/ak-stoch/stellung.html
8
Streifendiagramm-Säulendiagramm und Balkendiagramm
•
Eine Achse dient als Skala für die Häufigkeiten, auf der anderen Achse werden die Merkmalsausprägungen notiert. Die Abstände können beliebig, sollten jedoch gleich groß
gewählt werden.
•
Die Höhe
der Stäbe oder Säulen bzw. die Länge
der
Balken gibt die (absolute oder relative) Häufigkeit der Merkmalsausprägung an. Die Stäbe müssen daher gleich breit sein, da das Auge die Größe der Fläche wahrnimmt.
•
Die Höhen-
oder Längenskala beginnt bei 0.
0,1
0,2
0,35
0,15
0,1
0,05
0 0,1 0,2 0,3 0,4
1
2
3
4
5
6
Not
e
rel. Häufigkeit
9
Kreisdiagramm-TortendiagrammDas Kreisdiagramm eignet sich zur Veranschaulichung von Häufigkeitsverteilungen. Hier werden Flächen als Mittel zur Veranschaulichung von Häufigkeiten (oder von Anteilen) verwendet:
Fläche des Kreissektors ~ relativen Häufigkeit
( )ini ah=°360
α
Das Verhältnis von Sektor-Winkel αi
zum Vollwinkel 360°
ist hier gleich dem Verhältnis der Flächeninhalte von Sektor zu Vollkreis, und entspricht der relativen Häufigkeit der jeweiligen Merkmalsausprägung.
Vorsicht bei 3D- Darstellungen:
Volumen (nicht die Fläche) ist das bestimmende optische Element
11
LiniendiagrammDas Liniendiagramm eignet sich, wenn:•
eine große Zahl zeitabhängiger Daten visualisiert werden soll
•
das generelle Verhalten (der Trend) und nicht das absolute Ausmaß betont werden soll
•
verschiedene Beobachtungsreihen miteinander verglichen werden sollen.•
Prognosen und Interpolationen (Zwischenwerte) sichtbar gemacht werden sollen
Entwicklung der Arbeitslosenquote in Deutschland(Werte bis 1990 nur West-, ab 1991 Gesamtdeutschland)
Quelle: Bundesagentur für Arbeit
Vorsicht: Hier wird keine Häufigkeitsverteilung dargestellt.
12
PiktogrammAnstelle von Säulen, Balken oder Flächen werden in einem Pikto-
gramm Figuren
für die Darstellung von Häufigkeiten verwendet. Dabei bedeutet ein Symbol eine bestimmte Einheitsmenge.
www.bpb.de/wissen/CQCQSZ,0,0,Arbeitslosigkeit.html
Unübersichtliches Diagramm
13
Das gewählte Diagramm sollte vor allem eine statistische Erkenntnis, das Wesentliche einer Datensammlung, anschaulich und einprägsam ausdrücken sowie möglichst keine Fehlinter-
pretationen zulassen. Zum guten Gelingen sind einige Grundsätze zu berücksichtigen.
Das Diagramm•
ist für sich allein verständlich
•
trägt einen informativen Titel•
enthält alle wesentlichen Beschriftungen an den Achsen (Maßstab, Einheiten, …)
•
ist übersichtlich gestaltet und enthält nicht zu viele Details•
muss sich für die Darstellung der jeweiligen Daten eignen (Merkmalsarten beachten!)
Grundsätze beim Erstellen von Diagrammen
16
Vergleich von Kreisdiagrammen Häufigkeitsverteilung des Merkmals
„bisherige Arbeitslosigkeitsdauer“
17
Die Sehdauer gibt an, wie lange im Durchschnitt eine Person im Panel innerhalb eines bestimmten Zeitintervalls ferngesehen hat.
www.agf.de/daten/zuschauermarkt/sehdauer/
Warum wird hier wohl das Säulen-
anstelle des Liniendiagramms gewählt?
2. Beispiel: TV-Daten
Exkurs zum 2. Beispiel: Das AGF-Fernsehpanel
stellt ein verkleinertes Abbild aller Privathaushalte mit mindestens einem Fernseh-
gerät in Deutschland dar. Durch den ständigen Abgleich der Panelstrukturen mit denen der Grundgesamtheit soll die Repräsentativität des Fernsehpanels gewährleistet werden. Mit den 5.640 Haushalten des Panels, in denen fast 13.000 Personen leben, wird die Fernseh-
nutzung von 72,20 Mio. Personen ab 3 Jahre erfasst.
18
Stand 1.1.2009www.agf.de/fsforschung/methoden
19
Die Sehbeteiligung gibt an, wie viele Personen während einer Sendung/eines Werbeblocks/eines bestimmten Zeitintervalls durchschnittlich ferngesehen haben.
www.agf.de/daten/zuschauermarkt/sehbeteiligung/
Vergleich von Teilgruppen
20
3. Beispiel: Taschengeld-Daten
www.kinderbarometer-hessen.de/
21
„Mit einer offenen Frage wurden die Kinder … gefragt, wofür sie haupt- sächlich ihr Taschengeld ausgeben.“
Verwendung von Taschengeld
Ausprägungen des Merkmals nach Häufigkeit geordnet
22
Vergleich von zwei Verteilungen wird durch Anordnung der Merkmalsausprägungen nach Häufigkeit erschwert.
Verwendung von Taschengeld
23
Höhe des monatlichen Taschengeldes
Zeitliche Entwicklung im VergleichVerbindungslinien: Bedeutung der Zwischenwerte?Aussagekraft von Durchschnittswerten?
24
Höhe des monatlichen Taschengeldes
Die Taschengeldfrage ist heikel: „14% der befragten Kinder beantworteten in diesem Jahr die Frage nach dem Taschengeld nicht (2005: 13%). Diese Kinder wollen entweder keine Auskunft über ihr Taschengeld erteilen oder bekommen kein Taschengeld und haben die Fragen deshalb nicht beantwortet.“
Vorsicht: Klassen sind unterschied-
lich breit
25
Histogramm bei vielen Daten eines quantitativen Merkmals
Über den Klassen werden Rechtecke gezeichnet, die direkt aneinander anschließen. Beim Histogramm ist der Flächeninhalt ein Maß
für die Häufigkeit
der jeweiligen Klasse. Auf der y-
Achse wird daher die Häufigkeitsdichte fi
aufgetragen.
Schüler-Daten eines GK Mathematik zur Körpergröße (n = 49)
0,02
0,04
0,06
140 150 160 170 180 190 200Groesse_cm
33%10%
53%
4%
i
i
b teKlassnbreik Klasseder figkeit Klassenhäu relative
=if
0,33 :10 = 0,033Klassenbreite: 10 cm
26
Histogramm gleicher Datensatz, verschiedene Klasseneinteilungen
Schüler-Daten zur Körpergröße (n=49)
Klassenbreite: 10 cm Klassenbreite: 5 cm
0,02
0,04
0,06
0,08
140 150 160 170 180 190 200Groesse_cm
0,02
0,04
0,06
0,08
140 150 160 170 180 190 200Groesse_cm
Vertiefung in der 1. Übung: Histogramme bei unterschiedlich breiten Klassen
28
Häufigkeitsverteilung von Körpergrößen
http://de.statista.com/statistik/diagramm/studie/341/umfrage/koerpergroesse/
Sozio-oekonomisches Panel (SOEP) des DIW Berlin. Das SOEP ist eine repräsentative Wiederholungsbefragung privater Haushalte in Deutschland, die für die sozial-
und wirtschaftswissenschaftliche Grundlagenforschung Umfragedaten bereitstellt.
29
Häufigkeitsverteilung von Körpergrößen
http://de.statista.com/statistik/daten/studie/1825/umfrage/koerpergroesse-nach-geschlecht/
30
Häufigkeitsverteilung von Körpergewichten
http://de.statista.com/statistik/diagramm/studie/342/umfrage/koerpergewicht-in-kilogramm/
31
Häufigkeitsverteilung der Nettoeinkommen noch glockenförmig?
http://de.statista.com/statistik/diagramm/studie/585/umfrage/monatliches-nettoeinkommen-in-euro/
Fast 50% der Befragten verdienen weniger als 1500 €
netto im Monat!
Vertiefende Analyse des Diagramms in der 1. Hausaufgabe
33
Zahlen lügen nicht – oder vielleicht doch?
Sobald Daten zahlenmäßig erfasst werden, ist Kompetenz offenbar nachgewiesen. Niemand denkt mehr daran, dass diese Daten von irgendjemand zusammengestellt wurden, dass die Darstellung von Datenmaterial praktisch nie wertneutral ist, sondern meist bewusst eingesetzt wird, um jemanden von etwas zu überzeugen oder Widerspruch im Keim zu ersticken.
34
Was passiert mit der x-Achse?
aus Walter Krämer: So lügt man mit Statistik. Campus 1997, S. 47,49