Post on 27-Jun-2020
transcript
Wolfram Fischer
Neue Grafikenzur Datenvisualisierung
Band 1
Speichengrafiken, Streuungsfächerkarten,
Differenz−, Sequenz− und Wechseldiagramme
Wolfram Fischer
Neue Grafikenzur Datenvisualisierung
Band 1: Speichengrafiken, Streuungsfächerkarten,Differenz-, Sequenz- und Wechseldiagramme
Zentrum für Informatik und wirtschaftliche MedizinWolfertswil
Angaben zum Autor
Wolfram Fischer
Z I M – Zentrum für Informatik und wirtschaftliche Medizin
Steigstrasse 12
CH-9116 Wolfertswil (SG)
wolfram@fischer-zim.ch
Betriebswirtschafter (lic. oec. HSG) und Medizin-Informatiker;
Gründer und Leiter des Z I M.
Tätigkeitsschwerpunkte:
• Analyse und Visualisierung medizinökonomischer Daten.
• Patientenklassifikationssysteme aus ärztlicher und aus pflegerischer Sicht.
• Bereitstellung fachspezifischer Informationen im Internet unter:
www.fischer-zim.ch
Liste der «Kunstgrafiken» in diesem Buch
• Mond-Feuer-Blume (2010) ↑ S. 17
• Linien-Aussaat (2009) ↑ S. 29
• Dreiecke im Wind (2005) ↑ S. 45
• Rot verloren im Blauwald (2010) ↑ S. 71
• Wechselflaggen-Gehänge (2010) ↑ S. 85
• Speichenspirale 1 (2009) ↑ S. 97
Informationsseite zum Buch
http:// www.fischer-zim.ch / studien / Neue-Grafiken-I-1003-Info.htm
© 2010 (Internetversion) Wolfram Fischer, Wolfertswil
Zentrum für Informatik und wirtschaftliche Medizin
http:// www.fischer-zim.ch / verlag /
Umschlag, Layout und Satz: Wolfram Fischer
(Verwendete freie Software: LATEX, m4, R, perl, etc. unter Linux)
Grafik auf Umschlag: Auf der Grundlage von Tafel 8, S. 39
Korrektorat: Edith Meier-Keim
ISBN 978-3-905764-06-2
Vorwort
Statistische Grafiken helfen, Zahlenmaterial besser zu verstehen. Sie las-StatistischeGrafiken sen nicht nur Besonderheiten, sondern auch Unauffälligkeiten erkennen.
Sie sollen den Leser unterstützen, Fragen zu stellen und zu diskutieren.Es gibt zwei grundsätzlich verschiedene Ansätze, Grafiken zu gestalten:Plakativ oder
ziseliert? Mit einer plakativen Grafik kann man wirkungsvoll eine bestimmte Aussa-ge belegen. Man destilliert dazu aus einer Vielzahl von vorliegenden Infor-mationen jene Daten heraus, deren Darstellung den Betrachter der Grafikvon der angestrebten Aussage überzeugt.
Mit einer differenzierten, dichten Grafik kann man einen Sachverhaltumfassender darstellen. Auch dazu wird man Informationen auswählenmüssen. Man zeigt aber soviel Information, dass der Leser der Grafikselbst einen Schritt in die Tiefe machen kann und dass er möglicherwei-se Fragen an die Auswertungen stellt, die vom Konstrukteur der Grafik sonicht vorausgedacht worden waren.
Aussagekräftige und diskussionsfördernde statistische Grafiken zu ge-KreativeKonstruktionen stalten ist eine herausfordernde und zugleich auch sehr spannende, ja
beflügelnde Aufgabe. Wenn man die Freiheit hat, Grafiken jenseits derStandardvorschläge aus einem Officepaket zu gestalten, beginnt die Ar-beit – nach der vorgängigen Präzisierung des Darstellungsziels – zuersteinmal mit dem Sammeln von Gestaltungsideen: Welche Möglichkeitengäbe es, mit den verschiedenen Aspekten des Datenmaterials umzuge-hen? Genügen die bekannten Darstellungstechniken oder könnte eineneue Form entwickelt werden? Bei der anschliessenden Umsetzung undErprobung der Ideen werden sich neue Wege auftun; andere Wege wer-den sich als ungeeignet entpuppen. Schliesslich entscheidet man sich füreine bestimmte Ausgestaltung, die man als gelungen empfindet. Oder manverwirft das Ganze, nimmt eine andere Idee auf und beginnt von vorne.
Auf den folgenden Seiten stelle ich einige der von mir auf solchen Ent-Entdeckungsreisedeckungsreisen entwickelten neuartigen Grafikelemente und Grafiken vor.
Dass diese Arbeit auch zum Spiel an- oder verleitet, zeigen die denSpielfreudeKapiteln vorangestellten künstlerischen Verfremdungen der Grafiken. Sieberuhen auf realem Zahlenmaterial, wurden aber durch gezielte – manch-mal zunächst unabsichtliche – Fehleinstellungen einzelner Parameter um-geformt.
5
6
Inhaltsverzeichnis
Tabellen und Abbildungen 9
A Einleitung 11A.1 Aufbau des Buches . . . . . . . . . . . . . . . . . . . . . 11A.2 Lesehinweise . . . . . . . . . . . . . . . . . . . . . . . . . 12A.3 Vorüberlegungen . . . . . . . . . . . . . . . . . . . . . . . 13
B Speichengrafiken 15B.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 19B.2 Beschreibung . . . . . . . . . . . . . . . . . . . . . . . . . 20B.3 Beispiel 1: Überblick über Fallzahlen in 445 Patientenkate-
gorien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21B.4 Beispiel 2: Preisunterschiede in 546 Patientenkategorien . . 24
C Streuungsfächerkarten 27C.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 31C.2 Beschreibung: Fächer . . . . . . . . . . . . . . . . . . . . 32C.3 Beispiel 1: Fähigkeitseinschränkungen und Pflege . . . . . 34C.4 Beispiel 2: Fähigkeitseinschränkungen und Pflege im Zeit-
verlauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36C.5 Beispiel 3: Mathematikprüfungen und sozioökonomischer
Status . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38C.6 Beispiel 4: Krankenkassenprämien . . . . . . . . . . . . . 40
D Differenzdiagramme 43D.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 47D.2 Beschreibung: Dreiecke . . . . . . . . . . . . . . . . . . . 47D.3 Beispiel 1: Vergleich von Fallanteilen in Patientenkategorien 48D.4 Beispiel 2: Gerstenernten 1931 und 1932 . . . . . . . . . . 50D.5 Beschreibung: Punktbalken . . . . . . . . . . . . . . . . . 52D.6 Beispiel 3: Gerstenernten 1931 und 1932 . . . . . . . . . . 52D.7 Vergleich von vier Darstellungsweisen . . . . . . . . . . . . 54D.8 Beschreibung: Dreieck mit Balken . . . . . . . . . . . . . . 56D.9 Beispiel 4: Gerstenernten 1931 und 1932 . . . . . . . . . . 56D.10 Beschreibung: Kombination von zwei Dreiecken . . . . . . 58D.11 Beispiel 5: Gerstenernten 1931 und 1932 . . . . . . . . . . 58
7
Inhaltsverzeichnis
E Sequenzdiagramme 69E.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 73E.2 Beschreibung: Sequenzierte Dreiecke . . . . . . . . . . . . 75E.3 Beispiel 1: Verlauf von Rehabilitationsbehandlungen . . . . 76E.4 Beschreibung: Sequenzbänder . . . . . . . . . . . . . . . 78E.5 Beispiel 2: Verlauf von Rehabilitationsbehandlungen . . . . 78E.6 Beschreibung: Kammlinien . . . . . . . . . . . . . . . . . . 80E.7 Beispiel 3: Verlauf von Rehabilitationsbehandlungen . . . . 80
F Wechseldiagramme 83F.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 87F.2 Beschreibung: Wechselflagge . . . . . . . . . . . . . . . . 88F.3 Beispiel 1: Antwortpaare zu Ja/Nein-Fragen nach Ländern . 88F.4 Beispiel 2: Antwortpaare zu Ja/Nein-Fragen nach Themen . 90F.5 Beispiel 3: Antwortkombinationen zu Ja/Nein-Fragen pro
Person . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
G Anhang 95G.1 Statistische Anmerkungen . . . . . . . . . . . . . . . . . . 99
G.1.1 Median und Quartile in Boxplot und Streuungsfä-cherkarte . . . . . . . . . . . . . . . . . . . . . . . 99
G.1.2 Varianzreduktion (r2) . . . . . . . . . . . . . . . . . 100G.1.3 Reduktion der absoluten Abweichungen vom Medi-
an (r1) . . . . . . . . . . . . . . . . . . . . . . . . 102G.2 Verzeichnisse . . . . . . . . . . . . . . . . . . . . . . . . . 104
G.2.1 Abkürzungen . . . . . . . . . . . . . . . . . . . . . 104G.2.2 Literaturverzeichnis . . . . . . . . . . . . . . . . . . 105— Stichwortverzeichnis . . . . . . . . . . . . . . . . . 107
8
Tabellen und Abbildungen
1 Platzbedarf einer Speichengrafik im Vergleich zum Balkendiagramm . . 212 SGP 2005: Anzahl Fälle in allen belegten APDRGs . . . . . . . . . . . 233 HRG 3.5: Unterschiede der HRG-Pauschalen 2008 für elektive und nicht-
elektive Behandlungen . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Erster Versuch zu einem grafischen Symbol für ein Strömungsbild . . . 315 Legende zum Streuungsfächer (360°) . . . . . . . . . . . . . . . . . . 336 Median und Quartile der LEP-Stunden pro Tag, nach motorischem und
kognitivem FIM (TAR97) . . . . . . . . . . . . . . . . . . . . . . . . . . 357 Median und Quartile der LEP-Stunden pro Tag, nach motorischem und
kognitivem FIM (Test-Daten) . . . . . . . . . . . . . . . . . . . . . . . 378 7185 Mathematikprüfungen: Resultate nach Geschlecht und Zugehörig-
keit zu einer Minorität . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 CH: Krankenkassenprämienangebote . . . . . . . . . . . . . . . . . . 41
10 Legende zum Symbol für Differenzdiagramme . . . . . . . . . . . . . . 4711 Krankenhaus H217: Fallanteile nach APDRG-Subkategorien und Kosten-
gewichtsklassen im Vergleich zu allen Krankenhäusern des Typs «Zen-trumsversorgung» . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
12 Gerstenernten in Minnesota 1931 und 1932 (Differenzdiagramm) . . . . 5113 Legende zum Symbol für Punktbalkendiagramme . . . . . . . . . . . . 5214 Gerstenernten in Minnesota 1931 und 1932 (Punktbalkendiagramm) . . 5315 Gerstenernten in Minnesota 1931 und 1932 (vier Darstellungsweisen) . 5516 Legende zum Symbol für Doppeldifferenzdiagramme . . . . . . . . . . 5617 Gerstenernten in Minnesota 1931 und 1932 (Doppeldifferenzdiagramm) 5718 Legende zum Symbol für Differenzdiagramme mit zwei Dreiecken . . . . 5819 Gerstenernten in Minnesota 1931 und 1932 (zwei Differenzdiagramme) . 5920 Gerstenernten in Minnesota 1931 und 1932, korrigiert (zwei Differenzdia-
gramme) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6121 Gerstenernten in Minnesota 1931 und 1932, korrigiert (zwei Differenzdia-
gramme), nach Sorten . . . . . . . . . . . . . . . . . . . . . . . . . . . 6322 Gerstenernten in Minnesota 1931 und 1932, korrigiert (zwei Differenzdia-
gramme), nach Anbauorten . . . . . . . . . . . . . . . . . . . . . . . . 6523 Gerstenernten in Minnesota 1931 und 1932, korrigiert (Strömungsbilder) 67
24 Legende zu sequenzierten Dreiecken mit fünf Werten . . . . . . . . . . 7325 Legende zu sequenzierten Dreiecken mit sieben Werten . . . . . . . . 7426 Legende zu sequenzierten Dreiecken mit acht Werten . . . . . . . . . . 7527 Entwicklung der FIMø-Punkte nach Hospitalisationswochen . . . . . . . 7728 Legende zu einem Sequenzband mit acht Werten . . . . . . . . . . . . 7829 Sequenzbänder zur Entwicklung der FIMø-Punkte nach Hospitalisations-
wochen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7930 Legende zu einer Kammlinie mit acht Werten . . . . . . . . . . . . . . 8031 Kammlinien zur Entwicklung der FIMø-Punkte nach Hospitalisationswo-
chen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
32 Legende zu den Wechselflaggen . . . . . . . . . . . . . . . . . . . . . 8733 Geordnete Antwortpaare zu sieben Ja/Nein-Fragen, nach Ländern . . . 8934 Geordnete Antwortpaare zu sieben Ja/Nein-Fragen, nach Themen . . . 91
9
Tabellen und Abbildungen
35 Antwortpaare pro Person zu sieben Ja/Nein-Fragen, nach Ländernund Personen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
36 Beispiel zur Berechnung der Varianzreduktion . . . . . . . . . . . . . . 10137 Beispiel zur Berechnung der Reduktion der absoluten Abweichungen vom
Median . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10338 Im Text verwendete Abkürzungen . . . . . . . . . . . . . . . . . . . . . 104
10
A Einleitung
A.1 Aufbau des Buches
Während meiner langjährigen Wühlarbeit in Datenbergen aus dem Ge-Grafiken gestaltensundheitswesen begann ich, eigene Grafiken zu gestalten. Dabei kamenmir meine Programmierkenntnisse zugute, und die Programmiersprache«R»1 eröffnete mir ganz neue Möglichkeiten. Sie spornte mich an, grafi-sche Darstellungen von Grund auf neu zu denken.
In der mit diesem Band eröffneten Buchreihe werden von mir entwickelteBuchreiheneuartige Typen von Grafiken zur Visualisierung statistischer Daten vorge-stellt. Sie dienen zur differenzierten Darstellung umfangreicher und kom-plexer Daten. Und sie sollen mit einer ansprechenden Gestaltung auchdas Auge erfreuen.
Kapitelweise werden folgende Typen von Grafiken vorgestellt:Kapitelinhalte
• Speichengrafik2: Balkendiagramm in Kreisform.↑ S. 15
• Streuungsfächerkarte: Fächersymbole mit fixer Grösse, mit welchen↑ S. 27
die gleichen Verteilungskennzahlen dargestellt werden können wiemit Boxplots, mit Vergleichsmöglichkeiten in zwei Dimensionen.
• Differenzdiagramme3: Dreiecke – z. T. mit Balken kombiniert – zur↑ S. 43
Anzeige von Paaren oder Tripeln von absoluten Werten und derenDifferenzen.
• Sequenzdiagramme4: Dreiecke und Bänder zur Anzeige von sequen-↑ S. 69
zierten absoluten Werten und deren Differenzen.
• Wechseldiagramm: Diagonal unterteilte Quadrate zur Darstellung↑ S. 83
von zwei Zuständen und zwei Zustandswechseln.
Jedem Kapitel wurde eine «Kunstgrafik» vorangestellt. Sie wurden mit den«Kunstgrafiken»gleichen Algorithmen und Daten wie die statistischen Grafiken konstruiert,aber mit anderen Werten parametriert, um schöne oder überraschende,abstrakte Grafiken zu erhalten.
Im Anhang folgen einige Anmerkungen zu statistischen Fachaus-StatistischeFachausdrücke↑ S. 99
drücken, welche im Rahmen der Präsentation der Streuungsfächerkarten
1 http:// www.r-project.org /; Chambers [R, 2008]; Dalgaard [R, 2002]. – «R» ist eineOpenSource-Implementation der Programmiersprache «S»; vgl. dazu: Chambers [S,1998].
2 Erstmalige Beschreibung in: Fischer [Grafiken zur PCS-Beurteilung, 2008]: 35.3 Erstmalige Beschreibung in: Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 135 ff.4 Erstmalige Beschreibung in: Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 108 f.
Fischer 2010 (Internetversion) 11
A Einleitung
verwendet wurden. Sie sind für Leser gedacht, denen diese Dinge nochnicht besonders geläufig sind.
Im Text anzutreffende Abkürzungen sind ebenfalls im Anhang zusam- Verzeichnisse↑ S. 104mengestellt und mit allfälligen Internetverweisen ergänzt. Anschliessend
folgen Literatur- und Stichwortverzeichnis.
A.2 Lesehinweise
In diesem Buch gibt es zwei Arten von internen Querverweisen: Querverweise:
• Verweise auf Tafeln, die unmittelbar zum Text gehören. direkter Verweis
• Verweise auf Tafeln oder Abschnitte, die in anderen Teilen des Bu- ↑ Querverweis
ches zu finden sind.
In der Pdf-Datei gibt es in den Marginalien und im Inhaltsverzeichnis blau Blaue Verweise aufTabellen und Seiteneingefärbte Tabellen- und Seitennummern. Durch einen Mausklick gelangt
man direkt zur referenzierten Seite.Grau gedruckte Texte enthalten Verweise auf Texte im Internet, die für Graue Verweise
ins Internetdiese Arbeit gebraucht wurden. Durch einen Mausklick öffnet sich einInternet-Browser-Fenster, und man kann sich den referenzierten Text an-sehen. Da die Inhalte im Internet z. T. sehr schnelllebig sind, kann es sein,dass manche Verweise bereits zum Zeitpunkt des Lesens nicht mehr gül-tig sind. In solchen Fällen kann es sich lohnen, im Internet nach Titel undAutor zu suchen, um einen allfälligen neuen «Standort» ausfindig zu ma-chen.
Bei mehrzeiligen Internetverweisen kann es sein, dass man die aktiveZone für den Mausklick kaum findet. (Sie befindet sich dann zwischen denZeilen.) Dies schafft die aktuelle Version der verwendeten Textaufberei-tungssoftware leider noch nicht besser.
Es ist eine der Spezialitäten der hier vorgestellten Konstruktionsweisen, Dichte Grafiken mitz. T. kleinen Textendass Grafiken auch dann noch auf einer Seite Platz haben, wenn sie gros-
se Datenmengen abbilden. Das Ziel ist es, gleichzeitig sowohl einen Über-blick zu erhalten als auch auffällige Details sichtbar zu machen. Ein Nach-teil dieser Technik ist, dass die Texte in den resultierenden Grafiken zumTeil sehr klein geworden sind und dass es notwendig werden kann, dieLupe zu Hilfe zu nehmen.
12 Neue Grafiken I
A.3 Vorüberlegungen
A.3 Vorüberlegungen
Als generelle Hauptaufgaben einer Grafik sind mir wichtig:
1. Eine Grafik soll eine Einschätzung der Daten ermöglichen. Dazu istÜberblickund Vergleiche es nötig, dass sie dem Leser einen Überblick verschafft und gleich-
zeitig verschiedene Vergleichsmöglichkeiten bereitstellt.
2. Vergleiche werden durch die Abbildung relativer Werte oder durch dieRelative undabsolute Werte Gegenüberstellung absoluter Werte ermöglicht.
3. Auch wenn relative Werte direkt abgebildet werden, sollen die absolu-ten Werte nach Möglichkeit erkennbar sein, damit die Bedeutsamkeitihres Ausmasses abgeschätzt werden kann.
4. Die Daten müssen «lokalisiert» werden können: Sie müssen einerLokalisierbarkeitKategorie (oder mehreren) und/oder einem Mass (z. B. Zeit, Koordi-naten, identifizierender Wert) zugeordnet werden können.
5. Die Relevanz der präsentierten Kennzahlen soll soweit möglich abge-Relevanzschätzt werden können. (Hilfreich dazu können z. B. Mengenangabensein, welche als Indikatoren der Relevanz betrachtet werden können.)
6. Eine Grafik soll aus zwei Distanzen betrachtet werden können: AusErster undzweiter Blick grösserer Entfernung soll man ein Gesamtbild erhalten und erkennen
können, ob dieses eher ruhig ist oder ob es auffällige Bereiche gibt,die Anstoss zu Fragen geben könnten. Für eine nähere Betrachtungsoll die Grafik mit genügend Detailinformationen ausgestattet sein,um ein facettenreicheres Bild zu ermöglichen und Hinweise zu Ant-worten auf einige der entstandenen Fragen liefern zu können.
7. Eine Grafik soll ansprechend aussehen.AnsprechendesAussehen
Bei der Arbeit an Grafik-Konstruktionen und bei der AuseinandersetzungLernerfahrungenmit deren Konstruktionsprinzipien konnte ich viel lernen. Fasziniert war ichinbesondere von der Entdeckung, dass das menschliche Auge nicht nurauf plakativ präsentierte Unterschiede reagiert, sondern auch auf erstaun-lich geringe Veränderungen von Farben, Formen und Positionen.
Aufgrund dieser Erkenntnis begann ich, mit kleineren Formen und mitKleine FormenUntergliederungen in «Grafikfelder» zu arbeiten. Es zeigte sich, dass dieVergrösserung von Grafiken eher selten eine wirklich differenziertere In-terpretation ermöglichte. Eine Vergrösserung ist dann hilfreich, wenn nichtmehr alle Textelemente entziffert werden können. Da eine Vergrösserunggleichzeitig aber auch zu einem Verlust an Übersichtlichkeit führen kann,ist nach einem Optimum zwischen Kompaktheit und Lesbarkeit zu suchen.
Kleinere Formen erlauben es auch, Daten darzustellen, die wenigerWenigeraggregierte Daten stark aggregiert sind. Dies gibt bessere Einsichten in Strukturen wie z. B.
Verteilungsstrukturen.
Fischer 2010 (Internetversion) 13
A Einleitung
Ich setzte nicht nur verschiedene Farben, sondern auch unterschied- Farbintensitätenund Farbverläufeliche Farbintensitäten und Farbverläufe ein. Damit war eine vielfältigere
Farbgebung möglich. Darüberhinaus ergaben sich so mehr Codierungs-möglichkeiten. Und: Nicht-grelle Farben sind oft angenehmer zum Be-trachten.
Bei dieser Konstruktionsarbeit erkannte ich im Weiteren, dass grafische Grafiksymbole mitfixer AusdehnungSymbole mit fixer Ausdehnung für kompakte Darstellungen sehr dienlich
sind. Ausserdem werden damit Vergleiche in zwei Dimensionen (senkrechtund waagrecht) möglich.
Nach diesen Vorüberlegungen möchte ich den Leser nun nicht mehr län-ger mit theoretischen Überlegungen aufhalten, sondern die Vorstellung derGrafiken mit den Speichengrafiken beginnen . . .
14 Neue Grafiken I
B Speichengrafiken
Mond-Feuer-Blume (2010)
Aus der Speichengrafik mit Differenzen zu gut 500 HRG-Pauschalen, ↑ Tafel 3 (S. 25)
durch beidseitige Verkürzung der radialen Skala.
B.1 Motivation
B.1 Motivation
Was macht man am besten mit einer endlos langen Liste von Häufigkei-Lange Listevon Häufigkeiten ten? Das erste ist natürlich, dass man versucht, die Liste zu strukturieren.
Man sucht nach Gruppen, nach einer hierarchischen Struktur. Solche Bün-delungen helfen bei der Orientierung.
Trotzdem bleibt die Ausgangsliste lang, sofern man nicht auf eine detail-Balkendiagramm?lierte Darstellungsform verzichten kann. Eine konventionelle Darstellungmit Balken, welche die Häufigkeiten abbilden, kann an mangelndem Platzscheitern oder an den grossen Häufigkeitsunterschieden, welche schwachbelegte Kategorien manchmal beinahe unsichtbar werden lassen.1
Als ich an dieser Fragestellung herumstudierte, ging mir durch den Kopf,Durchmesser × π= Kreisumfang dass ein abgewickelter Kreis eine lange Linie erzeugt. Sie ist gut dreimal
so lang wie der Durchmesser des Kreises. Was würde passieren, dachteich, wenn ich den umgekehrten Vorgang benutzte? Wie wäre es, wenn ichdie Grundlinie, auf der die Balken stehen, zu einem Kreis formte?
Als ich dem Computer beigebracht hatte, die Balken in einen Kreis zuMehrere hundertKategorien ineinem Kreis
stellen und diese dann zum ersten Mal betrachtete, staunte ich, dass ichtrotz der Darstellung der Häufigkeiten zu mehreren hundert Kategoriennicht den Eindruck hatte, von der Datenmenge überfahren zu werden,sondern dass ich – vielleicht auch angezogen von der schönen Form –interessiert schauen ging, wo viel und wo wenig Messungen vorlagen. Ichmerkte, dass eine Gruppierung nach wie vor nötig war. Aber die Gruppenbüschelten sich kompakt, und es resultierte ein überraschend übersichtli-cher Gesamteindruck.
Die neue Grafik nannte ich «Speichengrafik», weil sie mich an ein Rad«Speichengrafik»eines Fahrrades erinnerte.
1 Von Hoffmann stammt der interessante Vorschlag, unsichtbare, aber trotzdem beleg-te Positionen bei Histogrammen oder anderen Balkendiagrammen mit einem kleinen(z. B. roten) Markierungsstrich zu versehen. – Vgl. Unwin et al. [Graphics, 2006]:58+87+106.
Fischer 2010 (Internetversion) 19
B Speichengrafiken
B.2 Beschreibung
«Speichengrafiken» sind Balkendiagramme in Kreisform. Damit können Balkendiagrammein Kreisformauf einem beschränkten Platz ungefähr dreimal soviele Einträge gezeigt
werden wie mit einem gewöhnlichen Balkendiagramm. Dank der Gewohn-heit, tagtäglich analoge Uhren abzulesen, kann sich der Leser recht gutorientieren.
In der Erklärungsgrafik werden eine Speichengrafik und ein Balkendia- PlatzsparendTafel 1gramm für die gleichen Ausgangsdaten gezeigt. Es gibt beide Male 140
Einträge. Sie sind in Siebner-Gruppen gebündelt. Die Kreislinie der Spei-chengrafik und die Basislinie des Balkendiagrammes haben die gleicheLänge; die Abstände der einzelnen Speichen auf der Kreislinie sind gleichgross wie die Abstände der einzelnen Balken auf der Basislinie.
Die Grafik zeigt, wie wenig Platz die Speichengrafik im Vergleich zumBalkendiagramm benötigt. Ausserdem erscheinen die Gruppen besser ge-bündelt; es wird schneller erkannt, wie sich die Einträge einer Gruppe zu-einander verhalten. Und man sieht fast sofort, dass es etwa fünf Einträgemit sehr langen Speichen gibt.
Dadurch, dass alle Speichen gegen das Zentrum laufen, kommt es zu Für viele kleinebis mittlereund vereinzeltegrössere Werte
Überlagerungen, wenn es viele Speichen mit voller Länge gibt. Speichen-grafiken eignen sich deshalb besonders für Verteilungen mit vielen kleinenbis mittleren und vereinzelten grösseren Werten.
20 Neue Grafiken I
B.3 Beispiel 1: Überblick über Fallzahlen in 445 Patientenkategorien
Tafel 1: Platzbedarf einer Speichengrafik im Vergleich zum Balkendiagramm
B.3 Beispiel 1: Überblick über Fallzahlen in 445 Patientenk ategorien
Wie kann man die Struktur des Patientenspektrums eines Kranken-Einleitunghauses oder einer geografischen Region grafisch darstellen?2 – MitDRG3-basierten Auswertungen können viele Details erkannt werden. Abermanchmal ist es schwierig, einen Überblick zu erhalten. Neben der gros-sen Anzahl von vielen hundert bis über tausend DRGs machen einem da-bei auch die sehr unterschiedlichen Fallzahlen pro DRG zu schaffen: Esgibt ein paar wenige hochfrequentierte DRGs und viele schwach belegteDRGs.
2 Das folgende Beispiel stammt aus Fischer [Grafiken zur PCS-Beurteilung, 2008]: 61.3 DRG = Diagnosis Related Groups. DRG-Systeme sind Patientenkategorisierungs-
systeme, mit denen das Patientenspektrum stationärer Behandlungen in Akut-Krankenhäusern beschrieben werden können. In ihnen sind mehrere hundert bisüber tausend Patientenkategorien definiert. – Vgl. Fetter et al. [DRGs, 1991]; Fischer[PCS, 1997]. Fischer [DRG-Familie, 2008].
Fischer 2010 (Internetversion) 21
B Speichengrafiken
Für die folgende Musterauswertung waren 20 436 Datensätze aus acht DatenSchweizer Kinderkrankenhäusern oder -abteilungen aus dem Jahr 2005verfügbar. Sie belegten 445 DRGs. Die Fallzahlen bewegten sich zwischen1 und 1272 Fällen pro DRG.
Anstelle eines konventionellen Balkendiagrammes wurde ein Balkendia- Grafikgramm von einer Kreislinie aus gezeichnet. Die Bezeichnungen von DRGsund Hauptkategorien wurden – hierarchisch – aussen an der Kreislinie ein-getragen. – Die Grafik wurde mit dem frei verfügbaren Statistikpaket «R»erstellt.4
Die Grafik zeigt die Häufigkeiten pro Patientenkategorie «APDRG» (All ResultatPatient Diagnosis Related Groups). Die APDRGs sind geordnet nach Tafel 2
Hauptkategorien. Rechts aussen beginnen die Einträge mit den APDRGsder Hauptkategorie 01 (Nerven). Die Fälle in der chirurgischen Subkate-gorie («01.Nerv.C») sind hellblau gefärbt, jene in der medizinischen Sub-kategorie («01.Nerv.M») dunkelblau. Hier findet sich auch gleich eine dersehr stark belegten APDRGs. Ihr Balken reicht zwei Kreise über die Mitte.Dieser DRG sind also mehr als 900 Behandlungsfälle zugeordnet worden.Man muss leider sehr genau hinschauen, um ihre Kurzbezeichnung ab-lesen zu können: Es ist APDRG 762 «Gehirnerschütterung, intrakranialeVerletzung mit Koma < 1 Std. oder ohne Koma, Alter < 18». – Am meistenFälle gab es in APDRG 777 «Ösophagitis, gastrointestinale und verschie-dene Störungen des Verdauungstraktes, Alter < 18, ohne KK», nämlichüber 1200. (Deren Balken beginnt links oben und geht schräg nach rechtsunten.) – Das Bündel der auffallenden, roten Balken, die von unten herkommen, stammt von den vielen Behandlungen bei Neugeborenen. – Ins-gesamt aber gibt es sehr viele APDRGs, die nicht einmal den ersten Kreiserreichen: Sie waren mit weniger als 100 Fällen belegt.
Die längsten Speichen kreuzen sich in der Mitte der Grafik. Damit die Zur DiskussionGrafik lesbar bleibt, darf es nicht zu viele davon geben. Die Skala derGrafik muss entsprechend dimensioniert werden.
Speichengrafiken eignen sich speziell für Daten mit vielen kleinen undmittleren sowie vereinzelten grossen Werten.
Die Beschriftungen der vielen DRGs sind sehr klein geworden. Trotz-dem ist es praktisch, diese nützliche Information in «Augenreichweite» zuhaben. (Nötigenfalls können die Anschriften mit einer Lupe oder mit derZoomfunktion des Dokumentenanzeigeprogramms vergrössert werden.)
Speichengrafiken ermöglichen es, Fallzahlen von etwa 500 DRGs in ei- Konklusionner gut lesbaren und kompakten Weise auf weniger als einer einzigen Sei-te darzustellen.
4 http:// www.r-project.org; Dalgaard [R, 2002].
22 Neue Grafiken I
B.3 Beispiel 1: Überblick über Fallzahlen in 445 Patientenkategorien
Tafel 2: SGP 2005: Anzahl Fälle in allen belegten APDRGs
01.Nerv.C
01.Nerv.M
02.A
uge.C02
.Aug
e.M03.H
NOh.
C
03.H
NO
h.M04
.Atm
u.C
04.A
tmu.
M
05.Herz.C
05.Herz.M06.Verd.C
06.Verd.M
07.LGPa.C07.LGPa.M
08.Skel.C
08.Skel.M
09.Haut.C
09.Haut.M
10.DrS
w.C
10.D
rSw.M
11.N
ier.C
11.N
ier.M
12.M
ann.
C12
.Man
n.M
13.F
rau.
C
13.F
rau.
M14
.Geb
u.C
14.G
ebu.
M 15.Neug.C
15.Neug.M
16.Blut.C16.Blut.M
17.Myel.C
17.Myel.M
19.Psy.M
20.Drog.M
23.DivF.C
23.DivF.M
27.Tag1.C
27.Tag1.M
81.InHi.C
81.InHi.M
82.TrPo.C
82.TrPo.M
91.Pre.C
99.Fehl.C99.Fehl.M NrvC 004 Rmark NrvC 006 KarpTun NrvC 007 andere+ NrvC 008 andere− NrvC 530 Kran* NrvC 531 NKran* NrvC 737 Kran.V, NrvC 738 Kran,+ NrvC 739 Kran,− NrvC 912 Kran.aNS NrvM 009 Rmark NrvM 010 Neo+ NrvM 011 Neo− NrvM 012 Degen NrvM 013 MS NrvM 014 CerVasc
NrvM 017 CerVnnb− NrvM 018 Nerven+ NrvM 019 Nerven− NrvM 020 Infekt NrvM 021 Mening
NrvM 023 NTrKoma
NrvM 034 andere+
NrvM 035 andere−
NrvM 532 TIA&X*
NrvM 533 andere*
NrvM 762 Commotio,
NrvM 763 TrKoma,
NrvM 768 KopfS,+
NrvM 769 KopfS,−
AugC 036 Retina
AugC 037 Orbita
AugC 039 Linse
AugC 041 Anhangs,
AugC 042 andere
AugM 043 Hyphem
AugM 044 Infekt
AugM 045 Neurol
AugM 048 andere,
AugM 535 alle*
HnoC 050 Siaload
HnoC 051 Speichel
HnoC 052 Spalte
HnoC 054 Sinus,
HnoC 055 dive
rse
HnoC 056 R
hinopl
HnoC 058 M
andeln,
HnoC 060 Tons&
Ad,
HnoC 062 Trommel,
HnoC 063 andere
HnoC 168 M
und+
HnoC 169 M
und−
Hno
C 536 n
_majo
r*
Hno
C 932 a
nder
e.&
Hno
M 064 N
eo
Hno
M 0
65 B
alanc
e
Hno
M 0
66 E
pista
x
Hno
M 0
70 O
titis,
Hno
M 0
71 L
aryn
T
Hno
M 0
72 N
ase
Hno
M 0
74 a
nder
e,
Hno
M 1
86 Z
ahnA
nd,
Hno
M 1
87 Z
ahnE
xtr
Hno
M 5
87 a
lle,*
Atm
C 075
Thr
xMaj
Atm
C 076
and
ere+
Atm
C 0
77 a
nder
e−
Atm
C 5
38 T
hrxM
aj*
Atm
C 5
39 a
nder
e*
Atm
C 7
98 T
uber
k
Atm
M 0
78 L
ungE
mb
Atm
M 0
82 N
eo
Atm
M 0
85 P
leur
a+
Atm
M 0
87 L
ungO
ed
Atm
M 0
88 C
OPD
Atm
M 0
92 It
rstit
+
Atm
M 0
93 It
rstit
−
Atm
M 0
94 P
neuT
rx+
Atm
M 0
95 P
neuT
rx−
Atm
M 0
99 S
ympt
om+
Atm
M 1
00 S
ympt
om−
Atm
M 1
01 a
nder
e+
Atm
M 1
02 a
nder
e−
Atm
M 4
75 B
eatm
Atm
M 5
40 In
fekt
*
Atm
M 5
41 a
nder
e*
Atm
M 5
42 A
sthm
a*
Atm
M 6
31 D
yspl
as
Atm
M 7
70 In
fekt
,+
Atm
M 7
71 In
fekt
,−
Atm
M 7
72 P
neu,
+
Atm
M 7
73 P
neu,
−
Atm
M 7
74 A
sthm
a,+
Atm
M 7
75 A
sthm
a,−
Atm
M 8
00 T
uber
k+
Atm
M 8
01 T
uber
k−
Hrz
C 1
05 H
erzK
lp
Hrz
C 1
08 a
nder
e
Hrz
C 1
10 m
ajor
+
Hrz
C 1
11 m
ajor
−
Hrz
C 1
12 P
erkA
MI
Hrz
C 1
16 P
acem
ak
Hrz
C 1
17 P
cmkR
ev
Hrz
C 1
18 P
cmkI
G
Hrz
C 1
19 V
enLi
g
Hrz
C 1
20 a
nder
e
Hrz
C 4
78 a
nder
e+
Hrz
C 4
79 a
nder
e−
Hrz
C 5
45 H
erzK
Maj
*
Hrz
C 5
47 H
zTxA
ndM
aj*
H
rzC
549
HzV
asM
aj*
H
rzC
550
Vas
kAnd
Maj
*
HrzC
809 Kongen
HrzM
123 AM
Ikplx H
rzM 124 andkplx
HrzM
125 andkplx
HrzM
126 Endokar
HrzM
127 HerzIns
HrzM
128 Tphleb
HrzM
129 HerzS
til
HrzM
130 Perpiph+
HrzM
131 Perpiph−
HrzM
134 Hypert
HrzM
137 Kongen,
HrzM
138 Arrhyt+
HrzM
139 Arrhyt−
HrzM
140 AngP
ect
HrzM
141 Kollaps+
HrzM
142 Kollaps−
HrzM
143 ThoraxS
HrzM
144 andere+
HrzM
145 andere−
HrzM
543 andere*
HrzM
544 HerzIns*
VdgC
147 Rektum
−
VdgC
148 Darm
Maj+
VdgC
149 Darm
Maj−
VdgC
150 AdhäsLy+
VdgC
151 AdhäsLy−
VdgC
152 Darm
Min+
VdgC
153 Darm
Min−
VdgC
156 MgÖ
sDuo,
VdgC
157 Anus+
VdgC
158 Anus−
VdgC
163 Hern,
VdgC
164 AppK
plx+
VdgC
165 AppK
plx−
VdgC
166 AppE
inf+
VdgC
167 AppE
inf−
VdgC 170 andere+
VdgC 171 andere−
VdgC 553 andere*
VdgC 585 M
aÖsD
rm*
VdgC 935 M
gÖsD
uo.&,
VdgC 936 M
aÖsD
rm.&*
VdgM 174 H
ämorr+
VdgM 175 H
ämorr−
VdgM 176 UlcsKplx
VdgM 177 UlcusAnd+
VdgM 178 UlcusAnd−
VdgM 179 Darm
VdgM 180 O
bstruk+
VdgM 181 O
bstruk−
VdgM 551 Ö
sGaUlc*
VdgM 552 andere*
VdgM 776 ÖsGaX,+
VdgM 777 ÖsGaX,−
VdgM 778 andere,+
VdgM 779 andere,−
LgpC 191 PaLebSh+
LgpC 192 PaLebSh−
LgpC 194 GallG−
LgpC 198 CEoCDE−
LgpC 493 LapCEoCDE+
LgpC 494 LapCEoCDE−
LgpM 203 Neo
LgpM 204 Pankreas
LgpM 205 Leber+
LgpM 206 Leber−
LgpM 207 GallG+
LgpM 208 GallG−
LgpM 557 alle*
SklC 212 HüftFem,
SklC 213 Amput
SklC 216 Biopsie
SklC 217 DebrHand
SklC 220 Hum&Unt,
SklC 221 Knie+
SklC 222 Knie−
SklC 223 ShltEllMaj+
SklC 224 ShltEllMin−
SklC 225 Fuss
SklC 226 Weicht+
SklC 227 Weicht−
SklC 228 Hand+
SklC 229 Hand−
SklC 230 ExzHüfFem
SklC 231 ExzisAnd
SklC 232 Artrskp
SklC 233 andere+
SklC 234 andere− SklC 558 major*
SklC 559 n_major*
SklC 755 WirbelS+ SklC 756 WirbelS−
SklC 757 RückHals+ SklC 758 RückHals−
SklC 806 WirbKomb+ SklC 807 WirbKomb−
SklC 918 Knie.kl.− SklM 235 Femur SklM 236 Becken SklM 237 Dislok SklM 238 Osteom SklM 239 Neo SklM 240 Bindeg+ SklM 241 Bindeg− SklM 242 SArthri SklM 243 Rücken SklM 245 Knochen− SklM 246 Arthrop
SklM 247 Symptom SklM 248 Tendini
SklM 249 Nachsorg SklM 252 Distal,
SklM 255 Proxim, SklM 256 andere
SklM 560 andere*
SklM 561 Osteom*
HauC 261 BrustAnd
HauC 262 BrustBio
HauC 264 TrnUlkCel−
HauC 265 TrnAnd+
HauC 266 TrnAnd−
HauC 267 Perianal
HauC 268 Plast
HauC 269 andere+
HauC 270 andere−
HauC 564 alle*
HauM 271 HautUlk
HauM 272 Haut+
HauM 273 Haut−
HauM 276 BrustAnd
HauM 279 Cellul,
HauM 282 Trauma,
HauM 283 minor+
HauM 284 minor−
HauM 562 major*
HauM 563 andere*
DswC 288 Adipos
DswC 289 PThyro
DswC 290 Thyroid
DswC 291 Thyrogl
DswC 292 andere+
DswM 295 Diabet<
DswM 298 Nahrung,
DswM 299 Kongen
DswM 300 Endokri+
DswM 301 Endokri−
DswM 566 Endokri*
DswM 740 ZystFib
DswM 753 BehNahr
NirC
303 Neo
NirC
304 NNeo+
NirC
305 NNeo−
NirC
308 minor+
NirC
309 minor−
NirC
311 TrUreth−
NirC
314 Urethra,
NirC
315 andere
NirC
567 alle*
NirC
938 NNeo.&
+
NirC
939 NNeo.&
−
NirC
940 alle.&
*
NirM
316 N
versa
g
NirM
317 D
ialys
e
NirM
318 N
eo+
NirM
319
Neo
−
NirM
320
Infe
kt’+
NirM
322
Infe
kt,
NirM
323
Har
nstn
+
NirM
324
Har
nstn
−
NirM
327
Sym
ptom
,
NirM
333
and
ere,
NirM
568
Nve
rsag
*
NirM
569
and
ere*
Man
C 340
Hod
NNeo,
Man
C 341
Pen
is
Man
C 343
Zirk
umz,
Man
C 5
71 a
lle*
Man
M 3
50 In
fekt
Man
M 3
52 a
nder
e
Man
M 5
70 a
lle*
Fra
C 3
53 H
ystR
ad
Fra
C 3
56 R
ekns
tr
Fra
C 3
57 U
tNeo
Fra
C 3
58 U
tCA+
Fra
C 3
59 U
tCA
−
Fra
C 3
60 V
agZe
Vu
Fra
C 3
61 E
ileiL
ap
Fra
C 5
73 N
Rad
*
Fra
M 3
67 N
eo−
Fra
M 3
68 In
fekt
Fra
M 3
69 M
ens
Geb
C 3
70 K
ais+
Geb
C 3
74 G
eb
Geb
C 3
81 F
ehlG
eb
Geb
M 3
72 G
ebur
tK
Geb
M 3
73 G
ebur
tK
Geb
M 3
78 E
xUtG
rav
Geb
M 3
82 V
orw
ehen
Geb
M 3
83 a
nder
e
Geb
M 3
84 a
nder
e
Neu
C 6
06 N
eu_1
.5<
Neu
C 6
09 N
eu_2
<+
Neu
C 6
16 N
eu_2
.5<−
Neu
C 6
22 N
eu^2
.5<+
Neu
C 6
23 N
eu^2
.5<−
Neu
C 6
24 N
eu^2
.5m
in<
N
euM
602
Neu
_750
.a<
N
euM
604
Neu
_1.a
<
Neu
M 6
05 N
eu_1
.d<
N
euM
607
Neu
_1.5
.a<
N
euM
608
Neu
_1.5
.d<
N
euM
611
Neu
_2<
*
Neu
M 6
12 N
eu_2
<+
N
euM
613
Neu
_2.u
nb<
−
Neu
M 6
14 N
eu_2
.and
<+
N
euM
617
Neu
_2.5
<*
N
euM
618
Neu
_2.5
<+
N
euM
619
Neu
_2.5
.unb
<−
N
euM
620
Neu
_2.5
<−
N
euM
621
Neu
_2.5
.and
<+
N
euM
626
Neu
^2.5
<*
NeuM
627 Neu^2.5<
+
NeuM
628 Neu^2.5.unb<
−
NeuM
629 Neu^2.5<
−
NeuM
630 Neu^2.5.and<
+
NeuM
635 NeuW
gt<
NeuM
637 NeuT
ot5<
NeuM
638 NeuT
ot5<
NeuM
639 NeuT
rf5<
NeuM
640 NeuT
rf5<
BltC
393 Splen,
BltC
394 andere B
ltC 575 alle*
BltM
397 Gerinn
BltM
398 Imm
un+ B
ltM 399 Im
mun−
BltM
574 alle* B
ltM 760 H
ämo8&
9 B
ltM 784 A
nämi,
BltM
785 ErytrA
nd, M
yeC 400 Lym
phMaj
MyeC
401 LymphA
nd+
MyeC
406 MyelM
aj+
MyeC
407 MyelM
aj−
MyeC
408 MyelA
nd
MyeC
579 alle*
MyeM
403 Lymph&
L+
MyeM
404 Lymph&
L−
MyeM
409 RadioTp
MyeM
410 Chem
oTp
MyeM
411 HistN
eo
MyeM
414 andere−
MyeM
576 Leukäm*
MyeM
577 Myelop*
MyeM
578 Lymphom
*
MyeM
780 Leukäm,+
MyeM
781 Leukäm,−
PsyM
425 Anpass
PsyM 426 N
eurDepr
PsyM 427 N
eurAnd
PsyM 428 Person
PsyM 429 O
rg&Ret
PsyM 430 Psychos
PsyM 431 Kindheit
PsyM 432 andere
DrgM
744 Opiate+
DrgM
745 Opiate−
DrgM 747 DrogAnd+
DrgM 748 DrogAnd−
DrgM 750 Alkohol+
DrgM 751 Alkohol−
DivC 461 alle
DivM 462 Rehab
DivM 463 Sym
ptom+
DivM 464 Sym
ptom−
DivM 465 Postcare
DivM 466 Postcare
DivM 467 andere
DivM 633 Kongen+
DivM 634 Kongen−
DivM 636 Postcare<
TagC 921 TodTag1.&
TagM 901 TrfTag1
HivC 703 andere
InfC 415 alle
InfC 581 alle*
HivM 711 HIV*
HivM 712 HIV+
HivM 716 HIV−
InfM 417 Sepsis,
InfM 418 PostInf
InfM 422 VirFieb,
InfM 423 andere
InfM 580 andere*
InfM 584 Sepsis*
BrnC 458 LokTrnH
BrnC 459 LokDebr
BrnC 472 Extens
BrnC 914 LokTrnH.&
PlyC 730 Kran
PlyC 731 RüHüFeExt
PlyC 732 andere
PlyC 792 Kran*
PlyC 793 andere*
TrmC 439 TrnHaut
TrmC 440 Debrid
TrmC 441 Hand
TrmC 442 andere+
TrmC 443 andere−
TrmC 583 NPolytr*
TrmC 791 OffWund
BrnM 460 Lokal
PlyM 733 KoTrxL
PlyM 734 andere
PlyM 794 NTrKK*
TrmM 446 Polytra,
TrmM 448 Allerg,
TrmM 451 Gift,
TrmM 452 Komplik+
TrmM 453 Komplik−
TrmM 454 andere+
TrmM 455 andere−
TrmM 582 NPolytr*
PreC 482 TrachAnd
PreC 483 TrachKopf
PreC 803 KnoTrnAll
PreC 804 KnoTrnAuto
PreC 906 KnoTrnAuto
ErrC 468 ExtP_Dg
ErrC 477 NExtP_Dg ErrM 469 Hdg ErrM 470 NonGrp
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400
1400 1300 1200 1100 1000 900 800 700 600 500 400 300 200 100 0
Anzahl Fälle
n = 20436 Fälle (in 445 APDRGs) Z I M[SGP.082.spokeplot−082M.3g0w]
Datenquelle: SGP Daten 2005
Quelle: Fischer [Grafiken zur PCS-Beurteilung, 2008]: 61.
Fischer 2010 (Internetversion) 23
B Speichengrafiken
B.4 Beispiel 2: Preisunterschiede in 546 Patientenkategor ien
Im folgenden Beispiel5 werden Preisunterschiede für die britischen Pati- EinleitungTafel 3entenkategorien «HRG» (Healthcare Resource Groups)6 gezeigt.
Für elektive und nicht-elektive Fälle werden unterschiedliche HRG-Pauschalen vergütet, die sich bei vielen HRGs deutlich unterscheiden. Dienicht-elektiven HRG-Pauschalen umfassen notfallmässige Hospitalisatio-nen, Geburten, Neugeborene und Verlegungen.
Für jede der über 500 HRGs der Version 3.5 lagen zwei Vergütungsprei- Datense (HRG-Pauschalen) vor.7
Die Unterschiede zwischen elektiven und nicht-elektiven HRG-Pau- Grafikschalen wurden in einer Speichengrafik visualisiert. Die Skala von derKreislinie bis zum Kreismittelpunkt bezieht sich auf die in englischen Pfun-den angegebenen HRG-3.5-Pauschalen. Die HRGs sind der Kreislinie ent-lang eingetragen (ohne Beschriftung). Die mit Grossbuchstaben beschrif-teten Sektoren beziehen sich auf die HRG-Hauptkategorien.
Jeder Strich – ob blau oder rot – zeigt einen Unterschied zwischen Resultatder elektiven und der nicht-elektiven HRG-Pauschalen an. Identische Pau-schalen sind mit grünen Punkten dargestellt. Es ist erstaunlich, dass sichdie Tarife der meisten HRGs unterscheiden und dass die Unterschiedezum Teil recht gross sind. Aber es ist nicht so, dass die HRG-Pauschalenfür elektive Behandlungen immer niedriger sind (blaue Striche). Dort, wosie höher sind als die Pauschalen für nicht-elektive Behandlungen, sindrote Striche eingetragen. (Rot deshalb, weil es nicht der Erwartung ent-spricht, dass elektive Behandlungen teurer sind als Notfallbehandlungen.)
Das Speichendiagramm zeigt sowohl die positiven wie auch die negati- Zur Diskussionven Differenzen gut.
Dadurch, dass die roten, negativen Differenzen mit etwas breiteren Lini-en markiert sind, wird der farbbezogene Gesamteindruck leicht verzerrt.
Von den absoluten Werten lässt sich die grobe Position zwar ablesen.Zum Beispiel zeigt der äussere Beginn der blauen Linien die elektivenHRG-Pauschalen an. Sich aber ein differenziertes Bild von der Verteilungder elektiven oder der nicht-elektiven Pauschalen machen zu wollen, istanhand dieser Grafik schwierig. Dazu wäre es nötig, die beiden Pauscha-len in einzelnen Grafiken abzubilden.
5 Das Beispiel stammt aus Fischer [Notfallvergütung im Krankenhaus, 2009]: 95.6 http:// www.ic.nhs.uk / our-services / standards-and-classifications / casemix; Fi-
scher [Notfallvergütung im Krankenhaus, 2009]: 81 ff.7 DH-UK [PbR 2008/09, 2007].
24 Neue Grafiken I
B.4 Beispiel 2: Preisunterschiede in 546 Patientenkategorien
Tafel 3: HRG 3.5: Unterschiede der HRG-Pauschalen 2008 für elektive und nicht-elektiveBehandlungen
Striche: Differenzen zwischen elektiver Behandlung und nicht−elektiver Behandlung:Blau: elektiv günstiger als nicht−elektiv. Grün: elektiv = nicht−elektiv. Rot: elektiv teurer als nicht−elektiv.
546 HRGsH
RG
−P
ausc
hale
(N
atio
nal A
dmitt
ed P
atie
nt C
are
Man
dato
ry T
ariff
, in
Pou
nds)
037
5075
0011
250
1500
011
250
7500
3750
0
0 3750 7500 11250 15000 11250 7500 3750 0
A
B
C
D
EF
G
H
J
K
L
MN
P
Q
R
S
Z I M[HRG.085.spokeplot.CW:2008−102F]
Datenquelle: www.dh.gov.uk [2008−05]
Quelle: Fischer [Notfallvergütung im Krankenhaus, 2009]: 95.
Fischer 2010 (Internetversion) 25
C Streuungsfächerkarten
Linien-Aussaat (2009)
Gestapelte Streuungsfächerkarten ohne Streuungsfächer, zu Prämien aus ↑ Tafel 9 (S. 41)
mehreren Jahren.
C.1 Motivation
C.1 Motivation
In einem Weltatlas sah ich Strömungsbilder von Winden. Ich war faszi-Strömungsbilderniert von den Bewegungen, die hier sichtbar gemacht wurden. Spannend!,dachte ich und überlegte mir: Was wird damit eigentlich abgebildet? DieWindrichtung in Bezug auf die Himmelsrichtung und die Windgeschwin-digkeit. Was das Ganze interessant und praktisch verwendbar macht, ist,dass die beiden Variablen durch die Angabe der geografischen Positionverortet sind. Das alles zusammen erscheint in einer attraktiven Darstel-lung. Wie wäre es, begann ich zu überlegen, wenn man das Prinzip aufandere Daten anwenden würde?
Für die x- und y-Dimensionen der Zeichenfläche wären nicht nur metri-x- und y-Skalasche, sondern auch ordinale Skalen geeignet wie etwa ordinal geordneteKategorien (z. B. Schweregrade einer Erkrankung) oder nach Klassen un-terteilte Intervallskalen (z. B. Alterstufen).
Wenn ich nun einen Pfeil in jedes der so entstehenden Felder zeichnenDrehbare Pfeile↑ Vgl. Tafel ?? (S. ?? ) würde, hätte ich schon ein abstrahiertes «Strömungsbild». Was aber soll
die Drehrichtung des Pfeiles und was dessen Länge darstellen?Die Länge kann zur Abbildung der Anzahl Messwerte im betreffendenLänge
Feld verwendet werden. Kleinere Pfeile zeigen dann auf kleinere und weni-ger gewichtige Gruppen. Die Grösse wird damit zu einer Relevanzanzeige.
Für die Drehrichtung verbleibt der Messwert selbst. Je nach der WahlDrehrichtungvon x- und y-Skala kann es sein, dass ein Feld mehrere Messungen be-trifft. In solchen Fällen könnte der Mittelwert oder der Median abgebildet↑ Median: S. 99
werden. Aber wenn schon Mittelwert oder Median dargestellt werden,könnte dann nicht auch noch ein Streuungsmass angezeigt werden? Ausdieser Überlegung heraus schnitt ich den Hintergrund so aus, dass damitTafel 4
der Interquartilsbereich sichtbar wurde.In weiteren Versuchen mit diesem Grafiksymbol zeigte sich, dass sichGeburt des
Fächers die Pfeilspitze und der Interquartils-Ausschnitt ungünstig konkurrenzieren,denn sie sind gegenläufig. Ausserdem ist eine Pfeilspitze ein vielleicht un-nötiger Schnörkel;1 man müsste nur die Ausrichtung anders klarstellen
1 Tufte unterscheidet zwischen Druckfarbe, die zur Wiedergabe der Daten unverzicht-bar nötig ist, und solcher, die sonst für die Grafik verwendet wird. Das Verhältnisdieser beiden Mengen sollte möglichst gross sein, d. h. es sollte weggelassen wer-den, worauf ohne Datenverlust verzichtet werden kann. – Tufte [Display, 2001]: 93 ff.
Tafel 4:Erster Versuch zueinem grafischenSymbol für einStrömungsbild
53
Fischer 2010 (Internetversion) 31
C Streuungsfächerkarten
können. Lange suchen musste ich nicht mehr: Die Öffnung des Ausschnit-tes zeigte ja bereits die Richtung. Öffnung des Ausschnittes und Schaftdes Pfeiles aber ergeben – zusammengenommen – eine neue Figur: DerFächer war geboren. Ich färbte ihn schwarz. Damit hatte ich die Buntfarbenfrei für eine andere Variable.
Nun war es nur noch ein kleiner Schritt, die vom Boxplot her bekannten ↑ Boxplot: S. 99
weiteren Informationen hinzuzufügen: Links und rechts vom schwarzenStreuungsfächer positionierte ich zwei weisse Federn. Sie kennzeichnendas 5 %- und das 95 %-Perzentil, umfassen also 90 % der Werte.2
C.2 Beschreibung: Fächer
Die «Streuungsfächerkarte»3 ist eine Grafik, deren Gestaltung von meteo- Tafel 5
rologischen Windströmungskarten inspiriert wurde. Anstelle eines Pfeiles,welcher die Windrichtung anzeigt, wird ein gerichtetes Fächersymbol ver-wendet. Es zeigt Anzahl (Länge der vorderen, weissen Mittellinie), Medi-an (Symbolausrichtung) und Streuung (schwarzer Fächer und weisse Fe-dern) der Messwerte. Es kann anstelle von Boxplots verwendet werden.
Auf einer zweidimensionalen Fläche können die Verteilungskennzahlenfür Untergruppen einer Stichprobe, welche nach zwei Variablen klassiertist, dargestellt und direkt verglichen werden.
Als Skala wird eine Kreislinie benutzt. Die Skala beginnt ganz links, z. B. Skala auf Kreisliniemit Null. Die weiteren Werte werden im Uhrzeigersinn aufgetragen.
Mit dem Fächer-Symbol werden im Einzelnen abgebildet: Abbildung vonAnzahl, Medianund Quartilen
• Ausrichtung des Symbols: Median.
• Breite des Fächers: Quartilsabstand: Erstes bis drittes Quartil (25 %-bis 75 %-Perzentil).
• Äussere weisse Linien («Federn»): 5 %- bis 95 %-Perzentil.
• Länge der vorderen Mittellinie (weisse Linie im schwarzen Fächer):Anzahl Messwerte.
• Dicke der Mittellinie (sichtbar als Griff des Fächers): Proportional zumLogarithmus der Anzahl Messwerte.
• Hintergrundfarbe: Median (= Ausrichtung des Symbols).
• Zahlen am unteren Rand: Median sowie Anzahl Messungen.
2 Je nach Bedarf kann diese Grenze verändert werden. – Im Boxplot nach Tukey wer-den die ‹whiskers› beim ‹3. Quartil + k × IQR› bzw. beim ‹1. Quartil – k ) × IQR›gesetzt (IQR = Interquartilsabstand). Tukey schlug k = 3.0 vor; heute wird oft k =1.5 verwendet. – Tukey [EDA, 1977], zitiert in: Nagel et al. [Grafische Datenanalyse,1996]: 35 ff.
3 Englisch: «fan chart».
32 Neue Grafiken I
C.2 Beschreibung: Fächer
Bei der Interpretation einer Streuungsfächerkarte wird nach Abhängig-↑ Beispiel:Tafel 7 (S. 37) keiten der Ausrichtungen von einer oder von beiden klassierenden Va-
riablen gesucht. Dazu lässt man den Blick am Besten zeilenweise, dannspaltenweise und dann noch diagonal durch das Bild laufen und kontrol-liert, wie sich dabei die Ausrichtungen der Fächer drehen.
• Dreht sich die Ausrichtung kontinuierlich im Uhrzeigersinn, d. h. zugrösseren Messwerten hin, so korreliert die Abhängigkeit der Mess-werte positiv mit der klassierenden Variablen, die in der Bewegungs-richtung des Blickes aufgetragen ist.
• Dreht sich die Ausrichtung kontinuierlich im Gegenuhrzeigersinn, d. h.zu kleineren Messwerten hin, so korreliert die Abhängigkeit der Mess-werte negativ mit der klassierenden Variablen, die in der Bewegungs-richtung des Blickes aufgetragen ist.
Zusätzlich kann beachtet werden:
• Je geschlossener der Fächer ist (d. h.: je kleiner die Streuung ist),desto konzentrierter liegen die Messwerte um den Median der mitdem Fächersymbol abgebildeten Untergruppe.
• Je länger der weisse vordere Teil der Mittellinie ist (d. h.: je grösserdie Anzahl der Messwerte ist), desto verlässlicher sind Median undStreuung der Messwerte in der mit dem Fächersymbol abgebildetenUntergruppe.
Tafel 5: Legende zum Streuungsfächer (360°)
1535.42
0.0
4.0
8.0
12.0
16.0
Median der Werte in diesem Feld
Relative Anzahl Werte in diesem Feld
1. Quartil der Werte in diesem Feld
3. Quartil der Werte in diesem Feld
5 %−Perzentil
95 %−Perzentil
Median der Werte in diesem Feld
Anzahl Werte in diesem Feld
Minimum
Maximum
Fischer 2010 (Internetversion) 33
C Streuungsfächerkarten
C.3 Beispiel 1: Fähigkeitseinschränkungen und Pflege
In der neurologischen Rehabilitation war unter anderem zu prüfen, ob sich Einleitungder Pflegeaufwand aufgrund der Kenntnisse der Fähigkeitseinschränkun-gen schätzen liesse. Falls dies der Fall wäre, könnte man die Messung vonFähigkeitseinschränkungen auch für ein Tarifierungssystem benutzen. Einsolches System wurde im Rahmen des TAR-Projektes entwickelt.4
In der Grafik wird die Abhängigkeit des Pflegeaufwandes von den Fä- GrafikTafel 6higkeitseinschränkungen der Patienten gezeigt. Auf der x-Achse sind die
FIM-Werte zu den kognitiven Fähigkeitseinschränkungen, auf der y-Achsedie FIM-Werte zu den praktisch-motorischen Einschränkungen gruppiert.5
In den Feldern sind nebst dem Streuungsfächer die Anzahl der Patien-tenwochen, der Medianwert des Pflegeaufwandes pro Tag und – rot – dieAnzahl der Wochen mit einem durchschnittlichen Tagesaufwand von mehrals acht Pflegestunden (gemessen mit dem Instrument LEP6) eingetragen.Die Farbe der Felder korrespondiert mit dem Median des Pflegeaufwan-des.
Links unten, ausserhalb des Grafikfeldes, ist als Legende ein kleiner Fä-cher auf grauem Hintergrund aufgezeichnet. Darauf ist die Skala ersicht-lich sowie die Streuung der gesamten Stichprobe.
Als Erstes fällt die Abnahme des Pflegeaufwandes auf den meisten Zei- Resultatelen von rechts nach links auf: Von gut fünf und mehr Stunden zu wenigerals einer Stunde. Das heisst, mit zunehmenden praktisch-motorischen Fä-higkeiten ist weniger Pflege nötig. Das entspricht der Erwartung: Je mehrder Patient selber tun kann, desto weniger muss er gepflegt werden.
Bezüglich der kognitiven Fähigkeiten ist die Sachlage komplexer. Es fal-len die drei violetten Felder mit über sechs Stunden auf. Sie liegen alleam Rand, d. h. diese Patienten sind entweder praktisch-motorisch oderkognitiv völlig unselbständig. In allen diesen Feldern ist die Streuung sehrgross.
Die insgesamt unregelmässige Verteilung weist darauf hin, dass eine Zur DiskussionSchätzung des Pflegeaufwandes mittels linearer Regression vermutlich zugrob ausfällt und eine allenfalls darauf aufbauende Vergütung deshalb alsinadäquat empfunden werden könnte.
4 TAR = Leistungsbedarfsbezogenes Tarifsystem für Rehabilitationskliniken. – Fischeret al. [TAR und Reha-PCS, 2006].
5 FIM = Functional Independence Measure. Mit dem FIM-Instrument werden 13 Itemszur praktisch-motorischen und 5 Items zu kognitiven Fähigkeitseinschränkungen vonPatienten auf einer einheitlichen 7-stufigen Skala beurteilt. Die praktisch-motorischeSkala reicht somit von 13 bis 91, die kognitive von 5 bis 35 FIM-Punkten. – Grangeret al. [FIM, 1995]. UDSmr [FIM™ instrument, 1997].
6 LEP = Leistungserfassung in der Pflege. Mit LEP werden die erbrachten Leistun-gen der Pflegefachpersonen nach einer Tätigkeitsliste mit gut 80 Einträgen täglicherhoben, mit Normzeiten gewichtet und pro Patient aufaddiert. – Vgl. Brügger et al.[LEP-Methode 2.0, 2002]; Fischer [DRG+Pflege, 2002]: 141 ff + 247 ff.
34 Neue Grafiken I
C.3 Beispiel 1: Fähigkeitseinschränkungen und Pflege
Tafel 6:Median undQuartile derLEP-Stunden proTag, nachmotorischem undkognitivem FIM(TAR97)
TAR : n = 1716 Wochen
|−− Praktisch−motorischer FIM−Wert −−>Die schwarzen Fächer zeigen die Werte der Variablen "LEP−Stunden" vom ersten biszum dritten Quartil auf einer Kreisskala von 0 bis 16. Die weissen Federn zeigen diePositionen des 5 %− und des 95 %−Perzentils. Kennzahlen: ø = Durchschnitt, s =
Standardabweichung, r2 = Varianzreduktion, m = Median, a = ø abs. Abw., r1 = Red. d.abs. Abw. v. Median. Symbolfelder: Blaue Zahlen: Anzahl und Median der Messwerte.
Rote Zahl: Anzahl Wochen mit 8 oder mehr LEP−Stunden pro Tag.
LEP
−S
tund
en (
Hel
lgra
u, fa
lls <
7 M
essu
ngen
)
|−−
Kog
nitiv
er F
IM−
Wer
t −−
>
5
10
15
20
25
30
35
13 26 39 52 65 78 91
1508.6
205.8
46.4
85.2
127.8
61.8
385.4
114.9
113.8
103.9
43.1
130.76
245.7
24.7
124.8
82.4
192
701
468.9
264.5
166.2
134.4
103
1180.82
405.4
275.2
444.7
213.5
302.6
1610.66
905.1
804.1
452.8
502.5
822.6
3951
91 3 1 1 6
8 1
3 2
28 3 1
7 2
18 2 1
ø = 3.4 s = 3.1 r2 = 70.4 % m = 2.4 a = 2.4 r1 = 53.7 %
0
4
8
12
16
n = 1716 1997
0
1
2
3
4
5
6
7
10
Z I M[SZH.091.fanchart−1033]
Datenquelle: TAR 1997
Alternative Darstellung zu: Fischer et al. [TAR und Reha-PCS, 2006]: 36.
Fischer 2010 (Internetversion) 35
C Streuungsfächerkarten
C.4 Beispiel 2: Fähigkeitseinschränkungen und Pflege im Zei tverlauf
In der folgenden Grafik mit Daten aus einer anderen Erhebung zur Neuro- GrafikTafel 7Rehabilitation können die Abhängigkeiten des Pflegeaufwandes von den
kognitiven und praktisch-motorischen Fähigkeitseinschränkungen aus vierJahren miteinander vergleichen werden.
Zur Unterteilung in Gruppen wurde die Technik der Fachwerkgrafiken Fachwerkgrafikbenutzt. Damit werden viele Einzelgrafiken («Grafikfelder») matrixförmiganeinander gefügt und gleichzeitig auf einer einzigen Seite dargestellt.7
Im Überschriftsbalken ist links von der Anschrift jedes Grafikfeldes die RelevanzbalkenAnzahl Messwerte eintragen. Der hellblaue Balken, der von rechts herkommt, zeigt den Anteil der in diesem Grafikfeld abgebildeten Messwer-te im Verhältnis zu allen Messwerten. Die Länge des Balkens kann alsIndikator für die Relevanz der Auswertungen im jeweiligen Grafikfeld ver-wendet werden.
Die hellgrauen und die leeren Felder sowie die eher diagonal liegenden Resultatefarbigen Felder auf den Streuungsfächerkarten zeigen, dass es nicht vieleBehandlungen gab, wo die kognitive Beeinträchtigung und die praktisch-motorische Beeinträchtigung extrem gegensätzlich waren.
Auf den Streuungsfächerkarten wechselt die Farbe von rechts nach linksvon gelb zu blau und vereinzelt sogar bis violett. Dies weist auf eine deut-liche Zunahme der LEP-Stunden pro Tag bei zunehmenden praktisch-motorischen Fähigkeitseinschränkungen hin. Dem entsprechend drehtsich die Richtung des Fächers auf den meisten Zeilen kontinuierlich, wenneinzelne «Grafikzeilen» mit dem Auge durchwandert werden. Vereinzeltbewegt sich der Fächer auch mal in die Gegenrichtung.
Von oben nach unten kann man weniger Unterschiede feststellen. DieFächer zeigen in den meisten Spalten in eine jeweils ähnliche Richtung.Wenn sie sich drehen, tun sie das des Öftern nicht kontinuierlich mit demgleichen Drehsinn. Das weist darauf hin, dass der Pflegeaufwand nichtdirekt vom Ausmass der kognitiven Beeinträchtigungen gemessen in FIM-Punkten abhängig ist.
Für den Überblick ist die Grafik gut geeignet. Für eine detailliertere Ana- Zur Diskussionlyse sollte sie mit Zahlen versehen und auf einem grösseren Blatt ausge-druckt werden.
Die schwarzen Kleckse der übermässig breiten Fächer auf farbigemGrund regen an, sich die Daten der betreffenden Patienten näher an-zuschauen. War der Pflegeaufwand hier wirklich so unterschiedlich?Warum? Oder liegt ein Datenfehler vor?
7 Englisch: Trellis displays. – Vgl. Becker et al. [Trellis, 1996]; Becker/Cleveland[Trellis/Man, 1996]; Cleveland [Visualizing, 1993] und http:// cm.bell-labs.com / cm/ ms / departments / sia / project / trellis /. – Für Fachwerkgrafiken gibt es im R-Projekt das Paket ‹lattice›.
36 Neue Grafiken I
C.4 Beispiel 2: Fähigkeitseinschränkungen und Pflege im Zeitverlauf
Tafel 7: Median und Quartile der LEP-Stunden pro Tag, nach motorischem und kognitivem FIM(Test-Daten)
|−− Praktisch−motorischer FIM−Wert −−>Die schwarzen Fächer zeigen die Werte der Variablen "LEP−Stunden" vom ersten bis zum dritten Quartil auf einer
Kreisskala von 0 bis 16. Kennzahlen: ø = Durchschnitt, s = Standardabweichung, m = Median, a = ø abs. Abw.
LEP
−S
tund
en (
Hel
lgra
u, fa
lls <
7 M
essu
ngen
)
|−−
Kog
nitiv
er F
IM−
Wer
t −−
>
5
9
13
17
21
25
29
33
37
13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93
ø = 3.3 s = 2.2 m = 2.6 a = 1.7
04
8
1216
n = 2189 JAHR 1
5
9
13
17
21
25
29
33
37 ø = 3.2 s = 2.1 m = 2.5 a = 1.7n = 2560 JAHR 2
5
9
13
17
21
25
29
33
37 ø = 2.9 s = 2.2 m = 2.2 a = 1.7n = 2031 JAHR 3
5
9
13
17
21
25
29
33
37 ø = 2.9 s = 2.1 m = 2.2 a = 1.6n = 2307 JAHR 4
0
1
2
3
4
5
6
7
10
Z I M[SZH.091.fanchart−1033]
Datenquelle: Test−Daten SZH
Fischer 2010 (Internetversion) 37
C Streuungsfächerkarten
C.5 Beispiel 3: Mathematikprüfungen und sozioökonomische r Status
Das für das folgende Beispiel verwendete Datenset stammt aus dem R- DatenPaket «nlme».8 Es beinhaltet Resultate zu 7185 Mathematikprüfungen.Die StudentInnen sind kategorisiert nach Geschlecht und Zugehörigkeitzu einer ethnischen Minorität.9
In der Grafik wurden die Prüfungsresultate in Abhängigkeit vom sozio- GrafikTafel 8ökonomischen Status der StudentInnen (x-Achse) und vom durchschnittli-
chen sozioökonomischen Status der Schule (y-Achse) abgebildet. In denvier Hauptgrafikfeldern werden StudentInnen nach ihrem Geschlecht undnach der Zugehörigkeit zu einer Minorität unterschieden.
Als Erstes fallen die weit geöffneten Fächer auf, d. h. die grossen Streu- Resultateungen der Prüfungsresultate in praktisch allen Untergruppen. Der Ver-gleich der vier Hauptgrafikfelder zeigt grundsätzlich bessere Prüfungsre-sultate bei StudentInnen, die nicht einer Minorität angehören, sowie leichtbessere Resultate der Männer im Vergleich zu den Frauen.
Innerhalb der Felder ist festzustellen, dass sowohl der sozioökonomi-sche Status der StudentInnen als auch – etwas geringer – der durch-schnittliche sozioökonomische Status der Schule positiv mit den Prüfungs-resultaten korrelieren. – Bei der Detailbetrachtung zeigt sich, dass es auchMänner und Frauen aus Minoritäten gibt, die sehr gute Resultate habenkönnen. (Vgl. innerhalb der rechten Grafikfelder die blau gefärbten Unter-gruppenfelder rechts oben mit bis weit nach unten geöffneten Fächern.)
Es stellt sich die Frage, ob zur Abbildung des durchschnittlichen sozio- Zur Diskussionökonomischen Status der Schule die gleiche Skaleneinteilung verwendetwerden sollte wie für die Abbildung des sozioökonomischen Status derStudentInnen. Da der Status der Schule als Durchschnitt aus den Wer-ten der StudentInnen berechnet wird, streut er weniger: Der Interquartils-bereich liegt zwischen -0.32 und 0.33 beim durchschnittlichen Status derSchulen und zwischen -0.54 und 0.60 beim Status der StudentInnen. Diebeiden Variablen weisen also eine unterschiedliche Verteilung auf. Des-halb können auch die Skaleneinteilungen unterschiedlich gewählt werden.
Je nach Wahl der Skaleneinteilungen verändern sich allerdings dieStreuungsfächer. Die Wahl erfolgte so, dass die Bewegungen der Streu-ungsfächer sichtbar wurden, ohne dass die Anzahl StudentInnen in denUntergruppen zu klein wurde.
Diese Grafik zeigt anschaulich, wie der mittlere Wert z. T. einer gros- Konklusionsen Haupttendenz folgt, obwohl die Werte in den einzelnen Untergruppenstark streuen und man deshalb über eine mögliche Korrelation ins Zwei-feln geraten könnte. (Besonders gut ist dies in den unteren beiden Feldernsichtbar.)
8 http:// www.r-project.org /: «Linear and Nonlinear Mixed Effects» von Pinheiro J et al.9 Im amerikanischen Original: «member of a minority racial group».
38 Neue Grafiken I
C.5 Beispiel 3: Mathematikprüfungen und sozioökonomischer Status
Tafel 8: 7185 Mathematikprüfungen: Resultate nach Geschlecht und Zugehörigkeit zu einerMinorität
n = 7185
|−− Sozioökonomischer Status der StudentInnen −−>
Die schwarzen Fächer zeigen die Werte der Variablen "Mathematik−Resultat"vom ersten bis zum dritten Quartil auf einer Kreisskala von 0 bis 28.
Kennzahlen: ø = Durchschnitt, s = Standardabweichung, m = Median, a = ø abs. Abw.Fa
rbst
ufen
für:
Mat
hem
atik
−R
esul
tat (
Hel
lgra
u, fa
lls <
7 S
tichp
robe
n)
|−−
Dur
chsc
hnitt
l. so
zioö
k. S
tatu
s de
r S
chul
e −
−>
−1.25
−1.00
−0.75
−0.50
−0.25
0.00
0.25
0.50
0.75
1.00
−2.
5
−2.
0
−1.
5
−1.
0
−0.
5
0.0
0.5
1.0
1.5
2.0
ø = 13.1 s = 6.5 m = 13.5 a = 5.4
0
7
14
21
28
n = 2730 Frauen −−
−2.
5
−2.
0
−1.
5
−1.
0
−0.
5
0.0
0.5
1.0
1.5
2.0
ø = 9.1 s = 6.3 m = 8.5 a = 5.2
n = 1065 Frauen aus Minorität
−1.25
−1.00
−0.75
−0.50
−0.25
0.00
0.25
0.50
0.75
1.00ø = 14.8 s = 6.7 m = 15.7 a = 5.6
n = 2481 Männer −−ø = 10.5 s = 6.8 m = 10.2 a = 5.7
n = 909 Männer aus Minorität
0
5
10
15
20
25
Z I M[example.fanchart.mathachieve−1034]
Datenquelle: R−Paket «nlme»
Fischer 2010 (Internetversion) 39
C Streuungsfächerkarten
C.6 Beispiel 4: Krankenkassenprämien
In der Schweiz geben die Krankenversicherer («Krankenkassen») jedes EinleitungJahr im Herbst die Krankenkassenprämien für das Folgejahr bekannt.10
Die Krankenpflegeversicherung ist seit 1996 für alle Bewohner des Lan-des obligatorisch.11 Jeder versichert sich selbst bei einer Krankenkasseseiner Wahl. Die obligatorisch zu versichernden Leistungen beinhalten dieambulante und stationäre medizinische Behandlung im Wohnkanton.
Die Krankenversicherer befinden sich in einer Konkurrenzsituation undsind frei in der Festlegung der Prämien, solange sie eine gesunde wirt-schaftliche Lage ihrer Kasse sicherstellen. Die Prämien für Erwachsenedürfen nicht nach Altersklassen und Geschlecht, wohl aber nach Kantonund innerhalb mancher Kantone nach bis zu drei vom Bund vordefinierten«Prämienregionen» differenziert werden. Es ist erlaubt, für ‹junge Erwach-sene› und für ‹Kinder› Rabatte zu gewähren.
In der Grafik sieht man die Streuung der Prämien für grundversicherte GrafikTafel 9Erwachsene, welche die in den einzelnen Kantonen tätigen Krankenversi-
cherer pro Region anbieten.Die Anordnung der Felder ist «pseudogeografisch», d. h. die Kantone
und deren Prämienregionen sind in ähnlichen Gegenden zu finden wieauf einer Schweizer Karte. Zum Beispiel ist Genf («GE») ganz links un-ten positioniert und die beiden Tessiner Regionen («TI1» und «TI2») sindunten rechts von der Mitte zu finden.
Aus der Streuungsfächerkarte ist zunächst ersichtlich, dass die Prämien Resultatein der französischen Schweiz (eher links im Diagramm), im Tessin und inden städtischen Regionen (Basel Stadt: «BS», Zürich Region 1: «ZH1»,usw.) tendenziell höher sind als in den ländlicheren Kantonen. Die Streu-ungen der Prämien sind erstaunlich gross. Als Ausnahme fällt Genf (ganzlinks unten) auf, wo die mittleren 50 % der Prämienangebote praktischgleich sind. (Der schwarze Fächer ist ganz geschlossen.)
Infolge der pseudogeografischen Anordnung haben die x- und y-Skalen Zur Diskussionhier eher nominalen als ordinalen Charakter. Deshalb macht eine zeilen-oder spaltenweise Betrachtung wenig Sinn. Aus etwas Distanz kann manaber trotzdem die höheren Prämien im Westen des Landes (d. h. eher linksauf der Streuungsfächerkarte) erkennen.
10 Vgl. http:// www.praemien.admin.ch /.11 Art. 3 KVG.
40 Neue Grafiken I
C.6 Beispiel 4: Krankenkassenprämien
Tafel 9: CH: Krankenkassenprämienangebote
Die
sch
war
zen
Fäch
er z
eige
n di
e W
erte
der
Var
iabl
en "
OK
P−
Prä
mie
nang
ebot
e 26
+"
vom
ers
ten
bis
zum
drit
ten
Qua
rtil
auf e
iner
Kre
issk
ala
von
200
bis
500.
Die
wei
ssen
Fed
ern
zeig
en d
ie P
ositi
onen
des
5 %
− u
nd d
es 9
5 %
−P
erze
ntils
.
Farbstufen für: OKP−Prämienangebote 26+
453
416
388
302
270
391
366
298
284
268
342
314
406
359
331
240
255
260
281
282
274
402
370
309
303
298
281
269
279
280
300
242
309
446
357
329
370
325
301
335
314
311
261
GE
VD
1V
D2
VS
1V
S2
TI1
TI2
GR
1G
R2
GR
3
FR
1F
R2
BE
1B
E2
BE
3N
WO
WU
RG
LS
G2
SG
3
NE
JUS
OA
GLU
1LU
2LU
3Z
GS
ZS
G1
AI
CH
BS
BL1
BL2
ZH
1Z
H2
ZH
3S
H1
SH
2T
GA
R
200
280
350
420
500
2010
200
250
300
350
400
450
500
Z I
M[P
RE
.09Z
.fanc
hart
.P−
102F
]D
aten
quel
le:
ww
w.b
ag.a
dmin
.ch
Fischer 2010 (Internetversion) 41
D Differenzdiagramme
Dreiecke im Wind (2005)
Ausschnitt aus Differenzdiagramm mit Fallanteilen zur APDRG-Hauptkate- ↑ Tafel 11 (S. 49)
gorie 08.
D.1 Motivation
D.1 Motivation
Bei der Darstellung verschiedener Zahlenreihen steht man oft vor der Fra-Absolute und/oderrelative Werte? ge, ob man die absoluten Werte, die absoluten Differenzen oder die pro-
zentualen Differenzen anzeigen soll. Wenn es ums Vergleichen geht, sindDifferenzen die Zielgrösse. Zeigt man aber nur die Differenzen, fehlen ei-nem Bezugswerte.
Deshalb stellt man gerne Balken nebeneinander: Dann sieht man dieBalkendiagramme?absoluten Werte, und aus den unterschiedlichen Längen der Balken las-sen sich die Differenzen ablesen. Ausserdem gewinnt man eine Idee vonder prozentualen Differenz, wenn man die Differenz zweier Balken mit derGesamtlänge des einen dieser Balken vergleicht.
Wenn man der Differenz eine grössere Wichtigkeit geben will, könntePositive undnegativeDifferenzen↑ Beispiel mit
Differenzbalken:Tafel 3 (S. 25)
man versucht sein, nur einen einzigen Balken zu verwenden und damitdie Differenz abzubilden. Positive und negative Differenzen könnte manunterschiedlich färben. Bei diesem Vorgehen sieht man nun zwar die Dif-ferenzen gut; man hat aber Mühe, wenn man die absoluten Werte denBalkenenden zuordnen will, da man erst überlegen muss, zu welchem En-de welche Werte nun gehören.
Wenn man anstelle solcher Differenzbalken Dreiecke verwendet, wer-Dreiecke sindausgerichtet den auch die absoluten Werte wieder besser sichtbar: Man kann die Ba-
sen der Dreiecke oder die Spitzen verfolgen.Mit aneinander gereihten Dreiecken benötigt man weniger bedruckte
Fläche als mit nebeneinander gestellten Balken. Dies macht die Grafikendeutlich übersichtlicher.
D.2 Beschreibung: Dreiecke
Da ein Dreieck eine Ausrichtung hat, können damit zwei unterschiedlicheBasis und SpitzeTafel 10 Werte auf einer gemeinsamen Skala angezeigt werden: Ein Wert mit der
Basis der Dreiecks und ein Wert mit der Spitze des Dreiecks.Die Fläche, welche das Dreieck aufspannt, ist proportional zur DifferenzFläche
zwischen den beiden Werten. Je mehr Farbe erscheint, desto grösser istdie Differenz.
Tafel 10:Legende zumSymbol für Diffe-renzdiagramme
0 50(Messeinheiten)
Wert
Vergleichswert
Fischer 2010 (Internetversion) 47
D Differenzdiagramme
Positive und negative Unterschiede können durch unterschiedliche Fär- Farbenbungen angezeigt werden. Dank den Strassenampeln gut verständlich istz. B. die Benutzung der Farben Grün und Rot.
D.3 Beispiel 1: Vergleich von Fallanteilen in Patientenkat egorien
Für die folgende Grafik lautete die Arbeitsfrage: Wie kann man die Beson- Einleitungderheiten des Patientenspektrums eines Krankenhauses im Vergleich zuden Patientenspektren anderer Krankenhäuser des gleichen Typs darstel-len?1
Als Datenbasis wurden vom Krankenhaus, das zu analysieren war, und DatenTafel 11von allen 27 Vergleichskrankenhäusern Falldatensätze mit DRG2-Codes
benötigt. Die DRG-Codes wurden nach Hauptkategorien («01» = Nerven,«02» = Augen, . . .), Subkateogrien («M» = medizinisch, «C» = chirurgisch)und Kostengewichtsklassen («1» bis «4») kategorisiert.
Für die Grafik wurden für jede Kategorie die Differenz zwischen dem GrafikFallanteil des zu untersuchenden Krankenhauses und dem Durchschnittaller Krankenhäuser in der Vergleichsgruppe berechnet. Sie wurde mit ei-nem Dreieck abgebildet. Negative Abweichungen vom Durchschnitt wur-den mit dunkleren, positive mit klaren Farben markiert. Medizinische Be-handlungen wurden grün, chirurgische goldfarben gefärbt.
Die Grafik erlaubt es, auf den ersten Blick negative und positive Abwei- Resultatechungen in medizinischen und chirurgischen Kostengewichtsklassen derverschiedenen DRG-Hauptkategorien zu erkennen.
Besonders auffällig sind die überdurchschnittlichen Fallanteile bei denmedizinischen Behandlungen am Bewegungsapparat («08») sowie beiden chirurgischen Eingriffen am Herz und am Kreislaufsystem («05»). Beiden medizinischen Behandlungen an Nieren und Harnwegen («11») sindnur DRGs in der zweitgünstigsten Kostengewichtsklasse («M2») über-durchschnittlich vertreten; Behandlungen mit DRGs in den übrigen Kos-tengewichtsklassen entsprechen in etwa dem Durchschnitt.
Bereiche ohne Behandlungen sind an Dreiecksspitzen, die an den lin-ken Grafikfeldrand stossen, oder an leeren Zahlenspalten zu erkennen.Dies gilt z. B. für die Augen («02»), für Geburten («14») und Neugeborene(«15»).
1 Das Beispiel stammt aus: Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 45.2 DRG = Diagnosis Related Groups. Mit DRG-Systemen können Patientenspekt-
ren akutstationärer Behandlungen beschrieben werden. – Vgl. Fetter et al. [DRGs,1991]; Fischer [PCS, 1997]. Fischer [DRG-Familie, 2008].
48 Neue Grafiken I
D.3 Beispiel 1: Vergleich von Fallanteilen in Patientenkategorien
Tafel 11: Krankenhaus H217: Fallanteile nach APDRG-Subkategorien undKostengewichtsklassen im Vergleich zu allen Krankenhäusern des Typs «Zentrumsversorgung»
Dreiecke und Zahlen: Fallanteile (in Promillen) von H217.Basis der Dreiecke: Durchschnitt aller 27 Spitäler des Typs
K11 (Zentrumsversorgung).
AP
DR
G−
Kos
teng
ewic
htsk
lass
en
C1C2C3C4M1M2M3M4
178
282916
501 / Nerven 02 / Augen
825
113
510
87
03 / Hals Nase Ohren
C1C2C3C4M1M2M3M4
25
117151511
04 / Atmung
C1C2C3C4M1M2M3M4
810
624403125
05 / Herz Kreislauf
614
91515181413
06 / Verdauung
5121643
07 / Leber Galle Pankreas
C1C2C3C4M1M2M3M4
37276740
723
49
08 / Bewegungsapparat
C1C2C3C4M1M2M3M4
8
329
09 / Haut
611842
10 / Drüsen Stoffwechsel
13168
2479
11 / Nieren Harnwege
C1C2C3C4M1M2M3M4
410
94
21
12 / Mann
C1C2C3C4M1M2M3M4
13 / Frau 14 / Geburten 15 / Neugeborene
C1C2C3C4M1M2M3M4
1
33
16 / Blut
C1C2C3C4M1M2M3M4
11
11
817 / Lymphome Leukämien+
1
319 / Psyche
220 / Alkohol Drogen
C1C2C3C4M1M2M3M4
2
27
23 / Diverse Faktoren
0 20 40 60
C1C2C3C4M1M2M3M4
1
344
81 / Infektionen HIV
0 20 40 60
22
3
782 / Trauma Polytrauma
0 20 40 60
91 / Tracheost. Transplant.
0 20 40 60
C1C2C3C4M1M2M3M4
16
1
99 / Nicht klassifizierbar
Z I M − Test . 31[BFSMS.042.H.diffplot.nF:CWcat−2002−053Q]
Datenquelle: Bundesamt für Statistik: Medizinische Statistik der Krankenhäuser
Quelle: Nach Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 45.
Fischer 2010 (Internetversion) 49
D Differenzdiagramme
D.4 Beispiel 2: Gerstenernten 1931 und 1932
Daten zu Gerstenernten von 1931 und 1932 in Minnesota wurden seit EinleitungTafel 121934 von amerikanischen Statistikern wiederholt ausgewertet. Cleveland
machte in seinem Buch von 1993 auf eine «Datenanomalie» der Da-ten aus ‹Morris› aufmerksam. Anschliessend belegte er seine Vermutung,dass die Daten zu den beiden Jahren von ‹Morris› vertauscht seien u. a.auch anhand von grafischen Auswertungen.3 Interessant ist, dass Cleve-land offenbar der erste war, dem die Unterschiede auffielen und der sienicht einfach als gegeben hinnahm.
Die hier verwendeten Daten bestehen aus Ertragsmengen für die Jahre Daten1931 und 1932 von sechs Anbauorten (von ‹Waseca› bis ‹Rapids›) undzehn Gerstensorten (von ‹Trebi› bis ‹No. 475›).4 Der Datensatz umfasst120 Messungen (= zwei Jahre × sechs Orte × zehn Sorten).
Zur Darstellung wählte ich ein Differenzdiagramm. Anbauorte und Gers-tensorten sind geordnet nach den Erträgen von 1931. Die Erträge von1931 werden mit der Basis der Dreiecke abgebildet, die Erträge von 1932mit der Spitze. Die Länge der Dreiecke entspricht dem Ertragsunterschied.Verminderte Erträge sind rot, erhöhte Erträge grün eingefärbt.
Es fällt auf den ersten Blick auf, dass die Daten aus ‹Morris› im Unter- Resultateschied allen den übrigen Anbauorten durchgehend erhöhte Erträge auf-weisen. Es zeigt sich weiter, dass in ‹Duluth› die kleinsten Ertragseinbus-sen zu verzeichnen waren. Allerdings war hier die Ernte von 1931 bereitsrelativ niedrig, d. h. insbesondere niedriger als in ‹Waseca› und in ‹Crook-ston›, aber ähnlich hoch wie in ‹Rapids›.
Um die 120 Messungen überblicken zu können, sind die bereits von Zur DiskussionCleveland benutzten Fachwerkgrafiken5 äusserst nützlich.
Eine andere Möglichkeit, die beiden Ernten in einem einzigen Grafik- ↑ Tafel 15 (S. 55),2. Spaltefeld darzustellen, ist die Verwendung von graphischen Zeichen wie «o»
und «+». Diese Darstellungsart benutzte Cleveland. Wenn man genau hin-schaut, ist auch in solchen Darstellungen ersichtlich, dass die Zeichen für‹Morris› vertauscht sind. Im Differenzdiagramm jedoch wird die Besonder-heit von ‹Morris› durch die unterschiedliche Einfärbung und Ausrichtungder Dreiecke bei Abnahmen und Zunahmen unmittelbar augenfällig.
3 Vgl. Cleveland [Visualizing, 1993]: 328 ff, insbesondere Tafel 6.20 (S. 330) und 338 f.4 Es wurden die Daten verwendet, die dem R-Paket ‹lattice› beigegeben sind. Der
angegebene Ertrag ist der durchschnittliche Ertrag von jeweils drei zufällig ausge-wählten Anbaufeldern je Anbauort. Gemessen wurde er in Scheffel (US-‹bushels› =35 Liter × ca. 30 kg ≈ 1050 kg) pro Morgen (‹acre› = 40 Aren oder 4047 m2). EineEinheit entspricht also etwa einem Ertrag von ¼ Kilogramm pro Quadratmeter.
5 In Fachwerkgrafiken («trellis displays») werden viele Grafiken gleichzeitig auf ei-ner einzigen Seite dargestellt. – Vgl. Becker et al. [Trellis, 1996]; Becker/Cleveland[Trellis/Man, 1996]; Cleveland [Visualizing, 1993] und http:// cm.bell-labs.com / cm /ms / departments / sia / project / trellis /. – Für Fachwerkgrafiken gibt es im R-Projektdas Paket ‹lattice›.
50 Neue Grafiken I
D.4 Beispiel 2: Gerstenernten 1931 und 1932
Tafel 12:Gerstenernten inMinnesota 1931und 1932 (Diffe-renzdiagramm)
Dreieck: Basis: Ertrag 1931. Spitze: Ertrag 1932.
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
29
33
3225
20
35
30
30
23
34
14
22
1920
15
27
17
21
32
21
−15
−11
−13−5
−4
−8
−13
−9
+9
−14
−50
−33
−39−20
−23
−23
−44
−31
+40
−40
0 20 40 60
RapidsNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
29
27
2930
23
30
26
44
26
29
35
34
4447
44
43
35
47
39
47
+6
+7
+15+17
+22
+13
+9
+3
+13
+18
+22
+25
+52+55
+96
+45
+36
+7
+49
+60
MorrisNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
30
29
3428
33
32
26
34
26
32
26
23
2322
27
31
22
31
22
29
−4
−6
−11−6
−6
−1
−3
−3
−4
−2
−13
−22
−32−20
−17
−2
−13
−10
−15
−7
DuluthNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
43
27
4337
25
33
35
37
40
39
37
27
2626
30
28
27
29
27
38
−6
−0
−17−11
+5
−5
−8
−7
−13
−1
−15
−0
−39−30
+22
−14
−22
−21
−33
−3
UniversityNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
38
40
4649
44
42
40
47
41
50
26
33
3431
32
25
21
42
32
36
−12
−7
−11−18
−12
−16
−20
−5
−9
−14
−31
−17
−25−37
−27
−39
−49
−11
−22
−28
CrookstonNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
55
49
5866
47
49
47
64
50
59
1931
38
33
4245
41
36
38
49
37
58
1932
−17
−15
−16−21
−6
−13
−9
−15
−13
−1
Diff.
−32
−32
−27−32
−12
−26
−19
−23
−26
−1
Diff.%Waseca
Z I M[example.diffplot.barley−1034]
Datenquelle: R−Paket «lattice»
Fischer 2010 (Internetversion) 51
D Differenzdiagramme
D.5 Beschreibung: Punktbalken
Um absolute Werte und deren Differenz darzustellen, können anstelle vonDreiecken auch «Punktbalken» verwendet werden.
Punktbalken6 sind auf einer Achse frei positionierbare Balken, deren Tafel 13
Länge einer Differenz entspricht. Eines der Balkenenden ist mit einemPunkt markiert. Damit werden ein Wert und ein zugehöriger Vergleichs-wert unterscheidbar. Zur Darstellung von negativen und positiven Abwei-chungen kann der Balken unterschiedlich eingefärbt werden.
0 10
WertVergleichswert
Tafel 13:Legende zumSymbol für Punkt-balkendiagramme
D.6 Beispiel 3: Gerstenernten 1931 und 1932
Auch bei der Abbildung der Daten zu den Gerstenernten mit Punktbalken Zur DiskussionTafel 14
↑ Daten: S. 50sieht man die Unterschiede zwischen den Ernten der beiden Jahre gut.
Durch die wegfallende Pfeilform des Dreiecks, wäre die Ausrichtung derDifferenz ein wenig schlechter erkennbar, wenn sie nicht durch die unter-schiedliche Einfärbung deutlich angezeigt würde.
Dafür ist der Endwert mit dem Punkt sehr deutlich markiert. Dies ermög-licht es, diese Werte über die ganze Erhebung besser zu überblicken.
6 Englisch: «dot bar». – Fischer [Grafiken zur PCS-Beurteilung, 2008]: 44.
52 Neue Grafiken I
D.6 Beispiel 3: Gerstenernten 1931 und 1932
Tafel 14:Gerstenernten inMinnesota 1931und 1932 (Punkt-balkendiagramm)
Balkenanfang: Ertrag 1931. Punkt: Ertrag 1932.
0 20 40 60
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
RapidsNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
MorrisNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
DuluthNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
UniversityNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
CrookstonNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
Waseca
Z I M[example.dotbar.barley−1034]
Datenquelle: R−Paket «lattice»
Fischer 2010 (Internetversion) 53
D Differenzdiagramme
D.7 Vergleich von vier Darstellungsweisen
In der folgenden Grafik werden die Gerstenernte-Daten spaltenweise nach Tafel 15
vier unterschiedlichen Darstellungsweisen präsentiert:
1. Balkendiagramm: Durch die Überlagerung der Balken der Ernten ausden beiden Beobachtungsjahren wird gut sichtbar, ob es eine Abnah-me oder eine Zunahme gab.
2. Punktediagramm: Hier kann man den Verlauf der einzelnen Erntenüber alle Sorten und Anbauorte besser verfolgen als in den ande-ren Darstellungsweisen. Dagegen braucht es mehr Beobachtungs-aufwand, um die Unterschiede klar zu erkennen.
3. Differenzdiagramm mit Dreiecken: Die Unterschiede werden hier be-sonders augenfällig. Auch der Verlauf zu immer höheren Ernten inden im oberen Bereich abgebildeten Anbaugebieten ist sichtbar.
4. Differenzdiagramm als Punktbalkendiagramm: Die Unterschiede sindgut sichtbar. Die Ausprägung der Ernte vom 1932 (beim Punkt) überalle Anbaugebiete und Sorten ist wie im Punktediagramm gut erkenn-bar.
54 Neue Grafiken I
D.7 Vergleich von vier Darstellungsweisen
Tafel 15: Gerstenernten in Minnesota 1931 und 1932 (vier Darstellungsweisen)
|−− Ertrag −−>
No. 475Svansota
ManchuriaVelvet
PeatlandGlabronNo. 462No. 457
WisconsinTrebi
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
−50
−33
−39−20
−23
−23
−44
−31
+40
−40
0 10 20 30 40 50 60
−15
−11
−13−5
−4
−8
−13
−9
+9
−14
0 20 40 60
−15
−11
−13−5
−4
−8
−13
−9
+9
−14
0 20 40 60
−15
−11
−13−5
−4
−8
−13
−9
+9
−14
0 20 40 60
RapidsNo. 475
SvansotaManchuria
VelvetPeatlandGlabronNo. 462No. 457
WisconsinTrebi
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
+22
+25
+52+55
+96
+45
+36
+7
+49
+60
0 10 20 30 40 50 60
+6
+7
+15+17
+22
+13
+9
+3
+13
+18
0 20 40 60
+6
+7
+15+17
+22
+13
+9
+3
+13
+18
0 20 40 60
+6
+7
+15+17
+22
+13
+9
+3
+13
+18
0 20 40 60
MorrisNo. 475
SvansotaManchuria
VelvetPeatlandGlabronNo. 462No. 457
WisconsinTrebi
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
−13
−22
−32−20
−17
−2
−13
−10
−15
−7
0 10 20 30 40 50 60
−4
−6
−11−6
−6
−1
−3
−3
−4
−2
0 20 40 60
−4
−6
−11−6
−6
−1
−3
−3
−4
−2
0 20 40 60
−4
−6
−11−6
−6
−1
−3
−3
−4
−2
0 20 40 60
DuluthNo. 475
SvansotaManchuria
VelvetPeatlandGlabronNo. 462No. 457
WisconsinTrebi
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
−15
−0
−39−30
+22
−14
−22
−21
−33
−3
0 10 20 30 40 50 60
−6
−0
−17−11
+5
−5
−8
−7
−13
−1
0 20 40 60
−6
−0
−17−11
+5
−5
−8
−7
−13
−1
0 20 40 60
−6
−0
−17−11
+5
−5
−8
−7
−13
−1
0 20 40 60
UniversityNo. 475
SvansotaManchuria
VelvetPeatlandGlabronNo. 462No. 457
WisconsinTrebi
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
−31
−17
−25−37
−27
−39
−49
−11
−22
−28
0 10 20 30 40 50 60
−12
−7
−11−18
−12
−16
−20
−5
−9
−14
0 20 40 60
−12
−7
−11−18
−12
−16
−20
−5
−9
−14
0 20 40 60
−12
−7
−11−18
−12
−16
−20
−5
−9
−14
0 20 40 60
CrookstonNo. 475
SvansotaManchuria
VelvetPeatlandGlabronNo. 462No. 457
WisconsinTrebi
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
−32
−32
−27−32
−12
−26
−19
−23
−26
−1
Diff.%
0 10 20 30 40 50 60
−17
−15
−16−21
−6
−13
−9
−15
−13
−1
Diff.
0 20 40 60
−17
−15
−16−21
−6
−13
−9
−15
−13
−1
Diff.
0 20 40 60
−17
−15
−16−21
−6
−13
−9
−15
−13
−1
Diff.
0 20 40 60
Waseca
Z I M[example.diffplot.barley−1034]
Datenquelle: R−Paket «lattice»
Fischer 2010 (Internetversion) 55
D Differenzdiagramme
D.8 Beschreibung: Dreieck mit Balken
Zur Anzeige einer weiteren Differenz kann an die Basis des Dreiecks ein Tafel 16
Balken angefügt werden. Er kann in die gleiche oder in die dem Drei-eck entgegengesetzte Richtung blicken. Auch wenn er hinter dem Dreieckliegt, bleibt er sichtbar, denn das Dreieck verjüngt sich bis zur Spitze, derBalken aber behält immer die gleiche Breite. Wenn der Balken allerdingssehr klein im Verhältnis zum Dreieck ist, verschwindet er trotzdem mehroder weniger. Abhilfe geschaffen werden kann, indem die vordere Balken- ↑ Beispiel:
Tafel 17 (S. 57)kante über dem Dreieck gezeichnet wird.
0 50
(Messeinheiten)
Zweiter Wert
Wert
Vergleichswert Tafel 16:Legende zumSymbol fürDoppeldifferenz-diagramme
D.9 Beispiel 4: Gerstenernten 1931 und 1932
Um die Gerstenernten etwas besser beurteilen zu können, wurde auch Tafel 17
noch die durchschnittliche Ernte pro Sorte berechnet und angezeigt.Dazu wurde ein Doppeldifferenzdiagramm verwendet: Das Dreieck zeigt Grafik
wie bereits früher den Unterschied von der Ernte 1931 zur Ernte 1932.Der dahinterliegende, heller gefärbte Balken zeigt den Unterschied von derErnte 1931 zur durchschnittlichen Ernte der betreffenden Sorte in diesemJahr.
Man sieht, dass in ‹Waseca› die Ernte von 1931 bei allen Sorten über- Resultatedurchschnittlich war (lauter hellgrüne Balken). Die Ernte von 1932 wardeutlich niedriger als die Ernte von 1931 (rote Dreiecke), aber immer nochetwas höher als die durchschnittliche Ernte pro Sorte von 1931. (Fast allehellgrünen Balken sind länger als die roten Dreiecke.)
In ‹Duluth› und in ‹Rapids› waren die Ernten bereits 1931 sehr unter-durchschnittlich. (Bis auf einen sind alle Balken hellrot.)
56 Neue Grafiken I
D.9 Beispiel 4: Gerstenernten 1931 und 1932
Tafel 17:Gerstenernten inMinnesota 1931und 1932 (Doppel-differenzdiagramm)
Dreieck: Basis: Ertrag 1931. Spitze: Ertrag 1932. Balken: ø 1931 pro Sorte.
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
29
33
3225
20
35
30
30
23
34
14
22
1920
15
27
17
21
32
21
−15
−11
−13−5
−4
−8
−13
−9
+9
−14
−50
−33
−39−20
−23
−23
−44
−31
+40
−40
37
34
4039
32
37
34
42
34
41
0 20 40 60
RapidsNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
29
27
2930
23
30
26
44
26
29
35
34
4447
44
43
35
47
39
47
+6
+7
+15+17
+22
+13
+9
+3
+13
+18
+22
+25
+52+55
+96
+45
+36
+7
+49
+60
37
34
4039
32
37
34
42
34
41
MorrisNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
30
29
3428
33
32
26
34
26
32
26
23
2322
27
31
22
31
22
29
−4
−6
−11−6
−6
−1
−3
−3
−4
−2
−13
−22
−32−20
−17
−2
−13
−10
−15
−7
37
34
4039
32
37
34
42
34
41
DuluthNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
43
27
4337
25
33
35
37
40
39
37
27
2626
30
28
27
29
27
38
−6
−0
−17−11
+5
−5
−8
−7
−13
−1
−15
−0
−39−30
+22
−14
−22
−21
−33
−3
37
34
4039
32
37
34
42
34
41
UniversityNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
38
40
4649
44
42
40
47
41
50
26
33
3431
32
25
21
42
32
36
−12
−7
−11−18
−12
−16
−20
−5
−9
−14
−31
−17
−25−37
−27
−39
−49
−11
−22
−28
37
34
4039
32
37
34
42
34
41
CrookstonNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
55
49
5866
47
49
47
64
50
59
1931
38
33
4245
41
36
38
49
37
58
1932
−17
−15
−16−21
−6
−13
−9
−15
−13
−1
Diff.
−32
−32
−27−32
−12
−26
−19
−23
−26
−1
Diff.%
37
34
4039
32
37
34
42
34
41
ø1931Waseca
Z I M[example.diffplot.barley−1034]
Datenquelle: R−Paket «lattice»
Fischer 2010 (Internetversion) 57
D Differenzdiagramme
D.10 Beschreibung: Kombination von zwei Dreiecken
Wenn zwei Differenzen zu unterschiedlichen Ausgangswerten angezeigt Zwei Dreieckeauf einer Zeile
Tafel 18werden müssen, können zwei Dreiecke auf der gleichen Zeile miteinanderkombiniert werden.
Wenn es nicht zu viele Überlagerungen gibt, kann dies auch mit mehrals zwei Dreiecken gemacht werden.7 Zur Unterscheidung der beiden Dif-ferenzen kann die Farbintensität verändert werden. Positive und negativeDifferenzen werden mit kontrastierenden Farben versehen.
0 50(Messeinheiten)
Erster WertErster Vergleichswert
Zweiter Wert
Zweiter Vergleichswert
Tafel 18:Legende zumSymbol für Diffe-renzdiagrammemit zwei Dreiecken
D.11 Beispiel 5: Gerstenernten 1931 und 1932
Im vorangegangenen Beispiel wurden die Ernten von 1932 mit jenen von Einleitung1931 und diese mit den durchschnittlichen Ernten von 1931 pro Gersten-sorte verglichen. Noch interessanter als diese Vergleiche ist die Gegen-überstellung der Vergleiche der Ernten von 1931 und 1932 mit den jewei-ligen Durchschnittserträgen pro Sorte.
Zur Darstellung dieser vier Werte wurden zwei Dreiecke verwendet. Die- GrafikTafel 19se zeigen die Differenzen zwischen Ertrag und durchschnittlichem Ertrag
in den beiden Jahren an. Aus der unterschiedlichen Positionierung derbeiden Dreiecke wird zusätzlich die Differenz zwischen den Erträgen von1931 und 1932 ersichtlich.
Es zeigt sich, dass in den vielen Anbauorten die Abweichungen vom Resultatdurchschnittlichen Ertrag zwar unterschiedlich hoch waren, aber meist indie gleiche Richtung gingen. In ‹Waseca› beispielsweise waren die Erträgebei allen Sorten in beiden Jahren überdurchschnittlich, in ‹Rapids› und‹Duluth› hingegen waren die Erträge in beiden Jahren bei fast allen Sortenunterdurchschnittlich. Nicht der Fall war dies in ‹Morris› und ‹Crookston›sowie bei einzelnen Sorten in der ‹University Farm›.
7 Ein Beispiel für drei Kennzahlen, die sich gut mit drei nebeneinander gestellten Drei-ecken abbilden lassen, sind die durchgängig in aufsteigender Reihefolge definier-ten DRG-Kennzahlen ‹untere Grenzverweildauer›, ‹mittlere Verweildauer›, ‹obereGrenzverweildauer›. – Vgl. Fischer [Grafiken zur PCS-Beurteilung, 2008]: 40 + 90 f.
58 Neue Grafiken I
D.11 Beispiel 5: Gerstenernten 1931 und 1932
Tafel 19:Gerstenernten inMinnesota 1931und 1932 (zwei Dif-ferenzdiagramme)
Dreieck im Vordergrund: Spitze: Ertrag 1932, Basis: ø 1932 pro Sorte.Dreieck im Hintergrund: Spitze: Ertrag 1931, Basis: ø 1931 pro Sorte.
No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
14
22
1920
15
27
17
21
32
21
29
29
3132
32
32
27
36
32
38
29
33
3225
20
35
30
30
23
34
37
34
4039
32
37
34
42
34
41
0 20 40 60
RapidsNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
35
34
4447
44
43
35
47
39
47
29
29
3132
32
32
27
36
32
38
29
27
2930
23
30
26
44
26
29
37
34
4039
32
37
34
42
34
41
MorrisNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
26
23
2322
27
31
22
31
22
29
29
29
3132
32
32
27
36
32
38
30
29
3428
33
32
26
34
26
32
37
34
4039
32
37
34
42
34
41
DuluthNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
37
27
2626
30
28
27
29
27
38
29
29
3132
32
32
27
36
32
38
43
27
4337
25
33
35
37
40
39
37
34
4039
32
37
34
42
34
41
UniversityNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
26
33
3431
32
25
21
42
32
36
29
29
3132
32
32
27
36
32
38
38
40
4649
44
42
40
47
41
50
37
34
4039
32
37
34
42
34
41
CrookstonNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi
38
33
4245
41
36
38
49
37
58
1932
29
29
3132
32
32
27
36
32
38
ø1932
55
49
5866
47
49
47
64
50
59
1931
37
34
4039
32
37
34
42
34
41
ø1931Waseca
Z I M[example.diffplot.barley−1034]
Datenquelle: R−Paket «lattice»
Fischer 2010 (Internetversion) 59
D Differenzdiagramme
Wenn die Werte von ‹Morris› – wie von Cleveland vorgeschlagen8 – Korrektur der Wertevon ‹Morris›
Tafel 20durch Umtauschen korrigiert werden, verändern sich nicht nur die Wertevon ‹Morris› selbst, sondern auch die Durchschnittswerte pro Gerstensor-te und damit alle Differenzen.
Es gibt immer noch drei Anbauorte mit gleichartigen Differenzen: ‹Wa-seca› mit lauter positiven, ‹Duluth› und ‹Rapids› mit fast lauter negativenDifferenzen.
Mit den korrigierten Werten ist ‹Morris› ins mittlere Feld mit uneinheitli-cher Ausrichtung gerutscht. Auffällig sind hier nun die Sorten ‹Wisconsin›,‹No. 475› und ‹Velvet›, die von überdurchschnittlichen Erträgen im Jahr1931 auf deutlich unterdurchschnittliche Erträge im Jahr 1932 fielen.
Ins Auge springen auch die unerwarteten überdurchschnittlichen Auffälligkeit von‹Velvet› in ‹Rapids›1932er-Erträge von ‹Peatland› in ‹Duluth› und von ‹Velvet› in ‹Rapids›.
Die Auffälligkeit von ‹Velvet› in ‹Rapids› wurde in der Literatur bereits dis-kutiert;9 von ‹Peatland› in ‹Duluth› berichtet Cleveland aber nichts.
Wenn man es sich genauer überlegt, ist der Fall von ‹Velvet› in ‹Rapids›aus der Sicht dieser Grafik deshalb von Interesse, weil sich beim Vertau-schen der Jahre – d. h. der Spitzen der Dreiecke – zwei gleich ausgerichte-te, rote Dreiecke ergäben, die mit den restlichen Dreiecken harmonischerkorrespondieren würden. Das wäre bei ‹Peatland› in ‹Duluth› nicht so; diebeiden Dreiecke würden sogar noch grösser. Die Auffälligkeit besteht indiesem Fall darin, dass hier die einzige positive (grüne) Differenz im gan-zen Grafikfeld auftritt.
Als Datendetektiv kann man weitere Fälle nach dem Muster von ‹Velvet›in ‹Rapids› suchen: Wo treten Überlagerungen von Dreiecken mit unter-schiedlicher Ausrichtung auf? Auf diese Weise entdeckt man noch ‹No.475› auf der ‹University Farm›.
Die Darstellung von zwei nebeneinander gestellten Dreiecken ermög- Konklusionlicht die Suche nach Beziehungsmustern zwischen den beiden Dreieckenund löst so Fragen aus, die weitere Überlegungen und Entdeckungen mitsich bringen. Damit wird ein wichtiges Ziel der Datenvisualisierung erfüllt.
8 Cleveland [Visualizing, 1993]: 329 ff.9 Vgl. Cleveland [Visualizing, 1993]: 332+340.
60 Neue Grafiken I
D.11 Beispiel 5: Gerstenernten 1931 und 1932
Tafel 20:Gerstenernten inMinnesota 1931und 1932, korrigiert(zwei Differenzdia-gramme)
Dreieck im Vordergrund: Spitze: Ertrag 1932, Basis: ø 1932 pro Sorte.Dreieck im Hintergrund: Spitze: Ertrag 1931, Basis: ø 1931 pro Sorte.
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
14
22
1920
15
27
17
21
32
21
28
28
2929
28
30
25
36
30
35
29
33
3225
20
35
30
30
23
34
38
35
4342
35
39
36
43
37
44
0 20 40 60
RapidsManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
26
23
2322
27
31
22
31
22
29
28
28
2929
28
30
25
36
30
35
30
29
3428
33
32
26
34
26
32
38
35
4342
35
39
36
43
37
44Duluth
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
37
27
2626
30
28
27
29
27
38
28
28
2929
28
30
25
36
30
35
43
27
4337
25
33
35
37
40
39
38
35
4342
35
39
36
43
37
44University
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
29
27
2930
23
30
26
44
26
29
28
28
2929
28
30
25
36
30
35
35
34
4447
44
43
35
47
39
47
38
35
4342
35
39
36
43
37
44Morris_corrected
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
26
33
3431
32
25
21
42
32
36
28
28
2929
28
30
25
36
30
35
38
40
4649
44
42
40
47
41
50
38
35
4342
35
39
36
43
37
44Crookston
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
38
33
4245
41
36
38
49
37
58
1932
28
28
2929
28
30
25
36
30
35
ø1932
55
49
5866
47
49
47
64
50
59
1931
38
35
4342
35
39
36
43
37
44
ø1931Waseca
Z I M[example.diffplot.barley−1034]
Datenquelle: R−Paket «lattice»
Fischer 2010 (Internetversion) 61
D Differenzdiagramme
Durch Umstellen der Grafik von Grafikfeldern pro Anbauort auf Grafik- Umstellung zuAuswertungenpro Gerstensorte
Tafel 21
felder pro Gerstensorte können die Abweichungen von den durchschnittli-chen Erträgen sehr augenfällig dargestellt werden.
Die grosse Bandbreite der Differenzen bei allen Sorten führt zur Vermu-tung, dass die Mehr- und Mindererträge stärker von den Anbauorten alsvon der Sorte abhängig sind. Dazu wurde eine weitere Grafik erstellt.
62 Neue Grafiken I
D.11 Beispiel 5: Gerstenernten 1931 und 1932
Tafel 21:Gerstenernten inMinnesota 1931und 1932, korrigiert(zwei Differenzdia-gramme), nachSorten
Dreieck im Vordergrund: Spitze: Ertrag 1932, Basis: ø 1932 pro Sorte.Dreieck im Hintergrund: Spitze: Ertrag 1931, Basis: ø 1931 pro Sorte.
RapidsDuluthUniversityMorris_correctedCrookstonWaseca
33
23
27
22
27
3328
28
28
28
28
2840
29
34
33
27
4935
35
35
35
35
35
0 20 40 60
ManchuriaRapidsDuluthUniversityMorris_correctedCrookstonWaseca
32
27
23
15
30
4128
28
28
28
28
2844
33
44
20
25
4735
35
35
35
35
35No. 475
RapidsDuluthUniversityMorris_correctedCrookstonWaseca
21
22
26
17
27
3825
25
25
25
25
2540
26
35
30
35
4736
36
36
36
36
36Svansota
RapidsDuluthUniversityMorris_correctedCrookstonWaseca
32
22
26
32
27
3730
30
30
30
30
3041
26
39
23
40
5037
37
37
37
37
37Velvet
RapidsDuluthUniversityMorris_correctedCrookstonWaseca
26
26
29
14
37
3828
28
28
28
28
2838
30
35
29
43
5538
38
38
38
38
38Glabron
RapidsDuluthUniversityMorris_correctedCrookstonWaseca
25
31
30
27
28
3630
30
30
30
30
3042
32
43
35
33
4939
39
39
39
39
39Peatland
RapidsDuluthUniversityMorris_correctedCrookstonWaseca
31
22
30
20
26
4529
29
29
29
29
2949
28
47
25
37
6642
42
42
42
42
42No. 462
RapidsDuluthUniversityMorris_correctedCrookstonWaseca
34
23
29
19
26
4229
29
29
29
29
2946
34
44
32
43
5843
43
43
43
43
43No. 457
RapidsDuluthUniversityMorris_correctedCrookstonWaseca
42
31
44
21
29
4936
36
36
36
36
3647
34
47
30
37
6443
43
43
43
43
43Trebi
RapidsDuluthUniversityMorris_correctedCrookstonWaseca
36
29
29
21
38
58
1932
35
35
35
35
35
35
ø1932
50
32
47
34
39
59
1931
44
44
44
44
44
44
ø1931Wisconsin
Z I M[example.diffplot.barley−1034]
Datenquelle: R−Paket «lattice»
Fischer 2010 (Internetversion) 63
D Differenzdiagramme
In dieser Grafik wurden anstelle der Abweichungen von den Durch- GrafikTafel 22schnitten pro Gerstensorte (und Jahr) die Abweichungen von den Durch-
schnitten pro Anbauort (und Jahr) dargestellt.Man sieht hier – im Unterschied zur vorangangenen Darstellung –, dass Resultate
die Dreiecke im Durchschnitt kürzer und damit die Abweichungen vomdurchschnittlichen Ertrag des Anbauortes und Jahres kleiner sind. Dieszeigt, dass – wie oben bereits vermutet – die Mehr- und Mindererträgestärker von den Anbauorten als von der Sorte abhängig sind.
Diese Sicht kann rechnerisch belegt werden: Die Reduktion der abso- ↑ r1: S. 102
luten Abweichungen vom Median (r1) beträgt bei der Gruppierung nachAnbauorten und Jahren 52 %, bei der Gruppierung nach Gerstensortenund Jahren hingegen nur 4 %.10
Die weiter oben vermerkte Auffälligkeit von ‹Velvet› in ‹Rapids› mit den ↑ S. 60
überlagerten gegenläufigen Dreiecken ist auch hier sichtbar, ebenso derFall von ‹No. 475› auf der ‹University Farm›.
10 Die Varianzreduktion (r2) beträgt bei der Gruppierung nach Anbauorten und Jahren73 %, bei der Gruppierung nach Gerstensorten und Jahren hingegen nur 1 %.
64 Neue Grafiken I
D.11 Beispiel 5: Gerstenernten 1931 und 1932
Tafel 22:Gerstenernten inMinnesota 1931und 1932, korrigiert(zwei Differenzdia-gramme), nachAnbauorten
Dreieck im Vordergrund: Spitze: Ertrag 1932, Basis: ø 1932 pro Anbauort.Dreieck im Hintergrund: Spitze: Ertrag 1931, Basis: ø 1931 pro Anbauort.
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
14
22
1920
15
27
17
21
32
21
21
21
2121
21
21
21
21
21
21
29
33
3225
20
35
30
30
23
34
29
29
2929
29
29
29
29
29
29
0 20 40 60
RapidsManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
26
23
2322
27
31
22
31
22
29
26
26
2626
26
26
26
26
26
26
30
29
3428
33
32
26
34
26
32
30
30
3030
30
30
30
30
30
30Duluth
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
37
27
2626
30
28
27
29
27
38
30
30
3030
30
30
30
30
30
30
43
27
4337
25
33
35
37
40
39
36
36
3636
36
36
36
36
36
36University
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
29
27
2930
23
30
26
44
26
29
29
29
2929
29
29
29
29
29
29
35
34
4447
44
43
35
47
39
47
42
42
4242
42
42
42
42
42
42Morris_corrected
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
26
33
3431
32
25
21
42
32
36
31
31
3131
31
31
31
31
31
31
38
40
4649
44
42
40
47
41
50
44
44
4444
44
44
44
44
44
44Crookston
ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin
38
33
4245
41
36
38
49
37
58
1932
42
42
4242
42
42
42
42
42
42
ø1932
55
49
5866
47
49
47
64
50
59
1931
54
54
5454
54
54
54
54
54
54
ø1931Waseca
Z I M[example.diffplot.barley−1034]
Datenquelle: R−Paket «lattice»
Fischer 2010 (Internetversion) 65
D Differenzdiagramme
Um noch auf eine andere Weise zu sehen, ob die Mehr- und Minder- StrömungsbildTafel 23erträge stärker vom Anbauort oder von der Sorte abhängig sind, wurde
zuguterletzt noch ein Strömungsbild erstellt.Als Erstes fallen die grundsätzlich dunkleren Farben im Grafikfeld für Resultate
1931 auf. Sie zeigen die insgesamt höheren Ernten im Jahr 1931 an. ImWeiteren ist eine Ertragssteigerung von ‹Rapids› bis ‹Waseca› zu beoach-ten (mit Farben, die von gelb/grün zu blau/violett wechseln).
Bei näherem Hinschauen zeigt sich, dass die Schwankungen bei ver-tikalem Vergleich der Ausrichtungen der Pfeile (und der Farben) kleinersind als die Schwankungen in horizontaler Richtung: Während es in deneinzelnen Spalten zwei bis drei Farbausprägungen gibt, sind auf den Zei-len Spannweiten von meist drei bis vier Farbeintragungen zu finden. Diesbestätigt die Vermutung, dass die Mehr- und Mindererträge weniger vonder Sorte als vielmehr vom Anbauort abhängig sind.
66 Neue Grafiken I
D.11 Beispiel 5: Gerstenernten 1931 und 1932
Tafel 23: Gerstenernten in Minnesota 1931 und 1932, korrigiert (Strömungsbilder)
Gerstensorte
Streuungsfächer links: Der schwarze Fächer zeigt die Werte der Variablen "Ertrag"vom ersten bis zum dritten Quartil auf einer Kreisskala von 0 bis 66.
Die weisse Federn zeigen die Positionen des 5 %− und des 95 %−Perzentils.
Farb
stuf
en fü
r: E
rtra
g
Anb
auor
t
Svansota
Manchuria
No. 475
Velvet
Glabron
Peatland
No. 462
No. 457
Wisconsin
Trebi
Rap
ids
Dul
uth
Uni
vers
ity
Mor
ris_c
orre
cted
Cro
okst
on
Was
eca
0
21
43
66
1931
Rap
ids
Dul
uth
Uni
vers
ity
Mor
ris_c
orre
cted
Cro
okst
on
Was
eca
1932
10
15
20
25
30
35
40
45
50
55
60
65
70
Z I M[example.vanechart2.barley−1034]
Datenquelle: R−Paket «lattice»
Fischer 2010 (Internetversion) 67
E Sequenzdiagramme
Rot verloren im Blauwald (2010)
Rotierter Ausschnitt aus einem Sequenzdiagramm zu Rehabilitations- ↑ Vgl. Tafel 27 (S. 77)
behandlungen, mit Vergrösserung der Symbolbreite.
E.1 Motivation
E.1 Motivation
Zur Darstellung der Entwicklung einer Kennzahl im Zeitverlauf bieten sichLiniendiagramme?Liniendiagramme an: Auf der x-Achse wird die Zeit abgetragen und aufder y-Achse der Wert. Liegen Werte zu mehreren Untersuchungseinhei-ten vor, können mehrere Liniendiagramme erstellt und untereinander odernebeneinander angeordnet werden. In beiden Fällen ist ein Vergleich nurbehelfsmässig möglich. Ausserdem brauchen die zweidimensionalen Lini-endiagramme relativ viel Platz.
Es stellte sich mir die Frage, wie ich Verläufe von Kennzahlen zu vielenViele Untersu-chungseinheiten Untersuchungseinheiten so darstellen könnte, dass sie gut vergleichbar
sind und auf möglichst einer Druckseite Platz haben. Es waren z. B. Ver-änderungen von Fähigkeitseinschränkungen vieler Patienten über mehre-re Wochen oder Veränderungen von Kosten und Erträgen zu vielen Pati-entenkategorien über mehrere Jahre hinweg übersichtlich darzustellen.
Wie im vorherigen Kapitel beschrieben, lassen sich mit Dreiecken Diffe-SequenzierteDreiecke renzen darstellen. Da Verläufe über mehrere aufeinanderfolgende Zeitpe-
rioden Sequenzen von Differenzen sind, überlegte ich mir, ob ich solcheVerläufe nicht mit Sequenzen von Dreiecken abbilden könnte? Der Vorteilwäre, dass dies eine eindimensionale Darstellung ermöglichte. Der Nach-teil wurde mir allerdings schnell auch klar: Was passiert, wenn sich dasVorzeichen der Veränderung wechselt? Die aufeinander folgenden Drei-ecke überlagern sich.
Trotz dieses Problems erstellte ich einige Versuchsgrafiken. Ich entdeck-Umgang mitRichtungswechseln te, dass das Problem der Überlagerung gemindert wurde, wenn ich Fül-
lung und Rahmen der Dreiecke in zwei Durchgängen aufzeichnete: Da-mit wurde der Rahmen eines überlagerten Dreiecks über der Füllung desdarüber liegenden Dreiecks sichtbar. Pendelbewegungen konnten damitbesser erkannt werden.
Überlagerungen brachten es zusätzlich mit sich, dass Anfang und En-de der Sequenzen z. T. nicht mehr gut erkenntlich waren. Eine Milderungdieses Problems fand ich, indem ich die Farbintensität vom Beginn einerSequenz bis zu deren Ende zunehmen liess.
Tafel 24:Legende zusequenziertenDreieckenmit fünf Werten 0 50
(Messeinheiten)
Wert 1
Wert 2
Wert 3
Wert 5
Wert 4
Wert 1
Wert 2
Wert 3
Wert 5
Wert 4
Fischer 2010 (Internetversion) 73
E Sequenzdiagramme
0 50(Messeinheiten)
Wert 1
Wert 2
Wert 3
Wert 4
Wert 5
Wert 7
Wert 6
Wert 1
Wert 2
Wert 3
Wert 4
Wert 5
Wert 7
Wert 6 Tafel 25:Legende zusequenziertenDreieckenmit sieben Werten
74 Neue Grafiken I
E.2 Beschreibung: Sequenzierte Dreiecke
E.2 Beschreibung: Sequenzierte Dreiecke
In einem Sequenzdiagramm1 werden aufeinander folgende Veränderun-AneinandergereihteDreiecke
Tafeln 24 bis 26gen von Variablenwerten durch grafische Symbole angezeigt, die auf ei-ner Linie aufgereiht sind. Als Symbole bieten sich Dreiecke an: Die Spitzeeines Dreiecks wird zur Basis des nächsten Dreiecks und damit zum Aus-gangspunkt für die nächste Differenz. Dank dieser kompakten Form wirdes möglich, Positionen und Veränderungen zu mehreren Untersuchungs-einheiten gleichzeitig darzustellen.
Da sich die dargestellten Werte in freiem Wechsel sowohl erhöhen alsFarben undRichtungswechsel auch senken können, wurde einerseits die Veränderungsrichtung mit zwei
deutlich unterschiedlichen Farben gekennzeichnet und andererseits dieFarbintensität von Messpunkt zu Messpunkt verstärkt.
Tafel 26:Legende zusequenziertenDreieckenmit acht Werten 0 50
(Messeinheiten)
Wert 1
Wert 2
Wert 3
Wert 4
Wert 5
Wert 6
Wert 8
Wert 7Wert 1
Wert 2
Wert 3
Wert 4
Wert 5
Wert 6
Wert 8
Wert 7
1 Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 108 f.
Fischer 2010 (Internetversion) 75
E Sequenzdiagramme
E.3 Beispiel 1: Verlauf von Rehabilitationsbehandlungen
In der Grafik wird eine Stichprobe von Rehabilitationspatienten gezeigt, GrafikTafel 27welche zwischen fünf und sieben Wochen in stationärer Behandlung wa-
ren. Die Patienten sind pro Zeile eintragen. Die (anonymisierte) Patienten-identifikation steht zu Beginn der Zeile. Im Grafikfeld kann die Entwick-lung der Fähigkeiten gemäss dem FIM-Instrument2 abgelesen werden:Für jede Hospitalisationswoche wurden die durchschnittlichen FIM-Punkteeingezeichnet und durch Dreiecke miteinander verbunden. Die Länge derDreiecke zeigt somit die Verbesserung oder Verschlechterung in FIMø-Punkten pro Woche. Die FIMø-Punkte jeder Woche wurden zusätzlich alsZahlenwerte in der grauen Spalte rechts eingetragen.
Die Eintragungen der Patienten sind geordnet nach den FIMø-Punkten.Zuoberst sind die selbständigsten Patienten, zuunterst die unselbständigs-ten Patienten.
Auf den ersten Blick fällt auf, dass die meisten Dreiecke blau sind, d. h., Resultatedass die Fähigkeiten gemäss FIM bei den allermeisten Behandlungen ausder Stichprobe im Verlauf der Behandlung zunahmen. Die Zunahmen sindunterschiedlich hoch. Die grössten Veränderungen sind in der Mitte zufinden; offenbar besteht ein besonders grosses Veränderungspotential beiPatienten, bei welchen zu Beginn der Behandlung ein FIMø-Wert von 3bis 4 Punkten gemessen wurde.
Es gibt nur eine Behandlung bei durchwegs abnehmenden FIMø-Werten: die zuunterst eingetragene.
Bei den Behandlungen mit zeitweilig abnehmenden FIMø-Werten fälltauf, dass die Abnahme des Öftern am Schluss der Behandlung auftrat.Dies zeigen die intensiv rot gefärbten Dreiecke am Ende einiger Sequen-zen.
Zeitweilige Stagnationen der eingetragenen Werte sind aus technischen Zur DiskussionGründen nicht erkennbar. Bei Patient «1560» (auf der siebentunterstenZeile) beispielsweise blieb der FIMø-Wert während der ersten drei Be-handlungswochen bei 2.72 stehen. Diese repetierten Werte erscheinenin der Tabelle; in der Grafik sind sie nicht sichtbar.
Es fällt auf, dass die Veränderungen bei mittleren FIMø-Werten grössersind als am Rand der Skala. Dies könnte auch darauf hinweisen, dass dieFIM-Skala nicht linear ist, sondern – wie mit einer Rasch-Analyse belegtwurde3 – für solche Auswertungen linearisiert werden müsste.
2 FIM = Functional Independence Measure. Die FIMø-Punkte wurden berechnet alsFIM-Punktesumme dividiert durch die Anzahl beurteilter FIM-Items. Die Skala derFIMø-Punkte reicht von «1», wenn eine totale Hilfestellung nötig ist, bis «7» beivölliger Selbständigkeit. – Granger et al. [UDSmr-93, 1995]. http:// www.udsmr.org /.
3 Vgl. Granger et al. [FIM-Rasch, 1993].
76 Neue Grafiken I
E.3 Beispiel 1: Verlauf von Rehabilitationsbehandlungen
Tafel 27: Entwicklung der FIMø-Punkte nach Hospitalisationswochen
52 Behandlungsfälle
|−− FIMø−Wert −−>Hellere Pfeile: ältere Veränderungen. Dunklere Pfeile: neuste Veränderungen.
Färbung: bläulich −> Verbesserung; rötlich −> Verschlechterung.
[1716]
[1585]
[1748]
[1591]
[1770]
[1744]
[1584]
[1500]
[1567]
[1569]
[1495]
[1570]
[1794]
[1621]
[1571]
[1724]
[1682]
[1681]
[1647]
[1678]
[1743]
[1694]
[1508]
[1627]
[1669]
[1776]
[1679]
[1671]
[1563]
[1704]
[1796]
[1606]
[1593]
[1793]
[1617]
[1565]
[1777]
[1695]
[1622]
[1818]
[1800]
[1723]
[1784]
[1729]
[1528]
[1817]
[1515]
[1774]
[1841]
[1542]
[1536]
[1600]
1 2 3 4 5 6 7
1.94
2.17
3.94
5.44
4.89
5.17
4.89
4.67
3.72
2.83
2.94
1.94
3.17
2.72
1.44
2.33
3.83
5.89
3.67
5.67
2.39
4.06
3.17
3.44
4.06
3.28
3.50
3.44
4.28
3.17
3.17
4.33
3.56
2.22
4.89
3.22
4.83
2.83
2.33
1.83
2.78
5.28
3.39
4.22
5.00
4.39
2.61
3.61
5.22
5.22
4.89
5.22
2.33
2.48
3.85
5.44
5.19
5.75
5.47
4.41
4.57
2.81
3.17
2.28
3.54
2.72
1.36
2.48
3.88
5.93
4.02
3.60
2.50
5.01
3.94
3.44
4.10
3.77
3.50
4.33
3.99
3.63
3.35
4.78
3.94
1.76
5.13
3.51
5.57
3.74
2.72
2.33
2.79
5.37
3.89
4.65
5.37
4.64
2.93
4.12
5.28
5.41
5.13
5.51
3.12
2.53
4.20
5.61
5.40
6.36
6.11
4.88
4.87
2.96
3.39
3.41
3.58
2.72
1.63
2.61
4.48
6.10
4.49
4.36
3.07
5.33
4.25
3.46
4.19
4.56
3.58
4.69
3.71
3.96
4.00
5.17
4.53
1.61
5.26
3.77
5.60
4.14
2.76
2.45
2.90
5.72
4.38
5.24
5.52
4.90
2.89
5.07
5.22
5.53
5.17
5.63
3.21
2.87
4.15
5.78
5.63
6.39
6.22
4.72
5.27
3.00
3.33
3.81
3.56
2.78
1.91
2.61
5.22
6.26
5.03
5.15
3.93
5.68
4.48
3.58
4.40
4.86
3.76
4.94
3.65
4.02
4.00
5.33
4.89
1.57
5.28
3.83
5.71
4.22
3.00
2.50
2.89
5.94
4.59
5.44
5.64
5.00
3.06
5.44
5.18
5.67
5.67
5.80
3.39
3.19
4.30
5.78
5.85
6.39
6.17
4.72
5.43
3.04
2.06
3.67
3.64
2.83
1.98
2.85
5.56
6.64
5.49
5.47
4.19
5.83
4.76
3.86
4.59
4.94
4.11
5.19
3.78
3.97
4.24
5.33
5.28
1.50
5.50
3.87
5.74
4.18
3.11
2.53
2.80
5.94
4.82
5.72
5.83
5.28
3.14
5.89
5.71
6.00
5.67
5.93
3.50
3.53
4.76
5.69
6.00
6.33
4.94
5.57
3.12
3.76
2.97
2.25
5.69
5.65
5.56
4.33
5.61
5.06
4.68
4.69
5.38
4.53
3.94
5.11
5.89
5.63
5.72
4.35
3.27
2.75
2.71
5.05
5.89
5.50
3.40
6.09
3.56
3.89
4.94
5.96
6.50
6.03
3.89
2.67
5.78
5.88
5.65
4.33
5.17
4.78
5.02
5.83
4.80
5.28
5.89
5.90
5.75
4.39
2.94
2.72
5.48
5.57
3.30
1 2 3 4 5 6 7Hospitalisationswoche
Z I M[SZH.08Z.seqplot:tri−1033]
Datenquelle: Test−Daten SZH
Fischer 2010 (Internetversion) 77
E Sequenzdiagramme
E.4 Beschreibung: Sequenzbänder
Anstelle von Dreiecken können auch Bänder über einer Werteskala aus- Tafel 28
gebreitet werden. Damit die Differenzen von einem Messpunkt zum nächs-ten besser erkannt werden können, wurde jeder Messpunkt mit einemPunkt grafisch markiert und die Differenzen selbst immer intensiver ge-färbt. Zusätzlich wurde das in waagrechter Richtung verlegte Band voneinem Messpunkt zum nächsten um einen bestimmten, kleinen Betragsenkrecht versetzt. Somit erscheinen positive und negative Differenzenwie ineinander gefaltet. Zur besseren Lesbarkeit wurden für positive undnegative Differenzen deutlich unterscheidbare Farben verwendet.
Sequenzbänder benötigen etwas mehr Platz als sequenzierte Dreiecke,zeigen aber Verlaufswechsel besser.
0 50(Messeinheiten)
Wert 1
Wert 2
Wert 3
Wert 4Wert 5
Wert 6
Wert 7
Wert 8 Tafel 28:Legende zu einemSequenzbandmit acht Werten
E.5 Beispiel 2: Verlauf von Rehabilitationsbehandlungen
In der Grafik sind die gleichen Daten aus der Rehabilitation verwendet wor- GrafikTafel 29den wie in der vorangegangenen Grafik mit den sequenzierten Dreiecken.
Der Lesbarkeit wegen werden aber nur zwei Drittel der Behandlungsfällegezeigt.
Es gelten die gleichen Aussagen wie zur vorangegangenen Auswer- Resultatetung. Die Fälle mit zeitweilig abnehmenden FIMø-Werten sind nun aberbesser sichtbar. Zum Beispiel sah man beim Patient «1561» (auf der zweit-untersten Zeile) vorher nicht so deutlich, dass sich der Zustand von derersten zur zweiten Woche verschlechterte. Auch der wechselhafte Verlaufbei Patienten wie «1539» (leicht oberhalb der Mitte) oder «1545» (auf dersiebtuntersten Zeile) kann hier besser abgelesen werden. Die Stagnationder Werte während der ersten drei Wochen der Behandlung von Patient«1560» (viertunterste Zeile) fällt erst hier auf.
Der Entscheid für den Einsatz von sequenzierten Dreiecken oder von KonklusionSequenzbändern ist also abhängig davon, ob man lieber möglichst vieleFälle oder eine etwas detaillierte Sicht auf die Daten zeigen will.
78 Neue Grafiken I
E.5 Beispiel 2: Verlauf von Rehabilitationsbehandlungen
Tafel 29: Sequenzbänder zur Entwicklung der FIMø-Punkte nach Hospitalisationswochen
36 Behandlungsfälle
|−− FIMø−Wert −−>Hellere Bandabschnitte: ältere Veränderungen. Dunklere Bandabschnitte: neuste Veränderungen.
Färbung: bläulich −> Verbesserung; rötlich −> Verschlechterung.
[1716]
[1585]
[1591]
[1584]
[1500]
[1567]
[1569]
[1495]
[1570]
[1621]
[1571]
[1724]
[1682]
[1681]
[1647]
[1678]
[1694]
[1508]
[1627]
[1669]
[1679]
[1671]
[1563]
[1704]
[1606]
[1593]
[1617]
[1565]
[1695]
[1622]
[1723]
[1528]
[1515]
[1542]
[1536]
[1600]
1 2 3 4 5 6 7
1.94
2.17
3.94
5.44
4.89
5.17
4.89
4.67
3.72
2.83
2.94
1.94
3.17
2.72
1.44
2.33
3.83
5.89
3.67
5.67
2.39
4.06
3.17
3.44
4.06
3.28
3.50
3.44
4.28
3.17
3.17
4.33
3.56
2.22
4.89
3.22
2.33
2.48
3.85
5.44
5.19
5.75
5.47
4.41
4.57
2.81
3.17
2.28
3.54
2.72
1.36
2.48
3.88
5.93
4.02
3.60
2.50
5.01
3.94
3.44
4.10
3.77
3.50
4.33
3.99
3.63
3.35
4.78
3.94
1.76
5.13
3.51
3.12
2.53
4.20
5.61
5.40
6.36
6.11
4.88
4.87
2.96
3.39
3.41
3.58
2.72
1.63
2.61
4.48
6.10
4.49
4.36
3.07
5.33
4.25
3.46
4.19
4.56
3.58
4.69
3.71
3.96
4.00
5.17
4.53
1.61
5.26
3.77
3.21
2.87
4.15
5.78
5.63
6.39
6.22
4.72
5.27
3.00
3.33
3.81
3.56
2.78
1.91
2.61
5.22
6.26
5.03
5.15
3.93
5.68
4.48
3.58
4.40
4.86
3.76
4.94
3.65
4.02
4.00
5.33
4.89
1.57
5.28
3.83
3.39
3.19
4.30
5.78
5.85
6.39
6.17
4.72
5.43
3.04
2.06
3.67
3.64
2.83
1.98
2.85
5.56
6.64
5.49
5.47
4.19
5.83
4.76
3.86
4.59
4.94
4.11
5.19
3.78
3.97
4.24
5.33
5.28
1.50
5.50
3.87
3.50
3.53
4.76
5.69
6.00
6.33
4.94
5.57
3.12
3.76
2.97
2.25
5.69
5.65
5.56
4.33
5.61
5.06
4.68
4.69
5.38
4.53
3.94
5.11
5.89
5.63
5.72
3.56
3.89
4.94
5.96
6.50
6.03
3.89
2.67
5.78
5.88
5.65
4.33
5.17
4.78
5.02
5.83
4.80
5.28
5.89
5.90
5.75
1 2 3 4 5 6 7Hospitalisationswoche
Z I M[SZH.08Z.seqplot:para−1033]
Datenquelle: Test−Daten SZH
Fischer 2010 (Internetversion) 79
E Sequenzdiagramme
E.6 Beschreibung: Kammlinien
Man kann die vertikale Versetzung von Sequenzbändern soweit vergös- Tafel 30
sern, bis von einem Messpunkt zum nächsten eine ganze beschreibba-re Zeile liegt. Wenn man die Bandabschnitte zwischen den Messpunktennun durch rechtwinklige Dreiecke ersetzt, entsteht eine «Kammlinie». DieBreite der Dreiecke zeigt die Differenz an. Die Höhe ist konstant und wirdidealerweise so gewählt, dass sie der Höhe einer Schreibzeile entspricht.
Damit ist man im Prinzip wieder beim Liniendiagramm angelangt. Nurgeht die Linie nun nicht von links nach rechts, sondern von unten nachoben. Das hat insbesondere den Vorteil, dass jeder Messpunkt beschriftetwerden kann, ohne dass der Text rotiert werden muss. Im Unterschied zumgewöhnlichen Liniendiagramm sind in Kammliniendiagrammen die Diffe-renzen dank der Dreiecke und deren Färbung besser erkennbar.
0 50
(Messeinheiten)
12
34
5
6
7
8
Wert 1
Wert 2
Wert 3
Wert 4
Wert 5
Wert 6
Wert 7
Wert 8
t
t + 1
t + 2
t + 3
t + 4
t + 5
t + 6
t + 7 Tafel 30:Legende zu einerKammliniemit acht Werten
E.7 Beispiel 3: Verlauf von Rehabilitationsbehandlungen
Die Grafik beruht nochmals auf den gleichen Daten aus der Rehabilitation GrafikTafel 31wie die beiden vorangegangen Grafiken. Der unselbständigste Patient ist
links unten eingetragen. Von unten nach oben und von einer Spalte zurnächsten sind immer selbständigere Patienten zu finden.
Dank der besseren vertikalen Auflösung sind die Behandlungsverläu- Resultatefe hier besonders gut erkennbar. Insbesondere sind in dieser Darstel-lung auch zeitweilig stagnierende Zustände gut sichtbar. (Vgl. z. B. Patient«1560» in der ersten Spalte auf der siebten Zeile.)
Damit alle 52 Behandlungsfälle auf einer Seite Platz hatten, musste eine Zur Diskussionfür dieses Ausgabeformat zu kleine Schrift gewählt werden.
80 Neue Grafiken I
E.7 Beispiel 3: Verlauf von Rehabilitationsbehandlungen
Tafel 31: Kammlinien zur Entwicklung der FIMø-Punkte nach Hospitalisationswochen
52 Behandlungsfälle
|−− FIMø−Wert −−>
Hos
pita
lisat
ions
woc
he
12
34
56
7
2.221.761.611.571.50
1 2 3 4 5 6 7
[171
6]
2.392.503.073.934.194.334.33
1 2 3 4 5 6 7
[162
1]
3.444.334.694.945.19
1 2 3 4 5 6 7
[167
9]
4.895.135.175.675.67
1 2 3 4 5 6 7
[181
8]
12
34
56
71.441.361.631.911.982.252.67
[158
5]3.173.543.583.563.643.76
[157
1]
3.283.774.564.864.945.385.83
[167
1]
5.225.285.225.185.71[1
800]
12
34
56
7
1.832.332.452.502.532.752.94
[174
8]
3.223.513.773.833.87[1
724]
4.674.414.884.724.724.94
[156
3]
4.895.135.265.285.505.725.75
[172
3]
12
34
56
7
2.332.482.612.612.85[1
591]
3.173.633.964.023.973.94
[168
2]
3.563.944.534.895.285.635.90
[170
4]
5.005.375.525.645.83[1
784]
12
34
56
7
2.782.792.902.892.802.712.72
[177
0]
4.283.993.713.653.78[1
681]
3.614.125.075.445.89[1
796]
4.835.575.605.715.74[1
729]
12
34
56
7
2.332.722.763.003.113.27
[174
4]
3.443.443.463.583.864.684.78
[164
7]
3.674.024.495.035.495.655.88
[160
6]
4.895.195.405.635.856.005.96
[152
8]
12
34
56
7
2.722.722.722.782.832.973.89
[158
4]
3.503.503.583.764.114.534.80
[167
8]
3.833.884.485.225.565.695.78
[159
3]
5.225.415.535.676.00[1
817]
12
34
56
7
2.172.482.532.873.193.533.89
[150
0]
2.833.744.144.224.184.354.39
[174
3]
4.394.644.905.005.285.505.57
[179
3]
5.445.445.615.785.785.69
[151
5]
12
34
56
7
2.832.812.963.003.043.12
[156
7]
3.173.354.004.004.245.115.28
[169
4]
5.673.604.365.155.475.565.65
[161
7]
5.285.375.725.945.94[1
774]
12
34
56
7
2.943.173.393.332.06[1
569]
3.943.854.204.154.304.764.94
[150
8]
3.724.574.875.275.435.576.03
[156
5]
5.225.515.635.805.936.09
[184
1]
12
34
56
7
1.942.333.123.213.393.503.56
[149
5]
3.173.944.254.484.765.065.17
[162
7]
4.224.655.245.445.725.89
[177
7]
4.895.476.116.226.176.336.50
[154
2]
12
34
56
7
1.942.283.413.813.67[1
570]
4.064.104.194.404.594.695.02
[166
9]
4.334.785.175.335.335.895.89
[169
5]
5.175.756.366.396.39[1
536]
12
34
56
7
2.612.932.893.063.143.403.30
[179
4]
3.393.894.384.594.825.055.48
[177
6]
4.065.015.335.685.835.61
[162
2]
5.895.936.106.266.64[1
600]
Z I M[SZH.08Z.seqplot:crest1−1033]
Datenquelle: Test−Daten SZH
Fischer 2010 (Internetversion) 81
F Wechseldiagramme
Wec
hsel
flagg
en-G
ehän
ge(2
010)
Rot
iert
erA
uszu
gau
sW
echs
eldi
agra
mm
mit
geor
dnet
enA
ntw
ortp
aare
n.↑
Tafe
l34
(S.9
1)
3333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333
F.1 Motivation
F.1 Motivation
Dreiecke können auch noch andere als wertmässige Differenzen zei-Paare vonJa/Nein-Antworten gen. Dies entdeckte ich, als ich einen Datensatz mit Vorher-/Nachher-
Antworten zu Ja/Nein-Fragen auszuwerten hatte. Aus den Paaren vonAntworten können folgende vier Paare von ersten und zweiten Antwortengebildet werden:
• ja / ja
• nein / ja
• ja / nein
• nein / nein
Die einfachste Auswertung einer Erhebung mit solchen Antworten ist eine2×2-Kreuztabelle?2×2-Kreuztabelle, in welche die (absoluten oder relativen) Häufigkeitenpro Antwortpaar eingetragen sind.
Nun waren im Datensatz aber Antworten zu mehreren Fragen enthal-Kombinationenvon Antwortpaaren ten. Grundsätzlich hätte ich aus den Antworten zu jeder Frage ein eigene
Kreuztabelle erstellen können. Da mich aber auch die Kombinationen derAntworten zu allen Fragen pro befragte Person interessierten, suchte ichnach einer Darstellungsmöglichkeit, in der ich jede Antwort einzeln abbil-den konnte, die aber so kompakt war, dass ich bei Bedarf mehrere hundertBefragungen auf einer einzigen Seite darstellen konnte. Also galt es, eingrafisches Symbol zu finden, mit dem zwei Zustände und zwei Zustands-wechsel abgebildet werden können.
Nach einigem Herumsuchen blieb ich bei der Flagge hängen, die alsDiagonal unterteilteQuadrate Postenmarkierung für Orientierungsläufe benutzt wird: Ein orange-weiss
eingefärbtes, diagonal unterteiltes Quadrat. Ich begann, die beiden Drei-ecke als dynamische Figuren zu sehen: Das untere Dreieck ist eine Figur,die sich von links nach rechts öffnet, währenddem sich das obere Dreieckvon links nach rechts schliesst. Mit dem oberen Dreieck könnte also dieerste, «vorherige», nun nicht mehr gültige Antwort codiert werden, mit demunteren die zweite, «neue» Antwort. Wenn keine Veränderung stattfand,dürfte nach dieser Logik das Quadrat nicht unterteilt werden. Damit diesmöglich wurde, gab ich den Antworten «ja» und «nein» unterschiedlicheFarben, nämlich Rot und Blau. (Zu dieser Farbenwahl stellte ich mir vor:«ja» = Rot = Feuer und Flamme sein; «nein» = Blau = Es lässt einen kalt.)
Tafel 32:Legende zu denWechselflaggen ja / ja nein / ja ja / nein nein / nein
Fischer 2010 (Internetversion) 87
F Wechseldiagramme
F.2 Beschreibung: Wechselflagge
Eine «Wechselflagge» ist ein Quadrat mit einer diagonalen Unterteilung. WechselflaggeTafel 32Damit können zwei Zustände und zwei Zustandwechsel angezeigt werden.
Sie eignen sich z. B. zur Abbildung der Kombination von zwei aufeinanderfolgenden Ja/Nein-Antworten.
Jeder Antwort wird eine Farbe zugeordnet. (Im Beispiel ist es Rot für Farben«ja» und Blau für «nein».) Die erste Antwort wird hell eingetragen. Wenndie zweite Antwort gleich ausgefallen ist wie die erste, wird sie auch helleingetragen, und es ergibt sich ein hell gefärbtes Quadrat. Wenn die zwei-te Antwort anders ist, wird das zweite Dreiecke mit grösserer Farbintensitäteingefärbt.
Die Antwortpaare können von «ja» bis «nein» geordnet werden, indem Reihenfolgeman z. B. die zweite Antwort als gewichtiger definiert. Die Reihenfolge lau-tet dann: «ja / ja», «nein / ja», «ja / nein», «nein / nein».
F.3 Beispiel 1: Antwortpaare zu Ja/Nein-Fragen nach Ländern
111 Personen aus fünf Ländern wurden vor und nach der Teilnahme an Einleitungeinem Kurs zu den gleichen sieben Fragen «(a)» bis «(g)» befragt. DieAntwortmöglichkeiten waren «ja» oder «nein». Daraus ergeben sich viermögliche Paare von erster und zweiter Antwort: «ja / ja», «nein / ja», «ja /nein», «nein / nein».
In der Grafik wurden die Antwortpaare in Form von Wechselflaggen dar- GrafikTafel 33gestellt. Sie wurden für jedes Land pro Frage gemäss der Reihenfolge in
obiger Liste geordnet und nacheinander auf den Zeilen eingetragen.Es fällt zuerst auf, wie sich die Länder nach den Farbanteilen unterschei- Resultate
den. Dies zeigt, dass das Antwortverhalten in den Ländern unterschiedlichwar. Unter den Deutschschweizern und bei den Deutschen gab es ammeisten Personen, die schon immer ja sagten. (Es gibt hier anteilmässigmehr hellrote Quadrätchen, d. h. «ja / ja»-Antworten als in den anderenLändern.)
Besonders viele veränderte Antworten kamen z. B. aus Peru. Meist ver-änderten sich diese von «nein» zu «ja». Aus der Grafik sieht man sofortauch, dass diese Regel für die Fragen «(b)» und «(g)» nicht gilt.
In Österreich gab es – ausser zur Frage «(d)» – fast keine Wechselzwischen erster und zweiter Antwort. Auch in Deutschland gab es verhält-nismässig wenig Wechsel.
88 Neue Grafiken I
F.3 Beispiel 1: Antwortpaare zu Ja/Nein-Fragen nach Ländern
Tafel 33:GeordneteAntwortpaarezu siebenJa/Nein-Fragen,nach Ländern
Anzahl interviewte Personen (n = 111)
Antworten vorher / nachher:
Fra
gen
(g)(f)
(e)(d)(c)(b)(a)
1 2 3 4 5 6 7 8 9 10111213141516171819202122232425262728
Österreich(g)(f)
(e)(d)(c)(b)(a)
Schweiz (deutsch)(g)(f)
(e)(d)(c)(b)(a)
Schweiz (französisch)(g)(f)
(e)(d)(c)(b)(a)
Deutschland(g)(f)
(e)(d)(c)(b)(a)
Frankreich(g)(f)
(e)(d)(c)(b)(a)
Peru
ja / ja nein / ja ja / nein nein / nein Z I M[BDZA.09Z.bquad−1033]
Fischer 2010 (Internetversion) 89
F Wechseldiagramme
F.4 Beispiel 2: Antwortpaare zu Ja/Nein-Fragen nach Themen
In der nächsten Grafik sind die Antworten der 111 Personen aus dem vor- GrafikTafel 34angegangenen Beispiel 1 nicht nach Ländern, sondern nach den Fragen
gebündelt.Auch hier fallen zuerst die unterschiedlichen Farbanteile auf: Bei Frage Resultate
«(b)» überwiegen z. B. die hellblauen «nein / nein»-Felder deutlich. Beiden Fragen «(e)» und «(f)» fallen die wenigen blau gefärbten «ja / nein»-und «nein / nein»-Felder auf.
Viele Veränderungen ins Positive (rote Dreiecken: von «nein» zu «ja»)ausserhalb Perus gab es bei der Frage «(d)». Sie kamen vor allem ausder französischen Schweiz und aus Österreich. In Deutschland und in derdeutschen Schweiz gab es zu dieser Frage hauptsächlich Antworten ohneWechsel. Am meisten Veränderungen ins Negative (blaue Dreiecke: von«ja» zu «nein») sind bei den Antworten zur Frage «(g)» festzustellen.
Wenn man die Antworten zeilenweise durchschaut, sieht man auch indieser Grafik, dass das Antwortverhalten in den Ländern unterschiedlichwar. Besonders viele Antwortwechsel kamen oftmals aus Peru. DieserSachverhalt als Ganzes war allerdings in der vorangegegangenen Gra-fik, die nach Ländern gruppiert war, noch deutlicher zu sehen. Hier nunkann man fragebezogene Details sehen wie z. B., dass zur Frage «(d)»praktisch gleich viele Antwortwechsel wie aus Peru auch aus der französi-schen Schweiz kamen (bei insgesamt etwas weniger Antworten).
90 Neue Grafiken I
F.4 Beispiel 2: Antwortpaare zu Ja/Nein-Fragen nach Themen
Tafel 34: Geordnete Antwortpaare zu sieben Ja/Nein-Fragen, nach Themen
Anzahl interviewte Personen (n = 111)
Antworten vorher / nachher:
ÖsterreichSchweiz (dt.)Schweiz (frz.)Deutschland
FrankreichPeru
−20 −10 0 10 20
(g)Österreich
Schweiz (dt.)Schweiz (frz.)Deutschland
FrankreichPeru
(f)Österreich
Schweiz (dt.)Schweiz (frz.)Deutschland
FrankreichPeru
(e)Österreich
Schweiz (dt.)Schweiz (frz.)Deutschland
FrankreichPeru
(d)Österreich
Schweiz (dt.)Schweiz (frz.)Deutschland
FrankreichPeru
(c)Österreich
Schweiz (dt.)Schweiz (frz.)Deutschland
FrankreichPeru
(b)Österreich
Schweiz (dt.)Schweiz (frz.)Deutschland
FrankreichPeru
(a)
ja / ja nein / ja ja / nein nein / neinZ I M
[BDZA.09Z.bquad−1033]
Fischer 2010 (Internetversion) 91
F Wechseldiagramme
F.5 Beispiel 3: Antwortkombinationen zu Ja/Nein-Fragen pr o Person
In der nächsten Grafik sind alle Antworten pro Person (gruppiert nach Län- GrafikTafel 35dern) abgebildet. In den Spalten sieht man, wie die einzelnen Personen
geantwortet haben. (In den Zeilen sieht man, wie einzelne Fragen beant-wortet wurden.) Die Personen wurden sortiert nach der Anzahl bejahenderAntworten.1 Links wurden jene Personen eingetragen, welche sowohl beider ersten wie auch bei der zweiten Antwort (meist) mit «ja» geantwortethaben. Ganz rechts sind die Antworten jener Personen zu sehen, die viele«nein»-Antworten abgaben.
Auch in dieser Grafik fällt als Erstes auf, dass sich Antworten aus den Resultateverschiedenen Ländern nach der Häufigkeit von Wechseln in der Antwortunterscheiden: Am meisten Dreiecke hat es bei den Antworten aus Peru.Die meisten Wechselflaggen sind rot gefärbt, d. h. sie gingen nach «ja».
Wenn man die Antworten spaltenweise durchschaut, sieht man u. a.sehr gut, welche Personen beim zweiten Interview lauter Nein-Antwortengaben: Ganz rechts in den Grafikfeldern sind einzelne Spalten zu finden,die nur hellblaue Rechtecke und blaue Dreiecke enthalten. In Peru, in derdeutschen und in der französischen Schweiz gab es je eine solche Person.Umgekehrt sind in keinem der Länder ausser in Peru Personen zu finden,welche anfänglich einige Nein-Antworten gaben und im zweiten Interviewdann alle Fragen mit Ja beantworteten. Bei den PeruanerInnen führt dieSuche zu zwei solchen Spalten ohne hellblaue Felder und ohne Felder mitblauem Dreieck. (Sie befinden sich links an zweiter und an vierter Stelle.)
1 Zum Problem von derartigen Sortierungen vgl. z. B. Bertin [Grafik, 1982]: 32 ff undHahsler et al. [Seriation, 2008].
92 Neue Grafiken I
F.5 Beispiel 3: Antwortkombinationen zu Ja/Nein-Fragen pro Person
Tafel 35:Antwortpaare proPerson zu siebenJa/Nein-Fragen,nach Ländernund Personen
Index der interviewten Personen (n = 111)
Antworten vorher / nachher:
Fra
gen
(g)(f)
(e)(d)(c)(b)(a)
1 2 3 4 5 6 7 8 9 10111213141516171819202122232425262728
Österreich(g)(f)
(e)(d)(c)(b)(a)
Schweiz (deutsch)(g)(f)
(e)(d)(c)(b)(a)
Schweiz (französisch)(g)(f)
(e)(d)(c)(b)(a)
Deutschland(g)(f)
(e)(d)(c)(b)(a)
Frankreich(g)(f)
(e)(d)(c)(b)(a)
Peru
ja / ja nein / ja ja / nein nein / nein Z I M[BDZA.09Z.bquad−1033]
Fischer 2010 (Internetversion) 93
F Wechseldiagramme
Im Anhang folgen einige Anmerkungen zu statistischen Fachausdrücken,welche im Rahmen der Präsentation der Streuungsfächerkarten verwen- ↑ S. 31
det wurden. Sie sind für Leser gedacht, denen diese Dinge noch nichtbesonders geläufig sind.
94 Neue Grafiken I
G Anhang
Speichenspirale 1 (2009)
Speichendifferenzdiagramm mit generierten Daten.↑ Vgl. Tafel 3 (S. 25)
G.1 Statistische Anmerkungen
G.1 Statistische Anmerkungen
G.1.1 Median und Quartile in Boxplot und Streuungsfächerkarte
Zur Beschreibung der Lage von Messwerten, die nicht normalverteiltMediansind, kann der Median (m) verwendet werden. Er gibt denjenigen Mess-wert an, der «in der Mitte» der Stichprobe liegt: Alle Messwerte werdensortiert; der Wert in der Mitte wird als Median bezeichnet.1 Vom Median-wert aus gesehen sind 50 % der Messwerte kleiner (oder gleich gross) und50 % der Messwerte grösser (oder gleich gross).
Bei perfekt normalverteilten Daten ist der Median gleich gross wie dasarithmetische Mittel. Es gibt jedoch Verteilungen, die selten normalver-teilt sind. Dazu gehören z. B. Verweildauern von Krankenhauspatienten:Es gibt meist einige wenige Behandlungsfälle mit langen und sehr lan-gen Verweildauern und demgegenüber viele mit kürzeren Verweildauern.Bei einer solchen Verteilung liegt der Median unterhalb des arithmetischenMittels, und man spricht von einer «rechtsschiefen» Verteilung.
Der Median wird – im Unterschied zum arithmetischen Mittel – von Aus-reisserwerten nicht beeinflusst. Somit ist er ein robuster Mittelwert.
Wenn man die beiden Hälften der Stichprobe unter und über dem Me-Quartiledian nochmals halbiert, erhält man die Quartile. Quartile unterteilen eineStichprobe bei 25 % (erstes Quartil), 50 % (zweites Quartil = Median) und75 % (drittes Quartil). Zwischen dem ersten und dem dritten Quartil liegenalso auch gerade 50 % der Messwerte. Dieser Bereich wird «Quartilsab-stand» genannt.2
Grafisch dargestellt werden Median und Quartile meist in Form von so-Visualisierung mitBoxplots genannten «Boxplots». Sie bestehen aus zwei aneinander gefügten Käst-
chen, welche erstes Quartil, Median und zweites Quartil anzeigen. An je-des der beiden Kästchen ist eine Linie angefügt, welche in der hier ver-wendeten Form das 5 %- und 95 %-Perzentil anzeigen und somit 90 % derMesswerte umfassen: ___ _____ .3
Aus Boxplots wird auf einen Blick ersichtlich, ob eine schiefe Verteilungvorliegt: In einem solchen Fall sind die beiden Kästchen nicht gleich gross.
In Streuungsfächern wird der Median mit der mittleren weissen Linie,Visualisierung mitStreuungsfächern↑ S. 32
die Werte vom ersten bis zum dritten Quartil mit dem schwarzen Fächer,5 %- und 95 %-Perzentil mit den weissen Federn abgebildet.
1 Bei einer geraden Anzahl von Messwerten wird der Median als Durchschnitt derbeiden in der Mitte liegenden Werte berechnet.
2 Englisch: IQR = Interquartile Range.3 Im Boxplot nach Tukey werden die ‹whiskers› beim ‹3. Quartil + k × IQR› bzw. beim
‹1. Quartil – k ) × IQR› gesetzt (IQR = Interquartilsabstand). Tukey schlug k = 3.0vor; heute wird oft k = 1.5 verwendet. – Tukey [EDA, 1977], zitiert in: Nagel et al.[Grafische Datenanalyse, 1996]: 35 ff.
Fischer 2010 (Internetversion) 99
G Anhang
G.1.2 Varianzreduktion (r2)
Die Varianzreduktion (r2) ist ein Mass dafür, inwieweit es durch eine Varianzreduktion(r2)Gruppenbildung gelungen ist, die Streuung von (normalverteilten) Daten
zu erklären.Zur Berechnung der Varianzreduktion werden zunächst die Unterschie-
de der Messwerte xi zum Mittelwert der Gesamtstichprobe von n Mess-werten berechnet, quadriert und dann summiert. (Im grafischen Beispiel Tafel 36
beträgt der Mittelwert der Gesamtstichprobe 3.9. Die quadrierten Abwei-chungen sind in der Zahlenspalte links eingetragen. Die Summe der quad-rierten Abweichungen gegenüber dem Mittelwert der Gesamtstichprobebeträgt 19.40.) Dieser Wert für die gesamte Streuung wird verglichen mitder Summe der Werte der Streuungen in Bezug auf die Gruppenmittel-werte. Dazu werden die Unterschiede der Messwerte xi zu den Gruppen-mittelwerten berechnet und ebenfalls quadriert und summiert. (Im Beispielergibt dies 5.60 + 8.40 = 14.00 .)
Im nächsten Schritt berechnet man nun den ‹Unterschied der Gesamt-streuung und der Summe der Streuungen in Bezug auf die Gruppenmit-telwerte›. (Im Beispiel ist dies 19.40 – 14.00 = 5.40.) Diese Differenz setztman anschliessend ins Verhältnis zur Gesamtstreuung. (Im Beispiel ergibtdies 5.40 / 19.40 = 27.8 %.) Damit erhält man die Varianzreduktion: eineZahl, welche angibt, um wieviele Prozent die Streuung in Bezug auf dieGruppenmittelwerte kleiner ist als die Streuung in Bezug auf den Mittel-wert der Gesamtstreuung.
Die – gekürzte – Formel dazu lautet:
Varianzreduktion = 1−∑n
i=1(xi −Gruppenmittelwert)2
∑ni=1(xi −Mittelwert der Gesamtstichprobe)2
100 Neue Grafiken I
G.1 Statistische Anmerkungen
Tafel 36: Beispiel zur Berechnung der Varianzreduktion
1 2 3 4 5 6 7 8 9
3.9
Alle
−2.3−1.5
−0.7+0.9
−1.2−0.3
+0.5+0.9
+1.1+2.6
5.292.250.490.81
1.440.090.250.811.216.76
19.40
1 2 3 4 5 6 7 8 9
3.0 4.5
Gruppe A Gruppe B
−1.4−0.6
+0.2+1.8
−1.8−0.9
−0.1+0.3
+0.5+2.0
1.960.360.043.24
3.240.810.010.090.254.00
5.60 8.40
Varianzreduktion = 1 − ( 5.60 + 8.40 ) / 19.40 = 27.8 %
Quelle: Nach Fischer [Grafiken zur PCS-Beurteilung, 2008]: 33
Fischer 2010 (Internetversion) 101
G Anhang
G.1.3 Reduktion der absoluten Abweichungen vom Median (r1)
Alternativ zur Varianzreduktion und als robustere Kennzahl die «Reduk- Reduktion derabsolutenAbweichungen vomMedian (r1)
tion der absoluten Abweichungen vom Median» (r1) , um zu beurteilen, in-wieweit es durch eine Gruppenbildung gelungen ist, die Streuung von Da-ten zu erklären. Im Unterschied zur Varianzreduktion wird sie viel wenigerstark von Extremwerten beeinflusst, denn die Abweichungen zu den Grup-penmittelwerten werden nicht quadriert, sondern nur als absolute Werteaufsummiert.
Im grafischen Beispiel wurden die durchschnittlichen absoluten Abwei- Tafel 37
chungen vom Median in den Zahlenspalten links und rechts aussen unterden Summen der absoluten Abweichungen eingetragen. Sie betragen inden beiden Gruppen 1.00 und 0.93. Wenn keine Gruppierung vorgenom-men wird, liegt dieser Wert bei 1.20; er ist also grösser als beide Gruppen-werte.
Red. d. abs. Abw. v. Med.= 1−∑n
i=1 | xi −Gruppenmedian |
∑ni=1 | xi −Median der Gesamtstichprobe |
Um diese Formel besser zu verstehen, kann man auch zuerst die Dif-ferenz zwischen der ‹Summe der Abweichungen vom Gruppenmedian›und der ‹Summe der Abweichungen vom Gesamtmedian› berechnen. An-schliessend wird das Resultat dieser Berechnung durch die ‹Summe derAbweichungen vom Gesamtmedian› dividiert. Damit hat man berechnet,wie gross die Reduktion der summierten Abweichungen von den mittle-ren Werten bei Gruppenbildung im Verhältnis zu den Abweichungen vommittleren Wert ohne Gruppenbildung ist.
(Es kann noch angemerkt werden, dass grundsätzlich gilt: Die Sum-me der absoluten Abweichungen von einem Wert aus einer Messreihe istdann am kleinsten, wenn es sich bei diesem Wert um den Median han-delt.)
102 Neue Grafiken I
G.1 Statistische Anmerkungen
Tafel 37: Beispiel zur Berechnung der Reduktion der absoluten Abweichungen vom Median
1 2 3 4 5 6 7 8 9
4.0
Alle
−2.4−1.6
−0.8+0.8
−1.3−0.4
+0.4+0.8
+1.0+2.5
2.41.60.80.8
1.30.40.40.81.02.5
12.01.20
1 2 3 4 5 6 7 8 9
2.8 4.6
Gruppe A Gruppe B
−1.2−0.4
+0.4+2.0
−1.9−1.0
−0.2+0.2
+0.4+1.9
1.20.40.42.0
1.91.00.20.20.41.9
4.0 5.61.00 0.93
Reduktion der absoluten Abweichungen vom Median = 1 − ( 4.0 + 5.6 ) / 12.0 = 20.0 %
Quelle: Nach Fischer [Grafiken zur PCS-Beurteilung, 2008]: 34
Fischer 2010 (Internetversion) 103
G Anhang
G.2 Verzeichnisse
G.2.1 Abkürzungen
Tafel 38: Im Text verwendete Abkürzungen
Abkürzung Bezeichnung Übersetzung; Internetverweise
ø Durchschnitt (arithmetisches Mittel)
a Durchschnittliche absolute Abweichung vom Median
APDRG All Patient Diagnosis Related Groups http:// www.fischer-zim.ch / textk-pcs /t-B3-drg-fam-AP-0801.htm
BAG Bundesamt für Gesundheit http:// www.bag.admin.ch /
BFS Bundesamt für Statistik http:// www.bfs.admin.ch /
DRG Diagnosis Related Groups http:// www.fischer-zim.ch / textk-pcs /index.htm
FIM Functional Independence Measure http:// www.udsmr.org /
HRG Healthcare Resource Groups http:// www.ic.nhs.uk / our-services /standards-and-classifications / casemix
IQR Interquartile Range Quartilsabstand
KVG Krankenversicherungsgesetz vom 18.3.1994 http:// www.admin.ch / ch / d / sr /c832_10.html
LEP Leistungserfassung in der Pflege http:// www.lep.ch /
m Median
OKP Obligatorische Krankenpflege-Grundversicherung http:// www.praemien.admin.ch /
PCS Patientenklassifikationssystem http:// www.fischer-zim.ch / studien /PCS-Buch-9701-Info.htm
r1 Reduktion der absoluten Abweichungen vom Median ↑ S. 102
r2 Varianzreduktion ↑ S. 100
s Standardabweichung
SGP Schweizerische Gesellschaft für Pädiatrie http:// www.swiss-paediatrics.org /
SZH Stiftung Zürcher Höhenkliniken http:// www.zhw.ch / 031dav _ 0103 _ de.htm
TAR Leistungsbedarfsbezogenes Tarifsystem fürRehabilitationskliniken
http:// www.fischer-zim.ch / studien /TAR-RehaPCS-0607-Info.htm
104 Neue Grafiken I
G.2 Verzeichnisse
G.2.2 Literaturverzeichnis
Becker/Cleveland (1996) Trellis/ManBecker RA, Cleveland WS. Trellis Graphics User’s Manual. Seattle (MathSoft, Inc.),Murray Hill (Bell Labs) 1996: 205 S. Internet: http:// cm.bell-labs.com / stat / doc /trellis.user.pdf.
Becker et al. (1996) TrellisBecker RA, Cleveland WS, Shyu MJ. The Visual Design and Control of Trellis Dis-play. In: Journal of Computational and Statistical Graphics 1996/5: 123–155. Inter-net: http:// cm.bell-labs.com / stat / doc / trellis.jcgs.col.ps.
Bertin (1982) GrafikBertin J. Graphische Darstellungen und die graphische Weiterverarbeitung der In-formation. Berlin New York (Gruyter) 1982 [1977]: 275 S.
Brügger et al. (2002) LEP-Methode 2.0Brügger U, Bamert U, Maeder C, Odermatt R. Beschreibung der Methode LEP®
Nursing 2. Leistungserfassung für die Gesundheits- und Krankenpflege. 2, über-arbeitete Auflage, (LEP AG) 2002: 32 S. Internet: http:// www.lep.ch / pdf / Metho-denbeschreibung_2_1.pdf.
Chambers (1998) SChambers JM. Programming with Data. A Guide to the S Language. New York(Springer) 1998. Info: http:// cm.bell-labs.com / cm / ms / departments / sia / Sbook.
Chambers (2008) RChambers JM. Software for Data Analysis. Programming with R. New York (Sprin-ger) 2008: 498 S.
Cleveland (1993) VisualizingCleveland WS. Visualizing Data. Summit (Hobart) 1993: 360 S.
Dalgaard (2002) RDalgaard P. Introductory Statistics with R. New York (Springer) 2002: 267 S.
DH-UK (2007) PbR 2008/09Dept. of Health Payment by Results Finance and Costing Team. Tariff Information:Confirmation of Payment by Results (PbR) arrangements for 2008/09. Exceltabel-le, 2007. Download ab: http:// www.dh.gov.uk / en / Managingyourorganisation /Financeandplanning / NHSFinancialReforms / DH _ 081226.
Fetter et al. (1991) DRGsFetter RB, Brand A, Dianne G [Hrsg.]. DRGs, Their Design and Development. AnnArbor (Health Administration Press) 1991: 341 S.
Fischer (1997) PCSFischer W. Patientenklassifikationssysteme zur Bildung von Behandlungsfall-gruppen im stationären Bereich. Prinzipien und Beispiele. Bern und Wolferts-wil (ZIM) 1997: 514 S. Auszüge: http:// www.fischer-zim.ch / studien / PCS–Buch-9701-Info.htm.
Fischer (2002) DRG+PflegeFischer W. Diagnosis Related Groups (DRGs) und Pflege. Grundlagen, Codie-rungssysteme, Integrationsmöglichkeiten. Bern (Huber) 2002: 472 S. Auszüge:http:// www.fischer-zim.ch / studien / DRG-Pflege-0112-Info.htm.
Fischer (2005) Krankenhaus-BetriebsvergleicheFischer W. Neue Methoden für Krankenhaus-Betriebsvergleiche. Ein Werkstatt-buch zur Visualisierung DRG-basierter Daten. Wolfertswil (ZIM) 2005: 160 S. Aus-züge: http:// www.fischer-zim.ch / studien / KBV-0506-Info.htm.
Fischer 2010 (Internetversion) 105
G Anhang
Fischer et al. (2006) TAR und Reha-PCSFischer W, Blanco J, Mäder M, Zangger P, Conti FM, et al.. Das TAR-System und andere Patientenklassifikationssysteme für die Rehabilitation. TAR-Forschungsbericht und Kurzbeschrieb von Systemen aus Deutschland, Frank-reich, Australien und den USA. Wolfertswil (ZIM) 2006: 89 S. Info: http://www.fischer-zim.ch / studien / TAR-RehaPCS-0607-Info.htm.
Fischer (2008) Grafiken zur PCS-BeurteilungFischer W. Statistische Grafiken zur Beurteilung von Patientenklassifikationssys-temen. dargestellt am Beispiel der pädiatrischen Sicht auf das APDRG-System.Wolfertswil (ZIM) 2008: 169 S. Internet: http:// www.fischer-zim.ch / studien / Gra-fiken-PCS-Beurteilung-0804.htm.
Fischer (2008) DRG-FamilieFischer W. Die DRG-Familie. Stand: 2007. Wolfertswil (ZIM) 2008: 32 S. Internet:http:// www.fischer-zim.ch / textk-pcs / index.htm.
Fischer (2009) Notfallvergütung im KrankenhausFischer W. Notfallvergütung im Krankenhaus. Patientenklassifikationssysteme undNotfallpauschalen bei DRG-basierter Vergütung von stationären Behandlungen. 1.Auflage, Wolfertswil (ZIM) 2009: 180 S.
Granger et al. (1993) FIM-RaschGranger CV, Hamilton BB, Linacre JM, Heinemann AW, Wright BD. PerformanceProfiles of the Functional Independence Measure. In: Am J Phys Med Rehabil1993(72): 84–89.
Granger et al. (1995) FIMGranger CV, Brownscheidle CM. Outcome Measurement in Medical Rehabilitati-on. In: International Journal of Technology Assessment in Health Care 1995(11)2:262–268.
Granger et al. (1995) UDSmr-93Granger CV, Ottenbacher KJ, Fiedler RC. The Uniform Data System for Medi-cal Rehabilitation. In: American Journal of Physical Medicine & Rehabilitation1995(74)1: 62–66.
Hahsler et al. (2008) SeriationHahsler M, Hornik K, Buchta C. Getting Things in Order: An Introduction to theR Package seriation. In: Journal of Statistical Software 2008(25)3. Internet: http://www.jstatsoft.org / v25 / i03 /.
Nagel et al. (1996) Grafische DatenanalyseNagel M, Benner A, Ostermann R, Keschke K. Grafische Datenanalyse. StuttgartJena New York (Gustav Fischer) 1996: 292 S.
Tufte (2001) DisplayTufte ER. The Visual Display of Quantitative Information. Second Edition, Cheshire(Graphics Press) 2001 [1983]: 200 S.
Tukey (1977) EDATukey JW. Exporatory Data Analysis. Reading (Addison Wesley) 1977.
UDSmr (1997) FIM™ instrumentUDSmr. Guide for the Uniform Data Set for Medical Rehabilitation (including theFIM™ instrument). Version 5.1. Buffalo (University at Buffalo) 1997.
Unwin et al. (2006) GraphicsUnwin A, Theus M Hofmann H. Graphics of Large Datasets. Visualizing a Million.Berlin New York (Springer) 2006: 271 S.
106 Neue Grafiken I
Stichwortverzeichnis
Balken mit Dreieck . . . . . . . . . . . . . . . . . . 56Balkendiagramm . . . . Punktbalkendia-
gramm, 20, 54Barley . . . . . . . . . . . . . . . . . GerstenernteBetrachtungsdistanz . . . . . . . . . . . . 13, 40Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . 32, 99
Differenzdiagramm . . . . . . . . . . . . . . 47, 54Doppeldifferenzdiagramm . . . . . . 56Kombination von D.diagrammen 58
Distanz . . . . . . . . . BetrachtungsdistanzDreieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
im Sequenzdiagramm . . . . . . . . . . 75mit Balken . . . . . . . . . . . . . . . . . . . . . 56
DRG = Diagnosis Related Groups . . . . .HRG, 21, 48
Fächer . . . . . . . . StreuungsfächerkarteFachwerkgrafik . . . . . . . . . . . . . . . . . . 36, 50Fallgewichte
HRG: elektiv / nicht-elektiv . . . . . 24Fan chart . . . . . . StreuungsfächerkarteFarben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14Federn
im Streuungsfächer . . . . . . . . . . . . 32FIM = Functional Independence Measu-
re. . . . . . . . . . . . . . . . . . . . . . . . .34,36
GerstenernteMinnesota 1931 und 1932 . . . . . .50
Grafiktypenbquad. . . . . . . . . . . . . . . . . . . . . . . . . . 87diffplot . . . . . . . . . . . . . . . . . . . . . . . . . 47dotbar. . . . . . . . . . . . . . . . . . . . . . . . . .52fanchart . . . . . . . . . . . . . . . . . . . . . . . . 31seqplot . . . . . . . . . . . . . . . . . 73, 78, 80spokeplot . . . . . . . . . . . . . . . . . . . . . . 19tri2x . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58tribar . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Histogramm. . . . . . . . . . . . . . . . . . . . . . . . .19HRG = Healthcare Resource Groups24
Interquartilsabstand . Quartilsabstand
Kammlinie . . . . . . . . . . . . . . . . . . . . . . . . . . 80Krankenkassenprämien . . . . . . . . . . . . . 40Kreis
im Streuungsfächer . . . . . . . . . . . . 32
in der Speichengrafik . . . . . . . . . . . 19Kunstgrafik. . . . . . . . . . . . . . . . . . . . . . . . . .11
LaTeX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4LEP = Leistungserfassung in der Pflege
34, 36Lesbarkeit. . . . . . . . . . . . . . . . . . . . . . .13, 78Liniendiagramm . . . . . . . . . . . . . . . . . 73, 80Lupe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12, 22
Markierungsstrichbei Unsichtbarkeit . . . . . . . . . . . . . . 19
Mathematikprüfungen . . . . . . . . . . . . . . . 38Median. . . . . . . . . . . . . . . . . . . . .31, 99, 102
im Boxplot. . . . . . . . . . . . . . . . . . . . . .99im Streuungsfächer. . . . . . . . .32, 99
Pdf-Dateiaktive Querverweise. . . . . . . . . . . .12
Pseudogeografische Anordnung . . . . 40Punktbalkendiagramm . . . . . . . . . . 52, 54Punktediagramm. . . . . . . . . . . . . . . . . . . . 54
Quartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99Boxplot. . . . . . . . . . . . . . . . . . . . . . . . .99Streuungsfächer . . . . . . . . . . . . . . . 32
Quartilsabstand . . . . . . . . . . . . . . . . . . . . . 99Streuungsfächer . . . . . . . . . . . . . . . 32
Reduktion der absoluten Abweichungenvom Median . . . . . . . . . . 64, 102
Rehabilitation . . . . . . . . 34, 36, 76, 78, 80Relevanz. . . . . . . . . . . . . . . . . . . . . . . . 13, 31
Relevanzbalken . . . . . . . . . . . . . . . . 36
Sequenzbänder . . . . . . . . . . . . . . . . . . . . . 78Sequenzdiagramm. . . . . . . . . . . . . . . . . . 75Speichengrafik . . . . . . . . . . . . . . . . . . 19, 20Spirale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96Spoke plot . . . . . . . . . . . SpeichengrafikStrömungsbild. . . . . . . . . . . . . . . . . . .31, 66Streuungsfächer . . . . . . . . . . . . . . . . . . . . 32Streuungsfächerkarte . . . . . . . . . . . . . . . 31
Trellis display . . . . . . . . Fachwerkgrafik
Varianzreduktion . . . . . . . . . . . . . . . 64, 100
Wechseldiagramm . . . . . . . . . . . . . . . . . . 87Wechselflagge . . . . . . . . . . . . . . . . . . . . . . 88Windrichtung. . . . . . . . . . . . . . . . . . . . . . . .31
Fischer 2010 (Internetversion) 107
Publikationen im ZIM-Verlag
Wolfram Fischer
Neue Methoden für Krankenhaus-Betriebsvergleiche
Ein Werkstattbuch zur Visualisierung DRG-basierter Daten
2005, 160 S., 109 Tab. und meist farbige Abb., geb.e 25.90 / SFr. 38.80ISBN 978-3-9521232-8-7 (ZIM)
Gleich zu Beginn ist in diesem Buch ein umfassendes Beispiel ei-nes Krankenhaus-Betriebsvergleichs zu finden. Anschliessend wer-den Schritt für Schritt Lösungen zu den folgenden Fragen präsen-tiert: 1. Wie lässt sich ein Krankenhaus beschreiben? 2. Wie kön-nen ähnliche Krankenhäuser ermittelt werden? 3. Welche Kennzah-len und Grafiken ermöglichen diskussionsfähige Krankenhausver-gleiche? Dazu werden neuentwickelte «dichte» Grafiken verwendet.
Wolfram Fischer
Neue Methodenfür Krankenhaus−Betriebsvergleiche
Ein Werkstattbuch zur Visualisierung DRG−basierter Daten
Wolfram Fischer
Statistische Grafiken zur Beurteilung von Patientenklassi fikati-onssystemen
dargestellt am Beispiel der pädiatrischen Sicht auf das APDRG-System
2008, 169 S., 81 Tab. und meist farbige Abb., kt.e 29.90 / SFr. 45.00ISBN 978-3-905764-03-1 (ZIM)
Auswertungen von DRG-Daten tendieren zur Unübersichtlichkeit. Indiesem Buch wird gezeigt, wie es mit «dichten» Grafiken möglichwird, einen Überblick zu schaffen, und wie gleichzeitig Problembe-reiche sichtbar gemacht werden können.
Wolfram Fischer
Statistische Grafiken zur Beurteilungvon Patientenklassifikationssystemen
dargestellt am Beispiel der pädiatrischen Sichtauf das APDRG−System
www.fischer-zim.ch / verlag