Neue Grafiken zur Datenvisualisierung - fischer-zim.ch · ZIM – Zentrum für Informatik und...

transcript

Wolfram Fischer

Neue Grafikenzur Datenvisualisierung

Band 1

Speichengrafiken, Streuungsfächerkarten,

Differenz−, Sequenz− und Wechseldiagramme

Wolfram Fischer

Neue Grafikenzur Datenvisualisierung

Band 1: Speichengrafiken, Streuungsfächerkarten,Differenz-, Sequenz- und Wechseldiagramme

Zentrum für Informatik und wirtschaftliche MedizinWolfertswil

Angaben zum Autor

Wolfram Fischer

Z I M – Zentrum für Informatik und wirtschaftliche Medizin

Steigstrasse 12

CH-9116 Wolfertswil (SG)

wolfram@fischer-zim.ch

Betriebswirtschafter (lic. oec. HSG) und Medizin-Informatiker;

Gründer und Leiter des Z I M.

Tätigkeitsschwerpunkte:

• Analyse und Visualisierung medizinökonomischer Daten.

• Patientenklassifikationssysteme aus ärztlicher und aus pflegerischer Sicht.

• Bereitstellung fachspezifischer Informationen im Internet unter:

www.fischer-zim.ch

Liste der «Kunstgrafiken» in diesem Buch

• Mond-Feuer-Blume (2010) ↑ S. 17

• Linien-Aussaat (2009) ↑ S. 29

• Dreiecke im Wind (2005) ↑ S. 45

• Rot verloren im Blauwald (2010) ↑ S. 71

• Wechselflaggen-Gehänge (2010) ↑ S. 85

• Speichenspirale 1 (2009) ↑ S. 97

Informationsseite zum Buch

http:// www.fischer-zim.ch / studien / Neue-Grafiken-I-1003-Info.htm

Zentrum für Informatik und wirtschaftliche Medizin

http:// www.fischer-zim.ch / verlag /

Umschlag, Layout und Satz: Wolfram Fischer

(Verwendete freie Software: LATEX, m4, R, perl, etc. unter Linux)

Grafik auf Umschlag: Auf der Grundlage von Tafel 8, S. 39

Korrektorat: Edith Meier-Keim

ISBN 978-3-905764-06-2

Vorwort

Statistische Grafiken helfen, Zahlenmaterial besser zu verstehen. Sie las-StatistischeGrafiken sen nicht nur Besonderheiten, sondern auch Unauffälligkeiten erkennen.

Sie sollen den Leser unterstützen, Fragen zu stellen und zu diskutieren.Es gibt zwei grundsätzlich verschiedene Ansätze, Grafiken zu gestalten:Plakativ oder

ziseliert? Mit einer plakativen Grafik kann man wirkungsvoll eine bestimmte Aussa-ge belegen. Man destilliert dazu aus einer Vielzahl von vorliegenden Infor-mationen jene Daten heraus, deren Darstellung den Betrachter der Grafikvon der angestrebten Aussage überzeugt.

Mit einer differenzierten, dichten Grafik kann man einen Sachverhaltumfassender darstellen. Auch dazu wird man Informationen auswählenmüssen. Man zeigt aber soviel Information, dass der Leser der Grafikselbst einen Schritt in die Tiefe machen kann und dass er möglicherwei-se Fragen an die Auswertungen stellt, die vom Konstrukteur der Grafik sonicht vorausgedacht worden waren.

Aussagekräftige und diskussionsfördernde statistische Grafiken zu ge-KreativeKonstruktionen stalten ist eine herausfordernde und zugleich auch sehr spannende, ja

beflügelnde Aufgabe. Wenn man die Freiheit hat, Grafiken jenseits derStandardvorschläge aus einem Officepaket zu gestalten, beginnt die Ar-beit – nach der vorgängigen Präzisierung des Darstellungsziels – zuersteinmal mit dem Sammeln von Gestaltungsideen: Welche Möglichkeitengäbe es, mit den verschiedenen Aspekten des Datenmaterials umzuge-hen? Genügen die bekannten Darstellungstechniken oder könnte eineneue Form entwickelt werden? Bei der anschliessenden Umsetzung undErprobung der Ideen werden sich neue Wege auftun; andere Wege wer-den sich als ungeeignet entpuppen. Schliesslich entscheidet man sich füreine bestimmte Ausgestaltung, die man als gelungen empfindet. Oder manverwirft das Ganze, nimmt eine andere Idee auf und beginnt von vorne.

Auf den folgenden Seiten stelle ich einige der von mir auf solchen Ent-Entdeckungsreisedeckungsreisen entwickelten neuartigen Grafikelemente und Grafiken vor.

Dass diese Arbeit auch zum Spiel an- oder verleitet, zeigen die denSpielfreudeKapiteln vorangestellten künstlerischen Verfremdungen der Grafiken. Sieberuhen auf realem Zahlenmaterial, wurden aber durch gezielte – manch-mal zunächst unabsichtliche – Fehleinstellungen einzelner Parameter um-geformt.

Inhaltsverzeichnis

Tabellen und Abbildungen 9

A Einleitung 11A.1 Aufbau des Buches . . . . . . . . . . . . . . . . . . . . . 11A.2 Lesehinweise . . . . . . . . . . . . . . . . . . . . . . . . . 12A.3 Vorüberlegungen . . . . . . . . . . . . . . . . . . . . . . . 13

B Speichengrafiken 15B.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 19B.2 Beschreibung . . . . . . . . . . . . . . . . . . . . . . . . . 20B.3 Beispiel 1: Überblick über Fallzahlen in 445 Patientenkate-

gorien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21B.4 Beispiel 2: Preisunterschiede in 546 Patientenkategorien . . 24

C Streuungsfächerkarten 27C.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 31C.2 Beschreibung: Fächer . . . . . . . . . . . . . . . . . . . . 32C.3 Beispiel 1: Fähigkeitseinschränkungen und Pflege . . . . . 34C.4 Beispiel 2: Fähigkeitseinschränkungen und Pflege im Zeit-

verlauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36C.5 Beispiel 3: Mathematikprüfungen und sozioökonomischer

Status . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38C.6 Beispiel 4: Krankenkassenprämien . . . . . . . . . . . . . 40

D Differenzdiagramme 43D.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 47D.2 Beschreibung: Dreiecke . . . . . . . . . . . . . . . . . . . 47D.3 Beispiel 1: Vergleich von Fallanteilen in Patientenkategorien 48D.4 Beispiel 2: Gerstenernten 1931 und 1932 . . . . . . . . . . 50D.5 Beschreibung: Punktbalken . . . . . . . . . . . . . . . . . 52D.6 Beispiel 3: Gerstenernten 1931 und 1932 . . . . . . . . . . 52D.7 Vergleich von vier Darstellungsweisen . . . . . . . . . . . . 54D.8 Beschreibung: Dreieck mit Balken . . . . . . . . . . . . . . 56D.9 Beispiel 4: Gerstenernten 1931 und 1932 . . . . . . . . . . 56D.10 Beschreibung: Kombination von zwei Dreiecken . . . . . . 58D.11 Beispiel 5: Gerstenernten 1931 und 1932 . . . . . . . . . . 58

Inhaltsverzeichnis

E Sequenzdiagramme 69E.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 73E.2 Beschreibung: Sequenzierte Dreiecke . . . . . . . . . . . . 75E.3 Beispiel 1: Verlauf von Rehabilitationsbehandlungen . . . . 76E.4 Beschreibung: Sequenzbänder . . . . . . . . . . . . . . . 78E.5 Beispiel 2: Verlauf von Rehabilitationsbehandlungen . . . . 78E.6 Beschreibung: Kammlinien . . . . . . . . . . . . . . . . . . 80E.7 Beispiel 3: Verlauf von Rehabilitationsbehandlungen . . . . 80

F Wechseldiagramme 83F.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 87F.2 Beschreibung: Wechselflagge . . . . . . . . . . . . . . . . 88F.3 Beispiel 1: Antwortpaare zu Ja/Nein-Fragen nach Ländern . 88F.4 Beispiel 2: Antwortpaare zu Ja/Nein-Fragen nach Themen . 90F.5 Beispiel 3: Antwortkombinationen zu Ja/Nein-Fragen pro

Person . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

G Anhang 95G.1 Statistische Anmerkungen . . . . . . . . . . . . . . . . . . 99

G.1.1 Median und Quartile in Boxplot und Streuungsfä-cherkarte . . . . . . . . . . . . . . . . . . . . . . . 99

G.1.2 Varianzreduktion (r2) . . . . . . . . . . . . . . . . . 100G.1.3 Reduktion der absoluten Abweichungen vom Medi-

an (r1) . . . . . . . . . . . . . . . . . . . . . . . . 102G.2 Verzeichnisse . . . . . . . . . . . . . . . . . . . . . . . . . 104

G.2.1 Abkürzungen . . . . . . . . . . . . . . . . . . . . . 104G.2.2 Literaturverzeichnis . . . . . . . . . . . . . . . . . . 105— Stichwortverzeichnis . . . . . . . . . . . . . . . . . 107

Tabellen und Abbildungen

1 Platzbedarf einer Speichengrafik im Vergleich zum Balkendiagramm . . 212 SGP 2005: Anzahl Fälle in allen belegten APDRGs . . . . . . . . . . . 233 HRG 3.5: Unterschiede der HRG-Pauschalen 2008 für elektive und nicht-

elektive Behandlungen . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4 Erster Versuch zu einem grafischen Symbol für ein Strömungsbild . . . 315 Legende zum Streuungsfächer (360°) . . . . . . . . . . . . . . . . . . 336 Median und Quartile der LEP-Stunden pro Tag, nach motorischem und

kognitivem FIM (TAR97) . . . . . . . . . . . . . . . . . . . . . . . . . . 357 Median und Quartile der LEP-Stunden pro Tag, nach motorischem und

kognitivem FIM (Test-Daten) . . . . . . . . . . . . . . . . . . . . . . . 378 7185 Mathematikprüfungen: Resultate nach Geschlecht und Zugehörig-

keit zu einer Minorität . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 CH: Krankenkassenprämienangebote . . . . . . . . . . . . . . . . . . 41

10 Legende zum Symbol für Differenzdiagramme . . . . . . . . . . . . . . 4711 Krankenhaus H217: Fallanteile nach APDRG-Subkategorien und Kosten-

gewichtsklassen im Vergleich zu allen Krankenhäusern des Typs «Zen-trumsversorgung» . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

12 Gerstenernten in Minnesota 1931 und 1932 (Differenzdiagramm) . . . . 5113 Legende zum Symbol für Punktbalkendiagramme . . . . . . . . . . . . 5214 Gerstenernten in Minnesota 1931 und 1932 (Punktbalkendiagramm) . . 5315 Gerstenernten in Minnesota 1931 und 1932 (vier Darstellungsweisen) . 5516 Legende zum Symbol für Doppeldifferenzdiagramme . . . . . . . . . . 5617 Gerstenernten in Minnesota 1931 und 1932 (Doppeldifferenzdiagramm) 5718 Legende zum Symbol für Differenzdiagramme mit zwei Dreiecken . . . . 5819 Gerstenernten in Minnesota 1931 und 1932 (zwei Differenzdiagramme) . 5920 Gerstenernten in Minnesota 1931 und 1932, korrigiert (zwei Differenzdia-

gramme) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6121 Gerstenernten in Minnesota 1931 und 1932, korrigiert (zwei Differenzdia-

gramme), nach Sorten . . . . . . . . . . . . . . . . . . . . . . . . . . . 6322 Gerstenernten in Minnesota 1931 und 1932, korrigiert (zwei Differenzdia-

gramme), nach Anbauorten . . . . . . . . . . . . . . . . . . . . . . . . 6523 Gerstenernten in Minnesota 1931 und 1932, korrigiert (Strömungsbilder) 67

24 Legende zu sequenzierten Dreiecken mit fünf Werten . . . . . . . . . . 7325 Legende zu sequenzierten Dreiecken mit sieben Werten . . . . . . . . 7426 Legende zu sequenzierten Dreiecken mit acht Werten . . . . . . . . . . 7527 Entwicklung der FIMø-Punkte nach Hospitalisationswochen . . . . . . . 7728 Legende zu einem Sequenzband mit acht Werten . . . . . . . . . . . . 7829 Sequenzbänder zur Entwicklung der FIMø-Punkte nach Hospitalisations-

wochen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7930 Legende zu einer Kammlinie mit acht Werten . . . . . . . . . . . . . . 8031 Kammlinien zur Entwicklung der FIMø-Punkte nach Hospitalisationswo-

chen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

32 Legende zu den Wechselflaggen . . . . . . . . . . . . . . . . . . . . . 8733 Geordnete Antwortpaare zu sieben Ja/Nein-Fragen, nach Ländern . . . 8934 Geordnete Antwortpaare zu sieben Ja/Nein-Fragen, nach Themen . . . 91

Tabellen und Abbildungen

35 Antwortpaare pro Person zu sieben Ja/Nein-Fragen, nach Ländernund Personen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

36 Beispiel zur Berechnung der Varianzreduktion . . . . . . . . . . . . . . 10137 Beispiel zur Berechnung der Reduktion der absoluten Abweichungen vom

Median . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10338 Im Text verwendete Abkürzungen . . . . . . . . . . . . . . . . . . . . . 104

A Einleitung

A.1 Aufbau des Buches

Während meiner langjährigen Wühlarbeit in Datenbergen aus dem Ge-Grafiken gestaltensundheitswesen begann ich, eigene Grafiken zu gestalten. Dabei kamenmir meine Programmierkenntnisse zugute, und die Programmiersprache«R»1 eröffnete mir ganz neue Möglichkeiten. Sie spornte mich an, grafi-sche Darstellungen von Grund auf neu zu denken.

In der mit diesem Band eröffneten Buchreihe werden von mir entwickelteBuchreiheneuartige Typen von Grafiken zur Visualisierung statistischer Daten vorge-stellt. Sie dienen zur differenzierten Darstellung umfangreicher und kom-plexer Daten. Und sie sollen mit einer ansprechenden Gestaltung auchdas Auge erfreuen.

Kapitelweise werden folgende Typen von Grafiken vorgestellt:Kapitelinhalte

• Speichengrafik2: Balkendiagramm in Kreisform.↑ S. 15

• Streuungsfächerkarte: Fächersymbole mit fixer Grösse, mit welchen↑ S. 27

die gleichen Verteilungskennzahlen dargestellt werden können wiemit Boxplots, mit Vergleichsmöglichkeiten in zwei Dimensionen.

• Differenzdiagramme3: Dreiecke – z. T. mit Balken kombiniert – zur↑ S. 43

Anzeige von Paaren oder Tripeln von absoluten Werten und derenDifferenzen.

• Sequenzdiagramme4: Dreiecke und Bänder zur Anzeige von sequen-↑ S. 69

zierten absoluten Werten und deren Differenzen.

• Wechseldiagramm: Diagonal unterteilte Quadrate zur Darstellung↑ S. 83

von zwei Zuständen und zwei Zustandswechseln.

Jedem Kapitel wurde eine «Kunstgrafik» vorangestellt. Sie wurden mit den«Kunstgrafiken»gleichen Algorithmen und Daten wie die statistischen Grafiken konstruiert,aber mit anderen Werten parametriert, um schöne oder überraschende,abstrakte Grafiken zu erhalten.

Im Anhang folgen einige Anmerkungen zu statistischen Fachaus-StatistischeFachausdrücke↑ S. 99

drücken, welche im Rahmen der Präsentation der Streuungsfächerkarten

1 http:// www.r-project.org /; Chambers [R, 2008]; Dalgaard [R, 2002]. – «R» ist eineOpenSource-Implementation der Programmiersprache «S»; vgl. dazu: Chambers [S,1998].

2 Erstmalige Beschreibung in: Fischer [Grafiken zur PCS-Beurteilung, 2008]: 35.3 Erstmalige Beschreibung in: Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 135 ff.4 Erstmalige Beschreibung in: Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 108 f.

Fischer 2010 (Internetversion) 11

A Einleitung

verwendet wurden. Sie sind für Leser gedacht, denen diese Dinge nochnicht besonders geläufig sind.

Im Text anzutreffende Abkürzungen sind ebenfalls im Anhang zusam- Verzeichnisse↑ S. 104mengestellt und mit allfälligen Internetverweisen ergänzt. Anschliessend

folgen Literatur- und Stichwortverzeichnis.

A.2 Lesehinweise

In diesem Buch gibt es zwei Arten von internen Querverweisen: Querverweise:

• Verweise auf Tafeln, die unmittelbar zum Text gehören. direkter Verweis

• Verweise auf Tafeln oder Abschnitte, die in anderen Teilen des Bu- ↑ Querverweis

ches zu finden sind.

In der Pdf-Datei gibt es in den Marginalien und im Inhaltsverzeichnis blau Blaue Verweise aufTabellen und Seiteneingefärbte Tabellen- und Seitennummern. Durch einen Mausklick gelangt

man direkt zur referenzierten Seite.Grau gedruckte Texte enthalten Verweise auf Texte im Internet, die für Graue Verweise

ins Internetdiese Arbeit gebraucht wurden. Durch einen Mausklick öffnet sich einInternet-Browser-Fenster, und man kann sich den referenzierten Text an-sehen. Da die Inhalte im Internet z. T. sehr schnelllebig sind, kann es sein,dass manche Verweise bereits zum Zeitpunkt des Lesens nicht mehr gül-tig sind. In solchen Fällen kann es sich lohnen, im Internet nach Titel undAutor zu suchen, um einen allfälligen neuen «Standort» ausfindig zu ma-chen.

Bei mehrzeiligen Internetverweisen kann es sein, dass man die aktiveZone für den Mausklick kaum findet. (Sie befindet sich dann zwischen denZeilen.) Dies schafft die aktuelle Version der verwendeten Textaufberei-tungssoftware leider noch nicht besser.

Es ist eine der Spezialitäten der hier vorgestellten Konstruktionsweisen, Dichte Grafiken mitz. T. kleinen Textendass Grafiken auch dann noch auf einer Seite Platz haben, wenn sie gros-

se Datenmengen abbilden. Das Ziel ist es, gleichzeitig sowohl einen Über-blick zu erhalten als auch auffällige Details sichtbar zu machen. Ein Nach-teil dieser Technik ist, dass die Texte in den resultierenden Grafiken zumTeil sehr klein geworden sind und dass es notwendig werden kann, dieLupe zu Hilfe zu nehmen.

12 Neue Grafiken I

A.3 Vorüberlegungen

Als generelle Hauptaufgaben einer Grafik sind mir wichtig:

1. Eine Grafik soll eine Einschätzung der Daten ermöglichen. Dazu istÜberblickund Vergleiche es nötig, dass sie dem Leser einen Überblick verschafft und gleich-

zeitig verschiedene Vergleichsmöglichkeiten bereitstellt.

2. Vergleiche werden durch die Abbildung relativer Werte oder durch dieRelative undabsolute Werte Gegenüberstellung absoluter Werte ermöglicht.

3. Auch wenn relative Werte direkt abgebildet werden, sollen die absolu-ten Werte nach Möglichkeit erkennbar sein, damit die Bedeutsamkeitihres Ausmasses abgeschätzt werden kann.

4. Die Daten müssen «lokalisiert» werden können: Sie müssen einerLokalisierbarkeitKategorie (oder mehreren) und/oder einem Mass (z. B. Zeit, Koordi-naten, identifizierender Wert) zugeordnet werden können.

5. Die Relevanz der präsentierten Kennzahlen soll soweit möglich abge-Relevanzschätzt werden können. (Hilfreich dazu können z. B. Mengenangabensein, welche als Indikatoren der Relevanz betrachtet werden können.)

6. Eine Grafik soll aus zwei Distanzen betrachtet werden können: AusErster undzweiter Blick grösserer Entfernung soll man ein Gesamtbild erhalten und erkennen

können, ob dieses eher ruhig ist oder ob es auffällige Bereiche gibt,die Anstoss zu Fragen geben könnten. Für eine nähere Betrachtungsoll die Grafik mit genügend Detailinformationen ausgestattet sein,um ein facettenreicheres Bild zu ermöglichen und Hinweise zu Ant-worten auf einige der entstandenen Fragen liefern zu können.

7. Eine Grafik soll ansprechend aussehen.AnsprechendesAussehen

Bei der Arbeit an Grafik-Konstruktionen und bei der AuseinandersetzungLernerfahrungenmit deren Konstruktionsprinzipien konnte ich viel lernen. Fasziniert war ichinbesondere von der Entdeckung, dass das menschliche Auge nicht nurauf plakativ präsentierte Unterschiede reagiert, sondern auch auf erstaun-lich geringe Veränderungen von Farben, Formen und Positionen.

Aufgrund dieser Erkenntnis begann ich, mit kleineren Formen und mitKleine FormenUntergliederungen in «Grafikfelder» zu arbeiten. Es zeigte sich, dass dieVergrösserung von Grafiken eher selten eine wirklich differenziertere In-terpretation ermöglichte. Eine Vergrösserung ist dann hilfreich, wenn nichtmehr alle Textelemente entziffert werden können. Da eine Vergrösserunggleichzeitig aber auch zu einem Verlust an Übersichtlichkeit führen kann,ist nach einem Optimum zwischen Kompaktheit und Lesbarkeit zu suchen.

Kleinere Formen erlauben es auch, Daten darzustellen, die wenigerWenigeraggregierte Daten stark aggregiert sind. Dies gibt bessere Einsichten in Strukturen wie z. B.

Verteilungsstrukturen.

A Einleitung

Ich setzte nicht nur verschiedene Farben, sondern auch unterschied- Farbintensitätenund Farbverläufeliche Farbintensitäten und Farbverläufe ein. Damit war eine vielfältigere

Farbgebung möglich. Darüberhinaus ergaben sich so mehr Codierungs-möglichkeiten. Und: Nicht-grelle Farben sind oft angenehmer zum Be-trachten.

Bei dieser Konstruktionsarbeit erkannte ich im Weiteren, dass grafische Grafiksymbole mitfixer AusdehnungSymbole mit fixer Ausdehnung für kompakte Darstellungen sehr dienlich

sind. Ausserdem werden damit Vergleiche in zwei Dimensionen (senkrechtund waagrecht) möglich.

Nach diesen Vorüberlegungen möchte ich den Leser nun nicht mehr län-ger mit theoretischen Überlegungen aufhalten, sondern die Vorstellung derGrafiken mit den Speichengrafiken beginnen . . .

14 Neue Grafiken I

B Speichengrafiken

Mond-Feuer-Blume (2010)

Aus der Speichengrafik mit Differenzen zu gut 500 HRG-Pauschalen, ↑ Tafel 3 (S. 25)

durch beidseitige Verkürzung der radialen Skala.

B.1 Motivation

Was macht man am besten mit einer endlos langen Liste von Häufigkei-Lange Listevon Häufigkeiten ten? Das erste ist natürlich, dass man versucht, die Liste zu strukturieren.

Man sucht nach Gruppen, nach einer hierarchischen Struktur. Solche Bün-delungen helfen bei der Orientierung.

Trotzdem bleibt die Ausgangsliste lang, sofern man nicht auf eine detail-Balkendiagramm?lierte Darstellungsform verzichten kann. Eine konventionelle Darstellungmit Balken, welche die Häufigkeiten abbilden, kann an mangelndem Platzscheitern oder an den grossen Häufigkeitsunterschieden, welche schwachbelegte Kategorien manchmal beinahe unsichtbar werden lassen.1

Als ich an dieser Fragestellung herumstudierte, ging mir durch den Kopf,Durchmesser × π= Kreisumfang dass ein abgewickelter Kreis eine lange Linie erzeugt. Sie ist gut dreimal

so lang wie der Durchmesser des Kreises. Was würde passieren, dachteich, wenn ich den umgekehrten Vorgang benutzte? Wie wäre es, wenn ichdie Grundlinie, auf der die Balken stehen, zu einem Kreis formte?

Als ich dem Computer beigebracht hatte, die Balken in einen Kreis zuMehrere hundertKategorien ineinem Kreis

stellen und diese dann zum ersten Mal betrachtete, staunte ich, dass ichtrotz der Darstellung der Häufigkeiten zu mehreren hundert Kategoriennicht den Eindruck hatte, von der Datenmenge überfahren zu werden,sondern dass ich – vielleicht auch angezogen von der schönen Form –interessiert schauen ging, wo viel und wo wenig Messungen vorlagen. Ichmerkte, dass eine Gruppierung nach wie vor nötig war. Aber die Gruppenbüschelten sich kompakt, und es resultierte ein überraschend übersichtli-cher Gesamteindruck.

Die neue Grafik nannte ich «Speichengrafik», weil sie mich an ein Rad«Speichengrafik»eines Fahrrades erinnerte.

1 Von Hoffmann stammt der interessante Vorschlag, unsichtbare, aber trotzdem beleg-te Positionen bei Histogrammen oder anderen Balkendiagrammen mit einem kleinen(z. B. roten) Markierungsstrich zu versehen. – Vgl. Unwin et al. [Graphics, 2006]:58+87+106.

B Speichengrafiken

B.2 Beschreibung

«Speichengrafiken» sind Balkendiagramme in Kreisform. Damit können Balkendiagrammein Kreisformauf einem beschränkten Platz ungefähr dreimal soviele Einträge gezeigt

werden wie mit einem gewöhnlichen Balkendiagramm. Dank der Gewohn-heit, tagtäglich analoge Uhren abzulesen, kann sich der Leser recht gutorientieren.

In der Erklärungsgrafik werden eine Speichengrafik und ein Balkendia- PlatzsparendTafel 1gramm für die gleichen Ausgangsdaten gezeigt. Es gibt beide Male 140

Einträge. Sie sind in Siebner-Gruppen gebündelt. Die Kreislinie der Spei-chengrafik und die Basislinie des Balkendiagrammes haben die gleicheLänge; die Abstände der einzelnen Speichen auf der Kreislinie sind gleichgross wie die Abstände der einzelnen Balken auf der Basislinie.

Die Grafik zeigt, wie wenig Platz die Speichengrafik im Vergleich zumBalkendiagramm benötigt. Ausserdem erscheinen die Gruppen besser ge-bündelt; es wird schneller erkannt, wie sich die Einträge einer Gruppe zu-einander verhalten. Und man sieht fast sofort, dass es etwa fünf Einträgemit sehr langen Speichen gibt.

Dadurch, dass alle Speichen gegen das Zentrum laufen, kommt es zu Für viele kleinebis mittlereund vereinzeltegrössere Werte

Überlagerungen, wenn es viele Speichen mit voller Länge gibt. Speichen-grafiken eignen sich deshalb besonders für Verteilungen mit vielen kleinenbis mittleren und vereinzelten grösseren Werten.

20 Neue Grafiken I

B.3 Beispiel 1: Überblick über Fallzahlen in 445 Patientenkategorien

Tafel 1: Platzbedarf einer Speichengrafik im Vergleich zum Balkendiagramm

B.3 Beispiel 1: Überblick über Fallzahlen in 445 Patientenk ategorien

Wie kann man die Struktur des Patientenspektrums eines Kranken-Einleitunghauses oder einer geografischen Region grafisch darstellen?2 – MitDRG3-basierten Auswertungen können viele Details erkannt werden. Abermanchmal ist es schwierig, einen Überblick zu erhalten. Neben der gros-sen Anzahl von vielen hundert bis über tausend DRGs machen einem da-bei auch die sehr unterschiedlichen Fallzahlen pro DRG zu schaffen: Esgibt ein paar wenige hochfrequentierte DRGs und viele schwach belegteDRGs.

2 Das folgende Beispiel stammt aus Fischer [Grafiken zur PCS-Beurteilung, 2008]: 61.3 DRG = Diagnosis Related Groups. DRG-Systeme sind Patientenkategorisierungs-

systeme, mit denen das Patientenspektrum stationärer Behandlungen in Akut-Krankenhäusern beschrieben werden können. In ihnen sind mehrere hundert bisüber tausend Patientenkategorien definiert. – Vgl. Fetter et al. [DRGs, 1991]; Fischer[PCS, 1997]. Fischer [DRG-Familie, 2008].

B Speichengrafiken

Für die folgende Musterauswertung waren 20 436 Datensätze aus acht DatenSchweizer Kinderkrankenhäusern oder -abteilungen aus dem Jahr 2005verfügbar. Sie belegten 445 DRGs. Die Fallzahlen bewegten sich zwischen1 und 1272 Fällen pro DRG.

Anstelle eines konventionellen Balkendiagrammes wurde ein Balkendia- Grafikgramm von einer Kreislinie aus gezeichnet. Die Bezeichnungen von DRGsund Hauptkategorien wurden – hierarchisch – aussen an der Kreislinie ein-getragen. – Die Grafik wurde mit dem frei verfügbaren Statistikpaket «R»erstellt.4

Die Grafik zeigt die Häufigkeiten pro Patientenkategorie «APDRG» (All ResultatPatient Diagnosis Related Groups). Die APDRGs sind geordnet nach Tafel 2

Hauptkategorien. Rechts aussen beginnen die Einträge mit den APDRGsder Hauptkategorie 01 (Nerven). Die Fälle in der chirurgischen Subkate-gorie («01.Nerv.C») sind hellblau gefärbt, jene in der medizinischen Sub-kategorie («01.Nerv.M») dunkelblau. Hier findet sich auch gleich eine dersehr stark belegten APDRGs. Ihr Balken reicht zwei Kreise über die Mitte.Dieser DRG sind also mehr als 900 Behandlungsfälle zugeordnet worden.Man muss leider sehr genau hinschauen, um ihre Kurzbezeichnung ab-lesen zu können: Es ist APDRG 762 «Gehirnerschütterung, intrakranialeVerletzung mit Koma < 1 Std. oder ohne Koma, Alter < 18». – Am meistenFälle gab es in APDRG 777 «Ösophagitis, gastrointestinale und verschie-dene Störungen des Verdauungstraktes, Alter < 18, ohne KK», nämlichüber 1200. (Deren Balken beginnt links oben und geht schräg nach rechtsunten.) – Das Bündel der auffallenden, roten Balken, die von unten herkommen, stammt von den vielen Behandlungen bei Neugeborenen. – Ins-gesamt aber gibt es sehr viele APDRGs, die nicht einmal den ersten Kreiserreichen: Sie waren mit weniger als 100 Fällen belegt.

Die längsten Speichen kreuzen sich in der Mitte der Grafik. Damit die Zur DiskussionGrafik lesbar bleibt, darf es nicht zu viele davon geben. Die Skala derGrafik muss entsprechend dimensioniert werden.

Speichengrafiken eignen sich speziell für Daten mit vielen kleinen undmittleren sowie vereinzelten grossen Werten.

Die Beschriftungen der vielen DRGs sind sehr klein geworden. Trotz-dem ist es praktisch, diese nützliche Information in «Augenreichweite» zuhaben. (Nötigenfalls können die Anschriften mit einer Lupe oder mit derZoomfunktion des Dokumentenanzeigeprogramms vergrössert werden.)

Speichengrafiken ermöglichen es, Fallzahlen von etwa 500 DRGs in ei- Konklusionner gut lesbaren und kompakten Weise auf weniger als einer einzigen Sei-te darzustellen.

4 http:// www.r-project.org; Dalgaard [R, 2002].

22 Neue Grafiken I

B.3 Beispiel 1: Überblick über Fallzahlen in 445 Patientenkategorien

Tafel 2: SGP 2005: Anzahl Fälle in allen belegten APDRGs

01.Nerv.C

01.Nerv.M

uge.C02

e.M03.H

05.Herz.C

05.Herz.M06.Verd.C

06.Verd.M

07.LGPa.C07.LGPa.M

08.Skel.C

08.Skel.M

09.Haut.C

09.Haut.M

10.DrS

M 15.Neug.C

15.Neug.M

16.Blut.C16.Blut.M

17.Myel.C

17.Myel.M

19.Psy.M

20.Drog.M

23.DivF.C

23.DivF.M

27.Tag1.C

27.Tag1.M

81.InHi.C

81.InHi.M

82.TrPo.C

82.TrPo.M

91.Pre.C

99.Fehl.C99.Fehl.M NrvC 004 Rmark NrvC 006 KarpTun NrvC 007 andere+ NrvC 008 andere− NrvC 530 Kran* NrvC 531 NKran* NrvC 737 Kran.V, NrvC 738 Kran,+ NrvC 739 Kran,− NrvC 912 Kran.aNS NrvM 009 Rmark NrvM 010 Neo+ NrvM 011 Neo− NrvM 012 Degen NrvM 013 MS NrvM 014 CerVasc

NrvM 017 CerVnnb− NrvM 018 Nerven+ NrvM 019 Nerven− NrvM 020 Infekt NrvM 021 Mening

NrvM 023 NTrKoma

NrvM 034 andere+

NrvM 035 andere−

NrvM 532 TIA&X*

NrvM 533 andere*

NrvM 762 Commotio,

NrvM 763 TrKoma,

NrvM 768 KopfS,+

NrvM 769 KopfS,−

AugC 036 Retina

AugC 037 Orbita

AugC 039 Linse

AugC 041 Anhangs,

AugC 042 andere

AugM 043 Hyphem

AugM 044 Infekt

AugM 045 Neurol

AugM 048 andere,

AugM 535 alle*

HnoC 050 Siaload

HnoC 051 Speichel

HnoC 052 Spalte

HnoC 054 Sinus,

HnoC 055 dive

HnoC 056 R

hinopl

HnoC 058 M

andeln,

HnoC 060 Tons&

HnoC 062 Trommel,

HnoC 063 andere

HnoC 168 M

HnoC 169 M

und−

C 536 n

C 932 a

M 064 N

titis,

809 Kongen

123 AM

Ikplx H

rzM 124 andkplx

125 andkplx

126 Endokar

127 HerzIns

128 Tphleb

129 HerzS

130 Perpiph+

131 Perpiph−

134 Hypert

137 Kongen,

138 Arrhyt+

139 Arrhyt−

140 AngP

141 Kollaps+

142 Kollaps−

143 ThoraxS

144 andere+

145 andere−

543 andere*

544 HerzIns*

147 Rektum

148 Darm

149 Darm

Maj−

150 AdhäsLy+

151 AdhäsLy−

152 Darm

153 Darm

Min−

156 MgÖ

157 Anus+

158 Anus−

163 Hern,

164 AppK

165 AppK

plx−

166 AppE

167 AppE

inf−

VdgC 170 andere+

VdgC 171 andere−

VdgC 553 andere*

VdgC 585 M

VdgC 935 M

VdgC 936 M

VdgM 174 H

ämorr+

VdgM 175 H

ämorr−

VdgM 176 UlcsKplx

VdgM 177 UlcusAnd+

VdgM 178 UlcusAnd−

VdgM 179 Darm

VdgM 180 O

bstruk+

VdgM 181 O

bstruk−

VdgM 551 Ö

sGaUlc*

VdgM 552 andere*

VdgM 776 ÖsGaX,+

VdgM 777 ÖsGaX,−

VdgM 778 andere,+

VdgM 779 andere,−

LgpC 191 PaLebSh+

LgpC 192 PaLebSh−

LgpC 194 GallG−

LgpC 198 CEoCDE−

LgpC 493 LapCEoCDE+

LgpC 494 LapCEoCDE−

LgpM 203 Neo

LgpM 204 Pankreas

LgpM 205 Leber+

LgpM 206 Leber−

LgpM 207 GallG+

LgpM 208 GallG−

LgpM 557 alle*

SklC 212 HüftFem,

SklC 213 Amput

SklC 216 Biopsie

SklC 217 DebrHand

SklC 220 Hum&Unt,

SklC 221 Knie+

SklC 222 Knie−

SklC 223 ShltEllMaj+

SklC 224 ShltEllMin−

SklC 225 Fuss

SklC 226 Weicht+

SklC 227 Weicht−

SklC 228 Hand+

SklC 229 Hand−

SklC 230 ExzHüfFem

SklC 231 ExzisAnd

SklC 232 Artrskp

SklC 233 andere+

SklC 234 andere− SklC 558 major*

SklC 559 n_major*

SklC 755 WirbelS+ SklC 756 WirbelS−

SklC 757 RückHals+ SklC 758 RückHals−

SklC 806 WirbKomb+ SklC 807 WirbKomb−

SklC 918 Knie.kl.− SklM 235 Femur SklM 236 Becken SklM 237 Dislok SklM 238 Osteom SklM 239 Neo SklM 240 Bindeg+ SklM 241 Bindeg− SklM 242 SArthri SklM 243 Rücken SklM 245 Knochen− SklM 246 Arthrop

SklM 247 Symptom SklM 248 Tendini

SklM 249 Nachsorg SklM 252 Distal,

SklM 255 Proxim, SklM 256 andere

SklM 560 andere*

SklM 561 Osteom*

HauC 261 BrustAnd

HauC 262 BrustBio

HauC 264 TrnUlkCel−

HauC 265 TrnAnd+

HauC 266 TrnAnd−

HauC 267 Perianal

HauC 268 Plast

HauC 269 andere+

HauC 270 andere−

HauC 564 alle*

HauM 271 HautUlk

HauM 272 Haut+

HauM 273 Haut−

HauM 276 BrustAnd

HauM 279 Cellul,

HauM 282 Trauma,

HauM 283 minor+

HauM 284 minor−

HauM 562 major*

HauM 563 andere*

DswC 288 Adipos

DswC 289 PThyro

DswC 290 Thyroid

DswC 291 Thyrogl

DswC 292 andere+

DswM 295 Diabet<

DswM 298 Nahrung,

DswM 299 Kongen

DswM 300 Endokri+

DswM 301 Endokri−

DswM 566 Endokri*

DswM 740 ZystFib

DswM 753 BehNahr

303 Neo

304 NNeo+

305 NNeo−

308 minor+

309 minor−

311 TrUreth−

314 Urethra,

315 andere

567 alle*

938 NNeo.&

939 NNeo.&

940 alle.&

kt’+

.5<−

627 Neu^2.5<

628 Neu^2.5.unb<

629 Neu^2.5<

630 Neu^2.5.and<

635 NeuW

637 NeuT

638 NeuT

639 NeuT

640 NeuT

393 Splen,

394 andere B

ltC 575 alle*

397 Gerinn

398 Imm

ltM 399 Im

mun−

574 alle* B

ltM 760 H

ämo8&

ltM 784 A

nämi,

785 ErytrA

yeC 400 Lym

401 LymphA

406 MyelM

407 MyelM

408 MyelA

579 alle*

403 Lymph&

404 Lymph&

409 RadioTp

410 Chem

411 HistN

414 andere−

576 Leukäm*

577 Myelop*

578 Lymphom

780 Leukäm,+

781 Leukäm,−

425 Anpass

PsyM 426 N

eurDepr

PsyM 427 N

eurAnd

PsyM 428 Person

PsyM 429 O

rg&Ret

PsyM 430 Psychos

PsyM 431 Kindheit

PsyM 432 andere

744 Opiate+

745 Opiate−

DrgM 747 DrogAnd+

DrgM 748 DrogAnd−

DrgM 750 Alkohol+

DrgM 751 Alkohol−

DivC 461 alle

DivM 462 Rehab

DivM 463 Sym

DivM 464 Sym

ptom−

DivM 465 Postcare

DivM 466 Postcare

DivM 467 andere

DivM 633 Kongen+

DivM 634 Kongen−

DivM 636 Postcare<

TagC 921 TodTag1.&

TagM 901 TrfTag1

HivC 703 andere

InfC 415 alle

InfC 581 alle*

HivM 711 HIV*

HivM 712 HIV+

HivM 716 HIV−

InfM 417 Sepsis,

InfM 418 PostInf

InfM 422 VirFieb,

InfM 423 andere

InfM 580 andere*

InfM 584 Sepsis*

BrnC 458 LokTrnH

BrnC 459 LokDebr

BrnC 472 Extens

BrnC 914 LokTrnH.&

PlyC 730 Kran

PlyC 731 RüHüFeExt

PlyC 732 andere

PlyC 792 Kran*

PlyC 793 andere*

TrmC 439 TrnHaut

TrmC 440 Debrid

TrmC 441 Hand

TrmC 442 andere+

TrmC 443 andere−

TrmC 583 NPolytr*

TrmC 791 OffWund

BrnM 460 Lokal

PlyM 733 KoTrxL

PlyM 734 andere

PlyM 794 NTrKK*

TrmM 446 Polytra,

TrmM 448 Allerg,

TrmM 451 Gift,

TrmM 452 Komplik+

TrmM 453 Komplik−

TrmM 454 andere+

TrmM 455 andere−

TrmM 582 NPolytr*

PreC 482 TrachAnd

PreC 483 TrachKopf

PreC 803 KnoTrnAll

PreC 804 KnoTrnAuto

PreC 906 KnoTrnAuto

ErrC 468 ExtP_Dg

ErrC 477 NExtP_Dg ErrM 469 Hdg ErrM 470 NonGrp

0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400

1400 1300 1200 1100 1000 900 800 700 600 500 400 300 200 100 0

Anzahl Fälle

n = 20436 Fälle (in 445 APDRGs) Z I M[SGP.082.spokeplot−082M.3g0w]

Datenquelle: SGP Daten 2005

Quelle: Fischer [Grafiken zur PCS-Beurteilung, 2008]: 61.

B Speichengrafiken

B.4 Beispiel 2: Preisunterschiede in 546 Patientenkategor ien

Im folgenden Beispiel5 werden Preisunterschiede für die britischen Pati- EinleitungTafel 3entenkategorien «HRG» (Healthcare Resource Groups)6 gezeigt.

Für elektive und nicht-elektive Fälle werden unterschiedliche HRG-Pauschalen vergütet, die sich bei vielen HRGs deutlich unterscheiden. Dienicht-elektiven HRG-Pauschalen umfassen notfallmässige Hospitalisatio-nen, Geburten, Neugeborene und Verlegungen.

Für jede der über 500 HRGs der Version 3.5 lagen zwei Vergütungsprei- Datense (HRG-Pauschalen) vor.7

Die Unterschiede zwischen elektiven und nicht-elektiven HRG-Pau- Grafikschalen wurden in einer Speichengrafik visualisiert. Die Skala von derKreislinie bis zum Kreismittelpunkt bezieht sich auf die in englischen Pfun-den angegebenen HRG-3.5-Pauschalen. Die HRGs sind der Kreislinie ent-lang eingetragen (ohne Beschriftung). Die mit Grossbuchstaben beschrif-teten Sektoren beziehen sich auf die HRG-Hauptkategorien.

Jeder Strich – ob blau oder rot – zeigt einen Unterschied zwischen Resultatder elektiven und der nicht-elektiven HRG-Pauschalen an. Identische Pau-schalen sind mit grünen Punkten dargestellt. Es ist erstaunlich, dass sichdie Tarife der meisten HRGs unterscheiden und dass die Unterschiedezum Teil recht gross sind. Aber es ist nicht so, dass die HRG-Pauschalenfür elektive Behandlungen immer niedriger sind (blaue Striche). Dort, wosie höher sind als die Pauschalen für nicht-elektive Behandlungen, sindrote Striche eingetragen. (Rot deshalb, weil es nicht der Erwartung ent-spricht, dass elektive Behandlungen teurer sind als Notfallbehandlungen.)

Das Speichendiagramm zeigt sowohl die positiven wie auch die negati- Zur Diskussionven Differenzen gut.

Dadurch, dass die roten, negativen Differenzen mit etwas breiteren Lini-en markiert sind, wird der farbbezogene Gesamteindruck leicht verzerrt.

Von den absoluten Werten lässt sich die grobe Position zwar ablesen.Zum Beispiel zeigt der äussere Beginn der blauen Linien die elektivenHRG-Pauschalen an. Sich aber ein differenziertes Bild von der Verteilungder elektiven oder der nicht-elektiven Pauschalen machen zu wollen, istanhand dieser Grafik schwierig. Dazu wäre es nötig, die beiden Pauscha-len in einzelnen Grafiken abzubilden.

5 Das Beispiel stammt aus Fischer [Notfallvergütung im Krankenhaus, 2009]: 95.6 http:// www.ic.nhs.uk / our-services / standards-and-classifications / casemix; Fi-

scher [Notfallvergütung im Krankenhaus, 2009]: 81 ff.7 DH-UK [PbR 2008/09, 2007].

24 Neue Grafiken I

B.4 Beispiel 2: Preisunterschiede in 546 Patientenkategorien

Tafel 3: HRG 3.5: Unterschiede der HRG-Pauschalen 2008 für elektive und nicht-elektiveBehandlungen

Striche: Differenzen zwischen elektiver Behandlung und nicht−elektiver Behandlung:Blau: elektiv günstiger als nicht−elektiv. Grün: elektiv = nicht−elektiv. Rot: elektiv teurer als nicht−elektiv.

546 HRGsH

0 3750 7500 11250 15000 11250 7500 3750 0

Z I M[HRG.085.spokeplot.CW:2008−102F]

Datenquelle: www.dh.gov.uk [2008−05]

Quelle: Fischer [Notfallvergütung im Krankenhaus, 2009]: 95.

C Streuungsfächerkarten

Linien-Aussaat (2009)

Gestapelte Streuungsfächerkarten ohne Streuungsfächer, zu Prämien aus ↑ Tafel 9 (S. 41)

mehreren Jahren.

C.1 Motivation

In einem Weltatlas sah ich Strömungsbilder von Winden. Ich war faszi-Strömungsbilderniert von den Bewegungen, die hier sichtbar gemacht wurden. Spannend!,dachte ich und überlegte mir: Was wird damit eigentlich abgebildet? DieWindrichtung in Bezug auf die Himmelsrichtung und die Windgeschwin-digkeit. Was das Ganze interessant und praktisch verwendbar macht, ist,dass die beiden Variablen durch die Angabe der geografischen Positionverortet sind. Das alles zusammen erscheint in einer attraktiven Darstel-lung. Wie wäre es, begann ich zu überlegen, wenn man das Prinzip aufandere Daten anwenden würde?

Für die x- und y-Dimensionen der Zeichenfläche wären nicht nur metri-x- und y-Skalasche, sondern auch ordinale Skalen geeignet wie etwa ordinal geordneteKategorien (z. B. Schweregrade einer Erkrankung) oder nach Klassen un-terteilte Intervallskalen (z. B. Alterstufen).

Wenn ich nun einen Pfeil in jedes der so entstehenden Felder zeichnenDrehbare Pfeile↑ Vgl. Tafel ?? (S. ?? ) würde, hätte ich schon ein abstrahiertes «Strömungsbild». Was aber soll

die Drehrichtung des Pfeiles und was dessen Länge darstellen?Die Länge kann zur Abbildung der Anzahl Messwerte im betreffendenLänge

Feld verwendet werden. Kleinere Pfeile zeigen dann auf kleinere und weni-ger gewichtige Gruppen. Die Grösse wird damit zu einer Relevanzanzeige.

Für die Drehrichtung verbleibt der Messwert selbst. Je nach der WahlDrehrichtungvon x- und y-Skala kann es sein, dass ein Feld mehrere Messungen be-trifft. In solchen Fällen könnte der Mittelwert oder der Median abgebildet↑ Median: S. 99

werden. Aber wenn schon Mittelwert oder Median dargestellt werden,könnte dann nicht auch noch ein Streuungsmass angezeigt werden? Ausdieser Überlegung heraus schnitt ich den Hintergrund so aus, dass damitTafel 4

der Interquartilsbereich sichtbar wurde.In weiteren Versuchen mit diesem Grafiksymbol zeigte sich, dass sichGeburt des

Fächers die Pfeilspitze und der Interquartils-Ausschnitt ungünstig konkurrenzieren,denn sie sind gegenläufig. Ausserdem ist eine Pfeilspitze ein vielleicht un-nötiger Schnörkel;1 man müsste nur die Ausrichtung anders klarstellen

1 Tufte unterscheidet zwischen Druckfarbe, die zur Wiedergabe der Daten unverzicht-bar nötig ist, und solcher, die sonst für die Grafik verwendet wird. Das Verhältnisdieser beiden Mengen sollte möglichst gross sein, d. h. es sollte weggelassen wer-den, worauf ohne Datenverlust verzichtet werden kann. – Tufte [Display, 2001]: 93 ff.

Tafel 4:Erster Versuch zueinem grafischenSymbol für einStrömungsbild

können. Lange suchen musste ich nicht mehr: Die Öffnung des Ausschnit-tes zeigte ja bereits die Richtung. Öffnung des Ausschnittes und Schaftdes Pfeiles aber ergeben – zusammengenommen – eine neue Figur: DerFächer war geboren. Ich färbte ihn schwarz. Damit hatte ich die Buntfarbenfrei für eine andere Variable.

Nun war es nur noch ein kleiner Schritt, die vom Boxplot her bekannten ↑ Boxplot: S. 99

weiteren Informationen hinzuzufügen: Links und rechts vom schwarzenStreuungsfächer positionierte ich zwei weisse Federn. Sie kennzeichnendas 5 %- und das 95 %-Perzentil, umfassen also 90 % der Werte.2

C.2 Beschreibung: Fächer

Die «Streuungsfächerkarte»3 ist eine Grafik, deren Gestaltung von meteo- Tafel 5

rologischen Windströmungskarten inspiriert wurde. Anstelle eines Pfeiles,welcher die Windrichtung anzeigt, wird ein gerichtetes Fächersymbol ver-wendet. Es zeigt Anzahl (Länge der vorderen, weissen Mittellinie), Medi-an (Symbolausrichtung) und Streuung (schwarzer Fächer und weisse Fe-dern) der Messwerte. Es kann anstelle von Boxplots verwendet werden.

Auf einer zweidimensionalen Fläche können die Verteilungskennzahlenfür Untergruppen einer Stichprobe, welche nach zwei Variablen klassiertist, dargestellt und direkt verglichen werden.

Als Skala wird eine Kreislinie benutzt. Die Skala beginnt ganz links, z. B. Skala auf Kreisliniemit Null. Die weiteren Werte werden im Uhrzeigersinn aufgetragen.

Mit dem Fächer-Symbol werden im Einzelnen abgebildet: Abbildung vonAnzahl, Medianund Quartilen

• Ausrichtung des Symbols: Median.

• Breite des Fächers: Quartilsabstand: Erstes bis drittes Quartil (25 %-bis 75 %-Perzentil).

• Äussere weisse Linien («Federn»): 5 %- bis 95 %-Perzentil.

• Länge der vorderen Mittellinie (weisse Linie im schwarzen Fächer):Anzahl Messwerte.

• Dicke der Mittellinie (sichtbar als Griff des Fächers): Proportional zumLogarithmus der Anzahl Messwerte.

• Hintergrundfarbe: Median (= Ausrichtung des Symbols).

• Zahlen am unteren Rand: Median sowie Anzahl Messungen.

2 Je nach Bedarf kann diese Grenze verändert werden. – Im Boxplot nach Tukey wer-den die ‹whiskers› beim ‹3. Quartil + k × IQR› bzw. beim ‹1. Quartil – k ) × IQR›gesetzt (IQR = Interquartilsabstand). Tukey schlug k = 3.0 vor; heute wird oft k =1.5 verwendet. – Tukey [EDA, 1977], zitiert in: Nagel et al. [Grafische Datenanalyse,1996]: 35 ff.

3 Englisch: «fan chart».

32 Neue Grafiken I

C.2 Beschreibung: Fächer

Bei der Interpretation einer Streuungsfächerkarte wird nach Abhängig-↑ Beispiel:Tafel 7 (S. 37) keiten der Ausrichtungen von einer oder von beiden klassierenden Va-

riablen gesucht. Dazu lässt man den Blick am Besten zeilenweise, dannspaltenweise und dann noch diagonal durch das Bild laufen und kontrol-liert, wie sich dabei die Ausrichtungen der Fächer drehen.

• Dreht sich die Ausrichtung kontinuierlich im Uhrzeigersinn, d. h. zugrösseren Messwerten hin, so korreliert die Abhängigkeit der Mess-werte positiv mit der klassierenden Variablen, die in der Bewegungs-richtung des Blickes aufgetragen ist.

• Dreht sich die Ausrichtung kontinuierlich im Gegenuhrzeigersinn, d. h.zu kleineren Messwerten hin, so korreliert die Abhängigkeit der Mess-werte negativ mit der klassierenden Variablen, die in der Bewegungs-richtung des Blickes aufgetragen ist.

Zusätzlich kann beachtet werden:

• Je geschlossener der Fächer ist (d. h.: je kleiner die Streuung ist),desto konzentrierter liegen die Messwerte um den Median der mitdem Fächersymbol abgebildeten Untergruppe.

• Je länger der weisse vordere Teil der Mittellinie ist (d. h.: je grösserdie Anzahl der Messwerte ist), desto verlässlicher sind Median undStreuung der Messwerte in der mit dem Fächersymbol abgebildetenUntergruppe.

Tafel 5: Legende zum Streuungsfächer (360°)

1535.42

Median der Werte in diesem Feld

Relative Anzahl Werte in diesem Feld

1. Quartil der Werte in diesem Feld

3. Quartil der Werte in diesem Feld

5 %−Perzentil

95 %−Perzentil

Median der Werte in diesem Feld

Anzahl Werte in diesem Feld

Minimum

Maximum

C.3 Beispiel 1: Fähigkeitseinschränkungen und Pflege

In der neurologischen Rehabilitation war unter anderem zu prüfen, ob sich Einleitungder Pflegeaufwand aufgrund der Kenntnisse der Fähigkeitseinschränkun-gen schätzen liesse. Falls dies der Fall wäre, könnte man die Messung vonFähigkeitseinschränkungen auch für ein Tarifierungssystem benutzen. Einsolches System wurde im Rahmen des TAR-Projektes entwickelt.4

In der Grafik wird die Abhängigkeit des Pflegeaufwandes von den Fä- GrafikTafel 6higkeitseinschränkungen der Patienten gezeigt. Auf der x-Achse sind die

FIM-Werte zu den kognitiven Fähigkeitseinschränkungen, auf der y-Achsedie FIM-Werte zu den praktisch-motorischen Einschränkungen gruppiert.5

In den Feldern sind nebst dem Streuungsfächer die Anzahl der Patien-tenwochen, der Medianwert des Pflegeaufwandes pro Tag und – rot – dieAnzahl der Wochen mit einem durchschnittlichen Tagesaufwand von mehrals acht Pflegestunden (gemessen mit dem Instrument LEP6) eingetragen.Die Farbe der Felder korrespondiert mit dem Median des Pflegeaufwan-des.

Links unten, ausserhalb des Grafikfeldes, ist als Legende ein kleiner Fä-cher auf grauem Hintergrund aufgezeichnet. Darauf ist die Skala ersicht-lich sowie die Streuung der gesamten Stichprobe.

Als Erstes fällt die Abnahme des Pflegeaufwandes auf den meisten Zei- Resultatelen von rechts nach links auf: Von gut fünf und mehr Stunden zu wenigerals einer Stunde. Das heisst, mit zunehmenden praktisch-motorischen Fä-higkeiten ist weniger Pflege nötig. Das entspricht der Erwartung: Je mehrder Patient selber tun kann, desto weniger muss er gepflegt werden.

Bezüglich der kognitiven Fähigkeiten ist die Sachlage komplexer. Es fal-len die drei violetten Felder mit über sechs Stunden auf. Sie liegen alleam Rand, d. h. diese Patienten sind entweder praktisch-motorisch oderkognitiv völlig unselbständig. In allen diesen Feldern ist die Streuung sehrgross.

Die insgesamt unregelmässige Verteilung weist darauf hin, dass eine Zur DiskussionSchätzung des Pflegeaufwandes mittels linearer Regression vermutlich zugrob ausfällt und eine allenfalls darauf aufbauende Vergütung deshalb alsinadäquat empfunden werden könnte.

4 TAR = Leistungsbedarfsbezogenes Tarifsystem für Rehabilitationskliniken. – Fischeret al. [TAR und Reha-PCS, 2006].

5 FIM = Functional Independence Measure. Mit dem FIM-Instrument werden 13 Itemszur praktisch-motorischen und 5 Items zu kognitiven Fähigkeitseinschränkungen vonPatienten auf einer einheitlichen 7-stufigen Skala beurteilt. Die praktisch-motorischeSkala reicht somit von 13 bis 91, die kognitive von 5 bis 35 FIM-Punkten. – Grangeret al. [FIM, 1995]. UDSmr [FIM™ instrument, 1997].

6 LEP = Leistungserfassung in der Pflege. Mit LEP werden die erbrachten Leistun-gen der Pflegefachpersonen nach einer Tätigkeitsliste mit gut 80 Einträgen täglicherhoben, mit Normzeiten gewichtet und pro Patient aufaddiert. – Vgl. Brügger et al.[LEP-Methode 2.0, 2002]; Fischer [DRG+Pflege, 2002]: 141 ff + 247 ff.

34 Neue Grafiken I

C.3 Beispiel 1: Fähigkeitseinschränkungen und Pflege

Tafel 6:Median undQuartile derLEP-Stunden proTag, nachmotorischem undkognitivem FIM(TAR97)

TAR : n = 1716 Wochen

|−− Praktisch−motorischer FIM−Wert −−>Die schwarzen Fächer zeigen die Werte der Variablen "LEP−Stunden" vom ersten biszum dritten Quartil auf einer Kreisskala von 0 bis 16. Die weissen Federn zeigen diePositionen des 5 %− und des 95 %−Perzentils. Kennzahlen: ø = Durchschnitt, s =

Standardabweichung, r2 = Varianzreduktion, m = Median, a = ø abs. Abw., r1 = Red. d.abs. Abw. v. Median. Symbolfelder: Blaue Zahlen: Anzahl und Median der Messwerte.

Rote Zahl: Anzahl Wochen mit 8 oder mehr LEP−Stunden pro Tag.

|−−

t −−

13 26 39 52 65 78 91

1508.6

130.76

1180.82

1610.66

91 3 1 1 6

28 3 1

18 2 1

ø = 3.4 s = 3.1 r2 = 70.4 % m = 2.4 a = 2.4 r1 = 53.7 %

n = 1716 1997

Z I M[SZH.091.fanchart−1033]

Datenquelle: TAR 1997

Alternative Darstellung zu: Fischer et al. [TAR und Reha-PCS, 2006]: 36.

C.4 Beispiel 2: Fähigkeitseinschränkungen und Pflege im Zei tverlauf

In der folgenden Grafik mit Daten aus einer anderen Erhebung zur Neuro- GrafikTafel 7Rehabilitation können die Abhängigkeiten des Pflegeaufwandes von den

kognitiven und praktisch-motorischen Fähigkeitseinschränkungen aus vierJahren miteinander vergleichen werden.

Zur Unterteilung in Gruppen wurde die Technik der Fachwerkgrafiken Fachwerkgrafikbenutzt. Damit werden viele Einzelgrafiken («Grafikfelder») matrixförmiganeinander gefügt und gleichzeitig auf einer einzigen Seite dargestellt.7

Im Überschriftsbalken ist links von der Anschrift jedes Grafikfeldes die RelevanzbalkenAnzahl Messwerte eintragen. Der hellblaue Balken, der von rechts herkommt, zeigt den Anteil der in diesem Grafikfeld abgebildeten Messwer-te im Verhältnis zu allen Messwerten. Die Länge des Balkens kann alsIndikator für die Relevanz der Auswertungen im jeweiligen Grafikfeld ver-wendet werden.

Die hellgrauen und die leeren Felder sowie die eher diagonal liegenden Resultatefarbigen Felder auf den Streuungsfächerkarten zeigen, dass es nicht vieleBehandlungen gab, wo die kognitive Beeinträchtigung und die praktisch-motorische Beeinträchtigung extrem gegensätzlich waren.

Auf den Streuungsfächerkarten wechselt die Farbe von rechts nach linksvon gelb zu blau und vereinzelt sogar bis violett. Dies weist auf eine deut-liche Zunahme der LEP-Stunden pro Tag bei zunehmenden praktisch-motorischen Fähigkeitseinschränkungen hin. Dem entsprechend drehtsich die Richtung des Fächers auf den meisten Zeilen kontinuierlich, wenneinzelne «Grafikzeilen» mit dem Auge durchwandert werden. Vereinzeltbewegt sich der Fächer auch mal in die Gegenrichtung.

Von oben nach unten kann man weniger Unterschiede feststellen. DieFächer zeigen in den meisten Spalten in eine jeweils ähnliche Richtung.Wenn sie sich drehen, tun sie das des Öftern nicht kontinuierlich mit demgleichen Drehsinn. Das weist darauf hin, dass der Pflegeaufwand nichtdirekt vom Ausmass der kognitiven Beeinträchtigungen gemessen in FIM-Punkten abhängig ist.

Für den Überblick ist die Grafik gut geeignet. Für eine detailliertere Ana- Zur Diskussionlyse sollte sie mit Zahlen versehen und auf einem grösseren Blatt ausge-druckt werden.

Die schwarzen Kleckse der übermässig breiten Fächer auf farbigemGrund regen an, sich die Daten der betreffenden Patienten näher an-zuschauen. War der Pflegeaufwand hier wirklich so unterschiedlich?Warum? Oder liegt ein Datenfehler vor?

7 Englisch: Trellis displays. – Vgl. Becker et al. [Trellis, 1996]; Becker/Cleveland[Trellis/Man, 1996]; Cleveland [Visualizing, 1993] und http:// cm.bell-labs.com / cm/ ms / departments / sia / project / trellis /. – Für Fachwerkgrafiken gibt es im R-Projekt das Paket ‹lattice›.

36 Neue Grafiken I

C.4 Beispiel 2: Fähigkeitseinschränkungen und Pflege im Zeitverlauf

Tafel 7: Median und Quartile der LEP-Stunden pro Tag, nach motorischem und kognitivem FIM(Test-Daten)

|−− Praktisch−motorischer FIM−Wert −−>Die schwarzen Fächer zeigen die Werte der Variablen "LEP−Stunden" vom ersten bis zum dritten Quartil auf einer

Kreisskala von 0 bis 16. Kennzahlen: ø = Durchschnitt, s = Standardabweichung, m = Median, a = ø abs. Abw.

|−−

t −−

13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93

ø = 3.3 s = 2.2 m = 2.6 a = 1.7

n = 2189 JAHR 1

37 ø = 3.2 s = 2.1 m = 2.5 a = 1.7n = 2560 JAHR 2

37 ø = 2.9 s = 2.2 m = 2.2 a = 1.7n = 2031 JAHR 3

37 ø = 2.9 s = 2.1 m = 2.2 a = 1.6n = 2307 JAHR 4

Z I M[SZH.091.fanchart−1033]

Datenquelle: Test−Daten SZH

C.5 Beispiel 3: Mathematikprüfungen und sozioökonomische r Status

Das für das folgende Beispiel verwendete Datenset stammt aus dem R- DatenPaket «nlme».8 Es beinhaltet Resultate zu 7185 Mathematikprüfungen.Die StudentInnen sind kategorisiert nach Geschlecht und Zugehörigkeitzu einer ethnischen Minorität.9

In der Grafik wurden die Prüfungsresultate in Abhängigkeit vom sozio- GrafikTafel 8ökonomischen Status der StudentInnen (x-Achse) und vom durchschnittli-

chen sozioökonomischen Status der Schule (y-Achse) abgebildet. In denvier Hauptgrafikfeldern werden StudentInnen nach ihrem Geschlecht undnach der Zugehörigkeit zu einer Minorität unterschieden.

Als Erstes fallen die weit geöffneten Fächer auf, d. h. die grossen Streu- Resultateungen der Prüfungsresultate in praktisch allen Untergruppen. Der Ver-gleich der vier Hauptgrafikfelder zeigt grundsätzlich bessere Prüfungsre-sultate bei StudentInnen, die nicht einer Minorität angehören, sowie leichtbessere Resultate der Männer im Vergleich zu den Frauen.

Innerhalb der Felder ist festzustellen, dass sowohl der sozioökonomi-sche Status der StudentInnen als auch – etwas geringer – der durch-schnittliche sozioökonomische Status der Schule positiv mit den Prüfungs-resultaten korrelieren. – Bei der Detailbetrachtung zeigt sich, dass es auchMänner und Frauen aus Minoritäten gibt, die sehr gute Resultate habenkönnen. (Vgl. innerhalb der rechten Grafikfelder die blau gefärbten Unter-gruppenfelder rechts oben mit bis weit nach unten geöffneten Fächern.)

Es stellt sich die Frage, ob zur Abbildung des durchschnittlichen sozio- Zur Diskussionökonomischen Status der Schule die gleiche Skaleneinteilung verwendetwerden sollte wie für die Abbildung des sozioökonomischen Status derStudentInnen. Da der Status der Schule als Durchschnitt aus den Wer-ten der StudentInnen berechnet wird, streut er weniger: Der Interquartils-bereich liegt zwischen -0.32 und 0.33 beim durchschnittlichen Status derSchulen und zwischen -0.54 und 0.60 beim Status der StudentInnen. Diebeiden Variablen weisen also eine unterschiedliche Verteilung auf. Des-halb können auch die Skaleneinteilungen unterschiedlich gewählt werden.

Je nach Wahl der Skaleneinteilungen verändern sich allerdings dieStreuungsfächer. Die Wahl erfolgte so, dass die Bewegungen der Streu-ungsfächer sichtbar wurden, ohne dass die Anzahl StudentInnen in denUntergruppen zu klein wurde.

Diese Grafik zeigt anschaulich, wie der mittlere Wert z. T. einer gros- Konklusionsen Haupttendenz folgt, obwohl die Werte in den einzelnen Untergruppenstark streuen und man deshalb über eine mögliche Korrelation ins Zwei-feln geraten könnte. (Besonders gut ist dies in den unteren beiden Feldernsichtbar.)

8 http:// www.r-project.org /: «Linear and Nonlinear Mixed Effects» von Pinheiro J et al.9 Im amerikanischen Original: «member of a minority racial group».

38 Neue Grafiken I

C.5 Beispiel 3: Mathematikprüfungen und sozioökonomischer Status

Tafel 8: 7185 Mathematikprüfungen: Resultate nach Geschlecht und Zugehörigkeit zu einerMinorität

n = 7185

|−− Sozioökonomischer Status der StudentInnen −−>

Die schwarzen Fächer zeigen die Werte der Variablen "Mathematik−Resultat"vom ersten bis zum dritten Quartil auf einer Kreisskala von 0 bis 28.

Kennzahlen: ø = Durchschnitt, s = Standardabweichung, m = Median, a = ø abs. Abw.Fa

|−−

−1.25

−1.00

−0.75

−0.50

−0.25

ø = 13.1 s = 6.5 m = 13.5 a = 5.4

n = 2730 Frauen −−

ø = 9.1 s = 6.3 m = 8.5 a = 5.2

n = 1065 Frauen aus Minorität

−1.25

−1.00

−0.75

−0.50

−0.25

1.00ø = 14.8 s = 6.7 m = 15.7 a = 5.6

n = 2481 Männer −−ø = 10.5 s = 6.8 m = 10.2 a = 5.7

n = 909 Männer aus Minorität

Z I M[example.fanchart.mathachieve−1034]

Datenquelle: R−Paket «nlme»

C.6 Beispiel 4: Krankenkassenprämien

In der Schweiz geben die Krankenversicherer («Krankenkassen») jedes EinleitungJahr im Herbst die Krankenkassenprämien für das Folgejahr bekannt.10

Die Krankenpflegeversicherung ist seit 1996 für alle Bewohner des Lan-des obligatorisch.11 Jeder versichert sich selbst bei einer Krankenkasseseiner Wahl. Die obligatorisch zu versichernden Leistungen beinhalten dieambulante und stationäre medizinische Behandlung im Wohnkanton.

Die Krankenversicherer befinden sich in einer Konkurrenzsituation undsind frei in der Festlegung der Prämien, solange sie eine gesunde wirt-schaftliche Lage ihrer Kasse sicherstellen. Die Prämien für Erwachsenedürfen nicht nach Altersklassen und Geschlecht, wohl aber nach Kantonund innerhalb mancher Kantone nach bis zu drei vom Bund vordefinierten«Prämienregionen» differenziert werden. Es ist erlaubt, für ‹junge Erwach-sene› und für ‹Kinder› Rabatte zu gewähren.

In der Grafik sieht man die Streuung der Prämien für grundversicherte GrafikTafel 9Erwachsene, welche die in den einzelnen Kantonen tätigen Krankenversi-

cherer pro Region anbieten.Die Anordnung der Felder ist «pseudogeografisch», d. h. die Kantone

und deren Prämienregionen sind in ähnlichen Gegenden zu finden wieauf einer Schweizer Karte. Zum Beispiel ist Genf («GE») ganz links un-ten positioniert und die beiden Tessiner Regionen («TI1» und «TI2») sindunten rechts von der Mitte zu finden.

Aus der Streuungsfächerkarte ist zunächst ersichtlich, dass die Prämien Resultatein der französischen Schweiz (eher links im Diagramm), im Tessin und inden städtischen Regionen (Basel Stadt: «BS», Zürich Region 1: «ZH1»,usw.) tendenziell höher sind als in den ländlicheren Kantonen. Die Streu-ungen der Prämien sind erstaunlich gross. Als Ausnahme fällt Genf (ganzlinks unten) auf, wo die mittleren 50 % der Prämienangebote praktischgleich sind. (Der schwarze Fächer ist ganz geschlossen.)

Infolge der pseudogeografischen Anordnung haben die x- und y-Skalen Zur Diskussionhier eher nominalen als ordinalen Charakter. Deshalb macht eine zeilen-oder spaltenweise Betrachtung wenig Sinn. Aus etwas Distanz kann manaber trotzdem die höheren Prämien im Westen des Landes (d. h. eher linksauf der Streuungsfächerkarte) erkennen.

10 Vgl. http:// www.praemien.admin.ch /.11 Art. 3 KVG.

40 Neue Grafiken I

C.6 Beispiel 4: Krankenkassenprämien

Tafel 9: CH: Krankenkassenprämienangebote

Farbstufen für: OKP−Prämienangebote 26+

D Differenzdiagramme

Dreiecke im Wind (2005)

Ausschnitt aus Differenzdiagramm mit Fallanteilen zur APDRG-Hauptkate- ↑ Tafel 11 (S. 49)

gorie 08.

D.1 Motivation

Bei der Darstellung verschiedener Zahlenreihen steht man oft vor der Fra-Absolute und/oderrelative Werte? ge, ob man die absoluten Werte, die absoluten Differenzen oder die pro-

zentualen Differenzen anzeigen soll. Wenn es ums Vergleichen geht, sindDifferenzen die Zielgrösse. Zeigt man aber nur die Differenzen, fehlen ei-nem Bezugswerte.

Deshalb stellt man gerne Balken nebeneinander: Dann sieht man dieBalkendiagramme?absoluten Werte, und aus den unterschiedlichen Längen der Balken las-sen sich die Differenzen ablesen. Ausserdem gewinnt man eine Idee vonder prozentualen Differenz, wenn man die Differenz zweier Balken mit derGesamtlänge des einen dieser Balken vergleicht.

Wenn man der Differenz eine grössere Wichtigkeit geben will, könntePositive undnegativeDifferenzen↑ Beispiel mit

Differenzbalken:Tafel 3 (S. 25)

man versucht sein, nur einen einzigen Balken zu verwenden und damitdie Differenz abzubilden. Positive und negative Differenzen könnte manunterschiedlich färben. Bei diesem Vorgehen sieht man nun zwar die Dif-ferenzen gut; man hat aber Mühe, wenn man die absoluten Werte denBalkenenden zuordnen will, da man erst überlegen muss, zu welchem En-de welche Werte nun gehören.

Wenn man anstelle solcher Differenzbalken Dreiecke verwendet, wer-Dreiecke sindausgerichtet den auch die absoluten Werte wieder besser sichtbar: Man kann die Ba-

sen der Dreiecke oder die Spitzen verfolgen.Mit aneinander gereihten Dreiecken benötigt man weniger bedruckte

Fläche als mit nebeneinander gestellten Balken. Dies macht die Grafikendeutlich übersichtlicher.

D.2 Beschreibung: Dreiecke

Da ein Dreieck eine Ausrichtung hat, können damit zwei unterschiedlicheBasis und SpitzeTafel 10 Werte auf einer gemeinsamen Skala angezeigt werden: Ein Wert mit der

Basis der Dreiecks und ein Wert mit der Spitze des Dreiecks.Die Fläche, welche das Dreieck aufspannt, ist proportional zur DifferenzFläche

zwischen den beiden Werten. Je mehr Farbe erscheint, desto grösser istdie Differenz.

Tafel 10:Legende zumSymbol für Diffe-renzdiagramme

0 50(Messeinheiten)

Vergleichswert

Positive und negative Unterschiede können durch unterschiedliche Fär- Farbenbungen angezeigt werden. Dank den Strassenampeln gut verständlich istz. B. die Benutzung der Farben Grün und Rot.

D.3 Beispiel 1: Vergleich von Fallanteilen in Patientenkat egorien

Für die folgende Grafik lautete die Arbeitsfrage: Wie kann man die Beson- Einleitungderheiten des Patientenspektrums eines Krankenhauses im Vergleich zuden Patientenspektren anderer Krankenhäuser des gleichen Typs darstel-len?1

Als Datenbasis wurden vom Krankenhaus, das zu analysieren war, und DatenTafel 11von allen 27 Vergleichskrankenhäusern Falldatensätze mit DRG2-Codes

benötigt. Die DRG-Codes wurden nach Hauptkategorien («01» = Nerven,«02» = Augen, . . .), Subkateogrien («M» = medizinisch, «C» = chirurgisch)und Kostengewichtsklassen («1» bis «4») kategorisiert.

Für die Grafik wurden für jede Kategorie die Differenz zwischen dem GrafikFallanteil des zu untersuchenden Krankenhauses und dem Durchschnittaller Krankenhäuser in der Vergleichsgruppe berechnet. Sie wurde mit ei-nem Dreieck abgebildet. Negative Abweichungen vom Durchschnitt wur-den mit dunkleren, positive mit klaren Farben markiert. Medizinische Be-handlungen wurden grün, chirurgische goldfarben gefärbt.

Die Grafik erlaubt es, auf den ersten Blick negative und positive Abwei- Resultatechungen in medizinischen und chirurgischen Kostengewichtsklassen derverschiedenen DRG-Hauptkategorien zu erkennen.

Besonders auffällig sind die überdurchschnittlichen Fallanteile bei denmedizinischen Behandlungen am Bewegungsapparat («08») sowie beiden chirurgischen Eingriffen am Herz und am Kreislaufsystem («05»). Beiden medizinischen Behandlungen an Nieren und Harnwegen («11») sindnur DRGs in der zweitgünstigsten Kostengewichtsklasse («M2») über-durchschnittlich vertreten; Behandlungen mit DRGs in den übrigen Kos-tengewichtsklassen entsprechen in etwa dem Durchschnitt.

Bereiche ohne Behandlungen sind an Dreiecksspitzen, die an den lin-ken Grafikfeldrand stossen, oder an leeren Zahlenspalten zu erkennen.Dies gilt z. B. für die Augen («02»), für Geburten («14») und Neugeborene(«15»).

1 Das Beispiel stammt aus: Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 45.2 DRG = Diagnosis Related Groups. Mit DRG-Systemen können Patientenspekt-

ren akutstationärer Behandlungen beschrieben werden. – Vgl. Fetter et al. [DRGs,1991]; Fischer [PCS, 1997]. Fischer [DRG-Familie, 2008].

48 Neue Grafiken I

D.3 Beispiel 1: Vergleich von Fallanteilen in Patientenkategorien

Tafel 11: Krankenhaus H217: Fallanteile nach APDRG-Subkategorien undKostengewichtsklassen im Vergleich zu allen Krankenhäusern des Typs «Zentrumsversorgung»

Dreiecke und Zahlen: Fallanteile (in Promillen) von H217.Basis der Dreiecke: Durchschnitt aller 27 Spitäler des Typs

K11 (Zentrumsversorgung).

C1C2C3C4M1M2M3M4

282916

501 / Nerven 02 / Augen

03 / Hals Nase Ohren

C1C2C3C4M1M2M3M4

117151511

04 / Atmung

C1C2C3C4M1M2M3M4

624403125

05 / Herz Kreislauf

91515181413

06 / Verdauung

5121643

07 / Leber Galle Pankreas

C1C2C3C4M1M2M3M4

37276740

08 / Bewegungsapparat

C1C2C3C4M1M2M3M4

09 / Haut

611842

10 / Drüsen Stoffwechsel

11 / Nieren Harnwege

C1C2C3C4M1M2M3M4

12 / Mann

C1C2C3C4M1M2M3M4

13 / Frau 14 / Geburten 15 / Neugeborene

C1C2C3C4M1M2M3M4

16 / Blut

C1C2C3C4M1M2M3M4

817 / Lymphome Leukämien+

319 / Psyche

220 / Alkohol Drogen

C1C2C3C4M1M2M3M4

23 / Diverse Faktoren

0 20 40 60

C1C2C3C4M1M2M3M4

81 / Infektionen HIV

0 20 40 60

782 / Trauma Polytrauma

0 20 40 60

91 / Tracheost. Transplant.

0 20 40 60

C1C2C3C4M1M2M3M4

99 / Nicht klassifizierbar

Z I M − Test . 31[BFSMS.042.H.diffplot.nF:CWcat−2002−053Q]

Datenquelle: Bundesamt für Statistik: Medizinische Statistik der Krankenhäuser

Quelle: Nach Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 45.

D.4 Beispiel 2: Gerstenernten 1931 und 1932

Daten zu Gerstenernten von 1931 und 1932 in Minnesota wurden seit EinleitungTafel 121934 von amerikanischen Statistikern wiederholt ausgewertet. Cleveland

machte in seinem Buch von 1993 auf eine «Datenanomalie» der Da-ten aus ‹Morris› aufmerksam. Anschliessend belegte er seine Vermutung,dass die Daten zu den beiden Jahren von ‹Morris› vertauscht seien u. a.auch anhand von grafischen Auswertungen.3 Interessant ist, dass Cleve-land offenbar der erste war, dem die Unterschiede auffielen und der sienicht einfach als gegeben hinnahm.

Die hier verwendeten Daten bestehen aus Ertragsmengen für die Jahre Daten1931 und 1932 von sechs Anbauorten (von ‹Waseca› bis ‹Rapids›) undzehn Gerstensorten (von ‹Trebi› bis ‹No. 475›).4 Der Datensatz umfasst120 Messungen (= zwei Jahre × sechs Orte × zehn Sorten).

Zur Darstellung wählte ich ein Differenzdiagramm. Anbauorte und Gers-tensorten sind geordnet nach den Erträgen von 1931. Die Erträge von1931 werden mit der Basis der Dreiecke abgebildet, die Erträge von 1932mit der Spitze. Die Länge der Dreiecke entspricht dem Ertragsunterschied.Verminderte Erträge sind rot, erhöhte Erträge grün eingefärbt.

Es fällt auf den ersten Blick auf, dass die Daten aus ‹Morris› im Unter- Resultateschied allen den übrigen Anbauorten durchgehend erhöhte Erträge auf-weisen. Es zeigt sich weiter, dass in ‹Duluth› die kleinsten Ertragseinbus-sen zu verzeichnen waren. Allerdings war hier die Ernte von 1931 bereitsrelativ niedrig, d. h. insbesondere niedriger als in ‹Waseca› und in ‹Crook-ston›, aber ähnlich hoch wie in ‹Rapids›.

Um die 120 Messungen überblicken zu können, sind die bereits von Zur DiskussionCleveland benutzten Fachwerkgrafiken5 äusserst nützlich.

Eine andere Möglichkeit, die beiden Ernten in einem einzigen Grafik- ↑ Tafel 15 (S. 55),2. Spaltefeld darzustellen, ist die Verwendung von graphischen Zeichen wie «o»

und «+». Diese Darstellungsart benutzte Cleveland. Wenn man genau hin-schaut, ist auch in solchen Darstellungen ersichtlich, dass die Zeichen für‹Morris› vertauscht sind. Im Differenzdiagramm jedoch wird die Besonder-heit von ‹Morris› durch die unterschiedliche Einfärbung und Ausrichtungder Dreiecke bei Abnahmen und Zunahmen unmittelbar augenfällig.

3 Vgl. Cleveland [Visualizing, 1993]: 328 ff, insbesondere Tafel 6.20 (S. 330) und 338 f.4 Es wurden die Daten verwendet, die dem R-Paket ‹lattice› beigegeben sind. Der

angegebene Ertrag ist der durchschnittliche Ertrag von jeweils drei zufällig ausge-wählten Anbaufeldern je Anbauort. Gemessen wurde er in Scheffel (US-‹bushels› =35 Liter × ca. 30 kg ≈ 1050 kg) pro Morgen (‹acre› = 40 Aren oder 4047 m2). EineEinheit entspricht also etwa einem Ertrag von ¼ Kilogramm pro Quadratmeter.

5 In Fachwerkgrafiken («trellis displays») werden viele Grafiken gleichzeitig auf ei-ner einzigen Seite dargestellt. – Vgl. Becker et al. [Trellis, 1996]; Becker/Cleveland[Trellis/Man, 1996]; Cleveland [Visualizing, 1993] und http:// cm.bell-labs.com / cm /ms / departments / sia / project / trellis /. – Für Fachwerkgrafiken gibt es im R-Projektdas Paket ‹lattice›.

50 Neue Grafiken I

Tafel 12:Gerstenernten inMinnesota 1931und 1932 (Diffe-renzdiagramm)

Dreieck: Basis: Ertrag 1931. Spitze: Ertrag 1932.

No. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi

−13−5

−39−20

0 20 40 60

RapidsNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi

+15+17

+52+55

MorrisNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi

−11−6

−32−20

DuluthNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi

−17−11

−39−30

UniversityNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi

−11−18

−25−37

CrookstonNo. 475SvansotaManchuriaVelvetPeatlandGlabronNo. 462No. 457WisconsinTrebi

−16−21

−27−32

Diff.%Waseca

Z I M[example.diffplot.barley−1034]

Datenquelle: R−Paket «lattice»

D.5 Beschreibung: Punktbalken

Um absolute Werte und deren Differenz darzustellen, können anstelle vonDreiecken auch «Punktbalken» verwendet werden.

Punktbalken6 sind auf einer Achse frei positionierbare Balken, deren Tafel 13

Länge einer Differenz entspricht. Eines der Balkenenden ist mit einemPunkt markiert. Damit werden ein Wert und ein zugehöriger Vergleichs-wert unterscheidbar. Zur Darstellung von negativen und positiven Abwei-chungen kann der Balken unterschiedlich eingefärbt werden.

WertVergleichswert

Tafel 13:Legende zumSymbol für Punkt-balkendiagramme

Auch bei der Abbildung der Daten zu den Gerstenernten mit Punktbalken Zur DiskussionTafel 14

↑ Daten: S. 50sieht man die Unterschiede zwischen den Ernten der beiden Jahre gut.

Durch die wegfallende Pfeilform des Dreiecks, wäre die Ausrichtung derDifferenz ein wenig schlechter erkennbar, wenn sie nicht durch die unter-schiedliche Einfärbung deutlich angezeigt würde.

Dafür ist der Endwert mit dem Punkt sehr deutlich markiert. Dies ermög-licht es, diese Werte über die ganze Erhebung besser zu überblicken.

6 Englisch: «dot bar». – Fischer [Grafiken zur PCS-Beurteilung, 2008]: 44.

52 Neue Grafiken I

Tafel 14:Gerstenernten inMinnesota 1931und 1932 (Punkt-balkendiagramm)

Balkenanfang: Ertrag 1931. Punkt: Ertrag 1932.

0 20 40 60

Waseca

Z I M[example.dotbar.barley−1034]

D.7 Vergleich von vier Darstellungsweisen

In der folgenden Grafik werden die Gerstenernte-Daten spaltenweise nach Tafel 15

vier unterschiedlichen Darstellungsweisen präsentiert:

1. Balkendiagramm: Durch die Überlagerung der Balken der Ernten ausden beiden Beobachtungsjahren wird gut sichtbar, ob es eine Abnah-me oder eine Zunahme gab.

2. Punktediagramm: Hier kann man den Verlauf der einzelnen Erntenüber alle Sorten und Anbauorte besser verfolgen als in den ande-ren Darstellungsweisen. Dagegen braucht es mehr Beobachtungs-aufwand, um die Unterschiede klar zu erkennen.

3. Differenzdiagramm mit Dreiecken: Die Unterschiede werden hier be-sonders augenfällig. Auch der Verlauf zu immer höheren Ernten inden im oberen Bereich abgebildeten Anbaugebieten ist sichtbar.

4. Differenzdiagramm als Punktbalkendiagramm: Die Unterschiede sindgut sichtbar. Die Ausprägung der Ernte vom 1932 (beim Punkt) überalle Anbaugebiete und Sorten ist wie im Punktediagramm gut erkenn-bar.

54 Neue Grafiken I

D.7 Vergleich von vier Darstellungsweisen

Tafel 15: Gerstenernten in Minnesota 1931 und 1932 (vier Darstellungsweisen)

|−− Ertrag −−>

No. 475Svansota

ManchuriaVelvet

PeatlandGlabronNo. 462No. 457

WisconsinTrebi

−39−20

0 10 20 30 40 50 60

−13−5

0 20 40 60

−13−5

0 20 40 60

−13−5

0 20 40 60

RapidsNo. 475

SvansotaManchuria

VelvetPeatlandGlabronNo. 462No. 457

WisconsinTrebi

+52+55

0 10 20 30 40 50 60

+15+17

0 20 40 60

+15+17

0 20 40 60

+15+17

0 20 40 60

MorrisNo. 475

SvansotaManchuria

WisconsinTrebi

−32−20

0 10 20 30 40 50 60

−11−6

0 20 40 60

−11−6

0 20 40 60

−11−6

0 20 40 60

DuluthNo. 475

SvansotaManchuria

WisconsinTrebi

−39−30

0 10 20 30 40 50 60

−17−11

0 20 40 60

−17−11

0 20 40 60

−17−11

0 20 40 60

UniversityNo. 475

SvansotaManchuria

WisconsinTrebi

−25−37

0 10 20 30 40 50 60

−11−18

0 20 40 60

−11−18

0 20 40 60

−11−18

0 20 40 60

CrookstonNo. 475

SvansotaManchuria

WisconsinTrebi

−27−32

Diff.%

0 10 20 30 40 50 60

−16−21

0 20 40 60

−16−21

0 20 40 60

−16−21

0 20 40 60

Waseca

D.8 Beschreibung: Dreieck mit Balken

Zur Anzeige einer weiteren Differenz kann an die Basis des Dreiecks ein Tafel 16

Balken angefügt werden. Er kann in die gleiche oder in die dem Drei-eck entgegengesetzte Richtung blicken. Auch wenn er hinter dem Dreieckliegt, bleibt er sichtbar, denn das Dreieck verjüngt sich bis zur Spitze, derBalken aber behält immer die gleiche Breite. Wenn der Balken allerdingssehr klein im Verhältnis zum Dreieck ist, verschwindet er trotzdem mehroder weniger. Abhilfe geschaffen werden kann, indem die vordere Balken- ↑ Beispiel:

Tafel 17 (S. 57)kante über dem Dreieck gezeichnet wird.

(Messeinheiten)

Zweiter Wert

Vergleichswert Tafel 16:Legende zumSymbol fürDoppeldifferenz-diagramme

Um die Gerstenernten etwas besser beurteilen zu können, wurde auch Tafel 17

noch die durchschnittliche Ernte pro Sorte berechnet und angezeigt.Dazu wurde ein Doppeldifferenzdiagramm verwendet: Das Dreieck zeigt Grafik

wie bereits früher den Unterschied von der Ernte 1931 zur Ernte 1932.Der dahinterliegende, heller gefärbte Balken zeigt den Unterschied von derErnte 1931 zur durchschnittlichen Ernte der betreffenden Sorte in diesemJahr.

Man sieht, dass in ‹Waseca› die Ernte von 1931 bei allen Sorten über- Resultatedurchschnittlich war (lauter hellgrüne Balken). Die Ernte von 1932 wardeutlich niedriger als die Ernte von 1931 (rote Dreiecke), aber immer nochetwas höher als die durchschnittliche Ernte pro Sorte von 1931. (Fast allehellgrünen Balken sind länger als die roten Dreiecke.)

In ‹Duluth› und in ‹Rapids› waren die Ernten bereits 1931 sehr unter-durchschnittlich. (Bis auf einen sind alle Balken hellrot.)

56 Neue Grafiken I

Tafel 17:Gerstenernten inMinnesota 1931und 1932 (Doppel-differenzdiagramm)

Dreieck: Basis: Ertrag 1931. Spitze: Ertrag 1932. Balken: ø 1931 pro Sorte.

−13−5

−39−20

0 20 40 60

+15+17

+52+55

−11−6

−32−20

−17−11

−39−30

−11−18

−25−37

−16−21

−27−32

Diff.%

ø1931Waseca

D.10 Beschreibung: Kombination von zwei Dreiecken

Wenn zwei Differenzen zu unterschiedlichen Ausgangswerten angezeigt Zwei Dreieckeauf einer Zeile

Tafel 18werden müssen, können zwei Dreiecke auf der gleichen Zeile miteinanderkombiniert werden.

Wenn es nicht zu viele Überlagerungen gibt, kann dies auch mit mehrals zwei Dreiecken gemacht werden.7 Zur Unterscheidung der beiden Dif-ferenzen kann die Farbintensität verändert werden. Positive und negativeDifferenzen werden mit kontrastierenden Farben versehen.

0 50(Messeinheiten)

Erster WertErster Vergleichswert

Zweiter Wert

Zweiter Vergleichswert

Tafel 18:Legende zumSymbol für Diffe-renzdiagrammemit zwei Dreiecken

Im vorangegangenen Beispiel wurden die Ernten von 1932 mit jenen von Einleitung1931 und diese mit den durchschnittlichen Ernten von 1931 pro Gersten-sorte verglichen. Noch interessanter als diese Vergleiche ist die Gegen-überstellung der Vergleiche der Ernten von 1931 und 1932 mit den jewei-ligen Durchschnittserträgen pro Sorte.

Zur Darstellung dieser vier Werte wurden zwei Dreiecke verwendet. Die- GrafikTafel 19se zeigen die Differenzen zwischen Ertrag und durchschnittlichem Ertrag

in den beiden Jahren an. Aus der unterschiedlichen Positionierung derbeiden Dreiecke wird zusätzlich die Differenz zwischen den Erträgen von1931 und 1932 ersichtlich.

Es zeigt sich, dass in den vielen Anbauorten die Abweichungen vom Resultatdurchschnittlichen Ertrag zwar unterschiedlich hoch waren, aber meist indie gleiche Richtung gingen. In ‹Waseca› beispielsweise waren die Erträgebei allen Sorten in beiden Jahren überdurchschnittlich, in ‹Rapids› und‹Duluth› hingegen waren die Erträge in beiden Jahren bei fast allen Sortenunterdurchschnittlich. Nicht der Fall war dies in ‹Morris› und ‹Crookston›sowie bei einzelnen Sorten in der ‹University Farm›.

7 Ein Beispiel für drei Kennzahlen, die sich gut mit drei nebeneinander gestellten Drei-ecken abbilden lassen, sind die durchgängig in aufsteigender Reihefolge definier-ten DRG-Kennzahlen ‹untere Grenzverweildauer›, ‹mittlere Verweildauer›, ‹obereGrenzverweildauer›. – Vgl. Fischer [Grafiken zur PCS-Beurteilung, 2008]: 40 + 90 f.

58 Neue Grafiken I

Tafel 19:Gerstenernten inMinnesota 1931und 1932 (zwei Dif-ferenzdiagramme)

Dreieck im Vordergrund: Spitze: Ertrag 1932, Basis: ø 1932 pro Sorte.Dreieck im Hintergrund: Spitze: Ertrag 1931, Basis: ø 1931 pro Sorte.

0 20 40 60

ø1932

ø1931Waseca

Wenn die Werte von ‹Morris› – wie von Cleveland vorgeschlagen8 – Korrektur der Wertevon ‹Morris›

Tafel 20durch Umtauschen korrigiert werden, verändern sich nicht nur die Wertevon ‹Morris› selbst, sondern auch die Durchschnittswerte pro Gerstensor-te und damit alle Differenzen.

Es gibt immer noch drei Anbauorte mit gleichartigen Differenzen: ‹Wa-seca› mit lauter positiven, ‹Duluth› und ‹Rapids› mit fast lauter negativenDifferenzen.

Mit den korrigierten Werten ist ‹Morris› ins mittlere Feld mit uneinheitli-cher Ausrichtung gerutscht. Auffällig sind hier nun die Sorten ‹Wisconsin›,‹No. 475› und ‹Velvet›, die von überdurchschnittlichen Erträgen im Jahr1931 auf deutlich unterdurchschnittliche Erträge im Jahr 1932 fielen.

Ins Auge springen auch die unerwarteten überdurchschnittlichen Auffälligkeit von‹Velvet› in ‹Rapids›1932er-Erträge von ‹Peatland› in ‹Duluth› und von ‹Velvet› in ‹Rapids›.

Die Auffälligkeit von ‹Velvet› in ‹Rapids› wurde in der Literatur bereits dis-kutiert;9 von ‹Peatland› in ‹Duluth› berichtet Cleveland aber nichts.

Wenn man es sich genauer überlegt, ist der Fall von ‹Velvet› in ‹Rapids›aus der Sicht dieser Grafik deshalb von Interesse, weil sich beim Vertau-schen der Jahre – d. h. der Spitzen der Dreiecke – zwei gleich ausgerichte-te, rote Dreiecke ergäben, die mit den restlichen Dreiecken harmonischerkorrespondieren würden. Das wäre bei ‹Peatland› in ‹Duluth› nicht so; diebeiden Dreiecke würden sogar noch grösser. Die Auffälligkeit besteht indiesem Fall darin, dass hier die einzige positive (grüne) Differenz im gan-zen Grafikfeld auftritt.

Als Datendetektiv kann man weitere Fälle nach dem Muster von ‹Velvet›in ‹Rapids› suchen: Wo treten Überlagerungen von Dreiecken mit unter-schiedlicher Ausrichtung auf? Auf diese Weise entdeckt man noch ‹No.475› auf der ‹University Farm›.

Die Darstellung von zwei nebeneinander gestellten Dreiecken ermög- Konklusionlicht die Suche nach Beziehungsmustern zwischen den beiden Dreieckenund löst so Fragen aus, die weitere Überlegungen und Entdeckungen mitsich bringen. Damit wird ein wichtiges Ziel der Datenvisualisierung erfüllt.

8 Cleveland [Visualizing, 1993]: 329 ff.9 Vgl. Cleveland [Visualizing, 1993]: 332+340.

60 Neue Grafiken I

Tafel 20:Gerstenernten inMinnesota 1931und 1932, korrigiert(zwei Differenzdia-gramme)

ManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin

0 20 40 60

RapidsManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin

44Duluth

44University

44Morris_corrected

44Crookston

ø1932

ø1931Waseca

Durch Umstellen der Grafik von Grafikfeldern pro Anbauort auf Grafik- Umstellung zuAuswertungenpro Gerstensorte

Tafel 21

felder pro Gerstensorte können die Abweichungen von den durchschnittli-chen Erträgen sehr augenfällig dargestellt werden.

Die grosse Bandbreite der Differenzen bei allen Sorten führt zur Vermu-tung, dass die Mehr- und Mindererträge stärker von den Anbauorten alsvon der Sorte abhängig sind. Dazu wurde eine weitere Grafik erstellt.

62 Neue Grafiken I

Tafel 21:Gerstenernten inMinnesota 1931und 1932, korrigiert(zwei Differenzdia-gramme), nachSorten

RapidsDuluthUniversityMorris_correctedCrookstonWaseca

0 20 40 60

ManchuriaRapidsDuluthUniversityMorris_correctedCrookstonWaseca

35No. 475

36Svansota

37Velvet

38Glabron

39Peatland

42No. 462

43No. 457

43Trebi

ø1932

ø1931Wisconsin

In dieser Grafik wurden anstelle der Abweichungen von den Durch- GrafikTafel 22schnitten pro Gerstensorte (und Jahr) die Abweichungen von den Durch-

schnitten pro Anbauort (und Jahr) dargestellt.Man sieht hier – im Unterschied zur vorangangenen Darstellung –, dass Resultate

die Dreiecke im Durchschnitt kürzer und damit die Abweichungen vomdurchschnittlichen Ertrag des Anbauortes und Jahres kleiner sind. Dieszeigt, dass – wie oben bereits vermutet – die Mehr- und Mindererträgestärker von den Anbauorten als von der Sorte abhängig sind.

Diese Sicht kann rechnerisch belegt werden: Die Reduktion der abso- ↑ r1: S. 102

luten Abweichungen vom Median (r1) beträgt bei der Gruppierung nachAnbauorten und Jahren 52 %, bei der Gruppierung nach Gerstensortenund Jahren hingegen nur 4 %.10

Die weiter oben vermerkte Auffälligkeit von ‹Velvet› in ‹Rapids› mit den ↑ S. 60

überlagerten gegenläufigen Dreiecken ist auch hier sichtbar, ebenso derFall von ‹No. 475› auf der ‹University Farm›.

10 Die Varianzreduktion (r2) beträgt bei der Gruppierung nach Anbauorten und Jahren73 %, bei der Gruppierung nach Gerstensorten und Jahren hingegen nur 1 %.

64 Neue Grafiken I

Tafel 22:Gerstenernten inMinnesota 1931und 1932, korrigiert(zwei Differenzdia-gramme), nachAnbauorten

Dreieck im Vordergrund: Spitze: Ertrag 1932, Basis: ø 1932 pro Anbauort.Dreieck im Hintergrund: Spitze: Ertrag 1931, Basis: ø 1931 pro Anbauort.

0 20 40 60

RapidsManchuriaNo. 475SvansotaVelvetGlabronPeatlandNo. 462No. 457TrebiWisconsin

30Duluth

36University

42Morris_corrected

44Crookston

ø1932

ø1931Waseca

Um noch auf eine andere Weise zu sehen, ob die Mehr- und Minder- StrömungsbildTafel 23erträge stärker vom Anbauort oder von der Sorte abhängig sind, wurde

zuguterletzt noch ein Strömungsbild erstellt.Als Erstes fallen die grundsätzlich dunkleren Farben im Grafikfeld für Resultate

1931 auf. Sie zeigen die insgesamt höheren Ernten im Jahr 1931 an. ImWeiteren ist eine Ertragssteigerung von ‹Rapids› bis ‹Waseca› zu beoach-ten (mit Farben, die von gelb/grün zu blau/violett wechseln).

Bei näherem Hinschauen zeigt sich, dass die Schwankungen bei ver-tikalem Vergleich der Ausrichtungen der Pfeile (und der Farben) kleinersind als die Schwankungen in horizontaler Richtung: Während es in deneinzelnen Spalten zwei bis drei Farbausprägungen gibt, sind auf den Zei-len Spannweiten von meist drei bis vier Farbeintragungen zu finden. Diesbestätigt die Vermutung, dass die Mehr- und Mindererträge weniger vonder Sorte als vielmehr vom Anbauort abhängig sind.

66 Neue Grafiken I

Tafel 23: Gerstenernten in Minnesota 1931 und 1932, korrigiert (Strömungsbilder)

Gerstensorte

Streuungsfächer links: Der schwarze Fächer zeigt die Werte der Variablen "Ertrag"vom ersten bis zum dritten Quartil auf einer Kreisskala von 0 bis 66.

Die weisse Federn zeigen die Positionen des 5 %− und des 95 %−Perzentils.

en fü

Svansota

Manchuria

No. 475

Velvet

Glabron

Peatland

No. 462

No. 457

Wisconsin

Z I M[example.vanechart2.barley−1034]

E Sequenzdiagramme

Rot verloren im Blauwald (2010)

Rotierter Ausschnitt aus einem Sequenzdiagramm zu Rehabilitations- ↑ Vgl. Tafel 27 (S. 77)

behandlungen, mit Vergrösserung der Symbolbreite.

E.1 Motivation

Zur Darstellung der Entwicklung einer Kennzahl im Zeitverlauf bieten sichLiniendiagramme?Liniendiagramme an: Auf der x-Achse wird die Zeit abgetragen und aufder y-Achse der Wert. Liegen Werte zu mehreren Untersuchungseinhei-ten vor, können mehrere Liniendiagramme erstellt und untereinander odernebeneinander angeordnet werden. In beiden Fällen ist ein Vergleich nurbehelfsmässig möglich. Ausserdem brauchen die zweidimensionalen Lini-endiagramme relativ viel Platz.

Es stellte sich mir die Frage, wie ich Verläufe von Kennzahlen zu vielenViele Untersu-chungseinheiten Untersuchungseinheiten so darstellen könnte, dass sie gut vergleichbar

sind und auf möglichst einer Druckseite Platz haben. Es waren z. B. Ver-änderungen von Fähigkeitseinschränkungen vieler Patienten über mehre-re Wochen oder Veränderungen von Kosten und Erträgen zu vielen Pati-entenkategorien über mehrere Jahre hinweg übersichtlich darzustellen.

Wie im vorherigen Kapitel beschrieben, lassen sich mit Dreiecken Diffe-SequenzierteDreiecke renzen darstellen. Da Verläufe über mehrere aufeinanderfolgende Zeitpe-

rioden Sequenzen von Differenzen sind, überlegte ich mir, ob ich solcheVerläufe nicht mit Sequenzen von Dreiecken abbilden könnte? Der Vorteilwäre, dass dies eine eindimensionale Darstellung ermöglichte. Der Nach-teil wurde mir allerdings schnell auch klar: Was passiert, wenn sich dasVorzeichen der Veränderung wechselt? Die aufeinander folgenden Drei-ecke überlagern sich.

Trotz dieses Problems erstellte ich einige Versuchsgrafiken. Ich entdeck-Umgang mitRichtungswechseln te, dass das Problem der Überlagerung gemindert wurde, wenn ich Fül-

lung und Rahmen der Dreiecke in zwei Durchgängen aufzeichnete: Da-mit wurde der Rahmen eines überlagerten Dreiecks über der Füllung desdarüber liegenden Dreiecks sichtbar. Pendelbewegungen konnten damitbesser erkannt werden.

Überlagerungen brachten es zusätzlich mit sich, dass Anfang und En-de der Sequenzen z. T. nicht mehr gut erkenntlich waren. Eine Milderungdieses Problems fand ich, indem ich die Farbintensität vom Beginn einerSequenz bis zu deren Ende zunehmen liess.

Tafel 24:Legende zusequenziertenDreieckenmit fünf Werten 0 50

(Messeinheiten)

Wert 1

Wert 2

Wert 3

Wert 5

Wert 4

Wert 1

Wert 2

Wert 3

Wert 5

Wert 4

E Sequenzdiagramme

0 50(Messeinheiten)

Wert 1

Wert 2

Wert 3

Wert 4

Wert 5

Wert 7

Wert 6

Wert 1

Wert 2

Wert 3

Wert 4

Wert 5

Wert 7

Wert 6 Tafel 25:Legende zusequenziertenDreieckenmit sieben Werten

74 Neue Grafiken I

E.2 Beschreibung: Sequenzierte Dreiecke

In einem Sequenzdiagramm1 werden aufeinander folgende Veränderun-AneinandergereihteDreiecke

Tafeln 24 bis 26gen von Variablenwerten durch grafische Symbole angezeigt, die auf ei-ner Linie aufgereiht sind. Als Symbole bieten sich Dreiecke an: Die Spitzeeines Dreiecks wird zur Basis des nächsten Dreiecks und damit zum Aus-gangspunkt für die nächste Differenz. Dank dieser kompakten Form wirdes möglich, Positionen und Veränderungen zu mehreren Untersuchungs-einheiten gleichzeitig darzustellen.

Da sich die dargestellten Werte in freiem Wechsel sowohl erhöhen alsFarben undRichtungswechsel auch senken können, wurde einerseits die Veränderungsrichtung mit zwei

deutlich unterschiedlichen Farben gekennzeichnet und andererseits dieFarbintensität von Messpunkt zu Messpunkt verstärkt.

Tafel 26:Legende zusequenziertenDreieckenmit acht Werten 0 50

(Messeinheiten)

Wert 1

Wert 2

Wert 3

Wert 4

Wert 5

Wert 6

Wert 8

Wert 7Wert 1

Wert 2

Wert 3

Wert 4

Wert 5

Wert 6

Wert 8

Wert 7

1 Fischer [Krankenhaus-Betriebsvergleiche, 2005]: 108 f.

E Sequenzdiagramme

E.3 Beispiel 1: Verlauf von Rehabilitationsbehandlungen

In der Grafik wird eine Stichprobe von Rehabilitationspatienten gezeigt, GrafikTafel 27welche zwischen fünf und sieben Wochen in stationärer Behandlung wa-

ren. Die Patienten sind pro Zeile eintragen. Die (anonymisierte) Patienten-identifikation steht zu Beginn der Zeile. Im Grafikfeld kann die Entwick-lung der Fähigkeiten gemäss dem FIM-Instrument2 abgelesen werden:Für jede Hospitalisationswoche wurden die durchschnittlichen FIM-Punkteeingezeichnet und durch Dreiecke miteinander verbunden. Die Länge derDreiecke zeigt somit die Verbesserung oder Verschlechterung in FIMø-Punkten pro Woche. Die FIMø-Punkte jeder Woche wurden zusätzlich alsZahlenwerte in der grauen Spalte rechts eingetragen.

Die Eintragungen der Patienten sind geordnet nach den FIMø-Punkten.Zuoberst sind die selbständigsten Patienten, zuunterst die unselbständigs-ten Patienten.

Auf den ersten Blick fällt auf, dass die meisten Dreiecke blau sind, d. h., Resultatedass die Fähigkeiten gemäss FIM bei den allermeisten Behandlungen ausder Stichprobe im Verlauf der Behandlung zunahmen. Die Zunahmen sindunterschiedlich hoch. Die grössten Veränderungen sind in der Mitte zufinden; offenbar besteht ein besonders grosses Veränderungspotential beiPatienten, bei welchen zu Beginn der Behandlung ein FIMø-Wert von 3bis 4 Punkten gemessen wurde.

Es gibt nur eine Behandlung bei durchwegs abnehmenden FIMø-Werten: die zuunterst eingetragene.

Bei den Behandlungen mit zeitweilig abnehmenden FIMø-Werten fälltauf, dass die Abnahme des Öftern am Schluss der Behandlung auftrat.Dies zeigen die intensiv rot gefärbten Dreiecke am Ende einiger Sequen-zen.

Zeitweilige Stagnationen der eingetragenen Werte sind aus technischen Zur DiskussionGründen nicht erkennbar. Bei Patient «1560» (auf der siebentunterstenZeile) beispielsweise blieb der FIMø-Wert während der ersten drei Be-handlungswochen bei 2.72 stehen. Diese repetierten Werte erscheinenin der Tabelle; in der Grafik sind sie nicht sichtbar.

Es fällt auf, dass die Veränderungen bei mittleren FIMø-Werten grössersind als am Rand der Skala. Dies könnte auch darauf hinweisen, dass dieFIM-Skala nicht linear ist, sondern – wie mit einer Rasch-Analyse belegtwurde3 – für solche Auswertungen linearisiert werden müsste.

2 FIM = Functional Independence Measure. Die FIMø-Punkte wurden berechnet alsFIM-Punktesumme dividiert durch die Anzahl beurteilter FIM-Items. Die Skala derFIMø-Punkte reicht von «1», wenn eine totale Hilfestellung nötig ist, bis «7» beivölliger Selbständigkeit. – Granger et al. [UDSmr-93, 1995]. http:// www.udsmr.org /.

3 Vgl. Granger et al. [FIM-Rasch, 1993].

76 Neue Grafiken I

Tafel 27: Entwicklung der FIMø-Punkte nach Hospitalisationswochen

52 Behandlungsfälle

|−− FIMø−Wert −−>Hellere Pfeile: ältere Veränderungen. Dunklere Pfeile: neuste Veränderungen.

Färbung: bläulich −> Verbesserung; rötlich −> Verschlechterung.

[1716]

[1585]

[1748]

[1591]

[1770]

[1744]

[1584]

[1500]

[1567]

[1569]

[1495]

[1570]

[1794]

[1621]

[1571]

[1724]

[1682]

[1681]

[1647]

[1678]

[1743]

[1694]

[1508]

[1627]

[1669]

[1776]

[1679]

[1671]

[1563]

[1704]

[1796]

[1606]

[1593]

[1793]

[1617]

[1565]

[1777]

[1695]

[1622]

[1818]

[1800]

[1723]

[1784]

[1729]

[1528]

[1817]

[1515]

[1774]

[1841]

[1542]

[1536]

[1600]

1 2 3 4 5 6 7

1 2 3 4 5 6 7Hospitalisationswoche

Z I M[SZH.08Z.seqplot:tri−1033]

E Sequenzdiagramme

E.4 Beschreibung: Sequenzbänder

Anstelle von Dreiecken können auch Bänder über einer Werteskala aus- Tafel 28

gebreitet werden. Damit die Differenzen von einem Messpunkt zum nächs-ten besser erkannt werden können, wurde jeder Messpunkt mit einemPunkt grafisch markiert und die Differenzen selbst immer intensiver ge-färbt. Zusätzlich wurde das in waagrechter Richtung verlegte Band voneinem Messpunkt zum nächsten um einen bestimmten, kleinen Betragsenkrecht versetzt. Somit erscheinen positive und negative Differenzenwie ineinander gefaltet. Zur besseren Lesbarkeit wurden für positive undnegative Differenzen deutlich unterscheidbare Farben verwendet.

Sequenzbänder benötigen etwas mehr Platz als sequenzierte Dreiecke,zeigen aber Verlaufswechsel besser.

0 50(Messeinheiten)

Wert 1

Wert 2

Wert 3

Wert 4Wert 5

Wert 6

Wert 7

Wert 8 Tafel 28:Legende zu einemSequenzbandmit acht Werten

In der Grafik sind die gleichen Daten aus der Rehabilitation verwendet wor- GrafikTafel 29den wie in der vorangegangenen Grafik mit den sequenzierten Dreiecken.

Der Lesbarkeit wegen werden aber nur zwei Drittel der Behandlungsfällegezeigt.

Es gelten die gleichen Aussagen wie zur vorangegangenen Auswer- Resultatetung. Die Fälle mit zeitweilig abnehmenden FIMø-Werten sind nun aberbesser sichtbar. Zum Beispiel sah man beim Patient «1561» (auf der zweit-untersten Zeile) vorher nicht so deutlich, dass sich der Zustand von derersten zur zweiten Woche verschlechterte. Auch der wechselhafte Verlaufbei Patienten wie «1539» (leicht oberhalb der Mitte) oder «1545» (auf dersiebtuntersten Zeile) kann hier besser abgelesen werden. Die Stagnationder Werte während der ersten drei Wochen der Behandlung von Patient«1560» (viertunterste Zeile) fällt erst hier auf.

Der Entscheid für den Einsatz von sequenzierten Dreiecken oder von KonklusionSequenzbändern ist also abhängig davon, ob man lieber möglichst vieleFälle oder eine etwas detaillierte Sicht auf die Daten zeigen will.

78 Neue Grafiken I

Tafel 29: Sequenzbänder zur Entwicklung der FIMø-Punkte nach Hospitalisationswochen

|−− FIMø−Wert −−>Hellere Bandabschnitte: ältere Veränderungen. Dunklere Bandabschnitte: neuste Veränderungen.

Färbung: bläulich −> Verbesserung; rötlich −> Verschlechterung.

[1716]

[1585]

[1591]

[1584]

[1500]

[1567]

[1569]

[1495]

[1570]

[1621]

[1571]

[1724]

[1682]

[1681]

[1647]

[1678]

[1694]

[1508]

[1627]

[1669]

[1679]

[1671]

[1563]

[1704]

[1606]

[1593]

[1617]

[1565]

[1695]

[1622]

[1723]

[1528]

[1515]

[1542]

[1536]

[1600]

1 2 3 4 5 6 7

1 2 3 4 5 6 7Hospitalisationswoche

Z I M[SZH.08Z.seqplot:para−1033]

E Sequenzdiagramme

E.6 Beschreibung: Kammlinien

Man kann die vertikale Versetzung von Sequenzbändern soweit vergös- Tafel 30

sern, bis von einem Messpunkt zum nächsten eine ganze beschreibba-re Zeile liegt. Wenn man die Bandabschnitte zwischen den Messpunktennun durch rechtwinklige Dreiecke ersetzt, entsteht eine «Kammlinie». DieBreite der Dreiecke zeigt die Differenz an. Die Höhe ist konstant und wirdidealerweise so gewählt, dass sie der Höhe einer Schreibzeile entspricht.

Damit ist man im Prinzip wieder beim Liniendiagramm angelangt. Nurgeht die Linie nun nicht von links nach rechts, sondern von unten nachoben. Das hat insbesondere den Vorteil, dass jeder Messpunkt beschriftetwerden kann, ohne dass der Text rotiert werden muss. Im Unterschied zumgewöhnlichen Liniendiagramm sind in Kammliniendiagrammen die Diffe-renzen dank der Dreiecke und deren Färbung besser erkennbar.

(Messeinheiten)

Wert 1

Wert 2

Wert 3

Wert 4

Wert 5

Wert 6

Wert 7

Wert 8

t + 7 Tafel 30:Legende zu einerKammliniemit acht Werten

Die Grafik beruht nochmals auf den gleichen Daten aus der Rehabilitation GrafikTafel 31wie die beiden vorangegangen Grafiken. Der unselbständigste Patient ist

links unten eingetragen. Von unten nach oben und von einer Spalte zurnächsten sind immer selbständigere Patienten zu finden.

Dank der besseren vertikalen Auflösung sind die Behandlungsverläu- Resultatefe hier besonders gut erkennbar. Insbesondere sind in dieser Darstel-lung auch zeitweilig stagnierende Zustände gut sichtbar. (Vgl. z. B. Patient«1560» in der ersten Spalte auf der siebten Zeile.)

Damit alle 52 Behandlungsfälle auf einer Seite Platz hatten, musste eine Zur Diskussionfür dieses Ausgabeformat zu kleine Schrift gewählt werden.

80 Neue Grafiken I

Tafel 31: Kammlinien zur Entwicklung der FIMø-Punkte nach Hospitalisationswochen

|−− FIMø−Wert −−>

2.221.761.611.571.50

1 2 3 4 5 6 7

2.392.503.073.934.194.334.33

1 2 3 4 5 6 7

3.444.334.694.945.19

1 2 3 4 5 6 7

4.895.135.175.675.67

1 2 3 4 5 6 7

71.441.361.631.911.982.252.67

5]3.173.543.583.563.643.76

3.283.774.564.864.945.385.83

5.225.285.225.185.71[1

1.832.332.452.502.532.752.94

3.223.513.773.833.87[1

4.674.414.884.724.724.94

4.895.135.265.285.505.725.75

2.332.482.612.612.85[1

3.173.633.964.023.973.94

3.563.944.534.895.285.635.90

5.005.375.525.645.83[1

2.782.792.902.892.802.712.72

4.283.993.713.653.78[1

3.614.125.075.445.89[1

4.835.575.605.715.74[1

2.332.722.763.003.113.27

3.443.443.463.583.864.684.78

3.674.024.495.035.495.655.88

4.895.195.405.635.856.005.96

2.722.722.722.782.832.973.89

3.503.503.583.764.114.534.80

3.833.884.485.225.565.695.78

5.225.415.535.676.00[1

2.172.482.532.873.193.533.89

2.833.744.144.224.184.354.39

4.394.644.905.005.285.505.57

5.445.445.615.785.785.69

2.832.812.963.003.043.12

3.173.354.004.004.245.115.28

5.673.604.365.155.475.565.65

5.285.375.725.945.94[1

2.943.173.393.332.06[1

3.943.854.204.154.304.764.94

3.724.574.875.275.435.576.03

5.225.515.635.805.936.09

1.942.333.123.213.393.503.56

3.173.944.254.484.765.065.17

4.224.655.245.445.725.89

4.895.476.116.226.176.336.50

1.942.283.413.813.67[1

4.064.104.194.404.594.695.02

4.334.785.175.335.335.895.89

5.175.756.366.396.39[1

2.612.932.893.063.143.403.30

3.393.894.384.594.825.055.48

4.065.015.335.685.835.61

5.895.936.106.266.64[1

Z I M[SZH.08Z.seqplot:crest1−1033]

F Wechseldiagramme

3333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333

F.1 Motivation

Dreiecke können auch noch andere als wertmässige Differenzen zei-Paare vonJa/Nein-Antworten gen. Dies entdeckte ich, als ich einen Datensatz mit Vorher-/Nachher-

Antworten zu Ja/Nein-Fragen auszuwerten hatte. Aus den Paaren vonAntworten können folgende vier Paare von ersten und zweiten Antwortengebildet werden:

• ja / ja

• nein / ja

• ja / nein

• nein / nein

Die einfachste Auswertung einer Erhebung mit solchen Antworten ist eine2×2-Kreuztabelle?2×2-Kreuztabelle, in welche die (absoluten oder relativen) Häufigkeitenpro Antwortpaar eingetragen sind.

Nun waren im Datensatz aber Antworten zu mehreren Fragen enthal-Kombinationenvon Antwortpaaren ten. Grundsätzlich hätte ich aus den Antworten zu jeder Frage ein eigene

Kreuztabelle erstellen können. Da mich aber auch die Kombinationen derAntworten zu allen Fragen pro befragte Person interessierten, suchte ichnach einer Darstellungsmöglichkeit, in der ich jede Antwort einzeln abbil-den konnte, die aber so kompakt war, dass ich bei Bedarf mehrere hundertBefragungen auf einer einzigen Seite darstellen konnte. Also galt es, eingrafisches Symbol zu finden, mit dem zwei Zustände und zwei Zustands-wechsel abgebildet werden können.

Nach einigem Herumsuchen blieb ich bei der Flagge hängen, die alsDiagonal unterteilteQuadrate Postenmarkierung für Orientierungsläufe benutzt wird: Ein orange-weiss

eingefärbtes, diagonal unterteiltes Quadrat. Ich begann, die beiden Drei-ecke als dynamische Figuren zu sehen: Das untere Dreieck ist eine Figur,die sich von links nach rechts öffnet, währenddem sich das obere Dreieckvon links nach rechts schliesst. Mit dem oberen Dreieck könnte also dieerste, «vorherige», nun nicht mehr gültige Antwort codiert werden, mit demunteren die zweite, «neue» Antwort. Wenn keine Veränderung stattfand,dürfte nach dieser Logik das Quadrat nicht unterteilt werden. Damit diesmöglich wurde, gab ich den Antworten «ja» und «nein» unterschiedlicheFarben, nämlich Rot und Blau. (Zu dieser Farbenwahl stellte ich mir vor:«ja» = Rot = Feuer und Flamme sein; «nein» = Blau = Es lässt einen kalt.)

Tafel 32:Legende zu denWechselflaggen ja / ja nein / ja ja / nein nein / nein

F Wechseldiagramme

F.2 Beschreibung: Wechselflagge

Eine «Wechselflagge» ist ein Quadrat mit einer diagonalen Unterteilung. WechselflaggeTafel 32Damit können zwei Zustände und zwei Zustandwechsel angezeigt werden.

Sie eignen sich z. B. zur Abbildung der Kombination von zwei aufeinanderfolgenden Ja/Nein-Antworten.

Jeder Antwort wird eine Farbe zugeordnet. (Im Beispiel ist es Rot für Farben«ja» und Blau für «nein».) Die erste Antwort wird hell eingetragen. Wenndie zweite Antwort gleich ausgefallen ist wie die erste, wird sie auch helleingetragen, und es ergibt sich ein hell gefärbtes Quadrat. Wenn die zwei-te Antwort anders ist, wird das zweite Dreiecke mit grösserer Farbintensitäteingefärbt.

Die Antwortpaare können von «ja» bis «nein» geordnet werden, indem Reihenfolgeman z. B. die zweite Antwort als gewichtiger definiert. Die Reihenfolge lau-tet dann: «ja / ja», «nein / ja», «ja / nein», «nein / nein».

F.3 Beispiel 1: Antwortpaare zu Ja/Nein-Fragen nach Ländern

111 Personen aus fünf Ländern wurden vor und nach der Teilnahme an Einleitungeinem Kurs zu den gleichen sieben Fragen «(a)» bis «(g)» befragt. DieAntwortmöglichkeiten waren «ja» oder «nein». Daraus ergeben sich viermögliche Paare von erster und zweiter Antwort: «ja / ja», «nein / ja», «ja /nein», «nein / nein».

In der Grafik wurden die Antwortpaare in Form von Wechselflaggen dar- GrafikTafel 33gestellt. Sie wurden für jedes Land pro Frage gemäss der Reihenfolge in

obiger Liste geordnet und nacheinander auf den Zeilen eingetragen.Es fällt zuerst auf, wie sich die Länder nach den Farbanteilen unterschei- Resultate

den. Dies zeigt, dass das Antwortverhalten in den Ländern unterschiedlichwar. Unter den Deutschschweizern und bei den Deutschen gab es ammeisten Personen, die schon immer ja sagten. (Es gibt hier anteilmässigmehr hellrote Quadrätchen, d. h. «ja / ja»-Antworten als in den anderenLändern.)

Besonders viele veränderte Antworten kamen z. B. aus Peru. Meist ver-änderten sich diese von «nein» zu «ja». Aus der Grafik sieht man sofortauch, dass diese Regel für die Fragen «(b)» und «(g)» nicht gilt.

In Österreich gab es – ausser zur Frage «(d)» – fast keine Wechselzwischen erster und zweiter Antwort. Auch in Deutschland gab es verhält-nismässig wenig Wechsel.

88 Neue Grafiken I

F.3 Beispiel 1: Antwortpaare zu Ja/Nein-Fragen nach Ländern

Tafel 33:GeordneteAntwortpaarezu siebenJa/Nein-Fragen,nach Ländern

Anzahl interviewte Personen (n = 111)

Antworten vorher / nachher:

(g)(f)

(e)(d)(c)(b)(a)

1 2 3 4 5 6 7 8 9 10111213141516171819202122232425262728

Österreich(g)(f)

(e)(d)(c)(b)(a)

Schweiz (deutsch)(g)(f)

(e)(d)(c)(b)(a)

Schweiz (französisch)(g)(f)

(e)(d)(c)(b)(a)

Deutschland(g)(f)

(e)(d)(c)(b)(a)

Frankreich(g)(f)

(e)(d)(c)(b)(a)

ja / ja nein / ja ja / nein nein / nein Z I M[BDZA.09Z.bquad−1033]

F Wechseldiagramme

F.4 Beispiel 2: Antwortpaare zu Ja/Nein-Fragen nach Themen

In der nächsten Grafik sind die Antworten der 111 Personen aus dem vor- GrafikTafel 34angegangenen Beispiel 1 nicht nach Ländern, sondern nach den Fragen

gebündelt.Auch hier fallen zuerst die unterschiedlichen Farbanteile auf: Bei Frage Resultate

«(b)» überwiegen z. B. die hellblauen «nein / nein»-Felder deutlich. Beiden Fragen «(e)» und «(f)» fallen die wenigen blau gefärbten «ja / nein»-und «nein / nein»-Felder auf.

Viele Veränderungen ins Positive (rote Dreiecken: von «nein» zu «ja»)ausserhalb Perus gab es bei der Frage «(d)». Sie kamen vor allem ausder französischen Schweiz und aus Österreich. In Deutschland und in derdeutschen Schweiz gab es zu dieser Frage hauptsächlich Antworten ohneWechsel. Am meisten Veränderungen ins Negative (blaue Dreiecke: von«ja» zu «nein») sind bei den Antworten zur Frage «(g)» festzustellen.

Wenn man die Antworten zeilenweise durchschaut, sieht man auch indieser Grafik, dass das Antwortverhalten in den Ländern unterschiedlichwar. Besonders viele Antwortwechsel kamen oftmals aus Peru. DieserSachverhalt als Ganzes war allerdings in der vorangegegangenen Gra-fik, die nach Ländern gruppiert war, noch deutlicher zu sehen. Hier nunkann man fragebezogene Details sehen wie z. B., dass zur Frage «(d)»praktisch gleich viele Antwortwechsel wie aus Peru auch aus der französi-schen Schweiz kamen (bei insgesamt etwas weniger Antworten).

90 Neue Grafiken I

F.4 Beispiel 2: Antwortpaare zu Ja/Nein-Fragen nach Themen

Tafel 34: Geordnete Antwortpaare zu sieben Ja/Nein-Fragen, nach Themen

Anzahl interviewte Personen (n = 111)

ÖsterreichSchweiz (dt.)Schweiz (frz.)Deutschland

FrankreichPeru

−20 −10 0 10 20

(g)Österreich

Schweiz (dt.)Schweiz (frz.)Deutschland

FrankreichPeru

(f)Österreich

FrankreichPeru

(e)Österreich

FrankreichPeru

(d)Österreich

FrankreichPeru

(c)Österreich

FrankreichPeru

(b)Österreich

FrankreichPeru

ja / ja nein / ja ja / nein nein / neinZ I M

[BDZA.09Z.bquad−1033]

F Wechseldiagramme

F.5 Beispiel 3: Antwortkombinationen zu Ja/Nein-Fragen pr o Person

In der nächsten Grafik sind alle Antworten pro Person (gruppiert nach Län- GrafikTafel 35dern) abgebildet. In den Spalten sieht man, wie die einzelnen Personen

geantwortet haben. (In den Zeilen sieht man, wie einzelne Fragen beant-wortet wurden.) Die Personen wurden sortiert nach der Anzahl bejahenderAntworten.1 Links wurden jene Personen eingetragen, welche sowohl beider ersten wie auch bei der zweiten Antwort (meist) mit «ja» geantwortethaben. Ganz rechts sind die Antworten jener Personen zu sehen, die viele«nein»-Antworten abgaben.

Auch in dieser Grafik fällt als Erstes auf, dass sich Antworten aus den Resultateverschiedenen Ländern nach der Häufigkeit von Wechseln in der Antwortunterscheiden: Am meisten Dreiecke hat es bei den Antworten aus Peru.Die meisten Wechselflaggen sind rot gefärbt, d. h. sie gingen nach «ja».

Wenn man die Antworten spaltenweise durchschaut, sieht man u. a.sehr gut, welche Personen beim zweiten Interview lauter Nein-Antwortengaben: Ganz rechts in den Grafikfeldern sind einzelne Spalten zu finden,die nur hellblaue Rechtecke und blaue Dreiecke enthalten. In Peru, in derdeutschen und in der französischen Schweiz gab es je eine solche Person.Umgekehrt sind in keinem der Länder ausser in Peru Personen zu finden,welche anfänglich einige Nein-Antworten gaben und im zweiten Interviewdann alle Fragen mit Ja beantworteten. Bei den PeruanerInnen führt dieSuche zu zwei solchen Spalten ohne hellblaue Felder und ohne Felder mitblauem Dreieck. (Sie befinden sich links an zweiter und an vierter Stelle.)

1 Zum Problem von derartigen Sortierungen vgl. z. B. Bertin [Grafik, 1982]: 32 ff undHahsler et al. [Seriation, 2008].

92 Neue Grafiken I

F.5 Beispiel 3: Antwortkombinationen zu Ja/Nein-Fragen pro Person

Tafel 35:Antwortpaare proPerson zu siebenJa/Nein-Fragen,nach Ländernund Personen

Index der interviewten Personen (n = 111)

(g)(f)

(e)(d)(c)(b)(a)

1 2 3 4 5 6 7 8 9 10111213141516171819202122232425262728

Österreich(g)(f)

(e)(d)(c)(b)(a)

Schweiz (deutsch)(g)(f)

(e)(d)(c)(b)(a)

Schweiz (französisch)(g)(f)

(e)(d)(c)(b)(a)

Deutschland(g)(f)

(e)(d)(c)(b)(a)

Frankreich(g)(f)

(e)(d)(c)(b)(a)

ja / ja nein / ja ja / nein nein / nein Z I M[BDZA.09Z.bquad−1033]

F Wechseldiagramme

Im Anhang folgen einige Anmerkungen zu statistischen Fachausdrücken,welche im Rahmen der Präsentation der Streuungsfächerkarten verwen- ↑ S. 31

det wurden. Sie sind für Leser gedacht, denen diese Dinge noch nichtbesonders geläufig sind.

94 Neue Grafiken I

G Anhang

Speichenspirale 1 (2009)

Speichendifferenzdiagramm mit generierten Daten.↑ Vgl. Tafel 3 (S. 25)

G.1 Statistische Anmerkungen

G.1.1 Median und Quartile in Boxplot und Streuungsfächerkarte

Zur Beschreibung der Lage von Messwerten, die nicht normalverteiltMediansind, kann der Median (m) verwendet werden. Er gibt denjenigen Mess-wert an, der «in der Mitte» der Stichprobe liegt: Alle Messwerte werdensortiert; der Wert in der Mitte wird als Median bezeichnet.1 Vom Median-wert aus gesehen sind 50 % der Messwerte kleiner (oder gleich gross) und50 % der Messwerte grösser (oder gleich gross).

Bei perfekt normalverteilten Daten ist der Median gleich gross wie dasarithmetische Mittel. Es gibt jedoch Verteilungen, die selten normalver-teilt sind. Dazu gehören z. B. Verweildauern von Krankenhauspatienten:Es gibt meist einige wenige Behandlungsfälle mit langen und sehr lan-gen Verweildauern und demgegenüber viele mit kürzeren Verweildauern.Bei einer solchen Verteilung liegt der Median unterhalb des arithmetischenMittels, und man spricht von einer «rechtsschiefen» Verteilung.

Der Median wird – im Unterschied zum arithmetischen Mittel – von Aus-reisserwerten nicht beeinflusst. Somit ist er ein robuster Mittelwert.

Wenn man die beiden Hälften der Stichprobe unter und über dem Me-Quartiledian nochmals halbiert, erhält man die Quartile. Quartile unterteilen eineStichprobe bei 25 % (erstes Quartil), 50 % (zweites Quartil = Median) und75 % (drittes Quartil). Zwischen dem ersten und dem dritten Quartil liegenalso auch gerade 50 % der Messwerte. Dieser Bereich wird «Quartilsab-stand» genannt.2

Grafisch dargestellt werden Median und Quartile meist in Form von so-Visualisierung mitBoxplots genannten «Boxplots». Sie bestehen aus zwei aneinander gefügten Käst-

chen, welche erstes Quartil, Median und zweites Quartil anzeigen. An je-des der beiden Kästchen ist eine Linie angefügt, welche in der hier ver-wendeten Form das 5 %- und 95 %-Perzentil anzeigen und somit 90 % derMesswerte umfassen: ___ _____ .3

Aus Boxplots wird auf einen Blick ersichtlich, ob eine schiefe Verteilungvorliegt: In einem solchen Fall sind die beiden Kästchen nicht gleich gross.

In Streuungsfächern wird der Median mit der mittleren weissen Linie,Visualisierung mitStreuungsfächern↑ S. 32

die Werte vom ersten bis zum dritten Quartil mit dem schwarzen Fächer,5 %- und 95 %-Perzentil mit den weissen Federn abgebildet.

1 Bei einer geraden Anzahl von Messwerten wird der Median als Durchschnitt derbeiden in der Mitte liegenden Werte berechnet.

2 Englisch: IQR = Interquartile Range.3 Im Boxplot nach Tukey werden die ‹whiskers› beim ‹3. Quartil + k × IQR› bzw. beim

‹1. Quartil – k ) × IQR› gesetzt (IQR = Interquartilsabstand). Tukey schlug k = 3.0vor; heute wird oft k = 1.5 verwendet. – Tukey [EDA, 1977], zitiert in: Nagel et al.[Grafische Datenanalyse, 1996]: 35 ff.

G Anhang

G.1.2 Varianzreduktion (r2)

Die Varianzreduktion (r2) ist ein Mass dafür, inwieweit es durch eine Varianzreduktion(r2)Gruppenbildung gelungen ist, die Streuung von (normalverteilten) Daten

zu erklären.Zur Berechnung der Varianzreduktion werden zunächst die Unterschie-

de der Messwerte xi zum Mittelwert der Gesamtstichprobe von n Mess-werten berechnet, quadriert und dann summiert. (Im grafischen Beispiel Tafel 36

beträgt der Mittelwert der Gesamtstichprobe 3.9. Die quadrierten Abwei-chungen sind in der Zahlenspalte links eingetragen. Die Summe der quad-rierten Abweichungen gegenüber dem Mittelwert der Gesamtstichprobebeträgt 19.40.) Dieser Wert für die gesamte Streuung wird verglichen mitder Summe der Werte der Streuungen in Bezug auf die Gruppenmittel-werte. Dazu werden die Unterschiede der Messwerte xi zu den Gruppen-mittelwerten berechnet und ebenfalls quadriert und summiert. (Im Beispielergibt dies 5.60 + 8.40 = 14.00 .)

Im nächsten Schritt berechnet man nun den ‹Unterschied der Gesamt-streuung und der Summe der Streuungen in Bezug auf die Gruppenmit-telwerte›. (Im Beispiel ist dies 19.40 – 14.00 = 5.40.) Diese Differenz setztman anschliessend ins Verhältnis zur Gesamtstreuung. (Im Beispiel ergibtdies 5.40 / 19.40 = 27.8 %.) Damit erhält man die Varianzreduktion: eineZahl, welche angibt, um wieviele Prozent die Streuung in Bezug auf dieGruppenmittelwerte kleiner ist als die Streuung in Bezug auf den Mittel-wert der Gesamtstreuung.

Die – gekürzte – Formel dazu lautet:

Varianzreduktion = 1−∑n

i=1(xi −Gruppenmittelwert)2

∑ni=1(xi −Mittelwert der Gesamtstichprobe)2

100 Neue Grafiken I

Tafel 36: Beispiel zur Berechnung der Varianzreduktion

1 2 3 4 5 6 7 8 9

−2.3−1.5

−0.7+0.9

−1.2−0.3

+0.5+0.9

+1.1+2.6

5.292.250.490.81

1.440.090.250.811.216.76

1 2 3 4 5 6 7 8 9

3.0 4.5

Gruppe A Gruppe B

−1.4−0.6

+0.2+1.8

−1.8−0.9

−0.1+0.3

+0.5+2.0

1.960.360.043.24

3.240.810.010.090.254.00

5.60 8.40

Varianzreduktion = 1 − ( 5.60 + 8.40 ) / 19.40 = 27.8 %

Quelle: Nach Fischer [Grafiken zur PCS-Beurteilung, 2008]: 33

G Anhang

G.1.3 Reduktion der absoluten Abweichungen vom Median (r1)

Alternativ zur Varianzreduktion und als robustere Kennzahl die «Reduk- Reduktion derabsolutenAbweichungen vomMedian (r1)

tion der absoluten Abweichungen vom Median» (r1) , um zu beurteilen, in-wieweit es durch eine Gruppenbildung gelungen ist, die Streuung von Da-ten zu erklären. Im Unterschied zur Varianzreduktion wird sie viel wenigerstark von Extremwerten beeinflusst, denn die Abweichungen zu den Grup-penmittelwerten werden nicht quadriert, sondern nur als absolute Werteaufsummiert.

Im grafischen Beispiel wurden die durchschnittlichen absoluten Abwei- Tafel 37

chungen vom Median in den Zahlenspalten links und rechts aussen unterden Summen der absoluten Abweichungen eingetragen. Sie betragen inden beiden Gruppen 1.00 und 0.93. Wenn keine Gruppierung vorgenom-men wird, liegt dieser Wert bei 1.20; er ist also grösser als beide Gruppen-werte.

Red. d. abs. Abw. v. Med.= 1−∑n

i=1 | xi −Gruppenmedian |

∑ni=1 | xi −Median der Gesamtstichprobe |

Um diese Formel besser zu verstehen, kann man auch zuerst die Dif-ferenz zwischen der ‹Summe der Abweichungen vom Gruppenmedian›und der ‹Summe der Abweichungen vom Gesamtmedian› berechnen. An-schliessend wird das Resultat dieser Berechnung durch die ‹Summe derAbweichungen vom Gesamtmedian› dividiert. Damit hat man berechnet,wie gross die Reduktion der summierten Abweichungen von den mittle-ren Werten bei Gruppenbildung im Verhältnis zu den Abweichungen vommittleren Wert ohne Gruppenbildung ist.

(Es kann noch angemerkt werden, dass grundsätzlich gilt: Die Sum-me der absoluten Abweichungen von einem Wert aus einer Messreihe istdann am kleinsten, wenn es sich bei diesem Wert um den Median han-delt.)

102 Neue Grafiken I

Tafel 37: Beispiel zur Berechnung der Reduktion der absoluten Abweichungen vom Median

1 2 3 4 5 6 7 8 9

−2.4−1.6

−0.8+0.8

−1.3−0.4

+0.4+0.8

+1.0+2.5

2.41.60.80.8

1.30.40.40.81.02.5

12.01.20

1 2 3 4 5 6 7 8 9

2.8 4.6

Gruppe A Gruppe B

−1.2−0.4

+0.4+2.0

−1.9−1.0

−0.2+0.2

+0.4+1.9

1.20.40.42.0

1.91.00.20.20.41.9

4.0 5.61.00 0.93

Reduktion der absoluten Abweichungen vom Median = 1 − ( 4.0 + 5.6 ) / 12.0 = 20.0 %

Quelle: Nach Fischer [Grafiken zur PCS-Beurteilung, 2008]: 34

G Anhang

G.2 Verzeichnisse

G.2.1 Abkürzungen

Tafel 38: Im Text verwendete Abkürzungen

Abkürzung Bezeichnung Übersetzung; Internetverweise

ø Durchschnitt (arithmetisches Mittel)

a Durchschnittliche absolute Abweichung vom Median

APDRG All Patient Diagnosis Related Groups http:// www.fischer-zim.ch / textk-pcs /t-B3-drg-fam-AP-0801.htm

BAG Bundesamt für Gesundheit http:// www.bag.admin.ch /

BFS Bundesamt für Statistik http:// www.bfs.admin.ch /

DRG Diagnosis Related Groups http:// www.fischer-zim.ch / textk-pcs /index.htm

FIM Functional Independence Measure http:// www.udsmr.org /

HRG Healthcare Resource Groups http:// www.ic.nhs.uk / our-services /standards-and-classifications / casemix

IQR Interquartile Range Quartilsabstand

KVG Krankenversicherungsgesetz vom 18.3.1994 http:// www.admin.ch / ch / d / sr /c832_10.html

LEP Leistungserfassung in der Pflege http:// www.lep.ch /

m Median

OKP Obligatorische Krankenpflege-Grundversicherung http:// www.praemien.admin.ch /

PCS Patientenklassifikationssystem http:// www.fischer-zim.ch / studien /PCS-Buch-9701-Info.htm

r1 Reduktion der absoluten Abweichungen vom Median ↑ S. 102

r2 Varianzreduktion ↑ S. 100

s Standardabweichung

SGP Schweizerische Gesellschaft für Pädiatrie http:// www.swiss-paediatrics.org /

SZH Stiftung Zürcher Höhenkliniken http:// www.zhw.ch / 031dav _ 0103 _ de.htm

TAR Leistungsbedarfsbezogenes Tarifsystem fürRehabilitationskliniken

http:// www.fischer-zim.ch / studien /TAR-RehaPCS-0607-Info.htm

104 Neue Grafiken I

G.2 Verzeichnisse

G.2.2 Literaturverzeichnis

Becker/Cleveland (1996) Trellis/ManBecker RA, Cleveland WS. Trellis Graphics User’s Manual. Seattle (MathSoft, Inc.),Murray Hill (Bell Labs) 1996: 205 S. Internet: http:// cm.bell-labs.com / stat / doc /trellis.user.pdf.

Becker et al. (1996) TrellisBecker RA, Cleveland WS, Shyu MJ. The Visual Design and Control of Trellis Dis-play. In: Journal of Computational and Statistical Graphics 1996/5: 123–155. Inter-net: http:// cm.bell-labs.com / stat / doc / trellis.jcgs.col.ps.

Bertin (1982) GrafikBertin J. Graphische Darstellungen und die graphische Weiterverarbeitung der In-formation. Berlin New York (Gruyter) 1982 [1977]: 275 S.

Brügger et al. (2002) LEP-Methode 2.0Brügger U, Bamert U, Maeder C, Odermatt R. Beschreibung der Methode LEP®

Nursing 2. Leistungserfassung für die Gesundheits- und Krankenpflege. 2, über-arbeitete Auflage, (LEP AG) 2002: 32 S. Internet: http:// www.lep.ch / pdf / Metho-denbeschreibung_2_1.pdf.

Chambers (1998) SChambers JM. Programming with Data. A Guide to the S Language. New York(Springer) 1998. Info: http:// cm.bell-labs.com / cm / ms / departments / sia / Sbook.

Chambers (2008) RChambers JM. Software for Data Analysis. Programming with R. New York (Sprin-ger) 2008: 498 S.

Cleveland (1993) VisualizingCleveland WS. Visualizing Data. Summit (Hobart) 1993: 360 S.

Dalgaard (2002) RDalgaard P. Introductory Statistics with R. New York (Springer) 2002: 267 S.

DH-UK (2007) PbR 2008/09Dept. of Health Payment by Results Finance and Costing Team. Tariff Information:Confirmation of Payment by Results (PbR) arrangements for 2008/09. Exceltabel-le, 2007. Download ab: http:// www.dh.gov.uk / en / Managingyourorganisation /Financeandplanning / NHSFinancialReforms / DH _ 081226.

Fetter et al. (1991) DRGsFetter RB, Brand A, Dianne G [Hrsg.]. DRGs, Their Design and Development. AnnArbor (Health Administration Press) 1991: 341 S.

Fischer (1997) PCSFischer W. Patientenklassifikationssysteme zur Bildung von Behandlungsfall-gruppen im stationären Bereich. Prinzipien und Beispiele. Bern und Wolferts-wil (ZIM) 1997: 514 S. Auszüge: http:// www.fischer-zim.ch / studien / PCS–Buch-9701-Info.htm.

Fischer (2002) DRG+PflegeFischer W. Diagnosis Related Groups (DRGs) und Pflege. Grundlagen, Codie-rungssysteme, Integrationsmöglichkeiten. Bern (Huber) 2002: 472 S. Auszüge:http:// www.fischer-zim.ch / studien / DRG-Pflege-0112-Info.htm.

Fischer (2005) Krankenhaus-BetriebsvergleicheFischer W. Neue Methoden für Krankenhaus-Betriebsvergleiche. Ein Werkstatt-buch zur Visualisierung DRG-basierter Daten. Wolfertswil (ZIM) 2005: 160 S. Aus-züge: http:// www.fischer-zim.ch / studien / KBV-0506-Info.htm.

G Anhang

Fischer et al. (2006) TAR und Reha-PCSFischer W, Blanco J, Mäder M, Zangger P, Conti FM, et al.. Das TAR-System und andere Patientenklassifikationssysteme für die Rehabilitation. TAR-Forschungsbericht und Kurzbeschrieb von Systemen aus Deutschland, Frank-reich, Australien und den USA. Wolfertswil (ZIM) 2006: 89 S. Info: http://www.fischer-zim.ch / studien / TAR-RehaPCS-0607-Info.htm.

Fischer (2008) Grafiken zur PCS-BeurteilungFischer W. Statistische Grafiken zur Beurteilung von Patientenklassifikationssys-temen. dargestellt am Beispiel der pädiatrischen Sicht auf das APDRG-System.Wolfertswil (ZIM) 2008: 169 S. Internet: http:// www.fischer-zim.ch / studien / Gra-fiken-PCS-Beurteilung-0804.htm.

Fischer (2008) DRG-FamilieFischer W. Die DRG-Familie. Stand: 2007. Wolfertswil (ZIM) 2008: 32 S. Internet:http:// www.fischer-zim.ch / textk-pcs / index.htm.

Fischer (2009) Notfallvergütung im KrankenhausFischer W. Notfallvergütung im Krankenhaus. Patientenklassifikationssysteme undNotfallpauschalen bei DRG-basierter Vergütung von stationären Behandlungen. 1.Auflage, Wolfertswil (ZIM) 2009: 180 S.

Granger et al. (1993) FIM-RaschGranger CV, Hamilton BB, Linacre JM, Heinemann AW, Wright BD. PerformanceProfiles of the Functional Independence Measure. In: Am J Phys Med Rehabil1993(72): 84–89.

Granger et al. (1995) FIMGranger CV, Brownscheidle CM. Outcome Measurement in Medical Rehabilitati-on. In: International Journal of Technology Assessment in Health Care 1995(11)2:262–268.

Granger et al. (1995) UDSmr-93Granger CV, Ottenbacher KJ, Fiedler RC. The Uniform Data System for Medi-cal Rehabilitation. In: American Journal of Physical Medicine & Rehabilitation1995(74)1: 62–66.

Hahsler et al. (2008) SeriationHahsler M, Hornik K, Buchta C. Getting Things in Order: An Introduction to theR Package seriation. In: Journal of Statistical Software 2008(25)3. Internet: http://www.jstatsoft.org / v25 / i03 /.

Nagel et al. (1996) Grafische DatenanalyseNagel M, Benner A, Ostermann R, Keschke K. Grafische Datenanalyse. StuttgartJena New York (Gustav Fischer) 1996: 292 S.

Tufte (2001) DisplayTufte ER. The Visual Display of Quantitative Information. Second Edition, Cheshire(Graphics Press) 2001 [1983]: 200 S.

Tukey (1977) EDATukey JW. Exporatory Data Analysis. Reading (Addison Wesley) 1977.

UDSmr (1997) FIM™ instrumentUDSmr. Guide for the Uniform Data Set for Medical Rehabilitation (including theFIM™ instrument). Version 5.1. Buffalo (University at Buffalo) 1997.

Unwin et al. (2006) GraphicsUnwin A, Theus M Hofmann H. Graphics of Large Datasets. Visualizing a Million.Berlin New York (Springer) 2006: 271 S.

106 Neue Grafiken I

Stichwortverzeichnis

Balken mit Dreieck . . . . . . . . . . . . . . . . . . 56Balkendiagramm . . . . Punktbalkendia-

gramm, 20, 54Barley . . . . . . . . . . . . . . . . . GerstenernteBetrachtungsdistanz . . . . . . . . . . . . 13, 40Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . 32, 99

Differenzdiagramm . . . . . . . . . . . . . . 47, 54Doppeldifferenzdiagramm . . . . . . 56Kombination von D.diagrammen 58

Distanz . . . . . . . . . BetrachtungsdistanzDreieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

im Sequenzdiagramm . . . . . . . . . . 75mit Balken . . . . . . . . . . . . . . . . . . . . . 56

DRG = Diagnosis Related Groups . . . . .HRG, 21, 48

Fächer . . . . . . . . StreuungsfächerkarteFachwerkgrafik . . . . . . . . . . . . . . . . . . 36, 50Fallgewichte

HRG: elektiv / nicht-elektiv . . . . . 24Fan chart . . . . . . StreuungsfächerkarteFarben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14Federn

im Streuungsfächer . . . . . . . . . . . . 32FIM = Functional Independence Measu-

re. . . . . . . . . . . . . . . . . . . . . . . . .34,36

GerstenernteMinnesota 1931 und 1932 . . . . . .50

Grafiktypenbquad. . . . . . . . . . . . . . . . . . . . . . . . . . 87diffplot . . . . . . . . . . . . . . . . . . . . . . . . . 47dotbar. . . . . . . . . . . . . . . . . . . . . . . . . .52fanchart . . . . . . . . . . . . . . . . . . . . . . . . 31seqplot . . . . . . . . . . . . . . . . . 73, 78, 80spokeplot . . . . . . . . . . . . . . . . . . . . . . 19tri2x . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58tribar . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

Histogramm. . . . . . . . . . . . . . . . . . . . . . . . .19HRG = Healthcare Resource Groups24

Interquartilsabstand . Quartilsabstand

Kammlinie . . . . . . . . . . . . . . . . . . . . . . . . . . 80Krankenkassenprämien . . . . . . . . . . . . . 40Kreis

im Streuungsfächer . . . . . . . . . . . . 32

in der Speichengrafik . . . . . . . . . . . 19Kunstgrafik. . . . . . . . . . . . . . . . . . . . . . . . . .11

LaTeX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4LEP = Leistungserfassung in der Pflege

34, 36Lesbarkeit. . . . . . . . . . . . . . . . . . . . . . .13, 78Liniendiagramm . . . . . . . . . . . . . . . . . 73, 80Lupe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12, 22

Markierungsstrichbei Unsichtbarkeit . . . . . . . . . . . . . . 19

Mathematikprüfungen . . . . . . . . . . . . . . . 38Median. . . . . . . . . . . . . . . . . . . . .31, 99, 102

im Boxplot. . . . . . . . . . . . . . . . . . . . . .99im Streuungsfächer. . . . . . . . .32, 99

Pdf-Dateiaktive Querverweise. . . . . . . . . . . .12

Pseudogeografische Anordnung . . . . 40Punktbalkendiagramm . . . . . . . . . . 52, 54Punktediagramm. . . . . . . . . . . . . . . . . . . . 54

Quartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99Boxplot. . . . . . . . . . . . . . . . . . . . . . . . .99Streuungsfächer . . . . . . . . . . . . . . . 32

Quartilsabstand . . . . . . . . . . . . . . . . . . . . . 99Streuungsfächer . . . . . . . . . . . . . . . 32

Reduktion der absoluten Abweichungenvom Median . . . . . . . . . . 64, 102

Rehabilitation . . . . . . . . 34, 36, 76, 78, 80Relevanz. . . . . . . . . . . . . . . . . . . . . . . . 13, 31

Relevanzbalken . . . . . . . . . . . . . . . . 36

Sequenzbänder . . . . . . . . . . . . . . . . . . . . . 78Sequenzdiagramm. . . . . . . . . . . . . . . . . . 75Speichengrafik . . . . . . . . . . . . . . . . . . 19, 20Spirale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96Spoke plot . . . . . . . . . . . SpeichengrafikStrömungsbild. . . . . . . . . . . . . . . . . . .31, 66Streuungsfächer . . . . . . . . . . . . . . . . . . . . 32Streuungsfächerkarte . . . . . . . . . . . . . . . 31

Trellis display . . . . . . . . Fachwerkgrafik

Varianzreduktion . . . . . . . . . . . . . . . 64, 100

Wechseldiagramm . . . . . . . . . . . . . . . . . . 87Wechselflagge . . . . . . . . . . . . . . . . . . . . . . 88Windrichtung. . . . . . . . . . . . . . . . . . . . . . . .31

Publikationen im ZIM-Verlag

Wolfram Fischer

Neue Methoden für Krankenhaus-Betriebsvergleiche

Ein Werkstattbuch zur Visualisierung DRG-basierter Daten

2005, 160 S., 109 Tab. und meist farbige Abb., geb.e 25.90 / SFr. 38.80ISBN 978-3-9521232-8-7 (ZIM)

Gleich zu Beginn ist in diesem Buch ein umfassendes Beispiel ei-nes Krankenhaus-Betriebsvergleichs zu finden. Anschliessend wer-den Schritt für Schritt Lösungen zu den folgenden Fragen präsen-tiert: 1. Wie lässt sich ein Krankenhaus beschreiben? 2. Wie kön-nen ähnliche Krankenhäuser ermittelt werden? 3. Welche Kennzah-len und Grafiken ermöglichen diskussionsfähige Krankenhausver-gleiche? Dazu werden neuentwickelte «dichte» Grafiken verwendet.

Wolfram Fischer

Neue Methodenfür Krankenhaus−Betriebsvergleiche

Ein Werkstattbuch zur Visualisierung DRG−basierter Daten

Wolfram Fischer

Statistische Grafiken zur Beurteilung von Patientenklassi fikati-onssystemen

dargestellt am Beispiel der pädiatrischen Sicht auf das APDRG-System

2008, 169 S., 81 Tab. und meist farbige Abb., kt.e 29.90 / SFr. 45.00ISBN 978-3-905764-03-1 (ZIM)

Auswertungen von DRG-Daten tendieren zur Unübersichtlichkeit. Indiesem Buch wird gezeigt, wie es mit «dichten» Grafiken möglichwird, einen Überblick zu schaffen, und wie gleichzeitig Problembe-reiche sichtbar gemacht werden können.

Wolfram Fischer

Statistische Grafiken zur Beurteilungvon Patientenklassifikationssystemen

dargestellt am Beispiel der pädiatrischen Sichtauf das APDRG−System

www.fischer-zim.ch / verlag

Neue Grafiken zur Datenvisualisierung - fischer-zim.ch · ZIM – Zentrum für Informatik und...

Documents