1
Wahn, Wunsch und Wirklichkeitin der Statistik
Wie durch statistische Interpretationsfehler irrige Überzeugungen entstehen
13. Juni 2017, Planetarium Nürnberg
Katharina Schüller
2
Warum ist dieser Ring so wertvoll?
1Rohmaterial besorgen (Gold, Rohdiamant)
2Säuberung und Materialaufbereitung (Gold
extrahieren und Diamant schleifen)
3Material zu Schmuckstück zusammenfügen
4Interpretation hinzufügen (der Tiffany
Stempel)
Wert und Wahn entstehen in Schritt 4 Quelle: Tiffany
3
Agenda
▪ Einführung
▪ Medien und Verbrauchermeinung
▪ Politisches Handeln
▪ Rechtsprechung
▪ Fazit
4
Einführung
5
Einführung
▪ Liefert Zahlen für rationale Entscheidungen
▪ Hinter jeder Mathe-Aufgabe steht ein Wert, der richtig oder falsch ist (Schule)
▪ Kopf weiß: bei Statistik geht um Wahrscheinlichkeiten (sehen aber auch aus wie exakte Zahlen)
▪ Bauch erwartet: „mathematische“ Aussagen – so werden Statistiken aufgefasst
▪ Statistische Analysen schaffen eine scheinbare Sicherheit – das Problem wird mit Big Data noch zunehmen
“There are a lot of small data problems that occur in big data. They don’t disappear because you’ve got lots of the stuff. They get worse.” (Tim Harford)
Vorstellung von Statistik
6
▪Hilft Big Data dabei, schwangere Kundinnen zu identifizieren – womöglich bevor diese es selbst wissen?
▪Oder ist das nur ein Beispiel für das Statistische Gesetz der sehr großen Zahlen?
Wir suchen Muster, um in komplexer Welt zu überleben (schnelles Denken).
Aber Statistical Literacy erfordert langsames Denken.
„Nobody wants data. What they want are the answers.“ (David Hand)
6
Warum Statistical Literacy?
Öl?
Ziemlich oldschool oder?!
Daten sind das neue schwarze Gold,
Google Analytics files,…
Facebook Credits mein Mädchen!
Quelle: Pixabay
7
Einführung
• Was ist Entscheidungskompetenz?
• Wichtige Fähigkeit, die von Managern und Politikern verlangt wird
• Kompetenz, mit Unsicherheit umzugehen
• Falsche Denkmuster:
• Es gibt genau eine richtige, gute und Erfolg versprechende Lösung, die man nur finden muss
• Es gibt mindestens eine falsche, schlechte, zum Scheitern verurteilte Alternative
• Variante für Journalisten:
• Es gibt etwas „Wahres“ und die Wahrheit ist dauerhaft
• Es gibt etwas „Falsches“, „Schlechtes“, das ein Journalist aufdecken muss
• Realität: Zufall, Unsicherheit, Ambivalenzen
„Es gibt ein Gentlemen‘s Agreement unserer Medien, dass im Dienste einer guten Sache die Wahrheit nicht so wichtig ist.“ (Walter Krämer)
Typische Denkmuster
8
Einführung
• Statistisches Denken heißt: Umgang mit Risiken und Unsicherheiten
• In einer Informationsgesellschaft gibt es immer mehr und immer mehr widersprüchliche Daten Unqualifizierte Überinformiertheit
• Datenanalyse allein bringt keine 100% Sicherheit
• Unsicherheit auszuhalten ist umso schwieriger, je mehr es eigentlich um Moral geht, um „gut“ und „böse“, um „richtig“ und „falsch“
• Hilfs-Lösung zur Entscheidungsfindung:
• Wir treffen Annahmen über die Daten, um ihnen Bedeutung zu verleihen
• Daten + Annahmen über Daten = „sichere“ Aussage, „zwingender“ Schluss
• Wir vergessen dabei oft, dass es mehr als eine mögliche Annahme gibt
Fehlentscheidung, weil die Statistik beweisen soll, was zu den eigenen Annahmen passt
Geht es dabei um gesellschaftsrelevante Entscheidungen, so folgt:
Ein Mangel an statistischer Allgemeinbildung ist kein individuelles Problem, sondern ein gesellschaftliches.
Kernthese
9
Medien und Verbrauchermeinung
10
Medien und Verbraucher
Kursverlauf der Deutschen Bank Aktie
Deutsche Bank auf Schrumpfkurs: Bestraft der Kapitalmarkt eine
falsche Strategie?
„Deutsche Bank: Investoren haben kaum Hoffnung“ (Der Aktionär, 17.04.2015)
„Sorgen um Strategie lässt (sic!) Risikoprämie steigen“ (Handelsblatt, 21.04.2015)
Bekanntgabe der Strategie am 27.04.2015. „Kritik am Konzernumbau: Deutsche-Bank-Aktie schmiert
ab“ (Spiegel Online)
Quelle: Onvista
11
Medien und Verbraucher
Kursverlauf der Deutschen Bank Aktie, etwas länger
„Neue Strategie: Bank will wieder bei Übernahmen mitmischen“
(Handelsblatt, 29.01.2014)
Oder haben nur ein paar Investoren auf eine andere
Strategie spekuliert?
„Man kann den Medien eben nicht erklären, wie
Kapitalmärkte funktionieren.“ (Vorstand der DB auf der
Frühjahrssitzung 2015 des Regionalbeirats Bayern)
Quelle: Onvista
12
Medien und Verbraucher
Kritische Medien, Pharmalobby und Regenwald
Quelle: Facebook
13
Medien und Verbraucher
Wednesday 8 October 2014 03.43 BST*
Cancer tumours destroyed by berry found in Queensland
A single injection of the drug directly into melanoma models in the laboratory, as well as into cancers of the head, neck and colon in animals, destroyed the tumours long-term in more than 70% of cases. (...)
“Within five minutes, you see a purpling of the area (...) about 24 hours later, the tumour area goes black, a couple of days later you see a scab, and at around the 1.5 week mark, the scab falls off, leaving clean skin.” (...)
There was no evidence EBC-46 would be effective to treat metastatic cancers.
The drug is being developed as a pharmaceutical through QBiotics. The company is also examining the potential for a blushwood plantation. (...)
Even if [phase 1 human clinical trials] proved successful, it was unlikely the drug would replace conventionalchemotherapy treatment.
Kritische Medien, Pharmalobby und Regenwald
* Quelle: http://www.theguardian.com/society/2014/oct/08/cancer-tumours-destroyed-by-berry-queensland-rainforest
14
Medien und Verbraucher
Published: October 1, 2014*
Intra-Lesional Injection of the Novel PKC Activator EBC-46 Rapidly Ablates Tumors in Mouse Models
Intra-lesional chemotherapy for treatment of cutaneous malignancies has been used for many decades. Here we describe a novel diterpene ester, EBC-46, and provide preclinical data supporting its use as an intra-lesional treatment. (...) EBC-46 was purified from the kernels of the fruit from Fontaineapicrosperma, was provided by QBiotics Ltd.. (...)
Our results demonstrate that a single intra-lesional injection of EBC-46 causes PKC-dependenthemorrhagic necrosis, rapid tumor cell death and ultimate cure of solid tumors in pre-clinical models ofcancer. (...)
Animal ethics statement
Mice were humanly euthanized by asphyxiation at the end of the experiment
Kritische Medien, Pharmalobby und Regenwald
* Quelle: http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0108887
15
Politisches Handeln
16
Politisches Handeln
Staatsgarantien
People queuing outside a branch in Golders Green, London, on 14 September 2007, to withdraw theirsavings due to fallout fromthe subprime crisis.
* Quelle: https://en.wikipedia.org/wiki/Northern_Rock#/media/File:Northern_Rock_Customers,_September_14,_2007.jpg
17
Politisches Handeln
Wie kommen die kleinen Löcher in unsere T-Shirts?
Woher kommen bloß die kleinen Löcher in den T-Shirts? Gibt es kleine Waschmaschinen-Geister, die sich während des Waschgangs an unseren Lieblingsshirts bedienen? (...) Ein Team der WDR-Servicezeit ist nun der Frage nachgegangen und hat eine wahrscheinliche Antwort gefunden. (...)
▪ Die vier Thesen:
1. Motten
2. Waschmaschine
3. Knöpfe und Co.
4. Die Hersteller
Geplanter Verschleiß
* Quelle:http://www.brigitte.de/wohnen/haushalt/loecher-t-shirts-ursachen-1255748/
18
Politisches Handeln
Christian Kreiß, Autor des Buchs "Geplanter Verschleiß", sagt gegenüber dem WDR dazu:
"Es ist mit Sicherheit geplant, denn so eine wichtige Größe wie die Haltbarkeit, die Lebensdauer von Gütern, das ist für einen Hersteller ganz extrem wichtig und das überlässt man nicht dem Zufall. Ich würde unterstellen (...), dass das festgelegt wird, wie lang diese T-Shirts ungefähr halten sollen.“
Die WDR Servicezeit kommt zu dem Fazit, dass es eine Kombination aus Reibung und minderwertiger Qualität ist, die die Löcher in T-Shirts verursacht. Der Preis, den wir für ein T-Shirt hinlegen, entscheidet aber im Zweifel nicht über die Qualität.
Geplanter Verschleiß
19
Politisches Handeln
Dienstag, 18. August 2015* Gezielt eingebaute Schwachstellen
Frankreich verbietet geplante Obsoleszenz
Nachdem die Garantie abgelaufen ist, geht der Laptop kaputt. Das ist nicht nur ärgerlich, sondern von manchen Herstellern so gewollt. Dem sagt Frankreich nun den Kampf an: Ab sofort ist die "geplante Obsoleszenz" strafbar. Doch einfach zu verfolgen ist das nicht. (...)
Denn der Kläger muss zunächst zeigen, dass die Lebensdauer bewusst verkürzt wurde, führt der auf Umweltfragen spezialisierte Anwalt Arnaud Gossement aus - aber was wäre dann die theoretische "normale" Lebensdauer? Gezeigt werden müsste auch, dass für die Verkürzung der Lebensdauer eine klar erkennbare "Technik" verwendet wurde. Und dann muss dem Hersteller auch Vorsatz nachgewiesen werden.
Geplanter Verschleiß
* Quelle: http://www.n-tv.de/wirtschaft/Frankreich-verbietet-geplante-Obsoleszenz-article15746266.html
20
Rechtsprechung
21
Rechtsprechung
XX. Oktober 2013* Polizei sucht Zeugen
Mord in der B-StraßeSeit Tagen wurde sie nicht gesehen, dann bricht die Feuerwehr die Tür ihrer Wohnung auf - und findet die 69-jährige Witwe tot. Sie wurde ermordet. Die Polizei sucht nun nach Zeugen, die das Opfer noch lebend gesehen haben.
XX. Januar 2014** Witwenmord in der M-Straße
Polizei verhaftet TatverdächtigenDrei Monate nach dem Mord an einer 69-jährigen in der B-Straße ist der mutmaßliche Täter gefasst worden. Das teilte das Polizeipräsidium am Donnerstag mit. Demnach waren im Oktober DNA-Spuren an der Leiche und in der Wohnung der Witwe gesichert worden, die inzwischen einem 36-Jährigen aus dem Landkreis E zugeordnet werden konnten.
DNA-Spuren: Daten und ihre Bedeutung
* Quelle: Süddeutsche Zeitung
** Quelle: Süddeutsche Zeitung
Namen und Orte wurden verändert. Genaue Quellen auf Anfrage.
22
Rechtsprechung
Argumentation der Staatsanwaltschaft
• An Tatort und Leiche Vielzahl von Mischspuren (d.h. verursacht von mindestens zwei Personen)
• Nicht alle können konkreten Personen zugeordnet werden
• Zur DNA des Tatverdächtigen passen Dutzende Spuren; biostatistische Berechnung: Übereinstimmung mit Wahrscheinlichkeit ca. 1:1 Bio
Überlegung, was ein Statistiker tun kann:
• Datenprüfung: gerichtsmedizinisches Gutachten umfasst ca. 500 Seiten und ca. 1000 Spuren – wurde evtl. etwas übersehen?
• Stimmen die biostatistischen Berechnungen (i.d.R. ja)
Ergebnis der Datenprüfung:
• Großteil der Spuren passen nur zum Tatverdächtigen unter Annahme von Allelic Dropout, Zusatzbanden ... frisch oder alt?
• Viele Spuren: multiple Bandenmuster eine oder mehrere Personen?
DNA-Spuren: Daten und ihre Bedeutung
23
Rechtsprechung
1. April 2015 Landgericht A
Mord im H-Viertel bleibt ungesühnt
• Das Landgericht A spricht einen 37-Jährigen vom Vorwurf frei, die Witwe Erna B. erdrosselt zu haben - obwohl es belastende Hinweise gibt.
• In der Wohnung der Toten sowie an deren Körper und Kleidung entdeckten Fahnder zahlreiche DNA-Spuren, die dem Angeklagten zugeordnet wurden.
• Neben den DNA-Spuren von Stefan W. war aber auch genetisches Material von drei bis vier weiteren Männern gefunden worden.
(...) Allerdings, sagte der Vorsitzende Richter Rudolf K. am Mittwoch bei der Urteilsbegründung, ergäben sich aus den Feststellungen, die hieraus gewonnen wurden, "erhebliche Zweifel" hinsichtlich der Täterschaft des Angeklagten. (...)
DNA-Spuren: Daten und ihre Bedeutung
* Quelle: Süddeutsche Zeitung
Fortsetzung folgt ...
24
Rechtsprechung
XX. September 2015* Strafprozess
Ist Richard R. wirklich der Kapuzenmann?
Der „Kapuzenmann“-Prozess ist noch nicht abgeschlossen. Es ist ein Präzedenzfall, wie groß die Kluft sein kann zwischen der tatsächlichen Beweislage und der Meinungsbildung eines Schwurgerichts. Nun muss der Bundesgerichtshof entscheiden. (...)
Es gebe zwar keine klassischen Beweise, aber eine schlüssige Indizienkette. (...)
Vor Gericht kommen dann auch weitere Merkmale des Täters zur Sprache: "basedowartige(hervorquellende) Augen". Das ist bei Richard R. nachweislich nicht der Fall. "Sehr dichte, stark geschwungene, rotblonde Wimpern; dichte, rotblonde Augenbrauen, Sommersprossen und rötliche Bartstoppeln." Richard R. ist dunkelhaarig. Erwähnenswert auch ihre Größenangabe: 1,70 bis 1,75 Meter. R. ist 1,85 Meter groß. Dass der „Kapuzenmann" höchstens 1,75 Meter maß, hatten übrigens auch Helmut K. und dessen Frau angegeben.
Zeugenaussagen, Indizien und Beweise
* Quelle: Morgenpost
Namen und Orte wurden verändert. Genaue Quellen auf Anfrage.
25
Rechtsprechung
Argumentation der Staatsanwaltschaft
• BKA NRW: Studie, dass Zeugen Körpergröße von Tätern oft unterschätzen
• Falsche Größenschätzung spricht nicht gegen Angeklagten
Überlegung, was ein Statistiker tun kann:
• Typische Unterschätzung? Wie wahrscheinlich unterschätzen mehrere Zeugen den Täter alle in gleichem Ausmaß?
• Zumal weitere Zeugen den Angeklagten gesehen haben und seine Körpergröße richtig einschätzen?
• Nullhypothese: Tatzeugen haben dieselbe Person gesehen wie diejenigen, die den Angeklagten gesehen haben
• Test auf Mittelwertsunterschiede der Schätzungen
Zeugenaussagen, Indizien und Beweise
26
Rechtsprechung
Ergebnis der Datenprüfung:
• Klare Signifikanz, auch bei Berücksichtigung Schätzunsicherheit (d.h. Varianz innerhalb der jeweiligen Zeugenaussagen)
• Statistische Berechnungen fließen ein in Revisionsbegründung
„Die richterliche Überzeugungsbildung darf nicht gegen die allgemeinen Denkgesetze verstoßen; dazu gehört auch die Wahrscheinlichkeitsrechnung.“ (Schweizer, M.: Beweiswürdigung und Beweismaß: Rationalität und Intuition)
Entscheidung des Bundesgerichtshofs im April 2016:
• Richard R. ist der Täter
Zeugenaussagen, Indizien und Beweise
27
Fazit
28
Statistik: Wunsch und Wirklichkeit
Falsches Verständnis von KorrelationOhne Idee, wie es zu der
Korrelation kommt, kann man nicht wissen, was diese
Korrelation zerstören könnte (Google Flu Trend Beispiel).
Sampling BiasIm Prinzip ist es möglich, jede
Nachricht auf Twitter zu analysieren, um die Stimmung in
der Bevölkerung zu erfassen. Aber Twitter repräsentiert nicht
die Weltbevölkerung
Wer und was fehlt?
Falsche Positivrate
Sammle so viele Daten, bis es einen Effekt gibt (Target
Beispiel).
Multiples Vergleichsproblem
Größe, Gewicht, Karies etc. um zu testen, ob Vitamine wirken.
Irgendwo wird immer ein Effekt gefunden.
29
Fazit
„Wenn wir mündige Bürger in einer modernen technologischen Gesellschaft möchten, dann müssen wir ihnen drei Dinge beibringen: Lesen, Schreiben und statistisches Denken, das heißt den vernünftigen Umgang mit Risiken und Unsicherheiten. “ (H. G. Wells)
„Statistik ist das Informationsmittel der Mündigen…“
30
Vielen Dank!
… und was können wir als Statistik-Experten dafür tun? Darüber würde ich gerne diskutieren!
Zum Weiterlesen:• Schüller, K. (2016): Statistik und Intuition: Alltagsbeispiele kritisch hinterfragt.
Heidelberg, Springer Spektrum.• https://www.confront.news/wp-content/uploads/2017/06/confront-2017-2.pdf• http://www.unstatistik.de