+ All Categories
Home > Documents > UBE_HS12_Statistik1_Ordner_Issuu

UBE_HS12_Statistik1_Ordner_Issuu

Date post: 17-Mar-2016
Category:
Upload: uniseminar
View: 214 times
Download: 0 times
Share this document with a friend
Description:
 
40
UNISEMINAR
Transcript
Page 1: UBE_HS12_Statistik1_Ordner_Issuu

UNISEMINAR

Page 2: UBE_HS12_Statistik1_Ordner_Issuu
Page 3: UBE_HS12_Statistik1_Ordner_Issuu

Sem

inar

Theorie

Aufgaben

Übu

ngen

Prüfung

enExtras

Page 4: UBE_HS12_Statistik1_Ordner_Issuu

Einleitung

Einführung in die Statstik für Wirtschafts- und Sozialwissenschaften I

Assessment

Bern, Dezember 2012

Page 5: UBE_HS12_Statistik1_Ordner_Issuu

Einleitung uniseminar.ch

Herzlich Willkommen bei Uniseminar

Vorwort

Ziel von Uniseminar ist es, Dich optimal auf Deine Prüfungen vorzubereiten und Deine Prü-

fungsvorbereitung an der Universität Bern so ezient wie möglich zu gestalten. Um dieses Ziel

zu erreichen, haben wir ein dreiteiliges Konzept entwickelt, das sich nun mehrere Jahre als grosse

Hilfe für die Studenten bewährt hat. Dieses besteht zum einen aus sehr umfangreichen Lernun-

terlagen in Form eines Ordners, perfekt darauf abgestimmten Karteikarten und dazu passenden

Prüfungsvorbereitungsseminaren am Ende des Semesters. Damit werden sämtliche Inhalte aus

den Vorlesungen und Übungen in einfacher und anschaulicher Form kompakt zusammengefasst.

Gleich zu Beginn des Semesters bieten wir Dir deshalb unsere umfangreichen Lernunterlagen

in Form eines Ordners und perfekt darauf abgestimmten Karteikarten an. Diese beiden Lehr-

mittel solltest Du im Selbststudium bereits während des Semesters begleitend zur Vorlesung

verwenden.

Am Ende des Semesters empfehlen wir Dir zur gezielten Prüfungsvorbereitung unsere Seminare

zu besuchen, wo wir Dir in acht Stunden nochmals die essentiellsten Aufgaben und Konzepte

näherbringen und Dich so optimal auf Deine Prüfungen vorbereiten. Dieser dreiteilige Ansatz

ermöglicht Dir mit einer ausgewogenen Mischung verschiedener aufeinander abgestimmter Me-

dien Deinen Lernerfolg nachhaltig zu verbessern.

-1-

Page 6: UBE_HS12_Statistik1_Ordner_Issuu

Einleitung uniseminar.ch

Aufbau

Dieser Ordner soll Dir als Lernhilfe zur ezienten Prüfungsvorbereitung der Statistikprüfungen

dienen und umfasst zwei zentrale Teile. Wir möchten Dir im Folgenden einen Überblick über

den Aufbau des Ordners geben.

1. Theorie: Das Theorieskript fasst in einfacher und übersichtlicher Form den gesamten

Sto des 1. Semesters 2012/2013 zusammen und erklärt diesen anhand anschaulicher

Beispiele. Am Ende ndest Du ein Stichwortverzeichnis, welches Dir bei allfälligen Fragen

schnellstmöglichst Zugri auf das erforderliche Wissen verschat.

2. Prüfungen: Beginne früh damit bisherige Prüfungen zu lösen, denn nur so gewinnst Du

das nötige Verständnis für deren Aufbau. Du wirst erkennen, was für die Prüfung relevant

ist und kannst Dich gezielt darauf vorbereiten. Dazu haben wir Dir vier Prüfungen mit

ausführlichen Lösungswegen zusammengestellt, genau so, wie auch Deine Prüfung werden

kann.

-5-

Page 7: UBE_HS12_Statistik1_Ordner_Issuu

Sem

inar

Theorie

Aufgaben

Übu

ngen

Prüfung

enExtras

S

Page 8: UBE_HS12_Statistik1_Ordner_Issuu

Seminar

Einführung in die Statstik für Wirtschafts- und Sozialwissenschaften I

Assessment

Bern, Dezember 2012

Page 9: UBE_HS12_Statistik1_Ordner_Issuu

Seminar uniseminar.ch

Ziel und Inhalt

Am Ende des Semesters empfehlen wir Dir unsere gezielten Prüfungsvorbereitungsseminare zu

besuchen. In zwei vierstündigen Seminarblöcken zeigen wir Dir dabei welche Themen für das

erfolgreiche Bestehen Deiner Prüfung essentiell sind und erarbeiten mit Dir gemeinsam ezi-

ente Strategien um die spezischen Aufgabentypen gezielt anzugehen. Dabei wird Dir nur das

Allerwichtigste an Theorie kurz und prägnant erklärt und repetiert. Der Fokus des Seminars

liegt im Lösen von Prüfungsaufgaben wobei wir Dir mit strukturierten Vorgehensweisen einen

zielgerichteten Ansatz aufzeigen, wie Du die Prüfung optimal lösen kannst.

Während dem Seminar werden deshalb zu 30% Grundkenntnisse und theoretische Vorlesungs-

inhalte behandelt und erarbeitet. 70% der Zeit nehmen wir uns, um Prüfungsaufgaben zu

bearbeiten und eziente Prüfungsstrategien zu besprechen.

Unsere erfahrenen Dozenten zeigen Dir auch wichtige Tipps und Tricks um Deine Prüfungs-

chancen zu optimieren. In den Pausen und nach Seminarende hast Du zudem die Möglichkeit,

den Dozenten individuelle Fragen zu stellen, um letzte Unklarheiten zu klären.

Unterlagen

Die Seminarunterlagen werden entweder auf unserer Homepage www.uniseminar.ch unter 'Mein

Account' online bereitgestellt oder im Seminar vor Ort ausgeteilt. Sobald Du Dich für das

Seminar angemeldet hast, wirst Du rechtzeitig informiert, wenn die Unterlagen für Dich zur

Verfügung stehen.

Seminarleitung

Sämtliche Kurse von Uniseminar werden von erfahrenen Doktoranden geleitet und betreut. Al-

le Dozenten verfügen über langjährige Unterrichtserfahrung an diversen schweizerischen und

europäischen Universitäten und wissen deshalb genau Bescheid, wo Probleme bei den Studie-

renden auftreten können. Weitere Infos zu Deinem persönlichen Seminarleiter und zu unseren

Dozenten im Allgemeinen ndest Du auf unserer Webseite www.uniseminar.ch in der Rubrik

'Über uns'.

Anmeldung

Unter www.uniseminar.ch kannst Du Dich jederzeit für die Seminare anmelden.

Page 10: UBE_HS12_Statistik1_Ordner_Issuu

Seminar uniseminar.ch

Page 11: UBE_HS12_Statistik1_Ordner_Issuu

Theorie

Aufgaben

Übu

ngen

Prüfung

enExtras

T

Page 12: UBE_HS12_Statistik1_Ordner_Issuu

Theorie

Einführung in die Statistik für Wirtschafts- und Sozialwissenschaften I

Assessment

Bern, Dezember 2012

Page 13: UBE_HS12_Statistik1_Ordner_Issuu

Inhaltsverzeichnis

1 Einführung 1

2 Beschreibung von Daten 3

2.1 Zentrale Begrisbestimmungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.2 Graphische Darstellung von Daten . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2.1 Kategorielle Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2.2 Metrische Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3 Quantitative Beschreibung von Daten . . . . . . . . . . . . . . . . . . . . . . . . 15

2.3.1 Lagemasse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.3.2 Streuungsparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3 Wahrscheinlichkeitsrechnung 29

3.1 Wahrscheinlichkeitsbegrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2 Bedingte Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.3 Stochastische Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4 Zufallsvariablen und ihre Verteilungen 38

4.1 Diskrete Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.2 Wahrscheinlichkeitsfunktion und Verteilungsfunktion . . . . . . . . . . . . . . . 39

4.3 Erwartungswert und Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.4 Stetige Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.5 Dichte und Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.6 Erwartungswert und Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.7 Rechnenregeln für Wahrscheinlichkeiten und Kennzahlen . . . . . . . . . . . . . 49

5 Verteilungen & Grenzwertsätze 51

5.1 Wichtige Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.1.1 Bernoulliverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.1.2 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5.1.3 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

5.1.4 Die Gleichverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

5.1.5 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

Page 14: UBE_HS12_Statistik1_Ordner_Issuu

5.1.6 Die χ2-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

5.1.7 t-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.1.8 F -Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.1.9 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.1.10 Gammaverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.2 Wichtige Grenzwertsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

6 Grundlagen der statistischen Verfahren 71

6.1 Schätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

6.2 Kondenzintervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6.3 Statistische Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6.3.1 Einseitige und zweiseitige Tests . . . . . . . . . . . . . . . . . . . . . . . 81

6.3.2 Fehlerarten bei Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . 83

6.3.3 Testentscheid mit dem p -Wert . . . . . . . . . . . . . . . . . . . . . . . . 85

7 Univariate Verfahren 87

7.1 Kondenzintervalle für den Mittelwert bei bekanntem σ . . . . . . . . . . . . . . 87

7.2 Kondenzintervalle für den Mittelwert bei unbekanntem σ . . . . . . . . . . . . 89

7.3 Kondenzintervalle für die Varianz (µ unbekannt) . . . . . . . . . . . . . . . . . 92

7.4 Kondenzintervall zum Anteilswert . . . . . . . . . . . . . . . . . . . . . . . . . 94

7.5 Kondenzintervalle für Quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

7.6 Exakter Binomialtest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

7.7 Einfacher Gauss-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

7.8 Einfacher t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

7.9 Der χ2-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

8 Bivariate Verfahren 105

8.1 Zwei kategorielle Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

8.1.1 Darstellung des Zusammenhangs . . . . . . . . . . . . . . . . . . . . . . 106

8.1.2 Zusammenhangsmasse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

8.1.3 χ2-Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

8.2 Zwei binäre Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

8.2.1 Die Odds-Ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

8.3 Ein kategorielles, ein numerisches Merkmal . . . . . . . . . . . . . . . . . . . . . 114

Page 15: UBE_HS12_Statistik1_Ordner_Issuu

8.3.1 Grasche Darstellung des Zusammenhang . . . . . . . . . . . . . . . . . 114

8.3.2 Quantizierung des Zusammenhangs für zwei Kategorien . . . . . . . . . 115

8.3.3 Quantizierung des Zusammenhangs für mehr als zwei Kategorien . . . . 115

8.3.4 Der F-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

8.3.5 Doppelter t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

8.3.6 Der Mann-Whitney-U-Test . . . . . . . . . . . . . . . . . . . . . . . . . . 119

8.4 Verbundene Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

8.4.1 Vergleichstest für gepaarte Stichproben . . . . . . . . . . . . . . . . . . . 123

9 Zusammenfassung der Tests und Vorgehensweise 126

Stichwortverzeichnis 128

Page 16: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Beschreibung von Daten uniseminar.ch

2 Beschreibung von Daten

2.1 Zentrale Begrisbestimmungen

Generell unterscheiden wir zwei Arten von Statistik: die deskriptive und die induktive Statistik.

Die deskriptive Statistik (oftmals auch beschreibende Statistik genannt) beschäftigt sich,

wie der Name schon sagt, mit der Darstellung von beobachteten Daten. Wir erheben dabei

eine gewisse Menge von Daten und stellen diese dar, machen aber keine darüber hinausgehen-

den Aussagen. Die Darstellung selbst geschieht durch Diagramme, oder durch Präsentation der

statistischen Kenngrössen, die wir später in diesem Kapitel besprechen.

Beispiel:

Wir betrachten zum Beispiel alle Flüge einer Airline in den USA im Januar 2001 und nden

dabei heraus, dass 80.6% davon pünktlich angekommen sind. Wir schliessen jedoch aus dieser

Aussage nicht, dass alle Flüge in den USA im Januar 2001 zu 80% pünktlich angekommen sind.

In der induktiven Statistik (oder schliessenden Statistik, auch Inferenzstatistik genannt)

beschäftigt man sich mit der Analyse von Daten unter Zuhilfenahme von mathematischen

Modellen. Wir versuchen, aufgrund von durch Beobachtung erhobenen Daten, Rückschlüsse

auf den beobachteten Vorgang zu ziehen, welche wir dann für Schlussfolgerungen, Prognosen

und Entscheidungen verwenden. So fragen wir uns also zum Beispiel, ob wir aufgrund der im

oben erwähnten Beispiel erhobenen Daten eine generelle Aussage über die Pünktlichkeit von

Flügen in den USA im Januar 2001 machen können.

Ein weiteres bekanntes Beispiel für die Anwendung der induktiven Statistik sind politische

Wahlprognosen. Beispielsweise werden vor einer Abstimmung eine bestimmte Anzahl Personen

nach ihrem Stimmverhalten befragt. Anhand dieses Beispiels können die Grundbegrie der in-

duktiven Statistik wie folgt eingeführt werden:

-3-

Page 17: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Beschreibung von Daten uniseminar.ch

Grundbegri Beschreibung

Grundgesamtheit/Population Die Gesamtheit der Personen oder Objekte, die wir in

unserer Studie betrachten, d.h. in unserem Beispiel also

die Stimmbürger der Schweiz.

Stichprobe Die Stichprobe ist eine Untermenge der Grundgesamt-

heit. Im Beispiel kann eine Stichprobe aus 500 zufällig

befragten Personen bestehen.

Merkmal/Variable Die Eigenschaft der Stichprobe oder Grundgesamtheit,

die wir statistisch untersuchen möchten. Im Beispiel ist

es das Stimmverhalten der Personen.

Daten/Werte Die Daten (oder Merkmalsausprägungen) sind die

Erscheinungsformen oder Werte, die aus der Beobach-

tung des Merkmals resultieren können. Sie sind die kon-

kreten Werte, die die Variable annimmt. Im Beispiel sind

es Ja/Nein-Werte, die das Stimmverhalten der Personen

beschreiben.

Parameter Ein Parameter ist eine spezische Eigenschaft der

Grundgesamtheit. Er beschreibt die Eigenschaften der

Verteilung wie beispielsweise die Streuung oder die

Lage, beispielsweise die Anzahl der Personen, die mit Ja

stimmen. Über den Parameter soll in der Statistik eine

Aussage formuliert werden, auch wenn statt der Grund-

gesamtheit nur eine Stichprobe untersucht werden kann.

-4-

Page 18: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Beschreibung von Daten uniseminar.ch

Beobachtung Ausprägung Merkmal X Ausprägung Merkmal Y . . .

1 x1 y1 . . ....

......

n xn yn . . .

Die in einem solchen Datensatz gegebenen Daten werden dann für gewöhnlich erst in einer

praktischen, aussagekräftigeren Tabelle aufbereitet, diese wird danach in ein Diagramm umge-

setzt. Die Art der Aufbereitung und Präsentation hängt von der Art der vorliegenden Daten

ab und ob ein oder mehrere Merkmale der Daten untersucht werden.

2.2.1 Kategorielle Daten

Der erste Schritt zur Präsentation kategorieller Daten ist die Erstellung der Häugkeitsta-

belle: zu jedem möglichen Wert, den das Merkmal annehmen kann, wird gezählt, wieviele

Individuen der Stichprobe diesen Wert annehmen. Diese Zahl nennt man die absolute Häu-

gkeit des Werts. Sie wird meist mit Hj bezeichnet, wobei j angibt, zu welcher der L Klassen

die Häugkeit gehört: j = 1, 2, ..., L.

Die einfachste Form der Darstellung ist das Säulendiagramm (oder Balkendiagramm).

Jedem Wert wird eine Säule zugeordnet, deren Höhe proportional zur Häugkeit ist. Eine Al-

ternative hierzu ist das Stabdiagramm, bei dem die Ausprägungen der Häugkeiten nicht als

Balken, sondern als einfacher Stab eingetragen werden.

Beispiel:

Zehn Kunden einer Firma werden befragt, wie sie mit dem Service der Firma zufrieden sind.

Zur Auswahl stehen die Werte Schlecht, Mittel, Gut, Sehr Gut. Die Befragung ergibt

Kunde Wert

1 Gut

2 Sehr Gut

3 Gut

4 Schlecht

5 Gut

Kunde Wert

6 Gut

7 Schlecht

8 Gut

9 Gut

10 Schlecht

-8-

Page 19: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Beschreibung von Daten uniseminar.ch

Die Häugkeitstabelle dazu ist

Wert Absolute Häugkeit

Sehr Gut 1

Gut 6

Mittel 0

Schlecht 3

Das zugehörige Säulendiagramm zeichnet sich dann als

Dagegen ist die relative Häugkeit gegeben durch

fj = Hj/n ,

sie gibt den relativen Anteil der Individuen an, die den gegebenen Wert annehmen.

Im Kreisdiagramm werden solche relativen Häugkeiten kenntlich gemacht. Jedes Kreisseg-

ment (= Kuchenstück) ist ächenproportional zur relativen Häugkeit.

-9-

Page 20: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Beschreibung von Daten uniseminar.ch

Beispiel:

Um das Kreisdiagramm zu zeichnen, erweitern wir die Tabelle aus dem letzten Beispiel um die

relativen Häugkeiten

Wert Absolute Häugkeit Relative Häugkeit In Prozent

Sehr Gut 1 0.10 10%

Gut 6 0.60 60%

Mittel 0 0.00 0%

Schlecht 3 0.30 30%

Das zugehörige Kreisdiagramm ist

2.2.2 Metrische Daten

Die wichtigste Darstellungsform für metrische Daten ist das Histogramm: Dazu werden die

Originaldaten in Klassen eingeteilt (sie werden sozusagen kategoriell gemacht), und dann als

Säulendiagramm dargestellt. Die Klassen müssen so gewählt werden, dass jeder Datenpunkt in

eine und nur eine Klasse fällt. In einer Häugkeitstabelle werden die Daten in Klassen eingeteilt

und dann werden die verschiedenen Klassen miteinander verglichen. Die Balken im Histogramm

sind Flächenproportional zur relativen Häugkeit der Klasse, zu der der Balken gehört. Bei der

Wahl gleichbreiter Klassen ist die Breite

-10-

Page 21: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Beschreibung von Daten uniseminar.ch

w =Maximaler Wert − Minimaler Wert

Anzahl Klassen,

dann ist auch die Höhe der Balken proportional zur Klassenhäugkeit.

Beispiel:

20 befragte Kunden einer Versandrma haben folgendes Alter angegeben:

27 43 33 54 32

76 45 62 43 44

55 19 41 41 23

51 61 47 38 31

Wir wählen eine Einteilung in 5 Klassen. Der maximale Datenwert ist 76, der minimale Daten-

wert ist 19. Die zu wählende Klassenbreite ist also

w =76− 19

5=

57

5= 11.4 ,

die wir zu 12 aufrunden. Die erste Klasse beginnt beim Minimum 19 und wir erhalten in 12er-

Schritten die Einteilung

Klasse 1 2 3 4 5

Bereich 19 . . . 30 31 . . . 42 43 . . . 54 55 . . . 66 67 . . . 78

Im nächsten Schritt berechnen wir die absoluten Häugkeiten. Wir zählen wie viele Datenwerte

in jede Klasse fallen:

Klasse Anzahl

1 3

2 6

3 7

4 3

5 1

Im Histogramm wird jede Klasse durch einen Balken dargestellt, dessen Höhe proportional zur

Häugkeit ist:

-11-

Page 22: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Beschreibung von Daten uniseminar.ch

Histogramm des Beispiels

Dabei ist es nicht relevant, ob sich im Diagramm die Säulen berühren oder nicht. Es ist aber

sehr wichtig, dass die Denition der Klassen lückenlos ist. Jeder Datenwert muss in eine Klasse

fallen und die Klassen dürfen sich nicht überlappen.

Die Grösse der Klassen, das heisst die Länge des Intervalls, muss hierbei nicht zwingend gleich

sein und auch eine Verwendung der absoluten Häugkeiten ist möglich. Allerdings ist hier zu be-

achten, dass die Dimensionen der Balken hier verzerrt sein können und das Diagramm weniger

aussagekräftig ist.

Zusammenfassend erstellt man also ein Histogramm immer nach der folgenden Vorgehensweise:

1. Wertebereich in Intervalle unterteilen: a0 < a1 < ... < al

2. Die absolute Häugkeiten Hj bzw. relativen Häugkeiten fj = Hj/N für jedes Intervall

Ij = (aj−1, aj] berechnen

3. Für jedes Intervall einen Balken der Breite Ij und Höhe Hj (Konvention 1) bzw.

der Höhefj

Länge(Ij)(Konvention 2)

4. Für identisch grosse Intervalle sind also beide Diagramme gleich

-12-

Page 23: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Wahrscheinlichkeitsrechnung uniseminar.ch

3 Wahrscheinlichkeitsrechnung

Inhalte dieses Kapitels:

• Grundlegende Notation für die Wahrscheinlichkeitsrechnung

• Rechenregeln für Wahrscheinlichkeiten

• Totale und bedingte Wahrscheinlichkeiten

Die Wahrscheinlichkeitstheorie stellt Regeln und Aussagen zur Verfügung, die es uns erlauben

unabhängig von konkreten Stichproben den Begri der Zufälligkeit einzufangen, diesen zu be-

schreiben und ezient damit zu rechnen.

Sie liefert auch Einsicht in den Zusammenhang zwischen einer idealisierten Zufallsverteilung

und den Stichprobenwerten die sie annähern je gröÿer die Stichprobe wird. Das Kernresultat

für die Statistik wird am Schluss des Kapitels das Gesetz der groÿen Zahlen sein, welches das

mathematische Fundament ist, auf dem die gesamte Statistik ruht.

Dazu sind allerdings eine Reihe von Grundbegrien nötig, die von den konkreten Beispielen

der letzten Kapitel abstrahiert und möglichst allgemein gehalten sind, damit möglichst viele

Sachverhalte damit beschrieben werden können:

• Ein Zufallsexperiment ist ein Vorgang, der

nach einer bestimmten Vorschrift ausgeführt wird,

beliebig oft wiederholbar ist, und

zufallsabhängig ein Ergebnis liefert.

• Ein Elementarereignis oder Ergebnis ist ein möglicher Ausgang des Experiments.

Ergebnisse werden mit kleinen Buchstaben a, b, ω, . . . geschrieben.

• Der Ereignisraum (oder Grundraum) Ω ist die Menge aller möglichen Ergebnisse des

Experiments.

-29-

Page 24: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Wahrscheinlichkeitsrechnung uniseminar.ch

• Ein Ereignis ist eine Teilmenge des Grundraums, also eine Menge aus keinem, einem

oder mehreren Elementarereignissen. Ein Ereignis tritt ein, wenn eines seiner Elemen-

te (Elementarereignisse) beim Experiment herauskommt. Ereignisse werden mit groÿen

lateinischen Buchstaben A,B, . . . beschrieben.

Beispiel:

Angenommen in einer Urne liegen ein roter, ein blauer und ein grüner Würfel. Das ziehen

eines Würfels aus der Urne entspricht einem Zufallsexperiment mit Ereignisraum Ω = r, b, g,

die Elementarereignisse sind r, g und b. Ein mögliches Ereignis wäre A = r, b. Dies ist das

Ereignis, dass der rote oder der blaue Würfel gezogen werden.

Ereignisse kann man mit Diagrammen beschreiben: Dabei wird der gesamte Ereignisraum Ω

als eine Box dargestellt und die Ergebnisse als Punkte in der Box. Ereignisse sind schraerte

Flächen in der Box. Hier ein paar wichtige spezielle Ereignisse als Text und als Diagramm:

• Das unmögliche Ereignis ist die leere Menge

∅ = . Das unmögliche Ereignis tritt nie ein,

weil es keine Elementarereignisse enthält.

Ω

• Ω Das sichere Ereignis ist der komplette Er-

eignisraum Ω. Im Beispiel wäre Ω = r, b, g das

sichere Ereignis.

Ω

• Das zu A komplementäre Ereignis besteht aus

den Elementarereignissen, die nicht in A liegen.

Im Beispiel: Wenn A = r das Ereignis roter

Würfel ist, dann ist A = b, g das Gegenteil

nicht roter Würfel.

ΩA

A

• Der Durchschnitt der Ereignisse A1 und A2

wird mit A1 ∩ A2 notiert, er enthält die Elemen-

tarereignisse, die sowohl in A1 als auch in A2 ent-

halten sind. Im Beispiel ist der Durchschnitt von

A = g, b und B = b dann A ∩B = b.

ΩA1

A2

A1 ∩ A2

-30-

Page 25: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Grundlagen der statistischen Verfahren uniseminar.ch

6 Grundlagen der statistischen Verfahren

Um aus den erhobenen Daten Rückschlüsse auf deren Verteilungen oder, expliziter, deren Pa-

rameter zu ziehen, existieren in der Statistik verschiedene Werkzeuge:

• Schätzer: Die Parameter können auf Basis der Stichprobe geschätzt werden.

• Kondenzintervalle: Der Bereich, indem der Parameter mit einer vorgegebenen Sicher-

heit liegt.

• Hypothesentests: Liefert eine Antwort auf die Frage, ob eine Vermutung bezüglich einer

Verteilung oder eines Parameters richtig ist.

6.1 Schätzer

Die Aufgabe der deskriptiven Statistik ist es, gegebene Daten zu beschreiben. Die induktive

Statistik hat dagegen zum Ziel, aus einer gegebenen Stichprobe auf die Bevölkerung zu schlies-

sen.

Hauptaufgabe der induktiven Statistik ist es daher, Information über einen unbekannten Para-

meter θ einer Grundgesamtheit zu erhalten, indem aus gezogenen Stichproben auf den Parame-

ter geschlossen wird. Parameter sind wie bereits gesehen die numerischen Gröÿen, die einen

Einuss auf die Verteilung der Grundgesamtheit (also der zugrunde liegenden unbekannten

Verteilungsfunktion) haben.

Im Abschnitt über die verschiedenen Verteilungen wurden zahlreiche Parameter beschreiben

und wie sie in den Wahrscheinlichkeitsfunktionen bzw. Dichten eingesetzt werden. Typische

Beispiele dazu sind

• Mittelwerte µ von Normalverteilungen, hier sind alle reellen Zahlen als Mittelwerte mög-

lich: Θ = R.

• Varianzen σ2 von Normalverteilungen, hier sind nur die positiven reellen Zahlen als Vari-

anzen denkbar: Θ = (0,∞). Eine Verteilung mit σ2 = 0 ist dabei keine Normalverteilung,

sondern eine (diskrete) Verteilung mit P (X = 1) = 1.

• Einzelwahrscheinlichkeiten p in Binomial- oder Bernoulliverteilungen, sie liegen zwischen

Null und Eins: Θ = [0, 1].

-71-

Page 26: UBE_HS12_Statistik1_Ordner_Issuu

Theorie - Grundlagen der statistischen Verfahren uniseminar.ch

In diesem Abschnitt sind diese Funktionen unbekannt, aber wir können Stichprobenwerte

X = (X1, . . . , Xn) ziehen, die gemäÿ der Wahrscheinlichkeitsfunktion (und den Parametern)

entstehen. Eine Schätzung besteht darin, aus genügend vielen Stichprobenwerten auf den Para-

meter zu schlieÿen. Die Unsicherheit, mit der ein Schätzwert θ für einen Parameter θ behaftet

ist, wird in diesem Abschnitt quantiziert.

Wir bezeichnen den unbekannten wenn (noch) keine konkrete Formel für die Schätzung exis-

tiert Parameter dabei stets mit einem kleinen Buchstaben (zum Beispiel θ), und den Schätzer

dafür mit einem Dach (zum Beispiel θ).

Der Schätzer θ ist eine Zufallsvariable, die aus der Stichproben-Zufallsvariable des letzten

Kapitels abgeleitet wird, während der Parameter θ selbst eine konkrete und feste Zahl ist, die

uns aber verborgen bleibt.

Ein Schätzer besitzt die folgenden Eigenschaften:

• Verzerrung (Lage/Zentrum): Man bezeichnet diese meist mit Bias = E(θ)−θ. Wenn der

Bias nicht Null ist, wurde der Schätzer nicht gut konstruiert, er ist systematisch verzerrt.

• Der Schätzer ist unverzerrt (unbiased) oder auch erwartungstreu, falls E(θ) = θ gilt.

Im Mittel schätzt der Schätzer den Parameter dann richtig.

• Variabilität (Streuung der Stichprobenverteilung): Var(θ) oder SA(θ) (Standardfehler

des Schätzers). Sie gibt an, wie stark der Schätzwert variiert, wenn verschiedene Stich-

proben gezogen werden.

Beispiel:

Wir wollen den Anteil der Personen in der Gesamtbevölkerung schätzen, der rote Haare hat:

• Der Parameter ist hier der Bruch

p =Anzahl Personen mit roten Haaren

Anzahl Personen gesamt,

-72-

Page 27: UBE_HS12_Statistik1_Ordner_Issuu

Prüfung

enExtras

P

Page 28: UBE_HS12_Statistik1_Ordner_Issuu

Prüfungen

Einführung in die Statistik für Wirtschafts- und Sozialwissenschaften I

Assessment

Bern, Dezember 2012

Page 29: UBE_HS12_Statistik1_Ordner_Issuu

Inhaltsverzeichnis

Übungsklausur 1 1

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Übungsklausur 2 10

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Übungsklausur 3 20

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Übungsklausur 4 31

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

Page 30: UBE_HS12_Statistik1_Ordner_Issuu

Übungsklausur 1 uniseminar.eu

Übungsklausur 1

Aufgaben

Aufgabe 1 (10 Punkte)

Wir betrachten einen Datensatz, in dem die jährlichen Ausgaben für Kultur (in CHF) der Ein-

wohner einer Schweizer Stadt erhoben wurden. Hier eine knappe Beschreibung der Stichprobe:

N 699

Mittelwert 219.86

Standardabweichung 51.802

Der Stichprobenmittelwert betrug demnach etwa 220 CHF. In einer früheren Untersuchung

wurde festgestellt, dass die Bürger dieser Stadt im Mittel 225 CHF pro Jahr für Kultur ausga-

ben. Es soll untersucht werden, ob sich das Mittel der jährlichen Ausgaben verändert hat.

a) Formulieren Sie dazu die Arbeits- und Nullhypothese und begründen Sie die Wahl eines

passenden Testverfahrens.

b) Wir führen den Test durch und erhalten als Output:

N 699

Mittelwert 219.86

Standardabweichung 51.802

Testwert 225

p 0.009

untere 95%-KI 216.01

obere 95%-KI 223.70

Formulieren Sie den Testentscheid zum 5%-Niveau auf zwei Arten.

c) Können wir sagen, dass die jährlichen Kulturausgaben im Mittel gesunken sind?

-1-

Page 31: UBE_HS12_Statistik1_Ordner_Issuu

Übungsklausur 1 uniseminar.eu

Aufgabe 2 (16 Punkte)

Bei der Erhebung aus Aufgabe 1 gaben die befragten Personen auch ihr Geschlecht an. Hier

die entsprechende Beschreibung der Stichprobe:

männlich weiblich

N 309 390

Mittelwert 222.71 217.59

Standardabweichung 51.101 52.305

a) Es soll untersucht werden, ob der wahre Mittelwert der Kulturausgaben bei Männern sich

von dem bei Frauen unterscheidet. Formulieren Sie Arbeits- und Nullhypothese.

b) Wir nehmen an, dass die Standardabweichungen bei beiden Verteilungen gleich sind, und

führen passende Tests durch. Der (Zweistichproben-)t-Test ergibt p = 0.195. Das 95%-

Konndenzintervall der Dierenz ist [−2.623, 12.862]. Der Wilcoxons-Rangsummentest

ergibt p = 0.145. Interpretieren Sie diese Ergebnisse und formulieren Sie den Testentscheid

zum 5%-Niveau auf drei Arten!

c) Jemand behauptet, die mittleren Kulturausgaben seien bei Frauen grösser als bei Män-

nern. Können Sie diese Behauptung anhand der Stichprobe beweisen oder widerlegen?

d) Ohne weitere Untersuchungen durchzuführen, möchte ein Statistiker unbedingt zeigen,

dass die mittleren Kulturausgaben bei Männern grösser sind als bei Frauen - auch wenn

er dafür schummeln muss. Was könnte er dafür tun? Kommentieren Sie kurz.

Aufgabe 3 (12 Punkte)

In einer anonymen Erhebung zu legalem und illegalem Filmkonsum in Bern wurden 298 Er-

wachsene befragt. Sie gaben an, wie oft sie ins Kino gehen und wie oft sie illegal erworbene

Filme schauen (Streams, Tauschbörsen u. ä.). Es ergab sich folgende Häugkeitstabelle:

Kino\illegal nie manchmal

nie 124 17 141

manchmal 63 94 157

187 111 298

a) Beschreiben Sie kurz das Ergebnis der Umfrage.

b) Berechnen Sie die Odds Ratio und formulieren Sie Ihr Ergebnis in einem kurzen Satz.

c) Hätten Sie bei einer solchen Fragestellung Unabhängigkeit erwartet?

d) Wie würden Sie vorgehen, um den Zusammenhang von legalem und illegalem Filmkonsum

genauer zu untersuchen? Welche Tests stehen zur Verfügung?

-2-

Page 32: UBE_HS12_Statistik1_Ordner_Issuu

Übungsklausur 1 uniseminar.eu

Aufgabe 4 (12 Punkte)

Wir werfen einen Blick in die Zukunft: Sie arbeiten bei einer Kfz-Versicherung, und Ihr Chef

beauftragt Sie, für die Anzahl der jährlichen Schadensfälle pro Versicherungsteilnehmer ein

Verteilungsmodell aufzustellen.

a) Mit welcher Verteilung würden Sie das modellieren? Wie hoch ist dann für einen Versi-

cherten die Wahrscheinlichkeit für genau k Unfälle im Jahr? Was ist der Erwartungswert

für die Anzahl der jährlichen Schadensfälle pro Versichertem?

b) Ihnen stehen nur die Daten einer unabhängigen Zufallsstichprobe von fünf Versicherten

mit folgenden Informationen über das vergangene Jahr zur Verfügung: Die ersten beiden

hatten je einen Schadensfall, der dritte hatte zwei Schadensfälle und die übrigen zwei

kamen schadensfrei durchs Jahr. Wie würden Sie daraus die Rate schätzen?

c) Wie hoch ist die Wahrscheinlichkeit für einen Versicherten in den kommenden drei Jahren

keinen Schadensfall zu haben?

-3-

Page 33: UBE_HS12_Statistik1_Ordner_Issuu

Übungsklausur 2: Lösung uniseminar.eu

Lösungen

Aufgabe 1 (16 Punkte)

In einem Datensatz sind unter anderem das Gehalt (in CHF pro Jahr) und die Berufserfahrung

(in Monaten) der Mitarbeiter eines Unternehmens erfasst.

a) Eine univariate Beschreibung der Stichprobe für Gehalt (in CHF pro Jahr) sieht folgen-

dermassen aus:

N 474

Mittelwert 34′419.57

Median 28′875.00

Modus 30′750

Standardabweichung 17′075.661

Spannweite 119′250

Minimum 15′750

10-Perzentil 21′000

25-Perzentil 24′000

30-Perzentil 24′825

50-Perzentil 28′875

70-Perzentil 34′500

75-Perzentil 37′162

90-Perzentil 59′700

(i) Was ist der im Datensatz am häugsten vorkommende Wert für Gehalt?

Lösung:

Der am häugsten vorkommende Wert eines Merkmals wird Modus genannt. Er be-

trägt 30′750.

(ii) Was ist der höchste im Datensatz vorkommende Wert für Gehalt?

Lösung:

Der kleinste Wert ist 15′750. Die Spannweite, also der Abstand zwischen kleinstem

und grösstem Stichprobenwert, beträgt 119′250. Damit ist der höchste Wert also

15′750 + 119′250 = 135′000.

-13-

Page 34: UBE_HS12_Statistik1_Ordner_Issuu

Übungsklausur 2: Lösung uniseminar.eu

(iii) Ist es möglich, mit den angegebenen Werten einen Boxplot für Gehalt zu zeichnen

(eventuell ohne Whiskers und Ausreisser)?

Lösung:

Wir können auf jeden Fall einen Boxplot ohne Whiskers und Ausreisser zeichnen: Es

werden die Kenngrössen Median, sowie 1. und 3. Quartil benutzt. Das 1. Quartil ist

gerade das 25-Perzentil, das 3. Quartil das 75-Perzentil. Gäbe es keine Ausreisser,

könnten wir auch einen kompletten Boxplot zeichnen. Die Whiskers würden dann

beim kleinsten und grössten Stichprobenwert enden. Hier liegt aber der grösste Wert

von 135′000 über der Schranke von

1.5 · IQR + 3. Quartil = 1.5 · (37′162− 24′000) + 37′162 = 56′905.

Da wir eventuelle weitere Ausreisser nicht kennen, können wir keinen kompletten

Boxplot zeichnen.

b) In der folgenden Teilaufgabe betrachten wir die Daten als Zufallsstichprobe aus der Po-

pulation der Angestellten in mittleren bis grossen Unternehmen. Eine Organisation für

Einkommensgerechtigkeit möchte zeigen, dass die Standardabweichung in der Verteilung

der Gehälter seit 20 Jahren zugenommen hat. Damals betrug sie etwa 14'900 CHF. For-

mulieren Sie Arbeits- und Nullhypothese. Begründen Sie, mit welchem statistischen Test

Sie diese prüfen können und erklären Sie kurz, wie Sie diesen durchführen würden.

Lösung:

• H1: Echte Standardabweichung ist grösser als 14'900 CHF.

• H0: Echte Standardabweichung ist nicht grösser als 14'900 CHF.

Hypothesen zur Standardabweichung können wir mit approximativem KI basierend auf

der Chiquadrat-Verteilung testen. Hier berechnen wir mit der Stichproben-

Standardabweichung die untere Kondenzschranke. Falls die untere Kondenzschranke

des 95%-Kondenzintervalls grösser ist als 14'900 CHF, können wir die Nullhypothese auf

dem 5%-Niveau verwerfen. Das heisst, in diesem Fall können wir mit 95%-iger Sicherheit

sagen, dass die Standardabweichung zugenommen hat.

-14-

Page 35: UBE_HS12_Statistik1_Ordner_Issuu

EExtras

Page 36: UBE_HS12_Statistik1_Ordner_Issuu

Notizen

Einführung in die Statstik für Wirtschafts- und Sozialwissenschaften I

Assessment

Bern, Dezember 2012

Page 37: UBE_HS12_Statistik1_Ordner_Issuu

Notizen uniseminar.ch

Page 38: UBE_HS12_Statistik1_Ordner_Issuu

Notizen uniseminar.ch

Page 39: UBE_HS12_Statistik1_Ordner_Issuu
Page 40: UBE_HS12_Statistik1_Ordner_Issuu