+ All Categories
Home > Documents > Stochastik einmal anders ||

Stochastik einmal anders ||

Date post: 20-Dec-2016
Category:
Upload: gerd
View: 241 times
Download: 8 times
Share this document with a friend
331
Gerd Fischer Stochastik einmal anders
Transcript
  • Gerd Fischer

    Stochastik einmal anders

  • Aus dem Programm ________ ---.,. Mathematik

    Stochastik fur Einsteiger von Norbert Henze

    Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik von Ulrich Krengel

    Lineare Algebra von Albrecht Beutelspacher

    Lineare Algebra von Gerd Fischer

    Analytische Geometrie von Gerd Fischer

    Analysis 1-3 von Otto Forster

    Analysis 1-2 von Ehrhard Behrends

    vieweg ________________ ~

  • Gerd Fischer

    Stochastik einmal anders Parallel geschrieben mit Beispielen und Fakten, vertieft durch ErUiuterungen

    rII vleweg

  • Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet tiber abrufbar.

    Prof. Dr. Gerd Fischer Fakultat flir Mathematik der Technische Universitat Mtinchen 85747 Mtinchen

    E-Mail: [email protected]

    1. Auflage Februar 2005

    Aile Rechte vorbehaiten Friedr. Vieweg & Sohn Verlag/GWV Fachverlage GmbH, Wiesbaden 2005

    Lektorat: Ulrike Schmickler-Hirzebruch/ Petra RuBkamp

    Der Vieweg Verlag ist ein Unternehmen von Springer Science+Business Media. www.vieweg.de

    Das Werk einschlieBlich aller seiner Teile ist urheberrechtlich geschtitzt. Jede Verwertung auBerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzuHi.ssig und strafbar. Das gilt insbe-sondere flir Vervielfiiltigungen, Obersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.

    Umschlaggestaltung: Ulrike Weigel, www.CorporateDesignGroup.de Textbearbeitung: Christoph Eyrich, Berlin

    Gedruckt auf siiurefreiem und chlorfrei gebleichtem Papier.

    ISBN-13: 978-3-528-03967-7 e-ISBN-13: 978-3-322-80249-1 001: 10.1007/978-3-322-80249-1

  • Herrn Hanns Klinger gewidmet

    Vorwort

    Dieser Text ist entstanden aus mehreren Vorlesungen flir Studierende mit Mathe-matik als Nebenfach und Veranstaltungen zur Lehrerfortbildung an der Heinrich-Heine-Universitat Diisseldorf. Sie dienten einer erst en Einflihrung in die Frage-stellungen und Methoden der Wahrscheinlichkeitsrechnung und Statistik (kurz Stochastik) sowohl flir Studierende, die solche Techniken in ihrem Fach benoti-gen, als auch fiir Lehrer, die sich flir den Unterricht mit den notigen fachlichen Grundlagen vertraut machen wollten. Der Inhalt eines solchen Kurses ist ziemlich kanonisch, auch die meisten Lehr-plane fiir die Oberstufe des Gymnasiums wahlen diesen Weg. In Kapitel 1 iiber die Beschreibende Statistik werden erhobene Daten aufbereitet und durchleuch-tet. Die behandelten Probleme trifft man im taglichen Leben an, die benotigten mathematischen Hilfsmittel sind zum groi3ten Teil sehr elementar. Dies ist ein idealer Einstieg und eine hervorragende Grundlage flir die Beschaftigung mit den Themen spaterer Kapitel. Kapite12 fiihrt in die Wahrscheinlichkeitsrechnung ein, hier beginnt der Zufall zu regieren. Die in der beschreibenden Statistik gefundenen Rechenregeln filr Haufig-keiten sind eine gute Motivation fiir den abstrakten Begriff der Wahrscheinlich-keit, die bei Merkmalen erprobten Begriffe finden sich analog bei Zufallsvariablen wieder. Man kann zwar in der Wahrscheinlichkeitsrechnung nicht mehr erreichen, als aus bekannten (oder als bekannt angenommenen) Wahrscheinlichkeiten ande-re, noch unbekannte Wahrscheinlichkeiten zu berechnen, aber dabei treten viele iiberraschende Ergebnisse auf. Hohepunkt ist die Normalverteilung, da ist im Hintergrund einige klassische nicht-triviale Analysis im Spiel. In der elementa-ren Wahrscheinlichkeitsrechnung betrachtet man nur endliche Ergebnismengen. Zum besseren Verstandnis der Normalverteilung und der Ausgangssituation bei Schatzungen und Tests ist es hilfreich, auch ein wenig iiber unendliche Ergebnis-mengen und stetige Verteilungsfunktionen zu wissen. Das wird in sehr kompri-mierter Form in Abschnitt 2.9 beschrieben. Wahrend der Inhalt der erst en beiden Kapitel bis auf den begriffiichen Rahmen schon zu Zeit en von GAUSS bekannt war, sind die Kapite13 und 4 iiber Schiitzen und Testen Kinder des 20. Jahrhunderts und stellen dementsprechend deutlich hohere Anforderungen an den Leser. Die Durchfiihrung der Verfahren ist Ge-genstand des Grundkurses, an die genaueren mathematischen Hintergriinde wird man sich wohl nur in einem Leistungskurs wagen. Diese Themen gehoren zur sogenannten beurteilenden (oder schliefJenden) Statistik, einer Kombination von beschreibender Statistik mit Wahrscheinlichkeitsrechnung. Wenn man in der be-schreibenden Statistik nicht alle Daten erheben kann oder will, so beschrankt man sich auf eine oder mehrere Stichproben, das Ergebnis erlaubt eine Schatzung

  • vi

    der unbekannten wirklichen Werte. Ftir die GroBe der Abweichung des geschatz-ten vom wirklichen Wert kann man nur noch Wahrscheinlichkeiten angeben. Die popularsten Beispiele ftir die dabei auftretenden Probleme sind Umfragen vor Wahlen oder Hochrechnungen am Wahlabend. Eine genauere Kenntnis der Unsi-cherheit hatte wohl manche verfrlihte Siegesfeier vermieden, damit aber andrer-seits den Unterhaltungswert der Wahlnacht geschmalert. Was tiberall in der Mathematik gilt, ist noch ausgepragter in der Stochastik: Es geht nichts liber markante Beispiele, die geeignet sind, die Anstrengungen in der Theorie zu rechtfertigen. Urn dem Leser dabei moglichst viel Freiheiten zu geben, ist der Text durchgehend parallel geftihrt: links die Beispiele, rechts die Fakten. Und weil Beweise und theoretische Erganzungen nicht von jedermann gleich geliebt sind, gibt es daftir einen Anhang mit Erliiuterungen. Ich hoffe, dass die Leser sich mit diesem Trio anfreunden konnen. Ftir die Verwendung im Unterricht an Gymnasien oder anderen Stellen hat die Teilung des Textes einen besonderen Vorteil: Zu den meisten Beispielen werden Schtiler und Studierende einen leichten Zugang finden. Die systematische mathe-matische Darstellung auf den rechten Seiten kann man je nach Interesse mehr oder weniger grtindlich studieren. Zur Ausftihrung der meisten n6tigen Rech-nungen gentigt einer der zum Schulgebrauch tiblichen Taschenrechner; ich habe einen "Equation Editor" verwendet, der auch tiber Statistikfunktionen verftigt. Ftir aufwandigere Rechnungen und die Einftigung der vielen Graphiken wurde das Programmpaket MAPLE verwendet. Es ist sicher verwegen, wenn ein absoluter Amateur auf dem Gebiet der Stochas-tik wie der Autor einen solchen Text schreibt. Aber er hofft, dass die viele Mtihe, die er gehabt hat, die Grundlagen zu lemen, seine Darstellung ftir Leidensge-nossen verstandlicher macht. Ich habe ungeniert aus vielen Quellen gesch6pft: insbesondere den Vorlesungnotizen meiner beiden Dlisseldorfer Kollegen Hanns Klinger und Klaus JanBen (der mich mit unermtidlicher Geduld immer wieder zu Korrekturen und Verbesserungen tiberedet hat), den leider vergriffenen Studien-briefen des DIFF [St] und den professionellen Texten von KRENGEL [Kr] und HENZE [He]. Brigitte Kaletha hat einige der Beispiele beigetragen und ausgear-beitet, Petra Gemein, Brigitte Singhof, Gabriele SliB und Oliver Wagener haben die TEX-Vorlagen erstellt und die Graphiken produziert. Ihnen allen sei gedankt, ebenso dem Verlag, der es gewagt hat den unzahligen Btichern tiber Stochastik noch ein weiteres hinzuzuftigen.

    Mtinchen, im Februar 2005 Gerd Fischer

  • Inhaltsverzeichnis

    1 Beschreibende Statistik 3 1.1 Individuen und ihre Merkmale 3 1.2 Haufigkeiten.. 7 1.3 Mittelwerte . . . . . . . . . . 15 1.4 StreuungsmaJ3e . . . . . . . . 29 1.5 Vergleich verschiedener Merkmale 37

    2 Wahrscheinlichkeitsrechnung 57 2.1 Relative Haufigkeit und Wahrscheinlichkeit . . . . . . . 57 2.2 Gleichverteilung und Zufallsvariable . . . . . . . . . . . 71 2.3 Urnenmodelle und Simulation von Zufallsexperimenten 77 2.4 Binomialverteilung und hypergeometrische Verteilung . 89 2.5 Unabhiingige Ereignisse und bedingte Wahrscheinlichkeiten . 99 2.6 Ubergangswahrscheinlichkeiten und Multinomialverteilung 109 2.7 Erwartungswert, Varianz, Covarianz. . . . . . . . . 123 2.8 Die Gaul3-Verteilung . . . . . . . . . . . . . . . . . 135 2.9 Kontinuierliche Ergebnisse und stetige Verteilungen 165

    3 Schatzungen 185 3.1 Punktschiitzungen........ 185 3.2 Maximum-Likelihood-Schiitzer 197 3.3 Intervallschiitzungen . . . . . . 199

    4 Testen von Hypothesen 211 4.1 Einseitiger Binomialtest ........... 213 4.2 Zweiseitiger Binomialtest . . . . . . . . . . . 223 4.3 Einseitiger Gaul3-Test bei bekannter Varianz 229 4.4 Zweiseitiger Gaul3-Test bei bekannter Varianz 241 4.5 Tests und Schatzungen ........ 247 4.6 Test bei unbekannter Varianz (t-Test) 251 4.7 Der x2-Test . . . . . . . . . . . . . . . 261

    Anhang 279 1.4 Streuungsmal3e . . . . . . . . . . . . . . . . . . . . . . 279 1.5 Vergleich verschiedener Merkmale . . . . . . . . . . . . 283 2.4 Binomialverteilung und hypergeometrische Verteilung . 289 2.5 Unabhangige Ereignisse und bedingte Wahrscheinlichkeiten . 290 2.6 Mehrstufige Experimente, Ubergangswahrscheinlichkeiten

    und Multinomialverteilung . . . . . 291 2.7 Erwartungswert, Varianz, Covarianz ............ 293

  • Vlll

    2.8 Die GauB-Verteilung . . . . . . . . . . . . . . . . . 2.9 Kontinuierliche Ergebnisse und stetige Verteilungen 4.6 und 4.7 Die r-Funktion von EULER ....... .

    Literaturverzeichnis

    Index

    302 312 321

    323

    325

  • Stochastik einmal anders

  • Beispiel (U"ifrugc in d uer Schule) Rill 1~'I!lplC'1 rllr C'III' \1I'1I~l' AI \"111 111(h\ulllt'll .... I C'III1' SdllllkhL.-,."'o( 11111 II Sdlilll'rli \\('Idl(' il.h'rklllllll" III C'lIIt' r (!mrrn~(' ,'rhot.,., .. "'t'nlC'lI . IlaURI ''011 111"111 ZM't"'k liN jt,wllu)o('ht j 'lI Stlllti>!lk /tl! Fllr ('illigI' IIlIh .. 11I'~{'IIfIt ~1('rklU"lt g'lwu \\ Ir IIII~hth(' At""POIJI;lIIlP;t'll 1111

    ~lNklllnl All"I,lrf..gIlUg(1I .\ I C;NIIII'Chl IIIJUlIIlith w{'iblial XJ - (;(' ''urll'>Jllilr IIfllllrhrh(' Zsthl Xl (:tllIlrt.. .. urt ()rt"'llfUIlf' X, ""' t\tlrpNltrn6l' rN:llt 'z hl X.. (;rllllli rilr 11.'11 Ilt'!'>udt dlt'!'.l .... &.~h~t~tl,~.l..'-' _______ ...J

    l l lll Ihl' AIl .. pn~III1R('1I 1Illllltt1ttllllst,h IIl'l'oChrPlhl"u III IIIlIth"II , 11111"""11 MI' ""' 1111 utIlIK('VIIi('rl "wliC'1I I)IIh.'1 hit' !C'I "kh lK,'i Mf,.hIlUI '\IIIII , " iO, q III ..... ilhl.' II . w"lwi 0 ~ 1II1n1l1lkh M IIUlI I M"'c'ihlkhM (,1I1""priC'hl 1)f'1 Mublwl X, 1M A N IlUg('bmrhl . odt" lIuth IM'!IoM"t C'II1 jIS;t' lIdt'.b lutt'n"11i \10'11' A (I ' E N 199(1 ~ " $ IO!')',)) . !3t.'1 Mui-wal X, kU1II1I'1i dw Hllfirt'I(,IIII,'u hoLf'

    I 2 J I "

    G

    - I--

  • 3

    Kapitel 1

    Beschreibende Statistik

    1.1 Individuen und ihre Merkmale Ganz allgemein gesehen beschMtigt sich die beschreibende Statistik mit M erk-malen von Individuen. Mathematisch gesehen sind die Individuen Elemente einer Menge M, die wir zur Vereinfachung als endlich annehmen, also

    mit n E N. Ein Merkmal (etwa eine Anzahl, Lange, Farbe, etc.) kann verschiedene Auspriigungen haben, die alle in einer anderen Menge A enthalten sein sollen. Dann ist die Erhebung eines Merkmals mathematisch gesehen eine Abbildung

    X : M ---> A, (3 f--+ X((3) . Zur Abkurzung nennt man eine solche Abbildung ein Merkmal. Fur die mathematische Beschreibung kann man ein Individuum durch die laufen-de Nummer, also (3j durch j ersetzen; dann wird einfacher

    M={l, ... ,n}. Bei den Auspragungen ist das schwieriger, weil sie vollig verschiedenartig sein konnen. Bei einer Anzahl ist A = N angemessen, bei einer Lange oder Tempera-tur A = lR, bei einer zoologischen Spezies A = {Lowe, Ente, ... }. Hier sieht man schon einen wesentlichen U nterschied: Anzahlen oder Spezies etwa sind diskrete Merkmale, Langen oder Temperaturen kontinuierliche. Da aber auch kontinuier-liche Merkmale nur mit begrenzter Genauigkeit gemessen werden konnen, ist der Ubergang zu diskreten Merkmalen in der Praxis flieEend. Urn das alles unter einen Hut zu bringen, ersetzt man auch diskrete Merkmale durch reelle Zahlen. Bei A = N c lR ist das offensichtlich, bei verschiedenartigen Spezies wahlt man eine Codierung dieser Spezies durch Zahlen. Dabei ist keines-falls klar, ob die Codierung so geschehen kann, dass die Differenz zwischen den Code-Zahlen ein MaE fur den Unterschied der Spezies ist. Fur die einheitliche mathematische Beschreibung ist ein Merkmal also schlieBlich eine Abbildung

    X: {l, .. . ,n}---> lR, jf--+X(j), und ublicherweise schreibt man Xj statt X(j) fUr dieses Merkmal des Individuums mit der laufenden Nummer j.

    n

  • \llIthl'UuttL","h ~~"'-t'11t"1I 1 .. 1 Iilt~, AU1
  • 1.1 Incli idu 11 lllld ihr M rkmal 5

    In der Praxis erhebt man oft mehrere Merkmale und vergleicht sie untereinander. Untersucht man insgesamt m Merkmale, so hat man Abbildungen

    Xi : M ----> lR fUr i = 1, ... ,m.

    Wir beschranken uns hier auf hochstens zwei Merkmale, die dann einfacher mit X, Y bezeichnet werden. Die beschreibende Statistik beschaftigt sich nun in erster Linie mit der Analyse eines Merkmals und dem Vergleich von mehreren Merkmalen. Das ist ziemlich einfach und erfordert nur ganz element are mathematische Hilfsmittel.

    Die Erhebung eines Merkmals geschieht haufig durch eine Umfrage. Das wesentli-che Problem dabei ist nicht die mathematische Auswertung, sondern die adaquate Auswahl und Formulierung der gestellten Fragen.

    Spannendere Probleme entstehen, wenn aus einer groBen Menge M' von Indivi-duen nur von einer Teilmenge M C M' ein Merkmal

    X: M={l, ... ,n}---->lR

    erhoben wird, und aus dem Ergebnis Eigenschaften dieses Merkmals in ganz M' abgeschatzt oder vorhergesagt werden sollen. Typisches Beispiel dafilr ist eine Umfrage vor einer Wahl. Man nennt die Werte X (1) , . .. , X (n) in einem solchen Fall das Ergebnis einer Stichprobe vom Umfang n. Die Auswahl von M C M' kann nach sehr unterschiedlichen Methoden erfolgen, zum Beispiel "zufallig". Damit kommt der Begriff "Wahrscheinlichkeit" ins Spiel, und man kann ilber M' hochstens noch Aussagen derart machen, mit welcher Sicherheit der Fehler der Vorhersage begrenzt werden kann. Auf diese wesentlich schwierigere Frage kommen wir in Kapitel 3 zurilck.

    n

  • llt' i .. piC'1 I ( DtJ rul ,..to9I1Wa}u) ,\111 1'1 S4'pl"ml)l" 2(.'1 r'"1I1 III df" BulltI" ..... ,,, ... I,hk )).'lIt!o( hl,,"1' -I P~li It..o II un Tli ; , " I'1>S I 11 P, i'li IIla.:IJ 'I;!lJ , " ,; S.1U .. tI~" , ,",)0( Iii IHUtl ,lrt; III i:....!it ,lIl1t Ii f}NJ '~j I I II f)')lJ !1)fJ lun Il

    1>"I)(,I"IIIII,h(' P,I./Inl.lUg.'))I'" \\IIIMI \\ 1I1i"'IIII"",h aur IIlIIt')lII- 1),'/111( 1 .. ,1'111' ~Pllllllki 1)11 II ..... \1"lkllllll \ 11111 :-1'(11. .. \ u ... pm~III1S:'1I h.lt kolllllllllU! elll' Ibl1lhK-kt'lt",\1-rt"II"",, Rill III t'lIWIII h.lt,...-h.t.K'KIIIIII ')lit, SI,tIMlillllt"UII'1i ,Idl !l'II,'1I

    -

    . -

    f III' I

    \11111 IM'.I.lIio .1,,,..,. 1M" d"r \ " .. 1' ...... 111111. f4 ""I1K \ntJ!:"li'"l1l1f'U \1011111.

    ..

    ..

    "'

    "'

    .... -

    " ...

    LI ,'n .'M f;._ HW 1'1~ Il10 __

    , ,

  • 1.2 Hliufigk it n 7

    1.2 Haufigkeiten 1st eine Erhebung abgeschlossen, so solI das Ergebnis in moglichst ubersichtlicher und einpragsamer Weise dargestellt werden. Wird ein Merkmal

    X: M----+lE.

    untersucht, so hat man die Werte von X, die mit

    Xl = X(l), X2 = X(2) , Xn = X(n) bezeichnet werden. Wesentlich fUr die Erhebung ist, dass ein Wert von X mehr-mals angenommen werden kann, d.h. die Xj muss en nicht alle verschieden sein. Daher sind folgende Bezeichnungen hilfreich: Die Menge

    X(M) = {all .. " ad c lE. mit paarweise verschiedenen al ... , ak bezeichnet man als Menge der Auspriigun-gen. Offensichtlich ist k ::; n. 1m Extremfall k = n ist das Merkmal fUr aIle Individuen verschieden. Fur beliebiges a E lE. bezeichnet (wie in der Statistik ublich)

    {X = a} := {j EM: Xj = a} = X-I (a) C M die Gesamtheit der Individuen, fiir die das Merkmal X die Auspragung a hat. Es gilt

    {X = a} "I 0 ~ a E X (M) . Die erste Zusammenfassung besteht nun darin, nur noch abzuzahlen, wie viele Individuen die Mengen {X = a} enthalten. Man nennt diese Anzahl (in Zeichen #)

    h(X = a) := #{X = a} die (absolute) Hiiufigkeit der Auspragung a und

    r(X = a) := ~h(X = a) die relative Hiiufigkeit der Auspragung a. Es ist

    Die Funktion

    h(X = al) + '" + h(X = ak) r(X = al) + ... + r(X = ak)

    lE.----+lE., a~r(X=a),

    n und l.

    (1.2.1 )

    hei13t Hiiufigkeitsverteilung des Merkmals X. Sie hat genau an den SteIlen aI, ... ,ak Werte ungleich Null. Man kann sie durch ein Stabdiagmmm oder ein

  • Bc is pid 2 ( K 1Jf1lt:1v,.OjJcn ) 1l,I' l\uI"IJt'rltri.B.'u nll.'r hi I\lIul"r dl'r drllll'l' ,lnIIlJl;ItIlJt,. ....... ,f" 1'lIlt'r (:rulIIl-..;IIu-It' \H'rd(", R('m,~u 1111' ErR,IJlII ... "' Vllnl,r,u ''''' 1M I",, 1;111 11("'11 IUlti 1:-,1.1 nil Alii ul"'llo,dl.lu 1, .. 1"'1 'M , .... 1'0.11' I>4Jf(,rt '" ,1'11' S""IIUI I Un. t 1)1I1"'!'oo' ('IIIIIIJI, (,IIIU' m-R'" WII1" 'i till' 11.,.h""fIlIRI' .h'r Eilllll~I ' liN 1)1'/11111111'11 dun It till' n,(I"'lIf"IJ.t!, Ii.'r \I ......... ,IIRI"" ," ... 1,1,1

    1 :l() " nJ I

    " .,

    J :1:1 ru

    " " 1:J1 " 'J 'I

    " 2 :1

    1;\'", II 7 K I :l{i 7

    " " 'I ,I

    I;ii I I, K :, 'I j:JK

    " " I

    I:l!) 2 -'l IHI

    " " :I :I 7 2 ..

    III 7 " 111 2 2 2 11:1 K "

    Ii III

    " II~ Ii " lUi 117 h

    11K 7 11'1 1:;(1 'I I!H 1!j1 2 I)II~' OI,n.Ii,lIulIg klllill IIlall IImil 1l.1,lulllj:, '"u'M) "I .. 1'111 "hl 'tRllIIUm 1111' !lqlll d, .. IlIIlIIr SdJrlIl .... ''lt ", "" I 1111 flu UII. . 1121 1:';\,11' .... 1 ... 11 \1 .. Ih .. lu'VIIIIIII' )1;'."'" IIlId "1I'i1' .... -..;, all."

    0' M

    ,

    "

    J .,

    r d.

    1:111 UIlm n,

    1111 ,',1' ';"1

  • Kreisdiagmmm darstellen. Das ist allerdings nur hilfreich, wenn k genugend klein ist.

    Bei einem Stabdiagramm ist zu beachten, dass nur die Hohe der Stabe von Bedeu-tung ist, sie gibt die relative Haufigkeit an. Die Breite der Stabe dient lediglich der deutlichen Sichtbarkeit. 1m Stabdiagramm kann man durch Anderung des MaBstabes auf der vertikalen Skala statt der relativen auch die absoluten Haufig-keiten anzeigen. Urn von den relativen zu den absoluten Haufigkeiten ubergehen zu konnen, muss man naturlich die Gesamtzahl n kennen.

    1st k sehr groB (vor allem im Vergleich zu n), so wird das Stabdiagramm leicht zu einem Datenfriedhof (fast aIle Grabsteine sind gleich hoch).

    3/11 2/n l/n

    r(X) = a k - 16, n - 20

    a

    In diesem Fall fasst man besser ahnliche A uspriigungen zu Klassen zusammen. Dabei ist nun wichtig, dass die Codierung der Merkmale durch reelle Zahlen sinn-voll ist, d.h. dass nahe beieinander liegende Zahlen ahnlichen Merkmalen entspre-chen. Entscheidend sind die Begriffe der (absoluten und relativen) kumulierten (d.h. "aufgehauften") Haufigkeiten. Fur 0: < f3 sind sie erklart durch

    h(o: :::; X < (3) #{j EM: 0: :::; Xj < f3} und r(o::::;X

  • I)", lUi .. wilt III.IUI, II ... , .. lit' "'1111111 .. ,.11111' i-.lllh'llulI~ III IJlIl ... II.wluu II lIIeI,! ,,d,r ulw .... uht he II l'" I"" ",Ih, SPit It." IK'I 1:11 IlIkl lin IIlwl UIIIIIIlM-U'ltIH- 11111('1\1'11 1111111 \11'11 ... l .. t EIIII' I~"'~'I

    Itll".q~ .. , ... tl' 1.IIIII'lhIllK \11,1( III l":h"''oI'III'llf,lht ful",I'nd,' "' IlIH-11t-

    " 2 I

    " 10 7

    ". I:IU HI n~1 n.~ l1C1 III lib 1:j2 ;,

    , !:i 1 tI 1 r.

    " .. ., .. .. ..

    d. IIIH n 1:1 II 0_-1 nw. nil II UI " (II

    I) ..... IIIKdMII I~f' II l"t,r..1II111 :.wht he' II.U"

    J.

    filii

    IItrl n.

    n" I ,n "t II, ". n. ... 1'.2~.

    I)nlM't "'''-nit-II chI' S"IIIt'1I dMllhrlM'I .. ic hlhm ill ""11 nllllfl1~ -n.,(hc,tl ~dll'lI hl~-I O!-,tlllllllrUrlllnll\'IIt'lI \ "I kIn-II

  • 1.2 Haufigkei n 11

    Wichtig ist dabei, dass fUr groBes n die Zahl m wesentlich kleiner ist (eine Faust-regel ist m ~ fo). Wir betrachten fUr i = 1, ... , m das halboffene Intervall [O:i-1,O:i[; die Menge

    {j EM: O:i-1 S Xj < O:i} c M heiBt die i-te M erkmalsklasse von X. Die Anzahl ihrer Elemente ist die kumulierte Raufigkeit

    h i := h(O:i-1S X

  • Beis pie l 3 ( lhul$JUJlbewkommcn) Ullnll .lit' \'arealllJII th'r h:1,\. ....... lIhnII .... III "111"111 IIL .. 1UW,lIul1I kitlill 1111111 J:klnll~ 11O'r\'I,rhdH'1\ IKI"f \(I~!.,ktu Dtt."wltul! lUlU IIL .. IIIIIII,'uhullIIlI tI ....... f'n"'I'IIIL" ....... Slnlbllkl'lI~ dH" IIII'hl 11111 P .. lillk,,' 1"'111111;1'11

    1111 Stlltil'lllMlw" ,J"ll1lml'h ;lOU I ISUI"IIIII 1111' I' !;'l"i AuWtl"'1I 1I1"'f !I,\. .. 1!.\IlI>-hltlt,.,nt'tl4MlIIkhlllllll'lI P'" ~11tI1it1 H'II ill~''''''III' ;1(; i~tlllc)U 111111 .. 11,.11"11 /Wl.~ I",,, II 111111 :1-', UUII I>~I 1I1111.,~('IH1I \\"'1111 1111'" .11(, I\.ln ........ , .. I ... II'U ........ alth tla ...... dll' IIIIUhl(kt'lll'1lllllhl /'1 111I1.I ..... I,I.,lli,l, 1I1l. .. rlll1'1I ,.,,,1,1 fli\. .. FIW'hlli!> , .... " .... , 1111:0>

    1-: III k'lllllut 'II!-ok I" ........ , 1I1~'oILllt 1I IIIIhKk"11 rl'l"ln" I hlUhll.kpll h, {III I lUll '-, (i" ':( I

    TIII,.,r ;, VII -i) ;m I I XlM), 2 :,un I ) ;12:1 II i~ I 2 "MI. " IMKI I ;112:1 S 76 I "'11M!. I IMKI I f) ~ml ):, !.IS I I IMMI. '"I (MMII I \J:-.tI I :1 "''(j t :} (Mill i 0011 7 uno 1'/0:1 I i Utlu, IfHxxl I 1 ()I)j 1;'- 'lIi IUIMMI. :1:1 UlltI.L 2'121 7 "~,

    SUllltIIl' ;Mi 7NI aMUMl

    1),1.tiIlI"l-h ',\'Ird lIrcll IltK'1l p,ri,ISI,rt, "11" ........ 11111'1,; Itu wlrtl W"III'r \"'I~hlt'u'rl

    Elllklllllllll',u.k In ....... 1I11!\ot111l1. IIl1uliRkl'lI rl'lllll"l' IImlh~k"11 Il, (III I IMMI) r, (III "A',

    t U. ;1 nun [ II nun ~) fil t;1 II(lU. r, HUll. III Nit !!I."':I I ~ "kJ ;v,'ml+_ ---ci',;-I 9"-_-t-_ , Ill" ..

    SUIIIIJIP ]h 7Jool) IUtI nu

    nt'/j'lnlll'" 111111. 4111' AIIIJ,I'lllIrtKt'll iI"r h'k 11,.,1,11 KI,\. ....... "I,., ~1K"t!.."oIl K'~I...t1l N' K.,htlrtu 1111/ It lii'l 111"'11'11 1 nlH-lI" t' WII ~'j{ ,I/I/.II lUll II d," 'wlt'n'lI "'"Id 1'1; ,111"1 III'A" I

  • Dabei entnimmt man der Zeichnung:

    hi = 2, ai - ai-1 = 8, 1 d--

    , - 4n' 3

    di+l = 2n'

    13

    Man beachte dabei, dass die Auspragung a = ai zur Klasse i + 1 gezahlt wird. Aus der disjunkten Zerlegung

    {j EM: ao S; Xj < ad u ... U {j EM: am -1 S; Xj < am} M folgt

    m m L hi = n und L ri = 1 . (1.2.4) i=l i=l

    Aus der zweiten Gleichung folgt, dass die Gesamtflache unter dem Histogramm gleich 1 ist.

    Besonders wichtig ist der Spezialfall einer aquidistanten Aufteilung. Ist der Ma13-stab so gewahlt, dass ai - ai-1 = 1, so ist die Hohe di des Blocks gleich der relativen Haufigkeit rio Bei aufeinander folgenden ganzzahligen ai kann man ein urn 900 gedrehtes Histogramm auch anders erhalten: Man schreibt die ai iiberein-ander und von jedem Xj E [ai, ai+d die erste Dezimalstelle daneben. So ergeben die ai einen Stamm und die Dezimalen einen Ast (meist Blatt genannt). Man spricht von der Stamm-Blatt-Darstellung. Aus ihr kann man im Vergleich zum Histogramm mit der Schrittweite 1 sogar noch die Verteilung in Schritten von 0.1 rekonstruieren.

  • Be is pie l 1 ( Ver,ichtningu chiiden) Die JahnnlAtisuk l'illt'r VCflIichcrung gila dit' hei Ihr Hufg('t11:lt.'l'lt'1l SrI1f\(len~ IKihen a, hckBllnI Allf 100 VCMikhcrlc 1X".f.ogel1 IoIclil (hesc (slRrk Vt'rril1rACht) WOIl1i)glkh flO RIm:

    tl, (in I OOO) o 5

    20 100

    lifo 10 J

    l' = ~ . (0 86 + 5 , 10+20 3+ 100 I) _ 2. 1 Dies bcdcuU'I , cl8S8 die Prulllie flir Jl-.rlCIi V('n;.ldu~rtl'n milldCtolICnlf 2 IOO 1K'lm-gf'n II1fL~t(' , 11111 Ill"! Vn Bezug ~ur Illrultiil. er i. .. t k-tligliclt d", .. Ergct, Ills ciltcr noolllUlig J)t'r Median blcibl ullvt'mlldcrt bei i = 3.50 , l'r tRnorWrl den Ausreificr. OM "'ird Schnlern in d(>f Diskussioll IIIll Ihrt"11 Eltt"rn 61wr dll' lkmcssulIg dCti T8HCltl.lIgddf'tl nieht ftugcllf'lilll 8('111

  • 1.3 15

    1.3 Mittelwerte Mit Hilfe von Stabdiagramm und Histogramm kann man die Verteilung eines Merkmals ubersichtlich beschreiben. Fur viele Zwecke sind die dabei sichtbaren Details gar nicht notig, sie konnen eher verwirrend sein. Deshalb ist es nutzlich, aus einer Verteilung charakteristische Zahlen zu extrahieren. Am wichtigsten sind MaBe fur "Mittelwerte" und "Streuung". Zunachst behandeln wir Mittelwerte, die auch LagemafJe genannt werden.

    A Arithmetisches Mittel Sei also ein Merkmal

    X:M={l, ... ,n}--+lR, jl--'tXj,

    mit den Auspragungen {aI, ... , ak} und mit den Haufigkeitsverteilungen

    h(X = ai) und r(X = ai) fUr i = 1, ... ,k

    gegeben. Unter dem arithmetischen Mittel von X versteht man die Zahl

    Man kann x auch aus den Haufigkeitsverteilungen berechnen, indem man in der obigen Summe gleiche Summanden zusammenfasst. Das ergibt

    ~(al . h(X = al) + '" + ak . h(X = ak)) al . r(X = al) + ... + ak . r(X = ak) .

    Daraus folgt die Gleichgewichtsbedingung

    (1.3.1)

    (1.3.2)

    Physikalisch gesehen kann man sie so interpretieren: Man betrachtet die reelle Zahlengerade als gewichtslose Stange und befestigt in den Punkten ai die Gewich-te h(X = ai). Dann ist x der Schwerpunkt des Systems. Befestigt man das System in x, so sind die Faktoren (ai -x) Hebelarme und die Produkte (ai -x) h(X = ai) Drehmomente. Legt man die Zahlengerade horizontal, so kann man die Gewich-te h(X = ai) auch darauf stellen. Unterstiitzt man das System in x, so bleibt es waagerecht stehen und ubt auf x das gleiche Gewicht aus, wie ein einziger (gestrichelt gezeichneter) Stab vom Gewicht n.

  • Beis piel 3 ( Vergtei.ch uou Klo lUlUnloten) Ole Fonurl (133) tol('hl ('t __ komphZk'ft "u~ . In flM" PrllXiI .... , (Wr Ml""hlUl I"IIZ rmfoch zu OChllll1l1K'1I 01(' IUIRt'Kchcu{'1l W('1'l('hknwl1 kbm14.'11 abl Erg('hull>flo(' \"011 KbuL'fILrCIl in \ ... ~III('(If'llt>1I K Un;cll RIIKl-'N'h(,11 wt'rdf'1I .) 1 22 333 I :t 4 1 5 66

    " _ 12 .r 3

    b) 1 1 2 J3 I 1 1 1 5 6 ,. _ 10, i - 3.$

  • n

    h(~ = a1) h(~ = 02)

    h(~ = a3)

    a1 a3

    B Median Ein Problem bei Mittelwerten sind "AusreifJer", d.h. extreme Auspragungen. Fur manche Zwecke wie Versicherungspramien (Beispiel 1) sind sie entscheidend, in anderen Fallen (Beispiel 2) storend. Daher betrachtet man oft den "Median" . Zu seiner Definition muss man aile Werte Xl , ... , Xn der GroBe nach ordnen. Sie werden neu nummeriert (dafiir ist die Bezeichnung x(1), .. . ,x(n) ublich), so dass

    X(l) :s; X(2) :s; ... :s; X(n-l) :s; X(n)

    Del' Median x (auch die Bezeichnungen x.!. oder x.!. kommen VOl') von X ist nun ein Wert derart, dass - wenn moglich - ge~auso vie1e Werte Xj kleiner wie groBer als x sind. Die prazise Definition ist

    falls n ungerade, (1.3.3)

    falls n gerade.

    Man beachte, dass x fur gerades n nur dann eine Auspragung von X ist, wenn XU}) = X(~+l). Eine wichtige Eigenschaft des Medians ist

    #{j EM: Xj < x} :s; ~ und #{j EM: Xj > x} :s; ~. (1.3.4) Manchmal wird jedes x mit dieser Eigenschaft als Median bezeichnet . Fur gerades n ist x dann allerdings im Allgemeinen nicht mehr eindeutig bestimmt, sondern kann zwischen x(~) und X(~+ l) variieren. Man kann den Median auch aus der Verteilung der relativen Haufigkeiten bestim-men. Dazu ordnet man die Auspragungen der GroBe nach, also

  • "~Hf q _ ~ IlAlx-n .. If d("l1 M('(hall r i.. :1 !iC."holi bGiWnlllt D" F(2) _ 0 25 1.',1 j'lcs .raa e 12.31 ('III QIUU111 [)a,.; kallli mlln andl din--kt nAC"hl)fUr("n

    N(J e AI .J', < .ro~} S :1 ~ 12 IIIKI _ 9 _ J 12

    ,

    .iol - 2 ,

    B ehtl) ic) 4 (N~'lleru rig tl01'l KlatuurnOLen) In ('111M" Khulbllf ~Uld UI~~nl 200 PUllkt(' rrf(,l(hhfU DI\.'4 Nolcn:.ch(,lIIit wlrd 1111 \'001011.'4 rf~I"t'lt"Kt

    Pullktu .... 1 X NOl(' ) . --'--+=.-'.!.f-'-

    Dif' IIIlt \ot(' 5 h(''''{'1""U'trn KI&I.l!ollr(,,1I ,,("IIMI "lit lu(lit I,",UUK)('II 13M 1IL.""t"l\Alut 11 _ 67 TrlhK'huW'T"1I "'111"&:'11 Ahi ErK('huW!o>I(' dw r,>igt'IKIf'1I I>unkt zaltl(,11 rrf('ldlt

    0 20 I)J 81 ml 120 1311 0 21 &1 86 107 122 III () 35 liZ III! 101' 126 IV; 0 35 &9 95 Hl'J 126 IIG 0 3G 70 9::' 109 ill IIG 0 3G 71 go III Il'l 152 3 11 73 99 117 129 152

    " ')2 7S 99 II 1]1

    9 GI 77 100 119 13-1 13 &1 80 1l!2 119 138

    Olt" 1'n:-lIIlhllll'l1 WNtk'" pnlf'f" rrkllirt

    " S I , 2 I

    _ a ) ... ~ 12 )':1 2 ()

    - tl ) 056j OIH- linT o OJ() 0

  • 1.3 1

    und betrachtet die kumulierten relativen Hiiufigkeiten, d.h. die Teilsummen

    der relativen Haufigkeiten fUr 1 ::; m ::; k - 1. Gibt es ein m, so dass Sm = ~, so ist

    x = Ham + am +1). Andernfalls gibt es ein m < k mit

    In diesem Fall ist x = am+i. Man mache sich dies etwa im Fall k = 3 mit den Verteilungen

    klar.

    r(X = al) = i r(X = a2) = i r(X = a3) = ~ und r(X = al) = i r(X = a2) = ~ r(X = a3) = i

    Man beachte, dass Rundungsfehler in den relativen Haufigkeiten r(X = ai) bei dieser Berechnung des Medians zu Schwankungen fUhren konnen.

    C Quantile Ais Verallgemeinerung des Medians kann man anstatt ~ fUr jede reelle Zahl p mit 0 < p < 1 ein "p-Quantil" xp des Merkmals X erklaren. Fur p = ~ ist Xl. nach (1.3.3) eindeutig festgelegt. Fur beliebiges p verallgemeinert man die

    2 Eigenschaft (1.3.4): Eine Zahl xp E lR hei13t p-Quantil des Merkmals X oder der Werte Xl, ... ,Xn , wenn

    #{j EM: Xj < xp} ::; pn und #{jE M: Xj > xp} ::; (l-p)n. (1.3.5) In der Sprache der kumulierten Haufigkeiten (1.2.2) bedeutet das

    Man beachte, dass xp im Allgemeinen nicht eindeutig festgelegt ist, sondern manchmal innerhalb eines Intervalls variieren darf (siehe Beispiel 3). Die beiden Bedingungen (1.3.5) kann man nach Division durch n auch durch kumulierte relative Haufigkeiten ausdrucken: Damit bedeuten sie

    r(X < xp) ::; p und r(X > xp) ::; 1 - p. (1.3.5') Wegen r(X ::; xp ) + r(X > xp ) = 1 kann man sie zusammenfassen zu

  • Drullli haiX'n ctw,," 57% tlcr Tdlnchll1er nieht ix'!>l#I.udl'lI

    Als KOlL'ilrasl. dltZlI kttnll !URn die NOlclL'ilc1&ln nicht all den errc-lchborrrl SOli-dCrII 811 dCli errcichll'n PUlIkt1.ahlcli justicl"en. DIIIJ b ... dR1II1 8l1gchmchl . W{'1II1 nUtl! bei gcniigclld gro6c.-1I 7~lhl(:11 \'011 T('ilucillilcrII cine n'lativ kOIlSLnIll(' LeUr lIIugsffihigkcil. rulllchlll(,11 knulI , tier Schwierigk{it.sgnuJ der Kbuu;Uf("U j('(loch !;tRl"-ken 5dlwllUkllllgt'II unterworf('11 ist. Einc M6glichkelt die Note }' III diebClII 511111l' 1.11 nonlllef'('fl 1.11 ('lI1cr Noll' 1'"' it\:1 die folg{'lIdt: ~ hUi 1IIK('1i .. tuniil'hst dll' Vorgllhe. dA.iS hacll!ilCllJi 20"'" der T('i1ncluuCf durchfallCII IiOllen . CCIIRlicr bt"'StiUIIII\ 111811 rtlr die Punktt-~nhl X clIVi QuaJlti! %02 mit

    h(X < i l)2) :5 02 67 "", 13.4 und /i(.\' > i 02 ) :5 0 .8 07 ... 53G An d('1" TIIIX'lIe ,I('r crrt'khwu PUllktC7..1lhlcli lil'lSt 111811 ah. d8.~.Tu = 35, denu et; '"

    'l(x < a:i) = 12 lind Il(X > 35) - I)3 . Dic 1I0fllllcrtc Nob' y ., 5 clltspn('ht dClIlIInch ('iner Puukll'7.1lhl 0 :5 X < 35. Zur F'cstlcgllllK d('r RCMlIltCII NOlel\.sknla !atml lUlU! folgcudc VMcihlllg nllll4..4IclI:

    Ot:m clIlspl'echclid l~tilllll\l nuul die Qun .. ntile

    i'0) .. = 69 . ;011 ",, 101 lind i"OKo K" 129 .

    x 10.351 135.691 I6'J I!HI 1 101. I 2'JI 1129,1521 I" 5 3 2 I

    "(Y') 12 "

    17 15 12 ,(I") 0.179 o I().I 0 .2M 022,1 0.179

    OHJIllt wcrdt'li die tlU,ltl'p,l'iX'IICIi Prozcut:r.ahl("11 Ilf\('h d(,,11 rtlr Quruuile Kiillip,cll nt'gC'iu 80 gut wit, 1116glirh "pproxilluerl.

  • 1.3

    (1.3.6)

    Dieser haarspalterische Umgang mit Ungleichungen ist etwas gewohnungsbedurf-tig.

    U m die Quantile besser zu verstehen, kann man die aus den kumulierten relati-ven Haufigkeiten entstandene (empirische) Verteilungsfunktion des Merkmals X benutzen. Man versteht darunter die Funktion

    F : lR -t [0,1] mit F(x):= r(X :s: x). Bezeichnen al < ... < ai < ... < ak wieder die Auspragungen von X, so ist

    F(x) = L r(X = ai), (1.3.7) ai:Sx

    also ist F eine Treppenfunktion mit Sprungstellen an den Auspragungen al,, ak Fur x < al ist F(x) = 0, fUr x :2: ak ist F(x) = 1.

    F(x)

    0.5

    :t

    Verteilung rfunktion bei 3 Auspriigungen

    Fur p E] 0, 1 [ gibt es nun zwei Moglichkeiten: 1. Wenn es eine Auspragung am gibt mit F(am ) = p, so ist jedes

    ein p-Quantil: Fur x E [am, am+d ist r(X < x) :s: r(X :s: x) = F(am ) = p, also

    r(X < x) :s: p = r(X:S: x). Fur x = am+l ist r(X < x) = r(X < am+l) = r(X :s: am) = p, also

    r(X < x) = p < r(X:S: x).

    21

  • Beispiel :; ( Alter oon Ludlerendtn) In Mlln' .... n.kullAl IIlIt hL."ft~JUt 1649 tudK'fl'IKIl'1I toOl! iI ... AItf:'fW>tl"uklur ullIn-!luchl ",,,nl(,11 Ott1U ..... 'nlt" ZUlli Stl('hl~ 1 I 2(l()..1 cite- IIRufiKkt'ltt'll fier G('hurl~ J"h- cnlllll("'h

    1929 I IIM6 0 1956 5 1066 0 1976 101 193[, I IIH7 I 1957 5 1007 16 1!)77 III 19.17 3 1018 I 19as 3 I !161! 10 1978 168 1935 I HU!) I 10:;!) 5 1000 10 1070 170 WI! I 1050 2 1!l6O 2 1070 26 1080 167 1912 I 1051 I 1001 3 1971 3 1 1081 167 1013 2 19)2 I 1002 8 1072 15 101>2 160

    10:.3 2 1003 6 1973 33 1083 86 195~ 2 100l 8 1971 78 1984 32 19J!1 3 1005 10 1975 ." 1085 I

    AIL'" tk'lII C('llllrtt>J"hr ('rllll' tlM-h IIAN ~1('rkllll,1 X uiJtmQilt'r FUr AIL"MKI'II IbN d~ AIt~lruklllr h..-lMl tJOoohl ('III 1I 1!110ftnUIIIU elM" rrlAlh"t'11 IIIU1figkril(>1I kh. IUK'h til(' VM"I(,llulI~rUllkuolI \'t"'flIdUc.."I.InIIU1I~(, Crundl""M) III d

  • 1.3

    Fall 1: mehrere Quantile

    2. Andernfalls gibt es ein m, so dass F(am) < p < F(am+l), das bedeutet

    Wegen r(X ::; am) = r(X < am+l) ist xp = am+l das einzige p-Quantil.

    _______ _ T

    I '-V

    Fall 2: eindeutiges Quantil

    23

    An dieser Beschreibung sieht man, dass der Fall 1 eine Ausnahme darstellt, im "Normalfall" ist ein p-Quantil eindeutig bestimmt. Fiir spezielle Werte von p haben die Quantile eigene Namen: x.!. bzw. x~ heiBen

    4 4

    unteres bzw. oberes Quartil, fiir p = 16 mit k = 1, ... ,9 spricht man von Dezilen. Die Bedeutung der Quantile ist klar: AuBerhalb des Intervalls [x.!., x~] liegen

    4 4

    h6chstens die Hiilfte der Xj, auBerhalb [XO.l, XO.9] h6chstens 20 %. Man schlieBt also h6chstens 20% der Individuen aus, wenn man die Auspriigung des Merkmals X auf das Intervall [XO.l, XO.9] beschriinkt. Man kann die Lage der Quantile auch niiherungsweise an einem Histogramm der relativen Hiiufigkeiten erkennen: xp liegt ungefiihr an der Stelle, an der die Fliiche unterhalb der Treppenfunktion links von xp den Wert p hat. Die Niiherung ist umso genauer, je feiner die Zerlegung ao < al < ... am ist.

  • " 10 9

    7 6

    .~ I 3 2

    Alu.,

    W m ~ m g W M ro M ro n M " ''1111 111("111 ,1M _",utllr GC'lJ11rbch,llllllllOlKlrru 11111 "Iv. Gfhm"lI'Jfthr 11(oIouUlnt ~t. krillli IIIIUl .IRS IIlItll('1l' Ahf'r 11m UUR,\'fKhr 11('ft .. :hm'u DltZlI &at ('I; 1U1~('III~n III j4'(h'r Ahf'1'1l,kl~' fit'll ~"It('I\Iowt AIIJ:IL ..... U'II \ b. Lr"..!m, ... ,.huh nuul

    I 117135 7 l"tn(1 1~~+J2 195+ +1 il! 27116

    u-o:l 1f).19 lIm QUAntile xu '"",,1111111)('11. IX'lIl!W"litrt IIIAn ,he \"l'rtt-'tIUlleofUlikhOIi F(r) -r-(.\ ~ r)

    1011 00 110 70 GO [,II m 30 W 10

    r(.\ < r, III 'X ;-

    .

    i 20 2.', 10 !.j

    Iii 10 t'j 'j(J ~, (jO (;.'j 7U 75 teO

  • 1.3 25

    D Boxplots Ais vereinfachte Darstellung der Verteilungsfunktion dient oft ein sogenannter Boxplot. In ihm sind neben arithemtischem Mittel x und Median x auch vier Quantile, meist

    XO.l, XO.25, XO.75, XO.9

    angegeben. Uber die Quartile wird eine Box gesetzt, bis zu den Dezilen reichen Whiskers (Schnurrhaare). Weitere Auspragungen unterhalb von XO.l und ober-halb von XO.9 k6nnen durch einzelne Punkte markiert werden. Diese graphische Darstellung vermittelt einen erst en Eindruck von der Verteilung der Haufigkeiten.

    E Geometrisches Mittel Sind Xl, ... , Xn die Werte eines Merkmals X, so ist manchmal neben dem arith-metischen Mittel

    x = ~(Xl + ... + xn) im Fall Xi ;::: 0 (fiir alle i = 1, ... , n) auch das geometrische Mittel

    Xgeo := ylXI ..... Xn

    von Bedeutung. Der mathematische Zusammenhang zwischen den beiden Mittel-wert en ist durch die Exponentialfunktion gegeben. Ist

    Yi = In Xi und y = ~ (Yl + ... + Yn) das arithmetische Mittel der Logarithmen, so folgt

    _ 1 ey = (eY1 . . eYn)n = X

    . . . geo'

    Allgemein gilt

    Xgeo ::; x und Xgeo = X } Xl = ... = Xn .

    1m Fall n = 2 kann man das leicht am Graph des Logarithmus erkennen,

    (1.3.8)

  • II til II nl'~dll rm dll B( 111111111111' ,II .. QU II ii" I'rh. I III II

    11 I)C "'Utet

    I

    I I Ml It " II

    .tu - I . r 'v.,

    lllei ill!! illt!

    rt I I'll III 'rllI 111011' II III I It A It l'r tI,.. '1 lit li"n'llil 'II

    \nll _I ,,~ 2J.I hr. II ,

    I ,rHhlllt'l ,Ill' Mill'lllI'lI 'At :';.1 J hli'

    Jlul 'n; 1111 \. r It' .. It \. I 1\1( It'll 'r I" lilt I t'U IIt'II ~I, 11111 IIl1cl Imlllll! II tit II !\litt,'1 I 'I ' .

    n i pic I It ( [JOXlliot vo n KfJrpt ,,tiJl n ) JIlt. I I :. k,lllll III III (1111 II I

    H7

    :r I 1'11'1 T .o I 'J.~" r" ('rgll! du' Gr h

    1 } 13', II II"

    ""

  • 1.3

    oder nachrechnen:

    also

    xi - 2XIX2 + x~ xi + 2XIX2 + x~ - 4XIX2 (Xl + X2)2 - 4XIX2

    XIX2 :::; HXl + X2)2 .

    Wegen der Monotonie der Quadratwurzel folgt

    27

    Eine wichtige Anwendung des geometrischen Mittels und der Ungleichung (1.3.8) betrifft Wachstumsprozesse. Dabei wird ein Ausgangswert a E lR+ Veranderungen unterworfen, die durch Multiplikation mit Faktoren Xi entstehen. 1st etwa a ein Geldbetrag und Zi der Zinssatz im Jahr i in %, so ist der Wertfaktor

    Xi := 1 + 160Zi .

    Bei der Wertentwicklung von Aktien kann Zi < 0, also Xi < 1 sein. Betrachtet man etwa die Wertfaktoren Xl, ... , Xn in n aufeinanderfolgenden J ah-ren, so ist der Endwert nach den n Jahren gleich

    / a := a . Xl ..... Xn .

    Ein adaquater gemittelter Wertfaktor von Xl, . . . , Xn ist X geo , denn

    Das arithmetische Mittel x von Xl, ... , Xn wurde im Allgemeinen einen zu groBen Wert ergeben, denn nach (1.3.8) ist

    a (Xgeot:::; ax.

    Wir geben ein stark vereinfachtes aber dafiir sehr deutliches Beispiel. Angenom-men der Kurs einer Aktie steigt im erst en Jahr urn 30% und faUt im zweiten Jahr wieder urn 30%. Dann ist

    Xl = 1.3, X2 = 0.7, x = 1.0 und Xgeo = JQ.9i = 0.954. Nach zwei Jahren hat man also insgesamt 9% und im JahresmitteI4.6% verloren, und das unabhangig davon, in welcher Reihenfolge Kursgewinn und Kursverlust eingetreten sind!

  • Be is piel 1 ( T
  • 1. 2

    1.4 StreuungsmaBe Neben der Festlegung von Mittelwerten fUr die Werte Xl, ... ,Xn eines Merkmals X ist es auch von Interesse, ein Maf3 dafUr zu finden, wie stark die Xl, ... , Xn streu-en. Etwa die Quantilsabstande :T0.75 - :T0.25 oder :T0.9 - :T0.1 sind grobe Indikatoren dafUr. Es gibt aber bessere Maf3e. Zunachst erklart man fur einen beliebigen Wert c E JR;

    n k

    Str1(X, c) Llxj -cl L lai - cl . h(X = ai) , j=l i=l n k

    Str2(X, c) - L(Xj - C)2 L(ai - c? h(X = ai). j=l i=l

    Str1 (X, c) bzw. Str2(X, c) heif3t lineare bzw. quadratische Streuung von X um c. Physikalisch interpretiert ist Str2(X, c) das von den Gewichten h(X = ai) verur-sachte Tragheitsmoment, wenn das gesamte System urn den Punkt c rotiert. Es ist klar, dass die beiden Streuungen von der Wahl von c abhangen. Das folgende Ergebnis zeigt, dass jeweils ein Wert von c ausgezeichnet ist.

    Satz tiber die Extremaleigenschaften von Median und arithmetischem Mittel. Als Funktion von c ist

    Str1 (X, c) minimal fur c = x, Str2(X, c) minimal JUT c = X.

    Einen Beweis geben wir im Anhang.

    Die Werte x des Medians und x des arithmetischen Mittels haben eine direkte Bedeutung: Sie entsprechen einer Auspragung im "Normalfall". Die beiden mini-malen Streuungsmaf3e

    sind Zahlen, die zunachst keine unmittelbare Bedeutung haben: Sie hangen insbe-sondere ab von der Maf3einheit der Merkmale und von der Zahl n der Individuen. Dabei ist in einfachen Beispielen (siehe Beispiel 1) eine Linearitat in n zu er-kennen. 1m Folgenden beschranken wir uns auf die quadratische Streuung; der wesentliche Grund dafur ist, dass man damit besser rechnen kann.

    Die storende Abhangigkeit der Streuung von n kann man am einfachsten beseiti-gen, indem man die absolute durch die relative Haufigkeit ersetzt. Man nennt

  • AI:. IIlIt 7 Scillilt'TIl lind ("1Ilt"1n T,,*,h("u&("kl (,mch w(k'll("Illiich III E" (W lhl ""tell tilt) \"on

    ZCM,) - CI . 2. 25. 25. 1. 6.6) In dif'8e1n FilII lilt

    : _ 25 , StTI(Z,:) - 10.5, .. - 3429 , StTJ(Z.l) 23 211 , ~ - 1821

    OA$! dit> Werle lIuf AlJ Iltilrkcr IilrcUCIl aLs rntf AI, uud All 8M'h' ""U1 lIuf den (nl("n Dhdt; tlK' Sla.ndAnll,IJy,'etchuUK agt 1"111 "Ult'II VcrgwK:ruITls8.

    O~ dK' SlAndAnlAb","elchuug lremc Ahtio1ul(" Ikdl'tIIUl13 hal , buill IIIA.II auf \"M" .. h,edcu(" ATl('lIlIC'hMl Wlrd 1111 FaJl MI \'011 olM'11 dM IIlOlIalhclK' TNiCIK"IIKt'kl In E mit l' lx-?.ckiIll4"t . 80 bit )' _ IX (zltr V('r(,lIlfR('llIInp; rochilcil wir CIII('11 MonKt mit I IJIAU I 315 Woc:hcn) . AIbO IItt

    I'C M,) C . 12. 12, 16. 20} . i- 136 _ 11' .: 16 G4 . ...

    StrJ(l',,~) 83 2 - 16 StTJ(X .1'). l OS 1 __

    Der ,kotCht- Ef('kl ('f"glm Bl('h. "''('IIU da!! TIVoCI)('ugC'kJ III Cllter andert'fl Wkhnul3 1x-rfd11K'1 'tnI'd, dSUIl l!il Y oX mil ("IIWI'1I UmT1"CfllltlllpJaktor CJ > 0 Nf'hIHMI wir IIChlk-8hch All, bel ('III"" Cruppc M. milS Sehorn I 1St 'UUI fillallzicli(,1l Crfilldf'1I (hut TI'L'tt'IK'lIgcktilUT I"db lIO hoch 'NK' 00 M, . ItO . 'INt (w6d14~lIth hill )

    ZCAI,) - C I. 1.5. 1.5. 2. 2 .5 ) , 3 I

    l' 17 2' Stt, (Z.!) - 1,3 62 - 1-' "Z

    102 0.51 - 2

    Das8 dlc StrroulIgcu VOII X. l ' und Z wclfcktlV" dit> gk-K'hm timd. ('1"kclllll tn VanalK)llskoeffi1K'nt

    ,__ 1,02 VA = ..;.., - --I 3 1 03 ,

    .. 108 l', - - - -- _ 03 Ii 136 . $z 0.51

    l z - - - -- - 03 ! 1,7

  • 31

    k

    S~ .- L (ai - X)2 . r(X = ai) = ~ Str2(X, x) (1.4.1) i=l

    die mittlere quadratische Abweichung von X , genauer der Xj von x.

    Physikaliseh ist s~ das Tragheitsmoment eines Systems vom Gesamtgewieht 1 mit den Einzelgewiehten r(X = ai) in den Punkten ai bei Rotation urn x. Dureh diese "Normierung" auf die relativen Haufigkeiten macht man die mittlere quadratische Abweichung unabhangig von der Gesamtzahl n der Individuen; sie hangt nur noch ab von der Verteilung der relativen Haufigkeiten.

    Da bei der Definition der mittleren quadratischen Abweichung Quadrate verwen-det wmden, liegt es nahe aus dem Ergebnis die VVurzel zu ziehen: Die Zahl

    Sx := Iii = J ~ "L:]=1 (Xj - X)2 heiBt Standardabweichung von X.

    (1.4.2)

    Sowohl die rnittlere quadmtische Abweiehung als auch die Standardabweichung sind abhangig vom MaBstab. 1st er jedoch fest gewahlt, so ist ein Vergleich dieser Abweichungen auch zwischen verschieden graBen Mengen von Individuen sinnvoll (Beispiele 1 und 3). Gibt man ein Merkmal X in einem neuen MaBstab an, so entsteht damus ein Merkmal

    Y=aX,

    wobei a E ~ den Umrechnungsfaktor beschreibt. Fur die Werte und die arithme-tischen Mittel gilt

    Yj=aXj, y=ax, also ergibt eine einfache Rechnung

    fUr die Umrechnung der Standardabweichungen (Beispiel 2).

    lal Sx

    Manchmal staren beim Vergleich verschiedener Streuungen nicht nm die unter-schiedlichen MaBstabe, sand ern auch die unterschiedlichen GraBen der Mittelwer-te. Vergleicht man etwa die Streuung der Preise fUr Tomaten in Munchen, Neapel und Zurich, so muss man berucksichtigen, dass die Schweiz eine andere Wahrung hat, und dass Tomaten in Italien am billigsten, in der Schweiz am teuersten sind. Daher geschieht der Vergleich in solch einem Fall am besten iiber den sogenannten Variaiionskoejfizienien

    Sx Vx := x

    n

  • Beis pie l 2 (SpnLpreue) Ow Pre,*, ftlr Krftfllotofrl' hftllK(,,1I \'011 umd XII lAurl \'NloC'lut'(INI uuk \'011 tiM' W"hl d~ TAukhlrUt' "h 11M V('rgicK'ht'll iliUM 111"11 *,",,"Ohl dAN Prt'.~IIIW II "I,,; "uc-h 11(' l.And{'h .... 'AhruIiR b~\lckhlchtl~cn Wlr haberl Dcllochlnud, It'rretch und "8ClwC'"hIMI all.'>R("\\,.UIIt . X bt."Z('kIIlH.>l dClI Preas I)f"() Liter O~lkr.ft.M.off III tk-r u..ndCbwkhrung IJCI 10 \"OIC"IIlCtiCIlCIl TIUIJu"lellen 01
  • 1.4 reuunpma8e 33

    Er ist jedoch nur sinnvoll fUr x > O. Man kann die mittlere quadratische Abweichung auch durch Mittelwerte beschrei-ben. Dazu betrachten wir neb en dem Merkmal X auch sein Quadrat

    X2 : M -+ IR, j f--7 x~ . Sein arithmetisches Mittel ist X2. Es ist wohl zu unterscheiden von x2, dem qua-drierten arithmetischen Mittel von X . Nun formen wir urn:

    n

    Str2(X, x) = L (Xj - X)2 j=l

    (tX/) -nx2 = n (X2 - X2) .

    Aus dem Ergebnis dieser Rechnung und (1.4.1) folgt sofort s3s: = X2 - x2

    (1.4.3)

    (1.4.4 ) Man beachte, dass der Ausdruck X2 - x2 empfindlich ist gegen Rundungsfehler, weil hier oft eine sehr kleine Differenz sehr groBer Zahlen entsteht (Beispiel 3). Manchmal dividiert man die quadratische Streuung nicht wie in (1.4.1) durch n sondern durch n - 1 und nennt das Ergebnis

    s'x:= /_1_Str2 (X, x) V n-1 (1.4.5) die empirische Standardabweichung. Eine Motivation dafUr wird sich in der Schatztheorie in Abschnitt 3.1 C ergeben. Ein Grund fUr die Bevorzugung der quadratischen Streuung gegenuber der linea-ren ist der Bezug zur linearen Algebra. Ist wieder X ein Merkmal mit den Werten Xl, ... ,Xn und dem arithmetischen Mittel x, so erhiilt man ganz kanonisch einen Vektor

    Vx := (Xl - x, .. . , Xn - x) E IRn , der Abweichungsvektor (genauer Vektor der Abweichungen von x) genannt wird. Fur das Quadrat seiner Norm gilt

    n

    Ilvxll 2 := L(Xj - X)2 j=l

  • Durm RUII(IUU~ Mltll,. furh

    Y 1000007 " Ill.lIO ~, _ 1000131 oo.a

    WCKCII .1'1 - l(.c~ + r, + .c~) 1000 133 310

    .-,

    ,;J - r' 1000 1333-10 - 1000 131 QO.I - 06&1 d('r \\'crt \"OII"-~ wm at,.... II~ 'M"gI\tlV Rill' Ilundct lUAU "ad, IIIchr ALe 3 Slf'IIf'1I 'A'lrd d.N; Er~cblll!l 1)('f!IIICf' Vl('llilChtrer" bt (ht' dlrt'ktc 1kn:'chlluIlA

    .l I - 0 (67)' + 0 003' + 0 003') a 1(0001+000 1 +0001) 0002

    J'-'tlcr 1iutchCIlrt'("hllM" arlJo('ltct 11m IIlIt ('Iller Iqn'lu.t(,1I 7..1\111 VOII Dt--,mll"len D,,~ hcr Will lIIall dM obigt' ikllJptd rur jc-(Ic StrUCllUhl IIKxhfi;cwreu M"" \'t'n.ucht> ('fi t't\\'ll IIIlt 6 Stt'lwn'

  • 1.4 'lreuulIgNma8c

    also gilt fUr die Standardabweichung

    1 Sx = fo Ilvxll

    Dies ist ein Schlussel zum Verstandnis des nachsten Abschnitts, in dem zwei Merkmale verglichen werden.

  • Beispie l 1 (SLudiendauer und Ezam~noLe) Ow Erfahnllll 7.('111. dNM SllKh('f'("Kle clK' rnllwr t-:XAIIIC11 Illlw:hl"l1 1111 AlIg(,III(,lIIl"f1 (tIKiI beiticr... Ol(-,II erhRltcll Ol('to(' Ten
  • 1.5 hied n r M rkmal 37

    1.5 Vergleich verschiedener Merkmale Sind auf einer Menge M = {I, ... , n} von Individuen verschiedene Merkmale

    Xi : M -+]R fUr i = I, ... ,m

    gegeben, so liegt es nahe, diese zu vergleichen. Wir beschranken uns auf den Fall m = 2 und bezeichnen die Merkmale einfacher mit X und Y. Weiter seien

    Xj := X(j) und Yj:= Y(j) fUr j = 1, ... , n die Werte von X und Y,

    al, a2,"" ak mit k S n die Auspragungen von X) bl , b2 )., bl mit I S n die Auspragungen von Y,

    X und 'jj die arithmetischen Mittel von X und Y , Sx und Sy die Standardabweichungen von X und Y.

    Zur graphischen Darstellung von X und Y kann man in ]R2 aIle Punkte (Xj, Yj) markieren. Das Ergebnis ist ein Punktschwarm

    bei dem jedoch manche Punkte mehrere j als Urbilder haben konnen. Man kann sie deswegen entsprechend dicker markieren oder dreidimensional zeichnen, indem man Stabe entsprechender Hohe auf die Ebene ]R2 stellt.

    n= 10 k=3 1=4

    43 (:til. 1/9)

    Punktschwarm

  • Zur quft.lIlilath'eli Allnl~ f1111S8 IIUUI clWRS rccllllen

    ~ _ ;/;;(8 2 + ... + II . 5) - 9.3 u = n\o(1 3+ ... + 6 .1) ... 3.26

    Il.~ _ dii(1.3' . 2 + ... + 1.11 5) - 0.35 ~ = Itm(2.26' 3 + ... + 2.7.1' 4) - I 132

    Mil Hilrc cler Forme! (IA.4) erh3Jt 1I11Ul 61 = 86.84 - 86.49 -= 0 .35 Zlir Be-r(!ChllUn~ von (lJx . lit) Y('f\\"el1d~ wir die Formel (1 .5.2'). elltsprocilend den 17 EiIlLrigcn ill der Kon1i11A llztruel mit 17 SlIlIlIllsndcn:

    (Vx . lIy) - I (8 - 9.3) ' (I - 3.26) + 1 . (8 - 9.3) (2 - 3.26) +2 (9 - 9.3) (I - 3.26) + ... + I (9 - 9.3) (6 - 3.26) + ... + I (II - 9.3) (6 - 3.26)

    - 32.2 .

    Damit kOllll(!l1 wir die RcgrCIISionsgeradcli I)eJLirnmcn:

    (vx.",) 32.2 0 - , - 350=0.92 . fJ - V- oZ --5.296 .

    " . !Ix . (vx . ",.) 32.2

    "Y - " ' '': - 113.2 = 0.284. 6' - 7 - ..,'11=8.374 .

    OWl crgibt die Cleiclillllgcll

    6

    4

    J

    ,

    y - 0.92% - 5.200 . x '" 0.28

  • 1.5 Y, rglcich v I1>chicd 11 r 1 rkmal

    . I.. I .. 0 .. I:::::.... .. ~ ......... :: ....... .

    .' '\ ............ . ' "0

    Stabdiagrnmm

    n= 10 k = 3 1= 4

    3

    Wie bei den Stabdiagrammen in Abschnitt l.2 ist die Breite der Stabe ohne Bedeutung.

    Gilnstiger filr die rechnerische Auswertung ist eine matrixformige Tabelle (auch Kontingenztajel genannt). Sie sieht wie folgt aus:

    x

    Dabei nennt man

  • Sehhc8lich crhiUt IIIIUI dell Korrcllltion~kocflb.I(,lIlcm

    322 - 0.511 . 100 . 0.592 . 1.064

    Er isL dClIllich pCldliv; dC'r g{,lUlIIC Wert. kl:l1l11 dllZlI dit"lIell , eli" StArke tier Tcml{,lIz mil ftJlderell Jllhrgiingcll oder Swdicngnngell ~1I \'crglcichcn. b ) N8Ch clem ren.hUitsllahCII Beispiel a) noch cill Idcnl~ BPispicl mil" ,. 40. Wlr geix.-n dazu zwci KOlllillgCIIZ18,rclll an;

    YII 12 1: Y II I 2 ~ E X X

    8 III~ II~ 10 8 0.1 0 .15 0.25 9 30 9 0.3 0.

  • 1.5 1

    die gemeinsame Hiiufigkeit der Auspragungen aK und b)... Die letzte Spalte mit den Eintragen

    I

    Lh(X = aK , Y = b)..) )..=1

    und die unterste Zeile mit den Eintragen

    k

    h+,).. := h(Y = b)..) = L h(X = aK , Y = b)..) K=l

    heiBen Marginalverteilungen. Ihre Summen ergeben jeweils die Gesamtzahl n der Individuen.

    Entsprechend kann man auch die relativen Haufigkeiten

    eintragenj dann ergibt die Gesamtsumme rechts unten jeweils 1. Sind die Zahlen k und I der Auspragungen nicht wesentlich kleiner als die Zahl n der Individuen, so werden sehr viele Haufigkeiten hK ,).. klein (vor allem 0 und 1) sein. In diesem Fall fasst man besser wie schon in Abschnitt 1.2 ahnliche Auspragungen zu Klassen zusammen. Da dies nun ftir X und Y geschehen muss, wahlt man neben

    0'0 < 0'1 < ... < am mit 0'0 ::::: a1 und ak < am

    noch (30 < (31 < ... < (3r mit (30 ::::: b1 und bl < (3r ,

    wobei die Schnittstellen a und (3 so gewahlt werden, dass gentigend und vergleich-bar groBe Klassen entstehen. Daraus erhalt man eine KontingenztaJel fUr die m'T M erkmalsklassen

    {j EM: O'jL-1 ::::: Xj < O'jL und (312-1 ::::: Yj < (3g} c M fUr 1 ::::: f.L ::::: m, 1 ::::: fl ::::: r mit Eintragen [O'jL-lo 0'J.L[ und [(312- 1, (312 [ in der linken Randspalte und der oberen Randzeile, sowie

    in Zeile f.L und Spalte fl. Entsprechend kann man auch die relativen Haufigkeiten eintragen.

  • In der KOlllingcnzWel filr relative Hiiufigkcil.cn ist die Prodllktregc1 (1.5.
  • 3

    Nun zu der entscheidenden Frage nach einer eventuellen Beziehung zwischen den beiden Merkmalen (ob sie kausal ist oder nicht, ist ein ganz anderes Problem). Die einfachste Art der Beziehung ist eine lineare, also

    Y = aX + (3 oder X = 1 Y + 5 ,

    mit a, (3,1, fj E JR., wobei diese Beziehungen, wenn sie bestehen, bis auf die Ex-tremfiiJle a = 0 oder 1 = 0 gleichwertig sind. Fur den Punktschwarm {(Xj,Yj)} bedeutet das, dass er auf einer Geraden liegt. Aber im Allgemeinen wird der Punktschwarm hochstens eine Tendenz zeigen, in der Nahe einer Geraden zu blei-ben. Selbst bei evident nichtlinearen Abhangigkeiten (wie etwa Korpergro13e und Gewicht) ist in einem begrenzten Bereich eine line are Approximation moglich. Nun betrachtet man in der Ebene JR.2 mit Koordinaten (x, y) eine beliebige Gerade G""f3 mit der Gleichung

    Y = ax + ,f3 und vergleicht ihre Lage mit dem Punktschwarm in folgender Weise: Fur jedes j E M hat man den Punkt (Xj, Yj) im Schwarm und den senkrecht daruber oder darunter liegenden Punkt

    Die vertikale Abweichung ist Yj - aXj - (3,

    und als Gesamtabweichung definiert man die Summe der Quadrate, also n

    F(a, (3) := i)Yj - aXj - (3? j=l

  • 0 -..

    , ,;rl: .. .;-. ...

    -,

    2S

    08 aile 61 Wcrtclmnre Vl'nlchicdcl1 sind. IlIIl der &h ..... 8nll ftuch 61 Puukle. Neben den" Cr66cllklhItiClI hildcll ..... ir 8uch .. CcwichtsklfISSJCn. Oas crgibt die folgcndcll Thbcllcl1 ftbtiolulCr IUiufigkcitcn:

    o I 2 3 4 0, 130 136 I,m 1 '16 1M h, 20 18 19 4

    o I 2 3 1 11. 24 30 36 42 51 h, 16 31 10 4

    Durell Zuorduuug det C('wicht.6klftS.'l(!ll :til den Gr66cllklllSSCII lind Allsziihlung def Ergebllis!.lc crhiilt IIlIYI cine KOlllillgcni'.lftfcl nlJtiOlulcr Bl1ufigkeilcli rur Mcrk 1II1W1kI8$IiCu'

    x I' ! 124,3011130.3611136.4211142 ,52111 !:

    p30.IJ(;! 10 6 3 I 20 1136. 1401 4 12 2

    18

    1140. 1461 2 12 3 2 19 j146. 154i 0 I 2 I 4

    E 16 31 10 4 61 Nun ZUlU Vl'rgleich dl'f Mcrklllftic X und Y . Die Tctldcl1~. dl\SlOl Y mil X IUlSldgl, 1:.1 sclt.tvt'n;t/iudlicil IIlId tIOwohllUll Punkw.chwRtIll Rb Much der KOllt illgClll".uucl klll.r Ztl Crkl!llllCIi 0" dus C('Wicht. ill ct.w" proportional ZUni VOIUIIII.'I1 ist. \Iud dus Volumcl1 in dl'r driltclI PotCIiZ der lilll-"IU'CII Ausdehllung IUlSlcigt. b;l cine BcUchung

    y :::::o X~

  • 1.iJ ef 'll'ich v( dlil'd II 'r \erkmale 15

    Diese Funktion ist offenbar ein quadratisches Polynom in den Variablen a und {3. Es wird nun versucht, diese Abweichung moglichst klein zu machen, das ist eine Methode der kleinsten Quadrate. 1m Anhang wird folgendes bewiesen:

    Satz tiber die Regressionsgerade. Die Gesamtabweichung F( a, {3) hat genau ein relatives und auch absolutes Minimum, namlich fur

    (1.5.1) {3 = {3* := '[1 - a*x.

    Dazu muss natiirlich Sx of 0, d.h. X nicht konstant, d.h. k ~ 2 sein. Die durch X und Y eindeutig bestimmte Gerade Ry(x) mit der Gleichung

    Y = a'x + {3* heif3t Regressionsgemde bezuglich Y in Abhangigkeit von X. Der Wert von {3' zeigt, dass sie durch den Schwerpunkt (x, '[1) des Punktschwarms geht. Die Stei-gung a* ist bestimmt durch die schon in Abschnitt 1.4 erklarten Abweichungs-vektoren

    Vx := (Xl - x, ... ,Xn - x) und Vy:= (YI - '[1, ... ,Yn - '[1) im ]Rn. Damit ist

    sl = ~ (vx,vx) = ~llvxl12 und a* = ~VX'VY~, Vx,Vx

    wobei (, ) das Skalarprodukt und 1111 die Norm in ]Rn bezeichnen. Dabei ist fur jedes v E ]Rn

    (v, v) = IIvl12 . Eine Vereinfachung der Rechnung ergibt sich wie folgt mit Hilfe der Kontingenz-tafel: In der Formel

    n

    (vx,Vy) = 2)Xj -x) (Yj -'[1) (1.5.2) j=l

    hat man n Summanden, von denen viele gleich sein konnen. Sind al,"" ak bzw. b], ... ,bl die Auspragungen von X bzw. Y, so ergibt die Zusammenfassung eine Doppelsumme von k . I Summand en

    (vx,Vy) = '2:.:::h(X=aK"Y=bJ,).(a,,-x).(bJ,-'[1). (1.5.2') K"J,

  • mil eiuem ma&tAl)IUI,bhiulgigen Faktor u > 0 zu etwtvlell, 06 die GroBen lind C wichte dl!f Kinder ('iller Johrgnugs5ture jcdoch ill eillcm eug begrellzlClI Bereich licgeu t Will die kllb~IC F\llIklioll III diCfiCIII Bereich gOllz gUllincnr approxilllicrt werden. Ausrci6cr dabei !flud die klciuen Dicken und die gm6cn Dunnell, die mall im Punkl8chwnrlll IJOrOrl crkenllt.

    DR der Punk~hwJ\r1ll all8 61 venK:hicdellcu PUllklclI bcst.elu., is&. die Rcgmltli ollsrcchllulIg \'On Ihmd xu Rurwlindig: 111"11 \'crwendct bes8cr die Prognuume \'011 T6IK:hCllrocilllcrn odcr Excel . Die Ergebuis!;(> sind:

    :r - I .5 Ii - 337 (V\",IJ:C) _ 1438,9 ("'" "' ) - 1001 0

    (lJx , l1')' ) = 523.39 0' _ O,~, {J" - - 16,65(} ~. _ 0 .327 6 - 127.480

    fX'- - 0,345 Ocr Punkt$:hWJlnn mit den beiden R.cgrcssionsgcrnden siehl 110 8U8:

    ,po.) .,

    OIl

    I' -10

    :IS

    30 ,.

    '.

    slOc. Die ?aliI 0.345 hAL kcillc lIullliuelbllfe nb8011llt.' Bedeutung, Will aber Ills VerglcicllS_'ert zu Rndt.'nuU'lig~n Crnpl>en \'011 P('njl()fI~1I dicn{,11 Bei ciller CrupIX' von 53 Sltldi~rendl.!n illl Aller von el"'8 20 Jahrell wllf'd~ ein

    K()rrclalIOllSkocffizi~ul TXt - onl crlllillell III dlCtlCr Aller.Jgrup~ ist a.lso der Trend 8lirker ausgeprfigl,

  • 17

    Die Zahl der Paare (K;, A) mit einer Haufigkeit h(X = a,,, Y = b).,) =I 0 ist haehs-tens gleieh n, sehr oft deutlieh kleiner. Wir erwahnen noeh eine andere Magliehkeit zur einfaeheren Bereehnung des Ska-larprodukts. 1st

    so ist ( v x , vy) = (x, Y) - nxy . (1.5.3)

    Diese Formel beweisen wir im Anhang. Man beaehte jedoeh, dass dabei wieder sehr kleine Differenzen sehr groJ3er Zahlen entstehen kannen, wenn die Xj und Yj nahe bei x und y liegen. Die Extremaleigenschaft der Regressionsgeraden bedeutet nur, class sie so gut wie maglieh dureh clen Punktsehwarm lauft. Mit Hilfe einer zweiten Geraden kann man nun ein ganz brauehbares MaJ3 clafUr ableiten, inwieweit Y eine lineare Tendenz zu X hat. Dazu vertauseht man X und Y, d.h. man betrachtet Geraden mit der Gleichung

    x = ,,(Y + 8 und clie entspreehend aus den waagereehten Abweiehungen des Punktsehwarms entstehende Funktion

    n

    F(,,(,8) := 2)Xj - "(Yj - 8)2 . j=l

    Aus dem obigen Satz folgt, class sie fUr

    ein Minimum annimmt. Die Gerade Rx(y) mit cler Gleiehung

    (1.5.4 )

    heiJ3t Regressionsgemde bezuglich X in Abhiingigkeit von Y. Sie geht wie Ry(x) dureh den Sehwerpunkt (x, y), im Allgemeinen sind aber Ry(x) und Rx(y) ver-sehieden, ihre gegenseitige Lage wird im Anhang erlautert. Ob die beiden Regressionsgeraden libereinstimmen und ob das Merkmal Y eine lineare Funktion von X ist, kann man an einer einzigen, leieht bereehenbaren Zahl ablesen, clem K orrelationskoeffizienten

  • Be is pie l 3 (llouclum und Lungenl...-reb.) E8 ist phmsibcl , dNlS dit' .. Waimchcilllichkclt" 11.11 LUlIgf'ukrehs 7.U crkmnkC'1I VOII del' HOhe dCll Thoo.kkonS\llIIliI abhlin~t. \Vir gcl~n cin lilnrk vcrcinrlU"hl(!tS l3cisl)lcl fOr cine IlcgrCIISiollsrcc:hullug hien" mil nul' n - 10 ludh'idueu . X gibt d(,11 durclutdlllittlichcli T"hnkkolislIUI pro TIlg in Cnlllllll lUI, lr hnl die \ \'l'rl.(> 0 111111 I : o lX'(ll'utet nicht lUI Lungcnkrcbs erkrnllkl. I dfUJ CcgClIlcl1. Dei diesel' Ccit'gt'uhcit I!,chcu wir RliCh eill ciurnchC8 Rl'ClICIU.c hf'IIIR au. mit clem elif' Ill'grt'SHion.sn'f'huuIIA ohne Computt'rRurwnnd durchmhrbar bt

    J I .; II. TY

    I 0 0 0 0 0 2 0 0 0 0 0 3 0 0 0 0 0 4 0 0 0 0 0 5 0 I 0 I 0 6 10 0 100 0 0 7 20 0 400 0 0 8 30 I !JOO I 30 9 40 0 1600 0 0 10 50 I 2_ I 50 E 150 3 5500 3 80

    An den Einlrii,gcn ill dell 5 1)l\lten xJ und Jlj erkenllt man . d!\.'!lS cill ichlr8l1cher ulld ... wei n.ftuchcr crkrnnkt. bind.

    Nun zur Rcchlllmg: Uliler Verwendu.ng von (1.

  • Ui Vergl 'Idl \ ,'rsdliedt'llcr \l'rkl11nl'

    rXY:=

    oder ausfiihrlicher geschrieben

    (vx,Vy) Ilvxll'llvyll' (1.5.5)

    Die extreme Abhangigkeit ist Y = X. In diesem Fall ist rXY = rxx = 1 wegen (vx,vx) = Ilvxl12. Offensichtlich ist

    r~y = a* . "Y* . Geometrisch interpretiert ist rXY bestimmt durch den Winkel zwischen den Ab-weichungsvektoren, es ist

    rXY = cos(L(vx,vy)). Die Werte von a* und {3* hangen ab von den gewahlten MaBstaben, rXY ist davon unabhiingig. Das sieht man so: 1st

    Xl = a . X und yl = b . Y ,

    so folgt wegen VX' = a Vx und Vy' = b Vy

    (a')' = ~ . a* , a

    ( *)1 a 'Y* "Y = _. I b und rX'Y' = rXY'

    Daran sieht man, dass auch der Winkel zwischen den Regressionsgeraden Ry(x) und Rxcy) von den MaBstaben abhangt und nicht durch rXY allein , sondern durch a * und "Y* bestimmt ist . Das wird im Anhang erliiutert. 1m Anhang beweisen wir als zentrales Ergebnis dieses Abschnitts den Satz tiber den Korrelationskoeffizienten. Sind auf M = {I, ... , n} nicht konstante M erkmale

    X,Y: M ----> lR gegeben und ist rXY ihr Korrelationskoeffizient, so gilt

    -1::; rXY::; +1. Die folgenden Bedingungen sind gleichwertig:

    i) y ist eine lineare Funktion von X, ii) fur die beiden Regressionsgeraden gilt Rxcy) = Ry(x) ,

    iii) rXY = 1.

  • B e is pie l 4 (SllJrclte, Bubif!6, etc.) III cinelli ill1l\KillArell Stadtch('11 im EIsnB wurden 1.wischen 1000 ulld 1080 jlihrlich 111 ciller (Ct;tgc1t'glCIi Umgebung illl Jahr) (1960 S ) :5 1980) (olge"d(' ~ 1 l'rkI1lRle crhobelr

    Xu) :- AIIZIlhl der geborcncn 01lbies ) ' (;) := AUZRhl tier beobachtetell St.6rc:hc Z(;) :_ Auuhl der geOOrencn Fr&che

    "'{J) :- GroBe der SlIIlIprnJit:ht>lI.

    Aile vier Werle haUC'1I 1m gcmcssenell ZeltrlloUIIl cmell deutlichen fund IIRCh lInteli. dURlL'1 (olgt

    rXl' > 0 . ryZ > 0 \l lId rzw > O.

    Dicsc l)()(Ii l in'u KorreluliollskocffiziclltclI k1ulII IIlfm tIO crkliiren: Durel. dell Ausoo.u dcr KnnaliAAlion wurdclI die Sillllprc verkleinert, WM dazu ffihrle . dWiS C8 wClIIger Ft&ichc gab, aUto r,,, > O. Die SUSrchc (nndclI nun lIicht. mehr gellllg l-rOHche als Nahrttng, Wid da-hs.lb wl\udcrle O. dftSti die St.Orche die BabiCti bringcn. llieral! crkcllul mAU gOllz offcnsichtlich, wic IIl1sillnig (,IIIC dirt'ktc katL'lnlc Be.. grfllldung der KorrelAtlollSkocffizicllt.eu ist. Leider Ixmut~1I uII7,fihligc .. achwci se" , clic nUlIl rcgehuaHig ill ZdLungell ICllCII buill. tin&.clbe Ver(o.hrcli. WiLle !IInl! "lid, nocl, dftH ~ I t'.rkllllli

    VU) :=- AU7.ahl tier \"CrbufLcn Allti Baby PillclI ('rhobell, lIO WRrC rXI < 0 g('wordclI. III dlCl'K'!II Fn.lJ isl cill(l Kausalit.lit plausilx-1. abcr durd. die blo8e RochllUII& keincsfnJls bewiefiCl1!

    Be is pie l 5 ( K orTelotion und Unabhlingigkeit) Die UnabhungigkclL \"011 Mcrkllln1CII X \llId Y isL chl' wcit stiirkcrr B.liuKlIlIg 1l1l'l r _n - O. Eill einrnchl'K Dcisl)lcJ erhiUt lIIal\ mil AI - {1,2 ,3. 4} \llId dl'lI WertclI :

    J I 2 3 4

    " 0 I - I 0

    V, I 0 0 - I OM crgibt tI(,lI PullktJICh .... "ftrm:

  • 1.) \'l!"\ idl \'1'1'. ('ili((II'Il('r ~l lklll h~ 51

    Sind diese Bedingungen eTfiillt, so ist

    Y = a*X + (3* (Vx,VYI mit a* = und (3* = y - a*x , (vx, vXI FUT TXY = +1 ist a* > 0, also wachst Y mit X; JUT TXY = -1 ist a* < 0, also Jallt Y mit wachsendem X.

    In der Praxis wird der Fall TXY = 1 (abgesehen von vollig evidenten Situationenl kaum auftreten. Aber die Position des Wertes von T XY zwischen -1 und + 1 zeigt, wie stark der "Trend" zur linearen Abhangigkeit ist. Je kleiner der Betrag von TXY, desto geringer der Trend. 1m Extremfall TXY = 0 ist a* = ,* = 0, die Regressionsgeraden sind also die Achsenparallelen durch den Schwerpunkt; sie stehen aufeinander senkrecht (Beispiel 1 b ),

    ,

    ,.

    r=1

    ,. .

    ,.

    r=O

    ,

    r = 0.9

    .

    .. .. .

    . . ..

    .

    r = -0,5

    . .

    ..

    .

    r = 0,3

    ..

    ...

    r= -1 .. . .

    ,

    " . ...

    Verschiedene Punktschwarrne und Korrelationskoeffizienten bei n = 20 (aus [L-M-R, p.87]).

    Urn den Korrelationskoeffizienten T XY zu bestimmen, muss man das Skalarpro-dukt (vx, vy I berechnen, das sind n Summanden, und n kann sehr groJ3 sein. Diese Summe laJ3t sich eventuell sehr verkiirzen, wenn man die Auspragungen a" und b). so wie ihre Haufigkeiten verwendet. Durch entsprechende Zusammenfassung

  • (O, I)

    (. 1.0) (1.0) (1),-1)

    NUll ist 1'-11 =0, IT\ -(O, I. - 1.0)uudlll _( 1.0.O,_ 1),Rhio

    Die Jid f11r ein SrmIMulI f~arlJ(loxo'l Illit. IImlcrgnmdltl,.rlmuu findct. man z.O. hei (lie. 22.141 . Ausgafll9iPuukl ist die Brobecht.ulIg ails Scu,lllcl I di~ AblchniuCfl rur die Thndcnz tier 1-::XIUIICll.'filOlc miL dcr Studicllduucr al1zuslcigen. Weniger I,lallsibel isl die ZcitUlIgKlIlCldulig OIX'r die Stud!!! CIII('r Cc-IfiCUschart rur PcntOn.ufilhrulig. won8Ch auch die ;\ lIrftIl8l'i(l,chlillcr tx-i Uillgcrelll St.lldiullI IUlSlcigcn. WM Kieh dllililiLer vcrbirgl, wollen wir au cincm stark verdll rl)Clit.en imaginii.rclI aber cllI\f'I\ktcrist.hichcli Bci.~pl{'1 crlHlIlcnI. l3ci " = 5 Sludicrcutiell eillaf Sludicll(l,rullOl crhcl){'u wir die Mcrklllaic

    XU) := St.udiclldnllcr ill Sclll~tcrn Y()) :_ Exftlncnsnotc (von I bill 6) ZU) :- AIIftll&!,&chRIt pro JRhr in TE.

    Die zugcilorig,11 PlInkUK:hwArme in der X. Y - ulld til'f X, Z - EI)('II(, M'hl'1I ('tv.-n 80 aus:

  • l.

    wird k,l

    (VX,Vy) = L(a"-x)(b.\-y).h(X=a,,,Y=b.\ ). ",'\=1

    Neben einer linearen Abhangigkeit Y = aX + (3 kann es auch Abhangigkeiten h6herer Ordnung (etwa bei K6rpergr613e und Gewicht) geben. Dafur gibt es ei-ne Theorie der nichtlinearen Regression (vgl. etwa [L]) . Wir wollen aber noch kurz auf das Gegenteil der Abhangigkeit von Merkmalen eingehen, namlich ihre "Unabhangigkeit". Eine gute Bedingung dafur ist die folgende: Zwei Merkmale X und Y heil3en unabhangig, wenn fUr aile Auspragungen a von X und b von Y die "Produktregel"

    T(X=a,Y=b) = T(X=a)'T(Y=b) (l.5.6)

    gilt. In einer Kontingenztafel mit relativen Haufigkeiten bedeutet das, dass jeder Eintrag T t< ,.\ gleich dem Produkt der Eintrage am Rand ist , also

    T 1

  • , ,

    z

    .. 4 40 3 30 ,

    '" X .\

    I. II "

    I. II " DAt'RI.1li n'kcnlll mall ohnt' RedllltlllK. dAM r'u > 0 und "~a < 0 OM IIIIl _,d

    KcO(ler St-1II~lert.khl X lind lelgender EXftlllt'IL"nOll' ) ' 'IInkMKic Anr'Uln>~('llIdt Z i5l durch (11(' ErfahrllllJt Ix-k-Kl 1)(',. WKlcrtolprud, w der ob(,11 7.11IeTt('1I SlUdl(' k011l111t fol.sendenIIAfit11 zlIstlUKle Wir Ix>tr8Chten jt-:; Sluti\('r('nde fill.!! dr 0 0,,'*; i5t,.\) > 0 klar . kolln In Rill'" ltKIiCtIKfillgt'n SlMgl dlt' Nnlr mil det Dauer 1111 Gl'gl'llIiillZ XII aben is, jrll.l allch r\Z > 0_ OM Aurltug>og

  • 'j VI I '\pi h \ t' hied '111'1 I 'rklll \.

    Abschlie13end noch einige Anmerkungen zum Thema Korrelation und Kausalitiit. Wenn der Korrelationskoeffizient rXY zweier Merkmale X und Y deutlich von Null verschieden ist, dann bedeutet das intuitiv eine Abhangigkeit zwischen X und Y; im Extremfall kann Y durch X eindeutig festgelegt sein. Das legt die Vermutung nahe, dass ein kausaler Zusammenhang bestehen konnte. Bedeuten bei einer Schulklasse X die Korpergro13e und Y die Leistung beim Weitsprung, so ist rXY > 0 tatsachlich physikalisch begriindet, aber durch alleinige Messung von X und Y nicht bewiesen.

    Bei den Merkmalen "Rauchen und Lungenkrebs" (Beispiel 3) wird jede geniigend umfangreiche Erhebung ein Ergebnis rXY > 0 liefern. Damit ist jedoch keinesfalls ein kausaler Zusammenhang bewiesen. Es konnte ja sein, dass irgendein verb or-genes Hintergrundmerkmal existiert, eine Krankheit, von der die Begierde nach Tabak und Lungenkrebs zwei Auswirkungen sind. Besonders deutlich wird diese Problematik im Beispiel 4 (Storche, Babies etc.). Ein tiickisches Hintergrundmerkmal tritt bei Studienzeiten und Anfangsgehalt auf (Beispiel 6). Hieran sieht man auch, wie leicht sich statistische Daten manipulieren lassen, urn Dinge zu "beweisen", die gerade niitzlich erscheinen.

  • Beispie l I ( Zu/alLsexperimenLe) Wie /tHe IUnlhell1ntilif'ileu Ilegriffe Iii lid Zlifalisexpt.orimcillc IdcalisienlllgclI wn R('(\liUi.ten. Wir gchell cinige ciufRChe ikispil'in 7.eigt, ncnnt IIIIUl die Ergchullt!le .. Zilll'" exJcr .. WarlleU"; cletllu,lb kruill mall

    (J ~ {O.I} MeLzclI. WelchCN Ergdmis u1Im aJs Erciguis 8l1SZl'idIllCl. hiillfoJ,L da\'on lib. WfUi IIlIUI ('rv.'rutM. (70.0 . \Willi die MOIIU' cine .. EI1l.M(:heidulIM;" troffell 8(11). Pnnziplcll kijlll1l(~ (he MOllzc 118eh clem Wtlrr Audl AUr dCI1l RR.11d slchcn bldbcll odl'f illl (sRl1digcn) UnlcrKrund scnkrceht st(!ckCII blcibcll Soli du.'tie MOghchkelL

    ""lciulw7.o~l11 ..... trdcn. *' kllnu

    (J ~ to. I. 2) gCtiClZt w(OrdclI IUil 0 - 7 . .ahl, I ... W8PI:H!U IIlIcI 2 ... Rand . Et1 ko/llllltCII qnr noeh ..... (ilcre 1Il00liclw Erg('hll~ hcrOcbichtigt wcrdt'li. wie: Di(' MOI\Y.c lhlllUCh del'll Wllrr \,,(n;chwIIUdclI 1111(1 winl IIklll lI1t'lir g;H Cf'WftTltlt' Aber ni(' dnfoJ,l'lrct(,lIe Ergt'bll1Sl1C wt..oggelMlj('II v. ... rdt'll kunllcn.

    !lei CIUt'r &onc \'011 MOnYo ..... lirrcl1 slUd dlc rolgt'udplI IIsufigk"'itell IUlrgt'trt'tt'u

  • 1j7

    Kapite12

    Wahrscheinlichkeitsrechnung

    2.1 Relative Haufigkeit und Wahrscheinlichkeit Man geht aus von den moglichen Ergebnissen eines Experiments, eines Tests oder dergleichen. Zur Vereinfachung nehmen wir zuniichst an, dass nur endlich viele (paarweise verschiedene) Ergebnisse WI, ... ,Wn moglich sind.

    heif3t die Ergebnismenge. Erstes Ziel ist es, fUr jedes wErt eine reelle Zahl P(W) mit O:s; P(w) :s; 1

    zu erkliiren, als die Wahrscheinlichkeit dafUr, dass das Ergebnis W eintritt. All-gemeiner wird eine beliebige Teilmenge A c rt von Ergebnissen als Ereignis bezeichnet, und man sucht nach einer Zahl

    P(A) E lR mit O:s; P(A) :s; 1, der Wahrscheinlichkeit dafiir, dass W E A, d.h. dass das Ereignis A eintritt. 1m Fall A = {w} spricht man von einem Elementarereignis. Diese Terminologie ist etwas gewohnungsbedtirftig: Ereignisse sind unter irgend einem Gesichtspunkt ausgezeichnete (oder erwartete) Mengen von Ergebnissen. Wir nehmen an, ein Experiment konne so ausgefUhrt werden, dass der Ablauf und somit das Ergebnis dem "Zufall" unterliegt, und dass man das Experiment beliebig oft wiederholen kann, ohne dass Ablauf und Ergebnis von den vorher-gehenden Abliiufen beeinflusst werden. Unter derartigen Voraussetzungen kann man von einem ZuJalisexperiment sprechen. Fiihrt man es k-mal aus, so erhiilt man (von den Ergebnissen der Serie der Experimente abhiingige) Zahlen

    Hk(W) Hk(A) = I: Hk(W)

    wEA

    Anzahl der Male, in denen W eintritt .

    Anzahl der Male, in denen W E A eintritt.

    Offenbar ist 0 :s; H k (w) :s; k und 0 :s; H k (A) :s; k. Man nennt diese Zahlen die (absoluten) Hiiufigkeiten des Eintretens von W bzw. A.

    Rk(w) := tHk(W) bzw. Rk(A):= tHk(A) = I: Rk(w) wEA

  • k I 10 20 30 10 SO 00 70 SO 00 100 II, 0) I 6 9 11 18 U 30 ~ J8 12 49 11.(1) 0 I )) 16 22 26 30 ~ 12 18 5 1 11.(2) II 0 0 0 0 0 0 0 0 0 0

    CrftplulICh .... ehl dlUlllO HUll (l"lIIgM.lllgcn fllUd dl(' rt'lall\'ct! Ib,ufigkellC'II) -

    I. Il. (0 )

    . ~

    .. -.. -----.----- . _ _ ___ ._ .. __ -- 0. . _ . , . '-"" . . ..

    .: n.( I) .

    .

    00 0 I. 20

    '" ., 50 00 ro ,., 90 100

    An dn- Graphlk towhL lUaJl gut . "'Ie It.lell ilK- 'IAlI\'t'I'1 Iht.uligkMlcn \'011 Zlthillud W"PPMI !wIde 1)('1 i t'1111M'1KlcllI MAn MIOl dnffir. dtt'tit" bndMI En-"gnlllM" *,tMl ~&k'If'l1 'A1\hniC'hf.'lIIlich" OBH ErcigniIJ 2 (MiIl17-C hlelhl "uf dem Rami I'Itrh('n) btl lIif' Ilufgclrt'wn foAl ~ih dAhl'f AI!! " lotaluIIWftlul11It' g'ftUI', hartt' Fln,h.II:~'Url("f1 'A't'fflen Daalll glhl ('toj dil" ;tv.", 111\1M' 1H'g(,IKIt'1i Ergt-hulaM'

    Schr",hlsr, i\l'iO 11 (0, 1 t Auch Iller kOIllM'1I nodI Andert' Ergebnt!llM' \"OrR{'toC'hclI "'{'!llcu. ("twa

    d h dn nClfhll'Kf'1 hlt'lht hn Glt'ichgNir'hl IUlr 11M' SPit" .. blell('l1 Dit.,. hot 1)('1 Ull.'OMl'r rordf'rUUK luw:h I"'lIwr fthult'U unci hurlf'1l 1I1lt('1"1~(' 1'10 Mllllwnhr-Rlwlllhch ~. dl\Sl\ "'II' t'" alleh IInIJ("l'"tkk.'ikhtl~t I~'II kOnll('11 J3N f'uwr NUlChKt'II. plfl..nIlK"fI 0_ tllIl ..... ll!(' a.tlJK' riM IUKll'OI lum 'x-lln Milu7.ur( hallllAIl dM Q!Hlhl. ctNOti ZR,hluIKI \\ RPI)t'f1 .. ,1Mt-h ",ahn.rlwm-he"" lund DaJK'f' Kill AI Jth; ~crt'Cht(' Ellljj('hMdun~ ,,(' 1111 UlAn SK'h uk-lit (-'lIIlgMl wm. 'A"f'1" x l) Ct'M'lurr pil~1I lutUib [kiln nM6uA"d dag~(,11 11tl (1M It'u uidll

  • 5f)

    heiBt die relative Haufigkeit des Eintretens von w bzw. A. Aus der Definition folgt unmittelbar die Grundregel fUr Elementarereignisse, dass fUr jedes k und jede Serie von Experimenten

    (0) und

    gilt. Daraus erhalt man fUr beliebige Ereignisse die Regeln

    (1) O:s: Rk(A) :s: 1 fiir A CD, (2) Rk(D) = 1, (3) Rk(A U B) = Rk(A) + Rk(B) fiir A, BcD mit An B = 0 .

    (2.1.1 )

    (2.l.2)

    Intuitiv hat man die Vorstellung, dass sich die Zahl Rk(A) bei immer grbBer werdendem k unabhangig von der Serie der Experimente "stabilisiert" oder sogar konvergiert gegen eine Zahl P(A), die gleich der "Wahrscheinlichkeit" dafiir ist, dass das Ergebnis w in A liegt. Diese Idee ist jedoch tiickisch: Schon in einfachsten Beispielen (etwa Miinze oder Wiirfel) sieht man, dass die Konvergenz extrem schlecht ist. Und in der Theorie ist gar nicht klar, welche Voraussetzungen fUr einen Beweis der Konvergenz gemacht werden miissten. In diesem Dilemma fand KOLMOGOROFF 1933 das Ei des Kolumbus mit seiner axiomatischen Definition der Wahrscheinlichkeit , die im folgenden angegeben ist. Den Zusammenhang mit den relativen Haufigkeiten kann man dann nachtraglich in einem "Gesetz der groBen Zahlen" prazise beschreiben (Anhang F zu 2.7). 1st D eine (endliche) Menge und bezeichnet 1>(D) die Potenzmenge, d.h. die Menge der Teilmengen von D, so versteht man unter einer Wahrscheinlichkeiisverteilung eine Abbildung

    P: 1>(D) -t lR, A f-+ P(A) mit folgenden Eigenschaften

    (1) O:S: P(A) :s: 1, (2) P(D) = 1, (2.l.3) (3) P(AUB) = P(A) +P(B) falls AnB=0.

    Welche Abbildung P angemessen ist, wird durch die Mechanismen bestimmt, die das Ergebnis w produzieren (etwa das Innenleben des Wiirfels), und die meist nicht genau bekannt sind. Die Axiome sagen nur aus, welchen Regeln eine mathe-matische Beschreibung geniigen muss. Die Wahrscheinlichkeitsrechnung gestattet es dann, aus gewissen vorliegenden Informationen iiber die Verteilung andere, noch unbekannte, zu berechnen.

  • kIM. denll die GewkhlsverLcilung ulld die Ma&- dC8 NR.gebi bceillAu&.e1l auf joocn rail. in welchc 5t{'l1l1l1& dcr Nilgellicbcr QUll Mit ~wci \-crschicclcllnrligclI RC"i6niigcll1 wurdc cinl' ScrKl von WOrfell durch jtcfUhrt. I" kt'illCIIl Fall blieb del" Rci811l1gd II\lr dN SpilZC stclle-n, wo;lmlh ~ Kcniigl , n ... {O. I} ~II hctrRchlcu und die rclnlh'O lIiiufigkdl de!! EreigniAAcH 0 "" M&Ur dCIIl Kop!" IUIZlIgcbcli. dellli IIUli (21 I) IIIItI (2. 1.2) folgt dirckL , daM R,(I) = I - R,(O) .. , Nagel I: k 10 20 3(1 40 SO 00 70 80 00 100 200 300 400 GOO n .. (Oj 0.60 o~o 017 045 048 OotS M!) 0.":' 048 048 04i 0.46 0.47 0.49 Nngcl2: k 10 20 30 40 60 GO 7U 80 00 100 200 300 400 bOO n.(O) O.au 0.30 0.30 036 0.3-1 0.33 03; 0,39 0.37 0.39 0 13 0.40 OAI U.43 Sclbfit. bel dcr grollcu Z"III VOII 500 Wif.'l:icrholuIIgl'lI :lilld IIadl kchw Werte deulr lieh ZII erkcnllCII, lIel dt'lit'll sich die relllLh't'1I I-Iftufigkcit 11 cillpcndclll . FUr die Wllhrschciulichkciteli 1'(0) Imu" IIInJl h&IIlot.CIIII grobe SchRt~tllIgcn \'CnmchclI:

    OAr; S P(O) S O.S bei Nagel I lind 0.35 S 1'(0) S 0.

  • 2.1 6J

    Nicht zu sagen, was Wahrscheinlichkeit ist, sondern nur die charakteristischen Eigenschaften anzugeben, mag zunachst unbefriedigend erscheinen. Aber das ist nicht neu: Schon der Versuch zu erklaren, was eine natiirliche Zahl inhaltlich ist, fiihrt bekanntlich auf einen Holzweg. Uberdies ist das auch gar nicht notig: es geniigt zu wissen, wie man zahlt. Das Ergebnis sind die vertrauten Peano-Axiome. Genau so ist die Definition der Wahrscheinlichkeit durch die Kolmogo'f'OfJ-Axiome (1), (2) und (3) zu verstehen. Sie sind gut motiviert durch die entsprechenden Rechenregeln fiir die relativen Haufigkeiten und auch iibertragbar auf allgemei-nere als die hier betrachteten endlichen Ergebnismengen Q. Das verschieben wir auf Abschnitt 2.9. Fiir endliches Q kann man eine Wahrscheinlichkeitsverteilung formal einfacher analog der Bedingung (0) flir relative Haufigkeiten erklaren: Zu jedem W E Q ist eine reelle Zahl Pw gegeben, so dass

    (0) 0::::; Pw ::::; 1 und 2: Pw = l. wEr!

    (2.l.4) Damit kann man fiir beliebiges A c Q

    P(A):= LPw (2.l.5) wEA

    erklaren, und die Axiome (1), (2) und (3) filr dieses P sind ganz einfach nach-priifbar. Umgekehrt folgt natilrlich Axiom (0) aus (1), (2) und (3), wenn man Pw := P(w) setzt. Die Zahl Pw = P(w) nennt man eine Elementarwahrscheinlichkeit. Eine schOne geometrische Veranschaulichung flir eine Wahrscheinlichkeitsvertei-lung ist ein GlUcksrad. Es hat den Gesamtumfang 1, das entspricht der Menge

    Q = {WI, ... , Wn } . Der gesamte Kreis ist aufgeteilt in n Bogenstiicke der Langen

    Nun lauft ein Zeiger den Bogen entlang und bleibt yom Zufall gesteuert auf einem Bogenstiick wE Q stehen. Ais Wahrscheinlichkeit daflir ist die Lange P(w) angemessen.

    ClUrk. "ad

  • gro6c ZahlclI " lIotig tllud . Oas "cst lIicht lUI dCII IlIcchall~hcll ProblCIIICII dC8 WUrrcllls: der glclche Effckt lriU bel cinc", Zur"lbgcllcmtor illl Computer AUr Als Beispiel gcheu wir dic Ergcbni.~ bel drci ScriCII VOIl jc 1000 W[jrrclI '"1 1St. l.. Ilcrt 2, 11.16J:

    0.20 11,(6) 0.\0 0.18 0.17 L-,~~~:::::~~:::~C::::::::S~::::$_:-0. 16~ 0.15 0.1'1 0. 13 0.12 0. 11

    O. IO -l---~--~--~--~---~-o 200 '100 GOO 800 1000

    Elite Varial1lc des IIIl'chlUllSChcn Wiirrcl1t8 gcltt 1lO: Man bittet cinCII Kreili \'011 lIlehr "Is 20 PcnIOliell. Jecll!r mUge :.ich cinc "IIlOgliclUil xunuligc" Zahl zwbichclI I \lIKI G merkel! 01\1111 TUrt IIIIUI ill ... mrnlligcr~ Rclhcurolgc 20 PCI'SOIICII ftUr. IIlId billel sic, die I\usgcwAhll(' Zuhl Ztl 1I(,IlIlCIi . Ow t-:rgcbIlL~ RUg drci vCr.fChirol'IlCIi KrcibClI 8ind:

    SchOler 1 KllUiSC

    Schiller 4. KI~ 11",(..,)

    StudClltCIi I ScIllChler

    lI ier isl der "ZurAII" ",fllIZ finders gcsteucrt. Ala IX'hll IIIl'CIIAIlLotch('1I Wiirfclll Oil' Kmdcr sind I)llr hOlIl' re A ugellzahlell, bt~lIdCOI die 6 fixicrl. Die StudcntclI \'COIII-chell die AUKcnwlllell glcichlK't(oclitigl zu betrne-liteli. v('rllleidcu Rber deutlkh dil' Zahicli I ulld IJ lUll .. Ilnlld ~. wei! sic Wt'gCII illrI'r CXlrrlllCIi Lugc .... 'Clliger zlIffillig l'r~heiIlCIi . DiNi('r llu'jd~Dt'kt trill I\lIcll brim AlIkr('tI:r.c1l der Lento Scheille 8Ur.

  • 2.1

    Man beachte, dass P(w) = 0 nicht bedeutet, das Ergebnis w ware unmoglich. 1m Bild des Glticksrades bedeutet das nur , dass der Zeiger genau auf einem Punkt, d.h. einem Sektor vom Winkel null, stehen bleiben muss. Dies ist naturlich eine rein mathematische Bedingung, die in der Realitat nur naherungsweise nachge-priift werden kann. Fur die relativen Haufigkeiten bedeutet P(w) = 0, dass Rk(w) mit wachsendem k beliebig klein wird. In Beispiel 1 kann man das fUr das Er-gebnis "die Munze bleibt auf dem Rand stehen", in Beispiel 2 fUr "der Rei13nagel bleibt auf der Spitze stehen" erwarten. Fur das Rechnen mit Wahrscheinlichkei-ten sind die wE Q mit P(w) = 0 irrelevant, man kann sie auch weglassen und Q entsprechend verkleinern. Die Voraussetzung der Endlichkeit von Q ist eine starke Einschrankung. Schon wenn das Ergebnis eines Zufallsexperiments eine beliebig gro13e naturliche oder gar eine beliebige reelle Zahl ist, muss man unendliche Ergebnismengen Q zu-lassen. Das verursacht gro13e technische Komplikationen, wir verschieben daher diese Verallgemeinerung auf Abschnitt 2.9. Es wird sich zeigen, dass man die Bedingungen (1) bis (3) fast unverandert ubernehmen kann, in Bedingung (0) dagegen sind die Summen nur fUr abzahlbare Mengen Q sinnvoll. Nicht nur zur Vorbereitung des aligemeineren Falles ist eine geometrische Analogie hilfreich. Man betrachtet ein Quadrat Q der Kantenlange 1, fUr seinen Flacheninhalt gilt P(Q) = l. Nun kann man sicher nicht fUr jede beliebige Teilmenge A C Q einen sinnvollen Flacheninhalt P(A) erklaren, aber immerhin fUr ein genugend gro13es System von Teilmengen

    A c :J>(Q), etwa die Menge A aller Teilmengen A C Q mit einem genugend einfachen Rand. Enthalt A mit A und Bauch Au B, und bezeichnet P(A) fUr A E A den Flacheninhalt, so gelten offensichtlich die abstrakten Axiome von Kolmogoroff. Man beachte, dass der Flacheninhalt inhaltlich nichts mit einer Wahrscheinlich-keit zu tun hat, aber die formale Analogie ist uberzeugend. Die Eigenschaft (3) fUr die Flacheninhalte kann man so illustrieren:

    P(A U B) = P(A) + P(B)

    Diese Analogie ist sehr nutzlich zum Verstandnis einiger anderer Grundregeln der Wahrscheinlichkeitsrechnung, die sich allein aus den Axiomen ableiten lassen. Wir stellen sie zunachst zusammen:

    n

  • Bempie l 5 ( Zo.lIlc1llotto) 01\8 ZurA.ll81-'XIH'l'IIIK'lIl Uol die ZU'hulig \'011 6 "Ull 19 ZAhleli . dM Erg~bllltl Mil 6 Tupcl

    .., {n.. . .. 1 C {I. . 191 W it> wlr III Ucl!!plt'l 2 "WI AIJti('hnin 23 ltusrt.'CIuK'1I \I"'l"nh"lI . hltt.!lit- Mrug(, n "lIt'r .,1c1M'1l 6 1'\11>1 ZwillIllJtklrolllNC:lltn h .. rlnt.KtllIg \'011 NlV"lIrK:hlt'lI " '('rd('11 dH'l;(' lull,.,.l III "IIII' Folge \'011 Olts. d II Sigu81rll tllll d('n W('rlcl! U und I Ein .. Worl " d('r I...AIIK(' " I:>ot dlUlI1 rill EIf'II"'"l

    IJ _ (al . . 0 .. ) e n -{o. !} '" lk-i tin Ul)M"tr"Aun~ ('11K'll BllM kallli ('111 FdliN' Aurlrrt("ll , 11K' WAlll'X"hrililK hkt' lt P E 10. II ffir 11K' rllhkil(, Ubt'11."'AulIl hlugt ' 'Om f{an,.J Ah. s .... Uil IHIS Erf"h ruUtt brMnnl od,.,. bnll ~UlIIIIK~t gut ,,1~(',.dl ltl~1 "''M"tW.1 In (wr SI)JlU"lw riM"

  • b5

    (4) P(0) = 0, (5) P(A1 U ... U AT) = P(A1) + ... + P(Ar ) falls Ai n Aj = 0, (6) P(A) = 1 - P(A), wobei A = n\A,

    (2.1.6) (7) A c B ==} P(A) ::; P(B) , (8) P(A U B) = P(A) + P(B) - P(A n B) , (9) P(A 1 U ... U Ar) ::; P(A 1 ) + ... + P(Ar ).

    Regel (4) besagt, dass die Wahrscheinlichkeit fUr das "leere Ereignis" 0 gleich Null ist. Das ist eine rein formale Regel; als "leeres Ereignis" kann man hochstens bezeichnen, dass gar kein Ergebnis eintritt. Das ist abel' durch die Definition eines Zufallsexperiments ausgeschlossen. In del' geometrischen Analogie besagt Regel (4), dass die FHiche del' leeren Menge gleich Null ist. Wie schon oben bemerkt ist die Umkehrung falsch: Aus P(A) = 0 folgt nicht A = 0; so wie eine Teilmenge vom Flacheninhalt Null nicht leer sein muss (etwa ein einzelner Punkt). Regel (4) folgt aus Axiomen (2) und (3) mit A = n, B = 0 :

    1 = p(n) = p(n U 0) = p(n) + P(0) = 1 + P(0) . Regel (5) ergibt sich dul'ch wiederholte Anwendung von Regel (3) .

    P(A1 U A2 U A3 U A4) = P(A1) + P(A2) + P(A3) + P(A4)

    Regel (6) besagt , dass das gegenteilige Ereignis die komplementare Wahrschein-lichkeit hat. Das ist mehr als plausibel, auch in der Analogie der Flacheninhalte.

    P( ) = 1- P(

  • Zu(ftll.scx)X'rIIucute ('rhli.h IIUUI rnr II = 1 durch Ubcrtrngllug von w E {D. 1 J ('111 Erg('bnill w' e {D. I} . Mil. den Air Bits IIblicill'1I Ik'chcnrcgclll

    0 - 0 - 1 - 1 - 0 w~ 1- 0 = 0 - 1 = 1 crkliirt 1II1t11 df'1I ObrrlrugunglJ/tlllcr

    ,. := w' - w e 0 _ to. I} . ~ ... 0 bec:!eutct rI('htigc. ,. .. I ("lschc ObcrtrKgulIg. Ohllll 1St durcb

    P(l) _ p unci P(O) - I - II elite IUlgelU~ue WRhnK'heilllichkeiu\'crtcilulIg RU( 0 "'" to. I} gegebcl1 Zur VDrtlClulU "lIf die (olgelldell Abtichl1iue .... -alien wir zcigeu, wie RU8 di~t ciu-rnchcn AU8gnll~itll"LiDII cin illlCrt'88lt.llt..cs ProblCl1I der WnlltScheilllicltkeihltccl,-IIl1ng wirel. Steigerl IIUIlI die WortlAlIgCtiOuclcrt' iutcrl'Rltcrt die Zahl cler Vbcrlra,gulIgs(ehlcr. d .h. die Zulli

    X) a X(",' - ",) - II (.e(I. ... ,n) , b,".,) . VIII dit' Wa.hrwchdl1hchkcil ror genall I.: Fclilrr %11 berochnell , bctracittcl IIIlUI ror o $ k $ " die MenKen

    gcsucht i!lt dan II die ZaJII P{A,,) . d.h. die Wahrschcilllidlkcit flit dM Eteignis .. ge-Ilflll k Fchler" Noch wichliger ror die Bcurtdlllllg tier QuaJitlit der Uhcrtrngullg

    i~t dM Ereignizs .. ittk.-llStclIs k Fchler". d .h

    uud die IX-rccitllulIg dN Wnhrsc::heinlichkl'it PCB,) . OfrclL,ieitllich ilit 0" _ O. UngecluJdigt'1I Le.cru ~iclI die ErgcblliHsc \ 'crmtCII Sct~t IIlfll'l YOI"IUlS. dlUiS ~Ich die Obcrtrngtlllg,llfchicr bei dell cillgeitcndclI BitH uichL gCfijCnscilig l>ecillnUl'l8C1I (ob sic gert.'CIltfM"ligt lst hAngt gltm VOII der Art det S16nlllgen ftb) . so ist

    PtA,) - G)p'" - 1')"- '

  • 2.1 I d,lti\'(1 II 11lfigk('it tim] \\ 1111 dl('1II1i hk it

    Regel (6) folgt unmittelbar aus Axiom (2) :

    1 = pen) = P(AUA) peA) + P(A) .

    Regel (7) besagt, dass die Wahrscheinlichkeit gr6Ber wird, wenn man mehr Er-gebnisse zu Ereignissen macht.

    peA) :s; PCB)

    n

    Regel (7) folgt sofort aus Axiomen (1) und (3):

    PCB) = peA U (B \ A)) = peA) + PCB \ A) :::: P(A).

    Regel (8) modifiziert Axiom (3), falls die Voraussetzung An B = 0 nicht erfiillt ist. 1m Bild der FUicheninhalte ist klar was passiert: Bei der Summe peA) + PCB) wird peA n B) doppelt gezahlt, es muss also einfach wieder abgezogen werden.

    peA U B) = peA) + PCB) - peA n B)

    n

    Zum Beweis von Regel (8) benutzt man die disjunkten Zerlegungen

    A = (A \ B) U (A n B) , B = (B \ A) U (A n B) und AUB=(A\B)U(AnB)U(B\A).

    Nach Axiom (3) ist

    peA) = peA \ B) + peA n B) und PCB) = PCB \ A) + peA n B)

  • OM wird in (kispiel 2 IUI5 2.'1 bcim TIl('rnl\ M Billolllial\'('rt('ilung~ crkliirt Aus der Regel (5) ill (2. 1.6) folgl. dflllll

    P(LJ,) - t (;),/( 1 - 1') , , ..

    om-usk:lllli h Uil die Vereilligullg

    AouA I u .. UA .. - n di5juukl.. also lIil IIRC" Regel (5) 8US (2.1.6)

    PIA,) + PIA,) + .. + P(A.) _ 1. dnrnlls folgt die "lterultli\'(' Formel

    Sie hal ","'CllIgL'T StilllIlUUldcu ..... 'CIln k > i isl In Ab8chnill 2.8 ('r18UlL'I'1i wir die Probleme I~i d(.'I' Bcn.'Chnung derarli., ... r 511111-men, in Beispiel 3 alilS 2.8 uigen wir. WIC dM Erg(-buis lUit Wife d(.'I' Gau6 Vertcilung gut "'1)Proxilllicrt werden kann . OiCHCr Aushlick soli noch ('illmal des Prillzip der Wailf'81chcinlichkeltsrC'Chnulig deullich IIInchcll: Ails dN I(CIIIlU,ill oc.ler SrhiitzulIg Al'wi&.cr PallUllt'lCr (ill di('-tielll FRII dcr lal.1 p) laUIlI UlaJl ullter 1)lflIL'iibleli AuunhmCII kOIllI)Ii~ierl,cre W"hr~ 8chciulichkciteu ix>rcchucll 08 die Ansgftugs .... wte sellen gCMU bckrulllt silld. ifil einc Apl)roxilllRtion dCII Er8cbni~ mc~t ftullrrichelld.

  • also folgt

    P(Au B) P(A \ B) + P(A n B) + P(B \ A) P(A) - P(A n B) + P(A n B) + P(B) - P(A n B) P(A) + P(B) - P(A n B) .

    6

    Regel (9) ist eine Variante von Regel (8). Fur r = 2 folgt sie aus P(A n B) 2': 0, fijr allgemeines r durch wiederholte Anwendung.

  • Beispie l 1 ( tommhaJter) In BclSpM'1 6 aus 21 hattn! wir dl(" FtAt' {,IIIt"J StlUlllnhalt('tl 00 2 Kmdcm aufseworfcn D~ fo;r~cbIll5nK'I\g~ ......

    Il {(O. 0) - (1.0)

    (0. I) } (I. I)

    Unter der Ann"lullc, dMIJ ~ Mnetn Kind nu",ullclt lind ,,'('ibllch glrich WAhr-helllh(':h Ilit (lIaht'rultp"~ bit dM ck>r FilII), llit IUIf {D. I} Glridw('ru'iluIII 1U1I>('mMK"l'I und ItOmit .. hcnfalls auf n OM &!Ie. ... hr plaWtlbcl und wlrd III AI~ 2idllliu 2 6 pnul.'!(' 'X'ITliIKlct Mit d('t EreignL"-lIIclIgt' A n \ {( I . I)} bot danll

    NA PtA) - - - I Nil '

    tlie WAJIOK'hclllllehlwlt ftlr ('1II("n SlftllllllllltllM" Wlr Mllnell (he fon..ge aoch Illldln l>CHChWlhen und Ilhl fo::rgcbull elk- lahl der MAdchen bet 2 KllldM'n anl"rhcII Dillin 1St

    11' - (0. 1. 2) Wi1rdcn wit IItIll "uf fY Il18 \\'ahtlChclllhc:hlwllJi\'1'rlCllulIl: P' G~h"'t'tlCdUlIA an-nchmen, dIU'" wlln- die Wklu1tChelllhchknt rur cillen SllUlllllhllllcr glcK:h

    I"O. I}} - P'(O} + P'(I} I + I I . "'M dem obigell korrcklell Ergclmis widM'l>ptkht Eiut' a'I.gMIlUiIoeIH' Vertelluug "uf fY 1St

    I'(O} - 1"(2) - I . P'(I} \ . drum ~l 1"((0. I}) I + I I , DMIII dlCfiN P' aIlK('IIK'flotiMI L5t, '''lIlII IIIIUI 80 8('hell riftbk-

    x n IIIll der dl(' Mj,.dch('11 gcz.l\hll ,,'\!tdell Drum ist durch

    P'(.} _ I'(X

  • 71

    2.2 Gleichverteilung und Zufallsvariable Das wichtigste Beispiel fur eine Wahrscheinlichkeitsverteilung ist die Gleichver~ teilung (oder Laplace~ Verteilung). Rier ist flir 0 = {WI, ... ,Wn }

    P(W) = ~ flir jedes W EO,

    also hat jedes Ereignis A c 0 die Wahrscheinlichkeit

    P(A) = #A = Anzahl der gunstigen Ergebnisse. #0 Anzahl


Recommended