+ All Categories
Home > Documents > skript_masstheorie

skript_masstheorie

Date post: 30-Oct-2015
Category:
Upload: bigitall
View: 54 times
Download: 0 times
Share this document with a friend
156
7/16/2019 skript_masstheorie http://slidepdf.com/reader/full/skriptmasstheorie 1/156 Elemente der Maß- und Integrationstheorie Skript zur Vorlesung Maßtheorie ur die Studienrichtung Statistik Prof. Dr. Uwe K¨ uchler Institut f¨ ur Mathematik Humboldt-Universit¨ at zu Berlin Sommersemester 2013 4. M¨ arz 2013 e-mail: [email protected] www.mathematik.hu-berlin.de/ kuechler
Transcript
Page 1: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 1/156

Elemente der Maß- und Integrationstheorie

Skript zur Vorlesung Maßtheorief ur die Studienrichtung Statistik

Prof. Dr. Uwe KuchlerInstitut f ur Mathematik

Humboldt-Universitat zu Berlin

Sommersemester 2013

4. Marz 2013

e-mail: [email protected]/∼kuechler

Page 2: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 2/156

2

Page 3: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 3/156

Inhaltsverzeichnis

1 Grundbegriffe 3

1.1 Elemente der Mengenlehre . . . . . . . . . . . . . . . . . . . . . 3

1.2 Semialgebren, Algebren, σ-Algebren . . . . . . . . . . . . . . . . 15

1.3 Mengenfunktionen und Maße . . . . . . . . . . . . . . . . . . . 28

2 Messbare Abbildungen 43

2.1 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.2 Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2.3 Produkt-σ-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . 49

2.4 Durch messbare Abbildungen induzierte Maße . . . . . . . . . . 51

3 Integration messbarer Funktionen 55

3.1 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.2 Einige Eigenschaften des Integrals . . . . . . . . . . . . . . . . . 58

3.3 Substitutionsregel . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.4 Integrale bezuglich diskreter Maße . . . . . . . . . . . . . . . . . 63

3.5 Integrale bezuglich absolutstetiger Maße auf (Rd,Bd) . . . . . . 64

3.6 Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

3.7 Lebesgue- und Riemannintegrale . . . . . . . . . . . . . . . . . . 77

4 Konvergenzarten f ur Folgen messbarer Funktionen 81

4.1 Konvergenz µ-fast-uberall . . . . . . . . . . . . . . . . . . . . . 82

4.2 Vertauschung von Grenzwertbildung und Integration . . . . . . 84

4.3 Konvergenz dem Maß nach . . . . . . . . . . . . . . . . . . . . . 88

4.4 Konvergenz in Verteilung . . . . . . . . . . . . . . . . . . . . . . 91

4.5 Konvergenz im L p-Sinne . . . . . . . . . . . . . . . . . . . . . . 93

3

Page 4: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 4/156

4

5 Produktmaße 101

5.1 Messbare Abbildungen auf Produktraumen . . . . . . . . . . . . 1015.2 Produktmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1035.3 Integrale bezuglich Produktmaßen . . . . . . . . . . . . . . . . . 105

6 Messbare Funktionen mit Werten in Rn 1116.1 Messbarkeitskriterien und induzierte

Maße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1116.2 Finite Maße auf (Rn,Bn) . . . . . . . . . . . . . . . . . . . . . . 112

7 Der Satz von Radon-Nikodym 1237.1 Der Satz von Radon-Nikodym . . . . . . . . . . . . . . . . . . . 123

7.2 Eigenschaften der Radon-Nikodym-Ableitung . . . . . . . . . . 1257.3 Absolutstetigkeit bei Maßen und bei Funktionen . . . . . . . . 126

8 Bedingte Erwartungen 1338.1 Definition und Beispiele . . . . . . . . . . . . . . . . . . . . . . 1338.2 Eigenschaften bedingter Erwartungen . . . . . . . . . . . . . . . 1358.3 Bedingte Erwartungswerte . . . . . . . . . . . . . . . . . . . . . 136

9 Likelihoodfunktionen 1419.1 Deterministische Likelihoodfunktionen . . . . . . . . . . . . . . 1419.2 Stochastische Likelihoodfunktionen . . . . . . . . . . . . . . . . 144

Page 5: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 5/156

5

Vorbemerkung Sommersemester 2013

Das Skript wurde in einigen wenigen Punkten korrigiert und erganzt. Es wur-den 16 Graphiken aufgenommen, f ur deren sorgf altige Erstellung ich dem Stu-denten Adrian Kammler danke.

Das Skript ist sicher auch jetzt noch nicht fehlerfrei. Hinweise, Vorschlage undkritische Bemerkungen sind deshalb weiterhin sehr willkommen.

Berlin-Adlershof, 01.03.2013

Page 6: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 6/156

6

Vorbemerkung Sommersemester 2012

Das vorliegende Skript wurde in mehrfacher Hinsicht uberarbeitet. Im Kapi-tel 1 werden die im Rahmen dieser Vorlesung notwendigen Hilfsmittel aus derMengenlehre und Analysis komprimiert zusammengestellt und gezielt aufge-frischt.

Neu sind weiterhin die zwei Kapitel uber bedingte Erwartungen (Kapitel 8)und uber Likelihoodfunktionen (Kapitel 9). Beide Begriffe sind eng verbundenmit dem Satz von Radon-Nikodym (Kapitel 7) und stellen Saulen der Wahr-scheinlichkeitsthteorie und Statistik dar. Ihre hier gegebene maßtheoretische

Fundierung eroffnet den Studierenden die Moglichkeit, moderne Richtungen,wie z.B. zeitstetige stochastische Prozesse und ihre Statistik, sowie Anwendun-gen in der Stochastik der Finanzmarkte, besser zu verstehen.

Daruber hinaus wurden Ubungsaufgaben an das Ende vieler Abschnitte ein-gef ugt. Ihre selbstandige Losung wird allen Studierenden sehr empfohlen. Siesind auch Bestandteil der Ubungsstunden, bei denen Losungen besprochenwerden sollen.

Das Skript ist sicher noch nicht fehlerfrei. Hinweise, Vorschlage und kritischeBemerkungen sind deshalb sehr willkommen.

Berlin-Adlershof, 28.02.2012

Page 7: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 7/156

7

Vorbemerkung Sommersemester 2009

Im Wintersemester 2008/09 startete der neu eingerichtete Masterstudiengang

”Statistik”, ein Gemeinschaftsprojekt der Humboldt-Universitat zu Berlin, der

Freien Universitat Berlin, der Technischen Universitat Berlin und der Charite(www.stat.de).

Ziel ist es, Statistiker mit praxisnahen Kenntnissen, aber auch mit einem gu-ten mathematischen Hintergrundwissen auszubilden. Daf ur ist die Lehrveran-staltung ”Stochastik I”, gelesen am Institut f ur Mathematik der Humboldt-Universitat, als Pflichtveranstaltung f ur diesen Studiengang aufgenommen wor-

den. Um den Studierenden den Zugang zu dieser ”Stochastik I” zu erleichtern,bietet das Institut im Sommersemester 2009 eine zusatzliche Vorlesung uberMaßtheorie nebst Ubungen an.

Maßtheorie ist unverzichtbarer Bestandteil moderner Stochastik, d. h. von Wahr-scheinlichkeitstheorie und Statistik, insbesondere, wenn man mit stochasti-schen Prozessen zu tun hat, wie sie in Anwendungen, z. B. in Finanzmarkt-modellen, in Modellen der Populationsdynamik und in vielen anderen Fallen,auftreten. Die Vorlesung ”Stochastik I” stutzt sich wesentlich auf die Maßtheo-rie.

Das vorliegende Skript ist als Unterstutzung der Vorlesung und der Ubung ge-dacht und ersetzt sie nicht. Da diese Lehrveranstaltung zum ersten Mal f ur dengenannten Horerkreis gelesen wird, gibt es sicherlich Verbesserungsvorschlage.Kritische Hinweise sind deshalb sehr willkommen.An dieser Stelle mochte ich meinen Dank an Frau Sabine Bergmann f ur dassorgf altige Schreiben des Manuskriptes und die geduldige Berucksichtigung vie-ler Anderungswunsche aussprechen. Mein Dank gebuhrt weiterhin dem Ubungs-assistenten Herrn Dipl. Math. Friedrich Bolz f ur die sorgf altige Durchsicht desSkriptes. Fur alle noch verbleibenen Mangel und Fehler bin ich selbst verant-wortlich.

Berlin-Adlershof, 14. 04. 2009

Page 8: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 8/156

Page 9: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 9/156

Kapitel 1

Grundbegriffe

1.1 Elemente der Mengenlehre

Begriffe, Relationen und Operationen der Mengenlehre

Unter einer Menge versteht man laut Georg Cantor (deutscher Mathema-tiker, 1845-1918)”. . . eine Zusammenfassung bestimmter, wohlunterschiedenerObjekte unserer Anschauung oder unseres Denkens zu einem Ganzen”. DieObjekte der Menge heißen Elemente der Menge . Dabei spielen irgendwelcheZusammenhange zwischen den Elementen keine Rolle. Insbesondere kommt es

nicht auf die Reihenfolge an und auch nicht darauf, ob ein Element mehrfachgenannt wird.

Wir stellen in diesem Abschnitt grundlegende Begriffe, Relationen und Opera-tionen der Mengenlehre zusammen, mit denen wir im Weiteren haufig arbeitenwerden:

x ∈ A bedeutet: x ist Element von A,

x ∈ A bedeutet: x ist nicht Element von A,

A ⊆ B bedeutet: jedes Element von A ist auch Element von B(A ist Teilmenge von B),

A ⊇ B bedeutet: B ⊆ A,

3

Page 10: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 10/156

4 Uwe K uchler

A = B bedeutet: A ⊆ B und B ⊆ A(Zwei Mengen A und B sind gleich, wenn sie aus den gleichen Elementen be-stehen ),

∅ bedeutet: leere Menge , die leere Menge enthalt kein Element,

A ∩ B := x|x ist Element von A und von B(Durchschnitt von A und B),

A und B heißen disjunkt , falls A

∩B =

∅,

A ∪ B := x|x ist Element von A oder von B(Vereinigung von A und B).

Es gelten folgende Gleichungen:

A ∪ (B ∪ C ) = (A ∪ B) ∪ C

A ∩ (B ∩ C ) = (A ∩ B) ∩ C

Assoziativgesetze

A ∪ (B ∩ C ) = (A ∪ B) ∩ (A ∪ C )

A ∩ (B ∪ C ) = (A ∩ B) ∪ (A ∩ C )

Distributivgesetze

A ∪ B = B ∪ A

A ∩ B = B ∩ A

Kommutativgesetze

Wir fahren mit der Zusammenstellung von Begriffen fort:

Page 11: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 11/156

Grundbegriffe 5

A\B := x|x ist Element von A, aber nicht Element von B,

(Differenz von A zu B),

AB := (A\B)∪(B\A) = x| x ist entweder Element von A oder Element von B(Symmetrische Differenz zwischen A und B),

A B

A ∪ B

A B

A ∩ B

A B

A \ B

A B

AB

Abbildung 1.1: Vereinigung von A und B, Durchschnitt von A und B, Differenzvon A zu B, Symmetrische Differenz von A und B

i∈I Ai :=

x

|x

∈Ai f ur alle i

∈I

,

(Durchschnitt der Mengen Ai, i ∈ I )i∈I

Ai := x|x ∈ Ai f ur mindestens ein i ∈ I ,

(Vereinigung der Mengen Ai, i ∈ I )(Die Menge I ist irgendeine Menge und heißt Indexmenge .)

Sind An, n ≥ 1, Mengen, so definieren wir die Mengen Limes superior undLimes inferior der Folge (An) wie folgt:

lim supn→∞

An :=∞

n=1

k=n

Ak, lim inf n→∞

An :=∞

n=1

k=n

Ak.

Ist E eine Menge, so heißt die Menge P(E ) := A|A ⊆ E aller Teilmengenvon E die Potenzmenge von E .

Page 12: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 12/156

6 Uwe K uchler

Wenn A ⊆ E , so heißt Ac = E \A das Komplement von A bez. E .

Es gelten (Ac)c = A, A ∩ Ac = ∅ und A ∪ Ac = E f ur alle A ⊆ E .

(A ∪ B)c = Ac ∩ Bc, (A ∩ B)c = Ac ∪ Bc und A\B = (A ∩ Bc) = (Ac ∪ B)c.

A

Ac

E

Abbildung 1.2: Komplement Ac der Menge A bez. der Menge E

Mengen Ai, i ∈ I, heißen paarweise disjunkt , falls Ai ∩ A j = ∅ f ur alle i, j ∈ I mit i = j.

Jede Menge S von Teilmengen von E nennen wir ein Mengensystem aus E .Die Elemente der Menge S sind also Teilmengen der Menge E , d.h. S

⊆ P(E ).

Ein Mengensystem Z = (Z i, i ∈ I ) aus E heißt eine Zerlegung von E , falls

•i∈I

Z i = E (jedes Element von E liegt in mindestens einem der Z i) und

• Z i ∩ Z j = ∅ f ur alle i, j ∈ I mit i = j (paarweise Disjunktheit)

gelten.

0 13

23

1[ )[ )[ )

Abbildung 1.3: Zerlegung von [0, 1) in Teilintervalle [0, 13), [13 , 2

3) und [23 , 1)

Page 13: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 13/156

Grundbegriffe 7

Abbildungen

Es seien E und F zwei (nichtleere) Mengen. Eine Abbildung X von der Menge E in die Menge F ist eine Vorschrift, die jedem Element y ∈ E ein und nurein (d.h. genau ein) Element X (y) ∈ F zuordnet. Die Abbildung X heißt in-

jektiv , falls f ur alle Elemente y, z von E aus X (y) = X (z ) folgt, dass y = z gilt.Fur jedes y aus E heißt X (y) das Bild von y vermittels X . Die Menge X (y)|y ∈E aller Bilder ist eine Teilmenge von F , man nennt sie den Wertebereich der Abbildung X und schreibt daf ur auch W b(X ). Es gilt also W b(X ) ⊆ F . Liegtsogar Gleichheit vor, W b(X ) = F , so nennt man X eine surjektive Abbildungoder eine Abbildung von E auf F . Ist X eine surjektive und injektive Abbil-dung , so heißt X bijektiv .

Statt Abbildung sagt man haufig auch Funktion .

Ist X eine Abbildung von E in F , so heißt f ur B ⊆ F die Menge

X −1(B) := u ∈ E | X (u) ∈ Bdas Urbild von B (vermittels X ). Kurzschreibweise:

X −1(B) = X ∈ BEs gelten die Gleichungen:

X −1(B ∩ C ) = X −1(B) ∩ X −1(C )

X −1(B ∪ C ) = X −1(B) ∪ X −1(C )

X −1(F \B) = E \X −1(B)

X −1

i∈I

Bi

=i∈I

X −1(Bi)

X −1

i∈I

Bi

=i∈I

X −1(Bi)

(B , C, Bi ⊆ F, i ∈ I, I irgendeine Indexmenge.)Diese Eigenschaften heißen Operationstreue von X −1: Die Urbildoperation ist

Page 14: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 14/156

8 Uwe K uchler

mit den Mengenoperationen vertauschbar.

Man beachte: Die Abbildung X hat im allgemeinen nicht die Eigenschaft derOperationstreue.

Reelle Zahlen

Mit N0 := 0, 1, 2, . . . , n , . . . werde die Menge der naturlichen Zahlen bezeich-net, wir setzen N := N0\0 = 1, 2, . . . , n , . . ., Z bezeichne die Menge allerganzen Zahlen.Das Symbol R1 (oder einfach R) steht f ur die Menge aller reellen Zahlen, dasSymbol Q1 (oder einfach Q) f ur die Menge aller rationalen Zahlen.

Eine Abbildung X , vermittelt durch ((xn), n ∈ N), von N in eine Menge E heißt eine Folge aus E . Wir schreiben daf ur auch (xn)n≥1 oder einfach (xn).Man unterscheide zwischen einer Folge (xn)n≥1 und der Menge xn|n ∈ N.

(a, b) := x ∈ R1|a < x < b, −∞ ≤ a ≤ b ≤ ∞,

heißt ein offenes Intervall aus R1.

[a, b] := x ∈ R1|a ≤ x ≤ b, −∞ ≤ a ≤ b ≤ ∞,

heißt ein abgeschlossenes Intervall aus R1.

(a, b] := x ∈ R1|a < x ≤ b, −∞ ≤ a ≤ b ≤ ∞,

heißt ein nach links halboffenes Intervall aus R1.Die Definition eines nach rechts halboffenen Intervalls erfolgt analog.

Nach Definition gilt f ur alle a, b aus R(a, ∞] = (a, ∞), [−∞, b) = (−∞, b), [−∞, ∞] = (−∞, ∞), (a, a] = (a, a) =[a, a) = ∅, [a, a] = a.

Eine reelle Zahl x heiße positiv (oder nichtnegativ ), falls x > 0 (bzw.x ≥ 0)

gilt.Eine reelle Zahl x heiße negativ (oder nichtpositiv ), falls x < 0 (bzw.x ≤ 0) gilt.

Eine nichtleere Menge E heißt eine endliche Menge , falls sie nur endlich vieleElemente enthalt. Genauer, falls es eine naturliche Zahl n ∈ N gibt, so daß die

Page 15: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 15/156

Grundbegriffe 9

Elemente von E durch die Zahlen 1, 2, . . . , n durchnumeriert werden konnen.

Die Anzahl n der Elemente von E heißt Kardinalzahl der Menge E , symbo-lisch: n = card E . Die leere Menge wird ebenfalls als eine endliche Mengeangesehen. Wir definieren card ∅ = 0.

Ist card E = n, so gilt card P(E ) = 2n.

Ist eine Menge nicht endlich, so heißt sie unendlich . Die Menge N0 der naturli-chen Zahlen und die Menge R der reellen Zahlen sind unendlich.Gibt es eine bijektive Abbildung von einer Menge E auf die Menge N0 dernaturlichen Zahlen, so heißt E abz ahlbar unendlich . Die Menge N0 der naturli-

chen Zahlen und die Menge Q der rationalen Zahlen sind abzahlbar unendlich.Jede unendliche Menge, die nicht abzahlbar unendlich ist, heißt ¨ uberabz ahlbar unendlich . Die Menge R der reellen Zahlen ist uberabzahlbar unendlich. JedesIntervall (a, b) mit a < b ist ebenfalls uberabzahlbar unendlich.Ist B eine (nichtleere) Menge reeller Zahlen und ist c eine reelle Zahl mit x ≤ cf ur alle x ∈ B, so heißt c eine obere Schranke f ur B, und B nennt man nach oben beschr ankt .

Ist cs eine obere Schranke f ur B und gilt cs ≤ c f ur alle oberen Schranken cvon B, so nennt man cs die kleinste obere Schranke von B und bezeichnet sieals Supremum von B, in Zeichen: sup B.

Gibt es keine obere Schranke f ur B, so setzt man sup B = ∞. Die Menge Bheißt dann nach oben unbeschr ankt .

Ist die Zahl sup B endlich, so kann sie zu B gehoren, muß es aber nicht. Im er-sten Fall nennt man dieses Supremum auch das Maximum von B und schreibtdaf ur max B.

Die Definition von unterer Schranke von B, gr oßter unterer Schranke von B,inf B (Infimum von B) und min B (Minimum von B)erfolgt analog, an Stelle

von ≤ wird ≥ verwendet, an Stelle von ∞ der Wert −∞.

Mit −B := −x|x ∈ B gilt

sup (−B) = −inf B, inf (−B) = −sup B.

Page 16: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 16/156

10 Uwe K uchler

Ist (xn, n ≥ 1) eine Folge aus R, so ist (xn) mit xn := supm≥n xm eine monoton

nichtwachsende Folge reeller Zahlen , d.h., es gilt xn ≥ xn+1, n ∈N

. Der Wertinf n xn = inf n supm≥n xm =: limsupn→∞ xn

heißt Limes superior der Folge (xn, n ≥ 1). Analog nennt man den Wert

supn inf m≥n xm =: liminf n→∞ xn

den Limes inferior der Folge (xn, n ≥ 1).

Es gilt stets

−∞ ≤ lim inf n→∞ xn ≤ lim supn→∞ xn ≤ ∞.

Wenn lim inf n→∞ xn = lim supn→∞ xn erf ullt ist, so heißt die Folge (xn, n ≥ 1)konvergent gegen den Grenzwert x = liminf n→∞ xn = limsupn→∞ xn. DerGrenzwert x wird auch als Limes der Folge (xn, n ≥ 1), symbolisch x =limn→∞ xn, bezeichnet.Eine Folge (xn, n ≥ 1) ist konvergent gegen ein x ∈ R1, wenn sie der Zahl xbeliebig nahe kommt und schließlich auch beliebig nahe bleibt. Genauer: Wennf ur jedes ε > 0 ein n0 = n0(ε) existiert, so daß |xn − x| < ε f ur alle n ≥ n0 gilt.

Die Menge Q1 aller rationalen Zahlen liegt dicht in R1 in dem Sinne, daß manzu jeder reellen Zahl x eine Folge (xn) rationaler Zahlen finden kann, die sich

der Zahl x unbegrenzt nahern, also gegen sie konvergieren: x = limn→∞ xn.Mit anderen Worten, f ur jedes ε > 0 findet man eine rationale Zahl xr mit|x − xr| < ε.

Ist namlich x bereits rational, so setzt man xn ≡ x, n ≥ 1.Ist x irrational, so hat x eine eindeutig bestimmte Dezimalentwicklung

x = [x] +∞k=1

bk10−k

wobei [x] := maxy ∈ Z|y ≤ x die großte ganze Zahl bezeichnet, die klei-

ner oder gleich x ist und die bk ganze Zahlen zwischen 0 und 9 sind. (Wirvereinbaren dabei, dass Zahlen der Form

mk=1

bk10−k +∞

k=m+1

9 · 10−k

Page 17: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 17/156

Grundbegriffe 11

mit bm < 9 geschrieben werden als

m−1k=1

bk10−k + (bm + 1)10−m.)

Wir setzen

xn = [x] +n

k=1

bk10−k.

Somit gilt xn ∈ Q und |x − xn| ≤ 10−n, n ≥ 1, woraus sich limn→∞ xn = xergibt.

Die rationalen Zahlen bilden also ein ”unendlich dichtes Netz“ in der MengeR1 aller reellen Zahlen, das aber nur abzahlbar unendlich ist, also wesentlichweniger Elemente als R1 enthalt.

Produktmengen

Es seien E 1, E 2, . . . , E n Mengen, die Menge

n

k=1

E k := E 1 × E 2 × . . . × E n

besteht aus allen n-Tupeln x = (x1, . . . , xn)T mit xi ∈ E i, i = 1, . . . , n, undheißt Produktmenge der E 1, E 2, . . . , E n.

Die ProduktmengeRd := R1 × . . . × R1

d mal

ist der Raum aller Vektoren der Dimension d; d ≥ 1.

Fur a = (a1, . . . , ad)T und b = (b1, . . . , bd)T mit −∞ ≤ ak ≤ bk ≤ ∞, k =

1, . . . , d , heißt

(a, b] :=d

k=1

(ak, bk] (1.1)

Page 18: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 18/156

12 Uwe K uchler

ein nach links halboffener Quader in Rd.

Im Fall d = 2 spricht man auch von Rechtecken anstelle von Quadern. Furd = 1 handelt es sich um Intervalle. Offene und abgeschlossene Quader (a,b)bzw. [a,b] werden analog zum Fall der Intervalle f ur d = 1 definiert.

Ist (E k, k ≥ 1) eine Folge von Mengen, so ist ihre Produktmenge, bezeichnet

durch∞k=1

E k := E 1×E 2× . . .×E n×. . ., die Menge aller Folgen y := (yk, k ≥ 1)

mit yk ∈ E k, k ≥ 1. Sind alle E k identisch gleich E , so schreiben wir einfach

E N anstelle∞

k=1

E .

Ist I irgendeine Indexmenge, so verstehen wir unter E I

die Menge aller Funk-tionen y = y(i), i ∈ I, von I in die Menge E .

Ubungen

1. Welche Relationen bestehen zwischen den MengenA = Stuhl, Hocker, T isch, B = Stuhl, T isch, Stuhl, Hocker,C = Stuhl, Hocker und D = Hocker?Geben Sie die Mengen B ∩ C und A ∪ D an.

2. Es seien A und B zwei Mengen. Wie kann man paarweise disjunkte

Mengen A1, A2, A3 so wahlen, dass A1 ∪ A2 ∪ A3 = A ∪ B gilt?

3. Es seien A und B Teilmengen einer Menge E . Beweisen Sie die Formeln(Ac)c = A, A ∩ Ac = ∅ und A ∪ Ac = E ,(A ∪ B)c = Ac ∩ Bc, (A ∩ B)c = Ac ∪ Bc undA\B = (A ∩ Bc) = (Ac ∪ B)c.

4. Es seien An, n ≥ 1, Teilmengen einer Menge E . Man zeige, dass folgendeBeziehungen gelten:

a) liminf n→∞ An =

x ∈ E | es gibt ein n0 = n0(x), so dass x ∈ An f ur alle n ≥ n0 =

x ∈ E | x ∈ An f ur alle außer endlich vielen n ≥ 1

Page 19: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 19/156

Grundbegriffe 13

lim supn→∞

An =

x ∈ E | f ur alle n ≥ 1 gibt es ein n1 = n1(x) ≥ n, so dass x ∈ An1 =

x ∈ E | x ∈ An f ur unendlich viele n ≥ 1b)

liminf n→∞

An ⊆ limsupn→∞

An.

5. Eine Folge (An) von Mengen heißt konvergent , falls

liminf n→∞

An = limsupn→∞

An =: limn→∞

An

gilt.

Zeigen Sie: Wenn An ⊆ An+1 f ur alle n ≥ 1, so ist (An) konvergent.Berechnen Sie lim

n→∞An.

Was gilt im Fall An ⊇ An+1 f ur alle n ≥ 1?

6. Beweisen Sie:

a) Die Menge aller nichtnegativen geraden Zahlen ist abzahlbar un-

endlich.b) Sind A1 und A2 zwei hochstens abzahlbar unendliche Mengen, so

ist auch A1 × A2 eine hochstens abzahlbar unendliche Menge.

c) Die Menge Qd aller d-dimensionalen Vektoren mit rationalen Kom-ponenten ist abzahlbar unendlich.

d) Sind Die Menge Ak, k ≥ 1, hchstens abzahlbar unendlich, so istauch ∪∞

k=1Ak hochstens abzahlbar unendlich. (Hinweis: VerwendenSie das Cantorsches Diagonalverfahren, siehe Abb. 1.4.)

7. a. Die Abbildung X werde auf E = [−1, 1] definiert durch X (y) = y2

.Mit F werde die reelle Achse R1 bezeichnet. Ist X eine surjektiveAbbildung? Begrunden Sie Ihre Antwort!Wie wurden Sie E bzw. F abandern, damit X surjektiv wird (damitX bijektiv wird)?

Page 20: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 20/156

14 Uwe K uchler

A4 :

A3 :

A2 :

A1 :

a41

a31

a21

a11

a42

a32

a22

a12

a43

a33

a23

a13

a44

a34

a24

a14

· · ·

· · ·

· · ·

· · ·

......

......

Abbildung 1.4: Cantorsches Diagonalverfahren

b) Man zeige, dass die Abbildungen X und Y , vermittelt durch X (y) =max(y, 0) =: y+, Y (y) = −min(y, 0) =: y−, y ∈ R, surjektive Ab-bildungen von R auf [0, ∞) sind. Dasselbe gilt f ur Z mit Z (y) =|y| = y+ + y−, y ∈ R1. Sind diese Abbildungen auch bijektiv?

8. Es seien E und F zwei nichtleere Mengen und X eine Abbildung vonE in F . Weiterhin seien Bi, i ∈ I Teilmengen von F . Man zeige, dassfolgende Gleichungen richtig sind:

X −1i∈I

Bi

=

i∈I X −1(Bi),

X −1

i∈I

Bi

=i∈I

X −1(Bi).

9. Es sei B eine nichtleere Teilmenge von R1. Beweisen Sie:

a) Die Menge aller oberen Schranken von B ist entweder die leere Men-ge oder ein abgeschlossenes Intervall der Form [c, ∞) f ur eine reellZahl c.

b) Die Menge B sei nach oben beschrankt. Genau dann gilt f ur einereelle Zahl x die Gleichung x = sup B, wenn

(i) x ≥ y f ur alle y ∈ B, und

(ii) Fur jede relle Zahl x < x gibt es mindestens ein y ∈ B mitx < y ≤ x.

Page 21: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 21/156

Grundbegriffe 15

Dabei ist (ii) gleichbedeutend mit

(ii’) Fur jedes ε > 0 gibt es mindestens ein y ∈ B mit x−ε < y ≤ x.

c) Formulieren Sie die Punkte a) und b) f ur nichtleere, nach untenbeschrankte Mengen B und x = inf B. Beweisen Sie diese Aussagen.

10) Fur jede Folge (xn) reeller Zahlen existieren lim inf n→∞ xn und lim supn→∞ xn,und es gilt:

−∞ ≤ liminf n→∞

xn ≤ lim supn→∞

xn ≤ ∞.

11) Es sei (xn) eine Folge reeller Zahlen. Zeigen Sie, dass folgende Aussagen

a) und b) aquivalent sind:a) Eine reelle Zahl c ist gleich lim supn→∞ xn,

b) (i) Fur jedes ε > 0 und jedes nε ∈ N, gibt es mindestens ein n ≥ nε,so dass gilt xn > c − ε.

(ii) Fur jedes ε > 0 gibt es ein m = mε, so dass gilt xn < c + ε f uralle n ≥ mε.

c) Formulieren Sie analoge Aussagen f ur lim inf n→∞ xn.

12) a) Eine Folge (xn) reeller Zahlen konvergiert genau dann gegen eineZahl x, wenn es f ur alle ε > 0 ein n0

∈N gibt, so dass x

−ε < xn <

x + ε f ur alle n ≥ n0 gilt.

b) Eine Folge (xn) reeller Zahlen konvergiert genau dann gegen eineZahl x, wenn limn→∞ |xn − x| = 0 gilt.

1.2 Semialgebren, Algebren, σ-Algebren

In der Wahrscheinlichkeitstheorie und Mathematischen Statistik spielen zuf alli-

ge Versuche eine zentrale Rolle. Sie zeichnen sich dadurch aus, dass ihr Er-gebnis im Rahmen gewisser Moglichkeiten ungewiss ist, d.h., irgendeines vonmoglichen Ergebnissen ω aus einer Menge Ω tritt ein. Beim Werfen einesWurfels zum Beispiel ist Ω = 1, 2, . . . , 6. Teilmengen von Ω werden alszuf allige Ereignisse aufgefasst, z.B. 2, 4, 6 = ”Es tritt eine gerade Zahl als

Page 22: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 22/156

16 Uwe K uchler

Ergebnis ein”. Durch Mengenoperationen wie ∪, ∩ und c werden neue Teil-

mengen von Ω, also Ereignisse, gebildet. Die Menge der Ereignisse, die beieinem zuf alligen Versuch eintreten konnen, ist also abgeschlossen gegenuberVereinigungs-, Durchschnitts- und Komplementbildung. Bei umfangreicherenMengen Ω moglicher Versuchsausgange ist es allerdings nicht mehr sinnvoll,alle Teilmengen von Ω als mogliche Ereignisse zu interpretieren. Die Abge-schlossenheit der Menge dieser Ereignisse gegenuber den erwahnten Operatio-nen bleibt jedoch wunschenswert, man setzt sogar voraus, dass sie bezuglichabzahlbar unendlichen Vereinigungen und Durchschnitten vorliegt. (Man fin-det Ausf uhrungen zum mathematischen Hintergrund dieser Problematik z.B.im Buch von Elstrodt [3], Kapitel 1, 1.)In der Maßtheorie werden wir deshalb Systeme von Teilmengen einer Grund-

menge studieren, die gewisse Abgschlossenheitseigenschaften aufweisen. Dasmacht diese Begriffe mitunter unanschaulich, der Umgang mit ihnen ist abernach etwas Ubung nicht so schwierig, wie es f ur den Anfang scheint. Eine ge-wisse Vorstellung wird von den jeweiligen Beispielen vermittelt werden.

Semialgebren

Es seien E eine nichtleere Menge und S ein Mengensystem aus E , d.h. eineTeilmenge der Potenzmenge von E : S

⊆ P(E ).

Definition 1.1 Man nennt S eine Semialgebra (von Teilmengen von E, bzw.aus E), falls

E ∈ S , ∅ ∈ S , (1.2)

f ur alle A, B ∈ S gilt A ∩ B ∈ S , (1.3)

f ur alle A, B ∈S gibt es ein n ≥ 1 und paarweise disjunkte (1.4)

Ai ∈S , i = 1, . . . , n , so dass B\A =

ni=1

Ai gilt .

Page 23: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 23/156

Grundbegriffe 17

A

B

D1

D2 D3

[h]

Abbildung 1.5: Eigenschaft (1.4) f ur S 2

Die Eigenschaft (1.3) nennt man Durchschnittsstabilit at des Mengensystems S .Wegen A1 ∩ A2 ∩ · · · ∩ An = A1 ∩ (A2 ∩ (· · · ∩ (An−1 ∩ An))) gilt sie f ur alleDurchschnitte endlich vieler Ai aus S .

Semialgebren von Teilmengen einer Menge sind in manchen Fallen Mengensy-steme, bei denen die Struktur ihrer Elemente ubersichtlich ist, wie die folgen-den Beispiele zeigen.

Beispiele 1.2 Die folgenden Mengensysteme bilden Semialgebren

a) S 1 := (a, b] ⊆ R1 : −∞ ≤ a ≤ b ≤ ∞Menge aller nach links halboffenen Intervalle aus R1,

b) S 2 := (a1, b1] × (a2, b2] : −∞ ≤ ak ≤ bk ≤ ∞,Menge aller nach links halboffenen Rechtecke aus R2,

c) S d := d

k=1

(ak, bk] : −∞ ≤ ak ≤ bk ≤ ∞ Menge aller nach links

halboffenen Quader aus Rd.

Verzichtet man in der Definition 1.1 auf die Forderung E ∈ S , behalt aber an-sonsten (1.2) bis (1.4) bei, so nennt man S einen Semiring (oder Halbring) von Teilmengen von E . Beispiele f ur Semiringe sind f ur d ≥ 1:

S

0 := d

k=1 (ak, bk] : −∞ < ak ≤ bk < ∞, k = 1, · · · , d,

also die Menge aller nach links halboffenen Quader aus Rd mit endlichen Seitenak ≤ bk, k = 1, · · · , d.

Page 24: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 24/156

18 Uwe K uchler

Algebren

Definition 1.3 Es sei E eine nichtleere Menge und A0 ein Mengensystem aus E . Man nennt A0 eine Algebra (von Teilmengen von E , bzw. aus E ), wenn

folgende drei Bedingungen erf ullt sind:

E ∈ A0, (1.5)

f ur alle A

∈A0 gilt Ac

∈A0, (1.6)

f ur alle A, B ∈ A0 gilt A ∪ B ∈ A0. (1.7)

Folgerung: Sind die Mengen A1, A2, . . . , An Elemente einer Algebra A0 vonTeilmengen einer Menge E , so gehoren auch ∪n

k=1Ak und ∩nk=1Ak zu A0.

Eine Algebra aus E ist also ein Mengensystem, das gegenuber der Bildungvon Durchschnitten und Vereinigungen endlich vieler Elemente sowie Komple-mentbildung bez. E abgeschlossen ist und das die ganze Menge E als Element

enthalt.

Bemerkungen:

Jede Algebra A0 ist auch eine Semialgebra. Es gilt namlich E ∈ A0, ∅ ∈ A0

wegen (1.5) und (1.6), also ist (1.1) erf ullt. Sind A, B ∈ A0, so ist A ∩ B =(Ac ∪ Bc)c ∈ A0 wegen (1.6) und (1.7), somit gilt (1.3). Sind A, B ∈ A0, sogehort A\B = (A ∩ Bc) = (Ac ∪ B)c wegen (1.6) und (1.7) ebenfalls zu A0.Das bedeutet, (1.4) ist mit n = 1 und A1 = B\A erf ullt.

Man nennt ein Mengensystem R von Teilmengen einer Menge E einen Ring ,falls

∅ ∈ R, und f ur alle A, B ∈ R gelten A ∪ B ∈ R und A\B ∈ R.

Offenbar ist jede Algebra von Teilmengen einer Menge E auch ein Ring.

Page 25: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 25/156

Grundbegriffe 19

Beispiele 1.4 a) E sei eine nichtleere Menge und A ⊆ E . Das Mengensy-

stem A0

:= ∅, A , A

c

, E bildet eine Algebra in E .

b) Das Mengensystem

A0 := A ⊆ R1 : A oder Ac besteht aus endlich vielen Elementen

ist eine Algebra in R1.

Aussage 1.5 Ist S eine Semialgebra von Teilmengen von E , so bildet die Men-ge A0( S ) aller endlichen Vereinigungen von paarweise disjunkten Elementen von S , also

A0( S ) :=

n

k=1

Ak|Ak ∈S , paarweise disjunkt , n ≥ 1

, (1.8)

eine Algebra von Teilmengen von E .

Dabei ist S ⊆ A0( S ) und A0( S ) ist die kleinste Algebra, die S umfaßt (in dem Sinne, dass f ur jede Algebra A, mit S

⊆ A gilt A0( S )⊆ A).

Beweis: siehe Ubungen.Eine analoge Aussage gilt f ur Semiringe und Ringe anstelle Semialgebren bzw.

AB

Abbildung 1.6: Elemente der Algebra A0(S 2)

Algebren.(Siehe Elstrodt [3], Beispiel 1.5.7)

Page 26: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 26/156

20 Uwe K uchler

Beispiele 1.6 Die folgenden Mengensysteme bilden Algebren ( d ≥ 1):

S := nk=1

(ak, bk]| − ∞ ≤ ak ≤ bk ≤ ∞, bk ≤ al, 1 ≤ k ≤ l ≤ d(Menge aller endlichen Vereinigungen paarweise disjunkter d-dimensionaler,nach links abgeschlossener Quader, d ≥ 1 (z.B.entsprechender Intervalle f ur d=1 bzw. Rechtecke f ur d= 2), siehe auch Abbildung 1.7..)

σ-Algebren

Es sei E eine nichtleere Menge und A ein Mengensystem aus E .

Definition 1.7 Man nennt A eine σ-Algebra (von Teilmengen von E , bzw.aus E ), falls A eine Algebra ist und zus atzlich gilt

falls An ∈ A, n ≥ 1, so ist ∞

n=1

An ∈ A. (1.9)

Eine σ-Algebra A aus E ist also eine Algebra aus E , die zusatzlich abgeschlos-sen ist bezuglich der Vereinigungsbildung (und damit auch der Durchschnitts-bildung wegen ∩An = (∪Ac

n)c) von abzahlbar unendlich vielen Elementen ausA.

Beispiele 1.8

a) Es sei E eine nichtleere Menge. Dann ist die Potenzmenge P(E ) eine σ-Algebra.

b) Das Mengensystem A :=A ⊆ R1|A oder Ac ist h ochstens abz ahlbar unendlich ist eine σ-Algebra aus R1.

c) Ist Z n, n ∈ N eine Zerlegung der Menge E , so bildet Z := i∈I Z i|I ⊆N eine σ-Algebra.

Die folgende Aussage bildet die Grundlage f ur den Ubergang von irgendeinemMengensystem zu der kleinsten, dieses Mengensystem enthaltenden σ-Algebra.

Page 27: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 27/156

Grundbegriffe 21

Aussage 1.9 Der Durchschnitt A =

i∈I Ai jeder Familie (Ai, i ∈ I ) von σ-

Algebren Ai von Teilmengen einer Menge E ist ebenfalls eine σ-Algebra in E .

Beweis: Man pruft leicht die Eigenschaften (1.5)-(1.6) und (1.9) f ur A nach.

Aussage 1.10 Ist S irgendein Mengensystem aus E , so gilt

a) σ( S ) := A |A ist σ-Algebra aus E mit S

⊆ A

ist eine σ-Algebra aus E , die S umfaßt,

b) σ( S

) ist die kleinste σ-Algebra, die S

umfaßt,m.a.W.,

ist H eine σ-Algebra aus E mit S ⊆ H , so gilt σ( S ) ⊆ H .

Man nennt das Mengensystem S einen Erzeuger der σ-Algebra σ( S ).

Beweis: Nach Aussage 1.9 ist σ( S ) eine σ-Algebra, und es gilt S ⊆ σ( S ).

Angenommen H ist ein σ-Algebra in E mit S

⊆H , so folgt aus der Definition

von σ( S ), dass σ( S ) ⊆ H gilt.

Folgende Eigenschaften sind leicht an Hand der Definition 1.7. nachzuprufen.

Ist A eine σ-Algebra aus E , so gilt σ(A) = A. (1.10)

Sind S und S

Mengensysteme aus E mit S ⊆

S

, so folgt

σ( S ) ⊆ σ( S

). (1.11)

Page 28: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 28/156

22 Uwe K uchler

Abbildung 1.7: Approximation eines Halbkreises H durch endliche Vereinigun-gen H n von Rechtecken: H = ∪∞

n=1H n

Messbare Raume und Borelmengen

Definition 1.11 Jedes Paar (E, E), wobei E eine nichtleere Menge ist und Eeine σ-Algebra von Teilmengen von E bildet, heißt ein messbarer Raum. Eine Teilmenge A ⊆ E heißt E-messbar, falls A ∈ E gilt.

Definition 1.12

a) Es sei S 1 = (a, b]| − ∞ ≤ a < b ≤ ∞ (siehe Beispiele 1.2a)).

Dann heißt B1

:= σ(S

1) die σ-Algebra der Borelmengen (oder Borelsche σ-Algebra) aus R1.( Emile Borel, franz osischer Mathematiker,1871-1956)

b) S d = d

k=1

(ak, bk]| − ∞ ≤ ak ≤ bk ≤ ∞, k = 1, 2, . . . , d(vgl. Beispiel 1.2b))Bd := σ( S d) heißt σ-Algebra der Borelmengen (oder Borelsche σ-Algebra)aus Rd.

Jede einelementige Menge x, x ∈ Rd, ist eine Borelmenge (es gilt namlich(x = ∩n(x − 1

n , x])), damit auch jede Menge B ⊆ Rd mit endlich oderabzahlbar unendlich vielen Elementen, und somit auch die Menge Qd allerx ∈ Rd, deren Koordinaten samtlich rational sind.

Page 29: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 29/156

Grundbegriffe 23

Definition 1.13 Eine Menge U ⊆ Rd heißt offen, wenn man f ur jedes x ∈ U

einen d-dimensionalen Quader Q ∈S

d finden kann mit x ∈ Q ⊆ U . Eine Menge V ⊆ Rd heißt abgeschlossen, falls ihr Komplement V c = Rd\V offen ist.

Aussage 1.14 a) Im Rd sind alle Quader der Form (a, b) =d

k=1

(ak, bk)

offen und alle Quader der Form [a, b] =d

k=1

[ak, bk] abgeschlossen im Sinne

der Definbition 1.13.

b) Jede offene und jede abgeschlossene Menge im Rd ist eine Borelmengen.

c) Bezeichnet U d das System aller offenen Mengen aus Rd und V d das System aller abgeschlossenen Mengen aus Rd, so gilt

σ(U d) = σ(V d) = Bd (d ≥ 1). (1.12)

Der Beweis der Teile a)und b) der Aussage ist technischer Natur und wird inder Vorlesung skizziert. Er nutzt wesentlich aus, dass Qd nur abzahlbar un-endlich ist und ein unendlich dichtes Netz in Rd bildet. Der Teil c) folgt aus S

⊆ U d und σ( S ) = Rd.

Also: Die σ-AlgebraBd aller Borelmengen des Rd ist die kleinste σ-Algebra ausRd, die alle offenen (bzw. die alle abgeschlossenen) Teilmengen von Rd umfaßt.Mit anderen Worten, das Mengensystem U der offenen Mengen aus Rd unddas Mengensystem V der abgeschlossenen Mengen aus Rd sind beide Erzeu-ger von Bd. Wie wir noch sehen werden, sind die messbaren Raume (Rd,Bd)mit d ≥ 1 sehr gut geeignete Objekte f ur die Masstheorie im Rd und somitauch f ur Wahrscheinlichkeitstheorie und Mathematische Statistik. Einerseitsist das Mengensystem der Borelmengen abgeschlossen bezuglich Vereinigungs-und Durchschnittsbildung abzahlbar unendlich vieler seiner Elemente sowiebezuglich der Komplementbildung, andererseits ist es das kleinste solche Sy-

stem von Teilmengen von Rd

, das auch alle Quader enthalt.Dagegen umfasst die Potenzmenge P(Rd) von Rd, also die Menge aller Teil-mengen von Rd, einfach zu viele Elemente, um eine fruchtbare Masstheorie f urden messbaren Raum (Rd,P(Rd)) zu entwickeln. Zu dieser Problematik sieheauch Elstrodt [3], Kapitel I, 1.

Page 30: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 30/156

24 Uwe K uchler

Die allgemeine Form von Borelmengen ist nicht bekannt. Das heißt, man kann

nicht sagen, wie eine Menge beschaffen sein muss, damit sie Borelsch ist.Man weiss aber, dass die Gesamtheit Bd aller Borelmengen des Raumes Rd

weitaus kleiner ist, als die Menge P(Rd) aller Teilmengen von Rd (siehe z.B.Elstrodt,[3], Korollar 8.6).

Page 31: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 31/156

Grundbegriffe 25

σ-Algebren und Abbildungen

Es sei X eine Abbildung von einer nichtleeren Menge E in einen messbarenRaum (F, F ).

Aussage 1.15 Das Mengensystem

EX := X −1(F ) := X −1(B)|B ∈ F

ist eine σ-Algebra aus E .

Die σ-Algebra EX := X −1(F ) heißt auch σ-Algebra der Urbilder von F vermit-tels X , oder auch die von der Abbildung X erzeugte σ-Algebra in E.

Beweis: Es gilt E ∈ EX wegen X −1(F ) = E , die anderen Eigenschaften(1.6),(1.7) und (1.9) einer σ-Algebra folgen aus der Operationstreue von X −1.

Beispiele 1.16 a) Ist E eine nichtleere Menge, und ist A eine Teilmenge von E , so bezeichnet man mit 1 A die sogenannte Indiaktorfunktion von A. Sie ist definiert durch 1 A(y) = 1 f ur alle y ∈ A und 1 A(y) = 0 f ur

alle y ∈ E \A. F ur (F, F ) w ahlen wir (R1

,B1

). Die σ-Algebra EX

f ur X = 1 A besteht aus den Elementen ∅, A, Ac, E .

b) Ist E eine nichtleere Menge, und ist X eine Abbildung von E auf eine endliche Menge x1, x2, . . . , xn paarweise verschiedener xk, k = 1, 2, . . . n ,so bildet y ∈ E |X (y) = xk, k = 1, 2, . . . , n eine Zerlegung von E und EX besteht aus allen m oglichen Vereinigungen von Elementen der Zerle-gung (siehe Beispiele 1.8 c)).

Die folgende Aussage wird im Weiteren oft benutzt werden.

Aussage 1.17 Ist S ein Mengensystem in F , so gilt

σ(X −1( S )) = X −1(σ ( S )) (1.13)

Page 32: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 32/156

26 Uwe K uchler

Beweis: Auf Grund der Aussagen 1.10 und 1.15 gilt σ(X −1 ( S )) ⊆ X −1(σ( S )),

da X

−1

(S

) ⊆ X

−1

(σ (S

)) und σ(X

−1

(S

)) die kleinste σ-Algebra ist, die X

−1

( S ) umfaßt.

Um die umgekehrte Inklusion zu beweisen, setzen wir B := C ⊆ F |X −1(C ) ∈σ(X −1 ( S )). Das Mengensystem B ist eine σ-Algebra in F (man nutze dieOperationstreue von X −1) und nach Definition von B gilt S ⊆ B. Also istσ ( S ) ⊆ B und somit gilt auf Grund der Definition von B die BeziehungX −1(σ ( S )) ⊆ X −1(B) ⊆ σ(X −1 ( S )).

Beispiele 1.18 Setzen wir E = R1 und (F, F ) = (R1,B1) so gilt f ur X (y) =

exp[y], y ∈ E die Beziehung EX

= B

1

.Davon uberzeugt man sich leicht mittels (1.13) undS = (a, b]| − ∞ ≤ a ≤ b ≤ ∞.

Ubungen

1) Zeigen Sie, dass die Mengensysteme aus den Beispielen 1.8. σ-Algebrensind.

2) Uberzeugen sie sich davon, dass die Beziehungen (1.10) und (1.11) richtigsind.

3) Man beweise: Fur das Mengensystem S

:= (a, b) : −∞ ≤ a < b ≤ ∞gilt σ ( S

) = B1, d.h., neben S aus Definition 1.12 ist auch S

ein Erzeugervon B1.

4) Es seien E und F nichtleere Mengen und S eine Semialgebra aus F . MitX werde eine Abbildung von E in F bezeichnet. Zeigen Sie, dass X −1( S )eine Semialgebra aus E ist.

5) f ur jede naturliche Zahl n aus N ist n := k2n

|k+12n , k = 0, 1, . . . 2n−1eine Zerlegung des Intervalls [0, 1).

a) Man gebe die von n erzeugte σ-Algebra An := σ(n) von Teil-mengen von [0, 1) an.

Page 33: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 33/156

Grundbegriffe 27

b) Zeigen Sie, dass

An ⊆ An+1, n ≥ 1

gilt, und dass

c)

γ :=∞k=1

Ak

eine Algebra, aber keine σ-Algebra ist.

d) Bestimmen Sie σ(γ ).

6) Es sei f die durchf (x) = |x|, x ∈ R1,

gegebene Abbildung von R1 in R1. Bestimmen Sie Bf := f −1(B).

7) Uberzeugen Sie sich davon, dass die Menge (x, y) ∈ R2|x2 + y2 < 1eine offene Menge in R2 ist.

8) Beweisen Sie die Aussage 1.5.

Hinweis:Zeigen Sie zunachst die Richtigkeit folgender Aussage.Es seien A, B1, B2, . . . , Bn Elemente einer Semialgebra S . Dann gibt espaarweise disjunkte Mengen C 1, C 2, . . . , C m ∈

S , so dass gilt:

A\(n

i=1

Bi) =m

j=1C j.

Prufen Sie nunmehr f ur A die Eigenschaften (1.5)-(1.7) einer Algebranach.

9) Es seien (E, E) ein messbarer Raum und C irgendeine Teilmenge von E .Durch EC := C ∩ B|B ∈ E ist ein Mengensystem in C definiert, dasman die Spur von E auf C nennt. Man zeige:

a) das Mengensystem EA ist eine σ−Algebra von Teilmengen von A,

b) ist S ein Erzeuger von E, so ist S A := S ∩ A = B ∩ A|B ∈

S ein

Erzeuger von EA, d.h., es gilt

Page 34: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 34/156

28 Uwe K uchler

(σ( S ))A = σ( S A)

(Hinweis zu a) und b): Man definiere eine Abbildung H von A in E durch H (x) := x, x ∈ A, und verwende die Aussagen 1.15 und 1.17.

c) wenn A ∈ E, so ist eine Teilmenge C von A genau dann EA-messbar,wenn sie E-messbar ist.

d) Man gebe einen Erzeuger der σ−Algebra B1[0,1) an.

1.3 Mengenfunktionen und Maße

Definitionen In diesem Abschnitt definieren wir sogenannte Maße auf σ-

Algebren, das sind Abbildungen von einer σ-Algebra in die Menge der nicht-negativen reellen Zahlen einschließlich eventuell des Elementes ∞. Anschau-lich konnte man sich darunter Volumina von Korpern im Raum vorstellen,oder Flacheninhalte von ebenen Figuren, oder auch Langen eindimensionalerStrecken. Mathematisch abstrakt werden sie in Definition 1.19 erfaßt, und indieser Abstraktheit eignet sich der Begriff des Maßes auch sehr gut zur Erfas-sung von Wahrscheinlichkeiten. Zu Beginn des Abschnitts 1.2. wurde namlich

angedeutet, dass zuf allige Ereignisse mit Teilmengen einer Grundmenge vonmoglichen Ausgangen eines zuf alligen Versuches angesehen werden konnen. Inder Tat bilden diese zuf alligen Ereignisse eine σ-Algebra, und die Wahrschein-lichkeiten dieser Ereignisse haben gerade die Eigenschaften eines Maßes.

Es seien E eine nichtleere Menge und E ein Mengensystem aus E .

Definition 1.19 a) Eine Funktion µ auf E, die jedem A ∈ E ein µ(A) ∈[0, ∞) ∪∞ zuordnet, heißt additiv auf E, falls

µ(∅) = 0, (1.14)

und falls f ur jedes n ∈ N und f ur jede Folge (Ak, k = 1, 2, . . . , n) paar-

weise disjunkter Mengen Ak aus E mit n

k=1

Ak ∈ E, gilt:

Page 35: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 35/156

Grundbegriffe 29

µ n

k=1

Ak

=

nk=1

µ(Ak). (1.15)

b) Die Funktion µ heißt σ-additiv auf E, falls sie additiv auf E ist, und falls

µ

∞n=1

An

=

∞n=1

µ(An) (1.16)

f ur jede (h ochstens abz ahlbar unendliche) Folge (An, n

≥1) paarweise

disjunkter Mengen An aus E mit ∞n=1

An ∈ E richtig ist.

c) Ist E eine σ-Algebra von Teilmengen von E und µ eine σ-additive Men-genfunktion auf E, so nennt man µ ein Maß auf E und das Tripel (E, E, µ)einen Maßraum.

d) Gilt f ur ein Maß µ auf einer σ-Algebra E die Beziehung µ(E ) < ∞, soheißt µ endliches (oder finites) Maß.Gilt µ(E ) = 1, so nennt man µ normiert. Normierte Maße heißen auch Wahrscheinlichkeitsmaße (oder Wahrscheinlichkeitsverteilungen), und µ(A)nennt man in diesem Fall die Wahrscheinlichkeit von A.Ein normierter Maßraum (E, E, µ) ist ein Maßraum, dessen Maß µ nor-miert ist. Er wird auch Wahrscheinlichkeitsraum genannt.

Gibt es eine Folge (E n) aus E mit n

E n = E , wobei f ur alle n gelte

µ(E n) < ∞, so heißt µ σ-endlich oder σ-finit.

Alle im Weiteren betrachteten Maße seien σ-finit.

Unmittelbare Folgerungen

Es sei µ ein σ-finites Maß auf (E, E).

Page 36: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 36/156

30 Uwe K uchler

1) Fur alle A, B ∈ E mit A ⊆ B und µ(A) < ∞ gilt µ(B\A) = µ(B)−µ(A),

insbesondere ist µ(A) ≤ µ(B). (Monotonie des Maßes)2) Fur alle A, B ∈ E mit µ(A ∪ B) < ∞ gilt µ(A ∪ B) = µ(A) + µ(B) −

µ(A ∩ B),

3a) Fur jede Folge (An) aus E mit An ⊆ An+1, und µ(An) < ∞, n ≥ 1, gilt

limn→∞

µ(An) = µ ∞

n=1

An

. ( Stetigkeit des Maßes µ von unten )

3b) Fur jede Folge (An) aus A mit An ⊇ An+1, n ≥ 1, und µ(A1) < ∞ gilt

limn→∞

µ(An) = µ

n=1

An). (Stetigkeit des Maßes µ von oben )

4) Fur jede Folge (An) aus E gilt µ ∞

n=1

An

≤∞

n=1

µ(An).

(Subadditivit at des Maßes µ)

Beweis:

1) B = A ∪ (B\A), beide Mengen der rechten Seite sind disjunkt, also giltµ(B) = µ(A) + µ(B\A) ≥ µ(A).

2) A ∪ B = (A\B) ∪ (B\A) ∪ (A ∩ B), die Mengen A\B, B\A und A ∩ Bsind paarweise disjunkt, daraus folgt wegen der Additivitat von µ und

mit 1) die Behauptung.3a) Es sei An ⊆ An+1, n ≥ 1.

Mit Bn := An\An−1, n ≥ 1, A0 := ∅ giltn

Bn =n

An und die Bn sind

paarweise disjunkt. Also gilt wegen Definition 1.19 b) der σ-Additivitatund Folgerung 1) die Gleichung

µ∞

n=1

An = µ∞

n=1

Bn =∞

n=1

µ(Bn) =∞

n=1

[µ(An) − µ(An−1)]

= limm→∞

mn=1

[µ(An) − µ(An−1)] = limm→∞

(µ(Am) − µ(A0)) = limm→∞

µ(Am).

Page 37: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 37/156

Grundbegriffe 31

3b) Nun sei An ⊇ An+1, n ≥ 1. Wir definieren die paarweise disjunkten

C n = An\An+1, n ≥ 1, und erhalten An =

∞k=n

C k ∪ ∞k=1

Ak.

Aus Definition 1.19 b) folgt

µ(An) =∞

k=n

µ(C k) + µ

∞n=1

An

,

da C k ∩∞

n=1

An = ∅ f ur alle k ≥ 1.

Somit ist limn→∞

µ(An) = µ ∞

n=1

An

.

4) Ist n ≥ 2, so gilt

ni=1

Ai = A1 ∪ (A2\A1) ∪ (A3\(A1 ∪ A2)) ∪ . . . (An\(A1 ∪ . . . ∪ An−1),

und da alle Mengen A j\(A1 ∪ . . . ∪ A j−1) f ur j = 1, . . . , n paarweisedisjunkt sind, haben wir f ur alle n

≥2 wegen der Additivitat und der

Monotonie von µ

µ

ni=1

Ai

=

ni=1

µ(Ai\(Ai ∪ . . . ∪ Ai−1)) ≤n

i=1

µ(Ai) ≤∞i=1

µ(Ai)

Mittels der Stetigkeit des Maßes µ von unten ergibt sich µ(∞i=1

Ai) =

limn→∞µ(

ni=1 Ai) und somit 4).

Aussage 1.20 Ist µ eine additive Mengenfunktion auf einer σ-Algebra E von Teilmengen von E , so folgt aus jeder der Eigenschaften 3a) und 3b) die σ-Additivit at von µ.

Page 38: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 38/156

32 Uwe K uchler

Beweis: Es gelte 3a). Ist (An, n ≥ 1) eine Folge paarweise disjunkter meßbarer

Mengen, so ist die Folge (Bm, m ≥ 1) mit Bm := m

n=1 An monoton nichtfallendmit∞

n=1 An =∞

m=1 Bm, und folglich gilt wegen der Additivitat von µ und3a)

µ(∞

n=1

An) = limm→∞

µ(Bm) = limm→∞

mn=1

µ(An) =∞

n=1

µ(An).

Es gelte 3b). Ist (An, n ≥ 1) eine Folge paarweise disjunkter meßbarer Mengen,so ist die Folge (C m, m ≥ 1) mit C m =

∞n=m An monoton nichtwachsend mit∞

m=1 C m = ∅, und folglich gilt wegen der Additivitat von µ und 3b)

µ(∞

n=1

An) = µ(m

n=1

An) + µ(C m+1) =m

n=1

µ(An) + µ(C m+1)m→∞

−→

n=1

µ(An).

Es seien (E, E, µ) ein Maßraum und C eine E-messbare Teilmenge von E . DieMengenfunktion µC (.), definiert durch

µC (B) := µ(B), B ∈ EC ,

ist die Einschr ankung von µ auf den messbaren Raum (C,EC ).

Definition 1.21 Eine messbare Menge A aus einem Maßraum (E, E, µ) heißt eine µ-Nullmenge, falls µ(A) = 0 gilt.Gilt eine Eigenschaft (z.B. X (y) ≥ 0) nicht f ur alle y ∈ E , sondern nur f ur alle y aus dem Komplement Nc einer µ-Nullmenge N, so sagt man, die Eigen-schaft gelte µ− fast ¨ uberall, kurz: µ− f.¨ u.

Ist (An, n ≥ 1) eine Folge von µ-Nullmengen, so ist wegen der Subadditivitatvon Maßen (Eigenschaft 4) auch

n≥1 An eine µ-Nullmenge.

In der Wahrscheinlichkeitstheorie werden Ereignisse mit der Wahrscheinlich-keit Null haufig ignoriert, mit ihrem Eintreten braucht nicht gerechnet zu wer-den.

Bisher haben wir den Begriff des Maßes auf einer σ-Algebra A definiert undeinige unmittelbare Folgerungen hergeleitet. Wie gelangt man aber zu kon-kreten Beispielen von Maßen? Die Angabe der Werte µ(A) f ur alle A ∈ A

erscheint zunachst hoffnungslos, da man i.a. nicht einmal alle Elemente von A

Page 39: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 39/156

Grundbegriffe 33

kennt, z.B. f ur A = Bd, d ≥ 1. Wir widmen uns als nachstes dieser Frage und

beginnen mit dem relativ einfachen Fall sogenannter diskreter Maße.Beispiele 1.22

a) Es seien M eine Teilmenge der nat urlichen Zahlen, E irgend eine Menge und Y := yn, n ∈ M eine endliche oder abz ahlbar unendliche Teilmen-ge von E . Weiterhin sei (q n, n ∈ M ) eine Folge positiver reeller Zahlen.Durch

µ(B) :=

n:yn∈Bq n, B ⊆ E, (1.17)

ist auf der σ-Algebra P(E ) ein Maß µ definiert.

Die Menge Y heißt Tr ager von µ und die q n nennt man die Einzelmaße von µ.Wegen (1.17) gilt µ(yn) = q n, n ∈ M und µ(E \Y ) = 0.

b) Gilt in a) die Beziehung q n = 1 f ur alle n ∈ M , so ist

µ(B) = Anzahl der Elemente y aus Y, die auch zu B geh oren.

Das Maß µ heißt in diesem Fall das Z ahlmaß auf Y .

y1

q 1

y2

q 2

y2

q 3

E y1

q 1

y2

q 2

y2

q 3

E B

Abbildung 1.8: Diskretes Maß µ mit Trager y1, y2, y3 und Einzelmaßenq 1, q 2, q 3. Das Maß von B ist gemaß (1.17) µ(B) = q 1 + q 2.

Man nennt Maße µ, die die Form (1.17) haben, diskrete Maße . Diskrete Ma-ße sind einfach zu handhaben, wegen (1.17) sind sie f ur jede Menge B ⊆ Y

Page 40: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 40/156

34 Uwe K uchler

explizit definiert und konnen unmittelbar berechnet werden. Da sie durch die

Folge (yn, q n)n∈M eindeutig bestimmt sind, heißt mitunter die Folge (yn, q n)n∈M bereits ein diskretes Maß. Gilt uberdies

n∈M q n = 1, so spricht man von dis-kreten Wahrscheinlichkeitsmaßen oder -verteilungen (die Gesamtwahrschein-lichkeit Eins ist auf die yn, n ∈ M, verteilt ).Ist M eine endliche Menge, z.B. M = 1, 2, . . . , n, und gilt q k ≡ 1

n, so heißt

die dadurch gegebene Wahrscheinlichkeitsverteilung die gleichm aßige Vertei-lung auf 1, 2, . . . , n. Sie stellt das mathematische Modell der rein zuf alligen Auswahl eines Elementes aus 1, 2, . . . , n dar:Jedes Element von M wird mitder gleichen Wahrscheinlichkeit gewahlt.

Maße auf dem messbaren Raum (R1,B1)

Definition 1.23 F ur jedes endliche Maß µ auf (R1,B1) ist durch

F (x) := µ((−∞, x]), x ∈ R1, (1.18)

eine Funktion F auf R1 definiert, die als Verteilungsfunktion des Maßes µ be-zeichnet wird.

Die folgende Aussage fasst einige Eigenschaften von Verteilungsfunktionen F zusammen.

Aussage 1.24 Es sei F die Verteilungsfunktion eines endlichen Maßes µ auf (R1,B1). Dann gilt:

a) F ist monoton nichtfallend: x ≤ y =⇒ F (x) ≤ F (y) f ur alle x, y ∈ R1,

b) limx↓−∞

F (x) = 0, limx↑∞

F (x) =: F (∞) < ∞,

c) F ist von rechts stetig: F (x + 0) := limy↓x

F (y) = F (x),

d) F (x) − F (x − 0) := F (x) − limy↑x

F (y) = µ(x), x ∈ R1.

Beweis: Zum Beweis werden die unmittelbaren Folgerungen 1) und 3) einge-setzt. Dazu beachte man:

Page 41: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 41/156

Grundbegriffe 35

y1 y2 y3 ... yn

1

q 1

q 2

q 3

q n

Abbildung 1.9: Verteilungsfunktion eines diskreten Maßes µ auf R1 mit demTrager y1, y2, . . . , yn und den Einzelmaßen q 1, q 2, . . . , q n

a) (−∞, x] ⊆ (−∞, y] f ur x ≤ y,

b) xn ↓ −∞ =⇒ n

(−∞, xn] = ∅,

xn ↑ +∞ =⇒ n

(−∞, xn] = R1,

c) yn ↓ x =⇒ n

(−∞, yn] = (−∞, x].

d) µ(x) = µ(n

(x − 1n

, x]) = limn→∞

[F (x) − F (x − 1n

)] = F (x) − F (x − 0).

Die Punkte x ∈ R1 mit µ(x) > 0 sind also genau die Punkte aus R1, in

denen F nicht stetig ist: F (x + 0) = F (x − 0).

Ist F irgendeine Funktion auf R1 mit den Eigenschaften a) - c) aus Aussage1.22, so nennt man sie ebenfalls eine Verteilungsfunktion auf R1.

Wir gehen jetzt der Frage nach, ob es zu jeder Verteilungsfunktion F auf R1

ein Maß µ auf (R1,B1) gibt, so daß (1.18) gilt.Es sei F eine Verteilungsfunktion auf R1. Durch

µF ((a, b]) := F (b) − F (a), −∞ ≤ a ≤ b ≤ ∞ (1.19)

mit F (−∞) := 0, F (∞) := limx→∞

F (x),

wird eine additive Mengenfunktion µF auf der Semialgebra S 1 aller nach linkshalboffenen Intervalle aus R1 definiert.

Page 42: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 42/156

36 Uwe K uchler

Erweiterung von µF zu einer additiven Mengenfunktion auf der

Algebra A

0

= A

0

(S

1 ).

Es sei A ∈ A0 = A0(S 1 ) (vgl.Aussage 1.5) die kleinste Algebra aus R1, die

S 1 umfasst. Dann gilt nach Definition A =n

k=1

(ak, bk] f ur gewisse Intervalle

(ak, bk], die paarweise disjunkt gewahlt werden konnen. Nun definiert man

µF (A) :=n

k=1

F (bk) − F (ak) (1.20)

und uberzeugt sich leicht von der Addivitat dieser Mengenfunktion µ auf A0.

Die mathematischen Beweise der folgenden Aussage und des Satzes 1.24 sindinteressant und lehrreich. Allerdings sind sie umfangreich und gehen uber denRahmen dieses Skriptes hinaus. Der Leser wird deshalb auf die Literatur ver-wiesen.

Aussage 1.25 Die durch (1.20) definierte Mengenfunktion µF ist σ-additiv

auf A0

(S 1).

Beweis: Wegen Aussage 1.20 genugt es, die Stetigkeit von µF nach unten zuzeigen, siehe z.B. Siraev [6], II, §3, S. 165.

Ganz allgemein gilt der folgende

Satz 1.26 (Fortsetzungssatz f ur σ-additive Mengenfunktionen)Es sei µ eine σ-additive σ-finite Mengenfunktion auf einer Algebra A0 von Teilmengen einer nichtleeren Menge E . Dann gibt es ein eindeutig bestimmtes Maß µ auf σ(A0) f ur das gilt

µ(A) = µ(A) f ur alle A aus A0( S ).

Page 43: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 43/156

Grundbegriffe 37

Man nennt µ die Fortsetzung des Maßes µ von A0 auf σ(A0) und bezeichnet

sie der Einfacheit halber ebenfalls mit µ.Der Beweis erfordert erheblichen technischen Aufwand und ubersteigt denRahmen dieses Skriptes. Siehe z.B. Siraev [6], II, §3, S. 165.

Folgerung 1.27 Die durch µF in (1.20) gegebene σ-additive Mengenfunkti-on µF auf A0 besitzt eine eindeutig bestimmte Fortsetzung auf die σ-Algebra B1 = σ(A0( S 1 )) = σ( S 1 ) der Borelmengen aus R1. Wir werden sie ebenfalls mit µF bezeichnen.

Damit ist insgesamt eine eineindeutige Entsprechung zwischen den endlichenMaßen auf B1 und den Verteilungsfunktionen F auf R1 hergestellt:

Jedem endlichen Maß µ ist durch (1.18) eine Verteilungsfunktion F zugeordnet,und zu jeder Verteilungsfunktion F existiert ein Maß µ, dessen Verteilungs-funktion eben dieses F gemaß (1.18) ist. Wenn man also ein Maß µ auf R1

charakterisieren will, so muss man nicht µ(B) f ur jede Borelmenge B aus B1

aufschreiben, sondern es genugt, die Verteilungsfunktion F des Maßes µ anzu-geben. Das ist wesentlich einfacher, und sie bestimmt das Maß µ eindeutig.Die Untersuchung von Maßen µ auf B1 ist somit zuruckgef uhrt auf die Unter-suchung von Verteilungsfunktionen F auf R1.

Beispiele 1.28

a) Es sei (yn

, q n

), n≥

1, ein diskretes endliches Maß auf (R1,P(R1)), siehe Beispiele 1.22 und die Bemerkungen danach. Seine Verteilungsfunktion F ist gegeben durch

F (x) := µ((−∞, x]) =

k:yk≤x

q k, x ∈ R1.

Die Funktion F ist eine monoton nichtfallende, st uckweise konstante, von rechts stetige Funktion mit Spr ungen der H ohe q k = F (yk) − F (yk − 0)in den Punkten yk, k ≥ 1.

b) Es sei F eine Verteilungsfunktion auf R1 und f eine nichtnegative, st uck-weise stetige Funktion auf R1. Es gelte

F (x) =

x −∞

f (s)ds, x ∈ R1.

Page 44: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 44/156

38 Uwe K uchler

0 1 2 3 4

0, 5

0 1 2 3 4

1

Abbildung 1.10: Einzelmaße und Verteilungsfunktion der BinomialverteilungB(n, p) mit n = 4, p = 0, 4

x

λ

f (x)

x

1F (x)

Abbildung 1.11: Dichte f (x) = λe−λx1[0,∞)(x) und Verteilungsfunktion F (x) =(1 − e−λx)

Dann heißt F eine absolutstetige Verteilungsfunktion und f nennt man

eine Dichte von F .( Auf absolutstetige Funktionen gehen wir in Kapitel 6 noch naher ein.)Es gilt in diesem Fall

f (y) =dF

dy(y) = F (y) f ur alle y ∈ R1, in denen f stetig ist ,

und ∞

−∞

f (s)ds = F (∞) < ∞.

(Die Integrale in diesem Beispiel sind Integrale im Sinne von Riemann,wir werden den Begriff der Dichte in Abschnitt 3.5 allgemeiner formu-lieren.)

Page 45: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 45/156

Grundbegriffe 39

c) Ordnet man jedem Intervall (a, b] ∈S 1 (siehe Beispiel 1.2) seine L¨ ange

b − a zu, setzt man also

λ((a, b]) =

b − a f ur − ∞ < a ≤ b < ∞,∞ f ur a = −∞ oder b = ∞,

(1.21)

so erh alt man eine additive Mengenfunktion auf S 1, die σ-finit ist. Sie l aßt sich f ur alle A = ∪n

k=1(bk − ak] mit paarweise disjunkten (bk − ak]durch

λ(A) :=n

k=1

(bk − ak)

analog wie in (1.20) auf A0( S 1) erweitern. Folgerung 1.27 ist auch f ur

diese Erweiterung g ultig, und mittels Satz 1.26 erhalten wir ein σ-finites Maß λ auf (R1,B1) mit der Eigenschaft (1.21). Dieses Maß tr agt den Namen Lebesguemaß auf (R1,B1).

(Henri Lebesgue, franzosischer Mathematiker, 1875-1941)Es gilt f ur jedes Intervall [a, b] mit −∞ < a ≤ b < ∞ die Gleichung

λ([a, b]) = b − a,

Insbesondere gilt f ur jede reelle Zahl x die Gleichung λ(x) = 0.Ist C eine abzahlbar unendliche Teilmenge von R1, so gilt folglich λ(C ) = 0.Abzahlbar unendliche Teilmengen von R1 sind also Nullmengen bezuglich des

Lebesguemaßes, m.a.W. Lebesgue-Nullmengen . Somit hat die Menge Q allerrationalen Zahlen aus R1 das Lebesguemaß Null.

Auf analoge Weise zeigt man, daß es f ur jedes d ≥ 1 ein σ-finites Maß λd auf Bd gibt, mit

λd((a, b]) =d

k=1

(bk − ak)

f ur jeden nach links offenen Quader (a, b] =d

k=1(ak, bk] aus Rd. Das Maß λd

heißt das Lebesguemaß auf (Rd,Bd).Fur jede Borelmenge B

∈Bd und jedes x

∈Rd haben wir

λ(B + x) = λ(B)

(Translationsinvarianz des Lebesguemaßes).

Page 46: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 46/156

40 Uwe K uchler

Man kann beweisen, dass es auf der Potenzmenge P(Rd)von Rd kein σ-finites

Maß gibt, das translationsinvariant ist (siehe z.B. Elstrodt [3], Kap.II,3). Diesist der eigentliche Grund, sich i.a. auf kleinere σ-Algebren als die Potenzmen-ge, namlich die σ-Algebra Bd der Borelmengen, einzuschranken.

Ist C eine Borelmenge aus Rd mit λd(C ) > 0, so bildet die Einschrankung λC d

von λd auf (C,BdC ) ein Maß, das Lebesguemaß auf (C,Bd

C ).

Das Lebesguemaß λ[0,1)d

d ist ein Wahrscheinlichkeitsmaß auf ([0, 1)d,Bd[0,1)d)

und wird in der Wahrscheinlichkeitstheorie als mathematisches Modell f ur dierein zuf allige Auswahl eines Punktes (d-dimensionalen Vektors) aus dem Qua-der [0, 1)d angesehen. Es ist in dieser Hinsicht ein Analogon zum Zahlmaß auf

einer endlichen Menge 1, 2, . . . , N .

Die Cantorsche Funktion

Wir geben hier ein Beispiel f ur eine stetige Verteilungsfunktion an, die keineDichte besitzt. Ihre Konstruktion geht auf Georg Cantor zuruck.

Es sei

F 1(x) = 0, x ≤ 0, F 1(x) =1

2, x ∈ (

1

3,

2

3), F 1(x) = 1, x ≥ 1.

Auf den Intervallen (0, 13) und (2

3 , 1) wird F 1 linear fortgesetzt, so dass einestetige Funktion entsteht.Wir definieren die Funtion F 2 durch

F 2(x) =

0 : x ≤ 014

: x ∈ (19

, 29

)12

: x ∈ (13 , 2

3)

34 : x ∈ (79 , 8

9)

1 : x≥

1

Auf den ubrigen Intervallen wird F 2 wieder linear zu einer insgesamt stetigenFunktion fortgesetzt.Dieser Prozeß der Definition neuer Funktionen F n+1 aus F n wird fortgef uhrt.Auf den Intervallen, auf denen F n konstant ist, wird F n+1 gleich F n gesetzt.

Page 47: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 47/156

Grundbegriffe 41

1

0

1

F 11

0( )

( )

1

F 21

0()( )()

()( )()

1

F 3

Abbildung 1.12: Cantor’sche Funktion auf [0, 1)

Die restlichen Intervalle werden jeweils in drei gleich lange Teile geteilt, auf dem mittleren Teil wird F n+1 gleich dem arithmetischen Mittel von F n auf denbenachbarten Konstanzintervallen von F n gesetzt, und auf dem ersten unddritten Teil des Intervalls wird F n+1 wieder linear zu einer stetigen Funktionfortgesetzt. Fuhrt man diesen Prozess unbegrenzt weiter, so erhalt man eineFolge (F n, n ≥ 1) von Verteilungsfunktionen, die f ur n → ∞ gegen eine stetigeVerteilungsfunktion F , die sogenannte Cantorsche Funktion , konvergieren.Diese Verteilungsfunktion hat keine Dichte. Diese Aussage werden wir in Punkt3.5 herleiten.

Ubungen

1. Es sei µ ein diskretes Maß auf (R1,B1) mit dem Trager N und µ(n) >0, n ≥ 1. Man gebe diejenigen Teilmengen von R1 an, die µ-Nullmengensind.

2. Es sei F eine Verteilungsfunktion auf R1, definiert durch

F (x) =1

41 [0,∞)(x) +

1

21 [1,∞)(x) +

1

41 [2,∞)(x), x ∈ R1.

Durchµ((a, b]) := F (b) − F (a)

sei das dazugehorige Ma µ auf B1 definiert. Berechnen Sie die entspre-chenden Maße folgender Mengen:

Page 48: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 48/156

42 Uwe K uchler

a) A = [1, ∞)

b) B = (−1

2 ,

3

2)c) C = [0, 2)d) D = (2

3, 52

)e) E = (3, ∞)

3. Es sei (E,E, µ) ein finiter Maraum und (An, n ≥ 1) eine Folge von Teil-mengen von E mit An ∈ E, n ≥ 1.Man beweise das folgende Lemma von Borel-Cantelli :

Wenn∞

n=1

µ(An) < ∞, so gilt µ(lim supn→∞

An) = 0 (1.22)

. Hinweis: Nutzen Sie die Eigenschaften 3) und 4) der UnmittelbarenFolgerungen aus.

4. Es seien (E, E, µ) ein finiter Maßraum und (Ak, k = 1, 2, . . . , n) eine Folgevon Mengen aus E. Man zeige, dass gilt:

µ(n

k=1

Ak) =n

k=1

(−1)k−1

I ⊆1,2,...,n,cardI =k

µ(i∈I

Ai).

(Ein- und Ausschlußformel )Die Summation

I ⊆1,2,...,n,cardI =k erfolgt uber alle moglichen Teilmen-

gen von 1, 2, . . . , n mit genau k Elementen.

5. Beweisen Sie: Wenn (Ai, i ∈ I ) eine Menge offener Mengen in Rd ist, soist auch ∪i∈I Ai offen in Rd. Eine analoge Aussage gilt nicht f ur abge-schlossene Mengen.

Page 49: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 49/156

Kapitel 2

Messbare Abbildungen

2.1 Definitionen

Messbare Abbildungen sind ein zentraler Gegenstand der Maßtheorie. In derWahrscheinlichkeitstheorie dienen sie zur Modellierung von Zufallsgroßen. Wahrendnormierte Maßraume (Ω,F ,P) als zuf allige Experimente angesehen werden, dieim Hintergrund ablaufen und eventuell nicht wahrgenommen werden konnen,dienen messbare Funktionen von Ω in R1 oder Rd als Modell beobachtba-rer Teilaspekte des zugrundeliegenden Experimentes. Die Voraussetzung derMessbarkeit sichert die Existenz einer Wahrscheinlichkeitsverteilung der Zu-fallsgroße im Bildraum R1 oder Rd.

Es seien(E, E) und (F, F ) zwei messbare Raume und X eine Abbildung von E in F . (Wir verwenden die Bezeichnungen Abbildung und Funktion synonym.)

Definition 2.1 Die Abbildung X heißt (E,F )-messbar (wenn keine Verwechs-lungen m oglich sind, auch k urzer E-messbar, oder einfach messbar), falls

X −1(B) ∈ E f ur alle B ∈ F , d.h., falls (2.1)

X −1

(F ) ⊆ E.Ist F,F ) = (Rd,Bd), so heißt jede (E,Bd)-meßbare Abbildung von E in Rd

auch Borel-messbar oder Borelsch.

Beispiele 2.2 Gegeben sei ein messbarer Raum (E, E).

43

Page 50: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 50/156

44 Uwe K uchler

a) Es seien α ∈ R1, α = 0, A ⊆ E . Die Funktion X (y) = α1 A(y), y ∈ E ,

ist E

-messbar genau dann, wenn A ∈E

, insbesondere ist jede konstante Funktion messbar.

b) Gilt A1, A2, . . . , An ∈ E, so ist

X (y) =n

k=1

αk 1 Ak(y), y ∈ E, (2.2)

E-messbar f ur jede Wahl reeller Zahlen α1, α2, . . . , αn. Funktionen X von der Gestalt (2.2) nennen wir einfache Funktionen oder Elementarfunk-tionen.

Man pr uft leicht nach, dass, wenn X und Y einfache Funktionen sind,auch αX + βY (α, β ∈ R1) eine einfache Funktion ist.

Es sei X eine Abbildung von einer Menge E in einen messbaren Raum (F, F ).

Aussage 2.3 1) EX := X −1(F ) ist eine σ-Algebra,

2) EX ist die kleinste σ-Algebra H aus E , so dass X eine ( H,F )-messbare Abbildung ist.

Beweis:1): Diese Eigenschaft liegt vor wegen der Operationstreue von X −1.

2):(2.1) ist f ur EX

= X −1

(F ) erf ullt, also ist X eine (EX

,F )-messbare Abbil-dung.Ist H eine σ-Algebra aus E und X eine ( H,F )-messbare Abbildung, so giltwegen (2.1), dass X −1(F ) ⊆ f H richtig ist. Das heißt, dass EX die kleinsteσ-Algebra H aus E ist, bezuglich der X eine ( H,F )-messbare Abbildung ist.

Die σ-Algebra EX nennen wir die von X erzeugte σ-Algebra.

2.2 Eigenschaften

Der Begriff der messbaren Funktion ist einfach zu formulieren, aber im allge-meinen schwer nachzuprufen, da man die Elemente von F meist nicht explizitkennt. Aussage 1.17 erlaubt es uns, mit der folgenden Aussage und ihrer Fol-gerung einfache Messbarkeitskriterien zu formulieren.

Page 51: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 51/156

Messbare Abbildungen 45

Satz 2.4 Es sei S ein Erzeuger von F , d.h., es gelte σ(S ) = F . Genau dann ist

X eine (E

,F

)-messbare Funktion, wenn

X −1 ( S ) ⊆ E. (2.3)

Beweis: Aus (2.1) folgt offensichtlich (2.3). Also erf ullt jede (E,F )-messbareAbbildung die Inklusion (2.3). Aus (2.3) folgt mittels Aussage 1.17, dass X −1(F )= X −1(σ (S )) = σ(X −1( S )) ⊆ σ(E) = E erf ullt ist. Also gilt (2.1).

Folgerungen 2.5

a) Eine Abbildung X von (E, E) in R1 ist genau dann Borel-messbar, wenn f ur alle x

∈R1 gilt

y ∈ R1|X (y) ≤ x ∈ E. (2.4)

Beweis: Aus der Borel-Messbarkeit von X folgt sofort (2.4). Gilt (2.4),so ist X −1((a, b]) = X −1((−∞, b])\X −1((−∞, a]) ∈ E f ur alle a, b mit−∞ ≤ a ≤ b ≤ ∞. Die Menge S dieser Intervalle (a, b] ist aber einErzeuger von B1. Mit Aussage 1.17 folgt die (E,B1)-Messbarkeit vonX .

b) Sind X n, n

≥1 Borel-messbare Abbildungen von (E, E) in R1, so sind es

auch

supn≥1

X n, inf n≥1

X n, lim supn→∞

X n, lim inf n→∞

X n.

(Hierbei erfolgt die Bildung von supX n,infX n, usw. punktweise , d.h., esgilt (supn≥1X n)(y) := supn≥1(X n(y)), y ∈ E , usw..)Beweis: Weil X n Borel-messbar ist, gilt X n ≤ x ∈ E f ur alle x ∈ R1.Daraus folgt supn X n ≤ x =

n

X n ≤ x ∈ E. Also ist supn

X n wegen

Folgerung a) Borel-messbar. Analog gilt inf n X n < x =

nX n < x ∈

E, also auch inf n X n ≤ x = minf n X n < x + 1

m ∈ E f ur allex ∈ R1. Somit ist inf n X n ebenfalls Borel-messbar. Es gilt lim sup

n→∞X n =

inf n supm≥n X m und lim inf n→∞

= supn inf m≥n X m, somit folgt der Rest von

b).

Page 52: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 52/156

46 Uwe K uchler

c) Sind X n, n ≥ 1, wie in c) definiert und konvergieren die X n punktweise

gegen X , dann ist X Borel-messbar.

Beweis: In diesem Fall gilt X = lim supn→∞

X n = lim inf n→∞

X n und somit ist X

Borel-messbar.

Die Folgerung 2.5 c) besagt, dass punktweise Grenzwertbildung aus der Mengeder messbaren Funktionen nicht hinaus f uhrt. Diese Eigenschaft hat z. B. dieMenge aller stetigen Funktionen nicht.Bisher haben wir als konkrete Beispiele messbarer Funktionen nur die einfachenFunktionen kennengelernt. Die folgende Aussage liefert uns eine ganze Reihe

weiterer Beispiele.Aussage 2.6 Es sei X eine stetige Funktion von R1 in sich. Dann ist X Borel-messbar.

Beweis: Fur jedes Polynom Q(y) :=n

i=0

aiyi ist y ∈ R1|Q(y) ≤ x Vereinigung

von hochstens n nach links halboffenen Intervallen, also Borel-messbar. Alsoist nach Folgerung 2.5a) jedes Polynom Q Borel-messbar. Fur jedes N > 0ist 1 [−N,N ](y)X (y) punktweiser Grenzwert einer Folge von Polynomen (Weier-straßscher Approximationssatz), folglich Borel-messbar.Daraus ergibt sich, dass auch X Borel-messbar ist.

(Karl Weierstraß, deutscher Mathematiker, 1815-1897)

Bemerkung: Die Aussage gilt auch f ur stetige Funktionen X von (Rn,Bn) inRd.

Im folgenden Beispiel geben wir eine einfache (im Sinne von Beispiel 2.2a))Borel-messbare Funktion an, die an jeder Stelle ihres Definitionsbereiches un-stetig ist.

Beispiel 2.7 (Dirichletsche Funktion) Die Funktion X (y) =1

Q(y), y ∈ [0, 1],ist Borel-messbar, da die Menge Q der rationalen Zahlen Borel-messbar ist.Andererseits ist X an keiner Stelle y ∈ [0, 1] stetig, da lim inf z→y X (z ) = 0und limsupz→y X (z ) = 1 f ur alle y ∈ [0, 1] gilt.

Page 53: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 53/156

Messbare Abbildungen 47

(Peter Gustave Dirichlet, deutscher Mathematiker, 1805-1859)

Die nachsten beiden Aussagen werden es uns ermoglichen, aus gegebenenmessbaren Funktionen weitere zu bilden.

Aussage 2.8 Es seien X eine (E,F )-messbare Abbildung von (E, E) in (F, F )und Y eine (F ,G)-messbare Abbildung von (F, F ) in (G,G). Dann ist die zu-sammengesetzte Abbildung

Z (y) := Y (X (y)), y ∈ E,

eine (E,G)-messbare Abbildung von (E, E) in (G,G).Symbolisch: Z := Y X .

Beweis: Z −1(B) = X −1(Y −1(B)) ∈ E f ur alle B ∈ G, da Y −1(B) ∈ F f ur alleB ∈ G.

Aussage 2.9 a) Sind X 1, X 2, . . . , X n reellwertige Borel- messbare Funktio-nen auf (E, E), und ist h eine Borel-messbare Funktion von Rn in Rd,so ist h(X 1, . . . , X n) eine E-messbare Funktion von (E, E) in Rd.

b) Sind X und Y Borel-messbar, so sind es auch X +Y, X ·Y, max(X, Y ), min(X, Y )und, (falls Y = 0), X

Y .

Beweis:

a) X = (X 1, X 2, . . . , X n) ist eine Borel-messbare Funktion von (E, E) inRn. (Wir werden das in Aussage 6.1 beweisen.)Es gilt namlich f ur (a, b] =n

k=1

(ak, bk] die Beziehung X −1((a, b]) = ∈ E : X (y) ∈ (a, b] =n

k=1

y ∈E : X k(y) ∈ (ak, bk] ∈ E. Anwendung von Satz 2.4 liefert die E-Messbarkeit von X . Die Anwendung von Aussage 2.8 ergibt die Behaup-tung a).

b) Die angegebenen Funktionen (x, y) → x + y, max(x, y), min(x, y), x\ysind stetig (letztere auf R1

×(R1

\0

)). Aus der Bemerkung nach Aussage

2.6 folgt die Behauptung.

Der Begriff der messbaren Funktion ist recht abstrakt, und es ist auf denersten Blick nicht klar, wie umfangreich die Menge aller messbaren Funktionenist. Stetige Funktionen sind auf jeden Fall in dieser Menge enthalten. Auch

Page 54: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 54/156

48 Uwe K uchler

Indikatorfunktionen messbarer Mengen und einfache Funktionen (im Sinne

von (2.2)) gehoren dazu.Der folgende Satz zeigt, dass man andererseits jede messbare Funktion durcheinfache Funktionen beliebig genau annahern kann. Wir werden spater sehen,dass er den Umgang mit messbaren Funktionen sehr erleichtert.

Approximation Borel-messbarer Funktionen

Satz 2.10 F ur jede nichtnegative Borel-messbare Funktion X von (E, E) in R1 gibt es eine nichtfallende Folge (X n, n ≥ 1) einfacher nichtnegativer Borel-messbarer Funktionen, die punktweise von unten gegen X konvergiert:

0 ≤ X n(y) ≤ X n+1(y) ≤ X (y), n ≥ 1, y ∈ E

und

limn→∞

X n(y) = X (y), y ∈ E.

Beweis: Wir setzen

X n(y) :=

k · 2−n , falls X (y) ∈ [k · 2−n, (k + 1)2−n) und 0 ≤ k ≤ n2n,n , falls X (y) ≥ n + 2−n.

Die X n sind einfache, insbesondere Borel-messbare, Funktionen mit

X n(y) ≤ X n+1(y) ≤ X (y), y ∈ E und (2.5)

|X n(y) − X (y)|1 X ≤n(y) ≤ 2−n, y ∈ E. (2.6)

Also gilt

limn→∞

X n(y) = X (y) f ur alle y ∈ E.

Folgerung 2.11 Mit Hilfe des Satzes 2.10 zeigt man leicht, dass jede Borel-messbare Funktion X von E in R1 punktweiser Grenzwert einer Folge (X n)einfacher (insbesondere Borel-messbarer) Funktionen ist.

(Man verwende die Zerlegung X = X + − X − mit X + = max(X, 0) und X − =− min(X, 0).)

Page 55: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 55/156

Messbare Abbildungen 49

y

n

(k + 1)2−n

k2−n

X (y)

X n(y)

Abbildung 2.1: Approximation von X (y) = y2 durch einfache FunktionenX n(y) =

n2n−1k=0 k2−n · 1X −1([k2−n,(k+1)2−n))(y)

2.3 Produkt-σ-Algebren

Produktmengen und Produkt-σ-algebren dienen in der Wahrscheinlichkeits-theorie zur Modellierung mehrerer gleichzeitig oder nacheinander ausgef uhrterzuf alliger Versuche. Um die Notation nicht mit technischen Details zu uberla-sten, beginnen wir mit dem Fall des Produktes zweier messbarer Raume.Gegeben seien zwei messbare Raume (E 1,E1) und (E2,E2). Wir bilden die

Produktmenge

E := E 1 × E 2 = y = (y1, y2)T : y1 ∈ E 1, y2 ∈ E 2und f uhren die Projektionsabbildungen (oder Koordinatenabbildungen ) P 1 eindurch

P i : E → E i, P iy = yi,

die jedem Paar y = (y1, y2) ∈ E seine i-te Koordinate yi zuordnet, i = 1, 2.

Definition 2.12 Die kleinste σ-Algebra E in E , bez uglich der beide P i jeweils

(E,Ei)-messbar sind, heißt die Produkt-σ-Algebra von E1 und E2. Sie wird mit

E = E1 ⊗ E2

bezeichnet.

Page 56: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 56/156

50 Uwe K uchler

Aussage 2.13S 1 und S 2 seien Erzeuger von E1 bzw. E2. Dann wird E1 ⊗ E2

vom System S

1×S

2 aller Mengen S 1 × S 2 mit S i ∈S

i, i = 1, 2, erzeugt:

E = E1 ⊗ E2 = σ( S 1 ×S 2) = σ(S 1 × S 2 : S 1 ∈

S 1, S 2 ∈S 2).

Beweis: P i ist (E,Ei)-messbar, folglich gilt P −1i ( S i) ⊆ E, i = 1, 2, und somit

S 1 × S 2 = P −11 ( S 1) ∩ P −12 (S 2) ⊆ E. (2.7)

Daraus folgt

σ(S 1 × S 2) ⊆ E. (2.8)

Andererseits sind P 1 bzw. P 2 bez. (σ(S 1× S 2),Ei) messbar. Es gilt namlich (sieheAussage 1.17) P −1

i (Ei) = P −1i (σ(S i)) = σ(P −1i (S i)) ⊆ σ(P −11 ( S 1) ∩ P −1

2 (S 2)) =σ( S 1 × S 2), i = 1, 2, und somit, nach Definition der Produkt-σ-Algebra,

E ⊆ σ(S 1 ×S 2). (2.9)

Aus (2.8) und (2.9) folgt die Aussage.

Bemerkung: Auf analoge Weise definiert man f ur gegebene messbare Raume

(E i,Ei), i = 1, 2, . . . , n, den Produktraum E =n

i=1

E i und die Produkt-σ-

Algebra E =n

i=1

Ei.

Gilt (E i,Ei) ≡ (E 1,E1), so schreibt mann

i=1

Ei =: En1 .

Folgerung 2.14 Im Fall (E i,Ei) = (R1,B1), i = 1, 2, . . . , d, erhalten wir als Produkt-σ-Algebra die σ-Algebra Bd der Borelmengen aus Rd.

In der Tat, ist S die Semialgebra der nach links halboffenen Intervalle aus R1,so ist S

d gleich der Semialgebra der nach links halboffenen Quader aus Rd, undsomit gilt die Folgerung.

Page 57: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 57/156

Messbare Abbildungen 51

Man kann diese Definition auf Produktraume mit beliebig vielen”

Faktoren “

E i ausdehnen. Wir skizzieren das Vorgehen.Ist I eine Indexmenge (z.B. N oder [0, ∞)), so bezeichneti∈I

E i die Menge aller

Funktionen x = (xi, i ∈ I ) auf I mit xi ∈ E i, i ∈ I .

Fur jedes i ∈ I sei P i der Projektionsoperator voni∈I

E i in E i, gegeben durch

P ix = xi f ur x = (xi, i ∈ I ) ini∈I

E i.

Als Produkt-σ-Algebra E =i∈I

Ei wird die kleinste σ-Algebra von Teilmengen

von

i∈I E i bezeichnet, bez. der alle P i, i ∈ I, (E,Ei)−messbar sind.

Im Fall E i ≡ E schreiben wir E I bzw. EI anstelle i∈I

E i bzw. i∈I Ei.

Fur I = 1, 2 haben wir die Konstruktion ausgef uhrt.

Die messbaren Raume (RN,EN) und (R[0,∞),E[0,∞)) dienen in der Wahrschein-lichkeitstheorie zur Beschreibung unendlicher Folgen von Zufallsgroßen bzw.zuf alliger Prozesse mit stetiger Zeit.

2.4 Durch messbare Abbildungen induzierte

MaßeEs seien (E, E, µ) ein Maßraum (µ sei σ-finit) und X eine (E,F )-messbareAbbildung von (E, E) in einem messbaren Raum (F, F ).

Aussage 2.15 Durch

µX (B) := µ(X −1(B)), B ∈ F , (2.10)

ist auf F ein σ-finites Maß µX definiert, das als das von X induzierte Maß auf

F oder als Bildmaß von µ bez. X bezeichnet wird. Ist µ(E ) = 1, so nennt man (in der Wahrscheinlichkeitstheorie) µX auch die Wahrscheinlichkeitsverteilung der Zufallsgr oße X .Bemerkung: Damit µ(X −1(B)) f ur B aus F ¨ uberhaupt definiert ist, muss X −1(B)zu E geh oren. Das wird gerade durch die (E,F )−Messbarkeit von X

Page 58: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 58/156

52 Uwe K uchler

bewirkt.

Beweis: µX (∅) = 0, µX ∞

k=1

Bk

= µ

X −1

∞k=1

Bk

= µ

∞k=1

X −1(Bk)

=

∞k=1

µX (Bk) f ur jede paarweise disjunkte Folge (Bk) aus F . Dabei haben wir die

Operationstreue von X −1 benutzt.

Beispiele 2.16 Es sei (F, F ) = (R1,B1). Besteht der Wertebereich von X (also die Menge X (y)|y ∈ E ) aus den Zahlen xk, k ≥ 1, so ist µX ein diskretes Maß mit den Einzelmaßen

µX (xk) = µ(y ∈ E : X (y) = xk) = µ(X = xk), k ≥ 1, (2.11)

und f ur jede Menge B ⊆ R1 ist

µX (B) = µ(y ∈ E : X (y) ∈ B) =

k:xk∈B

µX (xk). (2.12)

Ist µ dar uber hinaus ein Wahrscheinlichkeitsmaß, so sagt man, X habe eine diskrete Wahrscheinlichkeitsverteilung µX .

Besitzt µX

eine Dichte f X (wir nehmen wieder der Einfacheit halber hier an,daß f X st uckweise stetig ist), so gilt

µX (B) =

B

f X (x)dx, z.B. f ur B = [a, b], (2.13)

und man sagt, X habe eine absolut-stetige Verteilung mit der Dichte f X , oder verk urzt, X habe die Dichte f X .

(Fur allgemeine Borelmengen B wird das Integral, das in (2.13) auftritt, im

nachsten Abschnitt definiert werden.)Im Allgemeinen kann man im Fall (F, F ) = (R1,B1) und µ(E ) < ∞ dasBildmaß µX charakterisieren durch seine Verteilungsfunktion

F X (x) := µX ((−∞, x]) = µ(X −1((−∞, x])) =: µ(X ≤ x), x ∈ R1,

Page 59: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 59/156

Messbare Abbildungen 53

(siehe Folgerung 1.27).

Ubungen

1) Beweisen Sie: Wenn S i f ur i = 1, 2 Semialgebren in E i sind, so ist S 1× S 2

eine Semialgebra in E 1 × E 2.

2) Es sei E = [0, 1),E = B1[0,1) und X (y) = y2 f ur y ∈ E . Konstruieren

Sie eine nichtfallende Folge (X n, n ≥ 1) einfacher nichtnegativer Borel-messbarer Funktionen, die punktweise von unten gegen X konvergiert.

3) Es sei X eine Abbildung von einer Menge E in einen messbaren Raum(F, F ) und EX := X −1(F ) die von X in E erzeugte σ-Algebra. Ist Y eine(EX ,Bd)−messbare Abbildung von E in Rd, so existiert eine (F ,Bd)-messbare Abbildung h von F in Bd, so dass gilt Y (y) = h(X (y)), y ∈ E .

Hinweis:Zunachst sei X = 1 B f ur ein B ∈ EX . Fur dieses X gilt dieAussage, da B = X −1(C ) f ur ein C ∈ F und 1 X −1(C ) = 1 C (X ) gelten.In diesem Fall kann man h = 1 C setzen. Auf analoge Weise behandleman den Fall einfacher (EX ,Bd)−messbarer Abbildungen. Anschließendwende man den Approximationssatz 2.10 bzw. Folgerung 2.11 an.

4) Zeigen Sie: Wenn (E, E, µ) ein diskreter Maßraum ist, und wenn X eine

messbare Abbildung von (E, E, µ) in einen messbaren Raum (F, F ) ist,so ist auch µX ein diskretes Maß.

5) Es sei E = 1, 2, . . . , 62 und E = P(E ). Mit µ werde das normierteZahlmaß auf (E, E) bezeichnet. Die Abbildung X sei auf E definiertdurch X (y) = y1 + y2, f ur y = (y1, y2) ∈ E .

a) Geben Sie die Elemente der σ−Algebra EX an.

b) Bestimmen Sie die Wahrscheinlichkeitsverteilung µX von X .

6) Es seien E = [0, 1),E = B1[0,1) und µ = λ[0,1) das Lebesguemaß auf E .

Durch X (y) = yn

, y ∈ E, ist eine Borel-messbare Abbildung X von E inR1 definiert. Man bestimme das von X induzierte Maß µX auf (R1,B1).Besitzt X eine Dichte?

Page 60: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 60/156

54 Uwe K uchler

Page 61: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 61/156

Kapitel 3

Integration messbarerFunktionen

3.1 Definitionen

Es seien (E, E, µ) ein Maßraum, µ ein finites Maß und X eine Borel-messbareFunktion auf (E, E) mit Werten in R1. Wir werden in diesem Abschnitt das In-

tegral

E

X (y)µ(dy) (kurz:

E

Xdµ) der Funktion X bez. des Maßes µ uber die

Menge E einf uhren. Dieser Integralbegriff wird in Wahrscheinlichkeitstheorie

und Statistik verwendet, um Erwartungswerte, Varianzen, Kovarianzen undhohere Momente von Zufallsgroßen zu berechnen. Er gestattet u. a. eine ein-heitliche Behandlung diskreter und absolut-stetiger Maße.Wir beginnen mit dem Fall, dass X eine einfache Funktion ist, d. h.,

X (y) =mi=1

ai 1 Ai(y), y ∈ E, (3.1)

f ur gewisse ai ∈ R1, Ai ∈ E, i = 1, 2, . . . , m , m ≥ 1.

Definition 3.1 Als Integral der einfachen Funktion X aus (3.1) ¨ uber E bez uglich

µ bezeichnet man die Zahl

E

X (y)µ(dy) :=mi=1

aiµ(Ai). (3.2)

55

Page 62: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 62/156

56 Uwe K uchler

Das Integral hangt nicht von der Wahl der Darstellung (3.1) ab (siehe zum

Beispiel Elstrodt [3], Kap.IV,Lemma 1.1).Wir erwahnen zunachst zwei schnell einzusehende Eigenschaft dieses Integral-begriffs.

Es seien X und Y einfache Funktionen.

a) Aus X ≤ Y (d.h. X (y) ≤ Y (y) f ur alle y ∈ E ) folgt

E

Xdµ ≤ E

Y dµ, (3.3)

(Monotonie des Integrals )

b) f ur alle a, b ∈ R1 gilt

E

(aX + bY )dµ = a

E

Xdµ + b

E

Y dµ. (3.4)

(Linearit at des Integrals )

Es sei nun X eine nichtnegative Borel-messbare Abbildung von (E, E) in R1.Auf Grund des Satzes 2.10 uber die Approximation Borel-messbarer Funktio-nen gibt es eine nichtfallende Folge (X n) nichtnegativer einfacher Funktionenmit lim

n→∞X n(y) = X (y), y ∈ E .

Wegen (3.3) ist die bereits mit (3.2) definierte Folge (

E

X ndµ,n ≥ 1) mo-

noton nichtfallend und besitzt folglich einen (evtl. unendlichen) Grenzwert,namlich ihr Supremum.

Definition 3.2 Als Integral von X ¨ uber E bez uglich des Maßes µ bezeichnet

man den Wert E

X (y)µ(dy) := limn→∞

E

X n(y)µ(dy) (3.5)

Page 63: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 63/156

Integration messbarer Funktionen 57

Die Funktion X , die integriert wird, nennt man Integrand , die Menge E , uber

die sich das Integral erstreckt, heißt Integrationsbereich .

Ist X eine beliebige Borel-messbare Funktion von E in R1, so benutzen wir dieZerlegung X (y) = X +(y) − X −(y) mit X +(y) := max(X (y), 0) und X −(y) :=− min(X (y), 0).

Definition 3.3 Sind

E

X +dµ und

E

X −dµ beide endlich, so heißt X bez. µ

integrierbar, und wir definieren

E

Xdµ := E

X +dµ − E

X −dµ.

Ist

E

X +dµ = ∞ und

E

X −dµ < ∞, so definieren wir

E

Xdµ := ∞.

Im Falle

E

X +dµ < ∞ und

E

X −dµ = ∞ setzen wir

E

Xdµ := −∞.

Auch in diesen F allen heißt X integrierbar bez. µ, allerdings ist das Integral gleich +∞ bzw. −∞.

Anderenfalls, also wenn E

X +dµ = E

X −dµ = ∞, nennen wir X nicht inte-

grierbar bez. µ.

Ohne Beweis vermerken wir, dass das Integral

E

Xdµ nicht von der Wahl

der approximierenden Folge (X n) einfacher Funktionen abhangt (siehe z.B.Elstrodt [3],Kap.IV, Korollar 2.2). Das soeben eingef uhrte Integral heißtµ-Integral oder auch Lebesgueintegral (nach dem Maß µ) (siehe Elstrodt [3],

Kap.8, S.110).

Page 64: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 64/156

58 Uwe K uchler

Definition 3.4 Ist X eine bez uglich µ integrierbare Funktion und ist A ∈ E,

so ist offensichtlich auch X ·1

A bez. µ integrierbar. Wir schreiben in diesem Fall A

Xdµ :=

E

X · 1 Adµ (3.6)

Auch in diesemn Zusammenhang heißt A der Integrationsbereich, ¨ uber den die Funktion X integriert wird.

Wir benotigen noch den Integralbegriff f ur den Fall, dass µ ein σ-finites Maß

ist. In diesem Fall sei Bn, n ≥ 1, eine Zerlegung von E in messbare MengenBn mit µ(Bn) < ∞. Wir definieren f ur nichtnegative messbare Funktionen X

E

Xdµ :=∞

n=1

Bn

Xdµ,

und erweitern diesen Integralbegriff auf beliebige messbare Funktionen X wieoben durch Zerlegung von X in Positiv- und Negativteil.

In der Wahrscheinlichkeitstheorie und Mathematischen Statistik werden messba-

re Funktionen X zur Modellierung von Zufallsgroßen verwendet. Ihr Integralbezuglich des zugrunde liegenden Wahrscheinlichkeitsmaßes µ ist der Erwar-tungswert EX von X . Er spielt in der Statistik, zum Beispiel auf Grund desGesetzes der großen Zahlen, eine fundamentale Rolle. (Siehe z.B. Schmidt [5],Kap.15.)

3.2 Einige Eigenschaften des Integrals

In diesem Abschnitt nehmen wir an, (E, E, µ) sei ein σ−finiter Maßraum. Wirbezeichnen die Menge aller Borel-messbaren Funktionen X auf (E, E) mit Wer-ten in R1, deren Integral uber E bez. µ endlich ist, mit L1 (ausf uhrlicher:L1(E, E, µ)).

Page 65: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 65/156

Integration messbarer Funktionen 59

Allein auf Grundlage der Definition des Integrals E

Xdµ kann man bereits

eine ganze Reihe von Eigenschaften dieses herleiten.

Satz 3.5 Im Folgenden seien X und Y bez. µ integrierbare Funktionen mit endlichem Integral, also Elemente von L1(E, E, µ). Es gelten folgende Aussa-gen:

a) F ur alle a, b ∈ R1 ist aX + bY ∈ L1(E, E, µ), und es gilt

E

(aX + bY )dµ = a

E

Xdµ + b

E

Y dµ,

(man sagt, L1(E, E, µ) bilde ein linearen Raum),

b) wenn X ≥ 0, so

E

Xdµ ≥ 0, wenn X ≤ Y , so

E

Xdµ ≤ E

Y dµ,

(man sagt, die Integration sei eine monotone Operation),

c) | E

X (y)µ(dy)| ≤ E

|X (y)|µ(dy) < ∞,

(Spezialfall der Jensenschen Ungleichung; siehe Abschnitt 3.6.)

d) wenn µ(y ∈ E |X (y) = Y (y)) = 0, so ist E

X (y)µ(dy) = E

Y (y)µ(dy),

(das Integral E

Xdµ ist unempfindlich gegenuber Anderungen des Inte-

granden X (.) auf einer µ-Nullmenge),

e) Aus X ≥ 0 und E

Xdµ = 0 folgt X = 0 µ-fast ¨ uberall.

Beweis:

a) Es seien X und Y nichtnegative Funktionen aus L1(E, E, µ) und (X n)bzw. (Y n) nichtfallende Folgen einfacher Funktionen mit X = lim

nX n, Y =

limn

Y n, a , b ≥ 0. Dann ist Z n := (aX n + bY n) eine wachsende Folge einfa-

cher Funktionen mit limn

Z n = aX + bY . Also gilt (siehe (3.3)und (3.5))

Page 66: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 66/156

60 Uwe K uchler

E

(aX + bY )dµ : = limn

E

(aX n + bY n)dµ = limn

a E

X ndµ + b E

Y ndµ

= a

E

Xdµ + b

E

Y dµ.

Im allgemeinen Fall nutzt man wieder die Zerlegungen X = X + − X −

und Y = Y + − Y −,

b) der erste Teil ergibt sich aus der Definition von E

Xdµ, der zweite folgte

aus Y − X ≥ 0 und Teil a),

c) | E

Xdµ| = | E

X +dµ − E

X −dµ| ≤ E

X +dµ +

E

X −dµ

Aus dieser Ungleichung ist ersichtlich, dass genau dann

E

Xdµ endlich

ist, wenn

E

|X |dµ es ist.

d) Nach Voraussetzung ist A := y ∈ E |X (y) = Y (y) eine µ-Nullmenge.Wir setzen zunachst voraus, dass X, Y ≥ 0 gilt. Dann haben wir

E

Y dµ =

E

Y 1 Adµ +

E

Y 1 Acdµ =

E

Y 1 Adµ +

E

X 1 Acdµ. (3.7)

Es sei (Y n) eine nichtfallende Folge einfacher Funktionen mit limn

Y n = Y .

Dann ist auch ( 1 AY n) eine nichtfallende Folge einfacher Funktionen und

es gilt limn

1 A · Y n = 1 AY wie in Satz 2.9. Somit ist (siehe Definition 3.2)

E

Y 1 Adµ = limn

E

Y n 1 Adµ.

Page 67: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 67/156

Integration messbarer Funktionen 61

Daraus folgt 0 ≤ E

Y n 1 Adµ ≤ C n · µ(A) = 0 f ur ein C n > 0, da Y n

nach oben beschrankt ist. Also gilt

E

Y 1 Adµ = 0. Analog zeigt man E

X 1 Adµ = 0. Daraus ergibt sich mit (3.7)

E

Y dµ =

E

Xdµ.

Beispiel 3.6 Es sei (E, E, µ) = ([0, 1),B1[0,1), λ[0,1)), wobei λ das Lebesguemaß

auf B1 bezeichne. Die Funktion X sei die Dirichletsche Funktion, siehe Beispiel 1.7. Dann ist X bez. λ[0,1) integrierbar, und es gilt

[0,1) Xdλ[0,1) = 0, da X =

0 λ[0,1)− f.¨ u..

Wir haben im Abschnitt 1.3 beim Studium von Maßen auf der reellen Achse

gesehen, dass es eine bijektive Entsprechung zwischen finiten Maßen auf B1

und Verteilungsfunktionen F auf R1 gibt. Aus diesem Grund schreibt man auchhaufig

R1

XdF anstelle R1

Xdµ. Das Gleiche gilt ubrigens auch f ur Maße auf Bn mit n > 1. Wir kommen darauf in Kapitel 6 zuruck.

3.3 Substitutionsregel

Wir nehmen wieder an, dass (E, E, µ) ein σ−finiter Maßraum sei.

Satz 3.7 (Substitutionsregel) Es seien X eine (E,F )-messbare Funktion

von einem Maßraum (E, E, µ) in einem messbaren Raum (F, F ), h eine Borel-messbare Funktion von F in R1, µX das Bildmaß von µ vermittels der Abbil-dung X (siehe (2.10)).

Dann gilt

Page 68: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 68/156

62 Uwe K uchler

a) h X = h(X ) ∈ L1(E, E, µ) genau dann, wenn h(·) ∈ L1(F, F , µX ),

b) falls h ≥ 0, oder falls h die Eigenschaften aus a) hat, dann

E

h(X (y))µ(dy) =

F

h(x)µX (dx) (3.8)

Beweis: Die Gleichung (3.8) gilt f ur h(x) = 1 B(x), B ∈ F , x ∈ F , nach Defini-tion (2.10) des Bildmaßes µX :

E

h(x)µX

(dx) = µX

(B) = µ(X −1

(B)) = E

1 X −1(B)(y)µ(dy) = E

1 B(X (y))µ(dy) =

E

h(X (y))µ(dy).

Auf Grund der Linearitat der Integration gilt (3.8) f ur alle einfachen Funk-tionen. Ist h ≥ 0 und hn eine wachsende Folge einfacher Funktionen mith(x) = l im

nhn(x), x ∈ F , so folgt (3.8) aus der Definition der Integrale

siehe (3.5). Den allgemeinen Fall erhalt man wieder mittels h = h+ − h−.

Bemerkung: Die hier verwendete Methode zum Beweis einer Eigenschaft von

Integralen heißt mitunter die ”Lifting-Methode“. Eine Aussage uber messba-re Funktionen wird zunachst f ur messbare Indikatorfunktionen bewiesen, wassich haufig als einfach herausstellt, und dann mit Hilfe des Approximations-satzes 2.10. und der Zerlegung in Positiv- und Negativteil auf das Niveau vonallgemeinen messbaren Funktionen

”geliftet“.(Elstrodt [3], S.109 nennt sie

”al-

gebraische Induktion“.)Die Bedeutung des Satzes 3.6 besteht darin, dass man zur Berechnung von E

h(X (y))µ(dy) nur das Bildmaß µX und die Funktion h(.) verwenden muss,

nicht die Abbildung X und das Maß µ selbst.

Fur die Wahrscheinlichkeitstheorie heißt das, daß der Erwartungswert (undauch alle sogenannten Momente) einer Zufallsgroße X uber einem Wahrschein-lichkeitsraum (Ω,A, P) allein durch ihre Wahrscheinlichkeitsverteilung PX be-stimmbar sind, die konkrete Form der Zufallsgroße X (d.h. der A-meßbaren

Page 69: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 69/156

Integration messbarer Funktionen 63

Abbildung ω −→ X (ω)) dabei also keine Rolle spielt. Das ist von grundsatzli-

cher Bedeutung, da i.a. der Wahrscheinlichkeitsraum (Ω,A

, P) hypothetischeNatur besitzt, gut geeignet f ur theoretische Uberlegungen, in der Praxis aber,auf Grund von Stichproben, nur die Wahrscheinlichkeitsverteilung PX zugang-lich ist.

3.4 Integrale bezuglich diskreter Maße

Wir setzen jetzt voraus, daß (E, E, µ) ein diskreter finiter Maßraum ist, d.h.,es gibt eine Folge (yn, n ∈ M ) aus E mit M ⊆ N und eine Folge (q n, n ∈ M )positiver Zahlen, mit endlicher Summe, so dass

µ(B) =

n:yn∈B

q n, f ur alle B ∈ E (3.9)

gilt.Die Gleichung (3.9) definiert sogar ein Maß µ auf der Menge P(E) aller Teil-

mengen von E, diskrete Maße gestatten also eine ”Erweiterung“ auf die ma-ximale σ-Algebra P(E) von Teilmengen von E.

Offenbar ist jede reellwertige Funktione X auf E eine (P(E),B1)-messbareFunktion. Mit Y := yn, n ∈ M ) gilt wegen µ(Y c) = 0 die Gleichung X =1 Y · X µ-fast uberall und wegen Satz 3.5 d) ist

E

Xdµ =

E

1 Y · Xdµ. (3.10)

Setzt man Y m := yn, n ∈ M, n ≤ m, so ist die Abbildung

y →1 Y m(y) · X (y) =

n∈M ;n≤m

1 yn(y) · X (yn)

Page 70: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 70/156

64 Uwe K uchler

eine einfache Funktion, also gilt nach Definition

E

1 Y m · Xdµ =

n∈M :n≤m

X (yn)q n.

Ist X nichtnegativ, so folgt f ur m → ∞ aus der Definition (3.5) des Integralsdie Formel

E

Xdµ =n∈M

X (yn)q n. (3.11)

Fur beliebige X benutzt man wieder die Zerlegung X = X + − X −, um (3.11)zu zeigen.

Es ergibt sich, daß X genau dann µ-integrierbar ist mit endlichem Integral E

Xdµ, wenn

n∈M

|X (yn)| q n < ∞.

Die Berechnung von Integralen bezuglich diskreter Maß ist damit auf Sum-menbildungen reduziert.

3.5 Integrale bezuglich absolutstetiger Maße

auf (Rd,Bd)

Es sei zunachst (F, F ) = (R1,B1). Die Berechnung von Integralen der Form(3.8) wird haufig einfacher, wenn das Maß µX eine Dichte besitzt.

Ist E = R1,E = B1 und λ das Lebesguemaß auf B1 (siehe Beispiele 1.28

c)), so nennen wir das Integral

R1

Xdλ das Lebesgueintegral der Funktion X

bez uglich des Lebesguemaßes uber R1 und bezeichnen es mit

R1

X (y)dy oder,

der Deutlichkeit halber, mit L

− R1

X (y)dy. Wir prazisieren jetzt den Begriff

der Dichte eines Maßes.

Definition 3.8 Es seien µ ein σ-finites Maß auf B1, und f eine nichtnegative Borel-messbare Funktion auf R1 mit

Page 71: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 71/156

Integration messbarer Funktionen 65

µ((a, b]) =

(a,b]

f (x)dx, −∞ ≤ a < b ≤ ∞. (3.12)

Dann heißt f Dichte des Maßes µ und das Maß µ heißt absolutstetig (bez. des Lebesguemaßes).

Fur die Verteilungsfunktion F jedes endlichen absolutstetigen Maßes µ auf B1

gilt dann (siehe (Definiton 1.23):

F (x) = µ((−∞, x]) =

(−∞,x]

f (s)ds, x ∈ R1. (3.13)

Ist f eine daruber hinaus stuckweise stetige Funktion, so existiert in jedemStetigkeitspunkt x von f die Ableitung F (x) und es gilt

F (x) =dF

dx(x) = f (x) λ − f. u. (3.14)

Wir erwahnen hier vorgreifend auf Abschnitt 3.7, dass das Lebesgueintegral

L − R1

X (y)dy f ur den Fall, dass X eine hinreichned glatte Funktion ist (z.B.

stetig, oder zumindestens stuckweise stetig) gleich dem aus dem Gymnasiumbekannten Riemann-Integral ist.

Beispiele 3.9

a) f (x) = exp

− (x−m)2

2σ2

, x ∈ R1

ist f ur feste m ∈ R1 und σ2 > 0 die Dichte eines sogenannten Gaußschen

Maßes µ auf B1( ”Normalverteilung N (m, σ2)“, falls µ normiert wird).

b) Das Lebesguemaß λ auf einem Intervall [a, b] hat die Dichte f (x) =1 [a,b](x), x ∈ R1.

Page 72: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 72/156

66 Uwe K uchler

Der Begriff der Dichte bez. des Lebesguemaßes λd wird im Fall (F, F ) =

(Rd

,Bd

) analog definiert. Das Intervall (a, b] in (3.12) wird dabei durch einend-dimensionalen Quader (a, b] (siehe (1.1)) ersetzt.

Ist f eine Dichte von µX , so nennt man sie auch Dichte der meßbaren Funktion X . Hintergrund ist, daß man in Wahrscheinlichkeitstheorie und Statistik gernvon Dichten von Zufallsgroßen X spricht und dabei Dichten ihrer Wahrschein-lichkeitsverteilungen PX meint.

Der folgende Satz erlaubt die Ruckf uhrung von Integralen bezuglich Maßen auf (Rd,Bd) mit Dichten auf die Berechnung von Lebesgueintegralen bez. des Le-besguemaßes. Spater werden wir sehen, daß man diese wiederum haufig durch

Riemannintegrale , wie sie aus dem Gymnasium bekannt sind, auswerten kann.Fur sie gibt es eine Fullle von konkreten Berechnungsformeln, z.B. die Substi-tutionsregel oder die Methode der partiellen Integration.

Es sei µ ein σ−finites Maß auf Bd mit einer Dichte f und d ≥ 1.

Satz 3.10 Falls h eine reellwertige Borel-messbare Funktion auf Rd ist mit

h ≥ 0 oder

|h(z )|µ(dz ) < ∞, so gilt

Rd h(y)µ(dy) = Rd h(z )f (z )dz. (3.15)

Insbesondere haben wir

µ(B) =

B

f (z )dz f ur alle B ∈ Bd. (3.16)

Beweis: Wir verwenden die Lifting Methode. Fur h = 1 (a,b] ist der Satz nachFormel (3.12)(in seiner allgemeinen Form mit (a, b] als Quader) richtig. Nunerweitert man ihn mit Hilfe der Linearitat der Integralbildung auf einfacheFunktionen und durch monotone Limites auf nichtnegative messbare Funktio-nen h. Abschließend zerlegt man beliebige messbare Funktionen h in Positiv-

und Negativteil h = h−

− h−

.

Transformationssatz f ur Dichten

Page 73: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 73/156

Integration messbarer Funktionen 67

Wir beschranken uns in diesem Punkt der Klarheit halber auf reellwertige

Borel-messbare Funktionen X . Der FallRd

mit d > 1 wird spater in Kapitel 6behandelt.Es sei X eine reellwertige Borel-messbare Funktion auf einem finiten Maßraum(E, E, µ) mit der Dichte f . Das bedeutet, das durch X induzierte Maß µX hat

die Dichte f , es gilt also (siehe (3.16)) µX (B) =

B

f (x)dx f ur alle B ∈ B1.

Haufig hat man die Verteilung einer Borel-messbaren Funktion Y auf (E, E, µ)zu berechnen, die eine Funktion von X ist. Dazu nehmen wir an, h sei eineBorel-messbare Funktion von R1 in sich, und es gelte

Y (y) := h(X (y)), y ∈ E.

Offenbar gilt f ur die Verteilungsfunktion F Y von Y

F Y (y) = µ(Y ≤ y) = µ(z ∈ E |h(X (z )) ≤ y) = µ(h(X ) ≤ y).

Aus dieser Gleichung gewinnen wir folgende

Aussage 3.11 Es seien f X eine st uckweise stetige Dichte von X und x ∈R1|f X (x) > 0 ein Intervall I = (a, b). Weiterhin sei h eine stetig differen-zierbare, streng monotone Funktion auf dem Intervall I mit einem Intervall

J = (c, d) ⊆ R1 als Wertebereich und mit h(x) = 0 f ur alle x ∈ I . (Die Funk-tion h ist insbesondere eine bijektive Abbildung von I auf J.)Gilt Y = h(X ) und setzt man g(y) := h−1(y), y ∈ J, g(y) := 0, y ∈ R1\J , sobesitzt Y ebenfalls eine Dichte, wir bezeichnen sie mit f Y , und es gilt

f Y (y) = f X (g(y))|g(y)|, y ∈ (c, d), f Y (y) = 0, y ∈ R1\(c, d). (3.17)

Gleichung (3.17) kann man auch wie folgt schreiben

f X (x) = f Y (h(x))

|h(x)

|, x

∈(a, b), f X (x) = 0, x

∈R1

\(a, b).

Beweis: Wir wissen aus der Differential- und Integralrechnung, dass g(.) diffe-renzierbar ist. Es sei h zunachst (streng) monoton wachsend. Dann gilt

F Y (y) = µ(Y ≤ y) = µ(h(X ) ≤ y) = µ(X ≤ g(y)) =

Page 74: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 74/156

68 Uwe K uchler

µX

((−∞, g(y)]) = (−∞,g(y)]

f X (s)ds = F X (g(y)).

Das Integral kann als Riemann-Integral aufgefasst werden, da f X nach Vor-aussetzung stuckweise stetig ist.(Wir gehen in Abschnitt 3.7 noch darauf ein.)Nach der Substitionsregel der Differential- und Integralrechnung ist es gleich y

−∞

f X (g(y)) · g(y)dy.

Daraus folgt, dass F Y eine Dichte besitzt (siehe (3.13) und (3.14)), und dassgilt

f Y (y) := F Y (y) = f X (g(y)) · g(y), y ∈ (c, d).

Da h nur Werte aus (c, d) annimmt, ist µ(Y /∈ (c, d)) = 0, wir konnen alsof Y (y) = 0, y ∈ R1\(c, d) setzen.Ist h (streng) monoton fallend, so haben wir f Y (y) = f X (g(y))·(−g(y)). Somitergibt sich die Formel (3.17).

Beispiele 3.12 1) Es sei h(x) = ax + b, x ∈ R1, mit a = 0, Y = aX + b.Dann ist

g(y) =

y

−b

a sowie f Y (y) =

1

|a|f X (

y

−b

a )

und f X (x) = |a| · f Y (ax + b).

2) Ist X eine Borel-messbare reellwertige Funktion auf (E, E),und µX eine (normierte) N (m, σ2)-Verteilung, dann besitzt Y = exp(X ) eine Dichte der Form

f Y (y) =1√

2πσ2yexp

− 1

2σ2(ln y − m)2

, y > 0

f Y (y) = 0, y ≤ 0.

Das Maß bzw. die Verteilung mit dieser Dichte nennt man logarithmische Normalverteilung mit den Parametern m und σ2.

Page 75: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 75/156

Integration messbarer Funktionen 69

Die Cantorsche Funktion, Fortsetzung

Wir zeigen jetzt, dass die am Ende des Abschnitts 1.3. definierte CantorscheFunktion F , die eine Verteilungsfunktion auf R1 ist, keine Dichte besitzt, ob-wohl sie stetig ist.Angenommen, die Dirichletsche Funktion F habe eine Dichte f . Nach Defini-ton ist die Funktion F konstant auf jedem der Intervalle

(0, ∞), (−∞, 0), (1

3,

2

3), (

1

9,

2

9), (

7

9,

8

9), . . . .

Auf diesen Intervallen ist F folglich stetig differenzierbar, und dort gilt

F (x) = dF dx

(x) = f (x) = 0

Das Lebesguemaß der Vereinigung dieser Intervalle aus (0, 1) (außer den bei-den erstgenannten) ist gleich Eins. Also gilt F (x) = f (x) = 0 λ-f.u., und somitkann nicht (3.13) gelten. Also besitzt das von der (stetigen) Cantorschen Funk-tion erzeugte Maß keine Dichte.Weitere interessante Eigenschaften der Cantorschen Funktion und des von ihrerzeugten Maßes findet man z.B. in Elstrodt [3], S.73ff.

Wir beenden diesen Abschnitt mit der Definition bestimmter Teilmengen der

Menge aller Borel-messbarer Funktionen auf einem Maßraum (E, E, µ), die sichspater als sehr nutzlich erweisen werden, und von denen im nachsten Punkteinige Eigenschaften zusammengestellt werden.

Definition 3.13 (Die Mengen L p(E, E, µ)) Es seien (E, E, µ) ein σ-finiter Maßraum und p ≥ 1. Wir bezeichnen mit L p = L p(E, E, µ) die Menge aller reellwertigen Borel-messbaren Funktionen X auf E mit

E

|X (y)| pµ(dy) < ∞.

F ur jedes X aus L p definieren wir

X p:=

E

|X (y)| pdµ

1p

.

Page 76: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 76/156

70 Uwe K uchler

Die Menge L∞ = L∞(E, E, µ) ist definiert als Menge aller reellwertigen, Borel-messbaren Funktionen X auf (E, E, µ), die beschr ankt sind: sup

y∈E |X (y)| < ∞.

Wir setzen f ur alle X aus L∞

X ∞:= supy∈E

|X (y)|.

Ubungen

1) Uberprufen Sie, ob die zwei Funktionen f und g, definiert durch

f (y) = 21 [0, 34](y) + 4 1 [ 1

4,1](y), y ∈ [0, 1],

g(y) = 21 [0, 14](y) + 6 1 [ 1

4, 34](y) + 4 1 ( 3

4,1](y), y ∈ [0, 1],

auf dem Intervall [0, 1] gleich sind. Berechnen Sie die Integrale [0,1] f (y)dy

und [0,1]

g(y)dy.

2) Durch

X n(y) =k

2nf ur y ∈ [

k

2n,

k + 1

2n), k = 0, 1, . . . , 2n − 1

ist eine Folge (X n, n ≥ 1) definiert. Zeigen Sie: (X n) ist eine mono-ton nichtfallende Folge von einfachen Funktionen und bestimmen Sieden Grenzwert X = X (y) f ur n

→ ∞. Berechnen Sie die Integrale

[0,1] X n(y)dy und ihren Grenzwert [0,1] X (y)dy.

3) Die Abbildung X habe die Dichte f (y) = λ exp[−λy]1 (0,∞)(y), y ∈ R1

f ur ein λ > 0. Welche Dichte hat die Funktion Y = exp[−aX ] f ur a = 0?

Page 77: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 77/156

Integration messbarer Funktionen 71

3.6 Ungleichungen

In diesem Punkt nehmen wir an, dass (E, E, µ) ein finiter Maßraum ist. Wirbeweisen bzw. stellen eine Reihe nutzlicher und in der Wahrscheinlichkeitstheo-rie und Statistik, aber auch daruber hinaus haufig verwendeter Ungleichungenvor.

Aussage 3.14 (Jensenschen Ungleichung) Es sei X (·) eine Borel-messbare Abbildung von einem finiten Maßraum (E, E, µ) in R1. Ist g eine konvexe Funk-tion auf R1, d.h. gilt f ur alle x, y ∈ R1 und alle λ ∈ (0, 1) die Ungleichung

g(λx + (1−

λ)y)≤

λg(x) + (1−

λ)g(y),

so ist

g

E

X (y)µ(dy)

≤ E

g(X (y))µ(dy).

(J.L.W.V. Jensen, danischer Mathematiker, 1876-1925) Zum Beweis dieserUngleichung siehe z.B. Schmidt [5], Seite 280.

Aussage 3.15 (Cauchy-Schwarzsche Ungleichung) Sind X und Y Ele-mente von L2(E, E, µ), so ist X

·Y

∈L1(E, E, µ), und die Cauchy-Schwarzsche

Ungleichung ist g ultig:

E

X · Y dµ

2≤ E

X 2dµ · E

Y 2dµ, m.a.W. (3.18)

| E

X · Y dµ| X 2 · Y 2 (3.18’)

Die Gleichheit ” = ” gilt genau dann, wenn es Zahlen a, b ∈ R1

gibt mit |a| + |b| > 0 und

aX + bY = 0 µ − f.¨ u.. (3.19)

Page 78: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 78/156

72 Uwe K uchler

(Augustion Louis Cauchy, franzosischer Mathematiker, 1789-1857, Herr-

mann Amandus Schwarz, deutscher Mathematiker, 1843-1921)

Die Cauchy-Schwarzsche Ungleichung wird auch oft mit dem NamenV.J.Bunjakowski, russischer Mathematiker(1804-1889), verbunden, der sieunabhangig von Cauchy und Schwarz im Jahr 1859 publiziert hat. Beweis: Fur

jedes c ∈ R1 gilt

0 ≤ E

(cX + Y )2dµ = c2 E

X 2dµ + 2c

E

XY dµ +

E

Y 2dµ =: Q(c). (3.20)

Die Losungen a1,2 einer quadratischen Gleichung der Form R(a) = a2+ pa+q =

0 lauten bekanntlich a1,2 = − p2 ± p24 − q . Es gilt R(a) ≥ 0 f ur alle a ∈ R

1

genau dann, wenn p2

4− q ≤ 0. Wegen (3.20) folgt (sofern

E

X 2dµ > 0)

E

XY dµ

2 E

X 2dµ

2 ≤ E

Y 2dµ

E

X 2dµ

und somit (3.18).Es gilt Q(c) = 0 f ur ein c ∈ R1 genau dann, wenn cX + Y = 0 µ-f.u.. Darausfolgt (3.19).

Im Fall E

X 2dµ = 0 haben wir X = 0 µ-f.u., und (3.18) ist erf ullt. Die

Gleichung (3.19) erhalt man in diesem Fall f ur a = 1undb = 0.

Aus der nachsten Ungleichung werden sich mehrere nutzliche konkretere Falleergeben, die teilweise eigene Namen tragen.

Aussage 3.16 Es seien h eine nichtnegative Borel-messbare Funktion auf R1

und X eine reellwertige Borel-messbare Funktion auf (E, E, µ). Dann gilt

µ(y ∈ E |h(X (y)) ≥ a) ≤

E

h(y)µ(dy)

a(3.21)

f ur jedes a > 0.

Page 79: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 79/156

Integration messbarer Funktionen 73

Beweis: Die Funktion Y = h X ist Borel-messbar. Wir setzen

A := Y −1([a, ∞)) = y ∈ E |h(X (y)) ≥ a = h(X ) ≥ a.

Damit gilt h(X (y)) ≥ a1 A(y) und

E

h(X )dµ ≥ a

E

1 A(y)dµ = aµ(A), also

erhalten wir die Ungleichung (3.21).

Folgerungen 3.17

a) ( Markovsche Ungleichung) Es gilt f ur jedes a > 0 und jedes p > 0

µ(|X | p ≥ a) = µ(y ∈ E X (y)| ≥ a) ≤ E |X |

p

dµa p

.

( Andrej Andrejevitsch Markov, russischer Mathematiker, 1856-1922) Zum Beweis setze man einfach h(x) = |x| p in Aussage 3.15 und berucksichtige,

daß |X | p ≥ a p genau dann gilt, wenn |X | ≥ a richtig ist.

b) (Chebyshev’sche Ungleichung) Es gilt f ur jedes a > 0 die

µ(

|X

| ≥a)

E

|X |dµ

a

. (3.22)

( Pavnuty Lwowitsch Chebyshev, russischer Mathematiker, 1821-1894) Diese Ungleichung folgt aus a) f ur k = 1.

c) (H oldersche-Ungleichung) .

Ist p > 1 und q > 1 mit 1 p + 1

q = 1, so gilt f ur je zwei reellwertige E-messbare Funktionen X und Y auf E

| E

XY dµ| ≤ X p · Y q . (3.23)

( Ludwig Otto Holder, deutscher Mathematiker, 1859-1937) (EineVerallgemeinerung der Cauchy-Schwarzschen Ungleichung (3.18))

Page 80: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 80/156

74 Uwe K uchler

d) (Minkowski-Ungleichung) Falls p ∈ [1, ∞) und X, Y ∈ L p(E, E, µ), so

gilt

X + Y p≤ X p + Y p . (3.24)

( H.Minkowski, litauischer-deutscher Mathematiker, 1864-1909)

Zu den beiden nicht bewiesenen Ungleichungen siehe zum Beispiel Siraev [6]unter dem Stichwort

”Ungleichungen“.

f) (Lyapunov-Ungleichung)

Es sei X eine reellwertige Borel-messbare Abbildung auf einem finiten Maßraum (E, E, µ). Dann gilt f ur alle p, p mit 0 < p < p die Unglei-chung

E

|X (y)| pµ(dy)

1p

E

|X (y)| pµ(dy)

1p

(3.25)

oder, in anderer Notation,

X p≤ X p .

( Alexander Michailowitsch Lyapunov, russischer Mathematiker, 1857-1918)

Zum Beweis dieser letzten Ungleichung setzt man in der Jensenschen Unglei-chung g(x) := |x|r mit r = p

pund |X (y)| p anstelle X (y). Dann folgt

| E

|X (y)| pµ(dy)|r ≤ E

|X (y)| prµ(dy) =

E

|X (y)| pµ(dy),

woraus sich die Lyapunovsche Ungleichung unmittelbar ergibt.

Als Folgerung aus der Minkowski-Ungleichung ergibt sich, daß f ur jedes p ∈[1, ∞) die Menge L p = L p(E, E, µ) einen linearen Raum bildet:

X, Y ∈ L p, α , β ∈ R1 ⇒ αX + βY ∈ L p.

Page 81: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 81/156

Integration messbarer Funktionen 75

Dasselbe gilt auch f ur die Menge L∞.

Als Folgerung ergibt sich weiterhin, dass die Menge L p(E, E, µ) f ur jedes p ∈[1, ∞)

”fast “einen normierten Raum bildet, und dass · p ”fast” alle Eigen-

schaften einer Norm besitzt:

i) X ∈ L p =⇒ αX p= |α| X p, α ∈ R1,

ii) X + Y p ≤ X p + Y p, (Dreiecksungleichung f ur Normen).

Allerdings ist die folgende, f ur eine Norm notwendige dritte Eigenschaft, i. a.

nicht erf ullt:iii) X p= 0 genau dann, wenn X = 0 richtig ist.

Aus X p= 0 folgt namlich nur µ(y : X (y) = 0) = 0 (siehe Satz 3.5e)).Um auch diese dritte Eigenschaft zu erhalten, geht man folgendermaßen vor.Man faßt alle Borel-messbaren Funktionen auf E , die µ-fast uberall gleich sind,zu einer ¨ Aquivalenzklasse zusammen:

[X ] := Y |E → R1, Borel-messbar, µ(X = Y ) = 0.

Mit der Definition

α[X ] + β [Y ] := [αX + βY ]

wird die Menge aller Aquivalenzklassen zu einem linearen Raum. Das Nullele-ment in diesem linearen Raum ist [0], die Aquivalenzklasse, die die Funktion

X (y) ≡ 0 enthalt. Das Integral

E

|X | pdµ hangt nicht von Anderungen von X

in µ-Nullmengen ab, folglich hangt der Wert

E

|Y | pdµ nicht von der Wahl des

Elementes Y aus einer Aquivalenzklasse [X ] ab (siehe Satz 3.5d)). Aus diesemGrund konnen wir jeder Aquivalenzklasse [X ] den Wert X p zuordnen, wo-bei X irgend ein Reprasentant aus dieser Klasse ist. In der Regel bezeichnetman den linearen Raum aller Aquivalenzklassen [X ], f ur die [X ] p< ∞ gilt,mit L p(E, E, µ), oder, wenn keine Verwechslungen moglich sind, oder kurz mit

Page 82: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 82/156

76 Uwe K uchler

L p. Neben den Analoga zu i) und ii) hat nun die Funktion [X ] p, [X ] ∈ L p,

tatsachlich die Eigenschaft

iii) [X ] p= 0 genau dann, wenn [X ] = [0].

Aus Grunden der Vereinfachung, und weil Verwechselungen kaum moglich sind,nennt man L p ( p ≥ 1) den Raum der p-integrierbaren Funktionen, meint abereigentlich den Raum der entsprechenden Aquivalenzklassen.Wir formulieren hier zur Abrundung der Darstellung den folgenden Satz ohneweitere Erklaerung. Interessierte Leser konnen sich z.B. in Siraev [5], II,10informieren.

Satz 3.18 Jeder der R¨ aume L p(E, E, µ), ( p ∈ [1, ∞)), ist ein Banachraum.Es gilt f ur alle p, p mit 1 ≤ p < p < ∞ die Relation L p ⊆ L p.

Bemerkung: In der Menge L∞(E, E, µ) werden ebenfalls Aquivalenzklasseneingef uhrt, indem man alle Borel-messbaren Funktionen zusammenfasst, dieµ−fast uberall gleich einer beschrankten Borel-messbaren Funktion sind. DieMenge dieser Aquivalenzklassen wird mit L∞(E, E, µ) bezeichnet. Eine pas-sende Norm auf L∞(E, E, µ) ist dann definiert durch

X

∞:= inf

c > 0

|X (y)

≤c µ

−fast uberall

. (3.26)

(Die so definierte Norm X ∞ ist unempfindlich gegeuber A nderungen vonX auf µ−Nullmengen, d.h., X ∞ ist gleich f ur alle Funktionen aus derAquivalenzklasse [X ].)Bezuglich dieser Norm ist auch L∞(E, E, µ) ein Banachraum. Details findetman z.B. in Elstrodt [3], S.228ff.

Ubungen

1) Zeigen Sie, dass unter den in Aussage 3.14 formulierten Voraussetzungen

an X und Y auch folgende Ungleichung gilt: E

|X | · |Y |dµ

2≤ E

X 2dµ · E

Y 2dµ.

Page 83: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 83/156

Integration messbarer Funktionen 77

2) Beweisen Sie, dass die Erweiterung der Holderschen Ungleichung (3.23)

auf dem Fall p = 1 und q = ∞ richtig ist:

| E

XYdµ| ≤ X 1 · Y ∞ .

3) Zeigen Sie, dass f ur die Dirichletsche Funktion gilt

supy∈[0,1]

||X (y)| = 1,

aber

||X

||∞ = 0 im Sinne von (3.26).

4) Beweisen Sie, dass f ur jede reellwertige, Borel-messbare Funktion X auf einem finiten Maßraum (E, E, µ) mit ||X ||∞ < ∞ gilt

lim p→∞

||X || p = ||X ||∞.

3.7 Lebesgue- und Riemannintegrale

Es sei X eine reellwertige Funktion auf einem (endlichen) Intervall [a, b].Fur jede Zerlegung

m := a = s(m)0 < s

(m)1 < .. . < s

(m)km

= b

von [a, b] und jede Wahl von ”Zwischenpunkten” ξ (m)k ∈

s(m)k−1 s

(m)k

, k =

1, . . . , km, definieren wir die Summe

I (m; X ) :=kmk=1

X (ξ (m)k )(s

(m)k − s

(m)k−1). (3.27)

Page 84: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 84/156

78 Uwe K uchler

sa

ξ (n)

1 s(n)

1 ξ (n)

2 s(n)

2

...

b

X

Abbildung 3.1: Bestandteile der Riemannschen Summe

Definition 3.19 Man sagt, die Funktion X sei integrierbar im Riemannschen Sinne (oder einfach Riemann-integrierbar), falls f ur jede Folge (m) von Zer-

legungen von [a, b] mit |m| := maxk=1,...,km

|s(m)k − s

(m)k−1| −→

m→∞0 und jede Wahl von

Zwischenpunkten ξ (m)k , k = 1, . . . , km, die Folge (I (m; X )) gegen ein und die-

selbe Zahl konvergiert, die man als Riemannintegral von X ¨ uber das Intervall [a, b] bezeichnet:

lim|m|→0

I (m) =: R −b

a

X (s)ds.

(Bernhard Riemann, deutscher Mathematiker, 1826-1866)Ein hinreichendes Kriterium daf ur, dass eine Funktion Riemann-integrierbar

ist, liefert die folgende Aussage.

Aussage 3.20 Es sei X eine st uckweise stetige Funktion auf einem (endli-chen) Intervall [a, b], d.h. es gebe eine Folge a = t0 < t1 < . . . < tn = b von Punkten aus [a, b], so dass X auf jedem Intervall [tk−1, tk], k = 1, . . . , n , stetig und beschr ankt ist. Dann ist X Riemann-integrierbar.

Zum Beweis siehe z. B. H. Heuser, Lehrbuch der Analysis, Teil 1, TeubnerVerlag Stuttgart, Leipzig, 12. Aufl. 1998.

Page 85: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 85/156

Integration messbarer Funktionen 79

Das Riemannintegral hat eine Reihe von Eigenschaften, die Rechnungen mit

ihm erleichtern oder auch erst ermoglichen. Dazu gehoren die Aussage desFundamentalsatzes der Differential- und Integralrechnung, die Formel der par-tiellen Integration und die Substitutionsformel.

Die folgende Aussage zieht einen Vergleich zwischen den beiden Integralbegrif-fen, die wir bisher kennengelernt haben.

Aussage 3.21 Ist X eine Riemannintegriebare Funktion auf [a, b], so existiert das Lebesgueintegral bez. des Lebesguemaßes, bezeichnet durch

L−

b

a

X (s)ds,

und ist gleich dem Riemannintegral R −b

a

X (s)ds.

Beweis: Wir nehmen der Einfachheit halber an, dass X stuckweise stetig istund setzen

X m(s) :=

km

k=1

1

(s(m)k−1,s

(m)k ](s)X (ξ

(m)

k ).

Dabei sind wie oben angegeben m := a = s(m)0 < s

(m)1 < .. . < s

(m)km

= b eine

Zerlegung von [a, b] und ξ (m)k ∈

s(m)k−1 s

(m)k

, k = 1, . . . , km eine beliebige Folge

von Zwischenpunkten. Damit ist X m eine einfache Funktion, die stuckweisestetig ist.Es gilt

limm→∞

X m(s) = X (s) mit |∆m| −→m→∞

0 f ur alle s ∈ [a, b]

außer eventuell in einigen oder allen Unstetigkeitspunkten t0, t1, . . . , tn von

X .Da X beschrankt ist (d.h., |X | ≤ K f ur eine Konstante K > 0), sind auchdie X m gleichmaßig in m beschrankt (d.h., |X m| ≤ K f ur alle m und eineKonstante K > 0). Aus dem Satz uber die majorisierte Konvergenz (sieheSatz 4.6 c)) folgt

Page 86: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 86/156

80 Uwe K uchler

R −b

a

X (s)ds = limm→∞

I (m, X ) = limm→∞

L −b

a

X m(s)ds = L −b

a

X (s)ds.

Beispiel 3.22 Die sogenannte Dirichletfunktion

X (y) = 1 Q(y), y ∈ [0, 1],

wobei Q die Menge der rationalen Zahlen bezeichnet, ist Lebesgue-, aber nicht

Riemannintegrierbar.

Ubungen

1) Berechnen Sie mit Hilfe des Grenzwertes von Summen der Form (3.27)das Riemann-Integral (R)-

[0,1]

ydy.

2) Uberzeugen Sie sich davon, dass die in Beispiel 3.21 angegebene Dirich-letfunktion Lebesgue-, aber nicht Riemannintegrierbar ist.

Page 87: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 87/156

Kapitel 4

Konvergenzarten f ur Folgenmessbarer Funktionen

Es seien (E, E, µ) ein σ-finiter Maßraum und (X n, n ≥ 1) eine Folge reellwer-tiger Borel-messbarer Funktionen auf E .

Es gibt mehrere Moglichkeiten, eine Konvergenz der Folge (X n) gegen eineFunktion X auf E zu definieren. Diese Konvergenzarten stehen auf unter-schiedliche Weisen in Beziehung, keineswegs folgt aber aus der Konvergenzin der einen Art immer die in einer anderen Art. In Wahrscheinlichkeitstheo-rie und Statistik ist es zum Beispiel so, daß fundamentale Grenzwertsatze wie

Gesetze der großen Zahlen und Zentrale Grenzwertsatze in verschiedenen Kon-vergenzarten formuliert werden und unter unterschiedlichen Voraussetzungengultig sind.

Eine erste und naheliegende Moglichkeit der Definition der Konvergenz vonFunktionenfolgen ist die punktweise Konvergenz .

Definition 4.1 Man sagt, eine Folge (X n) reellwertiger Funktionen X n auf E konvergiere punktweise gegen eine Funktion X auf E , falls f ur jedes y aus E die Zahlenfolge (X n(y)) gegen die Zahl X (y) konvergiert:

limn→∞X n(y) = X (y), y ∈ E.

Die ”Grenz”-funktion X ist eindeutig bestimmt. Gilt namlich

limn→∞

X n(y) = X (y), y ∈ E,

81

Page 88: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 88/156

82 Uwe K uchler

so ist

X (y) = X (y), y ∈ E.

Die Funktion X ist mit X n, n ≥ 1, ebenfalls Borel-messbar (siehe Folgerung2.5c)).

4.1 Konvergenz µ-fast-uberall

Eine andere Konvergenzart ist die Konvergenz µ-fast-¨ uberall , die wir jetzt sy-stematischer untersuchen wollen.

Definition 4.2 Eine Folge (X n) reellwertiger Borel-messbarer Funktionen heißt µ-fast-¨ uberall (kurz: µ-f.¨ u.) konvergent gegen eine Borel-messbare Funktion X auf (E, E, µ), falls es eine µ-Nullmenge N aus E gibt, mit

limn→∞

X n(y) = X (y) f ur alle y ∈ E \N.

Symbolisch: X n −→µ− f.¨ u.

X .

Einige Eigenschaften der µ-fast-uberall-Konvergenz

a) Aus limn→∞

X n = X µ

−f.u. und lim

n→∞

X n = Xµ

−f.u. folgt X = X µ

−f.u..

Aus limn→∞

X n = X µ − f.u. und X n = X n µ − f.u. f ur alle n ≥ 1 folgt

limn→∞

X

n = X µ − f.u..

b) Ist ϕ eine stetige Abbildung von R2 in R1, und gilt limn→∞

X n = X µ − f.u.

sowie limn→∞

X n = X µ − f.u., so folgt limn→∞

ϕ(X n, X n) = ϕ(X, X ) µ − f.u..

Insbesondere ist

limn→∞X n ·˜

X n = X ·˜

X µ − f.u.limn→∞

X n/X n

= X/X

auf X = 0 µ − f.u.

limn→∞

(αX n + β X n) = αX + β X µ − f.u..

Page 89: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 89/156

Konvergenzarten f ur Folgen messbarer Funktionen 83

Beispiel 4.3 Es sei (E, E, µ) = ([0, 1],B[0,1], λ), wobei λ das Lebesguemaß auf

[0, 1] bezeichne. Die Folge X n(y) = y

n

, y ∈ [0, 1], n ≥ 1, konvergiert punktweise und damit λ-f.¨ u. gegen X (y) = 1 1(y) aber λ-f.¨ u. auch gegen X (y) ≡ 0 und

gegen X (y) = 1 Q(y), y ∈ [0, 1], wobei Q die Menge der rationalen Zahlen bezeichne.

Aussage 4.4 Sind (X n, n ≥ 1) und X reellwertige, Borel-messbare Funktio-nen auf (E, E, µ), so ist die Menge B aller y ∈ E , f ur die limn→∞ X n(y) =X (y) gilt, eine Borel-messbare Menge.

Beweis: Es gilt nach Definition der Konvergenz einer Zahlenfolge, dass y genaudann zu B gehort, wenn f ur alle ε > 0 ein n0 = n0(ε) ≥ 1 existiert, so dass f uralle n

≥n0 gilt

|X n(y)

−X (y)

| ≤ε.

Somit ist y /∈ B genau dann, wenn es ein ε > 0 gibt, so dass f ur unendlichviele n die Ungleichung |X n(y) − X (y)| > ε richtig ist.Wir definieren f ur jedes ε > 0 und jedes k ≥ 1 die Menge

Aεk := y ∈ E ||X k(y) − X (y)| > ε

undAε := y ∈ E |y ∈ Aε

k f ur unendlich viele k ≥ 1 =

limsupk→∞

Aεk =

n≥1

k≥n

Aεk.

Es gelten f ur alle ε, ε

mit 0 < ε

< ε und alle k ≥ 1 die Inklusionen Aεk ⊆ A

ε

k ,folglich auch Aε ⊆ Aε.Daraus folgt

A :=ε≥0

Aε =k≥1

A1k . (4.1)

Es gilt y ∈ A genau dann, wenn ein ε > 0 existiert, so daß y ∈ Aεk f ur unendlich

viele k ≥ 1. Das heißt, A = Bc. Wegen (4.1) ist A durch abzahlbar unendlicheVereinigungen und Durchschnitte der Borel-messbaren Mengen Aε

k darstellbarund somit auch Borel-messbar, und wegen Ac = B ist auch B eine Borelmenge,was zu zeigen war.

Folgerung 4.5 Es gilt limn→∞

X n = X µ-f.¨ u. genau dann, wenn

limn→∞

µ(y ∈ E | supk≥n

|X k(y) − X (y)| > ε) = 0 f ur alle ε > 0. (4.2)

Page 90: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 90/156

84 Uwe K uchler

Beweis: Wir verwenden die Notation des Beweises der Aussage 4.4. Es gilt

X nµ−f.u.−→ X ⇔ µ(A) = 0 ⇔ µ(

k≥0

A1k ) = 0.

Da A1k mit wachsendem k monoton nichtfallend ist, gilt die letzte Gleichung

genau dann, wenn µ(A1k ) = 0 f ur alle k ≥ 1. Das ist aquivalent mit µ(Aε = 0)

f uf alle ε > 0. Nach Definition von Aε und der Stetigkeit des Maßes µ vonunten (siehe in Abschnitt 1.3 den Punkt 3a) der Unmittelbaren Folgerungen.)ist das aber genau dann der Fall, wenn

limn→∞

µ(k≥n

Aεk) = 0.

Wegen k≥n

Aεk = y ∈ E | sup

k≥n||X k(y) − X (y)| > ε

ergibt sich damit die Aussage.

4.2 Vertauschung von Grenzwertbildung und

Integration

Ein großer Vorteil in der Arbeit mit dem oben eingef uhrten Integralbegriff istdie Moglichkeit, Grenzwerte von Funktionen im Sinne der µ− f.u.-Konvergenzund Integrale uber diese Funktionen bez. des Maßes µ unter relativ allgemeinenBedingungen

”vertauschen“ zu konnen. Das ist der Inhalt dieses Abschnittes.

Satz 4.6 Es seien (X n, n ≥ 1) und X reellwertige Funktionen ¨ uber einem σ− finitem Maßraum (E, E, µ), die Borel-messbar sind.

Dann sind folgende Aussagen richtig:

a) (Theorem der monotonen Konvergenz, Satz von B. Levi)Falls alle X n nichtnegative Funktionen sind, die µ-f.¨ u. monoton nichtfal-lend gegen X konvergieren (0 ≤ X n(y) ≤ X n+1(y) ↑ X (y) f ur alle y ∈ E außerhalb einer gewissen µ-Nullmenge), so gilt:

Page 91: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 91/156

Konvergenzarten f ur Folgen messbarer Funktionen 85

limn→∞

E

X ndµ = E

Xdµ = E

limn→∞

X ndµ (4.3)

(auch falls

E

Xdµ = ∞).

( Beppo Levi, italienischer Mathematiker, 1875-1961)

b) (Lemma von Fatou)Falls es eine Funktion Y von (E,E) in (R1,B1) gibt, die Borel-messbar ist, und f ur die X n

≥Y µ-f.¨ u. sowie Y

∈L1(E, E, µ) gilt, dann haben wir

E

lim inf n→∞

X ndµ ≤ lim inf n→∞

E

X ndµ. (4.4)

Die Voraussetzung ist insbesondere erf ullt f ur nichtnegative X n.( Pierre Fatou, franz osischer Mathematiker, 1878-1929)

c) (Lebesgues’s Theorem der majorisierten Konvergenz)Wenn die Funktionen X n µ-fast ¨ uberall gegen eine Funktion X konver-gieren und |X n| ≤ Y µ-f.¨ u. f ur ein Y ∈ L1 = L1(E, E, µ) und alle n ≥ 1gilt, dann ist X n, X

∈L1 und

limn→∞

E

X ndµ =

E

limn→∞

X ndµ =

E

Xdµ. (4.5)

Beweis:

a) Wegen der Monotonie der Integrationsbildung folgt

E

X ndµ ≤ E

Xdµ

und somit, weil auf Grund der Monotonie der Folge ( E

X ndµ) ihr Grenz-

wert existiert,

limn→∞

E

X ndµ ≤ E

Xdµ.

Page 92: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 92/156

86 Uwe K uchler

Fur den Nachweis der umgekehrten Ungleichung nehmen wir an, daß Y

eine einfache Funktion mit 0 ≤ Y ≤ X sei. Fur jedes c ≥ 1 setzen wirBn = Bn(c) = cX n ≥ Y . Es gilt Bn ∈ E, Bn ⊆ Bn+1, n ≥ 1,n

Bn =

E und cX n ≥ Y · 1 Bn.Offenbar ist Y · 1 Bn ebenfalls eine einfache Funktion, außerdem gilt Y ·1 Bn

↑ Y.Nun folgt aus Definition 3.2. und der Definition von Bn

E

Y dµ = limn→∞

E

Y · 1 Bndµ ≤ c · limn→∞

E

X ndµ.

Da diese Ungleichung f ¨ur alle c

≥1 gilt, haben wir

E

Y dµ ≤ limn→∞

E

X ndµ. (4.6)

Daraus ergibt sich die Ungleichung E

Xdµ ≤ limn→∞

E

X ndµ.

Insgesamt ergibt sich damit (4.3). Die Funktion X ist namlich der Grenz-

wert einer nichtfallenden Folge (Y n) nichtnegativer, einfacher Funktionenmit Y n ≤ X , man beachte nun die Definition 3.2 f ur

Xdµ.

b) Wir konnen Y = 0 voraussetzen, anderenfalls betrachten wir X n :=X n − Y .Es sei Z n := inf

k≥nX k. Dann sind die Z n messbare Funktionen mit Z n ≤

Z n+1, n ≥ 1.Es gilt lim

n→∞Z n = supn≥1 inf k≥n X k = liminf

n→∞X n.

Wegen X k ≥ Z n f ur alle k ≥ n haben wir

E

X kdµ ≥ E

Z ndµ f ur alle

k ≥ n, und somit gilt wegen a) die Beziehung

inf k≥n

E

X k ≥ E

Z ndµ

Page 93: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 93/156

Konvergenzarten f ur Folgen messbarer Funktionen 87

f ur alle n ≥ 1.

Daraus ergibt sich

lim inf n→∞

E

X ndµ = supn≥1

inf k≥n

E

X kdµ ≥ supn≥1

E

Z ndµ = limn→∞

E

Z ndµ,

m.a.W.

liminf n→∞

E

X ndµ ≥ limn→∞

E

Z ndµ =

E

limn→∞

Z ndµ =

E

lim inf n→∞

X ndµ.

c) Es sei zunachst X n ≥ 0 und limn→∞

X n = 0 µ-f.u..

Dann folgt wegen der Voraussetzung X n ≤ Y µ-f.u. mittels b)

E

lim inf n→∞

(−X n)dµ ≤ liminf n→∞

E

(−X n)dµ

und somit

E

lim supn→∞

X ndµ

≥lim supn→∞

E

X ndµ

≥0

Also ist wegen lim sup X n = lim X n = 0µ− f.u.

0 =

E

limsupn→∞

X ndµ ≥ lim supn→∞

E

X ndµ ≥ 0,

d.h. limn→∞

E

X ndµ = 0.

Im allgemeinen Fall lim X n = X µ-f.u. setzen wir Z n := |X n − X |. Dann gilt

0 ≤ Z n ≤ 2Y ∈ L1(E, E, µ), limn→∞

Z n = 0

und

Page 94: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 94/156

88 Uwe K uchler

| E

X ndµ − E

Xdµ| ≤ E

|X n − X |dµ = E

Z ndµ. (4.7)

Es gilt |X n − X | ∈ L1, und wegen X n ∈ L1 folgt X ∈ L1. Aus (4.7) ergibt sich

dann mit Hilfe des ersten Teils limn→∞

E

X ndµ =

E

Xdµ.

Ein Beispiel f ur eine Funktionenfolge (X n), die µ−f.-u. konvergiert, und f urdie (4.5) nicht gilt, wird in den Ubungen behandelt.

4.3 Konvergenz dem Maß nach

Es seien (E, E, µ) und (X n, n ≥ 1) wie zu Beginn dieses Kapitels eingef uhrt.

Definition 4.7 Die Folge (X n) konvergiert dem Maß µ nach gegen eine Borel-messbare Funktion X auf E , falls gilt

limn→∞

µ(y ∈ E | |X n(y) − X (y)| > ε) = 0 f ur jedes ε > 0. (4.8)

Symbolisch: X nµ−→ X .

Wir halten fest, daß offenbar X nµ−→ X genau dann gilt, wenn

limn→∞

supk≥n

µ(y ∈ E | |X n(y) − X (y)| > ε) = 0 f ur jedes ε > 0. (4.9)

Aussage 4.8 Es gelten folgende Beziehungen zwischen µ-f.¨ u.-Konvergenz und Konvergenz dem Maß nach.

a) Aus limn→∞

X n = X µ − f.¨ u. folgt limn→∞

X n = X dem Maß µ nach.

b) Wenn limn→∞

X n = X dem Maß µ nach, so gibt es eine Teilfolge (nk)

nat urlicher Zahlen mit limk→∞

X nk = X µ − f.¨ u..

Page 95: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 95/156

Konvergenzarten f ur Folgen messbarer Funktionen 89

Beweis:

a) Wir haben f ur alle k ≥ n :

|X k(y) − X (y)| > ε ⊆ supk≥n

|X k(y) − X (y)| > ε.

Daraus ergibt sich

supk≥n

µ(|X k − X | > ε) ≤ µ(supk≥n

|X k − X | > ε)

Mittels Folgerung 4.5. und (4.9) ergibt sich die Behauptung.

b) Da nach Voraussetzung limn→∞µ|X n − X | > 1k = 0 f ur alle k ≥ 1, so

gibt es f ur jedes k ≥ 1 ein nk ∈ N mit

µ

|X n − X | >

1

k

≤ 1

k2f ur alle n ≥ nk.

Also ist

k≥1 µ|X nk

−X

|>

1

k ≤ k≥1

1

k2

<

∞. (4.10)

An diesem Punkt verwenden wir das folgende Lemma, das auch an anderenStellen der Maßtheorie und Wahrscheinlichkeitstheorie haufig benutzt wird.

Lemma 4.9 (Borel-Cantelli)

Ist (An, n ≥ 1) eine Folge messbarer Mengen aus E mit ∞

n=1

µ(An) < ∞, so

gilt µ lim supn→∞

An = µ∞

n=1

m=n

Am = 0.

Der Beweis war Gegenstand der 3. Ubungsaufgabe aus Abschnitt 1.3.(Francesco Paolo Cantelli, italienischer Okonom und Mathematiker,1875-1966)

Page 96: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 96/156

90 Uwe K uchler

Folgerung 4.10 Die Folge (X n) konvergiert dem Maß µ nach gegen X genau

dann, wenn es zu jeder Teilfolge (X nk) eine Unterfolge (X nkl ) gibt, die µ-f.¨ u.gegen X konvergiert.

Beweis: Aus X nµ−→ X folgt X nk

µ−→ X f ur jede Teilfolge (nk) und wegen Aus-sage 4.8b) existiert eine Unterfolge (nkl) von (nk) mit lim

l→∞X nkl = X µ-f.u..

Umgekehrt, konvergiert (X n) nicht dem Maß µ nach gegen X , so gilt µ(|X nk −X | ≥ ε) > η f ur gewisse ε,η > 0 und eine unendliche Folge (nk) aus N. An-dererseits gibt es nach Voraussetzung eine Unterfolge (nkl) mit X nkl −→

µ−f.u.X ,

was zu einem Widerspruch f uhrt.

Aus Folgerung 4.10 ergibt sich nunmehr, dass die Eigenschaften a) und b) derµ-f.u.-Konvergenz auch f ur die Konvergenz dem Maß nach gelten.

Beispiel 4.11 ( ”

Folge der wandernden T urme“) (E, E, µ) = ([0, 1),B[0,1), λ)mit λ gleich dem Lebesguemaß auf [0, 1). Wir definieren:

X n,k(y) := 1 [k·2−n,(k+1)2−n)(y), k = 0, 1, . . . , 2n − 1, n ≥ 0,

Y m := Y n,k, falls m = 2n + k, m ≥ 1.

Die Folge (Y m, m ≥ 1) konvergiert dem Maß µ nach, aber nicht µ-f.¨ u. gegen

1

k

2nk+1

2n 1

y

X n,kX n,k−1 X n,k+1

Abbildung 4.1:”

Wandernde Turme“

X (y) ≡ 0.

Page 97: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 97/156

Konvergenzarten f ur Folgen messbarer Funktionen 91

Der Beweis ist als Ubungsaufgabe vorgesehen.

In der Wahrscheinlichkeitstheorie und Statistik treten µ-f.u.-Konvergenz bzw.Konvergenz dem Maß nach z.B. bei starken bzw. schwachen Gesetzen dergroßen Zahlen auf. Sie heißen dort fast sichere Konvergenz bzw. stochasti-sche Konvergenz.

4.4 Konvergenz in Verteilung

Eine vollig andere Art von Konvergenz als die bisher betrachteten ist die Kon-

vergenz in Verteilung. Man benotigt sie in der Wahrscheinlichkeitstheorie undStatistik z.B. im Rahmen von zentralen Grenzwertsatzen.Wir nehmen an, (X n, n ≥ 1) sei eine Folge von Borel-messbaren Funktionenauf einem finiten Maßraum (E, E, µ) mit Werten in R1. Ihre Verteilungsfunk-tionen F n seien gegeben durch

F n(x) := µ(X n ≤ x) = µ(y ∈ E |X n(y) ≤ x), x ∈ R1.

Definition 4.12 Die Folge (F n, n ≥ 1) (bzw. die Folge (X n, n ≥ 1)) kon-vergiert in Verteilung gegen eine Verteilungsfunktion F auf R1, (symbolisch:

F nd

−→F bzw. X n

d

−→F ), falls f ur jede Zahl x

∈R1, in der F stetig ist, gilt

limn→∞

F n(x) = F (x).

Bemerkung: Angenommen, es gibt eine reellwertige Borel-messbare FunktionX auf (E, E, µ) mit der Verteilungsfunktion F , so sagt man mitunter auch, dass

X n in Verteilung gegen X konvergiert (X nd−→ X ), falls F n

d−→ F f ur n → ∞.

Die Konvergenz in Verteilung laßt sich auf folgende Weise charakterisieren.

Aussage 4.13 Eine Folge (F n, n ≥ 1) von Verteilungsfunktionen auf R1 kon-

vergiert in Verteilung gegen eine Verteilungsfunktion F auf R1

, genau dann,wenn gilt:

limn→∞

R1

f dF n =

R1

fdF,

Page 98: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 98/156

92 Uwe K uchler

f ur jede stetige, beschr ankte Funktion f auf R1.

Zum Beweis siehe Siraev [6], Kap. III.Aus der Konvergenz dem Maß nach folgt die Konvergenz in Verteilung. Dasist der Inhalt der nachsten Aussage.

Aussage 4.14 Es sei (X n, n ≥ 1) eine Folge reellwertiger Borel-messbarer

Funktionen auf (E, E, µ) mit X nµ−→

n→∞X (Konvergenz dem Maß µ nach) f ur

eine Borel-messbare Funktion X auf (E, E, µ). Dann gilt F nd−→ F , wobei F n

bzw. F die Verteilungsfunktionen von X n bzw. X bezeichnen.

Beweis: Es sei f eine beschrankte stetige Funktion auf R1, es gelte also insbe-

sondere |f (x)| ≤ c, x ∈ R1

, f ur ein c > 0. Zu jedem ε > 0 gibt es ein N > 0,so dass µ(|X | > N ) ≤ ε4c richtig ist (wegen lim

N →∞µ(|X | > N ) = µ(

N

|X | >

N ) = µ(|X | = ∞) = 0). Auf Grund der Stetigkeit von f gibt es ein δ > 0,so dass f ur alle z, z ∈ R1 mit |z | ≤ N und |z − z | ≤ δ die Ungleichung|f (z ) − f (z )| ≤ ε

2 richtig ist. Folglich gilt (siehe Substitutionsregel, Satz 3.6))

| R1

f (x)F n(dx) − R1

f (x)F (dx)| = | E

(f (X n(y)) − f (X (y)))µ(dy)|

≤ E

|f (X n(y)) − f (X (y))|µ(dy) =

|X(y)|≤N

Xn(y)−X(y)|≤δ

|f (X n(y))−f (X (y))|µ(dy) +

|X(y)|>N

Xn(y)−X(y)|≤δ

|f (X n(y))−f (X (y))|µ(dy)

+

|X n(y)−X (y)|>δ

|f (X n(y)) − f (X (y))|µ(dy) ≤

≤ ε

2· µ(E ) +

ε

2µ(E ) + 2cµ(|X n − X | > δ ) =

εµ(E ) + 2cµ(

|X n

−X

|> δ ).

Nach Voraussetzung gilt µ(|X n − X | > δ ) −→n→∞

0, also ist

0 ≤ limn→∞

| R1

f (x)F n(dx) − R1

f (x)F (dx)| ≤ ε · µ(E )

Page 99: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 99/156

Konvergenzarten f ur Folgen messbarer Funktionen 93

f ur alle ε > 0, d. h.

limn→∞

R1

f (x)F n(dx) = R1

f (x)F (dx).

Aus der Konvergenz in Verteilung einer Folge Borel-messbarer Funktionen folgti.a. nicht ihre Konvergenz dem Maß nach. Es gilt lediglich

Aussage 4.15 Es sei ( X n, n ≥ 1) eine Folge Borel-messbarer Funktionen auf

(E, E, µ) mit X nd−→

n→∞F , wobei F eine Verteilungsfunktion auf R1 bezeichne.

Ist F ausgeartet, d.h., gilt F (x) = 0 falls x < x0 und F (x) = c > 0 falls x ≥ x0

f ur ein x0 ∈ R1

und ein c > 0, so konvergiert ( X n, n ≥ 1) dem Maß µ nach gegen die konstante Funktion X (y) ≡ x0, y ∈ E.

Der Beweis dieser Aussage ist als Ubungsaufgabe vorgesehen.

4.5 Konvergenz im L p-Sinne

Wir nehmen an, (E, E, µ) sei ein finiter Maßraum und p sei eine reelle Zahlmit p ≥ 1. Weiterhin sei (X n, n ≥ 1) eine Folge aus L p(E,E, µ) und X ∈L p(E, E, µ).

Definition 4.16 Man sagt, die Folge (X n, n ≥ 1) konvergiert im L p-Sinne gegen X , falls lim

n→∞ X n − X p= 0.

Wenn eine Folge (X n, n ≥ 1) im L p-Sinne gegen X konvergiert, so erfolgt dieKonvergenz auch dem Maß nach. Es gilt namlich

µ(y ∈ E | |X n(y) − X (y)| > ε) ≤ |X n(y) − X (y)| pdµ

ε p(4.11)

f ur p ≥ 1, siehe Folgerung 3.16a) (Markov-Ungleichung).

Fur p = ∞ ist dies ohne Weiteres klar, da µ(y ∈ E ||X n(y) − X (y)| >X n − X ∞) = 0.

Das Verhaltnis zwischen µ-fast uberall-Konvergenz und L p-Konvergenz ist et-was komplizierter. Im Allgemeinen folgt weder aus der µ-fast uberall-Konvergenz

Page 100: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 100/156

94 Uwe K uchler

die L p-Konvergenz noch umgekehrt aus der L p-Konvergenz die µ-fast uberall

Konvergenz. Fur die Klarung der gegenseitigen Beziehung f uhren wir folgendenBegriff ein.

Definition 4.17 Die Folge (X n), n ≥ 1 heißt gleichgradig integrierbar, falls gilt

limc→∞

supn≥1

|X n|≥c

|X n|dµ = 0 (4.12)

Aussage 4.18 Konvergiert die Folge (X n) µ-fast ¨ uberall gegen eine Funktion X , und ist (X n) gleichgradig integrierbar, so gilt

X n − X 1 −→n→∞

0.

Beweis: Mit (X n) ist auch die Folge (X n − X ) gleichgradig integrierbar. Alsogenugt es, die Aussage f ur X = 0 zu beweisen. Es sei c eine beliebige positiveZahl. Dann gilt

X n 1= E

|X n|dµ =

|X n|≥c

|X n|dµ +

|X n|<c

|X n|dµ ≤

supn

|X n|≥c

|X n|dµ +

|X n|<c

|X n|dµ.

Wegen |X n| −→µ−f.u.

0 und 1 |X n|<c|X n| ≤ c gilt konvergiert der zweite Summand

der rechten Seite f ur n → ∞ gegen 0 (siehe den Satz 4.6c) von der majori-sierten Konvergenz), und zwar f ur jedes c > 0. Der erste Summand ergibt f ur

c → ∞ nach Voraussetzung der gleichgradigen Integrierbarkeit der X n eben-falls Null. Somit haben wir X n 1 −→

n→∞0.

Mit Hilfe des folgenden Satzes, der eine Charakterisierung der gleichgradigenIntegrierbarkeit beinhaltet, werden wir zwei hinreichende Kriterien herleiten.

Page 101: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 101/156

Konvergenzarten f ur Folgen messbarer Funktionen 95

Aussage 4.19 Eine Folge (X n) ist genau dann gleichgradig integrierbar, wenn

a) supn

E

|X n|dµ < ∞ und

b) f ur alle ε > 0 gibt es ein δ > 0, so dass f ur alle A ∈ E gilt:

supn

A

|X n|dµ < ε, falls µ(A) < δ.

Beweis: Fur jedes n ≥ 1 jedes A ∈ E und jedes c > 0 gilt

A |

X n|dµ =

A∩|X n|≥c |X n

|dµ +

A∩|X n|<c |X n

|dµ <

|X n|≥c |X n

|dµ + c

·µ(A).

Also ist

supn

A

|X n|dµ ≤ supn

|X n|≥c

|X n|dµ + c · µ(A). (4.13)

Ist (X n) gleichgradig integrierbar, so folgt aus (4.13) die Eigenschaft a) (f urA = E ), sowie Eigenschaft b) (man wahle c so groß, dass

supn

|X n|≥c

|X n|dµ <ε

2 und setze δ =ε

2c.)

Umgekehrt, es mogen a) und b) gelten. Wir haben zu zeigen, dass (4.12) richtigist. Es sei nun ε irgendeine positive Zahl und δ gemaß b) gewahlt.Wegen a) haben wir

supn

P (|X n| ≥ c) ≤ 1

csupn

E

|X n|dµ −→c↑∞

0.

Wahlt man nun c so groß, dass supn

P (|X n| ≥ c) < δ , so gilt wegen b)

supn

|X n|≥c|X n|dµ < ε. Das bedeutet, f ur jedes ε > 0 gibt es ein c > 0, so

dass

h(c) :=

|X n|≥c

|X n|dµ < ε

Page 102: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 102/156

96 Uwe K uchler

gilt. Weil h(c) mit wachsendem c monoton f allt, gilt

limc↑∞

supn≥1

|X n|≥c

|X n|dµ < ε,

und da ε als eine bliebige positive Zahl gewahlt wurde, bedeutet das

limc↑∞

supn≥1

|X n|≥c

|X n|dµ = 0.

Wir geben nunmehr zwei einfache Kriterien an, unter denen Borel-messbareFunktionen (X n) gleichgradig integrierbar sind.

Folgerungen 4.20 a) Wenn es eine positive messbare Funktion Y ∈ L1(E, E, µ)gibt mit

|X n| ≤ Y, n ≥ 1,

so ist (X n) gleichgradig integrierbar.Unter der genannten Voraussetzung gilt

|X n|≥c

|X n|dµ ≤ |X n|≥c

Y dµ, n ≥ 1.

Außerdem ist

µ(|X n| ≥ c ≤ E |X n|c

≤ EY

calso

limc→∞

supn

µ(|X n| ≥ c) = 0,

woraus sich mittels Aussage 4.19 die Eigenschaft (4.12) ergibt.

Page 103: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 103/156

Konvergenzarten f ur Folgen messbarer Funktionen 97

y

n

1n

1

X n(y) = n1[0, 1n](y), y ∈ [0, 1)

X n+1

Abbildung 4.2: Beispiel einer Folge, die nicht durch eine Funktion Z ∈L1([0, 1), λ[0,1)) majorisiert werden kann

b) Ist eine Folge (X n) in einem L p mit p > 1 beschr ankt, d. h. gilt

supn

X n p< ∞ f ur ein p > 1,

so ist (X n) gleichgradig integrierbar.

Wir haben dann namlich |X n|≥c

|X n|dµ ≤ 1

c p−1

|X n|≥c

|X n| pdµ ≤ 1

c p−1

E

|X n| pdµ

Fur p = ∞ folgt aus supn X n ∞< ∞ bereits |X n(y)| ≤ supn X n ∞:= c < ∞µ−fast uberall. Folgerung 4.20 liefert nun die gleichgra-dige Integrierbarkeit.

Beispiele 4.21

a) Aus der µ-f.¨ u. Konvergenz folgt nicht die L p-Konvergenz:Ist (E, E, µ) = ([0, 1],B[0,1], λ) mit λ gleich dem Lebesguemaß auf [0, 1],so ist (X n) mit

Page 104: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 104/156

98 Uwe K uchler

X n(y) = 0 f ur y

∈ 1n , 1n f ur y ∈

0, 1n

, n ≥ 1

λ-fast ¨ uberall konvergent gegen X (y) ≡ 0, aber nicht gleichgradig inte-grierbar. Es gilt auch nicht lim

n→∞ X n − X p= 0 f ur irgend ein p ≥ 1.

Insbesondere ist (X n) nicht gleichgradig integrierbar.

b) Aus der L p-Konvergenz folgt nicht die µ-f.¨ u. Konvergenz: Die Folge (Y n)aus Beispiel 4.11 konvergiert im L p-Sinne ( p ∈ [1, ∞)) gegen Null, aber nicht λ-f.¨ u..

Die Konvergenzarten im Sinne des L p unterscheiden sich f ur unterschiedliches p. Es gilt allerdings

Aussage 4.22 Ist 1 ≤ p ≤ p < ∞, so folgt aus limn→∞

X n − X p= 0 die

Beziehung limn→∞

X n − X p= 0.

Beweis: Der Beweis ergibt sich unmitelbar aus der Lyapunov-Ungleichung(3.25).

Wir beweisen nun ein mitunter sehr nutzliches Kriterium f ur die L1-Konvergenz.

Aussage 4.23 Ist (X n) eine Folge nichtnegativer Borel-messbarer Funktionen auf (E, E, µ) mit

E

X ndµ < ∞, n ≥ 1, und gilt X n −→n→∞ X µ− f.¨ u. f ur

eine Borel-messbare Funktion X auf ( E, E, µ) mit

E

Xdµ < ∞, so folgt aus

limn→∞

E

X ndµ =

E

Xdµ < ∞

bereits limn→∞

X n−

X

1= 0, also X n

−→n→∞ X im L1-Sinne.

Beweis: Nach Voraussetzung gilt

E

X ndµ < ∞, n ≥ 1, und

E

Xdµ < ∞.

Folglich haben wir

Page 105: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 105/156

Konvergenzarten f ur Folgen messbarer Funktionen 99

0 ≤ E

|X − X n|dµ = E

(X − X n) 1 X ≥X ndµ + E

(X n − X )1 X<X ndµ

= 2

E

(X − X n) 1 X ≥X ndµ +

E

(X n − X )dµ.

Wegen 0 ≤ (X − X n) 1 X ≥X n ≤ X und X n −→µ−f.u.

X konnen wir Lebesgue’s

Theorem der majorisierten Konvergenz anwenden (siehe Satz 4.6 c)) und er-halten die Konvergenz des ersten Teils der rechten Seite gegen Null. Der zweiteTeil konvergiert nach Voraussetzung gegen Null.

Also gilt

limn→∞

X n − X 1= 0.

Die Raume L p(E,E, µ) als Banachraume

Eine Folge (X n) reellwertiger Borel-messbarer Funktionen auf einem σ-finitenMaßraum (E, E, µ) heißt fundamental (im Sinne der Maßkonvergenz, der µ-fastsicherer Konvergenz oder der L p-Konvergenz (1

≤p <

∞)) falls

(X n − X m) −→n,m→∞

0

im Sinne der entsprechenden Konvergenzart.

Man kann zeigen (siehe z. B. Siraev [6], § 10), dass es zu jeder fundamentalenFolge (X n) eine Funktion X gibt, f ur die

limn→∞

X n = X

im Sinne der entsprechenden Konvergenzart gilt.

Im Fall der normierten Raume (L p, · p) bezeichnet man diese Eigenschaftals Vollst andigkeit , vollstandige normierte Raume nennt man Banachr aume .

Aussage 4.24 Die R¨ aume L p(E, E, µ) mit 1 ≤ p ≤ ∞ sind Banachr aume.

Page 106: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 106/156

100 Uwe K uchler

(zum Beweis siehe z.B.ebenfalls Siraev, a.a.0.)

Ubungen

1) Weisen Sie f ur die Folge (X n) aus Beispiel 4.21a) durch explizite Rech-nung nach, dass sie die Bedingung (4.12) nicht erf ullt.

2) Beweisen Sie die Aussage 4.15.

3) Es seien (X n) und X Borel-messbare Funktionen auf einem finiten Maß-raum (E, E, µ). Die Folge (X n) sei gleichgradig integrierbar, und X sei in-tegrierbar mit endlichem Integral. Uberzeugen Sie sich davon, dass dannauch die Folge (X n

−X ) gleichgradig integrierbar ist.

Page 107: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 107/156

Kapitel 5

Produktmaße

In der Wahrscheinlichkeitstheorie spielt der Begriff der Unabhangigkeit f ur Er-eignisse bzw. Zufallsgroßen eine uberragende Rolle. Die gemeinsame Verteilungvoneinander unabhangiger Zufallsgroßen ist von spezieller Gestalt, es ist einesogenannte Produktverteilung oder, in der Sprache der Maßtheorie, ein Pro-duktmaß. In diesem Abschnitt f uhren wir Produktmaße ein und geben Satze(Satz von Fubini und Satz von Tonelli) an, mit dessen Hilfe man Integralebezuglich Produktmaßen auf einfachere Integrale zuruckf uhren kann.

5.1 Messbare Abbildungen auf Produktraum-

en

Es seien (E, E) und (F, F ) zwei messbare Raume und E × F := (x, y)|x ∈E, y ∈ F die Produktmenge aus E und F (siehe Kapitel 1) sowie E ⊗ F =σ(E× F ) die Produkt-σ-Algebra von E und F . Letzteres bedeutet, dass E⊗ F

die kleinste σ-Algebra von Teilmengen von E × F ist, die alle Mengen aus derSemialgebra

γ := E× F = B × C |B ∈ E, C ∈ F enthalt. (Vgl. Abschnitt 2.3.)

Dann heißtBeispiele 5.1

a) Ist E = Rn, F = Rm,E = Bn,F = Bm, so gilt E × F = Rn+m,E⊗ F =Bn+m.

101

Page 108: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 108/156

102 Uwe K uchler

Zum Beweis der letzten Gleichung bemerken wir, dass wegen γ k ⊆ σ(γ k) =Bk

die Inklusionen

γ n × γ m ⊆ E× F ⊆ E⊗ F

gelten, wobei γ l die Menge aller nach links halboffenen l-dimensionalenQuader bezeichnet, l = n, m (siehe Beispiele 1.2).Nun ist aber γ n × γ m = γ n+m, woraus Bn+m = σ(γ n+m) ⊆ E⊗ F folgt.

Andererseits gilt γ n × γ m = γ n+m ⊆ Bn+m und somit σ(γ n) × σ(γ m) ⊆Bn+m, also E×F ⊆ Bn+m. Nach Definition der Produkt-σ-Algebra folgtE

⊗F

⊆Bn+m.

b) Ist E = x1, . . . , xn,E = P(E ), F = y1, . . . , ym,F = P(F ), so ist E ×F = (xi, yi)|i = 1, 2, . . . , n; j = 1, 2, . . . , m und E⊗F = P(E ×F ).

Zum Beweis: Es gilt xi ∈ E und y j ∈ F f ur alle i, j. Die letzteGleichung folgt nun unmittelbar aus (xi, y j) ∈ E⊗ F f ur alle i, j.

Definition 5.2 Ist X eine reellwertige Funktion auf E × F , so heißt f ur jedes y ∈ F die Funktion

x → X (x, y), x ∈ E,der Schnitt von X am Punkt y ∈ F .Analog nennt man f ur jedes x ∈ E die Funktion

y → X (x, y), y ∈ F,

den Schnitt von X am Punkt x ∈ E .

Aussage 5.3 Es sei X eine (E ⊗ F ,B1)-messbare Abbildung von E × F in R1. Dann ist f ur jedes x ∈ E (bzw. y ∈ F ) der Schnitt y → X (x, y) (bzw.x

→X (x, y)) eine (F ,B1)-(bzw. (E,B1))-messbare Funktion von F (bzw. E )

in R1. Die Umkehrung gilt im Allgemeinen nicht.

Beweis: Wir nehmen als Erstes an, dass X von der Form X (x, y) = 1 C (x, y)f ur ein C ∈ E⊗ F ist.Nun definieren wir H := C ∈ E ⊗ F |y → 1 C (x, y) ist (F ,B1)-messbar f ur

Page 109: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 109/156

Produktmaße 103

alle x ∈ E . Die Menge H ist eine σ-Algebra von Teilmengen aus E (Beweis

als¨Ubung) und umfasst offenbar γ :=

E×F

.

Deshalb gilt E⊗ F ⊆ H , da E⊗ F nach Definition die kleinste σ-Algebra ausE × F ist, die γ umfasst. Nach Definition von H gilt aber auch H ⊆ E⊗ F .Somit ergibt sich insgesamt H = E⊗ F .Aussage 5.3 gilt also f ur alle Indikatorfunktionen 1 C , C ∈ E ⊗ F . Da Linear-kombinationen messbarer Funktionen messbar sind, gilt die Aussage auch f ureinfache Funktionen.

Wenn X eine positive (E ⊗ F ,B1)-messbare Funktion ist, so wahlen wir einemonoton wachsende Folge (X n) einfacher Funktionen aus mit 0

≤X n

↑X

(punktweise), siehe Satz 2.10.Nach dem bereits Bewiesenen ist Z n(y) = X n(x, y) f ur jedes x ∈ E eine F -messbare Funktion. Folglich gilt dasselbe f ur Z (y) := X (x, y) = lim

n→∞X n(x, y),

da der Grenzwert messbarer Funktionen messbar ist, siehe Folgerungen 2.5c).Schließlich nutzen wir bei beliebiger E⊗F -messbarer Funktion X die ZerlegungX = X + − X −, beachten, dass X + und X − positiv und E⊗ F -messbar sind,und dass die Differenz messbarer Funktionen messbar ist. (Lifting Methode)

5.2 Produktmaße

Gegeben seien zwei σ-finite Maßraume (E, E, µ) und (F, F , ν ). Wir definierendurch

κ(B × C ) := µ(B) · ν (C ), B ∈ E, C ∈ F (5.1)

eine Mengenfunktion κ auf E× F .

Aussage 5.4 κ ist eine nichtnegative σ-finite und σ-additive Mengenfunktion

auf der Semialgebra E × F und kann folglich auf eindeutige Weise zu einem σ-finiten Maß auf der Produkt-σ-Algebra E⊗F erweitert werden, das wiederum mit κ bezeichnet wird. Es wird das Produktmaß aus µ und ν genannt. Symbo-lisch: κ = µ ⊗ ν .Die Maße µ und ν nennt man die Komponenten von µ ⊗ ν .

Page 110: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 110/156

104 Uwe K uchler

Beweis: Dass κ(B × C ) ≥ 0 gilt, folgt aus µ ≥ 0 und ν ≥ 0. Da µ und ν σ-finit

sind, gibt es wachsende Folgen (Bn) bzw. (C n) ausE

bzw.F

mit n B = E bzw.

n

C n = F und µ(Bn) < ∞ bzw. ν (Bn) < ∞ f ur alle n ≥ 1. Folglich ist

κ(Bn × C n) < ∞ f ur alle n ≥ 1 undn

(Bn × C n) = E × F .

Es sei nun D ∈ E⊗F . Fur jedes x ∈ E schreiben wir D(x) = y : (x, y) ∈ D.Fur den Fall D = B × C, B ∈ E, C ∈ F , haben wir

κ(D) = µ(B) · ν (C ) =

E

ν (D(x))µ(dx), (5.2)

da D(x) = C , falls x ∈ B und = ∅, falls x /∈ B.

Es sei H := D ∈ E⊗ F |x → ν (D(x)) ist (E,B1) − messbar. Man uberzeu-ge sich davon, dass H eine σ-Algebra ist (Ubung). Außerdem gilt nach dembereits Festgestellten und der Definition von H die Beziehung E× F ⊆ H ⊆E⊗ F und somit die Gleichheit H = E⊗ F .

Also konnen wir f ur jedes D ∈ E⊗ F , da ν (D(x)) als Funktion von x positivund (E,B1)-messbar ist, definieren

κ(D) := E

ν (D(x))µ(dx). (5.3)

Die durch (5.3) gegebene Mengenfunktion κ ist offenbar nichtnegativ und ad-ditiv auf E⊗ F .

Wenn D = ∅ gilt, so ist κ(D) =

E

0 · µ(dx) = 0.

Es bleibt zu zeigen, daß κ sogar eine σ-additive Mengenfunktion ist. Wenn(Dn) eine Folge paarweise disjunkter Mengen aus E ⊗ F bildet, gilt f ur jedesx ∈ E die Gleichung

n

Dn

(x) =

n

(Dn(x))

und die Dn(x) sind paarweise disjunkt. Somit haben wir (Satz uber die mono-tone Konveregenz)

Page 111: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 111/156

Produktmaße 105

κn

Dn =

E

n

ν (Dn(x))µ(dx) = n

E

ν (Dn(x))µ(dx)

=n

κ(Dn).

Damit ist die σ-Addivititat von κ gezeigt.

Das Maß κ ist eine Fortsetzung der durch (5.1) auf E× F definierten Mengen-funktion κ auf E⊗ F und damit eindeutig (siehe Satz 1.26).

Folgerung: Zur eindeutigen Charakterisierung des Produktmaßes κ auf E⊗ F

genugt es also zu zeigen, dass κ ein Maß auf E⊗F ist, das jedem

”Rechteck “

S 1 × S 2(S 1 ∈ E, S 2 ∈ F ) den Wert µ(S 1) · ν (S 2) zuordnet.

5.3 Integrale bezuglich Produktmaßen

In diesem Punkt beweisen wir einen haufig verwendeten Satz, der u. a. die Be-rechnung von Integralen bez. Produktmaßen auf die Berechnung von Integralenbez. der Komponenten des Produktmaßes zuruckf uhrt.

Satz 5.5 (Satz von Fubini) F ur jede (E ⊗ F ,B1)-messbare Funktion X =X (x, y), x ∈ E, y ∈ F , die nichtnegativ ist oder bez. κ = µ ⊗ ν ein endliches

Integral besitzt, sind die Funktionen

x → F

X (x, y)ν (dy) und y → E

X (x, y)µ(dx) (5.4)

µ− (bzw. ν −)fast ¨ uberall endlich, (E,B1)-(bzw. (F ,B1)-)messbar, und es gilt

E ×F

X (x, y)µ ⊗ ν (dx,dy) =

E

F

X (x, y)ν (dy)

µ(dx)

= F

E

X (x, y)µ(dx)ν (dy), (5.5)

wobei die Seiten dieser Gleichungen entweder alle endlich oder alle unendlich sind.

Page 112: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 112/156

106 Uwe K uchler

(Guido Fubini, italienischer Mathematiker, 1879-1943)

Beweis: Wir haben (5.5) bereits f ur Indikatorfunktionen X (x, y) = 1 D(x, y), D ∈E⊗ F , bewiesen, siehe (5.3).Aus der Linearitat der Integralabbildungen folgt (5.5) f ur nichtnegative einfa-che Funktionen X (x, y). Ist X nichtnegativ und E⊗ F -messbar, und ist (X n)eine wachsende Folge einfacher Funktionen, die gegen X (punktweise) konver-gieren, so gilt (nach Definition des Integralbegriffes und (5.5))

E ×F

Xdµ ⊗ ν = limn→∞

E ×F

X ndµ ⊗ ν =

limn→∞

E

F

X n(x, y)ν (dy)

µ(dx). (5.6)

Die Funktionen x → F

X n(x, y)ν (dy) bilden eine mit n wachsende Folge von E-

messbaren Funktionen, die gegen

F

X (x, y)ν (dy) konvergiert. Auf der Grund-

lage des Theorems der Monotonen Konvergenz (s. Satz 4.6a)) folgt durch seinezweimalige Anwendung

limn→∞

E

F

X n(x, y)ν (dy)

µ(dx) =

E

limn→∞

F

X n(x, y)ν (dy)

µ(dx) =

E

F

limn→∞

X n(x, y)ν (dy)

µ(dx),

also mit (5.6)

E ×F

Xdµ⊗

ν = E

F

X (x, y)ν (dyµ(dx).

Aus Symmetriegrunden ergibt sich damit auch die zweite Gleichung in (5.5).

Page 113: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 113/156

Produktmaße 107

Bemerkungen 5.6

a) Aus der Existenz der iterierten Integrale auf der rechten Seite von (5.5)

folgt weder die Existenz des Integrals

E ×F

X (x, y)µ⊗ν (dx, dy) noch ihre

Gleichheit.

b) Ist dagegen X ≥ 0 und ist x → F

X (x, y)ν (dy) eine µ-fast uberall

endliche Funktion, so existiert das Integral

E ×F

X (x, y)µ⊗ ν (dx,dy) und

es gilt (5.5). (Satz von Tonelli, siehe zum Beispiel Bauer [1],§

23.)(Leonida Tonelli, italienischer Mathematiker, 1885-1946)

c) Wenn X (x, y) = H (x)G(y) f ur eine E-messbare Funktion H und eineF -messbare Funktion G, so gilt, falls H bezuglich µ und G bezuglich ν integrierbar sind und beide Integrale endlich sind,

E ×F

X (x, y)µ ⊗ ν (dx,dy) =

E

H (x)µ(dx) · E

G(y)ν (dy). (5.7)

Die Formel (5.7) ist in der Wahrscheinlichkeitstheorie und Statistik wichtig. In

der dortigen Sprache lautet sie: Sind G und H zwei (stochastisch) unabhangigeZufallsgroßen mit endlichem Erwartungswert, so gilt

E(G · H ) = EG · EH.

5.3.1 Faltung von Maßen

Sind in der Wahrscheinlickeitstheorie zwei Zufallsgroßen (= messbare Funk-tionen) unabhangig, so bedeutet das, dass ihre gemeinsame Verteilung dieProduktverteilung ihrer beiden Einzelverteilungen ist. Fur die Verteilung derSumme beider Zufallsgroßen ergibt sich eine Verteilung, die man als Faltung

beider Einzelverteilungen bezeichnet. Mit dieser Verteilung beschaftigen wiruns in diesem Punkt.

Wir nehmen im Folgenden an, dass µ und ν zwei finite Maße auf (R1,B1) sind,µ ⊗ ν bezeichne das Produktmaß auf (R2,B2).

Page 114: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 114/156

108 Uwe K uchler

Definition 5.7 Die Faltung µ ∗ ν der Maße µ und ν ist ein Maß auf B1,

definiert durch

µ ∗ ν (B) :=

R2

1 B(x + y)µ ⊗ ν (dx,dy), B ∈ B1. (5.8)

Auf Grund des Satzes von Fubini (Satz 5.5, siehe auch Bemerkung 5.6b)) istdieser Wert gleich

R1ν (y : x + y ∈ B)µ(dx) und auch gleich R1

µ(x : x + y ∈ B)ν (dy).

Fur B = (−∞, z ] ergibt sich wegen y : x + y ∈ (−∞, z ] = (−∞, z − y] f urdie Verteilungsfunktion F µ∗ν von µ ∗ ν

F µ∗ν (z ) = µ ∗ ν ((−∞, z ]) =

R1

F ν (z − x)µ(dx) =

R1

F ν (z − x)F µ(dx) =

R1

F µ(z − y)F µ(dy), z ∈ R1. (5.9)

Da F µ∗ν durch F ν und F µ ausgedruckt werden kann, nennt man F µ∗F ν auch dieFaltung von F µ und F ν und schreibt F µ ∗ F ν anstelle F µ∗ν .Offensichtlich gilt wegen des Satzes von Fubini

F µ ∗ F ν = F ν ∗ F µ, also µ ∗ ν = ν ∗ µ.

Beispiele 5.8

a) (Faltung diskreter Maße)Sind µ und ν diskrete finite Maße auf der Menge Z = 0, ±1, ±2, . . .der ganzen Zahlen mit

µ(k) =: µk, ν (k) =: ν k, k ∈ Z,

so ist µ ∗ν ebenfalls ein diskretes finites Maß auf Z , und es gilt f ur seine Einzelmaße

Page 115: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 115/156

Produktmaße 109

µ ∗ ν (k) = l∈Z

µlν k−l = l∈Z

µk−lµl (5.10)

Beweis: Es gilt µ ∗ ν (B) =k,l∈Z

1 B(k + l)µkν l, B ∈ B1, also ist µ ∗

ν (R1\Z ) = 0, d. h. µ ∗ ν ist ein diskretes Maß auf Z . Fur seine Einzel-massen (µ ∗ ν )k gilt wegen (5.8) mit B = k

(µ ∗ ν )k := (µ ∗ ν )(k) =

l,m∈Z

1 k(l + m)µl · ν m =

=l∈Z

µlν k−l =l∈Z

µk−lν l

also ist (5.10) richtig.

b) (Faltung von Dichten)Sind µ und ν finite Maße mit Dichten f (·) bzw. g(·) auf (R1,B1), so hat µ ∗ ν ebenfalls eine Dichte, wir bezeichnen sie mit h(·) oder mit f ∗ g(.),und es gilt

h(x) =

R1

f (x − y)g(y)dy =

R1

f (y)g(x − y)dy (5.11)

Beweis: Mittels der Substitutionsformel (3.15) folgt aus (5.9) und derTranslationsinvarianz des Lebesgueschen Masses

F µ∗ν (z ) = F µ

∗F ν (z ) = R1 (−∞,z−y]

f (x)dxg(y)dy =

R1

(−∞,z]

f (x − y)dx

g(y)dy.

Page 116: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 116/156

110 Uwe K uchler

Der Satz von Fubini, insbesondere der Satz von Tonelli (Bemerkung

5.6b)), liefert durch Vertauschung der Integrale

F µ ∗ F ν (z ) =

(−∞,z]

R1

f (x − y)g(y)dy

dx, z ∈ R1.

Also hat F µ ∗ F ν die Dichte

f µ∗ν (z ) :=

R1

f (z − y)g(y)dy =

R1

g(z − x)f (x)dx.

Die letzte Gleichung in (5.11) ergibt sich aus F µ ∗ F ν = F ν ∗ F µ.

Ubungen

1) Unter Verwendung der Terminologie des Abschnitts 5.2 zeige man, dassH := D ∈ E⊗ F |x → ν (D(x)) ist (E,B1) − messbareine σ-Algebra ist.

Page 117: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 117/156

Kapitel 6

Messbare Funktionen mitWerten in Rn

In diesem Kapitel werden messbare Abbildungen X von einem σ-finiten Maß-raum (E, E, µ) in den Raum (Rn,Bn) untersucht, Kriterien f ur ihre (E,Bn)-Messbarkeit angegeben und insbesondere die von ihnen auf Bn induziertenMaße µX untersucht. In der Wahrscheinlichkeitstheorie treten solche Funktio-nen als zuf allige Vektoren auf, die Maße µX sind ihre zugehorigen (mehrdi-mensionalen) Verteilungen.

6.1 Messbarkeitskriterien und induzierte

Maße

Es seien (E, E, µ) ein σ-finiter Maßraum und X := (X 1, X 2, . . . , X n)T eineAbbildung von E in Rn (jede Komponenete X k von X ist eine Abbildung vonE in R1).

Aussage 6.1 Folgende Aussagen sind miteinander ¨ aquivalent:

a) Die Abbildung X ist Borel-messbar,

b) Jede der Abbildungen X k von (E, E) in (R1,B1) ist Borel-messbar,

111

Page 118: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 118/156

112 Uwe K uchler

c) X −1((a, b]) ∈ E f ur jeden n-dimensionalen Quader

(a, b] :=n

k=1

(ak, bk], a = (a1, . . . , an)T , b = (b1, . . . , bn)T ,

ak, bk ∈ R1, ak < bk, k = 1, 2, . . . , n .

Beweis: Angenommen a) gilt. Dann ist jede Komponentenabbildung X k, k =1, 2, . . . , n eine E-messbare Abbildung, da X k = Πk X , wobei Πk die Projek-tion von X auf ihre k-te Komponente ist, siehe Abschnitt 2.3. Also gilt b).

Aus b) folgt c), da

X −1

((a, b]) =

nk=1

X −1k ((ak, bk]) ∈ E,

und jedes Intervall (ak, bk] eine Borelmenge aus B1 ist und folglich die MengeX −1((a − k, bk]) zu E gehort.

Nunmehr gelte c). Bezeichnen wir mit γ n die Menge aller Quader (a, b], so giltnach Definition σ(γ n) = Bn und somit haben wir (man beachte Aussage 1.17)X −1(Bn) = X −1(σ(γ n)) = σ(X −1(γ n)) ⊆ E, d. h. X ist E-messbar.

Gemaß Aussage 2.15 ist durch

µX (B) := µ(X −1(B)), B ∈ Bn

auf Bn ein σ-finites Maß gegeben, das das von X auf Bn induzierte Maß ge-nannt wird.Im folgenden Punkt studieren wir finite Maße auf Bn, sie spielen eine wichtigeRolle in der Wahrscheinlichkeitstheorie und Statistik, wo sie als Wahrschein-lichkeitsverteilungen zuf alliger Vektoren auftreten.

6.2 Finite Maße auf (Rn,Bn)

Es seien n ≥ 2 und ν ein finites Maß auf (Rn,Bn).

Page 119: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 119/156

Messbare Funktionen mit Werten in Rn 113

Definition 6.2 Mit der Bezeichnung x := (x1, x2, . . . , xn)T ∈ Rn und (−∞, x] :=n

k=1(−∞, xk] ist durch

F (x) = ν ((−∞, x]), x ∈ Rn,

eine Funktion F auf Rn definiert, die Verteilungsfunktion des finiten Maßes ν .

Aussage 6.3 Die Verteilungsfunktion F des Maßes ν hat folgende Eigenschaf-ten:

1. 0≤

F (x) <∞

, x = (x1, x2, . . . , xn)T

∈Rn,

f ur jedes k ∈ 1, . . . , n ist die Funktion xk → F (x1, x2, . . . , xk, . . . , xn)monoton nichtfallend,

2. limxk↓−∞

F (x1, · · · , xn) =: F (x1, . . . , xk−1, −∞, xk+1, . . . , xn) = 0

f ur jedes k = 1, · · · , n,

3. limx1,··· ,xn↑∞

F (x1, · · · , xn) =: F (∞, ∞, . . . , ∞) < ∞,

4. F ist an jeder Stelle x = (x1, x2, . . . , xn)T ∈ Rn von rechts stetig:limhi↓0

i=1,··· ,n

F (x1

+ h1,· · ·

, xn

+ hn

) = F (x1,· · ·

, xn

),

5. Mit der Definition hiF (x) := F (x1, · · · , xi−1, xi + hi, xi+1, · · · , xn) − F (x1, · · · , xn)gilt h1 ···· ·hnF (x) ≥ 0, x ∈ Rn, hi ≥ 0, i = 1, . . . , n .(Verallgemeinerung der Monotonie vom Fall n = 1 auf allgemeines n.)

Der endliche Grenzwert in Punkt 3. ist offenbar gleich ν (Rn).Der Beweis von 1.-4. erfolgt analog zum Beweis der Eigenschaften a)-c)der

Aussage 1.24. Die Aussage 6.3.5 ergibt sich wegen

h1 ···· ·hnF (x) = ν ((−∞, x]) ≥ 0

aus der Nichtnegativitat des Maßes ν .

Page 120: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 120/156

114 Uwe K uchler

Bemerkungen 6.4 F ur n = 2 lautet die Eigenschaft 6.3.5 wie folgt:

F (x1 + h1, x2 + h2) − F (x1, x2 + h2) − F (x1 + h1, x2) (6.1)

+ F (x1, x2) ≥ 0.

(Man bezeichnet diese Eigenschaft auch als ”

Rechteck-Monotonie“ der Funk-tion F .)

Definition 6.5 Jede Funktion F auf Rn mit den Eigenschaften 1.-5. aus Aus-sage 6.3 nennen wir eine Verteilungsfunktion auf Rn.

Zu jeder Verteilungsfunktion F auf Rn

in diesem Sinne definieren wir f ur allea = (a1, a2, . . . , an)T ∈ Rn und b = (b1, b2, . . . , bn)T ∈ Rn durch

ν ((a, b]) = ν nk=1

(ak, bk]

:= b1−a1b2−a2 . . . bn−anF (a) (6.2)

eine Mengenfunktion ν auf der Semialgebra S n aller n-dimensionalen Quader

(a, b] =n

k=1

(ak, bk] ⊆ Rn. Dabei definieren wir im Falle, daß gewisse ak oder bk

gleich −∞ bzw. gleich +∞ sind, den Wert ν ((a, b] als entsprechenden Grenz-wert gemaß den Eigenschaften 2. und 3. von Aussage 6.3. Das ist eine naturlicheErweiterung der Definition (6.2).

Aussage 6.6 a) Die durch (6.2) definierte Mengenfunktion ν ist auf γ n σ-additiv und l asst sich auf eine und nur eine Weise zu einem σ-additiven

finiten Maß auf Bn fortsetzen, das wir wiederum mit ν bezeichnen,

b) Das Maß ν besitzt F als Verteilungsfunktion.

Zum Beweis von Aussage 6.6, Teil a), sei auch hier auf Siraev [6] (siehe Kap.II,§3) verwiesen. Der Teil b) ergibt sich sofort aus der Definition (6.2) von ν .

Damit ist ebenso wie im Fall n = 1 eine eineindeutige Beziehung zwischen denendlichen Maßen auf Bn und den Verteilungsfunktionen auf Rn hergestellt.Die Brucke zwischen beiden Mengen bildet die Formel (6.2.Aus diesem Grund schreibt man auch haufig

Rn

XdF anstelle Rn

Xdµ, fallsF die Verteilungsfunktion des finiten Maßes µ ist.

Page 121: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 121/156

Messbare Funktionen mit Werten in Rn 115

Beispiele 6.7

a) Die Funktion F , definiert durch

F (x1, x2) = [(x1 ∧ x2) ∧ 1] ∨ 0, (x1, x2)T ∈ R2, (6.3)

ist eine Verteilungsfunktion auf R2.

Beweis: Die Eigenschaften 1.-4. aus Aussage 6.3 sind offensichtlich. ZumNachweis von 5. bemerken wir zunachst, dass f ur jedes Rechteck R :=(x1, x1 + h1]

×(x2, x2 + h2], das mit der Diagonalen D :=

(x, x) : 0 <

x ≤ 1 hochstens eine Punkt gemeinsam hat, gilt x2 ≥ x1 + h1 oderx1 ≥ x2 + h2. Daraus folgt f ur diese Rechtecke

h1 h2F (x1, x2) =

F (x1 + h1, x2 + h2) − F (x1, x2 + h2) − F (x1 + h1, x2) + F (x1, x2) = 0.

Gilt dagegen x2 < x1 + h1 und x1 < x2 + h2, so kann man das RechteckR in hochstens drei Rechtecke zerlegen, von denen eines die Form (x, x +h] × (x, x + h] f ur ein h > 0 besitzt, und die anderen mit der DiagonalenD hochstens einen Punkt gemeinsam haben. Es gilt

h hF (x, x) = (x + h − x − x + x) = h > 0

.

Mit Hilfe der Additivitat der von F auf γ 2 erzeugten Mengenfunktion ν ergibt sich die Eigenschaft 5.

b) Sind F k, k = 1, 2, . . . , n, Verteilungsfunktionen auf R1, so ist F , definiertauf Rn durch

F (x) =

nk=1

F k(xk), x = (x1, x2, . . . , xn)T ∈ Rn,

eine Verteilungsfunktion auf Rn. Der Beweis der Eigenschaften 1.-5. f urdieses F wird dem Leser als Ubung uberlassen.

Page 122: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 122/156

116 Uwe K uchler

Es seien ν ein finites Maß auf (Rn,Bn) und F seine Verteilungsfunktion.

Definition 6.8 F ur jede r-elementige Teilfolge Jr := (k1, k2, . . . , kr) von (1, 2, . . . , n) (1 ≤r ≤ n) bezeichne

Jr

den Projektionsoperator, definiert durch Jr

x := (xk1, xk2, . . . , xkr)T ∈ Rr, x = (x1, . . . , xn)T ∈ Rn.

Offenbar ist Π Jr eine (Bn,Br)-meßbare Abbildung.

Die durch

ν Jr(B) := ν −1

Jr (B), B ∈ Br

(6.4)

auf Br definierte Mengenfunktion ν Jr ist ein finites Maß und heißt das zu Jr

geh orende r-dimensionale Randmaß von ν .

Aussage 6.9 Die Verteilungsfunktion F Jr des Randmaßes ν Jr h angt mit der Verteilungsfunktion F wie folgt zusammen:

F Jr(xk1, xk2, . . . , xkr) =

F (∞, . . . , ∞, xk1 , ∞, . . . , xk2, . . . , ∞, xkr , ∞, . . . , ∞). (6.5)

Insbesondere erhalten wir f ur r = 1 und k1 = k die k-te (eindimensionale)Randverteilung von ν .Beweis:

F Jr(xk1 , xk2, . . . , xkr) = ν Jr

rl=1

(−∞, xkl]

=

ν

−1

Jr r

l=1

(−∞, xkl]= ν

n

m=1

Bm

mit

Bm = (−∞, xkl], falls m = kl f ur ein l = 1, 2, . . . , r ,

Bm = (−∞, ∞)falls m = kl f ur alle l = 1, 2, . . . , r .

Page 123: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 123/156

Messbare Funktionen mit Werten in Rn 117

Aus der Kenntnis der Randverteilungsfunktionen F Jr mit r < n kann die Ver-

teilungsfunktion F selbst i.a. nicht rekonstruiert werden.

Zum Beispiel haben die beiden unterschiedlichen Verteilungsfunktionen

F (x1, x2) = ((x1 ∧ x2) ∧ 1) ∨ 0 und

G(x1, x2) = [(x1 ∧ 1) ∨ 0] · [(x2 ∧ 1) ∨ 0], x1, x2 ∈ R1

(siehe Beispiele 6.7)die gleichen Randverteilungsfunktionen:

F (x1,∞

) = (x1

∧1)

∨0 = G(x1,

∞)

F (∞, x2) = (x2 ∧ 1) ∨ 0 = G(∞, x2).

Wir geben noch eine Definition an, die insbesondere in der Wahrscheinlich-keitshteorie eine Rolle spielt.Ist X = (X 1, X 2, . . . , X n)T eine E-meßbare Abbildung von einem normiertenMaßraum (E, E, µ) in Rn, und ist µX das von X auf Bn induzierte Maß mit derVerteilungsfunktion F X , so heißt F X auch Verteilungsfunktion der Abbildung(des

zuf alligen Vektors “) X . Dann ist F Jr die Verteilungsfunktion des Vektors

(X k1, . . . , X kr), wobei Jr = k1, k2, . . . , kr gilt. Das ergibt sich aus (6.5) und

F (∞, . . . , ∞, xk1, ∞, . . . , xk2, . . . , xkr , ∞, . . . , ∞) =

µ(X 1 < ∞, . . . , X k1 ≤ xk1, . . . , X kr ≤ xkr+1, . . . , X n < ∞) =

µ(X k1 ≤ xk1, . . . , X kn ≤ xkn).

Verteilungsdichten auf Rn

Es sei F eine Verteilungsfunktion auf Rn(n ≥ 2), siehe Definition 6.5.

Definition 6.10 Gibt es eine nichtnegative Borel-messbare Funktion f auf Rn

mit

Page 124: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 124/156

118 Uwe K uchler

1. f (x) ≥ 0, x ∈ Rn, (6.6)

2. F (x) =

xn −∞

. . .

x1 −∞

f (s1, s2, . . . , sn)ds,.. .dsn, x = (x1, . . . , xn)T , (6.7)

so heißt f eine Dichte der Verteilungsfunktion F , oder einfach eine Vertei-lungsdichte auf Rn.

Aussage 6.11 Ist ν das durch F erzeugte finite Maß (siehe (6.2)), so gilt

ν

nk=1

(xk, xk + hk]

= h1 . . . , hnF (x1, x2, . . . , xn) = (6.8)

xn+hn xn

. . .

x1+h1 x1

f (s1, . . . , sn)ds1 . . . d sn

f ur alle xk

∈R1, hk

≥0, k = 1, 2, . . . , n .

Beweis: Der Beweis folgt aus der Addivitat des Integrals.

Beispiele 6.12 (Fortsetzung der Beispiele 6.7)

Zu a) F hat keine Dichte, das Maß ν F ist auf (x, x) : 0 ≤ x ≤ 1 konzentriert.

Zu b) Haben die Verteilungsfunktionen F k die Dichten f k, k = 1, . . . , n , so be-sitzt F eine Dichte f mit

f (x1, x2, . . . , xn) =n

k=1

f k(xk), x = (x1, . . . , xn)T ∈ Rn. (6.9)

Aussage 6.13

Page 125: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 125/156

Messbare Funktionen mit Werten in Rn 119

a) F ur jede Dichte f von F gilt

F (x) =

x1 −∞

. . .

xn −∞

f (s1, . . . , sn)ds1 . . . d sn, (6.10)

x = (x1, . . . , xn)T ∈ Rn,

F (∞, ∞, . . . , ∞) =

∞ −1

. . .

∞ −∞

f (s1, . . . , sn)ds1 . . . d sn < ∞ (6.11)

b) besitzt F eine Dichte, so ist F eine stetige Funktion,

c) Besitzt F eine Dichte f , die stetig in einer Umgebung von x ∈ Rn ist,so ist F n-mal differenzierbar in diesem x = (x1, . . . , xn)T , und es gilt

∂ n

∂x1 . . . ∂ xnF (x1, . . . , xn) = f (x1, . . . , xn). (6.12)

Aussage 6.14 Besitzt F eine Dichte f , so hat auch jede Randverteilungs-

funktion F Jr mit Jr = k1, . . . , kr ⊆ 1, 2, . . . , n eine Dichte f Jr , die sich folgendermaßen berechnen l asst:

f Jr(xk1 , . . . , xkr) =

∞ −∞

. . .

∞ −∞

(n−r)−mal

f (s1, . . . , sk1−1, xk1, . . . , xkr , skr+1, . . . , sn)ds1 . . . d sn

Dabei wird uber alle Variablen sk integriert, f ur die k ∈ 1, . . . , n nicht zuder Menge Jr gehort.Beweis: Der Beweis ergibt sich aus (6.5) und der Definition 6.10 der Dichte

f durch Umordnung der Reihenfolge der entsprechenden n-fachen Integrale(Satz von Fubini).

Beispiel 6.15

Page 126: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 126/156

120 Uwe K uchler

a) Es sei

Σ :=

σ21 ρσ1σ2

ρσ1ρ2 σ22

mit σ1, σ2 > 0, ρ ∈ R1mit |ρ| < 1, µ :=

µ1

µ2

∈ R2.

Dann ist die Funktion f µ,Σ, definiert durch

f µ,Σ(x1, x2) =1

2πσ1σ2

1 − ρ2

.

exp− 1

2(1 − ρ2)

x1 − µ1

σ1

2− 2ρ(x1 − µ1)(x2 − µ2)σ1σ2

+x2 − µ2

σ2

2,

(x1, x2)T ∈ R2, die Dichte einer Wahrscheinlichkeitsverteilung auf (R2,B2),die als Normalverteilung N 2(µ, Σ) bezeichnet wird.

Die Randverteilungsdichten der Verteilung N 2(µ, Σ) sind eine N (µ1, σ21)-

bzw. eine N (µ2, σ22)-Verteilung mit den Dichten

f µi,σi

(xi) =

1

√ 2πσi

exp−1

2 xi

−µi

σi 2

, i = 1, 2.

Man beachte, dass in den Randverteilungen der Parameter ρ nicht mehrauftritt. Aus den Randverteilungen laßt sich deshalb die ursprunglicheVerteilung i. a. nicht rekonstruieren. Fur ρ = 0 ist N 2(µ, Σ) das Produkt-maß seiner beiden Randverteilungen:

f µ,Σ(x1, x2) = f µ1,σ1(x1) · f µ2,σ2(x2), x1, x2 ∈ R1.

b) Es seien µ ∈ Rn und Σ eine positiv definite symmetrische n × n-Matrix.

Dann ist die Funktion ϕµ,Σ, definiert durch

f µ,Σ(x) =1

(2π)n/2√

detΣexp

− 1

2(x − µ)T Σ−1(x − µ)

, x ∈ Rn,

Page 127: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 127/156

Messbare Funktionen mit Werten in Rn 121

die Dichte der sogenannten n-dimensionalen Normalverteilung N n(µ, Σ).

Zu jeder Teilfolge Jr von (1, 2, . . . , n) mit Jr = (k1, . . . , kr) ist die zu Jr gehorende Randverteilung ebenfalls eine Normalverteilung und zwargleich N r(Π Jrµ, ΠT

JrΣΠ Jr) wobei Π Jr die Projektionsmatrix ist, die x =

(x1, x2, . . . , xn)T auf Π Jrx = (xk1, . . . , xkr)T abbildet.

Transformationssatz f ur n-dimensionale Dichten

Aussage 6.16 Es sei X = (X 1, . . . , X n)T eine Abbildung von einem finiten Maßraum (E, E, µ) in (Rn,Bn) mit der Dichte f X . Weiterhin sei U eine offene Menge aus Rn mit µX (Rn

\U ) = 0 und h = (h1, . . . , hn)T eine eineindeutige

stetig differenzierbare Funktion von U auf eine offene Menge V ⊆ Rn, deren Jacobimatrix

ˆ Jh(x) :=

∂hi(x)

∂x j

i,j=1,...,n

nirgends auf U singul ar ist. Mit g werde die inverse Funktion h−1 bezeichnet.Dann hat die n-dimensionale Abbildung Y := h(X ) eine Dichte f Y mit

f Y (y) =

f X (g(y))| det ˆ Jg(y)| , falls y ∈ V 0, falls y ∈ Rd\V.

Bemerkung: Die soeben formulierte Aussage findet man in der Literatur inunterschiedlicher Form, je nachdem, welche Voraussetzungen man an h stellt.Siehe zum Beispiel Pfanzagl, 1991, Kap. 3.4 oder Jacod, Protter [3], Kap. 12.

Beispiel 6.17 Es seien A eine regulare n × n-Matrix und b ∈ Rn. Wir defi-nieren

h(x) = Ax + b, x ∈ Rn,

Y := h(X ).

Dann gilt g(y) = A−1(y − b), ˆ Jg(y) = A−1 und Y hat die Dichte

f Y (y) = f X (A−1(y − b))| det A−1| , y ∈ Rn.

Page 128: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 128/156

122 Uwe K uchler

Ubungen

1) Es sei X = (X 1, X 2)T eine Abbildung von einem finiten Maßraum (E, E, µ)in (R2,B2) mit der Dichte

f X (x) =1

2πexp

−1

2(x2

1 + x22)

, x = (x1, x2) ∈ R2.

Man berechne das von Y 1 := X 1X 2

induzierte Maß auf B1.Hinwweis: Wenden Sie Aussage 6.16 auf die Abbildung Y := (Y 1, Y 2) mitY 1 wie in der Aufgabe und Y 2 = X 2 an und berechnen Sie dann dasgewunschte Maß als Randmaß von Y .

2) Man berechne

R1exp(−x2

2)dx

2mit Hilfe des Satzes von Tonelli, Aus-

sage 6.16 und der Verwendung von Polarkoordinaten zur Berechnung desIntegrals uber R2.

Page 129: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 129/156

Kapitel 7

Der Satz von Radon-Nikodym

In der Wahrscheinlichkeitstheorie und der Mathematischen Statistik spielendie Begriffe der bedingten Erwartung und der Likelihoodfunktion und damitverbundene Großen eine zentrale Rolle. Ihre Existenz und ihre Eigenschaftensind eng mit dem Satz von Radon-Nikodym verbunden, den wir, zusammenmit einigen Folgerungen, in diesem Kapitel vorstellen werden.

7.1 Der Satz von Radon-Nikodym

Wir beginnen mit der Definition der Absolutstetigkeit von Maßen zueinander.

Definition 7.1 Es seien µ und ν zwei σ-finite Maße auf einem messbaren Raum (E, E). Man sagt, µ sei absolutstetig bez uglich ν , falls f ur jedes A ∈ E

mit ν (A) = 0 auch µ(A) = 0 gilt.Symbolisch schreibt man daf ur µ ν . Offenbar folgt aus µ ν und ν κauch µ κ (Transitivit at). Gilt sowohl µ ν als auch ν µ, so heißen µund ν ¨ aquivalent, in Zeichen: µ ≡ ν .

Beispiele 7.2 a) Es sei (E, E, ν ) ein σ− finiter Maßraum. Ist f eine (E,B1)-messbare reellwertige, nichtnegative Funktion auf E , so wird durch

µ(A) := A

f (y)ν (dy), A ∈ E, (7.1)

ein σ-finites Maß µ auf E definiert, das absolutstetig bez. ν ist: µ ν .Zum Nachweis, dass µ ein Maß ist, genugt es gemaß Aussage 1.20

123

Page 130: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 130/156

124 Uwe K uchler

zu zeigen, dass µ von oben stetig ist, also die Eigenschaft 3b) der unmittelbaren Folger

b) Es seien µ und ν zwei diskrete Maße auf (E, E) mit E := yn| n ≥ 1und E := P(E ). Nullmengen bez. µ (bez. ν ) sind die Teilmengen von N µ := yn ∈ E | µ(yn) = 0 (bzw. N ν := yn ∈ E | ν (yn) = 0). Es gilt µ ν genau dann, wenn N ν ⊆ N µ.In diesem Fall kann man

µ(yn)als µ(yn)

ν (yn)˙ν (yn), yn ∈ E \N ν ,

schreiben, oder in integraler Schreibweise:

µ(B) = B

µ(y)ν (y)

ν (dy), B ⊆ E.

(Hierbei wurde 00

:= 0 auf N ν gesetzt.)Das Maß µ ist also wie in (6.1) als Integral ¨ uber eine Funktion f (y) :=µ(y)ν (y)

bez. des Maßes ν darstellbar.

Die Frage, ob das bei allgemeinen Maßraumen auch so ist, beantwortet derfolgende Satz von Radon-Nikodym. Er bildet eine wichtige Grundlage f ur An-

wendungen in der Wahrscheinlichkeitstheorie und Mathematischen Statistik,da er z.B. Existenz und Eigenschaften von Likelihoodfunktionen und von be-dingten Erwartungen sichert.

Satz 7.3 (Satz von Radon-Nikodym) Es seien µ und ν zwei σ-finite Maße auf (E, E). Ist µ ν , d.h. folgt f ur alle A ∈ E mit ν (A) = 0 auch µ(A) = 0,so existiert eine nichtnegative Funktion f auf E mit folgenden Eigenschaften:

1. f ist (E,B1)-messbar,

2. µ(A) = A f (y)ν (dy) f ¨ ur alle A

∈E.

Die Funktion f ist ν -f.¨ u. eindeutig bestimmt, d. h. f ur jede (E,B1)-messbare

Funktion g mit

A

f dν =

A

gdν, ∀A ∈ E, gilt f = g ν -f.¨ u.

Page 131: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 131/156

Der Satz von Radon-Nikodym 125

(Johann Radon, osterreichischer Mathematiker, 1887-1956 Otton Martin

Nikodym, galizisch-polnischer Mathematiker, 1887-1974)Der Beweis der Existenz von f ist zu umfangreich, um ihn im Rahmen die-

ses Skriptes aufzunehmen. Siehe z.B. Elstrodt [3], Kap.VII, 2, oder Bauer[1],Kap.17.Wir beschranken uns auf den Nachweis der Eindeutigkeit: Sind f und g zweiFunktionen mit den Eigenschaften 1. und 2., so gilt

A(f − g)dν = 0 f ur alle

A aus E. Die Mengen B = f > g und C = f < g sind wegen 1. ausE, folglich gilt

B(f − g)dν = 0 und

C (f − g)dν = 0. Daraus ergibt sich

ν (B) = ν (C ) = 0, also ν (f = g) = 0.

Die Funktion f aus dem Satz von Radon-Nikodym heißt Radon-Nikodym-

Ableitung von µ nach ν und wird mit dµdν bezeichnet. Damit kann man dieEigenschaft 2 in der Aussage 4.1 schreiben als

µ(A) =

A

dν (y)ν (dy), A ∈ E. (7.2)

7.2 Eigenschaften der Radon-Nikodym-Ableitung

Es seien µ, ν und κ σ−finite Maße auf einem messbaren Raum (E, E). Dann

gelten folgende Ausagen (y ist hier stets Element aus E ):

Falls µ ν, so giltdµ

dν (y) > 0 µ − f.u., µ(y ∈ E |dµ

dν (y) = 0) = 0. (7.3)

Falls µ ν und ν κ, so haben wirdµ

dκ(y) =

dν (y) · dν

dκ(y) κ − f.u. (7.4)

Gilt ν ≡ µ, so ist dν dµ

(y) =dµ

dν (y)−1

µ − und ν − f.u. (7.5)

Beweis:

Page 132: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 132/156

126 Uwe K uchler

(7.3): µ(y ∈ E |dµdν (y) > 0) = E

dν (y)ν (dy) = µ(E ),

µ

y ∈ E |dµ

dν (y) = 0

= dµdν

=0

dν dν = 0.

(7.4): Wegen ν (A) =

A

dκ(y)κ(dy) f ur alle AausE, gilt f ur jede nichtnegative

(E,B1)−messbare Funktion g :

E

g(y)ν (dy) =

E

g(y)dν

dκ(y)κ(dy).

(Man uberlege sich die Gleichung f ur Indikatorfunktionen, f ur Linear-kombinationen von Indikatorfunktionen und approximiere die erwahnteng durch monotone Folgen solcher Linearkombinationen. Danach wendeman den Satz uber monotone Konvergenz an. (Lifting Methode!))

Speziell f ur g = dµdν

1 A gilt:

µ(A) =

A

dν (y)ν (dy) =

A

dν (y)

dκ(y)κ(dy)f ur alle A ∈ E.

Die Behauptung folgt auf Grund der κ-fast sicheren Eindeutigkeit derRadon-Nikodym-Ableitung.

(7.5): folgt aus (7.4) mit κ ≡ µ : dν dµ

· dµdν = 1 µ − und ν − f.u..

7.3 Absolutstetigkeit bei Maßen und bei Funk-

tionen

Die folgende Aussage enthalt ein Kriterium f ur die Absolutstetigkeit von Ma-ßen, das haufig eingesetzt wird.

Aussage 7.4 Es gilt folgende ¨ Aquivalenz f ur je zwei endliche Maße µ und ν auf einem messbaren Raum (E, E):

µ ν, d.h. ν (A) = 0 =⇒ µ(A) = 0 ∀A ∈ Eist ¨ aquivalent mit

∀ε > 0 : ∃δ > 0 : ∀A mit µ(A) < δ folgt µ(A) < ε.

Page 133: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 133/156

Der Satz von Radon-Nikodym 127

Beweis: Hinlanglichkeit der Bedingung: Gilt ν (A) = 0, so ist ν (A) < δ f ur alle

δ > 0, also auch µ(A) < ε f ur alle ε > 0, somit gilt µ(A) = 0.

Notwendigkeit: Angenommen, die Bedingung gilt nicht. Dann gibt es ein ε > 0und eine Folge An ∈ E mit ν (An) ≤ 2−n und µ(An) ≥ ε. Wir setzen A :=lim supn→∞ An. Dann folgt ν (A) = 0 (Lemma von Borel-Cantelli, siehe Ab-

schnitt 1.3, Ubung 3.). Andererseits ist µ(An) =

Ω

1 Andµ und

µ(A) =

Ω

lim supn→∞

1 Andµ ≥ lim supn→∞

An

dµ ≥ ε

(Fatousches Lemma, in Satz 4.6.b)) im Widerspruch zur Annahme.

Definition 7.5 Eine Verteilungsfunktion F auf R1 heißt absolutstetig auf R1, falls das von ihr erzeugte Maß µF absolutstetig bez uglich dem Lebesguemaß λauf R1 ist.

In diesem Fall gibt es auf Grund des Radon-Nikodym-Theorems eine Borel-messbare Funktion f = dµF

dλ mit

µF (A) =

A

f dλ, A ∈ B1,

insbesondere gilt

F (x) =

(−∞,x)

f (s)ds, x ∈ R1, (7.6)

d.h., die Verteilungsfunktion F hat eine Dichte f (s), s ∈ R1.

Wir erwahnen der Vollstandigkeit halber noch zwei Eigenschaften absolutste-tiger Funktionen.

a) Eine Verteilungsfunktion F ist genau dann absolutstetig, wenn f ur alleε > 0 ein δ > 0 existiert, so dass f ur jede endliche Menge [αk, β k], k =

1, 2, . . . , m paarweise disjunkter Teilintervalle mit

mk=1

(β k − αk) > δ die

Ungleichungm

k=1

F (β k) − F (αk) < ε gilt.

Page 134: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 134/156

128 Uwe K uchler

b) Ist F absolutstetig, so ist F Lebesgue-fast uberall differenzierbar, und es

gilt

dF

dx= f (x) =

dµF

dλλ − f.u.,

d. h. die Ableitung von F ist λ-f.u. gleich der Radon-Nikodym-Ableitungvon µF nach λ, somit also gleich der Dichte von F .

An dieser Stelle wird noch einmal deutlich, dass Dichten nur Lebesgue-fast-uberall eindeutig bestimmt sind.Die Cantorsche Funktion ist ein Beispiel f ur eine stetige, aber nicht absolut-

stetige Funktion, sie besitzt keine Dichte.

Eine ausf uhrlichere Darstellung von Eigenschaften reellwertiger Funktionen auf R1 findet man in der Literatur, z.B.in Natanson, I.P., Theorie der Funktionen einer reellen Ver anderlichen , Adademie-Verlag Berlin, 1961

Als Nachstes beantworten wir die Frage, wie man die Absolutstetigkeit vonMaßen µF und µG mit Dichten f bzw. g bez. dem Lebesguemaß an Hand derDichten ablesen kann.Es seien F und G zwei absolutstetige Verteilungsfunktionen auf R1 mit denDichten f bzw. g bezuglich dem Lebesguemaß λ. Es bezeichnen µF und µG die

durch F bzw. G erzeugten finiten Maße auf B1, d.h., es gilt

µF ((a, b]) = F (b) − F (a) =

(a,b]

f (s)ds und

µG((a, b]) = G(b) − G(a) =

(a,b]

g(s)ds

f ur alle a, b mit a < b. Dann haben wir die

Aussage 7.6 a) µF µG genau dann, wenn λ(g(x) = 0∩f > 0) = 0.In Worten: µF , ist absolutstetig bez. µG genau dann, wenn, bis auf Ele-mente y aus einer Lebesgue-Nullmenge, gilt:

y ∈ E |f (y) > 0 ⊆ y ∈ E |g(y) > 0,

Page 135: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 135/156

Der Satz von Radon-Nikodym 129

oder, anders ausgedr uckt, wenn, bis auf Elemente y aus einer Lebesgue-

Nullmenge, gilt, dass aus g(y) = 0 die Gleichung f (y) = 0 folgt.b) Im Fall µF µG gilt

dµF

dµG(y) =

f (y)

g(y)f ur µG − fast alle y ∈ R1. (7.7)

Beweis: Wir beginnen mit folgender Hilfsaussage.

Lemma 7.7 Es sei F eine Verteilungsfunktion auf R1 mit einer Dichte f .Mit µF werde das von F auf B1 erzeugte Maß bezeichnet. Dann gilt f ur jede Borelmenge B aus R1 die Gleichung µF (B) = 0 genau dann, wenn λ(B ∩f >

0) = 0 richtig ist.

Hier steht λ f ur das Lebesguemaß auf B1. Der Beweis des Lemmas ergibt sichsofort aus folgender Kette von Aquivalenzen:

µF (B) = 0⇐⇒ B

f (s)ds = 0⇐⇒

B∩f>0

f (s)ds = 0⇐⇒ λ(B ∩ f > 0) = 0.

Wir kommen zum Beweis der Aussage 7.6.

a) Es gelte µF µG. Wegen µG(g = 0) = g=0

gdλ = 0 haben wir

somit auch µF (g = 0) = 0.Wir benutzen das Lemma 7.7 und erhalten f ur B = g = 0 die Glei-chung

λ(g = 0 ∩ f > 0) = 0. (7.8)

Gilt dagegen (7.8) und ist µG(B) = 0, so haben wir wegen des Lemmas7.7, angewandt auf G an Stelle F , die Gleichung λ(B ∩g > 0) = 0 und

somit wegen

f > 0 ∩ B =f > 0 ∩ g > 0 ∩ B

∪f > 0 ∩ g = 0 ∩ B

auch

Page 136: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 136/156

130 Uwe K uchler

λ(f > 0 ∩ B) ≤ λ(g > 0 ∩ B) + λ(f > 0 ∩ g = 0) = 0.

Das bedeutet auf Grund des Lemmas 7.7.µF (B) = 0. Somit gilt µF µG.

b) Es sei µF µG. Dann gilt (mit 00

:= 0)

µF (B) =

B

f dλ =

B∩f>0

f dλ =

B∩f>0

f (s)

g(s)g(s)ds, (7.9)

(wegen f > 0 ⊆ g > 0λ − f.u.)

Bekanntlich gilt f ur alle nichtnegativen Borel-messbaren Funktionen h:

R

h(x)µG(dx) =

R

h(x)g(x)dx

Folglich ist

µE (B) =

B∩f>0

f (s)

g(s)µG(ds) =

Bf (s)

g(s)µG(ds),

d.h.dµE

dµG(s) =

f (s)

g(s)µG − f.s. bzw. λ − f.u. auf g > 0.

Beispiel 7.8 Es sei µ ein diskretes Maß auf (E, E) mit E = e1, e2, . . . , em, . . .und mit E = P(E ), sowie

µ(ek) =: pk ≥ 0.

Es sei weiterhin ν ein Maß auf E mit ν (

ek

) =: q k

≥0.

Dann kann man die Absolutstetigkeit an Hand der Einzelmaße pr ufen:

Aussage 7.9 Es gilt

a) µ ν ⇐⇒ ek : pk > 0 ⊆ ek : q k > 0

Page 137: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 137/156

Der Satz von Radon-Nikodym 131

b) (ek) =pk

q k f ur alle k mit q k > 0.

(F ur ek mit q k = 0 kann dµdν

(ek) beliebig, z.B. gleich Null, gew ahlt wer-

den.)

Beweis: Es gilt

µ(ek) =pk

q kq k; fallsq k > 0

Wir setzen pkqk

= 0, falls q k = 0 (und folglich auch pk = 0). Es gilt dann

µ(B) = k:ek∈B pk

q kq k = B

dν, B

⊆E.

Page 138: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 138/156

132 Uwe K uchler

Page 139: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 139/156

Kapitel 8

Bedingte Erwartungen

8.1 Definition und Beispiele

Es seien (E, E, µ) ein normierter Maßraum, Z eine nichtnegative, (E,B1)−messbareFunktion auf E und H eine σ-Algebra von Teilmengen von E mit H ⊆ E. DasIntegral

E

Zdµ sei endlich.

Satz 8.1 Es existiert eine auf E definierte, nichtnegative Funktion Y mit fol-genden Eigenschaften:

Y ist eine ( H,B1

) − messbare Funktion, (8.1)

B

Y dµ =

B

Zdµ f ur alle B ∈ H. (8.2)

Die Funktion Y ist µ| Heindeutig bestimmt, d.h., ist Z eine Funktion mit den Eigenschaften (8.1) und (8.2), so gilt Z = Y µ| H-f.¨ u.

Beweis:Durch

ν (B) := B

Zdµ,B ∈ E

ist auf E ein finites Maß ν gegeben. Die Einschrankung ν | H von ν auf H,definiert durch

ν | H(B) = ν (B) f ur alle B ∈ H,

133

Page 140: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 140/156

134 Uwe K uchler

ist ein bez. ν absolutstetiges finites Maß auf (E, H). Denn gilt f ur ein B ∈ H

die Gleichung ν (B) = 0, so folgt naturlich ν | H(B) = 0.Auf Grund des Satzes von Radon-Nikodym existiert eine ( H,B1)-messbareFunktion Y mit ν | H(B) =

B

Y dν f ur alle B ∈ H.Wir uberzeugen uns von der Eindeutigkeit. Angenommen, Y und Z sind zwei H-messbare Funktionen auf E mit der Eigenschaft (8.2):

B

Y dµ =

B

Zdµ f ur alle B ∈ H.

Wir verwenden nun folgendes Lemma, das haufig eingesetzt werden kann, unddessen Aussage wir in ahnlicher Art bereits beim Nachweis der Eindeutigkeitder Radon-Nikodym-Ableitung benutzt und bewiesen haben.

Lemma 8.2 Sind Y und Z zwei H-messbare Funktionen auf E , und gilt (8.2),so haben wir die Gleicheit Y = Z µ− f.¨ u..

Beweis des Lemmas: Wegen (8.3) und der H-Messbarkeit von Y < Z undZ < Y haben wir

Y <Z

(Z −Y )dµ = Z<Y

(Y −Z )dµ = 0, d.h. Z =Y

|Y −Z |dµ = 0, woraus sich µ(Y = Z ) = 0 ergibt. Also gilt Y = Z µ-f.u..

Definition 8.3 Die Funktion Y aus Satz 8.1 heißt bedingte Erwartung von Z bez uglich der σ-Algebra H und wird mit E (Z

| H)(y), y

∈E, oder einfach mit

E (Z | H) bezeichnet.

Ist Z eine bez uglich µ integrierbare Funktion auf E mit endlichem Integral E Zdµ, so definiert man als bedingte Erwartung von Z bez uglich der σ-Algebra H die Funktion E (Z | H) := E (Z +| H) − E (Z −| H).

Ist H gleich der trivialen σ−Algebra ∅, E , so ist E (Z | H) wegen (8.1) eine Konstante. Man schreibt in diesem Fall EZ anstelle E (Z | H) und nennt diese Zahl den Erwartungswert von Z . Es gilt wegen (8.2) die Gleichung EZ =

E Zdµ.

Beispiel 8.4 Es seien (E, E, µ) ein normierter Maßraum, K ⊆ N und Z =U k|k ∈ K eine Zerlegung von E in E-messbare Mengen U k. Mit H bezeichnen wir die kleinste σ-Algebra von Teilmengen von E , in der Z enthalten ist : H = σ(Z).

Page 141: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 141/156

Bedingte Erwartungen 135

F ur jede bez uglich µ integrierbare Funktion Z auf E mit endlichem Integral

E Zdµ, ist die bedingte Erwartung von Z bez uglich H

die Funktion

E (Z | H)(y) =k∈K

1

µ(U k)

U k

Zdµ 1 U k(y), y ∈ E. (8.3)

(Dabei wird 1µ(U k)

U k

Zdµ im Fall µ(U k) = 0 gleich Null gesetzt.)

Man beachte, dass die Summanden in (8.3) gerade die Erwartungswerte vonZ bez. der normierten Maße

µk(B) :=µ(B ∩ U k)

µ(U k)

, B

∈E,

bilden.

8.2 Eigenschaften bedingter Erwartungen

Es seien (E, E, µ) ein normierter Maßraum, Z und Y Funktionen aus L1(E,E, µ)und H eine Teil-σ−Algebra von E.

a) Ist H gleich der trivialen σ−Algebra ∅, E , so gilt

E (Z | H) ≡ E

Zdµ =: E (Z ) µ − f.u..

b) Ist H gleich der σ−Algebra E, so gilt E (Z | H) = Z µ-f.u..

c) Ist H1 eine σ−Algebra von Teilmengen von E mit H1 ⊆ H, so ist

E (E (Z | H)| H1) = E (Z | H1) µ − f.u..

d) Ist V eine H−B1-messbare Funktion mit V Z ∈ L1(E, E, µ), so gilt

E (V Z |G) = V E (Z |G) µ − f.u..

e) Sind Z i, i = 1, 2, wie in d), und gilt Z 1 ≤ Z 2 µ−f.u., so folgt

E (Z 1| H) ≤ E (Z 2| H) µ − f.u..

Page 142: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 142/156

136 Uwe K uchler

f) Sind Z 1 und Z 2 bez. µ integrierbare Funktionen mit endlichem Integral

E Z idµ,i = 1, 2, und sind a1 und a2 reelle Zahlen, so giltE (a1Z 1 + a2Z 2| H) = a1E (Z 1| H) + a2E (Z 2| H) µ − f.u..

g) Ist Z ∈ L2(E, E, µ),so gilt

E (Z − E (Z | H))2 = inf E (Z − Y )2| Y ∈ L2(E, E, µ),

d.h., E (Z | H) ist die Projektion von Z auf den Teilraum aller H−messbarenFunktionen aus L2(E, E, µ).

Beweis:Die Beweise von a) bis g) ahneln sich sehr und benutzen immer die beidenEigenschaften (8.1) und (8.2) sowie die Eindeutigkeit µ

−fast uberall der be-

dingten Erwartung. Wir beschranken uns deshalb hier exemplarisch auf denBeweis von c)Nach (8.1) sind die Funktionen E (E (Z | H)| H1) und E (Z | H1) bez. H1 messbar.Wegen (8.2) gilt f ur jedes B ∈ H1 ⊆ H B

E (E (Z | H)| H1)dµ =

B

E (Z | H)dµ =

B

E (Z | H)dµ =

B

Zdµ =

B

E (Z | H1)dµ.

Unter Verwendung von Lemma 8.2 ergibt sich die Eigenschaft c).

8.3 Bedingte Erwartungswerte

In diesem Abschnitt seien (E, E, µ) ein normierter Maßraum, Z eine Funktionaus L1(E, E, µ) und Y eine Borel-messbare Funktion von E in Rd.

Definition 8.5 Die bedingte Erwartung E (Z |σ(Y ))von Z bez uglich der von Y erzeugten σ−Algebra σ(Y ) := EY = Y −1(Bd) wird mit E (Z |Y ) bezeichnet.

Wir nennen E (Z |Y ) auch die bedingte Erwartung von Z bez uglich der messba-ren Funktion Y oder bedingte Erwartung von Z unter der Bedingung Y .

Aussage 8.6 Es existiert eine (Bd,B1)-messbare Funktion G(x), x ∈ Rd, von

Rd in R1 mit E (Z |Y )(y) = G(Y (y)), y ∈ E, µ − f.¨ u.. (8.4)

Die Funktion G ist µY − f.¨ u. eindeutig bestimmt. Das heißt, gibt es zwei solche Funktionen G und H , so gilt F = G µY − f.¨ u..

Page 143: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 143/156

Bedingte Erwartungen 137

Beweis: Nach Definition der bedingten Erwartung ist E (Z |Y ) eine (σ(Y ),B1)−

messbare Funktion. Auf Grund der¨Ubung 3. aus Abschnitt 1.4. existiert eine(Bd,B1)−messbare Funktion G von Rd in R1 mit E (Z |Y )(y) = G(Y (y)), y ∈

E.

Ist G1 eine zweite Funktion (Bd,B1)−messbare Funktion G von Rd in R1

mit E (Z |Y )(y) = G1(Y (y)), y ∈ E, so folgt, da E (Z |Y ) nur µ−f.u. eindeutigbetimmt ist, dass die Menge y ∈ E |G(Y (y) = G1(Y (y)) eine µ− Nullmen-ge ist. Daraus folgt µY (x ∈ Rd|G(x) = G1(x)) = µ(Y −1y ∈ E |G(x) =G1(x))) = µ(y ∈ E |G(Y (y) = G1(Y (y))) = 0.

Definition 8.7 Die gem aß ¨ Ubung 3. aus Abschnitt 1.4. existierende Funktion

G(x), x ∈ Rd

, heißt bedingter Erwartungswert von Z unter der Bedingung Y = x und wird mit G(x) =: E (Z |Y = x), x ∈ Rd, bezeichnet.

Wir fassen die Eigenschaften von E (Z |Y = x), x ∈ Rd, noch einmal zusam-men.E (Z |Y = .) ist eine reellwertige, (Bd,B1)-messbare Funktion auf Rd mit

a)E (Z |Y = x)|x=Y (y) = E (Z |Y )(y), f ur µ − fast alle y ∈ E,

b)

B

E (Z |Y = x)µY (dx) =

Y ∈ BE (Z |Y )(y)µ(dy) =

Y ∈ BZ (y)µ(dy) f ur alle B ∈ B1,

c) f ur jede reellwertige, (Bd,B1)-messbare Funktion G auf Rd mit den Ei-genschaften a) und b) gilt

G(x) = E (Z |Y = x) f ur µY − fast alle x ∈ Bd,

m.a.W., die Funktion E (Z

|Y = x), x

∈Rd, ist µY

−f.u. eindeutig be-

stimmt.

Beispiele 8.8 1) Es seien Z eine Funktion aus L1(E, E, µ) und Y (z ) :=k∈K xk 1 U k(z ), z ∈ E, wobei U := U k|k ∈ K mit K ⊆ N eine

Zerlegung von E mit U k ∈ E und µ(U k) > 0, k ∈ K, bildet, und die

Page 144: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 144/156

138 Uwe K uchler

xk|k ∈ K paarweise verschiedene reelle Zahlen seien.

In diesem Fall ist µ

Y

ein diskretes Maß mit den Einzelmaßen µ(U k) auf xk, und wir haben f ur den bedingten Erwartungswert von Z unter der Hypothese Y = x

E (Z |Y = xk) =1

µ(U k)

U k

Zdµ,k ∈ K, (8.5)

E (Z |Y = x) kann f ur alle anderen x ∈ Rd beliebig gew ahlt werden, wegen µY (Rd\xk|k ∈ K ) = 0.Daraus ergibt sich f ur die bedingte Erwartungedingung Y

E (Z |Y )(z ) = k∈K

1µ(U k) U k

Zdµ1 U k(z ), z ∈ E,

Als bedingte Wahrscheinlichkeitsverteilung von Z unter der Bedingung Y = yk erweist sich das normierte Maß

µZ |Y (B) :=1

µ(U k)µ(B ∩ U k), B ∈ B1.

2) Es seien (E, E, µ) ein normierter Maßraum, Z eine Funktion aus L1(E, E, µ)und Y eine Borel-messbare Funktion von E in Rd. Die (E,Bd+1)-messbare Funkiton (Z, Y ) von E in Rd+1 habe eine Dichte f (u, v), (u, v)

∈R1

×Rd.

Die Randverteilungsdichte von Y ist dann

f Y (v) =

R1

f (u, v)du,v ∈ R1.

(Siehe Aussage 6.14).)In diesem Fall bekommen wir

E (Z |Y = v) =

R1

uf (u, v)du

f Y (v), (8.6)

f ¨ ur alle v mit f

Y (v) > 0.

F ur alle anderen v kann E (Z |Y = v) beliebig gew ahlt werden, da µY (v ∈Rd|f Y (x) := µ(Y ∈ v|f Y (v) = 0) = 0 gilt.

Page 145: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 145/156

Bedingte Erwartungen 139

Der Beweis von (8.6) ergibt sich aus

B E (Z |Y = v)f Y (v)dv =

B E (Z |Y = v)µY (dv) =

Y ∈B

E (Z |Y )µ(dz ) =

Y ∈B

Zdµ = B

R1

uf (u, v)dudv.

Diese Gleichung gilt f ur alle B aus Bd, woraus sich die Gleichheit derIntegranden (siehe Lemma 8.2) ergibt:

E (Z |Y = v)f Y (v) =

R1uf (u, v)du.

Die Funktion

f Z |Y (u) :=f (u, v)

f Y (v), u ∈ R1,

nennt man bedingte Dichte der Funktion Z unter der Bedingung Y = v.

3) (Fortsetzung des Beispiels 6.15a)) Wir nehmen an, X := (X 1, X 2) sei ei-ne auf einem normierten Maßraum (E, E, µ) definierte, (E,B2)−messbare Funktion mit Werten in R2. Das induzierte Maß µY habe eine Dichte f µ,Σder Form

f µ,Σ(x1, x2) =1

2πσ1σ2

1 − ρ2

.

exp

− 1

2(1 − ρ2)

x1 − µ1

σ1

2

− 2ρ(x1 − µ1)(x2 − µ2)

σ1σ2+

x2 − µ2

σ2

2,

(x1, x2)T ∈ R2, ( Normalverteilung N 2(µ, Σ)).

Die Randverteilungsdichte der Funktion X 2 ist eine N (µ2, σ22)-Verteilung

mit der Dichte

f µ2,σ2(x2) =1√

2πσ2

exp

−1

2

x2 − µ2

σ2

2

.

Page 146: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 146/156

140 Uwe K uchler

Fr die bedingte Dichte f X 1|X 2(x1) der Funktion X 1 unter der Bedingung

X 2 = x2 ergibt sich nach einigen Umformungen

f X 1|X 2(x1) =f µ,Σ(x1, x2)

f µ2,σ2(x2)=

1√ 2πσ1

1 − ρ2

exp

− 1

2σ21(1 − ρ2)

(x1 − µ1) − ρ

σ1

σ2(x2 − µ2)

2

.

Das bedeutet, dass die bedingte Dichte der Funktion X 1 u nter der Bedin-gung X 2 = x2 eine Normalverteilungsdichte mit den Parametern (µ1 +ρσ1

σ2(x2

−µ2), σ2

1(1

−ρ2)) ist.

Ubungen

1) Durch

f (x1, x2) :=1

πr21 K r(x1, x2), x = (x1, x2) ∈ R2

ist die Dichte einer gleichmaßigen Wahrscheinlichkeitsverteilung (nor-miertes Maß) auf dem Kreis

K r :=

x = (x1, x2)

∈R2

|x21 + x2

2

≤r2

definiert.Es sei X = (X 1, X 2) eine Borel-messbare Funktion von einem finitenMaßraum auf R2, die diese Dichte besitzt. Berechnen Sie:

a) die bedingte Dichte von X 2 unter der Bedingung, dass X 1 = x1 gilt,

b) den bedingten Erwartungswert von X 2 unter der Bedingung, dassX 1 = x1 gilt,

c) die bedingte Erwartung von X 2 unter der Bedingung X 1.

Page 147: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 147/156

Kapitel 9

Likelihoodfunktionen

9.1 Deterministische Likelihoodfunktionen

Es sei (E, E,M, X ) ein statistisches Modell mit dem Stichprobenraum (F, F ).Darunter verstehen wir einen messbaren Raum (E, E), eine Familie M =(µϑ, ϑ ∈ θ) normierter Maße auf (E, E) und eine (E,F )−messbare AbbildungX von E in F . In der Terminologie der Wahrscheinlichkeitstheorie und Sta-tistik ist E die Menge aller moglichen Versuchsausgange, E die σ−Algebraaller mit dem Versuch verbundenen moglichen Ereignisse, M eine Menge vonWahrscheinlichkeitsverteilungen auf (E, E), wobei unbekannt ist, welches derµϑ in der Realitat vorliegt, und X eine Mathematische Stichprobe.In der klassischen Statistik ist X = (X 1, X 2, . . . , X n) haufig eine Folge un-abhangiger, identisch verteilter Zufallsgroßen und (F,F ) gleich (Rn,Bn). ImFall, daß man stochastische Prozesse studiert, ist der Stichprobenraum F inder Regel ein Funktionenraum, z.B. der Raum C([0, T ]) aller stetigen Funktio-nen auf dem Beobachtungsintervall [0, T ].Mit µX

ϑ bezeichnen wir das von X induzierte Maß auf (F, F ):

µX ϑ (B) := µϑ(X −1(B)), B ∈ F .

Gibt es ein σ−finites Maß µ auf E mit µϑ µ f ur alle ϑ ∈ θ, so sagt man, dasMaß µ dominiert die Familie M = (µϑ, ϑ

∈θ).

Es ist leicht zu sehen, dass dann auch das Maß µX die Familie MX := (µX ϑ , ϑ ∈

θ) dominiert.

Definition 9.1 Es seien (E, E,M, X ) ein statistisches Modell mit dem Stich-probenraum (F, F ) und µ ein die Familie M = (µϑ, ϑ ∈ θ) dominierendes Maß.

141

Page 148: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 148/156

142 Uwe K uchler

Die Radon-Nikodym-Ableitung

L(θ, x) := dµX ϑ

dµX

heißt Likelihoodfunktion der Familie MX bez uglich dem dominierenden Maß µX .

Die Likelihoodfunktion L(θ, x) ist eine reellwertige Funktion der Variablen(ϑ, x) ∈ θ × F , wobei ϑ der unbekannte Parameter ist und x f ur die (konkrete)Stichprobe steht.

Aussage 9.2 Ist µ ein dominierendes Maß f ur M, so gibt es ein zu µ ¨ aqui-

valentes Wahrscheinlichkeitsmaß µ0, das M ebenfalls dominiert.Beweis: Ist µ ein finites Maß, so normiert man es einfach durch Multiplikationmit 1

µ(E ) . Ist µ σ-finit , so gibt es eine Zerlegung von E in E−messbare Mengen

Z k, k ≥ 1, mit µ(Z k) ∈ (0, ∞). Wir setzen

µ0(A) =∞k=1

2−k µ(A ∩ Z k)

µ(Z k), A ∈ E.

Bemerkung 9.3 Wegen

dµϑ

dµ=

dµϑ

dµ0

dµ0

dµµ − fast uberall

unterscheiden sich die beiden Likelihoodfunktionen dµϑdµ

und dµϑdµ0

nur um den

von ϑ unabhangigen Faktor dµ0dµ . Wir werden deshalb im Folgenden gegebenen-

falls annehmen, dass das dominierende Maß normiert ist.

Beispiele 9.4 a) Es seien (E, E,M, X ) ein statistisches Modell mit M =(µϑ, ϑ ∈ θ) und der Stichprobenfunktion X (n) := (X 1, X 2, . . . , X n) als ei-

ne (E,Bn

)−messbare Abbildung von E in Rn

. F ur die induzierten Maße µX (n)

ϑ auf Bn gelte

µX (n)

ϑ (B1 × . . . × Bn) =n

k=1

µX k(Bk) f ur alle Bk ∈ B1, k = 1, . . . , n .

Page 149: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 149/156

Likelihoodfunktionen 143

Dieser Sachverhalt liegt in der Wahrscheinlichkeitstheorie vor f ur un-

abh angige Zufallsgr oßen X 1, . . . , X n. Ist M

dominiert durch ein sigma− finites Maß µ0, so gilt

Ln(ϑ, x) =n

k=1

dµX Xkϑ

dµX k0

(xk), x = (x1, x2, . . . , xn) ∈ Rn.

Gilt ¨ uberdies µX kϑ ≡ µX 1

ϑ , k = 1, . . . , n, so handelt es sich um unabh angige,identisch verteilte Zufallsgr oßen.Besitzen die µX k

ϑ eine Dichte f k,ϑ bez uglich des Lebesguemaßes λ auf B1,so gilt, wenn man das Lebesguemaß als dominierendes Maß verwendet,

L(θ, x) :=n

k=1

f k,ϑ(xk).

Ist

f k,ϑ(xk) =1√ 2πσ

exp

−1

2

xk − µ

σ

2

, k = 1, . . . , n ,

ist also µX kϑ eine N 1(µ, σ2)−Verteilung mit ϑ := (µ, σ2) ∈ R1× (0, ∞) =:

θ, so gilt

L(ϑ, x) = (2πσ2)−n2 exp

−1

2

nk=1

xk − µσ

2mit x = (x1, x2, . . . , n) ∈ Rn und ϑ ∈ θ.

b) Es seien ε1, ε2, . . . , εn reellwertige, unabh angige, identisch verteilte Zu- fallsgr oßen mit der Verteilungsdichte f . Wir setzen voraus, dass f ur alle x ∈ R1 gilt f (x) > 0.In der Sprache der Maßtheorie heißt das insbesondere, es gibt einen nor-mierten Maßraum (E, E, µ) und (E,B1)−messbare Funktionen ε1, ε2, . . . , εn

von E in R1

, so dass f ur ε := (ε1, ε2, . . . , εn) das induzierte Maß µε

auf (Rn,Bn) die Dichte

f (n)ε (e) =n

k=1

f (ek) mit e := (e1, e2, . . . , en) ∈ Rn

Page 150: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 150/156

144 Uwe K uchler

besitzt. Wir setzen f ur fest gew ahlte α ∈ R1 und x0 ∈ R1

X 0 := x0, X 1 := αX 0 + ε1, . . . , X n := αX n−1 + εn.

Dann hat X = (X 1, X 2, . . . , X n) die Dichte

f X (x1, x2, . . . , xn) = f (n)ε (A−1x) =

nk=1

f (xk − αxk−1).

Das Maß µX 0 dominiert die Familie (µX

α , α ∈ R1). F ur die Likelihood- funktion

L(α, x) =dµX

α

dµX 0

(x)

ergibt sich

L(α, x) =n

k=1

f (xk − αxk−1)

f (xk), x = (x1, x2, . . . , xn) ∈ Rn.

Ist f die Dichte einer N 1(µ, σ2)−Verteilung, so erhalten wir

L(α, x) =n

k=1

exp

− 1

2σ2

(xk − αxk−1)2 − x2

k

=

expα

σ2

n

k=1

xkxk−1

α2

2σ2

n

k=1

x2k−1 .

9.2 Stochastische Likelihoodfunktionen

Setzt man in die Likelihoodfunktion L(θ, x) anstelle der Variablen x die Funk-tion X (.) ein, so erhalt man, in der Sprache der Wahrscheinlichkeitstheorie,eine von ϑ abhangende Zufallsgroße L(θ, X (.)), also eine Funktion auf θ × E .Diese Funktion, wir nennen sie Stochastische Likelihoodfunktion, hat eine Rei-he bemerkenswerter Eigenschaften. Einige von ihnen wollen wir hier angeben.

Aussage 9.5 Wir setzen voraus, dass µ normiert ist. Dann gilt

L(θ, X (.)) = E dµϑ

dµ|X

(.) µ − fast ¨ uberall,

wobei die bedingte Erwartung unter Verwendung des normierten Maßes µ ge-bildet wird.

Page 151: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 151/156

Likelihoodfunktionen 145

Beweis: Es gilt (wir benutzen die Substitionsregel Satz 3.6 und die Definition

bedingter Erwartungen) X ∈B

L(θ, X (y))µ(dy) =

B

dµX ϑ

dµX (x)µX (dx) = µϑ(X ∈ B) =

X ∈B

dµϑ

dµ(y)µ(dy) =

X ∈B

E

dµϑ

dµ(y)|X

µ(dy)

f ur alle B ∈ F .Da die σ−Algebra EX nach Definition aus den Mengen X ∈ B|B ∈ F besteht, sind die Integranden auf der linken und der rechten Seite dieser Glei-chungskette µ−fast uberall gleich (siehe Lemma 8.2).

Die eben verwendete Beweismethode erlaubt eine einfache, aber weitreichen-de Verallgemeinerung. Es sei (E, E,M) ein statistischer Raum , d.h.,(E, E) istein messbarer Raum und M = (µϑ, ϑ ∈ θ) eine Familie von normierten Ma-ßen auf E. Die Familie M werden durch ein normiertes Maß µ dominiert. MitL(ϑ,E) bezeichnen wir die (E−messbare) Radon-Nikodym-Ableitung dµϑ

dµ . Ist H irgendeine Teil-σ−Algebra von E, so ist auch die Familie der Einschrankun-gen µϑ| H von µϑ auf H dominiert durch die Einschrankung (µ| H von µ auf H.

Definition 9.6 Die Radon-Nikodym-Ableitung

L(θ, H) :=

dµϑ

| H

dµ| Hheißt stochastische Likelihoodfunktion der Familie M bez uglich des dominie-renden Maßes µ und der σ−Algebra H.

Aus der Eigenschaft c) der bedingten Erwartungen ergibt sich nun folgende

Aussage 9.7 Es seien H und H zwei Teil-σ−Algebren von E mit H ⊆ H.Dann gilt

L(θ, H) = E [L(θ, H)| H] µ − fast ¨ uberall,

Beweis: Die Aussage ergibt sich aus der Definition der bedingten Erwartung,

der Gleichung H

E [L(θ, H)| H] dµ =

H

L(θ, H)dµ =

H

L(θ, H)dµ, H ∈ H

und der H−Messbarkeit beider Integranden vermittels Lemma 8.2.

Page 152: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 152/156

146 Uwe K uchler

Folgerung 9.8 Es seien (E, E,M, X ) ein statistisches Modell mit M = (µϑ, ϑ ∈

θ) und der Stichprobenfunktion X

(n)

:= (X 1, X 2, . . . , X n) als eine (E

,Bn

)−messbare Abbildung von E in Rn. Wir setzen Hn := σ(X 1, X 2, . . . , X n). Dann gilt Hn ⊆ Hn+1 und folglich

L(θ, Hn) = E [L(θ, Hn+1)| Hn] µ − fast ¨ uberall .

Die stochastische Likelihoodfunktion bildet also ein sogenanntes Martingal .Fur Martingale gibt es eine Vielzahl von Aussagen hinsichtlich ihres asym-ptotischen Verhaltens f ur n → ∞, aus denen man dann wiederum asympto-tische Aussagen f ur Maximum-Likelihood-Schatzungen ableiten kann. (Siehezum Beispiel Dacunha-Castelle,Duflo [2].)

Page 153: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 153/156

Literaturverzeichnis

[1] Bauer, H.: Maß- und Integrationstheorie, de Gruyter, 1990

[2] Dacunha-Castelle, D.,Duflo, M.: Probability and Statistics,Vol.I and

II, Springer, 1986

[3] Elstrodt, J.: Maß- und Integrationstheorie, Springer, 1999

[4] Jacod, J. und Protter, Ph.: Probability Essentials, Springer, 2000

[5] Schmidt, K.D.: Maß und Wahrscheinlichkeit, Springer, 2009

[6] Siraev, A.N.: Wahrscheinlichkeit, Verlag der Wissenschaften, Berlin,1988

Weiterf uhrende Literatur

(insbesondere Wahrscheinlichkeitstheorie und Statistik):

Dehling, H. und Haupt, B.: Einf uhrung in die Wahrscheinlichkeitstheorie undStatistik, Springer, 2004, 2.Auflage

Hess, Ch. und Meister, A.: Ubungsbuch zur angewandten Wahrscheinlichkeits-theorie (Aufgaben und Losungen) Vieweg-Verlag, 2005

Lowe, M. und Knopfel, H.: Stochastik-Struktur im Zufall, Oldenbourg Verlag,2011

Muller, P.H. (Herausgeber): Lexikon der Stochastik, Akademie Verlag Ber-lin,1991, 5.Auflage

Stahel, W.A.: Statistische Datenanalyse, Vieweg-Verlag 1999, 2.Auflage

147

Page 154: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 154/156

Index

σ-Algebra, 18Borelsche, 20Produkt-σ-Algebra, 45

Aquivalenzklasse, 71

additive Mengenfunktion, 25Algebra, 16approximierende Folge, 53

B. Levi, siehe SatzBanachraum, 94bedingter Erwartungswert, 141beschrankt in L p, 92bijektiv, 6Bildmaß, 47Borel-Cantelli, siehe Lemma

Borel-messbare Abbildung, 39Borelsche σ-Algebra, 20

Cauchy-Schwarzsche Ungleichung, sie-he Ungleichung

Chebyshev’sche Ungleichung, siehe Un-gleichung

Dichte, 61Normalverteilung, 117

Dirichletfunktion, 75

einfache Funktion, 40Elementarfunktion, siehe einfache Funk-

tionErzeuger, 19

Faltung, 103Fatou, siehe LemmaFolge, 7Fortsetzungssatz, 33Fubini, siehe SatzFundamentalfolge, 94

Gleichgradige Integrierbarkeit, 89

Holder-Ungleichung, siehe Ungleichung

Indiaktorfunktion, 22injektiv, 6Integral, 51

Lebesgue-, 60Lebesgueintegral, 53Linearitat, 52Monotonie, 52Riemann-, 74

Integrand, 53Integrationsbereich, 53, 54integrierbar, 53

gleichgradig, 89

Komplement, siehe MengeKonvergenz

µ-fast-uberall, 78dem Maße nach, 84im L p-Sinne, 89in Verteilung, 87punktweise, 77

148

Page 155: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 155/156

Likelihoodfunktionen 149

Koordinatenabbildung, siehe Projek-

tionsabbildungLebesgueintegral, siehe IntegralLebesguemaß, 35Lemma

von Borel-Cantelli, 85von Fatou, 81

Lifting Methode, 58

Maß, 26σ-endliches, 26

Bildmaß, 47diskretes, 30endliches bzw. finites, 26normiertes, 26Produkt-, 99Rand-, 112Stetigkeit, 27Subadditivitat, 27Trager, 30Wahrscheinlichkeits-, 26

Maximum, 8

Mengeabgeschlossen, 20Komplement, 5leere, 4messbare, 20Nullmenge, 29offen, 20Potenzmenge, 5Urbild, 6

Mengensystem, 5

messbare Abbildung, 39Messbarkeit

einer Menge, 20Minkowski-Ungleichung, siehe Unglei-

chung

Norm, 71

Normalverteilung, 117Nullmenge, siehe Menge

Operationstreue, 7

Potenzmenge, siehe MengeProduktmaß, siehe MaßProjektionsabbildung, 45Projektionsoperator, 112

Quader, 11

Radon-Nikodym-Ableitung, 125Randmaß, siehe MaßRaum

messbarer , 20Regel

Substitutionsregel, 57Riemannintegral, siehe IntegralRing, 17

SatzDichtentransformationssatz auf R1,

63Dichtentransformationssatz auf Rn,

117Fortsetzungssatz, 33von B. Levi (monotone Konvergenz),

80von Fubini, 101von Lebesgue (majorisierte Kon-

vergenz), 81von Tonelli, 103

Schnitt einer Funktion, 98Schranke, obere, 8Semialgebra, 15Stetigkeit eines Maßes, siehe MaßSubadditivitat eines Maßes, siehe Maß

Page 156: skript_masstheorie

7/16/2019 skript_masstheorie

http://slidepdf.com/reader/full/skriptmasstheorie 156/156

150 Uwe K uchler

Substitutionsregel, 57

Supremum, 8surjektiv, 6

Tonelli, siehe SatzTrager eines Maßes, siehe MaßTransformationssatz f ur Dichten

eindimensional, 63n-dimensional, 117

UngleichungCauchy-Schwarz, 67Chebyshev, 69Holder, 69Jensen, 67Lyapunov, 70Minkowski, 70

Urbild, siehe Menge

Verteilungsfunktionauf R1 31