+ All Categories
Home > Documents > Analysis 2 - Broecker

Analysis 2 - Broecker

Date post: 08-Aug-2015
Category:
Upload: carlos-valderrama
View: 60 times
Download: 1 times
Share this document with a friend
Description:
Libro de analisis matematico para carreras de matematicas
178
Transcript
Page 1: Analysis 2 - Broecker
Page 2: Analysis 2 - Broecker

Vorwort

In diesem Bande erklare ich die Differentialrechnung fur Abbil-dungen zwischen endlichdimensionalen reellen Vektorraumen sowiedie Grundlagen der Maß- und Integrationstheorie.

Die Differentialrechnung zeigt sich großenteils als Verbindung derAnalysis fur Funktionen einer Veranderlichen mit dem Kalkul derLinearen Algebra. Erst der Satz uber die Umkehrabbildung fuhrtzu etwas Neuem, zu einer geometrischen Sicht. Ich sage, was Unter-mannigfaltigkeiten und ihre Tangentialraume sind, und erklare damitdie Methode der Multiplikatoren zur Bestimmung kritischer Punkteauch bei nicht holonomen Nebenbedingungen. Auch der Begriff derEnveloppe wird erst in diesem Zusammenhang verstandlich.

Die Integralrechnung ist nicht so eng mit der Differentialrechnungverbunden, wie man es aus dem ersten Semester kennt. Ich erklare dieAnfangsgrunde der Maßtheorie. Der Leitgedanke zur Kennzeichnungder integrablen Funktionen ist hier, daß man einen fur die L1-Normkompletten Raum von Funktionen herstellen will. Die Konstruktionbliebe im wesentlichen wortlich dieselbe fur Funktionen mit Wertenin einem Banachraum. Am Ende kommt die Transformationsformel,und damit werden die beiden Themen des Bandes wieder zusam-mengefuhrt. Der Hauptsatz der Differential- und Integralrechnungim Hoherdimensionalen, der Satz von Stokes, wird ein Thema desdritten Bandes sein.

Am Schluß habe ich ein Kapitel angefugt, in dem ich unter ande-rem das Morselemma, den Rangsatz und den Satz von Sard vorfuhreund etwas uber konvexe Funktionen und Jensens Ungleichung sage.Das sind heute jedem Mathematiker vertraute Hilfsmittel, und siedienen auch dem Verstandnis der klassischen Satze uber die Hesse-form und uber die Umkehrabbildung.

Page 3: Analysis 2 - Broecker

ii Vorwort

In vielen Fallen ubertragen sich Satze und Beweise unmittelbarvom Ein- aufs Mehrdimensionale. Das gilt zum Beispiel fur denUmgang mit ε und δ , fur Folgen und Reihen, fur die Diskussionder verschiedenen Konvergenzbegriffe fur Folgen von Funktionen, furdie Vertauschbarkeit von Ableitungen mit Grenzwertbildung, fur denSatz von Borel uber Funktionen mit vorgeschriebener Taylorreihe,fur Dirac- und Weierstraßapproximation. Derartiges habe ich nichteigens wiederholt, um die Aufmerksamkeit nicht zu ermuden. Diesist ein Skriptum fur das zweite Semester, ein Kompendium soll esnicht werden.

Die Aufgaben, die ich am Ende gesammelt habe, will ich besondersempfehlen. Sie werden zwar im Text nicht benutzt, aber sie helfendoch, durch Beispiele, Gegenbeispiele und Anwendungen, mancheszu erhellen und zu erlautern, und sie sind vergnuglich.

Herr Martin Lercher hat die Figuren des letzten Kapitels herge-stellt, Herr Michael Prechtel hat zahlreiche Verbesserungen des Ma-nuskripts angeregt und Frau Martina Hertl hat den Drucksatz fur dieerste Auflage besorgt. Ihnen bin ich herzlich dankbar.

Fur die zweite Auflage habe ich die Schrift vergroßert und beider Gelegenheit das Manuskript etwas geputzt. Auch sind einigeHinweise im Text und in den Aufgaben hinzugekommen.

Regensburg, zu Neujahr 1994 Theodor Brocker

Page 4: Analysis 2 - Broecker

Inhaltsverzeichnis

Kapitel I: Differentialrechnung mehrerer Variablen . . . . . . 1

1. Kurven im euklidischen Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2. Differenzierbare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3. Taylorentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4. Das lokale Verhalten einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . 29

5. Vertauschbarkeit von Ableitung und Integral . . . . . . . . . . . . . . . . 35

Kapitel II: Der Satz uber die Umkehrfunktion . . . . . . . . . . 38

1. Normen und Fixpunkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

2. Der Satz uber die Umkehrabbildung . . . . . . . . . . . . . . . . . . . . . . . . 43

3. Gleichungen und Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . 49

4. Der Tangentialraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

5. Die Einhullende einer Schar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

Kapitel III: Maß und Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

1. Meßraume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

2. Maße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

3. Konstruktion des Integrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

4. Konvergenzsatze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

5. Das Integral nichtnegativer Funktionen . . . . . . . . . . . . . . . . . . . . 103

Page 5: Analysis 2 - Broecker

iv Inhaltsverzeichnis

Kapitel IV: Das euklidische Lebesgueintegral . . . . . . . . . . . 106

1. Produkte von Maßraumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

2. Die Transformationsformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

3. Nullmengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

4. Polar- und Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

Kapitel V: Allerleirauh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

1. Eine nicht meßbare Menge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

2. Der Rangsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

3. Das Morse-Lemma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

4. Der Satz von Sard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

5. Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

Kapitel I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

Kapitel II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

Kapitel III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

Kapitel IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

Kapitel V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

Symbolverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

Namen- und Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

Page 6: Analysis 2 - Broecker

Kapitel I

Differentialrechnung mehrerer Variablen

Ja, saadan var det, saadan vokser Ens Væsenmed Ens Viden, klares deri, samles igjennemden. Det er saa skjønt at lære som at leve.Vær ikke bange for at miste dig selv i størreAander end din egen.

Niels Lyhne.

Wir erklaren die grundlegenden Regeln der Differentialrechnungfur Abbildungen zwischen endlichdimensionalen reellen Vektorrau-men. Es erweist sich, daß alle eigentlich analytische Arbeit schonim Eindimensionalen getan ist. Wenn die Definition der Ableitungeinmal richtig gefaßt ist, kommt es hier vor allem darauf an, denKalkul der Linearen Algebra fur unsere Zwecke zu interpretieren undzu benutzen.

§ 1. Kurven im euklidischen Raum.

Eine Abbildung X → Y × Z in ein Produkt von topologischenRaumen ist genau dann stetig, wenn die beiden Komponenten X→ Y

und X → Z stetig sind, und ganz genau so verhalt es sich mitdifferenzierbaren Abbildungen. Daher ist noch nichts Bedenklichesgeschehen, wenn wir jetzt als ersten Blick auf das HoherdimensionaleAbbildungen D → Rn betrachten, wo D ein Intervall und eben nurder Bildraum hoherdimensional, namlich das n-fache Produkt vonR mit sich selbst ist. Mit solchen Abbildungen, die wir im stetigen

Page 7: Analysis 2 - Broecker

2 I. Differentialrechnung mehrerer Variablen

Falle Wege genannt haben und in dem hier betrachteten Zusammen-hang auch Kurven nennen, hat man es in Anwendungen oft zu tun.Etwa in der Mechanik wird einem System von n Massenpunkten eineKurve R → R6n zugeordnet, namlich jedem Zeitpunkt t ∈ R ord-net man drei Ortskoordinaten und drei Geschwindigkeitskoordinatenjedes Massenpunktes zu.

Wenn wir hernach auch zum Beispiel Abbildungen studieren, de-ren Definitionsgebiet hoherdimensional ist, so wird eine wichtige Me-thode sein, daß wir allerlei Kurven durch das Definitionsgebiet legen,und die Einschrankung der Abbildung auf diese Kurven also aufsEindimensionale betrachten.

Kommen wir nun zu genaueren und auch etwas technischen Er-klarungen. Sei also D ⊂ R ein Intervall mit mindestens zwei Punk-ten, so daß also D weder leer ist, noch zu einem Punkt degeneriert.Sei

γ : D → Rn, t 7→ γ(t) =(γ1(t), . . . , γn(t)

)

eine Abbildung. Wie gesagt, ist γ stetig, genau wenn alle Kompo-nenten γi : D → R stetig sind; eine stetige solche Abbildung heißteine Kurve in Rn oder auch ein Weg. Sie heißt stetig differen-zierbar, wenn jede Komponente γi von γ diese Eigenschaft hat. Sieheißt stuckweise stetig differenzierbar, falls es eine Zerlegung

a = t0 ≤ t1 ≤ · · · ≤ tm = b

von D ⊂ [a, b] gibt, so daß γ | [ti, ti+1] ∩D stetig differenzierbar ist.

Ganz entsprechend erklart man komponentenweise, wann die Kur-ve k-mal stetig differenzierbar (Ck), stuckweise k-mal stetig differen-zierbar oder an der Stelle τ ∈ D differenzierbar heißt. Ist letzteresder Fall, so heißt der Vektor

γ(τ) :=(d/dt γ1(τ), . . . , d/dt γn(τ)

)

der Geschwindigkeitsvektor oder die Ableitung von γ bei τ unddie reellen Vielfachen von γ(τ) heißen Tangentialvektoren von γ

Page 8: Analysis 2 - Broecker

1. Kurven im Rn 3

in τ . Die Geschwindigkeit von γ in τ ist |γ(τ)| , und wir deutengern den Parameter t als Zeit. Statt “an der Stelle” heißt es dannentsprechend “zur Zeit τ ”. Hier ist immer die euklidische Norm inRn zum Standard-Skalarprodukt gemeint. Im allgemeinen schreibenwir Geschwindigkeitsvektoren und Tangentialvektoren wie hier alsZeilentupel; nur wenn wir in Rechnungen vom Matrizenkalkul derLinearen Algebra Gebrauch machen, sind die Geschwindigkeits- undTangentialvektoren als Spalten zu notieren. Sind die Komponentenγi von γ integrabel, so setzen wir fur [a, b] ⊂ D

b∫a

γ(t) dt :=( b∫a

γ1(t), . . . ,b∫a

γn(t)) ∈ Rn.

Eine stuckweise stetig differenzierbare Kurve γ in Rn durfen wir unsdurch ihr Bild im Rn , also etwa

veranschaulichen. Wir nennen γ(a) den Anfangs- und γ(b) denEndpunkt der Kurve und sagen: Die Kurve lauft von γ(a) nachγ(b), oder sie verbindet diese Punkte miteinander, wenn D = [a, b]ist. Das Bild von γ nennt man auch die Spur, aber wir nennen esmeist einfach wieder die Kurve γ .

Beispiele.

γ(t) = p+ r (cos t, sin t), p ∈ R2, r ∈ R+, 0 ≤ t ≤ 2π,

beschreibt den Kreis um p mit Radius r . Die Tangentialvektoren desKreises (− sin t, cos t) stehen senkrecht auf dem Ortsvektor γ(t)− p .

Durch affine Verzerrung von R2 erhalt man aus dem Kreis eineEllipse, z.B. durch eine Gleichung

γ(t) = (a cos t, b sin t)

Page 9: Analysis 2 - Broecker

4 I. Differentialrechnung mehrerer Variablen

beschrieben.

Die Funktionγ(t) = p+ t · v, p, v ∈ Rn

beschreibt eine Gerade durch p mit Geschwindigkeitsvektor v .

Die Funktionγ(t) = (t2, t3)

beschreibt die Neilsche Parabel mit einer Spitze im Ursprung, woder Geschwindigkeitsvektor verschwindet. Die Funktion

γ(t) = (cos t, sin t, t)

ist eine Schraubenlinie in R3 . Ihre Projektion auf die (x, y)-Ebeneist der Kreis.

Den Geschwindigkeitsvektor γ(t) zeichnen wir gerne an den Punktγ(t), obwohl es naturlich ein Vektor in Rn ist.

Page 10: Analysis 2 - Broecker

1. Kurven im Rn 5

Wir wollen auch von der Lange einer Kurve im euklidischenRaum reden. Ist γ : [a, b] → Rn die Kurve und ware s(t) dieLange zwischen a und t , so ware ds/dt die Geschwindigkeit, alsos = ds/dt = |γ| , oder in sinnfalliger Schreibweise:

γ(t) =(x1(t), . . . , xn(t)

), und

ds

dt=

√(dx1

dt

)2+ · · ·+

(dxndt

)2, oder ds =

√dx2

1 + · · ·+ dx2n.

Wir erklaren daher:

Definition. Die Bogenlange einer stuckweise stetig differenzier-

baren Kurve γ : [a, b]→ Rn ist

s(γ) =∫ b

a

|γ(t)| dt.

Weil der Integrand stuckweise stetig ist, ist das Integral wohldefi-niert, und die Funktion

s : [a, b]→ R, t 7→t∫

a

|γ(τ)| dτ = s(γ|[a, t])

(die wir auch Bogenlange nennen) ist stetig, monoton wachsend,und wenn γ stetig differenzierbar ist, ist auch s stetig differenzierbarmit der Ableitung ds/dt =: s(t) = |γ(t)| .

Beispiel. Der Kreis mit Radius 1 ist gegeben durch γ : [0, 2π]→ R2 ,t 7→ (cos t, sin t), also

s(γ) =

2π∫

0

|(cos t, sin t).| dt =

2π∫

0

|(− sin t, cos t)| dt

=

2π∫

0

√sin2 t+ cos2 t dt =

2π∫

0

1 · dt = 2π.

Page 11: Analysis 2 - Broecker

6 I. Differentialrechnung mehrerer Variablen

Ist eine Kurve in R2 durch die x-Achse parametrisiert, also istγ(x) =

(x, f(x)

), so ist d/dx γ =

(1, f ′(x)

), also |γ| =

√1 + (f ′)2 ,

und damit

s(γ) =

b∫

a

√1 + f ′(x)2 dx.

(1.1) Satz. Die Bogenlange einer stuckweise stetig differenzierbaren

Kurve ist unabhangig von der Parametrisierung.

Das heißt genauer folgendes: Gegeben sei die Kurve γ : [a, b]→ Rn

und eine stetig differenzierbare Parametertransformation

ϕ : [α, β]→ [a, b], ϕ(α) = a, ϕ(β) = b,

so daß stets ϕ′ ≥ 0, dann haben γ und γ ◦ ϕ gleiche Bogenlange.

Beweis: Nach geeigneter Zerlegung α = τ0 ≤ τ1 ≤ · · · ≤ τn = β istγ stetig differenzierbar auf [ϕ(τi), ϕ(τi+1)] — hier wurde der Zwis-chenwertsatz auf ϕ angewandt und ϕ′ ≥ 0 benutzt. Man darf alsoannehmen, daß γ stetig differenzierbar ist, und hat dann

s(γ) =

b∫

a

|γ(t)| dt =

ϕ(β)∫

ϕ(α)

∣∣d/dt γ(ϕ(τ))∣∣ dϕ(τ) =

β∫

α

∣∣d/dt γ(ϕ(τ))∣∣ϕ′(τ) dτ =

β∫

α

|d/dτ γ ◦ ϕ(τ)| dτ = s(γ ◦ ϕ). �

Die Geschwindigkeit und der Geschwindigkeitsvektor sind natur-lich abhangig von der Parametrisierung, aber ist ϕ′(τ) 6= 0, so besagt

Page 12: Analysis 2 - Broecker

1. Kurven im Rn 7

fur ϕ(τ) = t die Gleichung

γ(t) · ϕ′(τ) =d

dτ(γ ◦ ϕ),

daß γ und γ ◦ ϕ gleiche Tangentialvektoren in t = ϕ(τ) bzw. τhaben, der Tangentialraum {λ · γ(t) | λ ∈ R} von γ zur Zeit t istunabhangig von der Parametrisierung.

Am naturlichsten ist es, eine Kurve durch ihre Bogenlange zuparametrisieren. Sei also γ : [a, b] → Rn eine stetig differenzierbareKurve, und sei stets γ 6= 0 auf [a, b] . Dann ist die Bogenlanges : [a, b] → [0, s(γ)] stetig differenzierbar mit der Ableitung |γ| > 0,also besitzt diese Transformation eine differenzierbare Umkehrungs−1 : [0, s(γ)]→ [a, b] .

� γ�∼=

�s

�γ

[0, s(γ)]

Rn[a, b]

Und wenn man γ = γ ◦ s−1 setzt, so folgt |γ| = |dγ/ds| · |ds/dt|= |dγ/ds| · |γ| , also γ hat Einheitsgeschwindigkeit, der Parameterist die Bogenlange. Diese Parametrisierung benutzt man, um dasIntegral einer Funktion auf einer Kurve zu erklaren, genauer:

Definition. Sei γ : [a, b] → X ⊂ Rn eine stuckweise stetig dif-

ferenzierbare Kurve und f : X → Rk eine Funktion, so daß f ◦ γintegrabel ist, dann ist

γ

f :=

s(γ)∫

0

f(γ(s)

)ds :=

b∫

a

f ◦ γ(t) |γ(t)| dt.

Jedes Stuckchen dt wird also beim Integrieren mit |γ(t)| gewich-tet, also soviel gezahlt, wie die Lange der Kurve zunimmt. Auchdieses Integral ist unabhangig von der Parametrisierung, und derWert ist in unserem Falle ein Punkt in Rk .

Page 13: Analysis 2 - Broecker

8 I. Differentialrechnung mehrerer Variablen

Ist namlich t = ϕ(τ), so dt = dϕ/dτ · dτ , also

∫(f ◦γ) · |γ| dt =

∫(f ◦γ ◦ϕ) · |γ ◦ϕ| · dϕdτ dτ =

∫(f ◦γ ◦ϕ) ·

∣∣dγ◦ϕdτ

∣∣ dτ.

Fur das Integral langs γ hat man folgende plausible

(1.2) Integralabschatzung. Sei γ : [a, b] → X ⊂ Rn eine stuck-

weise stetig differenzierbare Kurve und f : X → Rk eine Funktion,

so daß |f ◦ γ(t)| ≤M fur alle t ∈ [a, b] . Dann ist

∣∣∣∫

γ

f∣∣∣ ≤

γ

|f | ≤ s(γ) ·M.

Beweis: Es bezeichne 〈u, v〉 das euklidische Skalarprodukt von u

und v in Rk , dann ist fur eine Funktion ϕ : [a, b] → Rk und einenVektor v ∈ Rk offenbar

〈b∫a

ϕ(t) dt, v〉 =

b∫

a

〈ϕ(t), v〉 dt ,

wegen der Linearitat des Integrals. Setzen wir daher∫γf = v, so ist

|v|2 =∣∣∣∫

γ

f∣∣∣2

= 〈 ∫γ

f, v〉 =

b∫

a

〈f ◦ γ, v〉 |γ| dt ≤b∫

a

|f ◦ γ| · |v| · |γ| dt

= |v| ·b∫

a

|f ◦ γ| · |γ| dt = |v| ·∫

γ

|f |, also |v| ≤∫

γ

|f |.

Hier habe ich die Schwarzsche Ungleichung |〈f, v〉| ≤ |f | · |v| benutzt.Ist nun |f | ≤M , so konnen wir weiter abschatzen:

γ

|f | =b∫

a

|f ◦ γ(t)| |γ(t)| dt ≤Mb∫

a

|γ(t)| dt = M · s(γ). �

Page 14: Analysis 2 - Broecker

1. Kurven im Rn 9

(1.3) Anwendung. Ist γ : [a, b]→ Rn eine stuckweise stetig diffe-

renzierbare Kurve, so ist

s(γ) ≥ |γ(b)− γ(a)|,

das heißt, die Gerade ist die kurzeste Verbindung zweier Punkte.

Beweis: Wir wenden die Integralabschatzung an und wahlen dabeif = γ als Funktion auf der Kurve id : [a, b]→ [a, b] , dann folgt:

|γ(b)− γ(a)| =∣∣∣b∫

a

γ(t) dt∣∣∣ ≤

b∫

a

|γ(t)| dt = s(γ). �

Daß eine Kurve γ : D → Rn an der Stelle τ ∈ D differenzierbar istheißt, wenn man alle Komponenten wieder zu einem Vektor zusam-menfaßt:

γ(τ + h) = γ(τ) + h · Γ(h), Γ(0) =: γ(τ),

mit einer bei 0 stetigen Funktion Γ : D − τ → Rn . Daraus erhaltman leicht folgende

(1.4) Rechenregeln.

(i) Sind γ, ϕ : D → Rn differenzierbar an der Stelle τ ∈ D , und

ist 〈γ, ϕ〉 : D → R durch 〈γ, ϕ〉(t) = 〈γ(t), ϕ(t)〉 erklart, so ist

d/dt |t=τ〈γ(t), ϕ(t)〉 = 〈γ(τ), ϕ(τ)〉 + 〈γ(τ), ϕ(τ)〉.

(ii) Ist γ wie eben und ϕ : D → R differenzierbar bei τ , so ist dort

(ϕ · γ). = ϕγ + ϕγ.

Beweis: Wir schreiben:γ(τ + h) = γ(τ) + hΓ(h) und ϕ(τ + h) = ϕ(τ) + hΦ(h),

wie oben, und erhalten:

〈γ, ϕ〉(τ + h) = 〈γ, ϕ〉(τ) + h(〈γ(τ),Φ(h)〉+ 〈Γ(h), ϕ(τ)〉)+ h2(. . . ),

und daraus sogleich die erste Behauptung. Ebenso die zweite. �

Page 15: Analysis 2 - Broecker

10 I. Differentialrechnung mehrerer Variablen

§ 2. Differenzierbare Abbildungen

Jetzt werden wir Abbildungen Rn ⊃ U → Rp betrachten, derenDefinitionsgebiet auch hoherdimensional ist. Wir wollen uns daraufbesinnen, was lineare Abbildungen Rn → Rp sind, und wollen dieseohne weiteres mit (p×n)-Matrizen identifizieren, sodaß also der Ma-trix A = (aij) die Abbildung

A : Rn → Rp, x 7→ y, yi =∑

j

aijxj

entspricht.Um die Ableitung einer Abbildung f an der Stelle x zu erklaren,

konnte man im Eindimensionalen vom Differenzenquotienten ∆(h)ausgehen, der durch die Gleichung

f(x+ h)− f(x) = ∆(h) · heindeutig definiert ist. Ist nun aber U offen in Rn und eine Abbil-dung f : U → Rp gegeben, so ist fur h entsprechend ein Vektor ausRn zu nehmen, durch den man nicht dividieren kann. Auch ist einelineare Abbildung ∆ : Rn → Rp fur n > 1 keineswegs durch einenWert ∆ · h bestimmt. Es kommt allerdings eben auch gar nicht aufdie Eindeutigkeit des ∆(h) an, sondern nur auf die Existenz, und wiees schon im Eindimensionalen oft geschickter ist, die Definitionsglei-chung so stehen zu lassen, ohne durch h zu dividieren, so ist es hierunumganglich notwendig.

Definition (Differenzierbarkeit). Sei U offen in Rn und f: U → Rp

eine Abbildung. Sie heißt differenzierbar bei x ∈ U mit dem Dif-ferential oder der Ableitung Df(x) , wenn folgendes gilt:

Es gibt eine Abbildung

A : U → Hom(Rn, Rp) ∼= Rp·n

von U in den Raum der linearen Abbildungen Rn → Rp (also in

den Raum der reellen (p× n)-Matrizen), so daß fur alle h ∈ Rn mit

x+ h ∈ U gilt:

f(x+ h) = f(x) +A(x+ h) · h,

Page 16: Analysis 2 - Broecker

2. Differenzierbare Abbildungen 11

und zwar so, daß A am Punkt x stetig ist, mit dem Wert

A(x) =: Df(x) ∈ Hom(Rn, Rp).

Das Differential Df(x) ist also eine lineare Abbildung; in Koor-dinaten wird sie durch eine (p × n)-Matrix gegeben, die wir nochgenauer betrachten werden. Wenn wir den Matrizenkalkul der lin-earen Algebra benutzen, mussen wir die Vektoren, wie hier h ∈ Rn ,als Spalten schreiben und entsprechend auch die Komponenten vonf(x).

Die Definition zeigt unmittelbar, daß eine am Punkt x differen-zierbare Abbildung dort auch stetig ist, die rechte Seite der Formelist stetig bei h = 0. Auch ist f genau dann an der Stelle x dif-ferenzierbar, wenn alle Komponenten fj , j = 1, . . . , p von f dortdifferenzierbar sind: Die Matrix A(x+ h) ist das p-Tupel der Zeilenvon A , und A ist genau dann stetig bei x , wenn dasselbe fur jedeZeile gilt.

Oft faßt man die Definition der Differenzierbarkeit etwas anders— etwas weniger geschickt, wie mir scheint, und etwas weniger verall-gemeinerungsfahig, dafur vielleicht etwas verstandlicher — namlichwie in der folgenden

(2.1) Bemerkung. Die Abbildung f : U → Rp ist genau dann

differenzierbar bei x ∈ U , wenn es eine (feste) lineare Abbildung

A : Rn → Rp gibt, so daß

f(x+ h) = f(x) +A · h+ ϕ(h), mit limh→0

ϕ(h)/|h| = 0.

Beweis: Ist f differenzierbar bei x nach unserer Definition, so setzeA = A(x), dann ist

f(x+ h) = f(x) +A · h+(A(x+ h)−A(x)

) · h.

Setze ϕ(h) =(A(x+ h)−A(x)

) · h , dann ist

limh→0

ϕ(h)/|h| = limh→0

(A(x+ h)−A(x)

) · (h/|h|) = 0,

Page 17: Analysis 2 - Broecker

12 I. Differentialrechnung mehrerer Variablen

weil alle Komponenten der Matrix gegen 0 gehen und die von h/|h|hochstens 1 sind.

Erfullt die Funktion umgekehrt die Bedingung von (2.1), so schrei-be fur h 6= 0 nun:

f(x+ h) = f(x) +A · h+ 〈h, h〉 · |h|−2 · ϕ(h),

und erklare die lineare Abbildung A(x+ h) : Rn → Rp durch

v 7→ Av + 〈h, v〉 · |h|−2 · ϕ(h) (:= Av falls h = 0).

Dann ist offenbar f(x+h) = f(x)+A(x+h)·h , und die Stetigkeitvon A(x+ h) bei h = 0 ist zu zeigen; aber fur alle v ∈ Rn ist

limh→0〈h, v〉 · |h|−2ϕ(h) = lim

h→0〈|h|−1h, v〉 · |h|−1ϕ(h) = 0. �

Haufig fassen wir die Definition auch mit einer Formel

f(x+ h) = f(x) +A(h) · h,

dann ist A : U − x→ Hom(Rn, Rp) = Rpn stetig am Nullpunkt.

Bemerkung. Das Differential ist durch f eindeutig bestimmt.

Ist namlich

f(x+ h) = f(x) +A(h)h = f(x) +B(h)h,

so folgt(A(h) − B(h)

) · h = 0 fur alle genugend kleinen h . Istalso v irgendein Vektor in Rn , so gilt fur kleine t > 0 demnach(A(tv) − B(tv)

) · tv = 0, also(A(tv) − B(tv)

) · v = 0. Nun bildeden Limes fur t → 0, dann ergibt sich

(A(0) − B(0)

) · v = 0, alsoA(0) = B(0). �

Wie in der Dimension eins ergeben sich unmittelbar aus der Def-inition folgende

(2.2) Rechenregeln. Sind f, g : U → Rp differenzierbar bei x ∈ U⊂ Rn und λ, µ Konstanten, so ist auch λf + µg : U → Rp differen-

zierbar bei x , und es gilt:

Page 18: Analysis 2 - Broecker

2. Differenzierbare Abbildungen 13

Linearitat: D(λf + µg)(x) = λDf(x) + µDg(x) .

Seien U offen in Rn und V offen in Rm , und es seien Abbildungen

U −→fV −→

gRp, f(x) = y,

gegeben. Ist dann f differenzierbar an der Stelle x und g an der

Stelle y , so ist g ◦ f differenzierbar bei x , und es gilt die

Kettenregel: D(g ◦ f)(x) = Dg(y) ·Df(x).

Die lineare Approximation der Zusammensetzung ist die Zusammen-

setzung der linearen Approximationen.

Beweis: Beides folgt unmittelbar aus der Definition, die Ketten-regel so: Es ist

f(x+ h) = f(x) +A(h)h,

g(y + k) = g(y) +B(k)k,

A(0) = Df(x),

B(0) = Dg(y),

wobei A und B bei 0 stetig sind. Daher ist (mit y = f(x) undk = A(h) · h):

g ◦ f(x+ h) = g(f(x) +A(h)h

)= g ◦ f(x) +B

(A(h)h

) ·A(h) · h,

und limh→0B(A(h)h

)A(h) = B(0)A(0) = Dg(y) ·Df(x). �

Eine affine Abbildung

f : Rn → Rp, x 7→ Ax+ b,

hat konstantes Differential Df = A , denn

f(x+ h) = A · (x+ h) + b = f(x) +Ah.

Das Differential einer Abbildung f , als lineare Abbildung Rn → Rp ,wird auf kanonische Weise durch eine Matrix gegeben. Wie berechnetman die Komponenten dieser Matrix? Das wollen wir jetzt beschrei-ben. Wir betrachten eine offene Menge U in Rn und eine Abbildung

f : U → Rp, x 7→ (f1(x), . . . , fp(x)

)

Page 19: Analysis 2 - Broecker

14 I. Differentialrechnung mehrerer Variablen

mit den Komponenten

fi : U → R, i = 1, . . . , p.

Die j-te partielle Ableitung von f (bzw. fi ) in einem Punkteu ∈ U ist

Djf(u) := limh→0

h−1(f(u+ hej)− f(u)

)=:

∂f

∂xj(u),

beziehungsweise dasselbe fur die i-te Komponente

Djfi(u) = limh→0

h−1(fi(u+ hej)− fi(u)

)=

∂fi∂xj

(u).

Dabei ist ej der j-te Standard-Basisvektor von Rn mit j-terKomponente 1 und Null sonst.

Mit anderen Worten, Djfi erhalt man so: Man betrachtet alleVariablen xν bis auf die j-te als konstant und nimmt fi als Funktionder einen Veranderlichen xj , dann ist Djfi die Ableitung. WennDjfi(u) existiert, heißt fi bei u partiell nach xj differenzierbar.

(2.3) Satz. Sei U offen in Rn und f : U → Rp sei an der Stelle

u ∈ U differenzierbar. Dann existieren alle partiellen Ableitungen

Djfi(u) = ∂fi∂xj

(u) , und die lineare Abbildung Df(u) ist durch die

Matrix

Df(u) =(∂fi/∂xj(u)

)

gegeben. Diese Matrix heißt auch Jacobi-Matrix von f bei u . Im

Matrizenkalkul sind die Vektoren aus Rn und Rp hier als Spalten

zu schreiben.

Beweis: Die partiellen Ableitungen kann man auch so beschreiben:Fur ein Intervall I um 0 ∈ R existiert die Zusammensetzung vonAbbildungen

ϕij : Iκj−−−→ U

f−−→ Rp pri−−−→ R,t 7−−→ u+ tej , y 7−−→ yi,

Page 20: Analysis 2 - Broecker

2. Differenzierbare Abbildungen 15

und es ist Djfi(u) = Dϕij(0) = d/dt ϕij(0).Nun sind die Inklusionen und Projektionen κj , pri affin, wenn

also Df(u) existiert, so existiert nach der Kettenregel auch Dϕij(0),und es ist

Dϕij(0) = D pri ◦Df(u) ◦Dκj .Aber

Dκj : λ 7→ λej , D pri : (v1, . . . , vp) 7→ vi,

also Dϕij(0) = i-te Komponente von Df(u) · ej = Df(u)ij . �

Eine Formel wie

f(x+ h)− f(x) = Df(x) · h+ ϕ(h)

in der Erklarung der Differenzierbarkeit bedeutet also, wenn man siein Komponenten und Matrizen expliziter aufschreibt:

f1(x+ h)− f1(x)

...

fp(x+ h)− fp(x)

=

∂f1∂x1

(x) · · · ∂f1∂xn

(x)

......

∂fp∂x1

(x) · · · ∂fp∂xn

(x)

·

h1

...

hn

+

ϕ1(h)

...

ϕp(h)

In allgemeinen Uberlegungen, mit denen es ja dieser Text meist zutun hat, soll man sich aber unter einem Symbol wie Df(x)·v das Bilddes Vektors v unter der linearen Abbildung Df(x) ∈ Hom(Rn, Rp)denken, wie auch immer diese Gegenstande notiert sein mogen. Undso notieren wir, wie schon im ersten Abschnitt, meist die Vektoren ausRn als Zeilen, weil die chinesische Notation unbequem zu schreibenund zu lesen ist. In einem Symbol wie Df(x) · v ist dann

v = (v1, . . . , vn), Df(x) · v =(Df1(x) · v, . . . , Dfp(x) · v),

Dfi(x) · v =n∑

j=1

∂fi/∂xj(x) · vj .

Page 21: Analysis 2 - Broecker

16 I. Differentialrechnung mehrerer Variablen

Wo wir aber den Matrizenkalkul verwenden, sind Vektoren als Spal-tentupel zu schreiben, und das ist insbesondere der Fall, wenn wirdas Differential Df(x) als Matrix auffassen und uber Eigenschaftendieser Matrix, ihrer Zeilen und Spalten, reden. Ubrigens bezeichnetA die transponierte der Matrix A , dann konnen wir gelegentlich, woes der Kalkul verlangt, eine Zeile durch Transponieren in eine Spaltet(v1, . . . , vn) verwandeln.

Man hat etwas Muhe mit den Bezeichnungen, denn einerseits isteinem Punkt x die Matrix Df(x) zugeordnet, und andererseits istja auch dies eine (lineare) Abbildung, die dann einem Vektor v denBildvektor Df(x) · v zuordnet. Wir schreiben zur Unterscheidungdiese letztere Abbildung als Multiplikation, weil wir uns Df(x) alsMatrix denken. Andere schreiben x als Index, also Dfx oder Dxf

statt Df(x), und dann Dfx(v) oder Dxf(v) statt Df(x) · v .

Die Kettenregel zum Beispiel erhalt jetzt folgende Gestalt: Hatman eine Zusammensetzung

Rn Rm∪ ∪U −→

fV −→

gRp, f(u) = v,

und existieren Df(u) und Dg(v), so existiert auch D(g ◦ f)(u), unddie Kettenregel besagt explizit:

j

∂gi∂yj

(v) · ∂fj∂xk

(u) =∂(g ◦ f)i∂xk

(u).

Dies kann man auch bei der Berechnung der Ableitung von Funktio-nen einer Variablen mit Gewinn anwenden. Betrachte zum Beispieleine Zusammensetzung

R Rn∪ ∪I −→

γU −→

fR.

Page 22: Analysis 2 - Broecker

2. Differenzierbare Abbildungen 17

Dann ist ddt (f ◦ γ)(τ) = Df

(γ(τ)

)γ(τ) =

∑nj=1

∂f∂xj

(γ(τ)

) dγjdt (τ).

Kurz:df

dt=

n∑

j=1

∂f

∂xj

dxjdt

.

Ist zum Beispiel γ(t) = u + tv fur ein u ∈ U und einem Vektorv ∈ Rn , so ist

d

dt(f ◦ γ)(0) =

n∑

i=1

∂f

∂xi(u) vi =: Dvf(u).

Ist f : U → R differenzierbar am Punkt u , so heißt der Vektor

grad f(u) :=(D1f(u), . . . , Dnf(u)

)

auch der Gradient von f am Punkt u , und

Dvf(u) = 〈grad f(u), v〉

heißt die Richtungsableitung von f in Richtung v .

Ist |v| = 1, so ist |Dvf(u)| ≤ |gradf(u)| nach der SchwarzschenUngleichung, also ist |Dvf | maximal, falls v = grad f/|grad f | . DerGradient zeigt die Richtung des starksten Anstiegs der Funktion.

Die Existenz der Jacobischen(∂fi/∂xj(u)

)ist notwendig aber

nicht hinreichend fur die Differenzierbarkeit. Zum Beispiel die Funk-tion

f : R2 → R, (x, y) 7→ xy

x2 + y2, f(0) := 0,

ist am Ursprung nicht einmal stetig, also erst recht nicht differenzier-bar, sie hat dort aber die Jacobimatrix 0, denn f |R×0 =f |0×R = 0.

Es gilt aber folgender wichtiger

(2.4) Satz. Die Funktion f : U → Rp sei uberall partiell differen-

zierbar, und die partiellen Ableitungen Djfi : U → R seien am

Page 23: Analysis 2 - Broecker

18 I. Differentialrechnung mehrerer Variablen

Punkte x ∈ U stetig, dann ist f bei x differenzierbar mit dem Dif-

ferential

Df(x) =(∂fi/∂xj(x)

).

Beweis: Wir durfen p = 1 annehmen. Wir schreiben h ∈ Rn alsh = h1e1 + · · ·+ hnen , und erhalten

f(x+ h)− f(x)

=n∑

k=1

(f(x+ h1e1 + · · ·+ hkek)− f(x+ h1e1 + · · ·+ hk−1ek−1)

).

Auf jeden Summanden konnen wir den Mittelwertsatz der Differen-tialrechnung einer Variablen — namlich der k-ten Komponente imk-ten Summanden — anwenden und erhalten:

f(x+ h)− f(x) =n∑

k=1

hkDkf(x+ h1e1 + · · ·+ hk−1ek−1 + ϑkhkek),

mit 0 < ϑk < 1. Und dies ist schon die Behauptung, denn es ist jalimh→0Dkf(. . . ) = Dkf(x), weil Dkf bei x stetig ist. �

In der Regel werden wir also die Differenzierbarkeit einer Funktiondadurch feststellen, daß wir die partiellen Ableitungen berechnen —das lauft auf den Kalkul der Differentialrechnung einer Variablen hin-aus — und feststellen, ob die partiellen Ableitungen stetig sind. ZumBeispiel ein Polynom in mehreren Variablen ist stets differenzierbar.

Mit diesem Satz ubertragt man vieles unmittelbar vom Ein- aufsMehrdimensionale. Zum Beispiel die Grenzfunktion einer Folge stetigdifferenzierbarer Funktionen ist wieder stetig differenzierbar, wenndie Ableitungen gleichmaßig konvergieren.

Aus dem Eindimensionalen ubertragt sich auch, ahnlich wie imBeweis des Satzes benutzt, ein

(2.5) Mittelwertsatz. Sei U offen in Rn und f : U → R sei eine

differenzierbare Funktion. Es sei x+ th ∈ U fur 0 ≤ t ≤ 1 , dann ist

f(x+ h)− f(x) = Df(x+ τh) · h, 0 < τ < 1.

Page 24: Analysis 2 - Broecker

2. Differenzierbare Abbildungen 19

Beweis: Setze g(t) = f(x+ th) und wende den Mittelwertsatz fureine Variable an:

f(x+ h)− f(x) = g(1)− g(0) =d

dtg(τ) = Df(x+ τh) · h. �

Beachte jedoch, daß die Dimension des Bildraumes eins ist. Wennf mehrere Komponenten hat, f = (f1, . . . , fp) : U → Rp , so mußman im allgemeinen fur jede Komponente einen anderen Wert τ

nehmen. Zum Beispiel bei der Schraubenlinie γ(t) = (cos t, sin t, t)zeigt der Vektor γ(t) = (− sin t, cos t, 1) niemals in Richtungγ(2π) − γ(0) = (0, 0, 2π). Allgemein muß man, statt Df an einerZwischenstelle, vielmehr einen Mittelwert von Df wahlen, namlich:

(2.6) Mittelwertsatz. Sei U offen in Rn und f : U → Rp stetig

differenzierbar. Auch sei x+ th ∈ U fur 0 ≤ t ≤ 1 , dann ist

f(x+ h)− f(x) =

1∫

0

Df(x+ th) dt · h.

Das Ingtegral wird komponentenweise gebildet. Das Ergebnis derIntegration ist wieder ein Matrix, der Mittelwert von Df auf derStrecke von x nach x+ h .

Beweis: Beide Seiten sind gleich∫ 1

0ddtf(x+ th) dt . �

Diese Formel hat die Gestalt f(x+ h) = f(x) +A(x+ h) · h , mit

A(x+ h) =

1∫

0

Df(x+ th) dt.

Page 25: Analysis 2 - Broecker

20 I. Differentialrechnung mehrerer Variablen

Sie gibt also eine explizitere Beschreibung einer matrizenwertigenFunktion A , wie sie in der Definition der Differenzierbarkeit auftritt.Das wird sich noch oft als nutzlich erweisen, wenn wir etwa den Zu-wachs von f abschatzen oder die Differenzierbarkeit eines geeignetenA untersuchen wollen.

§ 3. Taylorentwicklung

Fur den Kalkul der Differentialrechnung machen wir nun die wich-tige Bemerkung, daß die hoheren Ableitungen einer Funktion ver-tauschbar sind. Die genaue Behauptung ist:

(3.1) Satz (uber die Vertauschbarkeit der Ableitungen). Sei U offen

in Rn und f : U → R eine Funktion; sie besitze Ableitungen Dif,

Djf nach der i-ten und j-ten Variable auf U , und es existiere die

Ableitung DiDjf : U → R und sei stetig. Dann existiert auch

DjDif , und

DiDjf = DjDif.

Beweis: Sei u ∈ U . Um das Schreiben zu vereinfachen setzen wir

ϕ(s, t) = f(u+ sei + tej).

Dann sagt die Voraussetzung, daß lokal um den Ursprung (0, 0) dieAbleitung D1D2ϕ existiert und stetig ist, und es ist zu zeigen:

D1D2ϕ(0, 0) = D2D1ϕ(0, 0).

Nach Definition ist nun

D2D1ϕ(0, 0) = d/dt |t=0

lims→0

ϕ(s, t)− ϕ(0, t)s

= limt→0

lims→0

1s·(ϕ(s, t)− ϕ(0, t)

)− (ϕ(s, 0)− ϕ(0, 0))

t.

Page 26: Analysis 2 - Broecker

3. Taylorentwicklung 21

Auf den Bruch, einen Differenzenquotienten bezuglich der zweitenVariablen, wenden wir den Mittelwertsatz der Differentialrechnungan und schreiben dafur

1s

(D2ϕ(s, ϑ2t)−D2ϕ(0, ϑ2t)

), 0 < ϑ2 < 1,

und dies ist wieder ein Differenzenquotient bezuglich der ersten Va-riablen, auf den wir, weil D1D2 existiert, ebenfalls den Mittelwertsatzanwenden konnen. Wir erhalten:

D1D2ϕ(ϑ1s, ϑ2t), 0 < ϑ1, ϑ2 < 1,

und weil D1D2ϕ stetig ist, folgt

limt→0

lims→0

D1D2ϕ(ϑ1s, ϑ2t) = D1D2ϕ(0, 0). �

Wir geben sogleich eine Anwendung des Satzes: Gegeben sei eineAbbildung v : R2 → R2 , die wir uns als Vektorfeld vorstellen, dasheißt, jedem Punkt (x, y) ∈ R2 ist ein Vektor

(v1(x, y), v2(x, y)

)

zugeordnet, den wir mit Fußpunkt in (x, y) abtragen.

Beispiel. v(x, y) = 12 (−y, x).

Frage: Gibt es zu dem Vektorfeld ein Potential, das heißt, gibtes eine Funktion P : R2 → R , so daß ∂P/∂x = v1 , ∂P/∂y = v2 ? In

Page 27: Analysis 2 - Broecker

22 I. Differentialrechnung mehrerer Variablen

unserem Beispiel ist die Antwort: Nein, denn es wurde folgen:

−12

=∂v1

∂y=∂v2

∂x=

12.

Nachdem wir nun wissen, daß die partiellen Ableitungen unter ver-nunftigen Voraussetzungen vertauschbar sind, machen wir uns fol-gende bequeme Schreibweise zu eigen: Wir setzen

Dif =:∂

∂xif,

Dki f := DiD

k−1i f =: ∂k/∂xki f, D0

i f := f.

Dann schreiben wir Zusammensetzungen partieller Ableitungen miteinem Multiindex α , wir benutzen folgende Bezeichnungen:

α = (α1, · · · , αn) ∈ N n0 heißt ein Multiindex,

|α| := α1 + · · ·+ an seine Ordnung,

α! := α1! · α2! · . . . · αn! α-fakultat,

xα := xα11 · . . . · xαnn heißt das Monom vom Exponent α ,

β ≤ α :⇐⇒ βi ≤ αi fur i = 1, . . . , n , kleinergleich,

α± β := (α1 ± β1, · · · , αn ± βn),

Dαf := Dα11 Dα2

2 . . . Dαnn f =:

∂|α|

∂xα11 · · · ∂xαnn

f, D0f := f.

Solange die Zusammensetzungen partieller Ableitungen von f aufder offenen Menge U ⊂ Rn stetig bleiben, sind sie vertauschbar, undwir konnen die Reihenfolge so festlegen, wie in dem Symbol Dαf .Eine Funktion f : U → R heißt Ck-Funktion oder k-mal stetigdifferenzierbar, falls Dαf fur |α| ≤ k existiert und stetig ist. UndCk(U) sei die Menge der Ck-Funktionen auf U . Wir lassen auchk =∞ zu, also

C∞(U) =∞⋂

k=0

Ck(U)

ist die Menge der beliebig oft stetig differenzierbaren Funktionen.Dies ist ubrigens ein kommutativer Ring mit Eins.

Page 28: Analysis 2 - Broecker

3. Taylorentwicklung 23

Eine Abbildung f : U → Rp heißt k-mal stetig differenzier-bar, wenn ihre Komponenten fi : U → R aus Ck(U) sind. DieMenge der k-mal stetig differenzierbaren Abbildungen U → Rp wirdmit

Ck(U, Rp) = Ck(U)p

bezeichnet. Ist f ∈ Ck(U)p , so ist Dαf das p-Tupel

Dαf = (Dαf1, . . . , Dαfp).

Man rechnet leicht aus

Dαxβ ={ (

β!/(β − α)!)xβ−α falls α ≤ β,

0 sonst,

denn

Dαxβ =( ∂α1

∂xα11

xβ11

)· · · · ·

( ∂αn∂xαnn

xβn)

=(β1!/(β1 − α1)!

)xβ1−α1

1 · · · · · (βn!/(βn − αn)!)xβn−αn

falls α ≤ β , und Null sonst. Insbesondere folgt:

Im Punkte x = 0 ist

Dαxβ ={α! falls α = β,

0 sonst.

Das sind dieselben Formeln, die schon fruher am Anfang der Er-klarung der Taylorentwicklung standen. Sie bedeuten jetzt etwasmehr als fruher, aber der Kalkul macht keinen Unterschied.

Definition (Jet). Die Funktion f : U → R sei k-mal stetig differen-

zierbar. Der k-Jet oder das k-te Taylorpolynom von f bei u ∈ Uist das Polynom

jkuf(x) =∑

|α|≤k

Dαf(u)α!

xα.

Page 29: Analysis 2 - Broecker

24 I. Differentialrechnung mehrerer Variablen

Ist k =∞ , so ist der Jet von f bei u die Potenzreihe

j∞u f(x) =∞∑

|α|=0

Dαf(u)α!

xα.

Ist f : U → Rp aus Ck(U)p , so wird jkuf durch die gleicheFormel definiert. In diesem Fall ist jedes Dαf ein p-Tupel, also jkuf

das p-Tupel von Polynomen

jkuf = (jkuf1, . . . , jkufp).

Wir nennen ein p-Tupel von Polynomen in n-Variablen kurzerhandwieder ein Polynom. Entsprechendes gilt fur j∞u f und Potenzreihen.Wie fruher konnen wir den k-Jet von f folgendermaßen charakter-isieren:

Das Polynom jkf(x) hat am Punkte 0 ∈ Rn die gleichen Ablei-tungen der Ordnung ≤ k wie die Abbildung f(u+x), oder jkf(x−u)hat bei u gleiche Ableitungen der Ordnung ≤ k wie f . In der Tatist namlich fur |β| ≤ k am Punkte x = 0

Dβ∑

|α|≤k

Dαf(u)α!

xα =∑

|α|≤k

Dαf(u)α!

Dβxα = Dβf(u).

Diese Eigenschaft charakterisiert auch den k-Jet. Ist

p(x) =∑

|α|≤kaαx

α

ein Polynom vom Grad ≤ k , und Dβp(0) = Dβf(u) fur |β| ≤ k , soist aβ = Dβp(0)/β! = Dβf(u)/β! .

Wie im Fall der Dimension eins finden wir folgende

(3.2) Rechenregeln. Sind f, g ∈ Ck(U) und sind λ, µ Konstanten,

so ist

jku(λf + µg) = λjkuf + µjkug.

Page 30: Analysis 2 - Broecker

3. Taylorentwicklung 25

Allgemeine Produktregel. jku(f · g) = jk0 (jkuf · jkug) .

Allgemeine Kettenregel. Hat man eine Zusammensetzung von

Ck-Abbildungen

U −→gV −→

fRm, g(u) = v,

so ist jku(f ◦ g) = jk0(jkv f ◦ (jkug − v)

).

Beweis: Die erste Regel ist trivial, weil die Abbildungen

Dα : Ck(U)→ Ck−|α|(U)

linear sind. Die zweite folgt so: Setze

f(u+ x) = jkuf(x) + ϕ(x),

g(u+ x) = jkug(x) + ψ(x).

Dann istDαϕ(0) = Dαψ(0) = 0 fur |α| ≤ k ,

und

f · g(u+ x) = jkuf(x) · jkug(x) + ϕ(x) · (. . . ) + ψ(x) · (. . . ),

und man sieht sofort: Dα(ϕ · h)(0) = 0 = Dα(ψ · h)(0) fur alleh ∈ Ck(U). Also folgt die zweite Regel.

Im Beweis der dritten Regel wollen wir die Koordinaten in U undV so verschieben, daß u = v = 0, dann haben wir g(0) = 0 undmussen zeigen

jk0 (f ◦ g) = jk0 (jk0 f ◦ jk0 g).

Ist jk0 f = 0, also Dαf(0) = 0 fur |α| ≤ k , so findet man durchInduktion nach |α| , daß jk0 (f ◦ g) = 0, das heißt Dα(f ◦ g)(0) = 0fur |α| ≤ k . Allgemein setzt man wieder f(x) = jk0 f(x) + ϕ(x), mitjk0ϕ = 0, und erhalt

jk0 (f ◦ g) = jk0 (jk0 f ◦ g + ϕ ◦ g) = jk0 (jk0 f ◦ g),

Page 31: Analysis 2 - Broecker

26 I. Differentialrechnung mehrerer Variablen

aber weil jk0 f ein Polynom und der Jet mit Summen und Produktennach den beiden ersten Regeln vertraglich ist, so ist

jk0 (jk0 f ◦ g) = jk0 (jk0 f ◦ jk0 g). �

Betrachten wir zum Beispiel die Zusammensetzung

D −→gV −→

fR,

wobei D ein Intervall ist, g(s) = x + sh , und v = g(τ). Ist dannf ∈ Ck(V ), so ist fur k ≥ 1

jkτ g(t) = v + th, also jkτ g − v = th,

also

jkτ (f ◦ g)(t) = jkv f(th) =∑

|α|≤k

Dαf(v)α!

· hα · t|α|,

und ein Koeffizientenvergleich mit der Definition von jkτ (f ◦ g) zeigtexplizit

(3.3)1k!

dk

dsk|

s=τf(x+ sh) =

|α|=k

Dαf(x+ τh) · hαα!

.

Man kann sich der Muhe unterziehen, dies direkt durch Induktionnach k zu zeigen.

Nachdem wir uns soweit uber die Eigenschaften des Jets unter-halten haben, konnen wir unmittelbar die Taylorsche Formel aufFunktionen von n Variablen ubertragen, die angibt, wie gut eineFunktion durch ihren k-Jet approximiert wird. Ist U offen in Rn

und f : U → R eine Funktion, so erhalten wir die Taylorformel furf(x + h) aus der Taylorformel fur Funktionen einer Veranderlichen,indem wir f auf die Verbindungsstrecke zwischen x und x + h ein-

Page 32: Analysis 2 - Broecker

3. Taylorentwicklung 27

schranken.

(3.4) Taylorsche Formel. Sei U offen in Rn und f ∈ Ck+1(U) ;

die Verbindungsstrecke

{x+ sh | 0 ≤ s ≤ 1}

zwischen x und x + h sei ganz in U enthalten. Dann gilt fur eine

Zahl 0 < τ < 1 :

f(x+ h) = jkxf(h) +∑

|α|=k+1

Dαf(x+ τh)α!

hα.

Beweis: Sei ϕ(s) := f(x+ sh), dann sagt die Taylorformel mit derRestglieddarstellung von Lagrange

ϕ(1) =k∑

j=0

1j!

dj

dsjϕ(0) +

1(k + 1)!

dk+1

dsk+1ϕ(τ), 0 < τ < 1,

und setzen wir die Ableitungen von ϕ(s) = f(x+ sh) nach (3.3) mitτ = 0 bzw. τ = τ ein, so ergibt sich:

ϕ(1) = f(x+ h) =k∑

|α|=0

Dαf(x)α!

hα +∑

|α|=k+1

Dαf(x+ τh)α!

hα,

was die Behauptung ist. �

Page 33: Analysis 2 - Broecker

28 I. Differentialrechnung mehrerer Variablen

Naturlich ubertragt man ahnlich auch andere Restglieddarstellun-gen auf hohere Dimension. Uber die Großenordnung des Restgliedesbelehrt uns die Abschatzung:

(3.5) |hα| ≤ |h||α|,

denn |hi| ≤ |h| , also |hα| = |h1|α1 · . . . · |hn|αn ≤ |h|α1+···+αn = |h||α| .Wir finden damit

(3.6) Restgliedabschatzung. Unter den Voraussetzungen der Tay-

lorschen Formel gilt:

f(x+ h) = jk+1x f(h) + ϕ(h), lim

h→0ϕ(h)/|h|k+1 = 0.

Beweis: Es ist ϕ(h) =∑|α|=k+1

(Dαf(x + τh) − Dαf(x)

)hα/α! ,

|hα/|h|k+1| ≤ 1, und limh→0

(Dαf(x+ τh)−Dαf(x)

)= 0. �

So ist der k-Jet in naturlicher Weise eine Verallgemeinerung derAbleitung. Daß f bei x differenzierbar ist, heißt:

f(x+ h) = f(x) +A · h+ ϕ(h), limh→0

ϕ(h)/|h| = 0.

Der k-Jet ist — statt der affinen Abbildung

h 7→ f(x) +Ah = f(x) + a1h1 + · · ·+ anhn,

was ja ein Polynom erster Ordnung in h ist — nun ein Polynom k-terOrdnung, das auch f(x+h) von k-ter Ordnung approximiert, namlich

f(x+ h) = jkxf(h) + ϕ(h), limh→0

ϕ(h)/|h|k = 0.

Eine stetig differenzierbare, also differenzierbare Funktion kann manals Polynom erster Ordnung

f(x+ h) = f(x) +A(h) · h

Page 34: Analysis 2 - Broecker

4. Das lokale Verhalten einer Funktion 29

schreiben, bei dem nur die Koeffizienten hochster — namlich erster— Ordnung von h abhangen. Entsprechend schreibt sich eine (k+1)-mal stetig differenzierbare Funktion als Polynom (k+1)-ter Ordnung

f(x+ h) = jkxf(h) +∑

|α|=k+1

Dαf(x+ τh)α!

hα,

wo nur die Koeffizienten hochster, namlich (k + 1)-ter Ordnung vonh abhangen.

Der k-Jet eines Polynoms p(x) =∑|α|≤k aαx

α im Punkte u istnaturlich das Polynom jkup(h) =

∑|α|≤k aα(u+h)α , insbesondere —

so kann man ja die Koordinaten auch immer legen — jk0p(x) = p(x).Ein Polynom ist gleich seiner Taylorreihe.

§ 4. Das lokale Verhalten einer Funktion

Die Formel jkuf(x) =∑|α|≤k

Dαf(u)α! xα ist in allgemeinen Uberle-

gungen leicht zu handhaben, weil man wie im eindimensionalen Fallrechnen kann. Man tut aber gut, auch etwas expliziter aufzuschrei-ben, was sie bedeutet, zum Beispiel:

j2uf(x) = f(u) +

n∑

i=1

Dif(u)xi + 12

i,j

DiDjf(u)xixj

= f(u) +n∑

i=1

∂xif(u)xi + 1

2

i,j

∂2f

∂xi∂xj(u)xixj .

Die α mit |α| = 2 sind namlich α = (0, . . . , 0, 2, 0, . . . 0), α! = 2, unddie mit zwei Einsen α = (0, . . . , 0, 1, 0, . . . 0, 1, 0, . . . 0), α! = 1, undletztere sind in der Summe

∑ij zweimal aufgefuhrt, an den Stellen

(i, j) und (j, i), treten aber in∑|α|=2 nur einmal auf.

Das Studium des Zweijets einer Funktion genugt meistens, um daslokale Verhalten der Funktion um einen Punkt aufzuklaren.

Definition. Sei U offen in Rn und f : U → R eine stetig dif-

ferenzierbare Funktion. Ein Punkt u ∈ U heißt kritisch, wenn

Page 35: Analysis 2 - Broecker

30 I. Differentialrechnung mehrerer Variablen

Df(u) = 0 , und in diesem Fall heißt f(u) ein kritischer Wertvon f .

Offenbar ist u genau dann kritisch, wenn die Richtungsableitun-gen Dvf(u) fur alle v verschwinden, d.h. wenn d

dtf ◦ γ(0) = 0 furjede stetig differenzierbare Kurve t 7→ γ(t) mit γ(0) = u .

Definition. Der Punkt u ∈ U heißt ein lokales Maximum von

f , wenn es ein ε > 0 gibt, so daß f(u + h) ≤ f(u) fur |h| < ε .

Ein lokales Minimum ist analog mit ≥ statt ≤ definiert, und ein

lokales Extremum ist ein lokales Maximum oder Minimum.

Hat eine stetig differenzierbare Funktion f : U → R bei u ∈ U einlokales Extremum, so ist u kritisch. Offenbar hat dann namlich ins-besondere f ◦γ fur jede stetig differenzierbare Kurve γ mit γ(0) = u

ein lokales Extremum an der Stelle 0, also D(f ◦ γ)(0) = 0 .

Umgekehrt braucht ein kritischer Punkt kein Extremum zu sein.Im Gegensatz zum eindimensionalen Fall findet man jetzt eine rei-chere Geometrie des lokalen Verhaltens einer Funktion, die nicht nurdurch die Begriffe von Monotonie und Extremalitat beschrieben wird.Typisch sind folgende

Beispiele. f(x, y) = x2 + y2

Diese Funktion zeigt ein (lokales) Minimum am Nullpunkt.

Page 36: Analysis 2 - Broecker

4. Das lokale Verhalten einer Funktion 31

f(x, y) = x2 − y2.

Hier ist der Ursprung ein kritischer Punkt, aber kein Extremum,sondern ein sogenannter Sattelpunkt.

Und schließlich hat die Funktion

f(x, y) = −x2 − y2,

das Negative der ersten, ein (lokales) Maximum am Ursprung, manerhalt ihren Graphen, wenn man das erste Bild auf den Kopf stellt.

Zu den Bildern wollen wir uns folgende Begriffe machen, um daslokale Verhalten einer Funktion zu beschreiben:

Definition. Sei U offen in Rn , und f : U → R eine C2-Funktion,

dann nenne ich f bei u ∈ U lokal positiv (negativ) definit, falls es

ein ε > 0 und λ > 0 gibt, so daß gilt:

f(u+ h)− f(u) ≥ λ|h|2 (bzw. ≤ −λ|h|2 ), fur |h| < ε .

Der Punkt u heiße Sattelpunkt von f , falls es eine orthogonale

Zerlegung Rn = V ⊕ W gibt, so daß dimV 6= 0, n , und so daß

f |u+ V lokal positiv definit, f |u+W lokal negativ definit ist.

Eine bei u lokal positiv definite Funktion hat dort ein lokales Mi-nimum, eine lokal negativ definite Funktion hat ein lokales Maximum,

Page 37: Analysis 2 - Broecker

32 I. Differentialrechnung mehrerer Variablen

und ein Sattel hat weder das eine noch das andere. Meistens, wennauch nicht immer, wird eine Funktion in einem kritischen Punkt eineder drei genannten Verhaltensweisen zeigen, und man erkennt das lo-kale Verhalten an dem Term zweiter Ordnung der Taylorentwicklung.

Definition (Hessesche). Sei u ein kritischer Punkt der C2-Funktion

f : U → R , dann heißt die symmetrische Matrix

Hu =(∂2f/∂xi∂xj(u)

), i, j = 1, . . . , n,

die Hessematrix von f bei u , und die Abbildung

x 7→ Hu(x) := txHux :=∑

i,j

(∂2f/∂xi∂xj(u)

)xixj

heißt die Hesseform von f bei u .

Das t bedeutet “transponiert”. Hier schreiben wir die Vektorenals Spalten-n-tupel.

(4.1) Satz (uber das lokale Verhalten). Sei U offen in Rn und u

ein kritischer Punkt der C2-Funktion f : U → R . Die Determinante

der Hessematrix in u sei ungleich 0 . Dann hat f bei u dasselbe

lokale Verhalten wie die Hesseform Hu von f am Ursprung. Ist also

die Hesseform x 7→ txHx positiv (negativ) definit, so gilt dasselbe

lokal fur f um u , und hat die Hesseform einen Sattel, so auch f ,

mit derselben Zerlegung Rn = V ⊕W .

Erlauterung. Wir durfen nach Verschiebung der Koordinaten an-nehmen: u = 0, und f(0) = 0. Ist A ein linearer Endomorphismusvon Rn , so ist

j20(f ◦A)(x) = j2

0f(Ax) = 12t(Ax)HAx = 1

2tx( tAHA)x,

wenn H die Hessematrix von f bei 0 ist. Man erkennt, daß f ◦ Adie Hessematrix tAHA hat. Nun lehrt die lineare Algebra: DurchWahl einer geeigneten orthonormalen Abbildung A kann man H aufDiagonalgestalt transformieren:

H = Diag (λ1, . . . , λk, µ1, . . . , µ`, 0, . . . , 0)

Page 38: Analysis 2 - Broecker

4. Das lokale Verhalten einer Funktion 33

sei die quadratische Matrix mit den genannten Koeffizienten λi > 0und µj < 0 und 0 in der Diagonale und verschwindenden Koeffizien-ten außerhalb der Diagonale. Sei dann λ = min{λi} , µ = min{−µj} .

Nach orthonormaler Transformation des Koordinatensystems fin-det man daher die koordinatenweise Zerlegung

Rn = V ⊕W ⊕N = Rk ⊕ R` ⊕ Rm,so daß H|V positiv definit und H|W negativ definit ist, namlich furx ∈ V ist H(x) =

∑ki=1 λix

2i ≥ λ|x|2 , und entsprechend fur W ; und

auf N verschwindet H(x). Ist also det(H) 6= 0, so ist Rn = V ⊕W ,und es gilt:

Erganzung. Ist V der Teilraum, auf dem die Hesseform positiv de-

finit ist (also f ist auf u+V positiv definit), so ist dimV gleich der

Anzahl der positiven Eigenwerte von H .

Ist det(H) = 0, so kann man f auf V ⊕W einschranken, und daslokale Verhalten von f |V ⊕W ist dasselbe wie das der Hesseform aufV ⊕W .

Fur das Verhalten der Funktion auf dem Unterraum N , wo dieHesseform verschwindet, lehrt der Satz nichts. Beachte auch, da zwardie Dimensionen von V und W , nicht aber diese Raume selbst durchdie Eigenschaften in der Definition eines Sattelpunktes eindeutig be-stimmt sind.

Beweis (4.1): Die Taylorformel lehrt, falls u = f(u) = Df(u) = 0:

f(x) = txAx+ |x|2ϕ(x), limx→0

ϕ(x) = 0, mit A = 12H .

Wir denken uns nun die Zerlegung Rn = V ⊕ W gegeben, dannexistiert ein λ > 0, so daß fur alle v ∈ V gilt:

tvAv ≥ λ|v|2, also tvAv ≥ λfur alle v ∈V mit |v| = 1. Weil nun limx→0 ϕ(x) = 0, so folgern wir,daß es zu jedem λ1 < λ ein ε > 0 gibt, so daß

tvAv + ϕ(x) ≥ λ1 fur |v| = 1, |x| < ε.

Page 39: Analysis 2 - Broecker

34 I. Differentialrechnung mehrerer Variablen

Ersetzen wir v durch x/|x| und multiplizieren mit |x|2 , so erhaltenwir

txAx+ |x|2ϕ(x) ≥ λ1|x|2 fur x ∈ V mit 0 < |x| < ε.

Das heißt aber f(x) ≥ λ1|x|2 fur x ∈ V mit |x| < ε . Entsprechendschließt man fur W . �

Um also Rechner auf den rechten Weg zu bringen: Will man daslokale Verhalten in einem kritischen Punkt bestimmen, so berechneman die Vorzeichen der Eigenwerte der Hessematrix. Dazu brauchtman die Eigenwerte selbst nicht auszurechnen, was auch im allgemei-nen sehr aufwendig ware. Ein gangbarer Weg ist die Diagonalisierungder Hesseform durch simultane Zeilen- und Spaltenumformungen.

Im Falle der Funktionen in 2 Variablen zeigt die Betrachtung einerHessematrix in Diagonalgestalt unmittelbar:

det(H) < 0 =⇒ Der Punkt ist ein Sattelpunkt.det(H) > 0 =⇒ Der Punkt ist ein lokales Extremum.Ob das Extremum ein Maximum oder Minimum ist, erkennt man

dann naturlich am Vorzeichen der Diagonalelemente der Hessematrix.Dazu braucht man nicht zu transformieren.

Beispiel. Zu bestimmen ist das lokale Verhalten der Funktion

f(x, y) =(3x+ 4y + sin(xy)

)(2x+ y − cos(x)(1− cos y)

)

am Nullpunkt. Wir berechnen den Zwei-Jet:

j20f(x, y) = (3x+ 4y)(2x+ y),

denn sin(xy) und (1 − cos y) verschwinden schon von mindestenszweiter Ordnung, also haben sie keinen Einfluß auf den 2-Jet desProdukts. Ist nun A : R2 → R2 durch

A : (x, y) 7→ (ξ, η), ξ = 3x+ 4y, η = 2x+ y,

Page 40: Analysis 2 - Broecker

5. Vertauschbarkeit von Ableitung und Integral 35

gegeben, so ist j20f(x, y) = p

(A(x, y)

), mit p(ξ, η) = ξ ·η . Also haben

wir j20(f ◦ A−1) = xy . Daher hat j2

0f ◦ A−1 einen Sattel, also auchj20f , also auch f .

Das Polynom xy wird ubrigens durch x = ξ − η , y = ξ + η inξ2 − η2 transformiert.

Die Behandlung des Beispiels zeigt, daß man durch etwas Uberle-gung viel Rechnung sparen kann.

Wir werden spater das sogenannte Morselemma kennenlernen, dasin gewissem Sinne eine Verscharfung des hier Bewiesenen enthalt:Eine genugend oft differenzierbare Funktion sieht lokal um einen kri-tischen Punkt mit nicht entarteter Hesseform nach geeigneter Koordi-natentransformation ebenso aus, wie die Hesseform fur diesen Punkt(V, § 3 und Bd. 3, III, 2.5).

§ 5. Vertauschbarkeit von Ableitung und Integral

Da wir uber Integration noch wenig wissen, sagen wir zum Themaerst etwas Vorlaufiges, das uns unmittelbar hilfreich fur die Differen-tialrechnung ist (vergl. III, 4.7).

(5.1) Satz. Sei U offen in Rn und D = [a, b] ein kompaktes Inter-

vall. Die Funktion f : D × U → R sei stetig, dann ist die Funktion

F : U → R, x 7→b∫

a

f(t, x) dt

stetig. Hat f stetige Ableitungen ∂/∂xif : D × U → R , so ist auch

F stetig nach xi differenzierbar, und

∂xi

b∫

a

f(t, x) dt =

b∫

a

∂xif(t, x) dt.

Page 41: Analysis 2 - Broecker

36 I. Differentialrechnung mehrerer Variablen

Beweis: Die Menge D × {x} ⊂ D × U ist kompakt, und daher istf auf D × {x} gleichmaßig stetig (Bd. 1, VI, 7.12). Also gibt es zuε > 0 stets ein δ > 0, so daß

|f(t, x+ h)− f(t, x)| < ε/|b− a| fur |h| < δ.

Daher |F (x+h)−F (x)| = | ∫ ba

(f(t, x+h)−f(t, x)

)dt| ≤ ∫ b

aε/|b−a| dt

= ε fur |h| < δ . Das ist die Stetigkeit. Jetzt setze fur festes x ∈ Uund genugend kleine h ∈ R

g(t, x, h) =

f(t, x+ hei)− f(t, x)h

falls h 6= 0

∂/∂xif(t, x) falls h = 0.

Dann ist g stetig in allen Variablen. Das ist nur in den Punkten nichtklar, wo h = 0, aber nach dem Mittelwertsatz der Differentialrech-nung schreibt sich der Differenzenquotient als

∂xif(t, x+ ϑh · hei),

was fur (x, t, h)→ (x0, t0, 0) gegen ∂/∂xi f(x0, t0, 0) geht. Nach demersten Fall ist also

∂/∂xiF (x) = limh→0

b∫

a

g(t, x, h) dt =

b∫

a

g(t, x, 0) dt =

b∫

a

∂/∂xif(t, x) dt,

und dies hangt stetig von x ab. �

Beachte, daß in dem Beweis nichts uber U benutzt wird; das hangtan der zitierten angemessen gefaßten Aussage, daß stetige Funktionenauf kompakten Mengen gleichmaßig stetig sind.

Hat die Funktion f stetige Ableitungen der Ordnung ≤ k nachden xi , so sieht man induktiv

DαF (x) = Dα

b∫

a

f(t, x) dt =

b∫

a

D0,αf(t, x) dt fur |α| ≤ k,

Page 42: Analysis 2 - Broecker

5. Vertauschbarkeit von Ableitung und Integral 37

mit 0, α = (0, α1, . . . , αn).

Wir geben gleich eine Anwendung, die eigentlich eine wesentlicheAussage uber die algebraische Struktur des Ringes der differenzier-baren Funktionen macht:

(5.2) Satz. Sei U offen in Rn und f : U → R eine Ck-Funktion,

dann ist fur alle u und x , so daß u+ tx ∈ U fur 0 ≤ t ≤ 1 ,

f(u+ x)− f(u) =n∑

i=1

ϕi(x) · xi

mit Ck−1-Funktionen ϕi .

Beweis: Nach dem Mittelwertsatz (2.6) setze

ϕi(x) :=

1∫

0

Dif(u+ tx) dt. �

Die Aussage geht insoweit uber die Definition der Differenzierbarkeithinaus, als die durch (ϕ1, . . . , ϕn) definierte lineare Abbildung ebennicht nur an der Stelle x = 0 stetig ist, sondern als Funktion vonx sogar (k − 1)-mal stetig differenzierbar — fur k = ∞ also auchbeliebig oft differenzierbar.

In Aufgabe 12 zu diesem Kapitel weisen wir auf eine Verallge-meinerung dieser Aussage fur die hoheren Restglieder der Taylorent-wicklung hin, die man leicht ebenso, oder durch Induktion aus (5.2)erhalt.

Page 43: Analysis 2 - Broecker

Kapitel II

Der Satz uber die Umkehrfunktion

Mathematica accipiuntur ut abstractasecundum rationem, cum tamen nonsint abstracta secundum esse.

Thomas, S.Th.I, Qu XLIV, I.

Wir erklaren, wann eine differenzierbare Abbildung lokal eine dif-ferenzierbare Umkehrabbildung hat. Damit hangt auch die Untersu-chung der Losungsmengen nicht linearer regularer Gleichungssystemeeng zusammen. Diese Losungsmengen sind Mannigfaltigkeiten, undso kommen wir auf den Begriff einer Mannigfaltigkeit und ihrer Tan-gentialraume.

§ 1. Normen und Fixpunkte

Wir wollen dem folgenden Abschnitt einige erinnernde Bemerkun-gen uber lineare und metrische Raume vorausschicken. Seien V undW endlichdimensionale reelle euklidische Vektorraume, dimV = m ,dimW = n , und es sei

H = HomR(V,W ) der Raum der linearen Abbildungen V →W .G = Aut(V ) die Gruppe der linearen Isomorphismen V → V .

Auf dem Vektorraum H , den wir als Raum der (n × m)-Matrizenansehen konnen, fuhren wir eine Norm ein, namlich

|A| := max{|Ax|

∣∣ |x| = 1}.

Page 44: Analysis 2 - Broecker

1. Normen und Fixpunkte 39

Dabei bezeichnet |x| die euklidische Norm in V . Weil die SphareS =

{x ∈ V

∣∣ |x| = 1}

kompakt ist, existiert das Maximum. Furbeliebiges x ∈ V , x 6= 0, ist offenbar

|Ax| = |x| · ∣∣Ax/|x| ∣∣ ≤ |x| · |A|.

Die Abschatzung gilt auch fur x = 0. Insbesondere erhalt man fureine Zusammensetzung V −→

BW −→

AU die Abschatzung

|ABx| ≤ |A| · |Bx| ≤ |A| · |B| · |x|,

was fur |x| = 1 bedeutet:

(1.1) |AB| ≤ |A| · |B|.

Auch ist offenbar

(1.2) |A+B| ≤ |A|+ |B|, |λA| = |λ| · |A|.

Ist (An) eine Folge aus H und limn→∞ |An| = 0, so folgt (An)→ 0.

Die Norm induziert eine Topologie auf H = Hom(V,W ), die mitder von H als Vektorraum der Dimension m · n ubereinstimmt.Fuhren wir orthonormale Koordinaten ein, so daß V = Rm undW = Rn ist, so schreibt sich A ∈ H als Matrix A = (aij), und wirkonnen erklaren:

‖A‖ := max{|aij |

∣∣ i = 1, . . . , n; j = 1, . . . ,m},

‖x‖ := max{|xi|

∣∣ i = 1, . . . ,m}.

Dann gilt: Ist |x| = 1 und ‖A‖ = α , so ist fur jede Zeile a von A of-fenbar |a| ≤ √mα , also hat nach Schwarz jede Komponente von Ax

den Betrag ≤ √mα , also |Ax| ≤ √mnα , das heißt, |A| ≤ √mn‖A‖ .Umgekehrt ist ‖A‖ ≤ |A| , weil aij die i-te Komponente von Aej ist,also |aij | ≤ |Aej | ≤ |A| . Also hat man die Abschatzung, die unmit-telbar angibt, wie die Komponenten mit der Norm konvergieren undumgekehrt:

(1.3) ‖A‖ ≤ |A| ≤ √mn ‖A‖.

Page 45: Analysis 2 - Broecker

40 II. Der Satz uber die Umkehrfunktion

Die Menge G der invertierbaren linearen Endomorphismen von V

ist offen, denn die Determinante

det : End(V ) := Hom(V, V ) −→ R

ist eine stetige Funktion, und G = det−1(R r {0}). Eine genauereAussage liefert das

(1.4) Lemma. Ist |A| < 1 , so ist id−A invertierbar.

Beweis: In der Tat, ware x − Ax = 0 fur ein x 6= 0, so setzev = |x|−1x , dann ist |v| = 1 und Av = v , also |A| ≥ 1. �

Man kann das Inverse folgendermaßen explizit angeben: Die Reihe∑∞k=0 |A|k konvergiert, also konvergiert auch die Reihe

∑∞k=0A

k

nach dem Cauchy-Kriterium. Aber

(1−A) ·∞∑

k=0

Ak = 1 := id ∈ End(V ).

Der Ubergang zum Inversen definiert eine beliebig oft stetig dif-ferenzierbare Abbildung

inv : G→ G, A 7→ A−1,

denn A−1 = det(A)−1 · A , wobei die Komponenten der zu A ad-jungierten Matrix A sich als Determinanten gewisser Untermatrizenvon A durch Polynome in den Koeffizienten von A berechnen.

Die linearen Abbildungen, die wir betrachten werden, sind Dif-ferentiale Df . Ist die Norm von Df beschrankt, so ist das Wachstumvon f beschrankt.

(1.5) Lemma. Sei U offen in Rn und f : U → Rp stetig differen-

zierbar, und sei x + th ∈ U fur 0 ≤ t ≤ 1 . Ist dann |Df | ≤ d auf

{x+ th | 0 ≤ t ≤ 1} , so ist

|f(x+ h)− f(x)| ≤ d · |h|.

Page 46: Analysis 2 - Broecker

1. Normen und Fixpunkte 41

Beweis: Dies folgt aus dem Mittelwertsatz (I, 2.6):

|f(x+ h)− f(x)| =∣∣∣

1∫

0

d

dtf(x+ th) dt

∣∣∣ =∣∣∣

1∫

0

Df(x+ th)h dt∣∣∣

≤1∫

0

|Df | · |h| dt ≤ d |h|. �

Schließlich sei hier eine Schlußweise erklart, die man als Fix-punktsatz von Banach zitiert, obwohl sie wohl schon von Newtonverwendet wurde. Wir erinnern an den Begriff eines vollstandigenmetrischen Raumes. Jede abgeschlossene Teilmenge des Rn ist einBeispiel, weil Rn vollstandig ist. Zunachst weniger naheliegend aberebenso wichtig ist folgendes Beispiel: Sei X ein topologischer Raum,Y ⊂ Rn abgeschlossen, und C der Raum der beschrankten stetigenFunktionen f : X → Y mit der Supremumsnorm (und induziertenMetrik)

‖f‖ = sup{|f(x)|

∣∣ x ∈ X}.Dann ist C vollstandig. Ist namlich (fn) eine Cauchyfolge in C ,so ist

(fn(x)

)fur jedes x ∈ X eine Cauchyfolge in Y, es existiert

also die Grenzfunktion f : X → Y , und die Folge (fn) konvergiertgleichmaßig gegen f , das heißt ‖fn − f‖ geht gegen 0. Aber eingleichmaßiger Limes stetiger Funktionen ist stetig.

Beweis: Ist x ∈ X und ε > 0, so wahle n so, daß ‖fn − f‖ < ε/3und die Umgebung U von x so, daß |fn(y)−fn(x)| < ε/3 fur y ∈ U,dann folgt:

|f(x)− f(y)| ≤ |f(x)− fn(x)|+ |fn(x)− fn(y)|+ |fn(y)− f(y)| < ε.

Eine Abbildung f : X → X eines metrischen Raumes in sich heißtkontrahierend mit Kontraktionskonstante λ , 0 ≤ λ < 1, wennfur alle x, y ∈ X gilt:

d(f(x), f(y)

) ≤ λ · d(x, y).

Page 47: Analysis 2 - Broecker

42 II. Der Satz uber die Umkehrfunktion

(1.6) Kontraktionslemma. Eine kontrahierende Abbildung eines

vollstandigen metrischen Raumes in sich besitzt genau einen Fix-

punkt, also es gibt genau einen Punkt x des Raumes, sodaß f(x) = x .

Breitet man zum Beispiel hier im Horsaal einen vorzuglichen Planvon Regensburg aus, so stimmt genau ein Punkt auf dem Plan mitdem dort abgebildeten Punkt der Stadt uberein, er liegt ungefahrdort, wo der Plan den Horsaal abbildet, genauer wo der Plan denPlan abbildet, genauer wo der Plan das Bild des Plans abbildet ...

Beweis: Sei λ die Kontraktionskonstante. Angenommen, x und y

sind Fixpunkte, also f(x) = x und f(y) = y , dann ist

d(x, y) = d(f(x), f(y)

) ≤ λd(x, y),

und weil λ < 1, folgt d(x, y) = 0, die Eindeutigkeit.Die Existenz erhalt man so: Sei fn = f ◦ · · · ◦ f : X → X

die n-fache Zusammensetzung von f mit sich, dann konvergiert furjedes x ∈ X die Folge

(fn(x)

), wie wir gleich zeigen. Ist dann

a = lim(fn(x)

), so

f(a) = f(lim fn(x)

)= lim

(fn+1(x)

)= a,

weil eine kontrahierende Abbildung offenbar stetig ist.Die Folge

(fn(x)

)konvergiert, denn sie ist eine Cauchyfolge. Man

schließt namlich induktiv

d(fn(x), fn(y)

) ≤ λnd(x, y),

und daraus erhalt man:

d(fn(x), fn+k(x)

) ≤ λnd(x, fk(x)) ≤ λn

k−1∑

i=0

d(f i(x), f i+1(x)

)

≤ λnk−1∑

i=0

λid(x, f(x)

) ≤ λn

1− λd(x, f(x)

)→ 0 fur n→∞. �

Page 48: Analysis 2 - Broecker

2. Der Satz uber die Umkehrabbildung 43

Der Satz beschreibt eigentlich, wann ein naheliegendes Iterationsver-fahren zur Losung einer Gleichung f(x) = x zum Ziele fuhrt,das Verfahren, das mit einem ersten Versuch x1 beginnt, und dannxn+1 = f(xn) setzt.

Wir werden das Kontraktionslemma mehrfach anwenden. Im fol-genden Abschnitt wird der metrische Raum eine euklidische Kugelsein, spater aber, wenn wir uns mit Differentialgleichungen befassen,wird der metrische Raum immer ein Raum stetiger Funktionen mitSupremumsnorm sein, und wir werden ohne weitere Erinnerung be-nutzen, daß ein gleichmaßiger Limes stetiger Funktionen stetig ist.

§ 2. Der Satz uber die Umkehrabbildung

Sei U offen in Rn und V offen in Rp , und sei f : U → V einestetig differenzierbare Abbildung. Dann heißt f : U → V diffeo-morph oder ein Diffeomorphismus, falls f eine differenzierbareUmkehrabbildung f−1 : V → U besitzt, so daß also

f−1 ◦ f = idU , f ◦ f−1 = idV .

Das bedeutet: f ist bijektiv, und f−1 ist differenzierbar. Ist f dannk-mal stetig differenzierbar, so gilt fur f−1 dasselbe. Ist namlichu ∈ U und f(u) = v , so ist

D(f−1)(v) ◦Df(u) = idRn ,

Df(u) ◦D(f−1)(v) = idRp ,

also n = p und Df−1(f(u)

)=(Df(u)

)−1 . Damit also f diffeo-morph sein kann, muß jedenfalls Df berall eine regulare Matrix sein.Dann ist

D(f−1) ◦ f = (Df)−1 : U → End(Rn), also

D(f−1) = (Df)−1 ◦ f−1 : V → End(Rn).

Page 49: Analysis 2 - Broecker

44 II. Der Satz uber die Umkehrfunktion

Mit (Df)−1 ist hier inv◦Df , also die inverse Matrix von Df gemeint.Man sieht: Ist f eine Ck-Abbildung und f−1 eine C`-Abbildungmit 1 ≤ ` < k , so ist (Df)−1 ◦ f−1 auch C` , also D(f−1) eine C`-Abbildung, also ist f−1 eine C`+1-Abbildung. Induktiv ergibt sichso, daß f−1 auch k-mal stetig differenzierbar ist.

Wir sagen kurz: f ist invertierbar, wenn wir meinen: f−1 exi-stiert und ist differenzierbar. Wir wissen schon: Ist f invertierbar,so ist Df(u) fur alle u eine regulare (linear invertierbare) Matrix.Nun ist folgendes eine sinnvolle Frage:

Sei f : U → V stetig differenzierbar, surjektiv, und sei Df(u)regular fur alle u ∈ U . Ist dann f diffeomorph?

Im Fall der Dimension 1 ist die Antwort: ja — f ist ja dannstreng monoton, also injektiv. Aber im Hoherdimensionalen kannman so nicht schließen. Betrachten wir zum Beispiel die

Polarkoordinaten der Ebene.

f : R+× R→ C r {0} = R2r {0}, (r, ϕ) 7→ reiϕ = r(cosϕ, sinϕ).

Die Jacobische der Abbildung f ist

cosϕ −r sinϕ

sinϕ r cosϕ

und hat die Determinante r 6= 0. Jedoch ist f nicht injektiv,f(r, ϕ) = f(r, ϕ+ 2π).

Aber f laßt sich lokal, in einer geeigneten Umgebung jedes Punk-tes (r, ϕ) ∈ R+ × R umkehren, zum Beispiel in der UmgebungR+ × (ϕ − π, ϕ + π). Die Jacobische so einer lokalen Umkehrungkonnen wir jetzt berechnen: Ist f(r, ϕ) = (x, y), so ist r =

√x2 + y2 ,

x/r = cosϕ , y/r = sinϕ und

Df−1(x, y) =(Df(r, ϕ)

)−1

=

cosϕ sinϕ

− sinϕr

cosϕr

=

x√x2 + y2

y√x2 + y2

−yx2 + y2

x

x2 + y2

Page 50: Analysis 2 - Broecker

2. Der Satz uber die Umkehrabbildung 45

mit der Determinante r−1 = (x2 + y2)−1/2 .

Aufs Allgemeine zuruckzukommen: Wir nennen eine Ck-Abbil-dung f : U → V lokal um u ∈ U invertierbar, wenn es offeneUmgebungen U1 von u und V1 von v = f(u) gibt, so daß die Ein-schrankung

f | U1 : U1 → V1

definiert und invertierbar ist.

(2.1) Satz uber die Umkehrfunktion. Seien U und V offen in

Rn , sei u ∈ U und f : U → V eine Ck-Abbildung. Genau dann

ist f um u lokal invertierbar, wenn Df(u) regular ist. Die lokale

Umkehrung ist in diesem Fall auch eine Ck-Abbildung.

Beweis: Wie gesagt, ist nur der Fall k = 1 zu betrachten. Auchdarf man nach Translation des Koordinatensystems u = f(u) = 0annehmen. Schließlich darf man Df(0) = id = Einheitsmatrix an-nehmen. Ist namlich Df(0) = A , so hat f ◦ A−1 das Differential idbei 0, und f ◦A−1 ist genau dann lokal umkehrbar, wenn f es ist.

Nach diesen Maßnahmen ist f(0) = 0 und Df(0) = id. Wirwollen insbesondere die Gleichung y = f(x) fur kleine y ∈ Rn nachx auflosen. Wegen Df(0) = id ist f nahe am Ursprung ungefahrdie Identitat. Die gesuchte Losung sollte daher ungefahr x = y sein.Dies schreiben wir hin und addieren die Berichtigung, wir schreibenalso die Gleichung y = f(x), die wir nach x auflosen sollen, in derForm

x = y +(x− f(x)

)=: gy(x).

Diese Gleichung x = gy(x) werden wir fur genugend kleines y ∈ Rnmit dem Kontraktionslemma losen.

Ist denn die Abbildung x 7→ gy(x) kontrahierend? Setzen wir

g(x) := g0(x) = x− f(x),

so istgy(x1)− gy(x2) = g(x1)− g(x2).

Page 51: Analysis 2 - Broecker

46 II. Der Satz uber die Umkehrfunktion

Das y fallt heraus. Wir mussen also nur schauen, ob g kontrahiert.Nun ist Dg(0) = 0, und daher aus Stetigkeit |Dg(x)| < 1/2 furgenugend kleine x . Ist also B(r) =

{x∣∣ |x| ≤ r

}die Kugel vom

Radius r und r > 0 genugend klein gewahlt, so folgt aus (1.5):

(i) Notiz. Sind x1, x2 ∈ B(r) , so ist |g(x1)− g(x2)| ≤ 12 |x1 − x2| .

Setzt man hier x1 = 0, so sieht man, daß g eine Abbildung

g : B(r)→ B(r/2)

induziert, und fur |y| ≤ r/2 induziert gy = y + g daher eine Abbil-dung

gy : B(r)→ B(r),

die nach dem Gesagten wie g mit Kontraktionskonstante 1/2 kon-trahiert. Nach dem Kontraktionslemma hat die Gleichung gy(x) = x

folglich fur |y| ≤ r/2 in B(r) genau eine Losung. Das besagt:

(ii) Zu jedem y ∈ B(r/2) existiert genau ein x ∈ B(r) , mit f(x) = y .

Sei also U1 ={x∣∣ |x| < r und |f(x)| < r/2

}, dann ist U1 offen.

Sei V1 = f(U1), dann ist f : U1 → V1 bijektiv, und wir haben dasPaar inverser Abbildungen

f : U1 → V1, f−1 =: ϕ : V1 → U1.

(iii) Wir mussen zeigen, daß V1 offen und ϕ differenzierbar ist.

Ersteres und die Stetigkeit von ϕ folgt unmittelbar aus folgenderAbschatzung: Sind u , x ∈ B(r), so ist

|x− u| = |g(x) + f(x)− (g(u) + f(u))|

≤ |g(x)− g(u)|+ |f(x)− f(u)| ≤ 12 |x− u|+ |f(x)− f(u)|.

Also gilt:

(iv) |x− u| ≤ 2 |f(x)− f(u)|.

Page 52: Analysis 2 - Broecker

2. Der Satz uber die Umkehrabbildung 47

Setzt man hier u = 0, so ergibt sich |f(x)| < r/2 =⇒ |x| < r furx ∈ B(r). Folglich ist V1 =

{y∣∣ |y| < r/2

}, und dies ist offen in

Rn .

Jetzt sagt aber die Ungleichung (iv) mit y = f(x), v = f(u),ϕ = f−1

|ϕ(y)− ϕ(v)| ≤ 2 |y − v|,also f−1 = ϕ ist stetig. Um zu sehen, daß ϕ differenzierbar ist,bemerke zunachst, daß Df(u) fur alle u ∈ U1 invertierbar ist, weilDf(u) = 1−Dg(u) und |Dg(u)| ≤ 1

2 .

Die Differenzierbarkeit von f bei u bedeutet:

f(x)− f(u) = A(x)(x− u)

fur kleine |x − u| , mit einer von x stetig abhangenden Matrix A ,und es ist dann A(u) = Df(u).

Ist nun f(u) = v und y nahe v , so ist f−1(y) = x und x naheu — das ist die Stetigkeit von ϕ = f−1 , die wir schon wissen; alsobesagt die letzte Gleichung fur kleines |y − v| :

y − v = A(ϕ(y)

)(ϕ(y)− ϕ(v)

).

Weil aber A(ϕ(v)

)= A(u) invertierbar ist, gilt dasselbe fur A

(ϕ(y)

)

wenn y nahe v ist, und wir konnen schreiben

ϕ(y)− ϕ(v) = A−1(ϕ(y)

)(y − v),

und weil wir die Stetigkeit von ϕ schon wissen, ist A−1(ϕ(y)

)stetig

an der Stelle y = v . Das zeigt, daß ϕ = f−1 differenzierbar ist, undzwar stetig, weil Df−1 = (Df)−1 ◦ f−1 . �

Also: Ob eine stetig differenzierbare Abbildung lokal invertierbarist, entscheidet sich allein daran, ob die lineare Approximation in-vertierbar ist. Der Satz uber die Umkehrfunktion ist das klassischeHilfsmittel der elementaren Geometrie differenzierbarer Abbildungen

Page 53: Analysis 2 - Broecker

48 II. Der Satz uber die Umkehrfunktion

neben zwei anderen: Der Taylorschen Formel und dem Existenzsatzfur Losungen von Differentialgleichungen, auf den wir im nachstenBand kommen.

Der erste Teil des Beweises liefert in Wahrheit etwas genauereInformation uber die Große der Umgebungen, auf denen f umkehrbarist, namlich:

(2.2) Zusatz. Sei U offen in Rn und f : U → Rn stetig differen-

zierbar, und fur ein u ∈ U und r > 0 sei{x∣∣ |x− u| ≤ r} ⊂ U , und

es gelte:

|Df(x)− id| ≤ 1/2, falls |x− u| ≤ r.Dann gibt es zu jedem y mit |y − f(u)| ≤ r/2 genau ein x mit

|x− u| ≤ r , so daß f(x) = y .

Nun ist auf{x∣∣ |x − u| ≤ r

}stets |Df | ≤ |Df − id| + |id| ≤ 3

2 ,also |f(x)− f(u)| ≤ 3

2 |x− u| , also folgt:

(2.3) Korollar. Unter den Voraussetzungen von (2.2) gilt:

Ist ρ < r/3 , so ist f |Uρ(u) injektiv, und fUρ(u) ⊃ Uρ/2(f(u)

). �

Der Witz des Korollars ist folgender: Um ρ zu bestimmen, mußman nur wissen: |Df− id| ≤ 1

2 auf einer Kugel mit Radius 3ρ . Dannkann man zugleich fur alle diese f Umgebungen Uρ(u), auf denen f

injektiv ist, und Uρ/2(f(u)

), die im Bild liegen, angeben.

Lokal invertierbare differenzierbare Abbildungen haben fur unsgrundsatzliche Bedeutung. Wir fassen solche Abbildungen als nichtlineare lokale Koordinatentransformationen auf, so wie man in derlinearen Algebra einen linearen Isomorphismus A : Rn → Rn alsAnderung des linearen Koordinatensystems auffassen kann. Mansprach fruher, wenn man U durch eine invertierbare Transforma-tion f : U → Rn auf eine offene Menge des Rn abbildete, auchvon krummlinigen Koordinaten auf U . Den Koordinatenlinien{x+ tei | t ∈ R} auf Rn entsprechen ja hier im allgemeinen krummeKurven {f−1(x+ tei) | t ∈ R} .

Page 54: Analysis 2 - Broecker

3. Gleichungen und Mannigfaltigkeiten 49

Manches von Natur krumme Phanomen der lokalen Geometriesieht, wenn man es in geeignet angepaßten krummlinigen Koordi-naten betrachtet, viel einfacher aus, als in linearen Koordinaten.

Der Satz uber die Umkehrfunktion dient, zu erkennen, welche Ab-bildungen als lokale Koordinatentransformationen geeignet sind, undProbleme der Differentialrechnung — die schwer durchschaubar sind— in solche der linearen Algebra zu verwandeln, die man gut versteht.

§ 3. Gleichungen und Mannigfaltigkeiten

Wo heute in der Mathematik vornehmlich von Abbildungen dieRede ist, da sah man fruher zunachst Gleichungen, die es zu losengalt. Auch der Satz uber die Umkehrabbildung hat eine solche Inkar-nation.

(3.1) Satz (Auflosen von Gleichungen). Sei U offen in Rn und V

offen in Rk , und sei

f : U × V → Rk, (x, y) 7→ f(x, y)

eine C`-Abbildung, so daß

f(u, v) = 0 und det(∂fi/∂yj(u, v)

) 6= 0

fur ein (u, v) ∈ U × V . Dann laßt sich die Gleichung f(x, y) = 0lokal um (u, v) ∈ U × V eindeutig durch C`-Funktionen nach y

Page 55: Analysis 2 - Broecker

50 II. Der Satz uber die Umkehrfunktion

auflosen, das heißt, auf einer Umgebung U1 ⊂ U von u existiert eine

C`-Abbildung η : U1 → V1 ⊂ V , so daß fur x ∈ U1

f(x, η(x)

)= 0, η(u) = v;

und wenn f(x, y) = 0 fur (x, y) ∈ U1 × V1 , so ist y = η(x) .

Beweis: Die Abbildung

ϕ : U × V → Rn × Rk, (x, y) 7→ (x, f(x, y)

)

hat die Jacobimatrix

Dϕ =

1. . . 0

1

∂fi/∂xj ∂fi/∂yj

n Zeilen

}k Zeilen

und diese ist im Punkt (u, v) regular. Auch ist das Diagramm

�ϕ

�f

�pr2

Rk

Rn × RkU × V

Page 56: Analysis 2 - Broecker

3. Gleichungen und Mannigfaltigkeiten 51

kommutativ (f = pr2 ◦ϕ), und durch die Transformation ϕ wird dasProblem, f(x, y) = 0 zu losen, lokal in das Problem, pr2(x, y) = 0zu losen, uberfuhrt. Und dies wird durch y = 0 gelost.

Explizit gesagt: Wir durfen nach dem Satz uber die Umkehrfunktionannehmen, daß ϕ diffeomorph ist. Dann setze

(x, η(x)

):= ϕ−1(x, 0);

es ergibt sich f(x, η(x)

)= pr2ϕ

(x, η(x)

)= pr2(x, 0) = 0, und wenn

f(x, y) = 0, so pr2ϕ(x, y) = 0, das heißt ϕ(x, y) = (x, 0), odery = pr2ϕ

−1(x, 0) = η(x).

Damit haben wir also jedenfalls eine Umgebung W von (u, v)mit f(x, y) = 0 ⇐⇒ y = η(x) fur (x, y) ∈ W . Jetzt wahle eineUmgebung U1 × V1 ⊂W von (u, v) so, daß η(U1) ⊂ V1 . �

Merke: Die stetig differenzierbare Gleichung f(x, y) = 0 ist lokal

eindeutig durch stetig differenzierbare Funktionen nach y losbar, falls

ihre lineare Approximation Df(u, v) · (x, y) = 0 eindeutig nach y

losbar ist.

Die lineare Approximation hat ja in Matrizenschreibweise die Ge-stalt (

∂fi/∂xs(u, v)) · x+

(∂fi/∂yj(u, v)

) · y = 0,

und dies ist genau dann eindeutig nach y auflosbar, wenn die Matrix(∂fi/∂yj(u, v)

)regular ist.

Naturlich kann eine Gleichung eindeutig losbar sein, obwohl ihrelineare Approximation im Ursprung nicht eindeutig losbar ist.

Beispiel. (x − y)2 = 0 hat nur die Losung y = x , aber die lineareApproximation 0 = 0, was von jedem Paar (x, y) gelost wird.

Der Satz uber das Losen von Gleichungen hat viele Anwendungen.

Page 57: Analysis 2 - Broecker

52 II. Der Satz uber die Umkehrfunktion

Beispiel. Sei f : Rn× R→ R das Polynom f(x, t) =∑nk=0 xn−kt

k ,mit x0 = 1. Sei ξ ∈ Rn und α eine einfache Wurzel von f(ξ, t),also sei f(ξ, t) = (t−α) · g(ξ, t), mit g(ξ, α) 6= 0. Dann gilt: In einerUmgebung U von ξ in Rn gibt es genau eine (beliebig oft stetig dif-ferenzierbare) Funktion η : U → R , η(ξ) = α , sodaß f

(x, η(x)

)= 0.

Solche Funktionen η nennt man algebraisch.

Wir durfen uns die Situation wie in folgender Figur vorstellen:

Es ist ja f(ξ, α) = 0, aber ∂∂tf(ξ, α) = g(ξ, α) 6= 0, die Behauptung

folgt aus dem Satz.

Betrachtet man das entsprechende Polynom f(x, t) mit komple-xen Koeffizienten x und Werten in C , so bilden die ξ ∈ C n , wof(ξ, t) mehrfache Wurzeln hat, die Diskriminante. Außerhalb derDiskriminante hat das Polynom f(x, t) jeweils n verschiedene Wur-zeln, die lokal durch differenzierbare Funktionen gegeben sind, abernicht global!

Sei f : U × V → Rk , (x, y) 7→ f(x, y) eine Abbildung wie in(3.1) und η : U → V die (lokal) eindeutig bestimmte Losung derGleichung f(x, y) = 0. Seien U , V schon so gewahlt, daß U = U1

und V = V1 wie im Satz. Dann kann man Dη leicht berechnen. Seinamlich

Dxf := (∂fi/∂xj), Dyf := (∂fi/∂yj),

Page 58: Analysis 2 - Broecker

3. Gleichungen und Mannigfaltigkeiten 53

dann erhalt man aus f(x, η(x)

)= 0 durch Anwenden der Kettenregel

die Gleichung Dxf + Dyf · Dη = 0, also wenn, wie vorausgesetzt,Dyf regular ist,

Dη = −(Dyf)−1 ·Dxf.

Um es genau zu sagen: Wende die Kettenregel auf die Zusammenset-zung

U → U × V −→fRk, x 7→ (

x, η(x)) 7→ 0

an. Die Differentiale sind(

idDη

)und Df = (Dxf,Dyf), also:

0 = (Dxf,Dyf) ·(

idDη

)= Dxf +Dyf ·Dη.

Im Falle einer Funktion von 2 Variablen spezialisiert sich die Formelzu

dy

dx= −∂f/∂x

∂f/∂y, wenn y = η(x), f

(x, η(x)

)= 0.

Der Satz besagt insbesondere, daß das Nullstellengebilde

{(x, y) | f(x, y) = 0} =: M ⊂ Rn+k

lokal um (u, v) durch eine offene Menge U ⊂ Rn parametrisiert wird;die Abbildung U →M , x 7→ (

x, η(x))

trifft M ∩ (U × V ) surjektiv,und die Abbildung pr1 : Rn × Rk → Rn induziert eine UmkehrungM ∩ (U × V )→ U .

Definition. Eine Teilmenge M ⊂ Rn heißt eine k-dimensionaleC`-Untermannigfaltigkeit von Rn , wenn gilt:

Page 59: Analysis 2 - Broecker

54 II. Der Satz uber die Umkehrfunktion

Jeder Punkt p ∈ M besitzt eine offene Umgebung U ⊂ Rn mit

einem C`-Diffeomorphismus

h : U → U ′ ⊂ Rk× Rn−k = Rn, sodaß h(U ∩M) = U ′∩ (Rk×{0}).

Eine solche Abbildung h heißt eine Karte der Untermannigfaltigkeit

M , und eine Familie {hλ : Uλ → U ′λ |λ ∈ Λ} von Karten heißt ein

Atlas der Untermannigfaltigkeit M , wenn M ⊂ ⋃λ∈Λ

Uλ .

Die Mannigfaltigkeit M ⊂ Rn sieht also lokal in geeigneten “krum-men” C`-Koordinaten wie Rk ⊂ Rn aus. Nach Voraussetzung be-sitzt M einen Atlas.

Der Satz uber das Auflosen von Gleichungen besagt:

Ist f : U × V → Rk wie im Satz, so gilt lokal um (u, v), also fureine offene Umgebung W ⊂ U × V :

W ∩ {(x, y) | f(x, y) = 0} =: M

ist eine Untermannigfaltigkeit der Dimension n . Die Abbildung ϕ

im Beweis des Satzes ist eine Karte.

In etwas allgemeinerer Situation ist die allgemeine Losung einesGleichungssystems eine Mannigfaltigkeit. Sei U offen in Rn undf : U → Rk differenzierbar bei u ∈ U , dann ist der Rang von f inu der Rang des Differentials:

rguf := rg Df(u).

Page 60: Analysis 2 - Broecker

3. Gleichungen und Mannigfaltigkeiten 55

Der Punkt u heißt ein kritischer Punkt von f , wenn rgu(f) < k ,und in diesem Fall heißt f(u) ∈ Rk ein kritischer Wert von f . Istx ∈ Rk kein kritischer Wert, so heißt x ein regularer Wert von f ,auch wenn x vielleicht gar kein Wert von f ist. Statt kritisch sagtman auch singular.

Ein kritischer Wert kann durchaus der Bildpunkt vieler regularerPunkte sein. Es genugt, daß in seinem Urbild ein kritischer Punktliegt. Im Urbild eines regularen Wertes hingegen liegen nur regularePunkte, es kann jedoch leer sein. Die leere Menge gilt hier als Unter-mannigfaltigkeit jeder beliebigen Dimension.

(3.2) Satz. Sei U offen in Rn und f : U → Rk eine C`-Abbildung.

Ist w ∈ Rk ein regularer Wert von f , so ist f−1{w} eine Unterman-

nigfaltigkeit der Kodimension k , das heißt der Dimension n− k .

Beweis: Sei u ∈ f−1{w} , dann hat die Abbildung g : U → Rk ,x 7→ f(x) − w , den Rang k in u , und wir interessieren uns fur dasNullstellengebilde

{x ∈ U | g(x) = 0} := M.

Nun ist rg(∂gi/∂xj(u)

)= k , also nach geeigneter Umordnung der

Koordinaten xj oBdA

0 6= det(∂gi/∂xj(u)

)i,j=1,...,k

.

Jetzt sind wir in der Situation von (3.1), explizit gesagt: Die Abbil-dung

ϕ : U → Rn, x 7→ (g1(x), . . . , gk(x), xk+1, . . . , xn

)

hat die Jacobimatrix

Dϕ(u) =

∂gi/∂xj

1

0. . .

1

}k Zeilenn− k Zeilen

weiße Stellen sind Null,

Page 61: Analysis 2 - Broecker

56 II. Der Satz uber die Umkehrfunktion

vom Rang n , und M = ϕ−1({0} × Rn−k). Also ist ϕ eine Kartevon M um u . �

Ein Beispiel fur diese Mannigfaltigkeiten bilden die Hohenlinieneiner Landkarte. Da sei etwa U offen in R2 und f : U → R die (hof-fentlich) stetig differenzierbare Hohenfunktion. Fur jeden regularenWert t ∈ R ist f−1{t} eine Hohenlinie in U . Besonders aufklarendist die Betrachtung dieser Linien in der Umgebung eines Extremumsoder Sattels — in diesen Punkten selbst ist f naturlich singular.

In der linearen Algebra begegnet man den Flachen zweiter Ordnung,wie zum Beispiel

F = {x ∈ Rn | txAx = b}.

Dabei sei A symmetrisch, b 6= 0, und tx die transponierte Zeile zurSpalte x . Dann ist F ⊂ Rn eine 1-kodimensionale Mannigfaltigkeit.Die Abbildung

f : Rn → R, x 7→ txAx− b

hat namlich das Differential Df(x) = 2 txA , wie man leicht sieht,wenn man die Definition des Differentials direkt anwendet. Und

Page 62: Analysis 2 - Broecker

4. Der Tangentialraum 57

txA 6= 0 falls x ∈ F , denn sonst ware txAx = 0, f(x) = 0, alsob = 0. Ein Spezialfall ist uns schon oft begegnet: die Sphare

Sn−1 :={x ∈ Rn ∣∣ |x|2 = 1

}

ist eine solche Flache, wahle fur A die Einheitsmatrix und b = 1. Siewar den Alten das Urbild von Symmetrie und Vollkommenheit undgibt uns Heutigen noch tiefe Ratsel auf, besonders die dreidimensio-nale.

§ 4. Der Tangentialraum

Sei M ⊂ Rm+n eine C`-Untermannigfaltigkeit der Dimension m .Nach Definition haben wir einen Atlas der Untermannigfaltigkeit

{hλ : Uλ → U ′λ ⊂ Rm × Rn |λ ∈ Λ}, M ∩ Uλ = h−1λ (U ′λ ∩ Rm),

wobei wir der Einfachheit halber Rm := Rm × {0} ⊂ Rm × Rn

setzen.

Ahnlich wie fur Kurven wollen wir den Raum der Tangentialvek-toren in einem Punkt p ∈M erklaren.

Definition. Ein Tangentialvektor in p ∈M ist ein Vektor

v = γ(0),

wo γ : D = (−ε, ε)→M ⊂ Rm+n eine stetig differenzierbare Kurve

mit γ(0) = p ist. Die Menge TpM aller Tangentialvektoren heißt der

Tangentialraum von M in p .

Page 63: Analysis 2 - Broecker

58 II. Der Satz uber die Umkehrfunktion

Also TpM ist der Raum aller Geschwindigkeitsvektoren von Kur-ven, die durch p laufen und in M bleiben, in p . Wir zeichnen wiederden zugehorigen affinen Raum TpM + p , die Tangente an p , habenaber zu zeigen, daß TpM uberhaupt ein Vektorraum ist.

Wie immer sind Vektoren in expliziten Rechnungen im Matri-zenkalkul als Spalten zu schreiben, wenn das Differential als Jacobi-Matrix geschrieben wird.

(4.1) Satz. In der beschriebenen Situation gilt: Der Tangentialraum

TpM ist ein m-dimensionaler Untervektorraum von Rn+m .

Ist ϕ : U → U ′ ⊂ Rm× Rn eine Karte um p mit ϕ(p) = 0 , so ist

TpM =(Dϕ(p)

)−1 · Rm = D(ϕ−1)(0)Rm.

Ist U eine offene Umgebung von p in Rm+n und g : U → Rn

differenzierbar vom Rang rgpg = n , und ist g|U ∩M = 0 , so ist

TpM = ker Dg(p).

Beweis: Wir wollen uns zunachst beide Aussagen klar machen:Ist U ∩ M =: V , U ′ ∩ Rm =: V ′ , und ϕ|U ∩ M = ψ , so istψ : V → V ′ ⊂ Rm ein Homoomorphismus der Umgebung V vonp in M mit der Umgebung V ′ von 0 in Rm , und ψ besitzt diestetig differenzierbare Umkehrung ψ−1 = ϕ−1|U ′ ∩ Rm : V ′ → V ,welche M lokal um p durch Koordinaten in V ′ ⊂ Rm parametrisiert.

Page 64: Analysis 2 - Broecker

4. Der Tangentialraum 59

Die erste Aussage ist:

Dψ−1(0)Rm = Tp(M).

In der Tat: Ist γ eine Kurve wie in der Definition von TpM , so istψ ◦ γ lokal um t = 0 definiert und eine stetig differenzierbare Kurvein Rm mit ψγ(0) = 0. Ist umgekehrt γ : (−ε, ε) → Rm , γ(0) = 0stetig differenzierbar, so ist ψ−1 ◦ γ lokal um 0 definiert, verlauft inM , und ψ−1 ◦ γ(0) = p . Als Kurven in der Definition von TpM hatman also die Kurven ψ−1 ◦ γ zu betrachten, wo γ : (−ε, ε) → Rm ,γ(0) = 0. Ihre Geschwindigkeitsvektoren sind die Vektoren

Dψ−1(0) γ(0),

und γ(0) durchlauft offenbar ganz Rm — wahle γ(t) = tv , dann istγ(0) = v . Das ist die erste Behauptung, insbesondere dimTpM = m ,denn Dψ−1(0) = Dϕ−1(0) | Rm hat den Rang m .

Ist nun g wie im Satz, und γ eine Kurve wie in der Definitionvon TpM , so ist g ◦ γ lokal um t = 0 definiert und konstant 0, also

D(g ◦ γ)(0) = Dg(p) γ(0) = 0, d.h. v ∈ ker Dg(p)

fur jeden Tangentialvektor v ∈ TpM . Also

TpM ⊂ ker Dg(p).

Aber dimTpM = m und rg Dg(p) = n , und daher ergibt sich:dim ker Dg(p) = m+ n− n = m , also TpM = ker Dg(p). �

Page 65: Analysis 2 - Broecker

60 II. Der Satz uber die Umkehrfunktion

Also, es nocheinmal zusammenzufassen: Die Mannigfaltigkeit Mwird lokal um p durch eine Karte

Rm ⊃ V ′ −−→ψ−1

V ⊂M

parametrisiert, und der Tangentialraum dann durch die lineare Ap-proximation

Rm −−−−−→Dψ−1(0)

Tp(M) ⊂ Rm+n.

Ist M lokal um p durch Gleichungen g beschrieben,

p ∈ U → Rn, M ∩ U = {x | g(x) = 0}, rgpg = n,

so wird TpM ⊂ Rm+n durch die lineare Approximation der Glei-chungen beschrieben:

TpM = {v ∈ Rm+n |Dg(p)v = 0}.Ist insbesondere g eine Funktion nach R , so kann man Dg · v = 0in der Form schreiben:

〈gradp(g), v〉 = 0, also TpM = gradp(g)⊥

ist der Orthogonalraum von gradp(g).

Beispiel. Die Einheitssphare Sn−1 in Rn ist die MannigfaltigkeitM = {x | 〈x, x〉 − 1 = 0} . Ist f(x) = 〈x, x〉 − 1, so ist gradxf = 2x ,also TxM = {v | 〈x, v〉 = 0} . Der Tangentialraum an Sn−1 in x istorthogonal zum Ortsvektor.

Ist U offen in Rm und f : U → Rn eine C`-Abbildung, so ist derGraph von f

M = {(x, y) | y − f(x) = 0} ⊂ U × Rn

Page 66: Analysis 2 - Broecker

4. Der Tangentialraum 61

eine m-dimensionale Mannigfaltigkeit, denn ist g(x, y) = y − f(x),so ist

(∂gi/∂yj) = (δij)

eine regulare Matrix, und Satz (3.2) anwendbar.

Der Tangentialraum von M in (x, y) ist

{(u, v) | (−Df, id) · t(u, v) = 0} = {(u, v) | v = Df(x) · u}.

Mit anderen Worten: Das Differential Df(x) beschreibt den Tangen-tialraum an den Graphen.

Fuhrt man um p ∈ M lokale Koordinaten, das heißt, fuhrtman eine Karte p ∈ U −→

ϕU ′ ⊂ Rm × Rn , und damit

U ∩M = V −−−−→ψ=ϕ|V

V ′ ⊂ Rm, ψ(p) = 0,

ein, so istTpM = Dψ−1(0) · Rm.

Also Tangentialvektoren sind bezuglich einer Karte durch reelle

Page 67: Analysis 2 - Broecker

62 II. Der Satz uber die Umkehrfunktion

m-Tupel v ∈ Rm gegeben. Physiker beschreiben gerne alles inlokalen Koordinaten, und manchmal bleibt einem auch nichts anderesubrig, um etwa einen bestimmten Vektor explizit hinzuschreiben.Dann muß man naturlich angeben, wie das, was man fur eine Kartebeschrieben hat, nun aussieht, wenn man die Karte wechselt. Schaunwir mal, was sich da bei den Tangentialvektoren tut:

Hat man außer dem lokalen Koordinatensystem ϕ beziehungsweiseψ um p noch ein anderes Koordinatensystem

U1 −→ϕ1

U ′1 ⊂ Rm × Rn,

und damit entsprechend

V1 −−−−−−→ψ1=ϕ1|V1

V ′1 ⊂ Rm, ψ1(p) = 0,

so entspricht einem m-Tupel v ∈ Rm bezuglich der Koordinaten ψ

der Tangentialvektor Dψ−1(0) · v ∈ TpM , und diesem das m-Tupel

Dϕ1(p)Dψ−1(0) · v = D(ψ1ψ−1)(0) · v ∈ Rm

Page 68: Analysis 2 - Broecker

4. Der Tangentialraum 63

bezuglich der Koordinaten ψ1 . Die Abbildung ψ1 ◦ ψ−1 bezeichnetman als Kartenwechsel (Koordinatentransformation) zwischenψ und ψ1 . Sie ist auf einer Umgebung des Ursprungs definiert.

Wir konnen daher den Tangentialraum auch so beschreiben: Be-zuglich lokaler Koordinaten ist ein Tangentialvektor in TpM

m durchein m-Tupel v ∈ Rm gegeben (namlich als Dψ−1(0)v ). Wech-selt man das Koordinatensystem, so wird das m-Tupel mit der Ja-cobischen des Koordinatenwechsels transformiert. Physiker sagendafur kurz: Ein Vektor ist ein m-Tupel, das sich kontravariant trans-formiert.

Ist U offen in Rn und p ∈ U , so hat man einen kanonischenIsomorphismus

TpU = Rn.

Man ordnet jedem Vektor v ∈ Rn den Weg γ(t) = p + tv unddamit den Tangentialvektor γ(0) ∈ TpU zu. Ist W ⊂ Rk offen undf : U → W differenzierbar, so ordnet f jedem Weg γ durch p denWeg f ◦ γ durch f(p) ∈W zu, und definiert so eine Abbildung

Tpf : TpU → Tf(p)W, γ(0) 7→ (f ◦ γ).(0),

und die Kettenregel zeigt (f ◦ γ).(0) = Df(p)γ(0), also

Tpf = Df(p) : Rn → Rk.

Das Differential, als lineare Abbildung, ist die durch f induzierteAbbildung der Tangentialraume.

Durch Einfuhren lokaler Koordinaten (Karten) kann man dies,wie viele andere Begriffe, von offenen Mengen des Rn auf Mannig-faltigkeiten ubertragen; wir werden das im nachsten Band systema-tisch tun. Hier nur ein einfaches Beispiel:

Definition. Sei M eine C1-Untermannigfaltigkeit einer offenen Teil-

menge U von Rn , und sei f : U → R stetig differenzierbar. Dann

heißt p ∈ M ein kritischer Punkt von f |M , wenn fur jede C1-

Kurve γ : (−ε, ε)→M ⊂ Rn mit γ(0) = p gilt, daß 0 ein kritischer

Page 69: Analysis 2 - Broecker

64 II. Der Satz uber die Umkehrfunktion

Punkt von f ◦γ : (−ε, ε)→ R ist. Man sagt auch: p ist ein kritischer

Punkt von f unter der Nebenbedingung M .

Ist p ein lokales Extremum von f |M , so ist p ein kritischer Punktvon f |M , weil f ◦ γ zur Zeit τ lokal extremal, also kritisch ist, furjede Kurve γ mit γ(τ) = p .

Nehmen wir zum Beispiel ein mechanisches System, wie das Pen-del. Hier unterliegt der sich bewegende Massenpunkt x der Nebenbe-dingung, daß er sich auf einer Sphare

{x | |x− 0| = r}

aufhalt, und man mochte nun etwa den Punkt minimalen Potentialsunter dieser Nebenbedingung bestimmen.

Die Bedingung an einen kritischen Punkt besagt offenbar:

Df(p) γ(0) = 0

fur die betrachteten Kurven γ , und die sind gerade so gewahlt, daßγ(0) ∈ Tp(M). Demnach also ist f genau dann kritisch in p , wennDf(p) |Tp(M) = 0. Wird M durch Gleichungen beschrieben, soergibt sich folgendes Rechenverfahren:

(4.2) Methode der Multiplikatoren von Lagrange.Sei U offen in Rm+n , und die Mannigfaltigkeit M ⊂ U sei durch

M = {x | g(x) = 0}, g = (g1, . . . , gn) : U → Rn, rgp(g) = n

gegeben. Dann ist f : U → R kritisch in p unter der Nebenbedin-

gung M , genau wenn es λ1, . . . , λn ∈ R gibt, so daß

D(f + λ1g1 + · · ·+ λngn)(p) = 0.

Beweis: f ist kritisch in p unter der Nebenbedingung M , genauwenn

Df(p)|Tp(M) = 0,

Page 70: Analysis 2 - Broecker

4. Der Tangentialraum 65

aber Tp(M) = kerDg(p), also lautet die Bedingung:

Df(p) · v = 0 fur alle v , fur die Dg(p) · v = 0.

Es ist reine lineare Algebra, daß dies bedeutet: Df(p) ist linear ab-hangig von den Dgi(p), was der Satz nur besagt. �

In der Tat, dimTpM = m , auf TpM verschwinden die n un-abhangigen Linearformen Dgi(p), und der Raum aller Linearformen,die auf TpM verschwinden, hat die Dimension n . Also ist Df(p)genau dann in diesem Raum, wenn Df(p) linear von den Dgi(p)abhangt.

Zur Bestimmung des gesuchten kritischen Punktes kommen zu denGleichungen im Satz noch die Gleichungen g(p) = 0 hinzu, die sagen,daß p in M gesucht ist. Im ganzen hat man so m+ 2n Gleichungenfur die m+ 2n Unbekannten (p, λ).

Die Nebenbedingungen, welche die Gleichungen g(x) = 0 ausspre-chen, induzieren die infinitesimalen Nebenbedingungen

G(x) · v = 0, mit G(x) := Dg(x),

fur die Tangentialvektoren an M in x . Daß p kritisch fur f |M ist,heißt, wie gesehen: Df(p) · v = 0 fur alle v , die den infinitesimalenNebenbedingungen

G(p) · v = 0

genugen, und das ist genau dann der Fall, wenn Df(p) Linearkombi-nation der Zeilen von G(p) ist. Das habe ich hier nocheinmal wieder-holt, weil in der Physik auch Nebenbedingungen von vornherein alsinfinitesimale Bedingungen G : U → Hom(Rm+n, Rn) auftreten,ohne daß es eine Mannigfaltigkeit M ⊂ U gabe, sodaß

TpM = {v |G(p) · v = 0}.Dann ist f in p kritisch unter den infinitesimalen Nebenbe-dingungen G , wenn

Df(p) | {v | G(p)v = 0} = 0.

Page 71: Analysis 2 - Broecker

66 II. Der Satz uber die Umkehrfunktion

Auch in diesem Fall infinitesimaler oder nicht integrabler, nichtholonomer Nebenbedingungen gilt:

(4.3) Satz. Genau dann ist p ein kritischer Punkt von f unter der

infinitesimalen Nebenbedingung G , wenn Df(p) eine Linearkombi-

nation der Zeilen von G(p) ist. �

In diesem Fall hat man keine Gleichungen g(p) = 0 fur dengesuchten kritischen Punkt und man findet oft nicht isolierte kritischePunkte.

Beispiel. Eine Studentin fahrt auf dem Einrad vom Radius 1 uberdie Ebene. Die Lage des Rades wird durch zwei Winkel:

und einen Punkt x ∈ U ⊂ R2 , den Punkt, wo das Rad den Bodenberuhrt, beschrieben. Also die Lage des Rades wird durch

(α, β, x) ∈ S1 × S1 × U ⊂ R2 × R2 × R2

beschrieben; der Tangentialraum dieser Mannigfaltigkeit ist R4 injedem Punkt, aber fur den Geschwindigkeitsvektor v = (α, β, x1, x2)der Bewegung gibt es eine Koppelung: Die Bewegung uber U ge-schieht in Richtung α mit Geschwindigkeit β , also

x1 − β cosα = 0, x2 − β sinα = 0,

das heißt G(α, β, x1, x2) =(

0 − cosα 1 00 − sinα 0 1

)beschreibt die in-

finitesimale Nebenbedingung.

Page 72: Analysis 2 - Broecker

4. Der Tangentialraum 67

Unterwirft man das Rad einer Zentralkraft mit einem Potentialf(α, β, x) = ϕ(|x|2), ϕ′ 6= 0, so bleibt es von dieser unbewegt, wenndas Potential unter den Nebenbedingungen kritisch ist, das heißt

Df = 2ϕ′ · (0, 0, x1, x2) = λ1(0,− cosα, 1, 0) + λ2(0,− sinα, 0, 1),

also wenn x1 cosα + x2 sinα = 0, was bedeutet: Die Fahrtrichtungist senkrecht zum Ortsvektor.

Auch der linearen Algebra konnen wir wieder einmal dienen, in-dem wir zeigen:

(4.4) Anwendung der Methode der Multiplikatoren. Sei A eine

symmetrische (n× n)-Matrix und µ = max{ | txAx|

∣∣ |x| = 1}

, dann

ist µ oder −µ ein Eigenwert von A .

Beweis: Das Maximum wird auf Sn−1 := {x| txx =: g(x) = 1}angenommen und zwar in einem Punkt, wo die Funktion

f : Rn → R, x 7→ txAx

kritisch unter der Nebenbedingung g = 1 ist; also gilt in diesem x

Df(x) = 2 txA = λDg(x) = 2λtx,

und das heißt Ax = λx , λ ist ein Eigenwert mit Eigenvektor x . Esfolgt µ = | txAx| = |λ| · |x|2 = |λ| . �

Es ist nicht schwer, induktiv fortfahrend zu zeigen, daß sich A or-thonormal in Diagonalgestalt transformieren laßt. Die Rechnung gibtzugleich eine analytische Deutung der Eigenvektoren: Sie bezeichnendie Richtungen, wo die quadratische Form

x 7→ txAx

auf der Einheitssphare kritisch wird.

In der Physik ist die Funktion f , deren kritische Werte man sucht,oft ein Potential, also Df = grad f eine Kraft, und man deutet da-her die Vektoren λi · grad gi auch als durch die Bewegung auftre-tende Zwangskrafte, normal zur Mannigfaltigkeit M , die das System

Page 73: Analysis 2 - Broecker

68 II. Der Satz uber die Umkehrfunktion

auf der Mannigfaltigkeit halten. Ein Tangentialvektor wird in derklassischen Mechanik in diesem Zusammenhang auch als virtuelleVerruckung bezeichnet.

§ 5. Die Einhullende einer Schar

Im Rn betrachten wir 1-kodimensionale UntermannigfaltigkeitenMc , und zwar eine durch den Parameter c indizierte ganze Scharsolcher Untermannigfaltigkeiten, wobei der Parameter c seinerseitsin einer Untermannigfaltigkeit C ⊂ Rk variiert.

Die Mannigfaltigkeit Mc sei durch eine regulare Gleichung defi-niert, also

Mc = {x ∈ U | f(x, c) = 0}.

Dabei ist U offen in Rn und c ∈ C ⊂ V , was eine offene Menge inRk ist. Die Funktion

f : U × V → R

sei stetig differenzierbar, und die Regularitatsforderung ist

Dxf(x, c) 6= 0 auf Mc fur alle c ∈ C .

Die Gleichung f(x, c) = 0 ist also eine durch c ∈ C parametrisierteSchar von Gleichungen, und jede Gleichung definiert eine Hyper-flache, eine Mannigfaltigkeit der Kodimension 1 in U . Die Einhul-lende oder Enveloppe der Schar (Mc | c ∈ C) ist folgendermaßenerklart:Die Gleichung f(x, c) = 0 definiert auch eine 1-kodimensionale Un-termannigfaltigkeit

M ⊂ U × C ⊂ U × Rk,M = {(x, c) | c ∈ C, f(x, c) = 0},

Page 74: Analysis 2 - Broecker

5. Die Einhullende einer Schar 69

weil D(f |U × C) in Punkten (x, c) ∈ M nicht verschwindet, schonDxf verschwindet ja nicht. Die Enveloppe ist nach Definition dieMenge der kritischen Werte der Projektion

p : M → U, (x, c) 7→ x.

Sie besteht also aus denjenigen x ∈ U , wo fur ein c ∈ C die Abbil-dung p : M = {(x, c) | f(x, c) = 0} → U nicht vollen Rang hat. DieseAbbildung hat notwendig einen Rang ≥ (n− 1), denn M enthalt jadie Untermannigfaltigkeiten {(x, c) | c = c0, f(x, c) = 0} , die durchp diffeomorph auf Mc0 ⊂ U abgebildet werden. Daß p in (x, c) kri-tisch ist, kann man so deuten, daß eine Variation des Scharparametersc von erster Ordnung zu Verschiebungen fuhrt, die in x tangentialzu Mc sind, der Scharparameter verschiebt die Schar tangential zuihren Mannigfaltigkeiten.

Zerlegen wir die Ableitung von f nach ihrer x- und c-Komponentein Rn × Rk , so erhalten wir:

T(x,c)M = {(a, b) | Dx f · a+Dcf · b = 0} ⊂ Rn × TcC,Tp : T(x,c)M −→ TxRn = Rn, (a, b) 7→ a.

Page 75: Analysis 2 - Broecker

70 II. Der Satz uber die Umkehrfunktion

Weil nun nach Voraussetzung Dxf 6= 0, ist diese Abbildung genaudann nicht surjektiv im Punkte (x, c) ∈M , wenn

Dcf · b = 0 fur alle b ∈ TcC.

Daher ergibt sich die

(5.1) Enveloppenbedingung. Die Enveloppe der durch f(x, c) de-

finierten Schar

Mc = {x | f(x, c) = 0}, c ∈ C,

in der offenen Menge U ⊂ Rn besteht aus denjenigen x ∈ Rn , wo

fur einen Parameter c ∈ C gilt

f(x, c) = 0, Dcf(x, c) · b = 0

fur alle Tangentialvektoren b ∈ TcC der Parametermannigfaltigkeit

C . �

Angenommen, die Parametermannigfaltigkeit besteht aus der gan-zen offenen Menge V ⊂ Rk , so ist TcC = Rk , und die Enveloppen-gleichungen sind einfach

(5.2) f(x, c) = 0, Dcf(x, c) = 0.

Ein wichtiger Fall ist aber auch, daß die Untermannigfaltigkeit C

ihrerseits durch ein regulares Gleichungssystem definiert ist:

C = {c ∈ V | g(c) = 0}, g : V → Rr, rg Dg|C = r.

In diesem Fall besagt die zweite Enveloppengleichung

Dcf · b = 0 fur alle b ∈ Rk , fur die Dg · b = 0,

und das heißt wie im Fall der Lagrange-Multiplikatoren:

(5.3) Korollar. Ist C = g−1{0} , und 0 ein regularer Wert der stetig

differenzierbaren Abbildung

g = (g1, . . . , gr) : V → Rr,

Page 76: Analysis 2 - Broecker

5. Die Einhullende einer Schar 71

so liegt x in der Enveloppe der Schar (Mc | c ∈ C) , wenn gilt:

f(x, c) = 0, Dcf(x, c) =r∑

i=1

λiDgi(c)

fur ein c ∈ C und ein r-tupel (λ1, . . . , λr) ∈ Rr . �

Meist rechnet man damit, daß die Enveloppengleichungen wenig-stens ein regulares Gleichungssystem in U×C bilden, jedoch brauchtdas nicht der Fall zu sein, und die Enveloppe kann sehr wild aussehen.

In der Optik und der Theorie der Wellengleichung ordnet maneiner Anfangswellenfront, die durch eine Hyperflache C ⊂ Rn mitn = 2 oder 3 gegeben sei, als Front nach der Zeit t die Enveloppe derSchar der Spharen um Punkte c ∈ C mit Radius t zu (HuygensschesPrinzip). Ist C durch die regulare Gleichung g = 0 beschrieben, soerhalten wir fur die Enveloppe die Gleichungen

g(c) = 0, |x− c|2 = t2, x− c = λ · grad g(c).

Sie ist also der geometrische Ort der Punkte, die auf zu C senkrechten“Strahlen” den Abstand t von C haben.

Bildet man in der Ebene nun die Enveloppe der Schar der Strahlen

{x | x− c = λ · grad g(c)}, c ∈ C,

so erhalt man die sogenannte Evolute der Kurve C .

Page 77: Analysis 2 - Broecker

72 II. Der Satz uber die Umkehrfunktion

In der Optik ist dies die Kaustik, die man als Lichtfigur zumBeispiel in der Kaffeetasse sehen kann.

Man kann nach demselben Muster auch die Enveloppe von Scha-ren von Untermannigfaltigkeiten hoherer Kodimension erklaren undberechnen. Uberhaupt ware in diesem Abschnitt wohl manches ge-nauer auszufuhren. Dazu lade ich in den Ubungen ein.

Im dritten Band werden wir den Mannigfaltigkeiten wieder begeg-nen und einen etwas freieren und vom Rechnerischen gelosten Zuganggewinnen. Da muß sich manches Ratsel losen.

Page 78: Analysis 2 - Broecker

Kapitel III

Maß und Integral

Da mußt er mit dem frommen Heerdurch ein Gebirge, wust und leer.Daselbst erhub sich große Not,viel Steine gab’s und wenig Brot.

Ludwig Uhland

Wir kennen das Riemannintegral fur Funktionen einer Variablenauf einem Intervall [a, b] , und wir haben den zugehorigen Raum F bader auf dem Intervall integrablen Funktionen mit verschiedenen Halb-normen (Seminormen) versehen, wie insbesondere der L1-Norm, diewir jetzt so bezeichnen:

‖f‖1 :=

b∫

a

|f(x)| dx.

Durch Faktorisieren nach dem Unterraum der Funktionen der Norm0 erhalt man damit einen normierten reellen Vektorraum. Ein we-sentlicher Mangel des Riemannintegrals ist, daß dieser Raum nichtvollstandig ist: Cauchyfolgen brauchen nicht zu konvergieren. Demwollen wir jetzt abhelfen. Wir entwickeln die Integrationstheorie inabstrakter Allgemeinheit. Alles ginge ebenso auch fur Funktionenmit Werten in Banachraumen.

Der Leitgedanke ist schon, daß man eben den Raum der inte-grablen Funktionen komplettiert, indem man Grenzwerte fur jede L1-Cauchyfolge hinzunimmt, aber man muß auch diese hinzugenomme-nen Elemente als Funktionen realisieren. Warum? Genugt es nicht,

Page 79: Analysis 2 - Broecker

74 III. Maß und Integral

einfach formal mit Cauchyfolgen umzugehen? In vielen Fallen genugtdas in der Tat nicht. Schon zum Beispiel, um eine L1-CauchyfolgeRiemannintegrabler Funktionen anzugeben, die nicht gegen eine Rie-mannintegrable Funktion konvergiert, wird man, von hoherer Warte,die wir jetzt besteigen wollen, den Grenzwert als Funktion beschrei-ben, die eben auch nach Abanderung um eine Nullfunktion nie Rie-mannintegrabel wird.

§ 1. Meßraume

Auf der reellen Geraden haben wir als naturliche Definitions-gebiete von Funktionen und als Teilmengen, die zu messen waren,immer Intervalle mit ihrer Lange betrachtet. Darauf beruhte dieDefinition und insbesondere die Normierung des Integrals. Aberim Hoherdimensionalen ist es naturlich, weniger einfach aussehendeMengen M zu betrachten, denen man dann statt einer Lange ent-sprechend ein Maß µ(M) zuordnen will. Im R2 sollte man sichunter µ(M) etwa den Flacheninhalt von M und in R3 das Volumenvorstellen. Man kann nicht erwarten, daß jeder Menge so auf sinnvolleWeise ein Maß zugeordnet wird. Wir beginnen also mit Forderungenan das System aller Teilmengen M eines Raumes X — uns interes-siert dann hauptsachlich X = Rn — die man messen kann. Dannformulieren wir Forderungen an das Maß µ(M).

Definition. Ein Meßraum besteht aus einer Menge X 6= ∅ , deren

Elemente wir Punkte nennen, und einer σ-Algebra auf X . Die

σ-Algebra ist eine Menge M von Teilmengen von X , die meßbarheißen, dergestalt, daß folgendes gilt:

(i) ∅ ist meßbar.

(ii) Ist M meßbar, so auch das Komplement {M = X rM .

(iii) Ist (Mj | j ∈ N ) eine abzahlbare Familie meßbarer Mengen, so

ist auch ihre Vereinigung⋃∞j=1Mj meßbar.

Page 80: Analysis 2 - Broecker

1. Meßraume 75

Durch Ubergang zum Komplement folgt, daß auch X meßbar ist,und daß abzahlbare Durchschnitte meßbarer Mengen meßbar sind.Setzt man M ′j = Mj r

⋃j−1k=1Mk , so ist

∞⋃

j=1

Mj =∞⊔

j=1

M ′j

eine disjunkte Vereinigung. Enthalt also M die leere Menge, mitjeder Menge das Komplement, mit zwei Mengen den Durchschnitt,und mit einer Familie (Aj | j ∈ N ) von paarweise disjunkten Men-gen die Vereinigung, so ist M eine σ-Algebra. Eine Abbildungf : X → Y zwischen Meßraumen heißt meßbar, wenn f−1(N)meßbar in X ist, fur jede meßbare Teilmenge N in Y . Zusam-mensetzungen meßbarer Abbildungen sind meßbar, und wir haben sodie Kategorie der Meßraume und meßbaren Abbildungen.

Es gibt viele triviale Beispiele. Ist X 6= ∅ eine beliebige Menge,so kann die σ-Algebra M nur aus ∅ und X bestehen. Das istdie kleinste σ-Algebra auf X . Oder sie kann aus allen Teilmengenbestehen. Das ist die großte σ-Algebra auf X .

Ist X ein Meßraum mit σ-Algebra M und f : X → Y eineAbbildung von Mengen, so hat man auf Y die σ-Algebra f∗M derTeilmengen N ⊂ Y , fur die f−1N in M ist. Diese Algebra heißtdas direkte Bild von M unter f . Dies ist die großte σ-Algebra aufY , fur die f meßbar ist.

Ist S irgendein System von Teilmengen von Y , also eine Teil-menge der Potenzmenge P(Y ), so gibt es eine kleinste σ-Algebraauf Y , die S enthalt: Der Durchschnitt aller σ-Algebren, die S ent-halten: Sie heißt das Erzeugnis M(S) von S . Um festzustellen, obeine Abbildung f : X → Y meßbar ist, braucht man nur zu prufen,ob die Urbilder der Mengen M ∈ S eines Erzeugendensystems S derσ-Algebra von Y in X meßbar sind. Liegen namlich die Erzeugendenim direkten Bild der σ-Algebra von X , so das ganze Erzeugnis.

Page 81: Analysis 2 - Broecker

76 III. Maß und Integral

Als Erzeugnis entsteht der Meßraum, auf den wir eigentlich hin-auswollen. Ist X ein topologischer Raum, so erzeugt die Topologie,also das System aller offenen Teilmengen, eine σ-Algebra auf X . Sieheißt die Borelalgebra auf X . Wenn wir nun hinfort einen topolo-gischen Raum ohne weiteres als Meßraum ansprechen, so ist immerdiese Struktur, die Borelalgebra gemeint. Stetige Abbildungen zwi-schen topologischen Raumen sind dann auch meßbar. Das gilt insbe-sondere fur den Rn , und in diesem Sinne sprechen wir von meßbarenAbbildungen X → Rn und von meßbaren Funktionen X → R . IstX ein Meßraum, so ist eine Abbildung f : X → Rn genau dannmeßbar, wenn das Urbild jeder offenen Menge meßbar ist, weil die of-fenen Mengen ja die Borelalgebra auf Rn erzeugen. Es gibt noch klei-nere Erzeugendensysteme, zum Beispiel das aller Elementarwurfel

(1.1) {x ∈ Rn | zj/2k ≤ xj ≤ (zj + 1)/2k fur j = 1, . . . , n},

mit zj ∈ Z , k ∈ N und x = (x1, . . . , xn).

Jede offene Teilmenge des Rn ist die Vereinigung der (abzahlbarvielen) in ihr enthaltenen Elementarwurfel. In R = R∪{±∞} kannman als Erzeugendensystem das System aller Intervalle

(1.2) (a,∞], a ∈ Q

wahlen, denn durch Differenzbildung erhalt man daraus alle Inter-valle (a, b] , a, b ∈ Q , und daraus durch abzahlbare Vereinigung alleoffenen.

Eine meßbare Funktion ϕ : X → R , die nur endlich viele Werteannimmt, heißt eine Stufenfunktion. Das bedeutet, daß X in end-lich viele meßbare Mengen M1, . . . ,Mk disjunkt zerlegt ist, auf denen

Page 82: Analysis 2 - Broecker

1. Meßraume 77

ϕ jeweils konstant ist. Die fruher von uns betrachteten Treppenfunk-tionen auf R sind Beispiele. Hieraus gewinnen wir nun viele weiteremeßbare Funktionen:

(1.3) Satz. Sei X ein Meßraum.

(i) Eine Funktion f : X → R ist genau dann meßbar, wenn fur

jedes a ∈ Q die Mengen {x | f(x) > a} in X meßbar sind.

(ii) Eine Abbildung f : X → Rn ist genau dann meßbar, wenn ihre

Komponenten f1, . . . , fn meßbar sind.

(iii) Die meßbaren Abbildungen X → Rn bilden einen Vektorraum.

(iv) Ist f : X → Rn meßbar, so auch |f | : X → R .

Sind f, g : X → C meßbar, so auch f · g .

Statt {x | f(x) > a} schreiben wir wie ublich kurz {f > a}.Beweis: (i) folgt, weil R das Erzeugendensystem (1.2) hat, und (ii)ergibt sich analog mit (1.1). Das ubrige folgt, weil die AbbildungenRn × Rn → Rn , (x, y) 7→ λx + µy , ebenso wie Rn → R , x 7→ |x| ,... stetig sind. �

Bemerkenswert ist, daß Meßbarkeit sich auf Grenzwerte ubertragt.

(1.4) Satz.(i) Ist (fj | j ∈ N ) eine Folge meßbarer Funktionen X → R , so

sind auch die punktweise gebildeten Funktionen

sup(fj | j ∈ N ), inf(fj | j ∈ N ), limj→∞

(fj), limj→∞

(fj)

meßbar. Konvergiert (fj) punktweise gegen f , so ist auch f

meßbar.

(ii) Konvergiert eine Folge meßbarer Funktionen fj : X → Rn

punktweise gegen die Funktion f , so ist f meßbar.

(iii) Ist f : X → [0,∞] meßbar, so gibt es eine aufsteigende Folge

ϕ1 ≤ ϕ2 ≤ · · · von Stufenfunktionen ϕj , die punktweise gegen

f konvergiert, also f = sup(ϕj | j ∈ N ) und insbesondere

|ϕj | ≤ |f | .Beweis: (i) Die Menge {supj fj > a} =

⋃∞j=1{fj > a} ist meßbar,

und fur infj fj analog. Daraus folgt dann, daß auch limj→∞(fj) =

Page 83: Analysis 2 - Broecker

78 III. Maß und Integral

infj supk≥j(fk) meßbar ist. Konvergiert (fj) punktweise, so ist dem-nach auch lim(fj) = lim(fj) meßbar. Das zeigt (i), und (ii) folgtnach (1.3, ii). Fur (iii) setze

ϕj(x) = (k − 1) · 2−jfur (k − 1) · 2−j ≤ f(x) < k · 2−j , k ∈ N , k < j2j ,

ϕj(x) = j fur f(x) ≥ j. �

Beachte ubrigens, daß die Folge (ϕj) auf jeder Menge {f < a}gleichmaßig gegen f konvergiert, denn schließlich ist j > a , unddann f − ϕj ≤ 2−j .

(1.5) Folgerung. Genau dann ist f : X → Rn meßbar, wenn f

punktweiser Limes einer Folge von Stufenfunktionen ist.

Beweis: Der Limes von Stufenfunktionen ist meßbar nach (1.4, ii).Fur die Umkehrung darf man nach (1.3, ii) eine meßbare Funktionf : X → R betrachten. Sie zerlegt man:

f = f+ − f−, f+ = max(f, 0).

Die Summanden sind meßbar nach (1.3, iv). Auf sie wendet man(1.4, iii) an. �

Der Unterschied zwischen Funktionen mit Werten in R oder inR ist nicht wesentlich, denn R ist ja homoomorph zu einem abge-schlossenen Intervall in R .

Page 84: Analysis 2 - Broecker

2. Maße 79

Stufenfunktionen nennt man auch einfach oder elementar. DasWort “Treppenfunktionen” brauchen wir spater fur integrable Stufen-funktionen.

§ 2. Maße

Meßbare Mengen wollen wir messen, wir wollen ihnen im Eindi-mensionalen eine Lange, im Zweidimensionalen einen Flacheninhalt,im Dreidimensionalen ein Volumen zuordnen.

Definition. Ein Maß auf einem Meßraum (X,M) ist eine Funktion

µ :M→ [0,∞] mit den Eigenschaften:

(i) µ(∅) = 0 .

(ii) Die Funktion µ ist σ-additiv, das heißt: Ist (Mj | j ∈ N ) eine

Folge paarweise disjunkter meßbarer Mengen, so ist

µ( ∞⋃

j=1

Mj

)=

∞∑

j=1

µ(Mj).

Ein Maßraum (X,M, µ) ist ein Meßraum mit einem Maß.

Dabei rechnen wir mit ∞ nach den Regeln

∞ · 0 = 0 · ∞ = 0,

∞ · a = a · ∞ =∞ fur 0 < a ≤ ∞,∞+ a = a+∞ =∞ fur 0 ≤ a ≤ ∞.

Die Summe der Reihe in der Definition ist entsprechend in [0,∞] zunehmen, wo jede Reihe mit nicht negativen Gliedern konvergiert.

Es gibt sehr einfache Beispiele. Ist M = {∅, X} die kleinsteσ-Algebra, so kann man µ(X) beliebig festsetzen. Fur die großteσ-Algebra, bei der alle Mengen meßbar sind, hat man:

(2.1) Das Dirac-Maß δp fur p ∈ X : Es ist δp(M) = 1 falls p ∈M ,

und δp(M) = 0 sonst.

Page 85: Analysis 2 - Broecker

80 III. Maß und Integral

(2.2) Das Zahlmaß ζ : Es ist ζ(M) die Anzahl der Elemente von

M , wenn diese endlich ist, und sonst ζ(M) =∞ .

Das sind in ihrer Art ganz nutzliche Maße, aber doch nicht das,worauf wir hinauswollen. Vielmehr mochten wir Borelmengen in Rn

messen und dabei fur einen Wurfel W ⊂ Rn als µ(W ) das Pro-dukt der Kantenlangen erhalten. Gibt es so ein Maß? Das ist nichtselbstverstandlich. In diesem Abschnitt wollen wir eine allgemeineKonstruktion vorfuhren, die insbesondere fur R dieses Maß liefert.Im nachsten Kapitel behandeln wir dann Produkte von Maßraumen,und damit auch Rn .

Zunachst wollen wir die Axiome fur Maße etwas naher betrachten.Das Maß µ ist additiv, das heißt, fur A1, A2 ∈M ist

µ(A1 ∪A2) = µ(A1) + µ(A2), wenn A1 ∩A2 = ∅ .

Das folgt aus (ii), wenn man alle folgenden Aj gleich ∅ wahlt. Manerhalt daraus allgemein:

µ(A1 ∪A2) + µ(A1 ∩A2) = µ(A1) + µ(A2),

indem man alles in die disjunkten Teile A1 rA2 , A2 rA1 , A1 ∩A2

zerlegt.Das Maß ist monoton, d. h. fur A ⊂ B aus M ist µ(A) ≤ µ(B),

denn µ(A) + µ(B rA) = µ(B).Fur eine beliebige Folge (An) in M gilt die Abschatzung

(2.3) µ( ∞⋃n=1

An

)≤

∞∑n=1

µ(An).

Setze namlich A′n = An r (A1 ∪ · · · ∪An−1), dann gilt:

µ( ∞⋃n=1

An

)= µ

( ∞⊔n=1

A′n)

=∞∑n=1

µ(A′n) ≤∞∑n=1

µ(An).

Page 86: Analysis 2 - Broecker

2. Maße 81

Ist (An) eine aufsteigende Folge in M , also An ⊂ An+1 fur allen ∈ N , so ist

(2.4) µ(A) = limn→∞

µ(An) fur A =∞⋃n=1

An.

Setze namlich Bn = An r An−1 , dann ist An = B1 ∪ · · · ∪ Bn einedisjunkte Zerlegung, und µ(An) =

∑nj=1 µ(Bj). Fur n → ∞ kon-

vergiert letzteres gegen∑∞j=1 µ(Bj) = µ(

⋃∞j=1Bj) = µ(A).

Ist µ :M→ [0,∞] eine additive Funktion, so ist sie genau dannσ-additiv, wenn sie eine der Eigenschaften (2.3) oder (2.4) hat. Dassieht man leicht, indem man die Argumente zuruckspult.

Jetzt wollen wir schauen, was das Riemannintegral auf dem Wegezu einem Maß auf R schon liefert. Sei also X = R und sei A dasSystem aller endlichen Vereinigungen endlicher Intervalle in R . FurA ∈ A sei

µ(A) =

∞∫

−∞χA(x) dx,

wobei χA die charakteristische Funktion ist (χA(x) = 1 fur x ∈ Aund χA(x) = 0 sonst). Diese Funktionen fur A ∈ A sind ja offenbarRiemann-integrabel. Wir nennen µ auch das Maß auf A , obwohl(X,A, µ) noch kein Maßraum ist, denn A ist keine σ-Algebra. Im-merhin erfullt (X,A, µ) folgende

(2.5) Maßregeln.(i) Das System A von Teilmengen von X ist eine Mengenalge-

bra, d.h. ∅ ∈ A und mit A,B ∈ A sind auch A ∪ B , A ∩ B ,

ArB in A .

(ii) Das Maß µ : A → [0,∞] ist additiv, d.h. µ(∅) = 0 , und

µ(A ∪B) = µ(A) + µ(B) , falls A ∩B = ∅ .

(iii) Das Maß ist σ-additiv, d.h. ist (An) eine Folge paarweise dis-

junkter Mengen in A und ist auch A =⋃∞n=1An in A , so ist

µ( ∞⋃n=1

An

)=

∞∑n=1

µ(An).

Page 87: Analysis 2 - Broecker

82 III. Maß und Integral

(iv) Das Maß ist σ-endlich, d.h. es gibt eine Folge (Sn) in A mit

X =∞⋃n=1

Sn und µ(Sn) < ∞.

Wir werden zeigen, daß sich ein Maß auf einer Mengenalgebra A ,das den Maßregeln genugt, eindeutig fortsetzen laßt zu einem Maßauf der von A erzeugten σ-Algebra M = M(A). Das liefert inunserem Beispiel dann das Maß auf R mit der Borelalgebra. Fur dieExistenz der Fortsetzung braucht man nur die Maßregeln (i) - (iii);man spricht hier auch von einem Pramaß auf A . Die σ-Endlichkeitwird erst gebraucht, damit die Fortsetzung eindeutig bestimmt ist.

Beweis (2.5): Nur (iii) ist nicht trivial. Sei Bn = Ar(A1∪· · ·∪An),dann ist

Bn ∈ A, Bn ⊃ Bn+1,

∞⋂n=1

Bn = ∅,

und wir mussen zeigen:µ(Bn)→ 0.

Sei also ε > 0 gegeben. Zu jedem Bn verschafft man sich einKompaktum Cn ⊂ Bn in A mit µ(Bn r Cn) < ε/2n , zum Bei-spiel als Vereinigung von endlich vielen kompakten Intervallen. FurDn = C1 ∩ · · · ∩ Cn ist dann auch Dn ⊂ Bn und Bn r Dn =⋃nk=1(Bn r Ck) ⊂ ⋃nk=1(Bk r Ck), also

µ(Bn rDn) <n∑

k=1

ε/2k < ε.

Nun sind die Mengen Dn alle kompakt, die Folge (Dn) steigt ab,also Dn ⊃ Dn+1 , und weil Dn ⊂ Bn und der Durchschnitt der Bnleer ist, ist auch der Durchschnitt der Dn leer, also schließlich ist Dn

leer, und von dann an ist µ(Bn) < ε . �

Damit kommen wir zum Hauptergebnis dieses Abschnitts.

(2.6) Satz (von Hahn uber Maßerweiterung). Sei (X,A, µ) eine

Mengenalgebra mit einem Maß, und die Maßregeln (2.5) seien erfullt.

Page 88: Analysis 2 - Broecker

2. Maße 83

Dann laßt sich µ auf genau eine Weise erweitern zu einem Maß auf

der von A auf X erzeugten σ-Algebra M =M(A) , und zwar ist

µ(M) = inf∞∑n=1

µ(An),

wobei das Infimum uber alle Folgen (An) in A zu nehmen ist, fur

die M ⊂ ⋃∞n=1An .

Setzt man nicht voraus, daß das gegebene Pramaß σ-endlich ist,so bildet man hier und im folgenden Lemma (2.7) gelegentlich dasInfimum uber die leere Menge. Das liefert dann immer passend ∞ ,wie man im einzelnen uberprufen mag, aber wir wollen das nichtimmer eigens erwahnen.

Der Beweis des Satzes besteht im wesentlichen aus den folgendenbeiden Aussagen (2.7), (2.8) uber außere Maße, die auch fur sich nichtohne Interesse sind.

Sei N eine σ-Algebra auf X . Ein außeres Maß auf N ist eineFunktion µ∗ : N → [0,∞] mit den Eigenschaften:

(i) µ∗(∅) = 0 .

(ii) Monotonie: Sind A ⊂ B in N , so ist µ∗(A) ≤ µ∗(B) .

(iii) Ist (An) eine Folge in N , so ist

µ∗( ∞⋃n=1

An

)≤

∞∑n=1

µ∗(An).

(2.7) Lemma. Unter den Voraussetzungen des Satzes definiert

µ∗(Y ) := inf∞∑n=1

µ(An),

wobei das Infimum uber alle Folgen (An) in A mit Y ⊂ ⋃∞n=1An

genommen wird, ein außeres Maß auf der σ-Algebra P(X) aller Teil-

mengen von X , und es ist

µ∗(A) = µ(A) fur alle A ∈ A .

Page 89: Analysis 2 - Broecker

84 III. Maß und Integral

Beweis: Zuerst zeigen wir die letzte Gleichung. Sei also A ∈ A .Aus

A ⊂ A ∪∅ ∪∅ ∪ · · ·folgt µ∗(A) ≤ µ(A). Jetzt wahle zu ε > 0 eine Folge (An) in A mitA ⊂ ⋃∞n=1An und

∞∑n=1

µ(An) ≤ µ∗(A) + ε.

Weil A =⋃∞n=1(An ∩A), folgt:

µ(A) ≤∞∑n=1

µ(An ∩A) ≤∞∑n=1

µ(An) ≤ µ∗(A) + ε.

Weil das fur alle ε > 0 gilt, folgt µ(A) ≤ µ∗(A).

Also µ(A) = µ∗(A) fur alle A aus A .

Die Eigenschaften (i), (ii) eines außeren Maßes sind offenbar. Und(iii) folgt mit dem immer wiederkehrenden ε/2n-Beweis: Sei (Yj) eineFolge von Teilmengen von X und ε > 0 gegeben. Wahle eine Folge(Ajn | n ∈ N ) in A mit Yj ⊂

⋃nA

jn und

∞∑n=1

µ(Ajn) ≤ µ∗(Yj) + ε/2j .

Dann ist Y :=⋃j Yj ⊂

⋃n,j A

jn , und

µ∗(Y ) ≤∑

n,j

µ(Ajn) ≤∞∑

j=1

µ∗(Yj) + ε.

Beachte, daß man auch (Ajn | n, j ∈ N ) als Folge abzahlen kann.Dies zeigt µ∗(Y ) ≤∑∞j=1 µ

∗(Yj), und damit die Behauptung. �

Jetzt sei µ∗ ein außeres Maß auf der Potenzmenge von X . Wirnennen eine Teilmenge A von X dann µ∗-meßbar, wenn fur jedeTeilmenge Z von X gilt

µ∗(Z) = µ∗(Z ∩A) + µ∗(Z rA).

Page 90: Analysis 2 - Broecker

2. Maße 85

(2.8) Lemma (von Caratheodory). Sei µ∗ ein außeres Maß auf der

Potenzmenge von X . Sei M das System der µ∗-meßbaren Teilmen-

gen von X . Dann ist M eine σ-Algebra und µ∗ ein Maß auf M .

Beweis: Wir zeigen, daß M eine σ-Algebra ist. Offenbar ist∅ ∈ M , und mit A ist auch X r A in M . Seien nun A,B ∈ M .Wir zeigen A ∩ B ∈ M . Sei also Z ⊂ X eine beliebige Teilmenge.Fur Teilmengen C von X setze C ′ = Z ∩C . Weil B µ∗-meßbar ist,haben wir:

µ∗(A′ ∩B′) + µ∗(A′ rB′) = µ∗(A′).

Addiere beidseits µ∗(ZrA′), dann steht rechts µ∗(Z), weil A ∈M ,also

µ∗(A′ ∩B′) + µ∗(A′ rB′) + µ∗(Z rA′) = µ∗(Z),

und wir mussen zeigen:

µ∗(A′ rB′) + µ∗(Z rA′) = µ∗(Z r (A′ ∩B′)).Das aber gilt, weil A meßbar ist, wahle Z r (A′ ∩B′) statt Z .

Damit wissen wir, daß M eine Mengenalgebra ist.

Page 91: Analysis 2 - Broecker

86 III. Maß und Integral

Seien nun A,B ∈ M disjunkt. Dann folgt fur jede Teilmenge Z

von X

µ∗(Z ∩ (A ∪B)) = µ∗(Z ∩A) + µ∗(Z ∩B).

Wahle namlich Z∩(A∪B) statt Z in der Definition der µ∗-Meßbar-keit. Induktiv folgt fur paarweise disjunkte A1, . . . , An ∈M dann:

µ∗(Z ∩ (A1 ∪ · · · ∪An)) =n∑

k=1

µ∗(Z ∩Ak).

Nun sei (An) eine Folge paarweise disjunkter Teilmengen in M mitVereinigung A . Dann gilt fur jede Teilmenge Z von X :

µ∗(Z) = µ∗(Z ∩ (A1 ∪ · · · ∪An)) + µ∗(Z r (A1 ∪ · · · ∪An))

≥n∑

k=1

µ∗(Z ∩Ak) + µ∗(Z rA)

fur alle n ∈ N . Daher, weil µ∗ ein außeres Maß ist,

µ∗(Z) ≥∞∑

k=1

µ∗(Z ∩Ak) + µ∗(Z rA) ≥ µ∗(Z ∩A) + µ∗(Z rA).

Die umgekehrte Ungleichung

µ∗(Z) ≤ µ∗(Z ∩A) + µ∗(Z rA)

gilt allgemein, weil µ∗ ein außeres Maß ist. Also gilt Gleichheit undA ist meßbar. Damit ist M eine σ-Algebra, und aus

n∑

k=1

µ∗(Ak) = µ∗( n⋃

k=1

Ak

)≤ µ∗

( ∞⋃

k=1

Ak

)≤∞∑

k=1

µ∗(Ak)

folgt durch Ubergang n→∞ , daß µ∗ auch σ-additiv auf M ist.�

Beweis (2.6): Fur die Existenzaussage bleibt A ⊂M zu zeigen. Seialso A ∈ A und Z eine beliebige Teilmenge von X . Die Ungleichung

µ∗(Z) ≤ µ∗(Z ∩A) + µ∗(Z rA)

Page 92: Analysis 2 - Broecker

2. Maße 87

gilt, weil µ∗ ein außeres Maß ist. Fur die Umkehrung sei ε > 0 und(An) eine Folge in A mit Z ⊂ ⋃∞n=1An und

∞∑n=1

µ(An) ≤ µ∗(Z) + ε.

Dann ist Z ∩ A ⊂ ⋃∞n=1(An ∩ A) und Z r A ⊂ ⋃∞

n=1(An r A).Folglich

µ∗(Z ∩A) + µ∗(Z rA) ≤∞∑n=1

µ(An ∩A) +∞∑n=1

µ(An rA)

=∞∑n=1

µ(An) ≤ µ∗(Z) + ε.

Das zeigt die Existenz der Erweiterung von µ zu einem Maß auf dervon A erzeugten σ-Algebra M . Soweit haben wir noch gar nichtbenutzt, daß µ ein σ-endliches Maß auf A ist.

Nun zur Eindeutigkeit. Sei µ das eben konstruierte Maß und ν

ein anderes, die beide auf A ubereinstimmen. Jetzt sei (Sn) die Folgein A mit X =

⋃∞n=1 Sn und µ(Sn) < ∞ . Es genugt nach (2.4), fur

jedes Y ∈M zu zeigen:

ν(Y ∩ Sn) = µ(Y ∩ Sn).

Also genugt zu zeigen: Hat A ∈ A endliches Maß und ist Y ∈ M ,Y ⊂ A , so ist ν(Y ) = µ(Y ). Nach Definition ist

µ(Y ) = inf∞∑n=1

µ(An) = inf∞∑n=1

ν(An),

wobei das Infimum fur alle Folgen (An) in A mit Y ⊂ ⋃∞n=1An

genommen wird. Weil ν(Y ) ≤ ∑∞n=1 ν(An), folgt ν(Y ) ≤ µ(Y ).

Aber auch ν(Ar Y ) ≤ µ(Ar Y ). Jedoch

µ(A) = ν(A) = ν(Ar Y ) + ν(Y ) ≤ µ(Ar Y ) + µ(Y ) = µ(A).

Page 93: Analysis 2 - Broecker

88 III. Maß und Integral

Das zeigt, daß uberall Gleichungen stehen, ν(Y ) = µ(Y ).

Damit ist (2.6) vollstandig bewiesen. �

Das Maß, das wir auf R aus (2.5) und (2.6) gewonnen haben,heißt das eindimensionale Lebesguemaß. Man kann ganz analogauf Rn mit dem Elementarvolumen, dem Produkt der Kantenlangenfur achsenparallele Quader also Produkte endlicher Intervalle, begin-nen und auf dem Wege uber (2.5) und (2.6) das n-dimensionaleLebesguemaß definieren.

Zu jedem Maß µ auf einem Meßraum (X,M) hat man das auße-re Maß µ∗ von (2.7) fur beliebige Teilmengen von X . TeilmengenY ⊂ X mit µ∗(Y ) = 0 heißen Nullmengen. Sie liegen nach Defi-nition in einer meßbaren Menge Mn mit µ(Mn) < 1/n , und damitauch in

⋂∞n=1Mn , einer meßbaren Menge vom Maß 0. Also die Null-

mengen sind genau die Teilmengen einer Menge vom Maß Null. Siebrauchen ansich selbst nicht zu M gehoren, aber sie sind µ∗-meßbarvom Maß Null. Ist namlich Z ⊂ X beliebig und N eine Nullmenge,so ist

µ∗(Z) ≤ µ∗(Z ∩N) + µ∗(Z rN) = µ∗(Z rN) ≤ µ∗(Z),

also die Ungleichungen sind Gleichungen.

Man kann die σ-Algebra M um die Nullmengen erweitern: eineTeilmenge Y von X heißt µ-meßbar, wenn Y Vereinigung einermeßbaren Menge und einer Nullmenge ist. Man pruft sofort nach,daß die µ-meßbaren Mengen wieder eine σ-Algebra bilden, auf diesich µ offenbar eindeutig fortsetzt. Den so entstehenden Maßraumnennt man auch die Lebesgue-Komplettierung von (X,M, µ).Der Ubergang zu dieser Komplettierung ist oft bequem und glattetdie Formulierungen in der Integralrechnung. Ubrigens sind die µ-meßbaren Mengen genau die im obigen Sinne µ∗-meßbaren (warum?).

Man sagt, eine Eigenschaft von Punkten x ∈ X gilt fast uberalloder fur fast jedes x , eigentlich µ-fast uberall, wenn die Ausnah-memenge eine Nullmenge ist.

Page 94: Analysis 2 - Broecker

3. Konstruktion des Integrals 89

Blicken wir noch einmal auf die Konstruktion des Maßes zuruck,so kann man die Idee wie folgt beschreiben: Wir wollen eine Teil-menge Y messen, und wir wollen annehmen, daß Y in einer MengeS liegt, die wir schon messen konnen; etwa in einem großen Wurfelim Falle des Lebesguemaßes. Der Ansatz von Riemann und eigentlichschon von Archimedes ist, daß man Y von außen durch Mengenaus A einschließt, die man schon messen kann. Als Infimum der sogewonnenen oberen Abschatzungen des Volumens erhalt man µ∗(Y ).Ebenso kann man Y von innen durch abzahlbare disjunkte Vereini-gungen von Mengen aus A ausschopfen und gewinnt als Supremumder so gewonnenen unteren Abschatzungen des Volumens µ∗(Y ). Istnun µ∗(Y ) = µ∗(Y ), so hatte man das Maß µ(Y ). Jedoch fuhrtdieser Ansatz nicht zu einem Maß auf einer σ-Algebra. Ist etwaQ die Menge der rationalen Punkte des Einheitsintervalls, so ist Qabzahlbar, also µ(Q) = 0, wenn ein Punkt das Maß 0 hat. Folglichsollte die Menge Y der irrationalen Punkte im Einheitsinvervall dasMaß 1 haben, aber diese Menge enthalt nur punktformige Intervalle,man kann sie nicht passend durch Intervalle ausschopfen.

Der Ansatz von Lebesgue ist nun, daß man zwar die obere Ab-schatzung µ∗(Y ) wie zuvor gewinnt, jedoch fur die untere Abschat-zung bildet man das außere Maß des Komplements µ∗(S r Y ), alsoman setzt

µ∗(Y ) := µ(S)− µ∗(S r Y ).

Der Erfolg rechtfertigt die Mittel.

§ 3. Konstruktion des Integrals

In diesem Abschnitt sei (X,M, µ) ein Maßraum, auf den sichdann alle Aussagen uber meßbare Mengen und Maße beziehen. EineFunktion ϕ : X → R heißt eine Treppenfunktion, wenn ϕ nurendlich viele Werte annimmt, und fur jedes c ∈ R r {0} die Stufe

Page 95: Analysis 2 - Broecker

90 III. Maß und Integral

ϕ−1{c} meßbar mit endlichem Maß ist. Die gewohnten Treppenfunk-tionen ϕ : R → R sind Beispiele, aber auch die charakteristischeFunktion von Q .

Die samtlichen Treppenfunktionen auf X bilden einen reellen Vek-torraum T (µ), sogar eine Algebra mit der gewohnlichen Multiplika-tion von Funktionen. Ist namlich ϕ auf den meßbaren Teilmengen Mi

und ψ auf den Nj konstant, so sind ϕ+ψ und ϕ·ψ auf den Teilmen-gen Mi ∩Nj konstant. Das gegebene Maß liefert sofort ein wohlbe-stimmtes Integral fur Treppenfunktionen. Ist namlich ϕ|Mi = ci ,i = 1, . . . , k , konstant und Mi ∩Mj = ∅ fur i 6= j , so setzen wir

(3.1)∫

X

ϕdµ :=k∑

i=1

ci µ(Mi).

Fur ci = 0 ist hier nach unserer Konvention ci · µ(Mi) = 0, auch furµ(Mi) =∞ .

Dies ist unabhangig von der Zerlegung (Mi | i = 1, . . . , k) vonX, denn hat man eine andere Zerlegung (Nj | j = 1, . . . , `), so geheman zur gemeinsamen Verfeinerung (Mi ∩ Nj) uber. So haben wirdas Integral als lineares Funktional, d.h. als lineare Abbildung

∫: T (µ)→ R, ϕ 7→

X

ϕdµ.

Zur Ausdehnung auf eine großere Funktionenklasse haben wir fruherdie Monotonie des Integrals gefordert und benutzt. Auch das hierbetrachtete Integral ist monoton, aber wir haben auch gelernt, daßein anderer Gesichtspunkt sehr wesentlich ist: Ein Integral liefert ver-schiedene Halbnormen (Seminormen) auf dem Raum der integrablenFunktionen, und es ware erwunscht, auf diese Weise vollstandige Vek-torraume zu erhalten. Diesen Gedanken verfolgen wir jetzt.

Das Integral (3.1) liefert uns auf dem reellen Vektorraum T (µ)die L1-Norm

(3.2) ‖ϕ‖1 :=∫

X

|ϕ| dµ.

Page 96: Analysis 2 - Broecker

3. Konstruktion des Integrals 91

Dies ist (nur) eine Seminorm auf T (µ), wir haben die

(3.3) Eigenschaften einer Seminorm.(i) ‖ϕ‖1 ≥ 0 .

(ii) Positive Homogenitat: Fur λ ∈ R ist ‖λϕ‖1 = |λ| · ‖ϕ‖1 .

(iii) Dreiecksungleichung: ‖ϕ+ ψ‖1 ≤ ‖ϕ‖1 + ‖ψ‖1 .

Zur Norm fehlt die Eigenschaft ‖ϕ‖1 = 0 =⇒ ϕ = 0, aber wirwissen schon, daß das nicht so schlimm ist, denn die Dreiecksunglei-chung und positive Homogenitat liefern, daß die ϕ mit ‖ϕ‖1 = 0einen Unterraum von T (µ) bilden, den Unterraum N (µ) der Null-funktionen. Auf dem Quotienten T (µ)/N (µ) hat man dann einegenuine L1-Norm. Jedenfalls wissen wir, was eine L1-Cauchyfolgein T (µ) ist, namlich eine Folge (ϕn | n ∈ N ) mit der Eigenschaft:Zu jedem ε > 0 existiert ein n ∈ N , sodaß ‖ϕn+k − ϕn‖1 < ε furalle k ≥ 0. Grundlegend fur die Konstruktion des Integrals ist dasfolgende

(3.4) Konstruktionslemma. Eine L1-Cauchyfolge (ϕn) von Trep-

penfunktionen hat stets eine Teilfolge, die fast uberall punktweise

gegen eine Funktion f : X → R konvergiert, und zwar so, daß zu

jedem ε > 0 eine Menge Z vom Maß kleiner ε existiert, außerhalb

von der die Teilfolge gleichmaßig konvergiert.

Beweis: Bestimme rekursiv eine Teilfolge, die wir der Einfachheithalber auch mit (ϕn) bezeichnen, so daß

‖ϕn − ϕk‖1 ≤ 2−2k fur alle k und n ≥ k .

Die Mengen Yk = {|ϕk+1 − ϕk| ≥ 2−k} sind meßbar, und es gilt

2−kµ(Yk) ≤∫|ϕk+1 − ϕk| dµ ≤ 2−2k,

also µ(Yk) ≤ 2−k . Setzen wir daher

Zk =∞⋃

n=k

Yn, so ist µ(Zk) ≤ 2 · 2−k .

Page 97: Analysis 2 - Broecker

92 III. Maß und Integral

Fur x 6∈ Zk gilt dann

|ϕn+1(x)− ϕn(x)| ≤ 2−n fur alle n ≥ k .

Das zeigt, daß die zur Folge (ϕn) assoziierte Reihe∑n(ϕn+1 − ϕn)

auf X r Zk gleichmaßig konvergiert, und µ(Zk) ≤ 2 · 2−k wird furgroße k beliebig klein. Insbesondere konvergiert die Reihe in jedemx 6∈ ⋂∞k=1 Zk , und µ(

⋂∞k=1 Zk) = 0. �

Ist (ϕn) eine L1-Cauchyfolge von Treppenfunktionen, so liefert(∫ϕn dµ) eine Cauchyfolge also konvergente Folge reeller Zahlen,

denn∣∣∣∫ϕj dµ−

∫ϕ` dµ

∣∣∣ =∣∣∣∫

(ϕj − ϕ`) dµ∣∣∣ ≤

∫|ϕj − ϕ`| dµ.

Das Lemma ermutigt daher zu folgender

Definition. Eine Funktion f : X → R heißt integrabel (genauer:

Lebesgue-integrabel), wenn es eine L1-Cauchyfolge (ϕn | n ∈ N ) von

Treppenfunktionen gibt, die fast uberall punktweise gegen f kon-

vergiert. Die Zahl

X

f dµ := limn→∞

X

ϕn dµ

heißt das Integral von f uber X . Ist Y in X meßbar, so ist

Y

f dµ :=∫

X

(χY · f) dµ.

Daß das so erklarte Integral wohldefiniert ist, folgt aus

(3.5) Lemma. Es seien (ϕn) und (ψn) zwei L1-Cauchyfolgen von

Treppenfunktionen, die beide fast uberall punktweise gegen dieselbe

Funktion f : X → R konvergieren. Dann gilt:

limn→∞

‖ϕn − ψn‖1 = 0, also limn→∞

∫ϕn dµ = lim

n→∞

∫ψn dµ.

Page 98: Analysis 2 - Broecker

3. Konstruktion des Integrals 93

Beweis: Die L1-Cauchyfolge τn = ϕn − ψn von Treppenfunk-tionen konvergiert fast uberall punktweise gegen 0 und wir mussenlimn→∞ ‖τn‖1 = 0 zeigen. Weil (τn) ja eine L1-Cauchyfolge ist,genugt es, dies fur eine Teilfolge zu zeigen, und wir gehen zu einerTeilfolge wie in (3.4) uber, die wir wieder mit (τn) bezeichnen. Seinun ε > 0 und k so groß gewahlt, daß

‖τn − τk‖1 < ε fur alle n ≥ k,

und es sei eine meßbare Menge Z in X so gewahlt, daß (τn) aufX r Z gleichmaßig konvergiert und

µ(Z) < ‖τk‖−1 · ε (Supremumsnorm).

Beachte, daß τk nur endlich viele Werte annimmt. Sei M ⊂ X dieMenge, wo τk nicht verschwindet, dann ist µ(M) < ∞ , und wirhaben die Abschatzung:

‖τn‖1 =∫

X

|τn| dµ ≤∫

Z

|τn| dµ +∫

MrZ

|τn| dµ +∫

XrM

|τn| dµ.

Z

|τn| dµ ≤∫

Z

|τn−τk| dµ+∫

Z

|τk| dµ ≤ ‖τn−τk‖1+µ(Z)·‖τk‖ < 2ε.

MrZ

|τn| dµ ≤ ‖τn‖XrZ · µ(M) < ε fur genugend große n .

XrM

|τn| dµ ≤∫

XrM

|τn − τk| dµ +∫

XrM

|τk| dµ ≤ ‖τn − τk‖1 < ε

fur n ≥ k , der zweite Summand verschwindet. Zusammen:

‖τn‖1 < 4ε fur genugend große n . �

(3.6) Regeln fur das Integral.(i) Die integrablen Funktionen f : X → R bilden einen reellen

Vektorraum L1(µ) und das Integral ist eine lineare Abbildung∫

: L1(µ)→ R.

Page 99: Analysis 2 - Broecker

94 III. Maß und Integral

(ii) Monotonie: Sind f, g integrabel und f ≥ g fast uberall, so ist∫

X

f dµ ≥∫

X

g dµ.

(iii) Ist Y meßbar von endlichem Maß, so ist χY integrabel und∫

X

χY dµ =∫

Y

dµ = µ(Y ).

(iv) Zerlegungseigenschaft: Sind Y,Z disjunkt und meßbar, und ist

f : Y ∪ Z → R integrabel (d.h. χY ∪Z · f integrabel auf X ), so

sind f |Y und f |Z integrabel und∫

Y ∪Z

f dµ =∫

Y

f dµ +∫

Z

f dµ.

(v) Ist f integrabel, so auch |f | , und

∣∣∣∫

X

f dµ∣∣∣ ≤

X

|f | dµ =: ‖f‖1

(vi) Die L1-Norm

L1(µ)→ [0,∞), f 7→ ‖f‖1 :=∫

X

|f | dµ

ist eine Seminorm auf L1(µ) und das Integral ist stetig fur diese

Seminorm auf L1(µ) .

(vii) Abanderung einer Funktion auf einer Nullmenge andert weder

die Integrierbarkeit noch gegebenenfalls das Integral.

Beweis: Dies geht ganz von selbst; zum Beispiel fur (i) seien f, g

integrabel und (ϕn), (γn) seien L1-Cauchyfolgen von Treppenfunk-tionen, die fast uberall gegen f beziehungsweise g punktweise kon-vergieren. Dann geht die L1-Cauchyfolge (ϕn + γn) fast uberallpunktweise gegen f + g , und∫

(f + g) := limn

∫(ϕn + γn) = lim

n

∫ϕn + lim

n

∫γn =:

∫f +

∫g.

Page 100: Analysis 2 - Broecker

3. Konstruktion des Integrals 95

Fur (v) sei (ϕn) eine L1-Cauchyfolge, die fast uberall punktweisegegen f geht. Dann geht (|ϕn|) eben da gegen |f | , und wegen

∣∣ |ϕn| − |ϕm|∣∣ ≤ |ϕn − ϕm|, also

∥∥ |ϕn| − |ϕm|∥∥

1≤ ‖ϕn − ϕm‖1,

ist auch (|ϕn|) eine L1-Cauchyfolge. Das weitere ubertragt sich vonden Treppenfunktionen. (ii) und (vi) folgen aus (v) und der Rest istleicht anzufugen. �

Aus (v) hat man, daß auch

(3.7) f+ := 12 (|f |+ f), f− := f+ − f,

und max(f, g) = 12 (f + g) + 1

2 |f − g| mit f und g integrabel sind.

(3.8) Satz. Integrable Funktionen sind µ-meßbar, also meßbar nach

Anderung auf einer Nullmenge. Ist f integrabel, so ist genau dann

‖f‖1 = 0 , wenn f fast uberall verschwindet.

Beweis: Die erste Behauptung folgt nach (1.4), weil f fast uberallpunktweiser Limes von Treppenfunktionen ist. Auch |f | ist inte-grabel, und wir durfen nach (1.4) annehmen, daß |f | Limes eineraufsteigenden Folge (ϕn) von nirgends negativen Stufenfunktionenist. Dies sind Treppenfunktionen. Es ist ja |f | außerhalb einerMenge Z vom Maß µ(Z) < 1 gleichmaßiger Limes von Treppen-funktionen, und ware ϕn = c > 0 auf einer Menge M vom Maßµ(M) = ∞ , so ware schließlich eine Treppenfunktion auf M r Z

großer als c/2, was wegen µ(M r Z) = ∞ nicht sein kann. Istnun ‖f‖1 = 0, so

∫ϕn dµ ≤

∫ |f | = 0, also µ{ϕn > 0} = 0, alsoµ{f > 0} = µ

⋃∞n=1{ϕn > 0} = 0. Die Umkehrung ist trivial. �

Wir entnehmen dem Beweis die

(3.9) Bemerkung. Ist f integrabel, ϕ eine Stufenfunktion und

0 ≤ ϕ ≤ f , so ist ϕ eine Treppenfunktion. Insbesondere ist f fast

uberall der punktweise Limes einer aufsteigenden Folge von Treppen-

funktionen. �

Page 101: Analysis 2 - Broecker

96 III. Maß und Integral

Und nun schließen wir den Weg zur Konstruktion des Integrals,indem wir auf den Anfang zuruckkommen.

(3.10) Normkonvergenzsatz. Sei (fn) eine L1-Cauchyfolge inte-

grabler Funktionen, dann gilt:

(i) Es gibt eine fast uberall punktweise konvergente Teilfolge, die

außerhalb einer Teilmenge von beliebig kleinem Maß gleich-

maßig konvergiert.

(ii) Je zwei solche Grenzfunktionen stimmen fast uberall uberein

und sind integrabel.

(iii) Ist f eine solche Grenzfunktion, so folgt ‖fn − f‖1 → 0 , also

(fn)→ f fur die L1-Norm, und insbesondere

limn→∞

X

fn dµ =∫

X

f dµ.

Beweis (i): Wortlich derselbe wie fur das Konstruktionslemma(3.4), bis auf die Feststellung, daß

Yk = {|fk+1 − fk| ≥ 2−k}

meßbar ist nach (3.8). Fur (ii), (iii) beginnen wir mit der

Vorbemerkung. Ist die integrable Funktion g fast uberall Limeseiner L1-Cauchyfolge (ϕn) von Treppenfunktionen, so folgt:

limn→∞

‖ϕn − g‖1 = 0,

denn nach Definition ist ‖ϕn − g‖1 = limk→∞ ‖ϕn − ϕk‖1 , undlimn→∞ limk→∞ ‖ϕn − ϕk‖1 = 0 nach der Cauchybedingung.

Nun zum Beweis, daß eine Grenzfunktion f integrabel ist, durfenwir annehmen: f(x) = limn→∞ fn(x) punktweise, und gleichmaßigaußerhalb einer Menge vom Maß < ε . Zu jedem n wahle eine Trep-penfunktion τn mit |fn − τn| < 1/n außerhalb einer Menge Zn vomMaß µ(Zn) < 2−n , und ‖fn−τn‖1 < 1/n . Das geht nach der Vorbe-merkung mit fn = g . Dann ist auch (τn) eine L1-Cauchyfolge, denn

‖τ` − τn‖1 ≤ ‖τ` − f`‖1 + ‖f` − fn‖1 + ‖fn − τn‖1.

Page 102: Analysis 2 - Broecker

3. Konstruktion des Integrals 97

Auch konvergiert τn fast uberall gegen f , namlich uberall außerhalbvon

⋂∞k=1

⋃∞n=k Zn =: Z , und

µ( ∞⋃

n=k

Zn

)≤

∞∑

n=k

µ(Zn) ≤∞∑

n=k

2−n = 2 · 2−k,

also µ(Z) = 0, weil µ(Z) ≤ 2−k fur alle k . Damit ist f = lim(τn)integrabel.

Nach der Voruberlegung mit g = f folgt dann ‖τn−f‖1 → 0, unddaher fur die entsprechende Teilfolge (fn) nach der Dreiecksunglei-chung auch ‖fn−f‖1 → 0. Aber (fn) ist eine L1-Cauchyfolge, daher‖fn−f‖1 → 0 allgemein. Ist nun auch g fast uberall Grenzfunktioneiner weiteren Teilfolge von (fn) nach (i), so folgt ‖fn − f‖1 → 0und ‖fn − g‖1 → 0, also ‖f − g‖1 = 0, also f = g fast uberall nach(3.8). �

Jetzt haben wir den reellen Vektorraum L(µ) der integrablenFunktionen mit der L1-Norm. Darin liegt der Unterraum N (µ) derNullfunktionen, d.h. der Funktionen der L1-Norm 0. Dies sinddie Funktionen, die fast uberall verschwinden. Nach (3.10, iii) ist derRaum L(µ) vollstandig fur die L1-Norm, Cauchyfolgen konvergieren.Wir bilden den Quotienten

L1(µ) = L1(µ)/N (µ)

und erhalten so einen vollstandigen normierten Raum mit der in-duzierten L1-Norm ‖f‖1 fur Funktionenklassen f ∈ L1(µ), die wiraber ebenso bezeichnen, wie ihre Reprasentanten in L1(µ). AlsoL1(µ) ist ein Banachraum, und die Elemente haben wir (bis aufVieldeutigkeit auf einer Nullmenge) wieder als Funktionen beschrie-ben. Eine Warnung jedoch: Fur f ∈ L1(µ) hat f(p) im allgemeinenkeinen Sinn, wenn namlich µ{p} = 0. Die L1-Konvergenz bezeichnenwir durch

L1- limn→∞

(fn) = f ⇐⇒ limn→∞

‖fn − f‖1 = 0.

Page 103: Analysis 2 - Broecker

98 III. Maß und Integral

§ 4. Konvergenzsatze

Das Lebesgueintegral ist unter ziemlich schwachen Voraussetzun-gen mit Grenzwertbildung vertauschbar. Das ist ein großer Vorzugdieses Integrals.

(4.1) Satz uber monotone Konvergenz (Beppo Levi). Sei (fn)eine fast uberall monoton steigende Folge integrabler Funktionen, und

die Folge der Integrale (∫Xfn dµ) sei beschrankt. Dann konvergiert

(fn) fast uberall gegen eine integrable Funktion f = L1- lim(fn) , und

insbesondere ∫

X

f dµ = limn→∞

X

fn dµ.

Beweis: Nach dem Normkonvergenzsatz genugt zu zeigen, daß (fn)eine L1-Cauchyfolge ist. Nun, fur ε > 0 und k ≥ n ist

‖fk − fn‖1 =∫

(fk − fn) dµ =∫fk dµ−

∫fn dµ < ε

fur genugend große n , weil die Folge (∫fn dµ) monoton und be-

schrankt, also eine Cauchyfolge ist. �

Man sagt, eine Funktion g : X → R dominiert eine Folge vonFunktionen (fn | n ∈ N ), wenn |fn(x)| ≤ g(x) fur alle n und fastalle x ∈ X gilt.

(4.2) Satz uber dominierte Konvergenz (Lebesgue). Die Folge

(fn) integrabler Funktionen sei von der integrablen Funktion g do-

miniert, und (fn) konvergiere fast uberall gegen f . Dann ist f in-

tegrabel und L1- lim(fn) = f . Insbesondere

limn→∞

X

fn dµ =∫

X

f dµ.

Beweis: Nach dem Normkonvergenzsatz genugt zu zeigen, daß (fn)eine L1-Cauchyfolge ist. Wir durfen annehmen, daß (fn) uberall

Page 104: Analysis 2 - Broecker

4. Konvergenzstze 99

punktweise gegen f konvergiert und |fn| ≤ g uberall gilt. Fur k ≥ 1bilde die Hilfsfunktion

hk(x) = sup{|fn(x)− fm(x)| | n,m ≥ k} ≤ 2g(x).

Behauptung. Die Funktionen hk sind integrabel.

In der Tat, sei n,m ≥ k ; jede Funktion |fn − fm| ist integrabel,also auch max{|fn − fm| | n,m ≤ `} = v` , und weil die Folge (v`)monoton steigt und von 2g dominiert ist, ist auch ihr Supremumintegrabel nach dem Satz uber monotone Konvergenz. Das zeigt dieBehauptung.

Nun bildet (hk) eine monoton fallende Folge integrabler Funktio-nen, und sie konvergiert punktweise gegen Null. Wieder nach demSatz uber monotone Konvergenz ist

limk→∞

∫hk dµ = 0.

Ist also ε > 0 und k genugend groß, so ist

‖fn − fk‖1 =∫|fn − fk| dµ ≤

∫hk dµ < ε. �

Durch die Konvergenzsatze gewinnen wir nun eine etwas bessereVorstellung uber die Gesamtheit der integrablen Funktionen. Wir be-ginnen mit einem Grundvorrat von Funktionen, von denen wir wissen,daß sie integrabel sind. Auf dem Rn sind das die stetigen Funktio-nen, die außerhalb eines Kompaktums verschwinden, und naturlichTreppenfunktionen. Von diesen ausgehend gewinnt man weitere alsGrenzfunktionen nach den Konvergenzsatzen.

Uber das Riemannintegral im Hoherdimensionalen haben wir niegenauer geredet. Es ginge ahnlich wie im Eindimensionalen.

(4.3) Bemerkung. Riemann-integrable Funktionen sind Lebesgue-

integrabel, und beide Integrale sind in diesem Fall gleich.

Beweis: Das Lebesgueintegral erfullt die Integralaxiome (Bd. 1, III,§ 1). Man muß also nur zeigen, daß Riemann-integrable Funktionen

Page 105: Analysis 2 - Broecker

100 III. Maß und Integral

uberhaupt Lebesgue-integrabel sind. Ist f Riemann-integrabel, sohat man eine aufsteigende Folge (ϕn) und eine absteigende Folge(ψn) von Treppenfunktionen, mit

ϕn ≤ f ≤ ψn, und (‖ψn − ϕn‖1)→ 0.

Punktweise konvergiert (ϕn) → ϕ und (ψn) → ψ , und nach demSatz uber monotone Konvergenz sind ϕ und ψ integrabel. Dann istϕ ≤ f ≤ ψ und ‖ψ − ϕ‖1 = 0, also fast uberall ϕ = f = ψ, und f

ist integrabel. �

Das Lebesgueintegral existiert fur viel mehr Funktionen, als dasRiemannintegral. Zum Beispiel die charakteristische Funktion vonQ∩ [0, 1] hat das Lebesgueintegral 0 und kein Riemannintegral. Dasist noch nicht sehr bemerkenswert, weil dies nur eine Nullfunktion ist;nach denen will man ja sowieso faktorisieren. Ein besseres Beispielerhalt man wie folgt: Sei Q = Q ∩ (0, 1) = {qn | n ∈ N } und sei Unein offenes Intervall in (0, 1) um qn der Lange hochstens ε/2n mitε < 1. Dann haben wir

Q ⊂ U :=∞⋃n=1

Un ⊂ (0, 1), µ(U) ≤ ε.

Sei f die charakteristische Funktion von U . Dann ist f punkt-weise und fur die L1-Norm der Limes der monotonen Folge (fn) derRiemann-integrablen charakteristischen Funktionen von U1∪· · ·∪Un ,aber f kann auch nach Abanderung um eine Nullfunktion nichtRiemann-integrabel werden. Die Menge U ist ja offen und dicht undbleibt dicht, wenn man eine Nullmenge herausnimmt, denn da darfman kein Intervall ganz herausnehmen. Also auch nach Abanderungvon f um eine Nullfunktion bleibt das Riemann-Oberintegral stetsmindestens 1, wahrend doch das Lebesgueintegral hochstens ε ist.

(4.4) Ausschopfungssatz. Sei (Mn) eine aufsteigende Folge meß-

barer Mengen, und auf M =⋃∞n=1Mn sei eine Funktion f : M → R

gegeben. Dann ist f genau dann uber M integrabel, wenn f uber

Page 106: Analysis 2 - Broecker

4. Konvergenzstze 101

jedem Mn integrabel ist und die Folge (∫Mn|f | dµ) konvergiert. Ist

das der Fall, so ist

M

f dµ = limn→∞

Mn

f dµ.

Beweis: Ist f uber M integrabel, so auch f und |f | uber jedemMn , und alle Integrale sind durch

∫M|f | dµ beschrankt, also kon-

vergiert (∫Mn|f | dµ). Nun zur interessanten Umkehrung: Die Folgen

(χMn ·f) und (χMn · |f |) konvergieren punktweise gegen χM ·f bzw.χM · |f | . Wenn nun die Folge der Integrale (

∫Mn|f | dµ) beschrankt

bleibt, ist nach dem Satz uber monotone Konvergenz χM · |f | inte-grabel und nach dem Satz uber dominierte Konvergenz auch χM · f ,und die Integralformel gilt. �

(4.5) Beispiel. Ist f : (a, b) → R integrabel auf jedem kompakten

Teilintervall (z.B. stetig), so ist f genau dann Lebesgue-integrabel,

wenn das uneigentliche Integral∫ ba|f(x)| dx konvergiert.

Zum Beweis schopfe man (a, b) durch die Mj = [a+ 1/j, b− 1/j]aus. �

Das uneigentliche Integral ist hier wie fur das Riemannintegraldefiniert.

Hat man ein Integral fur Funktionen f : X → R , so kann mandamit das Integral fur Abbildungen

f = (f1, . . . , fn) : X → Rn

einfach komponentenweise erklaren:

(4.6)∫

X

f dµ :=(∫

X

f1 dµ, . . . ,

X

fn dµ)∈ Rn.

Dies ist mit linearen Abbildungen

A : Rn → Rm, y 7→ Ay, (Ay)i =∑

j

aijyj ,

Page 107: Analysis 2 - Broecker

102 III. Maß und Integral

vertraglich, also

A

X

f dµ =∫

X

Af dµ,

denn das Integral ist linear; es steht ja da:∑

j

aij

X

fj dµ =∫

X

j

aijfj dµ.

Daher ist mit (4.6) das Integral auch wohldefiniert fur Abbildungenf : X → V in einen endlichdimensionalen Vektorraum V . Manfuhrt Basen ein, das Ergebnis ist davon unabhangig. Das hilft zumBeispiel fur V = C . Tatsachlich sind aber die zentralen Beweisebisher so gefaßt, daß V auch ein Banachraum sein darf, oder nochAllgemeineres — aber wir wollens nicht ubertreiben. Der Satz ubermonotone Konvergenz setzt naturlich die Anordnung in R voraus;er ist nur fur Funktionen mit Werten in R sinnvoll.

Konvergensatze sind Stetigkeitssatze, sie fuhren zu Aussagen uberParameterabhangigkeit von Integralen, die wesentlich starker sind, alsunsere fruheren vorlaufigen Feststellungen.

(4.7) Satz (uber Parameterabhangigkeit von Integralen). Sei X ein

Maßraum und p ein Punkt in einer offenen Menge U in Rn . Es sei

eine Funktion

f : X × U → R

gegeben, und fur jedes u ∈ U sei die Funktion

fu : X → R, x 7→ f(x, u)

integrabel. Das Integral definiert die Funktion

g : U → R, u 7→∫

X

fu dµ =:∫

X

f(x, u) dx.

(i) Angenommen alle Funktionen u 7→ f(x, u) , x ∈ X , sind stetig

bei p , und es existiert eine integrable Funktion h : X → R mit

|f(x, u)| ≤ h(x) fur alle (x, u) ∈ X × U.

Page 108: Analysis 2 - Broecker

5. Das Integral nichtnegativer Funktionen 103

Dann ist g stetig bei p .

(ii) Angenommen alle Funktionen u 7→ f(x, u) , x ∈ X haben

stetige partielle Ableitungen Djf(x, u) nach der j-ten Koordi-

nate in Rn und es existiert eine integrable Funktion h : X → Rmit

|Djf(x, u)| ≤ h(x) fur alle (x, u) ∈ X × U.Dann existiert Djg , ist stetig, und

Djg(p) =∫

X

Djf(x, p) dx.

Beweis: (i) folgt unmittelbar aus dem Satz uber dominierte Kon-vergenz, weil in U Stetigkeit dasselbe wie Folgenstetigkeit ist.(ii) folgt mit dem Mittelwertsatz:

g(p+ tej)− g(p)t

=∫

X

Djf(x, p+ ϑtej) dx.

Die rechte Seite konvergiert fur t→ 0 nach (i) gegen∫XDjf(x, p) dx .

So lang der Satz ist, er ist in dieser Form in vielen typischen Fallender Analysis noch gar nicht anwendbar. Man verlangt ja in (i), daßfur jede Folge (un) → p in U die Folge der Funktionen

(f(x, un)

)

auf X punktweise gegen f(x, p) konvergiert. Es genugt, daß das fastuberall gilt, außerhalb einer von der Folge abhangenden Nullmenge inX . Wir wollen nicht versuchen, allen Eventualitaten in einem nochlangeren Satz zu genugen, es kommt nur darauf an zu verstehen, wasdie Konvergenzsatze leisten.

§ 5. Das Integral nichtnegativer Funktionen

In diesem Abschnitt betrachten wir einen Maßraum (X,M, µ),und alle betrachteten Funktionen sind meßbare Funktionen

f : X → [0,∞].

Page 109: Analysis 2 - Broecker

104 III. Maß und Integral

Diesen Funktionen kann man stets sinnvoll ein Integral∫f dµ ∈ [0,∞]

zuordnen. Es geht nur darum, in angemessener Weise mit dem Wert∞ umzugehen. Ist zunachst ϕ : X → [0,∞] eine Stufenfunktion, sosetzen wir ∫

X

ϕdµ =∑

c∈Rc · µ{ϕ = c},

wie es naheliegt; dies ist eine endliche Summe.Fur beliebige meßbare Funktionen f : X → [0,∞] ist dann

(5.1)∫

X

f dµ := sup{∫

X

ϕdµ∣∣ 0 ≤ ϕ ≤ f

}∈ [0,∞],

wobei das Supremum uber alle Stufenfunktionen unter f gebildetwird. Diese Erklarung erlaubt ganz allgemein, Maße durch Integralezu erklaren:

µ(M) =∫

X

χM dµ,

und darin liegt ihr Nutzen. Die Regeln (3.6), soweit sinnvoll, lassensich ubertragen.

Man kann in (5.1) eine Folge (ϕn) von Stufenfunktionen wahlen,soda 0 ≤ ϕn ≤ f und

limn→∞

∫ϕn dµ =

∫f dµ,

und zwar eine aufsteigende Folge, ϕn ≤ ϕn+1 , ersetze nur ϕn durchmax{ϕ1, . . . , ϕn} . Auch kann man die Folge (ϕn) so wahlen, daßsie punktweise gegen f konvergiert: Wahle nach (III, 1.4) eine auf-steigende Folge (ψn) von Stufenfunktionen, die punktweise gegen f

konvergiert, und ersetze ϕn durch max{ϕn, ψn} .

(5.2) Bemerkung. Das Integral (5.1) ist genau dann endlich, wenn

f fast uberall endlich und nach § 3 dort integrabel ist, und in diesem

Fall stimmen beide Integrale uberein.

Page 110: Analysis 2 - Broecker

5. Das Integral nichtnegativer Funktionen 105

Beweis: Ist f nach § 3 integrabel, so sind die Stufenfunktionen ϕn

der eben beschriebenen Folge alle Treppenfunktionen, und nach demSatz uber monotone Konvergenz gilt

∫ϕn dµ→

∫f dµ ∈ R , also gilt

die Behauptung. Ist umgekehrt das Integral (5.1) endlich, so ist ins-besondere f fast uberall endlich, und wir durfen annehmen, uberall.Dann sind wieder alle ϕn Treppenfunktionen, und die Behauptungfolgt nach dem Satz uber monotone Konvergenz. �

Der Satz uber monotone Konvergenz ubertragt sich wie folgt:

(5.3) Satz. Sei fn : X → [0,∞] eine aufsteigende Folge meßbarer

Funktionen mit Supremum f , dann ist

limn→∞

X

fn dµ =∫

X

f dµ.

Beweis: Ist die linke Seite endlich, so sind alle fn nach eventuellerAbanderung auf einer Nullmenge endlich, und die Behauptung folgtnach dem Satz uber monotone Konvergenz. Ist aber die Folge

∫fn dµ

unbeschrankt, so ist ja∫f dµ ≥ ∫

fn dµ fur jedes n , also ist∫f dµ =∞ . �

Nach wie vor heißt auch eine nicht negative Funktion nur dannintegrabel, wenn ihr Integral endlich ist.

Man kann den Zugang zur Integralkonstruktion wie in diesem Ab-schnitt nehmen, indem man eine beliebige reelle Funktion kanonischin nicht negative zerlegt:

f = f+ − f− .

Aber eigentlich ist das eher ein Hintereingang. Allemal ist die In-tegralkonstruktion erst mit dem Normkonvergenzsatz am Ziel. Erzeigt, da das Lebesgueintegral nicht nur gut ist, und besser als zumBeispiel das Riemannintegral, sondern vollendet: Der Raum L1(µ)ist vollstandig.

Page 111: Analysis 2 - Broecker

Kapitel IV

Das euklidische Lebesgueintegral

Voran, voran! nur immer im Lauf,voran, als woll es ihn holen!Vor seinem Fuße brodelt es auf,es pfeift ihm unter den Sohlen.

Annette

Hier kehren wir aus allgemeinen Maßgefilden zuruck zum euklidi-schen Raum. Ein Abschnitt uber Produktmaße fuhrt insbesonderevon R zu Rn mit dem Lebesguemaß. Integrale sind als iterierte Inte-grale einer Variablen mit Gluck wirklich zu berechnen. Ein Haupter-gebnis ist die Transformationsformel, und damit fuhren wir die Inte-gralrechnung zum selben Punkt, wo wir mit der Differentialrechnungaufgehort haben: Wir stehen am Ende, wo die globale Analysis be-ginnen kann.

§ 1. Produkte von Maßraumen

In diesem Abschnitt konstruieren wir aus zwei σ-endlichen Maß-raumen (X,A, µ) und (Y,B, ν) einen Produktraum

(X × Y,A⊗ B, µ⊗ ν).

Induktiv entsteht so aus R mit dem eindimensionalen Lebesguemaßdann Rn mit dem n-dimensionalen Lebesguemaß.

Page 112: Analysis 2 - Broecker

1. Produkte von Maßraumen 107

Auf dem cartesischen Produkt X × Y der gegebenen Maßraumebetrachten wir die Algebra A×B der samtlichen endlichen disjunktenVereinigungen von Rechtecken A×B mit A ∈ A und B ∈ B .

Mit zwei Mengen M,N ∈ A×B sind auch M ∩N und das Komple-ment {M in A×B , wie man leicht nachpruft. Es sei A⊗B die vonA× B auf X × Y erzeugte σ-Algebra.

Sind z.B. A und B die Borelalgebren topologischer Teilraume Xund Y eines Rn , so ist A ⊗ B die Borelalgebra des topologischenProdukts X×Y . Eigentlich benutzt man hier nur, daß die betrachte-ten topologischen Raume eine abzahlbare Basis der Topologie haben.Darauf werden wir in (Bd.3, IV, §1) genauer eingehen.

Wir wollen aus σ-endlichen Maßen µ auf A und ν auf B ein σ-endliches Produktmaß µ⊗ν auf A⊗B konstruieren, das fur Rechteckedas Naheliegende liefert:

(µ⊗ ν)(A×B) = µ(A) · ν(B).

Bevor wir uns dem zuwenden, mussen wir nun doch etwas genauerhinsehen, wie die erzeugte σ-Algebra aus einer gegebenen Algebraentsteht. Wir gehen von einer Situation aus, wie wir sie hier vorge-funden haben: Gegeben sei eine Menge Z mit einer Algebra R vonTeilmengen von Z , fur die gilt:

A,B ∈ R =⇒ A ∩B, und {A ∈ R.Ein System M von Teilmengen von Z heißt monoton, wenn gilt:

(i) Sind Y1 ⊂ Y2 ⊂ · · · alle in M , so auch⋃∞n=1 Yn .

(ii) Sind Y1 ⊃ Y2 ⊃ · · · alle in M , so auch⋂∞n=1 Yn .

Page 113: Analysis 2 - Broecker

108 IV. Das euklidische Lebesgueintegral

(1.1) Lemma (uber monotone Klassen). Sei R eine Mengenalge-

bra auf Z wie oben, und sei M das kleinste monotone System von

Teilmengen von Z , das R enthalt. Dann ist M die von R erzeugte

σ-Algebra.

Beweis: Das System M′ = {Y ∈ M | {Y ∈ M} und ebenso furjedes B ∈M das System MB = {Y ∈M | Y ∩B ∈M} sind wiedermonoton. Ist nun A ∈ R , so auch {A ∈ R , also A ∈ M′ . Das zeigtR ⊂M′ , also M′ =M , und das heißt: Mit Y ist auch {Y in M .

Sind aber A,B ∈ R , so ist A ∩ B ∈ R , und das sagt A ∈ MB .Weil das fur alle A ∈ R gilt, folgt R ⊂ MB , also M = MB furalle B ∈ R . Das wiederum sagt: Ist Y ∈ M und B ∈ R , so istY ∩ B ∈ M . Das heißt B ∈ MY , und weil das fur alle B ∈ R gilt,folgt M =MY , und das bedeutet: Mit Y,Z ist auch Y ∩ Z in M .Damit ist M eine σ-Algebra. �

Auf unser Ziel zuruckzukommen: Die Algebra A ⊗ B entstehtalso aus A× B als kleinstes monotones System von Teilmengen vonX × Y , das A× B enthalt.

Weil die Maße µ, ν auf X und Y in diesem Abschnitt ein furallemal gegeben sind, werden wir in den zugehorigen Integralen imfolgenden oft

dx, dy statt dµ, dν

schreiben. Auch µ(dx) ist sonst ublich. Wir setzen im folgendenvoraus, daß beide Maßraume σ-endlich, also jeweils die Vereinigungeiner Folge von Teilmengen von endlichem Maß sind. Der Konstruk-tion des Produktmaßes und des zugehorigen Integrals dient folgendes

(1.2) Lemma. Sei f : X×Y → [0,∞] eine A⊗B-meßbare Funktion.

Dann gilt:

(i) Jede Funktion fx : Y → [0,∞] , y 7→ f(x, y) , ist B-meßbar.

(ii) Durch x 7→ ∫Yfx dν =:

∫Yf(x, y) dy wird eine A-meßbare

Funktion auf X definiert.

Page 114: Analysis 2 - Broecker

1. Produkte von Maßraumen 109

Beweis: Wir nehmen zunachst an, daß ν(Y ) endlich ist, und be-trachten charakteristische Funktionen f = χM . Sei

M = {M ∈ A⊗ B | f = χM erfullt (i) und (ii)}.

Dieses System von Teilmengen M ⊂ A ⊗ B enthalt alle Rechtecke,also A × B ⊂ M , und es ist monoton: Sind M1 ⊂ M2 ⊂ · · · allein M , so auch

⋃∞n=1Mn , denn das Supremum einer Folge meßbarer

Funktionen ist meßbar, und das Integral ist mit Grenzwerten auf-steigender Folgen vertauschbar (Hier ist das Integral nach III, § 5 in[0,∞] zu nehmen). Ebenso wenn M1 ⊃M2 ⊃ · · · alle in M sind, soauch

⋂∞n=1Mn . Hier bleiben die Integrale

∫χMn

(x, y)dy alle durchν(Y ) beschrankt, und wir konnen den Satz uber dominierte Konver-genz anwenden. Somit ist M = A⊗B , jedenfalls wenn ν(Y ) endlichist.

Ist dies nicht der Fall, so wahle eine steigende Folge Y1 ⊂ Y2 ⊂ · · ·in Y mit ν(Yn) <∞ fur alle n und

⋃∞n=1 Yn = Y . Setzt man dann

Mn = M ∩ (X×Yn), so ist M1 ⊂M2 ⊂ · · · und alle Mn ∈M , nachdem schon Gezeigten. Also

⋃∞n=1Mn = M ∈ M , wieder nach dem-

selben Argument uber monotone Konvergenz. Damit ist M = A⊗B ,also das Lemma gilt fur alle charakteristischen Funktionen meßbarerMengen in X ×Y , damit auch fur alle Stufenfunktionen, und wiedernach dem Satz uber monotone Konvergenz, und weil Meßbarkeit sichauf Grenzfunktionen vererbt, gilt das Lemma allgemein. �

(1.3) Cavalieris Prinzip. Es gibt auf X×Y genau ein Produktmaß

µ⊗ ν : A⊗ B → [0,∞]

mit der Eigenschaft: Fur Rechtecke A×B ∈ A× B ist

(µ⊗ ν)(A×B) = µ(A) · ν(B).

Fur eine meßbare Menge M ∈ A⊗B ist

(µ⊗ ν)(M) =∫

X

(∫

Y

χM (x, y) dy)dx =

Y

(∫

X

χM (x, y) dx)dy.

Page 115: Analysis 2 - Broecker

110 IV. Das euklidische Lebesgueintegral

Setzen wirMy = {x ∈ X | (x, y) ∈M},

so ist∫XχM (x, y) dx = µ(My), und die Formel besagt:

(1.4) (µ⊗ ν)(M) =∫

Y

µ(My) dy.

Beweis: Nach (1.2), mit vertauschten Faktoren auf χM fur f

angewendet, wird durch die rechte Seite von (1.4) eine additive Men-genfunktion auf A ⊗ B definiert, die nach dem Satz (III, 5.3) ubermonotone Konvergenz auch σ-additiv ist, und sie hat den behaupte-ten Wert auf Rechtecken. Die Eindeutigkeit folgt nach der Ein-deutigkeitsaussage im Satz von Hahn (III, 2.6). Naturlich folgt dieandere Integralformel fur µ⊗ν aus Symmetrie der Voraussetzungen.

�Dies erlaubt nun eine neue Beschreibung des Integrals. Sei nam-

lich X ein σ-endlicher Maßraum, den wir uns fur sein Maß µ vervoll-standigt, also um die Nullmengen erweitert denken. Dann ist auchX× R ein Maßraum, der Produktraum von X mit R , wobei R dasLebesguemaß λ tragt. Sei µ⊗ λ das Produktmaß auf X × R .

(1.5) Bemerkung. Ist f : X → R eine meßbare nie negative Funk-

tion, so ist die Menge

Mf := {(x, t) | t < f(x)} ⊂ X × [0,∞)

meßbar in X × [0,∞) , und ihr Maß ist

Page 116: Analysis 2 - Broecker

1. Produkte von Maßraumen 111

(µ⊗ λ)(Mf ) =∫

X

f dx.

Beweis: Die Funktion (x, t) 7→ f(x)− t ist meßbar, daher ist Mf

meßbar, und nach Cavalieri ist

(µ⊗ λ)(Mf ) =∫

X

λ(Mfx ) dx =

X

f(x) dx. �

Jetzt betrachten wir zwei σ-endliche Maßraume X und Y und zei-gen, daß man das Integral einer Funktion f : X ×Y → R als iterier-tes Integral

∫Y

(∫Xf(x, y) dx

)dy berechnen kann (wenn uberhaupt).

Das entsprechende gilt naturlich in umgekehrter Reihenfolge.

(1.6) Satz von Fubini. Seien X und Y zwei σ-endliche Maßraume,

und sei X×Y ihr Produkt mit dem Produktmaß. Sei f : X×Y → Rintegrabel. Dann ist fur fast jedes y ∈ Y auch die Funktion

X → R, x 7→ f(x, y)

integrabel. Die damit fast uberall definierte Funktion

Y → R, y 7→∫

X

f(x, y) dx

ist integrabel, und es gilt:

X×Y

f =∫

Y

(∫

X

f(x, y) dx)dy.

Page 117: Analysis 2 - Broecker

112 IV. Das euklidische Lebesgueintegral

Die analoge Aussage und Formel hat man naturlich aus Symmetrieder Voraussetzungen fur die Integration in umgekehrter Reihenfolge,und man schreibt:

X×Y

f(x, y) dx dy =∫

X

Y

f(x, y) dy dx.

Beweis: Ist f meßbar und nie negativ, so ist die Integralformelein Spezialfall von Cavalieris Prinzip, angewandt auf Mf wie in derBemerkung (1.5), denn

X

f(x, y) dx = (µ⊗ λ)(Mfy ) und

X×Y

f = (µ⊗ ν ⊗ λ)(Mf ).

Ist dabei f integrabel, also das Integral endlich, so muß auch dieFunktion y 7→ ∫

Xf(x, y) dx fast uberall endlich sein, damit ihr In-

tegral endlich bleibt. Das zeigt die Behauptung in diesem Fall unddurch Zerlegung f = f+ − f− dann fur beliebige meßbare Funktio-nen f . Das sind alle integrablen bis auf eine Nullmenge. Ist aberN ⊂ X × Y meßbar vom Maß Null, so ist auch Ny ⊂ X meßbar,und muß nach Cavalieris Prinzip fur fast jedes y das Maß Null ha-ben, weil

∫Yµ(Ny) dy = 0. Ersetzt man f also auf so einer Menge

durch 0, so andert sich nirgends im Satz die Integrabilitat oder dasIntegral. �

Auf dem euklidischen Raum Rn = R×· · ·× R haben wir jetzt dasn-dimensionale Lebesguemaß λn als Produktmaß auf der Borel-

Page 118: Analysis 2 - Broecker

1. Produkte von Maßraumen 113

algebra, das dadurch bestimmt ist, daß es fur ein achsenparallelesQuader das elementare Volumen liefert:

λn([a1, b1]× · · · × [an, bn]

)= (b1 − a1) · · · · · (bn − an).

Das Integral einer Funktion f : Rn → R ist als iteriertes Integraluber eine Variable zu berechnen:

∫f(x) dx =

∫· · ·∫f(x1, . . . , xn) dx1 · · · dxn.

Bildet man Quader mit beliebigen endlichen aber nicht notwendigabgeschlossenen Intervallen, so bilden die samtlichen endlichen dis-junkten Vereinigungen von Quadern eine Mengenalgebra Q , und dasLebesguemaß stimmt auf dieser Algebra mit dem elementaren Volu-men uberein. Allgemein entsteht es aus diesem elementaren Maß aufQ dann durch Erweiterung nach dem Hahnschen Erweiterungssatz,denn Q erzeugt als σ-Algebra die Borelalgebra. Das Lebesguemaßλ(A) = λn(A) einer beliebigen meßbaren Menge A ⊂ Rn ist folglichdas mit λ|Q gebildete außere Maß

(1.7) λ(A) = inf∞∑

j=1

λ(Qj),

wo das Infimum uber alle Folgen von Quadern Qj mit A ⊂ ⋃∞j=1Qj

gebildet wird. Weil jedes Quader Q zu jedem ε > 0 in einer Vereini-gung von Wurfeln Wk mit

∑k λ(Wk) ≤ λ(Q) + ε liegt, erhalt man

mit einem ε/2j-Schluß, daß man statt Quadern bei der Bildung desaußeren Maßes auch immer nur Wurfel nehmen kann. Man entnimmtdaraus, daß das Lebesguemaß durch seinen Wert auf abgeschlossenenWurfeln bestimmt ist.

(1.8) Invarianz des Integrals. Sei A ⊂ Rn eine Lebesgue-meß-

bare Menge.

(i) Translationsinvarianz: Fur v ∈ Rn ist λ(A) = λ(A+ v) , also∫

Rnf(x) dx =

Rnf(x+ v) dx.

Page 119: Analysis 2 - Broecker

114 IV. Das euklidische Lebesgueintegral

(ii) Homogenitat: Fur t ∈ R ist λ(tA) = |t|nλ(A) , fur t 6= 0 also

|t|n∫

Rnf(tx) dx =

Rnf(x) dx.

Beweis: Die Aussage uber die Maße gilt fur Wurfel, also allgemein.Daraus folgt die Aussage uber die Integrale zunachst fur charakteri-stische Funktionen. Beachte χtA(x) = χA(t−1x). Dann folgt sie furTreppenfunktionen, also allgemein. �

Man kann mit dieser Bemerkung und Cavalieris Prinzip das Volumenhinreichend regelmaßiger Korper ausrechnen. Sei zum Beispiel cndas Volumen der n-dimensionalen Kugel Dn =

{x ∈ Rn ∣∣ |x| ≤ 1

}.

Der Durchschnitt von Dn mit der Hyperebene Rn−1 × {s} ist dann(√1− s2 ·Dn−1

)× {s} fur −1 ≤ s ≤ 1, und daher ist

Mit der Substitution s = sin t erhalt man die Rekursion

(1.9) cn = cn−1

π/2∫

−π/2

cosn t dt.

Das Integral werden wir spater weiter untersuchen, siehe (4.11).

Der Schnellweg von Cavalieris Prinzip zum Satz von Fubini, denwir hier beschritten haben, ware fur Funktionen mit Werten in einem

Page 120: Analysis 2 - Broecker

2. Die Transformationsformel 115

Banachraum so nicht mehr gangbar, man mußte da etwas aufwendi-ger mit dem Normkonvergenzsatz argumentieren.

§ 2. Die Transformationsformel

Ein wesentliches Hilfsmittel zur Berechnung eindimensionaler In-tegrale ist die Transformationsformel: Ist ϕ : [a, b] → [ϕ(a), ϕ(b)]eine stetig differenzierbare Parametertransformation, so ist

b∫

a

f ◦ ϕ(t) · ϕ′(t) dt =

ϕ(b)∫

ϕ(a)

f(x) dx.

Fur uns bedeutet das:∫

[a,b]

(f ◦ ϕ) · ϕ′ dt =∫

[ϕ(a),ϕ(b)]

f(x) dx.

Hat man eine orientierungsumkehrende Transformation

ϕ : I = [a, b] → [ϕ(b), ϕ(a)] = ϕI, ϕ′ ≤ 0,

so ergibt sich:

I

(f ◦ ϕ) · ϕ′ =

b∫

a

(f ◦ ϕ) · ϕ′ =

ϕ(b)∫

ϕ(a)

f = −ϕ(a)∫

ϕ(b)

f = −∫

ϕI

f,

also fur eine Transformation ϕ mit ϕ′ 6= 0 allgemein:

(2.1)∫

I

(f ◦ ϕ) · |ϕ′| dt =∫

ϕI

f(x) dx.

Dies ist die Transformationsformel im Eindimensionalen, und die ent-sprechende Aussage fur das Lebesgueintegral im Hoherdimensionalenlautet wie folgt:

(2.2) Transformationsformel. Sei U offen in Rn und ϕ : U → V

ein C1-Diffeomorphismus mit einer offenen Menge V in Rn . Dann

Page 121: Analysis 2 - Broecker

116 IV. Das euklidische Lebesgueintegral

ist eine Funktion f : V → R genau dann integrabel, wenn die Funk-

tion (f ◦ ϕ) · | detDϕ| : U → R integrabel ist. Und es gilt:

V

f(y) dy =∫

U

fϕ(x) · | detDϕ(x)| dx.

Als Rezept zur Transformation hat man also bei der Transforma-tion

y = ϕ(x), dy = | detDϕ(x)| dxeinzusetzen. Man schreibt daher auch

dy

dx=

d(y1, . . . , yn)d(x1, . . . , xn)

:= detDϕ.

Die Transformation ϕ ist ja ein Homoomorphismus und induziertdaher einen Isomorphismus ϕ : A 7→ ϕA der Borelalgebren. Nimmtman fur f die charakteristische Funktion einer meßbaren MengeϕA ⊂ V , und bezeichnet λ das Lebesguemaß, so besagt der Satz:

(2.3) Maßtransformation. Unter den Voraussetzungen von (2.2)

ist fur jede meßbare Menge A in U

λ(ϕA) =∫

A

| detDϕ(x)| dx.

Beachte, daß dies eine Gleichung von Maßen auf U ist.

Zunachst wollen wir uns anschaulich machen, was der Satz eigent-lich bedeutet. Denken wir uns A als kleinen Wurfel um x , so ist ϕ|Anahezu affin, mit linearem Anteil Dϕ(x), und Dϕ(x) ·A ist ein Spatvom Volumen |detDϕ(x)| · λ(A).

Wem aus der Linearen Algebra die Deutung der Determinante alsorientiertes Volumen des Bildspats des Einheitswurfels nicht vertrautist, der sollte sich darauf besinnen, daß die definierenden Eigenschaf-ten der Determinante naheliegende Forderungen an so ein Volumenaussprechen.

Page 122: Analysis 2 - Broecker

2. Die Transformationsformel 117

Beweis der Transformationsformel in sechs Schritten (i) - (vi):(i) Gilt (2.3) fur ϕ : U → V , so gilt (2.2) fur dasselbe ϕ .

Ist f eine Treppenfunktion so folgt aus (2.3) und Linearitat so-fort, daß (f ◦ ϕ) · | detDϕ| integrabel ist, und die Formel gilt. Da-raus erhalt man diese Richtung allgemein zum Beispiel mit demNormkonvergenzsatz. Ist umgekehrt (f ◦ ϕ) · | detDϕ| integrabel, sotransformiere mit ϕ−1 zuruck, und nach dem schon Gesagten folgt,daß f integrabel ist, und die Formel gilt. (i)�

(ii) Es genugt, folgende lokale Aussage zu zeigen: Jeder Punkt p ∈ Uhat eine offene Umgebung W , sodaß die Behauptung (2.3) fur die

Transformation ϕ|W : W → ϕW gilt.

Man hat dann namlich eine abzahlbare Uberdeckung (Wj | j ∈ N )von U mit solchen offenen Mengen Wj , etwa Kugeln mit rationalemRadius und Mittelpunkt. Dann zerlegt man A disjunkt in TeileAj ⊂ Wj und bemerkt, daß beide Seiten von (2.3) fur solche Zer-legungen σ-additiv sind. (ii)�

(iii) (2.3) gilt, wenn ϕ eine Permutation von Koordinaten ist. (iii)�

(iv) (2.3) gilt fur n = 1 , also U ⊂ R .

Die Maße A 7→ λ(ϕA) und A 7→ ∫A|ϕ′| dx auf U stimmen (nach

(2.1) mit f = 1) fur Intervalle A uberein, also auch fur endliche dis-junkte Vereinigungen von Intervallen, und sie haben endlichen Wertfur kompakte Intervalle, also U ist fur beide Maße σ-endlich. Daherstimmen sie nach dem Satz von Hahn (III, 2.6) uberein. (iv)�

Page 123: Analysis 2 - Broecker

118 IV. Das euklidische Lebesgueintegral

(v) Gilt (2.3) und damit (2.2) fur die Transformationen ψ : U → W

und fur ρ : W → V , so gilt (2.2) und damit (2.3) auch fur die

Zusammensetzung ρ ◦ ψ : U → V .

Dies folgt fur (2.2) aus det(D(ρ ◦ψ)

)= det(Dρ) ·det(Dψ). (v)�

(vi) Beweis der lokalen Aussage (ii) durch Induktion nach n . Der An-fang ist (iv). Fur den Induktionsschritt betrachte ϕ : U → V ⊂ Rn

lokal um einen Punkt p ∈ U und ϕ(p) ∈ V . Weil Dϕ 6= 0, durfenwir nach Permutation der Koordinaten in U und V annehmen:

∂ϕ1/∂x1(p) 6= 0.

Dann zerlege ϕ lokal um p wie folgt:

�ϕ

�ψ

�ρ=ϕψ−1

W

VU

ψ(x1, . . . , xn) =(ϕ1(x), x2, . . . , xn

), ρ(y) =

(y1, ρ2(y), . . . , ρn(y)

).

Dies ψ ist in der Tat lokal um p invertierbar, denn die Jacobische ist

∂ϕ1/∂x1 ?

1

0. . .

1

(weiße Stellen sind Null).

Die Zerlegung des Diagramms lehrt mit (v): Man darf annehmen,daß ϕ eine Koordinate festlaßt, und dann nach Permutation derKoordinaten wieder ohne Beschrankung der Allgemeinheit die erste.Also:

ϕ : (t, x) 7→ (t, ϕt(x)

),

ϕt : Ut := U ∩ {x1 = t} → {t} × Rn−1 ⊂ Rn.

Page 124: Analysis 2 - Broecker

2. Die Transformationsformel 119

Dann hat die Jacobische von ϕ die Gestalt

Dϕ =

1 0 · · · 0

? Dϕt

detDϕ(t, x) = detDϕt.

In diesem Fall hilft naturlich die Induktionsannahme und der Satzvon Fubini:

λn(ϕA) =∫

R

λn−1(ϕA)t dt (Cavalieri)

=∫

R

λn−1(ϕtAt) dt

=∫

R

(∫

At

| det(Dϕt)| dλn−1

)dt (Induktionsannahme)

=∫

R

( ∫

Rn−1

χAt · | detDϕ(t, x)| dλn−1

)dt

=∫

RnχA · | detDϕ| dλn (Fubini). �

Wenden wir die Transformationsformel auf eine affine Transformation

ϕ : x 7→ D · x+ v, D ∈ Aut(Rn), v ∈ Rn

an, so ist Dϕ = D , also wenn λ das Lebesguemaß bezeichnet, ist

(2.4) λ(ϕA) = | det(D)| · λ(A)

Page 125: Analysis 2 - Broecker

120 IV. Das euklidische Lebesgueintegral

fur jede meßbare Teilmenge A von Rn . Dies gibt die geometrischeDeutung der Determinante wieder, von der wir bei der Einfuhrungder Transformationsformel ausgegangen sind. Wenn W ein Wurfelder Kantenlange 1 ist, ist danach λ(D ·W +v) = |det(D)| . Das Vor-zeichen der Determinante beschreibt die Orientierung der Abbildung.Das geht uns hier verloren, aber es wird auch in der Analysis wiedererscheinen, wenn es darum geht, den Hauptsatz der Differential- undIntegralrechnung im Hoherdimensionalen zu formulieren.

Eine Bewegung ist eine affine Abbildung, deren linearer AnteilD orthogonal ist. Dann ist | detD| = 1, also sagt die Transforma-tionsformel:

(2.5) Bewegungsinvarianz des Integrals. Ist ϕ : Rn → Rn eine

Bewegung, so ist

λ(ϕA) = λ(A)

fur jede meßbare Teilmenge A von Rn , und allgemein∫

ϕA

f(x) dx =∫

A

fϕ(x) dx. �

Es gibt naturlich noch viele andere Diffeomorphismen mit Jaco-bideterminante 1. In der Theorie der Differentialgleichungen werdenuns solche als divergenzfreie Flusse begegnen. Immerhin zeigt sichhier, daß das Lebesgueintegral auf einem endlichdimensionalen eu-klidischen Raum wohldefiniert, und unabhangig von der Wahl eineseuklidischen Koordinatensystems ist.

§ 3. Nullmengen

In geometrischen Untersuchungen treten maßtheoretische Argu-mente oft nur in der Form auf, daß gewisse Ausnahmemengen alsNullmengen zu erweisen sind. Dafur braucht es weiter keine Maßthe-orie. Eine Nullmenge nennt man auch dunn; sie hat das außere MaßNull, und das heißt nach (1.6):

Page 126: Analysis 2 - Broecker

3. Nullmengen 121

(3.1) Erinnerung. Eine Teilmenge A von Rn ist genau dann dunn,

wenn es zu jedem ε > 0 eine Folge von Wurfeln (Wj) in Rn gibt,

mit

A ⊂∞⋃

j=1

Wj und∞∑

j=1

λ(Wj) < ε.

Dabei ist hier λ(W ) das Produkt der Kantenlangen. Statt Wur-feln kann man auch achsenparallele Wurfel, Quader oder auch Kugelnnehmen, denn jeder Wurfel vom Durchmesser 2r liegt in einer Kugelvom Radius r und jede Kugel vom Radius r in einem Wurfel derKantenlange 2r , sodaß man immer ein Volumen bis auf eine Kon-stante durch das andere abschatzen kann.

(3.2) Satz. Ist A eine Nullmenge in Rn und f : A→ Rn Lipschitz-

stetig, so ist auch f(A) eine Nullmenge in Rn .

Beweis: Sei (Wj | j ∈ N ) eine Wurfeluberdeckung von A mit∑∞j=1 λ(Wj) < ε . Jeder Wurfel Wj enthalte einen Punkt aj ∈ A .

Hat Wj die Kantenlange s , so ist λ(Wj) = sn und |x− aj | ≤√n · s

fur x ∈ Wj . Ist dann |f(x) − f(y)| ≤ L|x − y| fur alle x, y , soinsbesondere |f(x) − f(aj)| ≤ L

√n s fur x ∈ Wj ∩ A . Daher liegt

f(Wj ∩ A) in einem Wurfel der Kantenlange 2L√n s mit dem Vo-

lumen k · sn = k · λ(Wj), wo k = (2L√n)n eine vom Wurfel un-

abhangige Konstante ist. Also liegt f(A) in der Vereinigung einerFolge von Wurfeln mit Volumensumme hochstens k · ε . �

(3.3) Folgerung. Ist A eine Nullmenge in Rn und f : U → Rn

stetig differenzierbar in einer offenen Umgebung U von A , so ist auch

f(A) eine Nullmenge in Rn .

Beweis: Man muß nur zeigen, daß f lokal einer Lipschitzbedingunggenugt. Das folgt aus dem Mittelwertsatz

f(x+ h)− f(x) =

1∫

0

Df(x+ th) dt · h,

wenn man L so wahlt, daß |Df | ≤ L . Vergleiche (II, 1.5). �

Page 127: Analysis 2 - Broecker

122 IV. Das euklidische Lebesgueintegral

Demnach sind zum Beispiel differenzierbare Untermannigfaltigkei-ten M ⊂ Rn kleinerer Dimension dunn in Rn , weil die Einbettungja lokal uber Rk mit k < n faktorisiert. Eine ahnliche Quelle dunnerMengen bietet die

(3.4) Bemerkung. Ist A meßbar in Rn und f : A → R meßbar,

so ist der Graph {(a, f(a)) | a ∈ A} dunn in Rn+1 .

Beweis: Es genugt, dies fur A = Rn zu zeigen, setze f durch 0außerhalb A fort. Der Graph {(x, y) | y − f(x) = 0} ist jedenfallsmeßbar, und schneidet jede Gerade {x = const} in genau einemPunkt, also in einer Nullmenge. Die Behauptung folgt daher nachCavalieri. �

Die Behauptung (3.2) gilt nicht fur beliebige stetige Abbildun-gen, denn eine stetige Kurve kann einen Wurfel ausfullen. Es gibtauch Homoomorphismen der Ebene auf sich, die eine Strecke auf eineMenge von positivem Maß abbilden.

§ 4. Polar- und Zylinderkoordinaten

Wenn die Mengen oder Funktionen, die man messen oder inte-grieren will, besondere Symmetrien aufweisen, wird man die Koor-dinaten entsprechend symmetrisch wahlen. Dafur bringen wir einigewichtige Beispiele.

(4.1) Polarkoordinaten der Ebene. Dies ist die Transformation

P : [0,∞)× [0, 2π]→ C = R2, (r, ϕ) 7→ r · eiϕ = r(cosϕ, sinϕ).

Die Jacobimatrix von P ist

DP =[

cosϕ −r sinϕsinϕ r cosϕ

], det(DP ) = r.

Page 128: Analysis 2 - Broecker

4. Polar- und Zylinderkoordinaten 123

Die Transformation ist zwar am Ursprung singular und hat fur ϕ = 0und ϕ = 2π den gleichen Wert, aber fur die Integralrechnung machtdas nichts, weil die Mengen, die man im Bild- und Urbildraum heraus-nehmen muß, damit die Voraussetzungen der Transformationsformelerfullt werden, das Maß Null haben. Das gilt ebenso fur die folgendenKoordinatensysteme.

Im Hoherdimensionalen kann man zunachst die weiteren Koordi-naten unverandert lassen. So erhalt man fur R3 die

(4.2) Zylinderkoordinaten.

(r, ϕ, z) 7→ (r cosϕ, r sinϕ, z)

mit Jacobi-Determinante r .

Polarkoordinaten gehen aus Koordinaten fur die Sphare bis aufeine Nullmenge hervor. Von der Sphare Sn−1 kommt man dann zumRn durch die Transformation

(4.3) R+ × Sn−1 → Rn r {0}, (r, ξ) 7→ r · ξ.

Koordinaten fur die Sphare entstehen induktiv durch die Transfor-mation

(4.4) Sn−1 × [0, π]→ Sn, (ξ, ϑ) 7→ (sinϑ · ξ, cosϑ),

die den Rand Sn−1 × {0, π} auf den Nord- und Sudpol (0,±1) vonSn abbildet und im ubrigen regular ist.

Page 129: Analysis 2 - Broecker

124 IV. Das euklidische Lebesgueintegral

So erhalt man, von den ebenen Polarkoordinaten ausgehend, auf demeuklidischen Raum R3 die

(4.5) Kugelkoordinaten.

Φ : (r, ϕ, ϑ) 7→ r(sinϑ cosϕ, sinϑ sinϕ, cosϑ),

fur r ≥ 0 , 0 ≤ ϕ ≤ 2π , 0 ≤ ϑ ≤ πdetDΦ = −r2 sinϑ.

So geht es induktiv weiter, und fur Rn hat man die

(4.6) Polarkoordinaten fur Rn .

Φn(r, ϕ, ϑ1, . . . , ϑn−2)

=(sinϑn−2 · Φn−1(r, ϕ, ϑ1, . . . , ϑn−3), r cosϑn−2

),

fur r ≥ 0 , 0 ≤ ϕ ≤ 2π , 0 ≤ ϑj ≤ π .

Die Jacobimatrix hat die Gestalt

DΦn =

sinϑn−2DΦn−1 cosϑn−2Φn−1

cosϑn−2, 0, . . . , 0 −r sinϑn−2

Page 130: Analysis 2 - Broecker

4. Polar- und Zylinderkoordinaten 125

Fur die Funktionaldeterminante dn von Φn entnimmt man darausdurch Entwicklung nach der letzten Zeile unter Berucksichtigung vonr ∂/∂rΦn−1 = Φn−1 die Rekursionsformel:

dn = −(cosϑn−2)2r(sinϑn−2)n−2dn−1 − r(sinϑn−2)ndn−1

= −r(sinϑn−2)n−2dn−1, also

(4.7) dn = (−)nrn−1 · sinϑ1 · (sinϑ2)2 · . . . · (sinϑn−2)n−2.

Wir wollen uns den Nutzen solcher Transformation in einigen An-wendungen vor Augen fuhren. Zylinderkoordinaten sind angebracht,wenn die zu integrierende Funktion rotationssymmetrisch um die z-Achse ist. Betrachten wir zum Beispiel eine meßbare Menge in derpositiven Halbebene:

A ⊂ R2+ := {(r, z) | r > 0}.

Durch Rotation um die z-Achse entsteht daraus der Rotationskorper

V = {(r cosϕ, r sinϕ, z) | (r, z) ∈ A, 0 ≤ ϕ ≤ 2π}.

Das Volumen von V ist

λ3(V ) =∫χA(r, z) r dr dz dϕ = 2π

A

r dr dz.

Page 131: Analysis 2 - Broecker

126 IV. Das euklidische Lebesgueintegral

Fur eine Menge A ⊂ Rn heißt der Punkt

S =1

λn(A)·∫

A

x dx ∈ Rn

der Schwerpunkt von A . Beachte, daß dieser Punkt invariant unteraffinen Koordinatentransformationen ist. Bei unserem Ergebnis furλ3(V ) ist also das Integral

R =1

λ2(A)

A

r dr dz

der Abstand vom Schwerpunkt von A zur z-Achse. Die Rechnunghat damit ergeben:

(4.8) Guldinsche Regel. λ3(V ) = 2πR · λ2(A) ,

R = Abstand des Schwerpunkts von A zur Rotationsachse. �

Als Anwendung der Polarkoordinaten fur die Ebene berechnen wirein wichtiges uneigentliches Integral auf dem Weg ubers Zweidimen-sionale:

(4.9)

∞∫

−∞e−x

2dx =

√π.

Beweis:( ∞∫−∞

e−x2dx)2

=( ∞∫−∞

e−x2dx)·( ∞∫−∞

e−y2dy)

=∫R2

e−(x2+y2)dx dy

=∞∫0

2π∫0

e−r2 · r dϕ dr = π

∞∫0

2re−r2dr = π

[−e−r2]∞0

= π . �

Das Integral ist uns schon im ersten Semester begegnet. DieTransformation x2 = t , 2x dx = dt , zeigt:

∞∫

−∞e−x

2dx = 2

∞∫

0

e−x2dx =

∞∫

0

t−1/2e−tdt = Γ( 12 ).

Page 132: Analysis 2 - Broecker

4. Polar- und Zylinderkoordinaten 127

Schauen wir mal, was derselbe Gedanke allgemeiner uber die Gam-mafunktion lehrt: Aus

Γ(u) =

∞∫

0

xu−1e−xdx

wird durch die Transformation x = s2/2, dx = s ds :

Γ(u) = 21−u∞∫

0

s2u−1exp(−s2/2) ds.

Das Produkt Γ(u) · Γ(v) ist also

Γ(u)Γ(v) = 22−u−v∞∫

0

∞∫

0

s2u−1t2v−1exp(−(s2 + t2)/2

)ds dt =

22−u−v∞∫

0

r2(u+v)−1exp(−r2/2) dr

π/2∫

0

(cosϕ)2u−1(sinϕ)2v−1dϕ.

Das erste Integral im letzten Term ist 2u+v−1Γ(u+v), und man setzt

B(u, v) := 2

π/2∫

0

(cosϕ)2u−1(sinϕ)2v−1dϕ.

Dies ist die Eulersche Betafunktion. Wir haben gefunden:

(4.10) B(u, v) =Γ(u)Γ(v)Γ(u+ v)

. �

Fur u = v = 1/2 ergibt sich B(u, v) = 2∫ π/2

0dϕ = π , also

Γ(1/2)2 = πΓ(1) = π wie in (4.9). Aber auch an ein anderes nochloses Ende konnen wir jetzt anknupfen: Fur das Volumen cn desn-Balls vom Radius 1 hatten wir in (1.9) die Rekursionsformel

cn = cn−1

π/2∫

−π/2

cosn t dt = cn−1 · 2π/2∫

0

cosn t dt

Page 133: Analysis 2 - Broecker

128 IV. Das euklidische Lebesgueintegral

gefunden. Der Faktor nach cn−1 ist B(n+12 , 1

2 ), also:

cn = cn−1 ·Γ( 1

2 )Γ(n+12 )

Γ(n2 + 1).

Auch ist c1 = 2, und mit Γ( 12 ) =

√π , Γ(x+ 1) = xΓ(x), erhalt man

induktiv:

(4.11) cn =πn/2

(n/2)Γ(n/2).

Fur gerades n = 2k ist Γ(n/2 + 1) = Γ(k + 1) = k! , also:

c2k = πk/k! .

Fur ungerades n = 2k + 1 erhalt man entsprechend:

c2k+1 =2k+1πk

1 · 3 · . . . · (2k + 1).

Aus beidem zusammen ergibt sich die auf den ersten Blick verwun-derliche Feststellung, daß das Volumen des n-Balls vom Radius 1 furn→∞ gegen Null geht. Beim Ubergang vom n-Dimensionalen zum(n + 1)-Dimensionalen wird eben jedesmal vom Zylinder uber demn-Ball etwas weggeschnitten, um zum (n+ 1)-Ball zu kommen, undwie sich zeigt, bleibt so auf die Dauer nichts ubrig.

Die Kugel vom Radius r in Rn hat nach (IV, 1.8) das Volumenrncn , und es liegt nahe, in der Ableitung dieses Volumens nach r das(n− 1)-dimensionale Volumen der Randsphare r ·Sn−1 zu sehen. Soerhalten wir

(4.12) vol (r · Sn−1) = n · rn−1cn

fur diese Große. Wir werden darauf in der globalen Integrationstheo-rie zuruckkommen (vergl. Bd. 3, VI, 5.7).

Page 134: Analysis 2 - Broecker

Kapitel V

Allerleirauh

Als der Tanz zuende war, ließ sich der Konigdie Suppe bringen und aß sie, und sie schmeckteihm so gut, daß er meinte, niemals eine bessereSuppe gegessen zu haben.

Bruder Grimm

Hier tragen wir einiges nach, was doch auch jeder gebildete Mathe-matiker weiß und oft, wenn er die Anfangsgrunde der Analysis erklart,als Leitstern vor Augen hat. Da ließe sich noch mancherlei anfugen.

§ 1. Eine nicht meßbare Menge

Wir betrachten R als Maßraum. Zu den meßbaren Mengen solljedenfalls das Einheitsintervall I = [0, 1) gehoren, und sein Maß seiµ(I) = 1. Auch soll das betrachtete Maß µ translationsinvariant undσ-additiv sein. Wir zeigen, daß es eine Menge M ⊂ I gibt, die furkein solches Maß meßbar ist. Freilich kann man diese Menge nichtwirklich vorzeigen, konstruieren: Man wahlt mit dem Auswahlaxiom,Sie werden schon sehen.

Die additive Gruppe R/Z hat die Untergruppe Q/Z , und siezerfallt in Restklassen nach dieser Untergruppe, also in Restklassen

Page 135: Analysis 2 - Broecker

130 V. Allerleirauh

fur die Aquivalenzrelation auf R/Z

x ∼ y :⇐⇒ x− y ∈ Q.

Aus jeder Klasse wahlen wir genau ein Element in I aus. Die Klassetrifft ja I, weil x ∼ x− q fur alle q ∈ Q . Die so ausgewahlte MengeM ist eine Teilmenge von I ⊂ R .

Nun hat jedes r ∈ R einen wohlbestimmten Reprasentanten r′∈ Imodulo Z , namlich r′ = r−[r] . Insbesondere wird Q/Z durch Q∩Ireprasentiert, also modulo Z erhalt man eine disjunkte Zerlegung

R/Z =⋃q

M + q, q ∈ Q ∩ I.

Zwar ist M + q noch nicht in I , aber das korrigieren wir, wir setzen

M + q = Aq tBq, Aq = (M + q) ∩ I,

und wir haben die disjunkte Zerlegung

(1.1) [0, 1) =⋃q

Aq t (Bq − 1), q ∈ Q ∩ I.

Nun beachte, daß M+q aus M durch Translation mit q hervorgeht.Ware M meßbar, so mit gleichem Maß auch M+q also auch AqtBqund schließlich ware

(1.2) µ(M) = µ(Aq) + µ(Bq − 1).

Ist nun µ(M) = 0, so ware µ(I) = 0, und ist µ(M) > 0, so wareµ(I) = ∞ nach (1.1), und daher kann M uberhaupt nicht meßbarsein.

Die Konstruktion ist leichter zu durchschauen, wenn man deneigentlichen Ursprung des Gedankens aufsucht: Das Intervall I istals Parametrisierung der Kreislinie, der multiplikativen Gruppe S1 ,

Page 136: Analysis 2 - Broecker

2. Der Rangsatz 131

durch t 7→ exp(2πit) anzusehen. Diese Gruppe hat die abzahlbareUntergruppe

Q = {exp(2πit) | t ∈ Q}

der rationalen Drehungen. Die bose Menge ist ein Reprasentanten-system M der Zerlegung von S1 in Restklassen modulo Q . Fur einunter Drehungen invariantes Maß µ auf S1 mit 0 < µ(S1) <∞ kannM nicht meßbar sein. Es hatten ja alle Mengen qM fur q ∈ Q glei-ches Maß weil sie durch Drehungen aus M hervorgehen. Die MengenqM sind fur verschiedene q ∈ Q disjunkt, und ihre Vereinigung istganz S1 . Ware nun µ(M) = 0, so folgt µ(S1) = 0, weil Q abzahlbarist. Ware µ(M) > 0, so folgt µ(S1) =∞ , weil Q unendlich ist.

Von diesem Beispiel kommt man zum zuerst erklarten, wenn manuberall den Kreis S1 und seine Punkte durch das ParameterintervallI und die entsprechenden Punkte ersetzt.

So ist der Erweiterung von Maßen eine prinzipielle Grenze gesetzt,wenn man es mit dem Auswahlen so halt, wie es in der Mathematikgebrauchlich ist. Freilich, sagen die Logiker, fuhrt es auch nicht zuWiderspruchen, wenn man das Auswahlaxiom aufgibt und dafur pos-tuliert, daß jede Teilmenge von Rn meßbar ist ...

§ 2. Der Rangsatz

Die Elementargeometrie der differenzierbaren Abbildungen beruhtzunachst vor allem auf dem Satz uber die Umkehrabbildung. Ersagt, welche Transformationen lokale Koordinatentransformationensind: diejenigen namlich, deren Differential als lineare Abbildungumkehrbar ist.

Die wesentliche Invariante einer linearen Abbildung ist ihr Rang.Ist A : V →W linear vom Rang r , so gibt es lineare Isomorphismen(Basisisomorphismen) B : V

∼=→ Rm und C : W∼=→ Rn , sodaß die

Page 137: Analysis 2 - Broecker

132 V. Allerleirauh

transformierte Abbildung

VA−−−−→ W

B

y∼= ∼=yC

Rm −−−−→ Rn

die Gestalt

CAB−1 : Rm → Rn, (x1, . . . , xm) 7→ (x1, . . . , xr, 0, . . . , 0)

hat. Man wahlt eine Basis v1, . . . , vm von V , so daß vr+1, . . . , vm

den Kern von A aufspannen, und eine Basis w1, . . . , wn von W mitwj = Avj fur j ≤ r .

Auch fur eine lokale Beschreibung differenzierbarer Abbildungenbis auf Koordinatentransformationen ist der Rang die erste Invari-ante, aber hier ist auch der Rang eine Funktion, und ist sie nichtkonstant, so kann man die gegebene Funktion auch nicht in ein so ein-faches Musterexemplar, das ja konstanten Rang hat, transformieren.

(2.1) Rangsatz. Sei U offen in Rm und V offen in Rn , und sei

f : U → V eine C`-Abbildung, ` ≥ 1 , von lokal um p ∈ U konstan-

tem Rang r . Dann gibt es C`-Karten h : U1 → Rm und k : V1 → Rn

von Umgebungen U1 von p in U und V1 von q = f(p) in V , mit

h(p) = 0 , k(q) = 0 , und

k ◦ f ◦ h−1 : (x1, . . . , xm) 7→ (x1, . . . , xr, 0, . . . , 0)

lokal um 0 in Rm .

Lokal um die betrachteten Punkte p und q sieht es so aus:

� f�h

�k

�Rn, (x1, . . . , xm) 7→ (x1, . . . , xr, 0, . . . , 0).Rm

VU

Page 138: Analysis 2 - Broecker

2. Der Rangsatz 133

Der Satz uber die Umkehrabbildung ist der Spezialfall m = n = r .

Beweis: Wir durfen gleich annehmen: p = 0 ∈ Rm , q = 0 ∈ Rn.Wir finden eine regulare (r × r)-Untermatrix von Df(0), und nachVertauschen der Koordinaten von Rm und Rn ist

(∂fi/∂xj), 1 ≤ i, j ≤ r

am Ursprung regular. Die lokal um den Ursprung definierte Trans-formation

h : (x1, . . . , xm) 7→ (f1(x), . . . , fr(x), xr+1, . . . , xm

)

hat die Jacobimatrix

∂fi/∂xj

1

0. . .

1

}r

m− r

weiße Stellen sind Null.

Ihre Determinante ist det(∂fi/∂xj)i,j≤r 6= 0, also h ist eine zulassigeKoordinatentransformation am Ursprung, und das Diagramm� f�

h

�f◦h−1=:g

(f1(x), . . . , fr(x), xr+1, . . . , xm

)= (z1, . . . , zr, zr+1, . . . , zm)

(f1(x), . . . , fn(x)

)(x1, . . . , xm)

zeigt:

g := f ◦ h−1 : (z1, . . . , zm) 7→ (z1, . . . , zr, gr+1(z), . . . , gn(z)

).

Page 139: Analysis 2 - Broecker

134 V. Allerleirauh

Soweit fuhrt die Transformation im Urbildraum. Bisher haben wirerst rgpf ≥ r benutzt. Die Jacobimatrix von g hat die Gestalt

1. . . 0

1

? A(z)

r

}m− r A(z) = (∂gi/∂zj)i,j>r .

Die Abbildung g = f ◦h−1 hat den gleichen Rang r wie f , und dahermuß die Teilmatrix A(z) lokal um den Ursprung verschwinden, also∂gi/∂zj = 0 fur i, j > r . Betrachten wir die Funktionen auf einemWurfel {|zj | < ε} um den Ursprung, so hangen die Funktionen gi ,i > r damit von den letzten Komponenten zj , j > r nicht ab, wirkonnen schreiben gi = gi(z1, . . . , zr). Dann aber haben wir lokal umden Ursprung von Rn die invertierbare Transformation

k: (z1, . . . , zn) 7→(z1, . . . , zr, zr+1 − gr+1(z1, . . . , zr), . . . , zn − gn(z1, . . . , zr)

),

deren inverse ebenso mit + statt − aussieht, und k ◦ g = k ◦ f ◦ h−1

hat die verlangte Gestalt. �

Der Rang rgxf kann in einer Umgebung von p nicht kleiner alsrgpf sein. Ist rgpf = r , so hat die Jacobimatrix Df(p) eine (r× r)-Untermatrix mit nicht verschwindender Determinante, und die bleibtin einer Umgebung von p ungleich Null. Wohl aber kann rgxf > rgpffur x nahe p sein, wie die Abbildung f(x) = x2 fur p = 0 zeigt.Der Rangsatz beschreibt also lokal eine Abbildung bis auf Koordi-natentransformation, falls der Rang der Funktion lokal nicht steigt.Zwei Falle gibt es, wo man dessen sicher sein kann, namlich wennrgpf = m und wenn rgpf = n ist. Eine Abbildung wie im Satzvom Rang m in jedem Punkt heißt eine Immersion (immersiv),eine Abbildung vom Rang n heißt Submersion (submersiv). EineImmersion ist lokal injektiv, wie der Rangsatz zeigt. Im Großen mußsie nicht injektiv sein:

Page 140: Analysis 2 - Broecker

3. Das Morse-Lemma 135

Eine Submersion ist nach dem Rangsatz offen: Bilder von offenenMengen sind offen.

§ 3. Das Morse-Lemma

Manches grundlegende Theorem heißt Lemma, wie manche wurdi-ge Person noch mit ihrem Kindernamen gerufen wird; so auch dieses.Wir haben gelernt, daß eine C2-Funktion lokal um einen singularenPunkt mit nicht ausgearteter Hesseform ebenso aussieht, wie dieseHesseform. Das Lemma von Morse sagt, daß in der Tat die Funktionsich lokal durch eine differenzierbare Koordinatentransformation inihre Hesseform uberfuhren laßt.

(3.1) Theorem (M. Morse). Sei U offen in Rn und f : U → Rsei eine C∞-Funktion. Sei p ∈ U ein kritischer Punkt von f mit

nicht ausgearteter Hessematrix 2H . Dann gibt es eine Umgebung

V von p in U und einen C∞-Diffeomorphismus ϕ : V → V ′ mit

ϕ(p) = 0 ∈ Rn und Dϕ(p) = id , sodaß

f ◦ ϕ−1(x) = f(p) + txHx.

Zunachst wollen wir die Transformationen der symmetrischen Ma-trizen selbst, also der quadratischen Formen, betrachten.

(3.2) Lemma. Sei H eine regulare symmetrische reelle (n × n)-Matrix, dann gibt es eine Umgebung U von H im Raum S al-

ler symmetrischen reellen (n× n)-Matrizen und eine C∞-Abbildung

Page 141: Analysis 2 - Broecker

136 V. Allerleirauh

P : U → End(Rn) , mit P (H) = id und

tP (A) ·A · P (A) = H

fur alle A ∈ U .

Mit anderen Worten: Wenn A sich wenig von H unterscheidet,laßt sich A in H transformieren, und die Transformation hangt C∞

von A ab.

Beweis: Jedenfalls gibt es ja eine Transformation T , sodaß tTHT

eine Diagonalmatrix ist. Es genugt also, das Lemma fur Diagonalma-trizen H zu zeigen. In diesem Fall schreiben wir A = H +X , wobeiX eine Umgebung von 0 im Raum S der symmetrischen Matrizendurchlaufen soll, und wir suchen P (A) = 1 + Y mit einer oberenDreiecksmatrix Y . Hier ist 1 = id die Einheitsmatrix. Erreichenwollen wir:

F (X,Y ) := t(1 + Y ) · (H +X) · (1 + Y )−H = 0.

Dies ruft nach dem Satz uber das Auflosen von Gleichungen: Sei alsoS der Vektorraum der symmetrischen (n× n)-Matrizen, V der Vek-torraum der oberen Dreiecksmatrizen (gleicher Dimension 1

2n(n+1)),und

F : S × V → S, (X,Y ) 7→ F (X,Y ),

wie oben definiert. Wir wollen die Gleichung F (X,Y ) = 0 lokal um(0, 0) durch Y = Y (X) losen. Fur den Satz uber das Auflosen vonGleichungen mussen wir also DY F (0, 0) ∈ HomR(V, S) berechnen.Nun, fur X = 0 ist

F (0, Y ) = tY H +HY + tY HY,

alsoDY F (0, 0) : Y 7→ tY H +HY.

Wir mussen zeigen, daß diese lineare Abbildung den Kern 0 hat, alsotY H + HY = 0 =⇒ Y = 0. Weil aber H regular diagonal, Y eine

Page 142: Analysis 2 - Broecker

3. Das Morse-Lemma 137

obere und damit tY eine untere Dreiecksmatrix ist, stimmt das.�

Weil hier nur quadratische Gleichungen gelost werden, kann mandie Losung auch durch eine Folge quadratischer Erganzungen hin-schreiben.

Beweis (3.1). Wir konnen p = 0, f(0) = 0 annehmen und

f(x) =n∑

i,j=1

aij(x)xixj , aij(0) = hij ,

mit C∞-Funktionen aij und (hij) = H schreiben. Das zeigt zumBeispiel die Integraldarstellung des Restglieds zweiter Ordnung derTaylorentwicklung. Setzen wir A(x) =

(aij(x)

)und wahlen P wie

im Lemma, und Q(x) := P(A(x)

), so steht da

f(x) = tx ·A(x) · x, tQ(x) ·A(x) ·Q(x) = H,

also lokal um Null

f(x) = t(Q(x)−1 · x) ·H · (Q(x)−1 · x).

Bleibt also, ϕ(x) = Q(x)−1 · x zu setzen, was wegen

Q(0) = PA(0) = P (H) = id

in der Tat bei Null die Ableitung id hat. Siehe unsere Definition derAbleitung. �

Auch hier braucht man nicht, daß f eine C∞-Funktion ist: DieDifferenzierbarkeitsordnung von ϕ hangt an der von x 7→ A(x), unddiese kann hochstens zwei geringer als die von f sein.

Betrachten wir noch einmal Funktionen einer Variablen, etwa lokalum den Ursprung. Verschwindet der (k−1)-Jet von f am Ursprung,so ist, wie gesagt:

f(x) = ϕ(x) · xk, ϕ(x) =1

(k − 1)!

1∫

0

(1− t)k−1f [k](tx) dt,

Page 143: Analysis 2 - Broecker

138 V. Allerleirauh

wie man sieht, wenn man die Integraldarstellung des Restglieds derTaylorentwicklung (Bd. 1, IV, 2.5) auf die Funktion x 7→ f(x · h) furx = 1 anwendet, und dann wieder x statt h schreibt. Uns interessiertnur, daß jedenfalls ϕ eine C∞-Funktion ist, falls dasselbe fur f gilt,und a := ϕ(0) ist der k-te Taylorkoeffizient von f . Ist a 6= 0, sokonnen wir schreiben:

f(x) = a · (ψ(x))k, ψ(x) := x · k

√ϕ(x)/a.

Weil ϕ(0)/a = 1, ist ψ lokal um Null eine C∞-Funktion, und es istψ′(0) = 1, also haben wir gezeigt:

(3.3) Bemerkung. Ist die reelle C∞-Funktion f lokal um p ∈ Rdefiniert und beginnt ihre Taylorentwicklung mit dem Term a · xk ,

a 6= 0 , k > 0 , so gibt es lokal um p eine invertierbare Transformation

ϕ mit ϕ(p) = 0 , ϕ′(p) = 1 , sodaß

f(x) = a · ϕ(x)k. �

Auch in hoherer Dimension sind fast alle Funktionen lokal durchein endliches Taylorpolynom an der betreffenden Stelle bis auf Trans-formation bestimmt, aber das ist nicht so leicht zu zeigen, ja nichteinmal leicht zu sagen, was das heißen soll. Immerhin: Das Morse-lemma ist ein erster und der wichtigste Schritt.

§ 4. Der Satz von Sard

Ist U offen in Rn und f : U → Rp stetig differenzierbar, so hatdie Gleichung

f(x) = q

eine p-kodimensionale Untermannigfaltigkeit von U als Losungsmen-ge, falls q ein regularer Wert von f ist. Wie groß aber ist die Aus-sicht, daß man bei zufalliger Wahl von q einen regularen Wert von f

trifft? Sehr groß, das sagt eben der

Page 144: Analysis 2 - Broecker

4. Der Satz von Sard 139

(4.1) Satz von Sard. Sei U offen in Rn , sei f : U → Rp eine

C∞-Abbildung, und sei D ⊂ U die Menge der kritischen Punkte der

Abbildung f , dann hat f(D) ⊂ Rp das Maß Null.

Beweis: Induktion nach n ; fur n = 0 ist Rn ein Punkt, f(U)hochstens ein Punkt, der Satz also richtig. Da er jedenfalls auch furp = 0 gilt, nehmen wir jetzt p > 0 an.

Fur den Induktionsschritt sei Di ⊂ U die Menge der Punkteu ∈ U , wo alle partiellen Ableitungen von f der Ordnung ≤ i ver-schwinden. Die Di bilden eine absteigende Folge abgeschlossenerTeilmengen

D ⊃ D1 ⊃ D2 ⊃ · · ·

von U , und wir zeigen:

(i) f(D rD1) ist dunn, d.h. ist eine Nullmenge.(ii) f(Di rDi+1) ist dunn.

(iii) f(Dk) ist dunn fur genugend große k .

Alle diese Aussagen mussen wir nur lokal zeigen, also jeder Punktu ∈ D rD1 hat eine Umgebung V , so daß f(V ∩ (D rD1)) dunnist, und so auch in den anderen Fallen. Abzahlbar viele solche Umge-bungen uberdecken ja dann die betroffene Menge.

Beweis (i): Man kann p ≥ 2 annehmen, denn fur p = 1 ist D = D1 .Sei u ∈ D r D1 , dann verschwindet eine partielle Ableitung von f

nicht am Punkt u , und wir durfen annehmen ∂f1/∂x1(u) 6= 0. Dannist die Abbildung

h : U → Rn, x 7→ (f1(x), x2, . . . , xn

)

bei u lokal invertierbar, ihre Einschrankung auf eine Umgebung V

von u ist ein Diffeomorphismus h : V → V ′ , und die transformierteAbbildung g := f ◦ h−1 hat lokal um h(u) die Gestalt

g : (z1, . . . , zn) 7→ (z1, g2(z), . . . , gp(z)

).

Page 145: Analysis 2 - Broecker

140 V. Allerleirauh

Wir mussen die Behauptung fur g zeigen. Diese Abbildung uberfuhrtdie Hyperebene {z | z1 = t} jeweils auf ihrem Definitionsgebiet indie Hyperebene {y | y1 = t} . Sei

gt :({t} × Rn−1

) ∩ V ′ → {t} × Rp−1

die Einschrankung von g . Dann ist ein Punkt aus({t}× Rn−1

)∩V ′genau dann kritisch fur g , wenn er kritisch fur gt ist, weil g dieJacobimatrix

Dg =

1 0 · · · 0

? Dgt

hat. Nun hat aber nach Induktionsvoraussetzung die Menge der kri-tischen Werte von gt das Maß Null in {t} × Rp−1 , also hat dieMenge der kritischen Werte von g dunnen Durchschnitt mit jederHyperebene {y | y1 = t} , hat also selbst nach Fubini das Maß Null,und das zeigt (i).

Beweis (ii): Hier verfahren wir ahnlich wie im Beweis von (i). Furjeden Punkt u ∈ DkrDk+1 gibt es eine (k+ 1)-te Ableitung, die imPunkt u nicht verschwindet, wir durfen annehmen:

∂k+1f1/∂x1∂xν1 . . . ∂xνk(u) 6= 0.

Sei w : U → R die Funktion

w = ∂kf1/∂xν1 . . . ∂xνk .

Dann ist also w(u) = 0 und ∂w/∂x1(u) 6= 0, und wie eben definiertdie Abbildung

h : x 7→ (w(x), x2, . . . , xn

)

eine Karte h : V∼=→ V ′ um u , und

h(Dk ∩ V ) ⊂ {0} × Rn−1 ⊂ Rn.

Page 146: Analysis 2 - Broecker

4. Der Satz von Sard 141

Betrachten wir also wieder die transformierte Abbildung g := f◦h−1 :V ′ → Rp und ihre Einschrankung g0 :

({0} × Rn−1) ∩ V ′ → Rp , so

hat die Menge der kritischen Werte von g0 nach Induktionsvoraus-setzung das Maß Null. Aber jeder Punkt aus h(Dk ∩ V ) ist kritischfur g0 , weil alle partiellen Ableitungen von g , also auch von g0 , derOrdnung ≤ k , insbesondere erster Ordnung, verschwinden. Also istf(Dk ∩ V ) = g ◦ h(Dk ∩ V ) dunn.

Beweis (iii): Sei W ⊂ U ein Wurfel der Kantenlange a , und sei

k >n

p− 1.

Dann zeigen wir, daß f(W ∩Dk) dunn ist. Die Taylorformel liefertdie Abschatzung

f(u+ h) = f(u) +R(u, h), |R(u, h)| ≤ c · |h|k+1

fur u ∈ Dk∩W und u+h ∈W , wobei die Konstante c bei gegebenemf und W jetzt fest gewahlt sei. Hier benutzen wir, daß f eine Ck+1-Funktion ist, vergleiche (I, 3.6).

Nun zerlege W in rn Wurfel der Kantenlange a/r . Ist W1 einWurfel dieser Zerlegung, der einen Punkt u ∈ Dk enthalt, so schreibtsich jeder Punkt aus W1 als u + h mit |h| ≤ √na/r , und nachder obigen Restgliedabschatzung liegt f(W1) in einem Wurfel derKantenlange

2 · c · (√na)k+1

rk+1=

b

rk+1,

mit einer Konstante b , die nur von W und f , nicht aber von derZerlegung abhangt. Alle diese Wurfel zusammen haben eine Volu-mensumme s ≤ rn · bp/rp(k+1) , und fur p(k + 1) > n konvergiertdieser Ausdruck mit wachsendem r gegen Null. Die Volumensummekann also durch Wahl einer genugend feinen Zerlegung beliebig kleingemacht werden. �

Page 147: Analysis 2 - Broecker

142 V. Allerleirauh

Schauen wir den Beweis noch einmal an, so finden wir, daß wirzuletzt die Taylorentwicklung einer Ck+1-Funktion f benutzt haben,also voraussetzen mussen, daß f eine C`-Funktion mit ` > n/p ist.Aber in der Induktion kommen dann ja auch die Dimensionspaare(n− 1, p− 1), . . . und schlimmstens (n− p+ 1, 1) vor, sodaß wir also` > max{0, n− p+ 1} benutzt haben. Tatsachlich genugt

` > max{0, n− p},

aber das braucht man auch. H. Whitney hat eine C1-Funktion aufder Ebene konstruiert, die auf einer topologisch eingebetteten Streckedas Differential Null hat aber dort nicht konstant ist, sodaß also dieMenge der kritischen Werte ein Intervall in R enthalt (Duke Math.J. 1 (1935), 514-517).

§ 5. Konvexe Funktionen

Eine Teilmenge K ⊂ Rn heißt konvex, wenn sie mit je zweiPunkten p, q auch deren Verbindungsstrecke

{λp+ µq | λ, µ ≥ 0, λ+ µ = 1}

enthalt. Man kann auch (1− t)p+ tq = p+ t(q − p), 0 ≤ t ≤ 1, alsParametrisierung der Verbindungsstrecke wahlen.

Beliebige Durchschnitte konvexer Mengen sind offenbar konvex, unddaher liegt jede Teilmenge A ⊂ Rn in einer kleinsten konvexen Teil-

Page 148: Analysis 2 - Broecker

5. Konvexe Funktionen 143

menge, namlich dem Durchschnitt aller konvexen Teilmengen, in de-nen sie liegt. Diese Menge bezeichnet man als die konvexe Hulleder Menge A .

(5.1) Beispiel. Die konvexe Hulle von k Punkten p1, . . . , pk ist die

Menge der Punkte

λ1p1 + · · ·+ λkpk,

mit λ1 + · · ·+ λk = 1 und λj ≥ 0 fur j = 1, . . . , k .

Beweis: Die beschriebene Menge ist offenbar konvex und enthaltalle pj . Umgekehrt schließt man durch Induktion: Ist λk 6= 1 undµ := 1− λk = λ1 + · · ·+ λk−1 , so setze λ′j := λj/µ , dann liegt

λ1p1 + · · ·+ λkpk = µ(λ′1p1 + · · ·+ λ′k−1pk−1) + λkpk

auf der Verbindungsstrecke von pk und einem Punkt der konvexenHulle von {p1, . . . , pk−1} , also in der konvexen Hulle von p1, . . . , pk .

Sei nun K ⊂ Rn eine konvexe Menge. Eine Funktion f : K → Rheißt konvex, wenn die Menge der Punkte uber f , also die Menge{(x, y) | y ≥ f(x)} konvex ist, und das bedeutet offenbar, wenn furalle p, q ∈ K gilt: Fur λ, µ ≥ 0 und λ+ µ = 1 ist

(5.2) f(λp+ µq) ≤ λf(p) + µf(q).

Page 149: Analysis 2 - Broecker

144 V. Allerleirauh

Die Definition einer konvexen Funktion ist nur sinnvoll, wenn dasDefinitionsgebiet der Funktion konvex ist, und das wollen wir jetztimmer voraussetzen.

(5.3) Bemerkung. Ist f : K → R eine konvexe Funktion, so ist

die Menge Kc = {x ∈ K | f(x) ≤ c} auch konvex.

Beweis: Sind p, q ∈ Kc und λ, µ wie oben, so ist

f(λp+ µq) ≤ λf(p) + µf(q) ≤ λc+ µc = c,

also λp+ µq ∈ Kc . �

Die Definition zeigt unmittelbar, daß eine Funktion genau dannkonvex ist, wenn ihre Einschrankung auf jede Strecke konvex ist. Mankann sich daher in vielen Situationen auf das Eindimensionale zuruck-ziehen, und konvexe Funktionen einer Variablen sind die wichtigsten.Fur eine Funktion ϕ : (a, b)→ R ist die Konvexitatsbedingung (5.2)aquivalent zu der Bedingung

(5.4)ϕ(t)− ϕ(s)

t− s ≤ ϕ(u)− ϕ(t)u− t fur a < s < t < u < b.

Die Bedingung der Konvexitat sagt ja, daß zwischen beiden Termendie Steigung

(ϕ(u) − ϕ(s)

)/(u − s) der Strecke liegt, die

(s, ϕ(s)

)

mit(u, ϕ(u)

)verbindet.

Page 150: Analysis 2 - Broecker

5. Konvexe Funktionen 145

(5.5) Satz. Eine konvexe Funktion auf einer offenen Teilmenge von

Rn ist stetig.

Beweis: Sei f : K → R die Funktion und p ∈ K . Wir konnen nachAbziehen einer Konstante und einer Translation in K annehmen:p = 0 und f(p) = 0. Weil K offen ist, liegt noch ein Wurfel W derKantenlange 2s > 0 um 0 in K , und auf den (endlich vielen) Eckendieses Wurfels sei f ≤ c fur ein c > 0. Dann liegen diese Ecken inKc , also ihre konvexe Hulle W auch, also insbesondere

f(x) ≤ c fur |x| = s.

Fur ein festes solches x betrachte die konvexe Funktion einer Vari-ablen

ϕ(t) := f(tx), −1 ≤ t ≤ 1.

Es ist ϕ(0) = 0 und ϕ(1) ≤ c , ϕ(−1) ≤ c . Daraus folgt

ϕ(t) ≤ ct, ϕ(−t) ≥ −ct fur 0 ≤ t ≤ 1,

aus (5.4) mit 0, t, 1 bzw. −t, 0, 1 fur s, t, u . Weil aber ϕ(−t) diesel-ben Voraussetzungen wie ϕ(t) erfullt, gilt −ct ≤ ϕ(t) ≤ ct , also|ϕ(t)| ≤ ct , und das heißt:

|f(tx)| ≤ ct fur |x| = s und 0 ≤ t ≤ 1.

Fur beliebiges x mit 0 < |x| ≤ s ist daher

|f(x)| =∣∣f((|x|/s) · sx/|x|)

∣∣ ≤ c|x|/s,

Page 151: Analysis 2 - Broecker

146 V. Allerleirauh

und f(0) = 0, was die Behauptung zeigt. �

Es ist wesentlich, daß K offen ist, siehe die Funktion ϕ : [0, 1]→ Rmit Wert 0 am Rand und −1 im Inneren.

Aus (5.4) folgt mit dem Mittelwertsatz sofort:

(5.6) Satz. Eine differenzierbare Funktion f : (a, b)→ R ist genau

dann konvex, wenn ihre Ableitung monoton wachst. Existiert f ′′

uberall, so ist f genau dann konvex, wenn stets f ′′ ≥ 0 ist. �

Im Hoherdimensionalen entnimmt man daraus:

(5.7) Satz. Eine C2-Funktion f : K → Rn ist genau dann konvex,

wenn die Matrix (∂2f/∂xi∂xj) uberall positiv semidefinit ist.

Beweis: Die Funktion t 7→ f(x + th) hat nach (I, 3.3) bei t = 0die zweite Ableitung

n∑

i,j=1

∂2f/∂xi∂xj(x)hihj ,

und die Bedingung des Satzes ist, daß dieses nie negativ ist, wasnach (5.6) dazu aquivalent ist, daß die Einschrankung von f auf jedeGerade konvex ist. �

Weil der Durchschnitt einer Familie konvexer Mengen konvex ist,ist das Supremum einer Familie konvexer Funktionen konvex. Sohaben wir alles in allem einen großen Vorrat konvexer Funktionen.Die wichtigste Aussage uber sie ist folgende:

(5.8) Jensens Ungleichung. Sei X ein Maßraum mit Maß µ ,

sodaß µ(X) = 1 . Sei f : X → (a, b) integrabel und ϕ : (a, b) → Rkonvex. Dann gilt

ϕ(∫

X

f dµ)≤∫

X

ϕ ◦ f dµ.

Es kann a = −∞ oder b =∞ sein, und die rechte Seite kann ∞sein.

Page 152: Analysis 2 - Broecker

5. Konvexe Funktionen 147

Beweis: Sei t =∫Xf dµ , dann ist a < t < b . Sei β das Supremum

uber s der Differenzenquotienten(ϕ(t)−ϕ(s)

)/(t−s) auf der linken

Seite von (5.4), dann steht dort:

ϕ(t)− ϕ(s)t− s ≤ β ≤ ϕ(t)− ϕ(u)

t− u , s < t < u, d.h.

ϕ(t)− ϕ(s) ≤ (t− s)β, ϕ(t)− ϕ(u) ≤ (t− u)β,

weil (t− u) < 0. Demnach gilt fur alle s ∈ (a, b):

ϕ(s)− ϕ(t)− β(s− t) ≥ 0.

Dies sagt nur, daß ϕ oberhalb der Geraden durch ϕ(t) mit Stei-gung β verlauft. Eine solche Stutzhyperebene findet man auch imHoherdimensionalen durch jeden Punkt einer konvexen Funktion.Nun setze s = f(x), dann haben wir

ϕf(x)− ϕ(t)− β (f(x)− t) ≥ 0,

und weil die so als nicht negativ erkannte Funktion µ-meßbar ist,konnen wir integrieren, und wegen µ(X) = 1 ergibt sich

∫ϕ ◦ f dµ ≥ ϕ(t) + β

(∫f dµ− t

),

was nach Bestimmung von t die Behauptung ist. �

Der Satz gilt mit gleichem Beweis auch im Hoherdimensionalen.Das Integral

∫ϕ◦f dµ ist so zu deuten, daß jedenfalls (ϕ◦f)− immer

endliches Integral hat, wenn f integrabel ist.

Page 153: Analysis 2 - Broecker

148 V. Allerleirauh

Man kann die Idee im Satz und Beweis so fassen: Die Menge

K := {(s, y) | ϕ(s) ≤ y}

ist konvex, und die Abbildung X → (a, b) × R , x 7→ (f(x), ϕf(x)

)

fuhrt in diese Menge, also liegt auch ihr Mittelwert (∫f,∫ϕf) in K ,

und das heißt ϕ∫f ≤ ∫ ϕf .

Jedoch weiß man die Ungleichung erst durch ihre Anwendungenund Spezialisierungen zu wurdigen.

Die Funktion ϕ(s) = es ist konvex weil ϕ′′ > 0, also

(5.9) exp∫

X

f dµ ≤∫

X

efdµ.

Wahlt man X = {p1, . . . , pn} mit µ(pj) = λj und λ1 + · · ·+ λn = 1und schreibt f(pj) = xj , so besagt die Jensensche Ungleichung:

(5.10) ϕ(λ1x1 + · · ·+ λnxn) ≤ λ1ϕ(x1) + · · ·+ λnϕ(xn).

In unserem Fall also:

exp(λ1x1 + · · ·+ λnxn) ≤ λ1exp(x1) + · · ·+ λnexp(xn),

oder wenn wir yj = exp(xj) setzen:

yλ11 · . . . · yλnn ≤ λ1y1 + · · ·+ λnyn,(5.11)

fur 0 ≤ λj und λ1 + · · ·+ λn = 1.

Das ist die Ungleichung zwischen dem geometrischen und arithme-tischen Mittel. Man nennt darum allgemein in der Ungleichung

(5.12) exp∫

X

log(g) dµ ≤∫

X

g dµ

die linke Seite das geometrische und die rechte das arithmetischeMittel.

Page 154: Analysis 2 - Broecker

5. Konvexe Funktionen 149

Zwei positive reelle Zahlen p und q bilden ein Paar konjugierterExponenten, wenn

1p

+1q

= 1, d.h. p+ q = pq .

Es ist dann 1 < p, q < ∞ , und weil p gegen ∞ geht fur q gegen1, nennt man auch (1,∞) und (∞, 1) ein konjugiertes Paar. Einwichtiger Spezialfall ist p = q = 2, und die vertraute Dreiecks-ungleichung und Schwarzsche Ungleichung in diesem Fall verallge-meinern sich wie folgt:

(5.12) Satz. Sei X ein Maßraum und seien p, q konjugierte Ex-

ponenten mit 1 < p, q < ∞ . Seien f, g : X → [0,∞] meßbare

Funktionen. Dann gilt:

(i) Holders Ungleichung.∫

X

f · g dx ≤(∫

X

fpdx)1/p·(∫

X

gqdx)1/q

.

(ii) Minkowskis Ungleichung.

(∫

X

(f + g)pdx)1/p

≤(∫

X

fpdx)1/p

+(∫

X

gpdx)1/p

.

Wir schreiben 〈f, g〉 :=∫Xf · g dx und ‖f‖p =

(∫Xfpdx

)1/p ,dann heißt das fur nicht negative Funktionen f und g :

(i) 〈f, g〉 ≤ ‖f‖p · ‖g‖q,

(ii) ‖f + g‖p ≤ ‖f‖p + ‖g‖p.

Beweis (i): Ist ‖f‖p = 0 so ist f = 0 fast uberall, also gilt dieUngleichung, ebenso falls ‖g‖q = 0. Andernfalls kann man f durchf/‖f‖p und g durch g/‖g‖q ersetzen, und es genugt, die Behauptungfur ‖f‖p = ‖g‖q = 1 zu zeigen. Nun ist

f(x) · g(x) ≤ p−1f(x)p + q−1g(x)q

Page 155: Analysis 2 - Broecker

150 V. Allerleirauh

fur alle x ∈ X nach (5.11), und daraus ergibt sich (i) durch Integra-tion, es ist ja jetzt

∫fp =

∫gq = 1.

Beweis (ii): Sei h = (f + g)p−1 , dann gilt:

(∗)∥∥f+g

∥∥pp

= 〈f+g, h〉 = 〈f, h〉+〈g, h〉 ≤ ‖f‖p · ‖h‖q+ ‖g‖p · ‖h‖q

Nun ist hq = (f + g)p , also

‖h‖q =(∫

hq)1/q

=(∫

(f + g)p)1/q

=(∫

(f + g)p)(1/p)·(p/q)

=(∫

(f + g)p)(1/p)(p−1)

=∥∥f + g

∥∥p−1

p.

Setzt man dies in (∗) ein und dividiert durch ‖f + g‖p−1p , so folgt

die Behauptung jedenfalls, wenn ‖f + g‖p nicht 0 oder ∞ ist.Ist ‖f + g‖p = 0, so ist die Behauptung trivial, ebenso wie wenn

‖f‖p + ‖g‖p = ∞ ist. Aber weil die Funktion t 7→ tp fur t ≥ 0konvex ist, gilt

2−p(f + g)p ≤ 12 (fp + gp),

also wenn ‖f‖p + ‖g‖p endlich ist, so ist auch ‖f + g‖p endlich, unddamit gilt die Behauptung immer. �

Wie die Argumente schon zeigen, die Zuordnung

f 7→ ‖f‖p :=∥∥|f |∥∥

p

definiert eine Norm, die p-Norm. Man bildet dazu die Lp-Raume,wie wir den Raum L1(µ) gebildet haben. Sie spielen eine wichtigeRolle in der Analysis.

Page 156: Analysis 2 - Broecker

Aufgaben

Kommen Sie, meine Herren, wir mussendenken, ungestort denken! Der Menschhat mich vorhin konfus gemacht, ich mußmir wieder heraushelfen.

Konig Peter

Zu Kapitel I

1. Skizziere folgende ebenen Kurven und berechne ihre Bogenlange:(i) γ : [0, 2π]→ R2 , γ(t) =

((1− cos t) cos t , (1− cos t) sin t

),

die Kardioide, und(ii) δ : [0,∞)→ C = R2 , δ(t) = eat , a ∈ C , Re(a) < 0,

die logarithmische Spirale.

2. Seien γ : [0, 1] → Rn und δ : [0, 1] → Rm differenzierbar, undsei α : Rn × Rm → Rk eine bilineare Abbildung. Formuliere undbeweise eine Produktregel fur die Ableitung von t 7→ α

(γ(t), δ(t)

).

3. Eine differenzierbare Funktion f : Rnr{0} → R heißt homogenvom Grad α > 0, wenn gilt:

f(tx) = tαf(x) fur alle x ∈ Rn r {0} und t > 0.

Zeige, daß f genau dann homogen vom Grad α ist, wenn dieEulersche Relation

αf(x) =n∑

j=1

xj∂f

∂xj(x)

uberall erfullt ist.Hinweise: i) Differenziere g(t) := f(tx) bei t = 1 nach t .ii) Zeige: tg = αg lokal um t = 1 =⇒ g(t) = c · tα .

Page 157: Analysis 2 - Broecker

152 Aufgaben

4. Betrachte die Funktion f : R2 → R ,

f(x, y) =

{x3

x2+y2 fur (x, y) 6= (0, 0),0 sonst.

Zeige: i) f ist am Ursprung stetig aber nicht differenzierbar.ii) Fur jede differenzierbare Kurve γ : [a, b] → R2 ist auch f ◦ γdifferenzierbar. Insbesondere ist f uberall partiell differenzierbar.iii) Fur die Kurve γ(t) =

(γ1(t), γ2(t)

)= (t, t) gilt am Ursprung nicht

die Kettenregel

d

dt(f ◦ γ)(t) =

∂f

∂x

(γ(t)

) · γ1(t) +∂f

∂y

(γ(t)

) · γ2(t).

5. Zeige, daß die Abbildung f : Rn → Rn , f(x) = |x| · x , uberalldifferenzierbar ist, und berechne ihre Jacobimatrix.

6. Sei U eine zusammenhangende offene Menge in Rn , seien K unda positive reelle Zahlen, und sei f : U → Rp eine Abbildung, sodaß

|f(x)− f(y)| ≤ K · |x− y|afur alle x, y ∈ R .

(i) Sei a > 1. Ist f differenzierbar?Welche Funktionen f erfullen dies?

(ii) Sei a ≤ 1. Muß f differenzierbar sein?

7. Eine offene Menge U ⊂ Rn heißt sternformig mit Zentrum p ,wenn gilt: Fur jedes u ∈ U und 0 ≤ t ≤ 1 ist auch p+ t(u− p) ∈ U .Dies sei nun der Fall, und sei

v = (v1, . . . , vn) : U → Rn

stetig differenzierbar. Zeige: Ist ∂vi/∂xj = ∂vj/∂xi fur alle i, j , soist tv = grad(f) fur eine C2-Funktion f : U → R mit f(p) = 0.Hinweis: d/dt f(p+ tx) = ?Die Bedingung, daß f sternformig ist, ist nicht uberflussig, Beispiel?Hinweis: Die Polarkoordinate ϕ ist keine wohldefinierte Funktion,wohl aber gradϕ = ?

Page 158: Analysis 2 - Broecker

Zu Kapitel I 153

8. Berechne den Jet der Funktion f mit

f(x, y) =x− yx+ y

an der Stelle (1, 1). Was ergibt sich fur ∂3f/∂x2∂y(1, 1)?

9. Sei f : Rn → R eine rotationssymmetrische C∞-Funktion, alsokonstant auf Spharen um den Ursprung. Zeige, daß es eine Potenz-reihe p(t) einer Variablen gibt, sodaß

j∞0 f(x) = p(|x|2).

10. Untersuche die Funktionf(x, y) = x2 + y2 − xy − 2x+ y

auf lokale Extrema und Sattelpunkte.

11. Finde alle kritischen Punkte der Funktion:f : R2 → R, f(x, y) = ey cosx+ ex cos y .

12. Sei f eine C∞-Funktion auf einer offenen Kugel U um denUrsprung von Rn . Zeige:

f(x) = jk0 f(x) +∑

|α|=k+1

ϕα(x) · xα

fur C∞-Funktionen ϕα : U → R .Hinweis: Integraldarstellung des Restglieds der Taylorentwicklung.

13. Sei f : Rn → R eine Cα-Funktion und homogen vom Grad α .Zeige, daß f ein Polynom vom Grad α ist.

14. Sei f : Rn → R eine k-mal stetig differenzierbare Funktion undp ein Polynom vom Grad k , so daß limh→0

(f(h) − p(h)

)/|h|k = 0.

Zeige: p = jk0 f .

15. Die Ck-Funktion f habe am Ursprung den (homogenen!) k-Jet

p(x) =∑

|α|=kaαx

α,

Page 159: Analysis 2 - Broecker

154 Aufgaben

und es sei k > 0 und p(x) > 0 fur x 6= 0. Zeige, daß f am Ursprungein lokales Minimum hat.

16. Zeige, daß die Funktion f(x, y) = 3x4 − 4x2y + y2 , einge-schrankt auf eine beliebige Gerade durch den Ursprung, dort einlokales Minimum hat. Ist der Ursprung auch ein lokales Minimumvon f : R2 → R ?

17. Bestimme alle lokalen Extrema der Funktion f : R2 → R ,f(x, y) = sin(x) · sin(y) · sin(x+ y) .

Zu Kapitel II

1. Gegeben sei eine Abbildung f : Rn → Rn , die in folgendem Sinnenahe der Identitat ist. Fur g(x) := x− f(x) sei

|g(x)− g(z)| ≤ λ · |x− z|fur alle x, z ∈ Rn, mit einer Konstante λ < 1. Zeige, daß dieAbbildung f : Rn → f(Rn) ein Homoomorphismus ist.

2. Zeige, daß f(x) := x + 12n (|x|, . . . , |x|) eine bijektive Abbildung

f : Rn → Rn definiert.

3. Seien f, g : Rn → Rn stetig differenzierbar, sei f ein Diffeo-morphismus und g(x) = 0 fur x außerhalb von einem Kompaktum.Zeige, daß es ein ε > 0 gibt, sodaß auch f+λg ein Diffeomorphismusist, fur alle λ ∈ R , |λ| < ε . Hinweis: Reduziere die Behauptung aufden Fall f = id.

4. Sei f eine C2-Funktion und u ein kritischer Punkt von f mitnicht ausgearteter Hessematrix. Zeige, daß f in einer Umgebung vonu keinen weiteren kritischen Punkt hat.

5. (i) Fur f : R2 → R2 , f(x, y) = (x2 − y2, 2xy) bestimme diePunkte von R2 , wo f lokal invertierbar ist.Ist f surjektiv? Ist f injektiv?(ii) Ebenso fur f(x, y) =

(ex+y cos(x− y), ex+y sin(x− y)

).

Page 160: Analysis 2 - Broecker

Zu Kapitel II 155

6. Zeige, daß durch das Gleichungssystem

x2 − y cos(uv) + z2 = 0,

x2 + y2 − sin(uv) + 2z2 = 2,

xy − sin(u) · cos(v) + z = 0,

lokal um (x0, y0, z0, u0, v0) = (1, 1, 0, π/2, 0) die Werte von x, y, z

in R5 als Funktionen von u und v eindeutig bestimmt sind, undberechne

∂x

∂u(π/2, 0) und

∂x

∂v(π/2, 0).

7. Sei f : R2 → R2 eine stetig differenzierbare Abbildung, derenJacobimatrix uberall regular ist und nicht negative Koeffizienten hat.Zeige, daß f injektiv ist. Zeige, daß eine analoge Behauptung fur R3

falsch ware. Hinweis: Beides ist nicht einfach.

8. Zeige, daß M := {(x, y, z) | x2 + y4 + z4 = 1} eine 2-dimensionaleUntermannigfaltigkeit des R3 ist. Gib eine Karte um den Punktp = (0, 0, 1) von M und eine lineare Gleichung fur den Tangential-raum TpM ⊂ R3 an.Zeige, daß M homoomorph zur Sphare S2 ist.

9. Sei M = {(x, y, z) ∈ R3 | x3 + y3 + z3 = 3} . Zeige, daß M einezweidimensionale Untermannigfaltigkeit von R3 ist und beschreibeden Tangentialraum Tp(M) an p = (1, 1, 1) durch eine lineare Glei-chung. Zeige, daß M homoomorph zu R2 ist.

10. Sei f : Rn+1 → R differenzierbar und grad f(x) = g(x) · x fureine Funktion g : Rn+1 → R . Zeige, daß f auf Spharen um denUrsprung konstant ist.

11. Sei M ⊂ Rn eine differenzierbare Untermannigfaltigkeit, seip ∈ Rn rM , und die Abbildung M → R , x 7→ |p − x| nehme imPunkte q ∈M ein Minimum an. Zeige, daß der Vektor p−q zu TqM

orthogonal ist.

Page 161: Analysis 2 - Broecker

156 Aufgaben

12. Sei G eine symmetrische reelle (n × n)-Matrix, a ∈ Rn undb ∈ R . Betrachte die Abbildung

f : Rn → R, f(x) = txGx+ 2 tax+ b.

(i) Gib ein lineares Gleichungssystem fur die Menge S der Punktean, wo f = Df = 0 ist.(ii) Sei M = {x ∈ Rn | f(x) = 0, Df(x) 6= 0} . Dann ist M eine(n−1)-dimensionale Untermannigfaltigkeit von Rn . Sei p ∈M . Gibeine lineare Gleichung fur die Tangente p + TpM von M im Punktp an.

13. Sei f : Rn → R eine stetig differenzierbare homogene Funktion,und sei M = {f = 0} ⊂ Rn . Sei V die Menge der Vektoren γ(0) furC1-Kurven γ : (−ε, ε)→M ⊂ Rn mit γ(0) = 0. Zeige: M = V .

14. Sei G eine symmetrische reelle (n × n)-Matrix und sei f inAufg. 13 durch f(x) = txGx gegeben. Zeige, daß V genau dann einVektorraum ist, wenn G semidefinit ist.

15. Bestimme die Punkte (x, y) ∈ R2 mit x4 + y4 − 4xy = 9, dieden großten und die den kleinsten Abstand vom Ursprung haben.

16. Berechne das Maximum und das Minimum vonf : R3 → R, f(x, y, z) = x− y + 2z

auf dem Ellipsoid M = {(x, y, z) | x2 + y2 + 2z2 = 2} .

17. In der Situation von (4.2) der Methode der Multiplikatoren istdie Hesseform von f |M in p gegeben durch

Hp(f |M) = Hp(f + λ1g1 + · · ·+ λngn)|TpM.

Dies reduziert die Berechnung der Hesseform von f |M in p , wennman die erforderlichen Ableitungen der beteiligten Funktionen in p

berechnet hat, auf eine Aufgabe der linearen Algebra.Hinweis: Die Funktion f +λ1g1 + · · ·+λngn ist in p kritisch, und

sie stimmt auf M mit f berein. Transformiert man nun Rm+n lokalum p , so wird ihre Hesseform mit der Jacobischen der Transformationlinear transformiert.

Page 162: Analysis 2 - Broecker

Zu Kapitel III 157

18. (i) Berechne die Enveloppe der Geradenschar in R2 :Mc = {(x, y) | y − 2cx+ c2 = 0}.

(ii) Gib eine Gleichung g(x, y, c) einer Geradenschar in R2 an, derenEnveloppe die Kurve y = x3 ist. Hinweis: Dies ist etwas tuckisch.Das Naheliegende erweist sich als mangelhaft. Kann man den Mangelbeheben?

19. Fuhre in § 3 einiges naher aus, insbesondere:

(i) Sei M ⊂ Rn eine C`-Untermannigfaltigkeit und f : M → Rp

eine Abbildung. Definiere “f ist Ck ”. Definiere rgxf fur x ∈ M .Wann soll q ∈ Rp ein singularer Wert von f heißen?

Hinweis: Denke an die Tangentialabbildung von f .

(ii) Begrunde die Beschreibung von T(x,c)M auf Seite 69. Man kannz.B. annehmen: C = {c | f(c) = 0} fur ein regulares Gleichungssys-tem f auf Rk .

(iii) Warum hat die Tangentialabbildung der Projektion p : M → U

stets mindestens den Rang n− 1 ?

Zu Kapitel III

1. Zeige, daß monotone Funktionen R→ R meßbar sind.

2. Sei X ein abzahlbarer Meßraum. Zeige, daß X die disjunkteVereinigung von abzahlbar vielen meßbaren Teilmengen An ist, wobeijedes An außer jeweils ∅ und An keine meßbaren Teilmengen hat(abzahlbare Mengen konnen auch endlich 6= ∅ sein).

3. Sei U eine offene Teilmenge von R×[0,∞) und sei f : R→ [0,∞]definiert durch

f(x) = max{

0, sup{y | (x, y) ∈ U}}.Zeige, daß f fur die Borelalgebren meßbar ist.

4. Zeige, daß die Menge der reellen Zahlen, deren Dezimalentwick-lung die Ziffer 2 enthalt, in R Borel-meßbar ist.

Page 163: Analysis 2 - Broecker

158 Aufgaben

5. Sei (fn) eine Folge meßbarer Funktionen auf dem Meßraum X .Zeige, daß die Menge {x ∈ X | (fn(x)

)konvergiert} meßbar ist.

6. Sei (X,A, µ) eine Mengenalgebra mit einem Pramaß, sodaß dieMaßregeln erfullt sind, und sei µ∗ das induzierte außere Maß auf derPotenzmenge von X . Sei M ∈ A , µ(M) < ∞ , und Y ⊂ M eineTeilmenge, sodaß

µ∗(Y ) + µ∗(M r Y ) = µ∗(M).

Zeige, daß Y dann µ∗-meßbar ist.

7. Sei (X,A, µ) ein Maßraum. Zeige, daß durchµ∗(Y ) = min{µ(A) | Y ⊂ A ∈ A}

ein außeres Maß auf der Potenzmenge von X definiert wird. Furdieses gilt

µ∗(Y ∪ Z) + µ∗(Y ∩ Z) ≤ µ∗(Y ) + µ∗(Z).

Eine Teilmenge Y ⊂ X ist genau dann µ-meßbar, wenn sie µ∗-meßbar ist, und in diesem Fall ist µ(Y ) = µ∗(Y ).

8. Gilt fur ein außeres Maß auf der Potenzmenge einer Menge X

stetsµ∗(Y ∪ Z) + µ∗(Y ∩ Z) ≤ µ∗(Y ) + µ∗(Z) ?

Hinweis: Untersuche kleine Mengen X .

9. (i) Eine Funktion F : R→ R heißt rechts stetig, wenn fur allep ∈ R stets limx↘p F (x) = F (p) gilt. Nun sei µ ein Maß auf R undµ(R) endlich. Zeige, daß durch F (x) = µ(−∞, x] eine rechtsstetigemonoton wachsende Funktion F : R → R definiert wird. Sie heißtdie Verteilung von µ .

(ii) Sei umgekehrt F : R → R monoton wachsend und rechtsstetig.Zeige, daß die endlichen disjunkten Vereinigungen von Intervallen derGestalt (a, b] eine Mengenalgebra A auf R bilden und daß durch

µ(a, b] = F (b)− F (a)

ein Pramaß auf A definiert wird. Das induzierte Maß und Integralauf R heißt nach Stieltjes.

Page 164: Analysis 2 - Broecker

Zu Kapitel III 159

10. Sei q : N → Q eine Bijektion. Erklare ein Maß µ auf R durch

µ =∞∑n=1

2−nδq(n),

wobei δq das Dirac-Maß fur q ist. An welchen Stellen in R ist dieVerteilung von µ unstetig?

11. (i) Sei ϕ : R → [0,∞) eine integrable Funktion und sei λ dasLebesgue-Maß auf R . Zeige, daß durch

µ(Y ) :=∫

Y

ϕdλ

ein Maß auf R definiert wird.(ii) Konstruiere ein Maß µ auf R mit µ(R) = 1, fur das gilt: Genaudann ist Y ⊂ R eine Nullmenge fur µ , wenn Y eine Nullmenge furdas Lebesguemaß ist.

12. Sei X abzahlbar, X 6= ∅ , und µ das Maß auf X , fur das dieeinpunktigen Mengen meßbar vom Maß 1 sind. Zeige:(i) Es gibt genau ein solches Maß.(ii) Eine reelle Funktion f : X → R ist genau dann fur diesesMaß integrabel, wenn

∑x∈X f(x) fur irgendeine (und dann fur jede)

Abzahlung von X absolut konvergiert.(iii) Folgere: Ist die Reihe

∑n,m anm fur irgendeine Abzahlung von

N × N absolut konvergent, so ist∑n(∑m anm) =

∑n,m anm .

(großer Umordnungssatz, Doppelreihensatz).

13. Zeige mit einem Konvergenzsatz, daß die Zetafunktion

ζ(s) =∞∑n=1

n−s

fur s > 1 stetig auf R ist.

14. Sei (X,M, µ) ein Maßraum und f : X → Y eine Abbildung vonMengen. Zeige, daß durch

f∗µ(A) := µ(f−1A)

Page 165: Analysis 2 - Broecker

160 Aufgaben

ein Maßraum (Y, f∗M, f∗µ) erklart wird.Zeige, falls eine Seite existiert:

X

g ◦ f dµ =∫

Y

g d(f∗µ).

15. Zeige, daß der Raum der Riemann-integrablen Funktionen aufdem Einheitsintervall fur die L1-Norm nicht komplett ist.

16. Ein translationsinvariantes Maß fur die Borelalgebra des Rn, dasfur den Wurfel im ersten Quadranten mit achsenparallelen Kantender Lange 1 und 0 als Ecke das Maß 1 liefert, ist das Lebesgue-maß. Hinweis: Zerlege den Wurfel in gleiche Teile, verschiebe sie,approximiere Quader.

Zu Kapitel IV

1. Berechne das Volumen der Teilmenge P ⊂ R3 der Punkte (x, y, z)mit

0 ≤ y ≤ sinx, 0 ≤ x ≤ (π/2)(1− z), 0 ≤ z ≤ 1.Zeichne eine Skizze von P .

2. Berechne das Volumen der Menge P ⊂ R2 der Punkte (x, y), mit(x2 + y2)3 ≤ 9x2.

3. Berechne das Volumen von P ⊂ Rn , wo P die Menge der Punktet1v1 + · · ·+ tnvn

mit 0 ≤ tj und t1 + · · ·+ tn ≤ 1 ist und die Vektoren v1, . . . , vn eineBasis von Rn bilden.

4. Eine Funktion f : Rn → R heißt Riemann-integrabel, wennsie beschrankt ist, außerhalb einer beschrankten Menge in Rn ver-schwindet, und fast uberall stetig ist. Zeige, daß diese FunktionenLebesgue-integrabel sind.

5. Berechne den Schwerpunkt und das Volumen der Menge P ⊂ R3

der Punkte (x, y, z) mit

Page 166: Analysis 2 - Broecker

Zu Kapitel IV 161

0 ≤ z ≤ π/2, x2 + y2 ≤ (1− cos z)2.

6. Mit Fubini und der Relation 1/x =∫∞

0e−xt dt zeige:

∞∫

0

sinxx

dx =π

2.

7. Sei I das Einheitsintervall und gn : I → [0,∞) definiert durch:

gn(t) = n(n+ 1) fur1

n+ 1< t <

1n, und gn(t) = 0 sonst.

Definiere f : I × I → [0,∞) durch

f(x, y) =∞∑n=1

(gn(x)− gn+1(x)

)gn(y).

Berechne∫ 1

0

∫ 1

0f(x, y) dx dy und

∫ 1

0

∫ 1

0f(x, y) dy dx .

Wie vertragt sich das Ergebnis mit dem Satz von Fubini?

8. Sei X = Y = [0, 1], sei λ das Lebesguemaß auf X und ζ dasZahlmaß auf Y . Sei f die charakteristische Funktion der Diagonale{(x, x) | x ∈ [0, 1]} ⊂ X × Y . Berechne

X

(∫

Y

f(x, y) dζ)dλ und

Y

(∫

X

f(x, y) dλ)dζ.

Wie vertragt sich das Ergebnis mit dem Satz von Fubini?

9. Zeige, da auf Rn das Integral∫

|x|≤c

|x|α dx, c > 0,

genau dann endlich ist, wenn n+ α > 0, und berechne es.

10. Sei U offen in Rn , sei f : U → R stetig differenzierbar undf |A = 0 fur eine Teilmenge A ⊂ U . Zeige:

A

∂f/∂xj dx = 0, j = 1, . . . , n.

Page 167: Analysis 2 - Broecker

162 Aufgaben

Zu Kapitel V

1. Sei B die Menge der Borel-meßbaren Teilmengen von R . Zeige,daß B die Machtigkeit von R hat; mit anderen Worten: B laßt sichbijektiv auf P(N ) abbilden.

2. Sei C ⊂ [0, 1] die sogenannte Cantor-Menge der reellen Zahlenin deren Dezimalentwicklung nur die Ziffern 0 und 3 auftreten. Zeige:C ist kompakt; das Lebesguemaß λ1(C) ist Null; es gibt eine stetigemonotone Surjektion C → [0, 1]. Folgere mit Aufg. 1: Es gibt Null-mengen in R , die nicht Borel-meßbar sind.

3. Offenbar gibt es nach § 1 in R2 eine nicht Borel-meßbare Null-menge, namlich?

4. Sei C ⊂ R kompakt und f : C → R stetig. Zeige, daß sich f

stetig auf R fortsetzen laßt. Zeige mit Aufg. 2, daß es eine NullmengeM in [0, 1] und eine stetige Abbildung f : [0, 1]→ [0, 1] gibt, sodaßf(M) nicht Lebesgue-meßbar ist.

5. Sei I das Einheitsintervall. Zeige, daß es eine nicht integrableFunktion f : I × I → I gibt, fur die das iterierte Integral

1∫

0

( 1∫

0

f(x, y) dx)dy

wohldefiniert und endlich ist. Man kann also den Satz von Fubininicht umkehren.

6. Sei U nicht leer und offen in Rn+k und k ≥ 1. Zeige, daß einestetig differenzierbare Abbildung f : U → Rn nicht injektiv seinkann. (Tatsachlich gilt dasselbe fur stetiges f ).

7. Sei U offen in Rn und f : U → U stetig differenzierbar, mitf ◦ f = f . Zeige, daß es lokal um jeden Punkt p ∈ U eine stetigdifferenzierbare Koordinatentransformation ϕ : U ⊂ U1

∼=→ U ′1 ⊂ Rn

gibt, sodaß

Page 168: Analysis 2 - Broecker

Zu Kapitel V 163

ϕ ◦ f ◦ ϕ−1(x1, . . . , xn) = (x1, . . . , xr, 0, . . . , 0).Beachte, daß hier im Bild- und Urbildraum die gleiche Transforma-tion zu wahlen ist.

8. Zeige, daß eine C∞-Abbildung f : Rn → Rn+1 nicht surjektivsein kann.

9. Sei O(n) die Menge der orthogonalen Matrizen im VektorraumV ∼= Rn·n aller reellen (n × n)-Matrizen. Zeige, daß O(n) eineUntermannigfaltigkeit der Dimension 1

2n(n− 1) von V ist.Hinweis: Sei S der reelle Vektorraum der symmetrischen (n × n)-Matrizen. Zeige, daß die Einheitsmatrix E ∈ S ein regularer Wertder Abbildung V → S , x 7→ tXX ist.Zeige, daß der Tangentialraum von O(n) am Punkt E der Vektor-raum der schiefsymmetrischen reellen (n× n)-Matrizen ist.

10. Sei ϕ : U → V eine bijektive C∞-Abbildung offener Teilmengenvon Rn und sei f : V → R integrabel. Zeige, daß die Transforma-tionsformel ∫

V

f =∫

U

f ◦ ϕ · | detDϕ|

immer noch gilt, auch wenn ϕ−1 nicht differenzierbar ist.

11. Sei U offen in Rn und f : U → R eine C∞-Funktion. Fura ∈ Rn erklare ga : U → R durch ga(x) = f(x) + 〈a, x〉 . Zeige, daßga fur fast jedes a ∈ Rn nur kritische Punkte mit nichtentarteterHesseform hat.

12. Sei U offen in Rn und f : U → R eine C2-Funktion. Sei p ∈ Uein kritischer Punkt mit positv definiter Hesseform. Zeige, daß furgenugend kleines ε > 0 die Menge

Dε ={x ∈ U

∣∣ f(x)− f(p) < ε}

homoomorph zum n-Ball Dn ={x∣∣ |x| ≤ 1

}und ihr Rand homoo-

morph zu Sn−1 ist.

13. Zeige, daß jede offene Uberdeckung des Rn eine abzahlbareTeiluberdeckung enthalt. Prazisiere und beweise die Aussage, daßeine lokal dunne Teilmenge des Rn dunn ist.

Page 169: Analysis 2 - Broecker

Literatur

Außer dem schon im ersten Bande empfohlenen Buch:S. Lang: Undergraduate Analysis. Springer-Verlag,New York 1983,

empfehle ich besonders auch die “grune Analysis” vom selben Autor:S. Lang: Real Analysis. Addison-Wesley,Reading, Mass. 1969.

Hier findet man auch Grundlegendes uber Funktionalanalysis, Diffe-rentialgleichungen und globale Integrationstheorie.

Als einfuhrendes Lehrbuch uber Mannigfaltigkeiten mit vielen Figu-ren und Erklarungen empfehle ich:

Th. Brocker, K. Janich: Einfuhrung in die

Differentialtopologie. Springer Verlag, Heidelberg 1990.

Fur die Maß- und Integrationstheorie habe ich außer dem Buch vonLang auch

W. Hackenbroch: Integrationstheorie. Teubner,Stuttgart 1987,H. Bauer: Wahrscheinlichkeitstheorie und Grundzuge der

Maßtheorie, Berlin, de Gruyter 1968und Notizen, die auf eine Vorlesung von K. Janich zuruckgehen,zu Rate gezogen.

Dem Buch vonW.H. Fleming: Functions of Several Variables.Addison-Wesley, Reading, Mass. 1966

bin ich bei den Mitteilungen uber die Beta- und Gammafunktionund das Volumen der Kugel gefolgt. Man findet da auch sonst vielKonkretes und Ersprießliches.

Bei der Erklarung der Enveloppe hat michR. Thom: Sur la theorie des enveloppes. Journ. de Math.,tome XLI, Fasc. 2 (1962)

Page 170: Analysis 2 - Broecker

Literatur 165

angeregt. Dieser Gegenstand scheint aus den neueren Lehrbuchernder Analysis verschwunden zu sein, obwohl er in der Theorie der Dif-ferentialgleichungen bedeutsam ist und auch etwas beschreibt, wasman im taglichen Leben, beim Wein und bei Lampenschein, unmit-telbar sehen kann.

Nicht holonome Nebenbedingungen in der Mechanik sind zum erstenMal von

A. Voss: Uber die Differentialgleichungen der Mechanik.Math. Ann. 25 (1885), 258-286

bemerkt und systematisch untersucht worden. Das Wort holonomhat wohl H. Hertz in seinem hinterlassenen Buch uber Mechanikgepragt, und durch das Lehrbuch von

A. Sommerfeld: Mechanik. Akademische Verlagsanstalt,Leipzig (viele Auflagen)

ist der Begriff zum ublichen Bestand der physikalischen Lehrbuchergekommen. Die eigentliche Quelle der Einsicht ist naturlich im Satzvon Frobenius zu suchen.

Die beliebteste Quelle fur den Beweis des Morselemmas und desSatzes von Sard sind die Schriften (und Perlen der mathematischenLiteratur) von

J. Milnor: Morse Theory. Annals of Math. Studies 51,Princeton Univ. Press 1963,J. Milnor: Topology from the Differentiable Viewpoint.

The Univ. Press of Virginia, Charlottesville 1965.Fur unseren Beweis des Morselemmas vergleiche:

M.W. Hirsch: Differential Topology. Springer Verlag,New York 1976.

Zu dem Abschnitt uber konvexe Funktionen vergleiche außer demgenannten Buch von Fleming auch das Buch von

W. Rudin: Real and Complex Analysis. McGraw-Hill 1974,dem ich auch einige Aufgaben entnommen habe.

Page 171: Analysis 2 - Broecker

Symbolverzeichnis

γ Geschwindigkeitsvektor 2

s(γ) Bogenlange 5

Df Jacobimatrix 11

∂fi/∂xj = Djfi

partielle Ableitung 14tv , tA transponiert 16

Dαf , xα , α! Multiindex 22

|α| Ordnung 22

Ck , Ck(U) 22

C∞ , C∞(U) 22

jkpf Jet 23

Hp Hessematrix 32

|A| Operatornorm 38

‖A‖ 39

inv inverse Matrix 40

d(x, y) Metrik 41

Dxf 52

rgpf Rang 54

Sn Sphare 57

TpM Tangentialraum 57

Tpf Tangentialabbildung 63

‖f‖1 L1-Norm 73, 90, 94, 97∞⊔j=1

disjunkte Vereinigung 75

M(S) erzeugte σ-Algebra 75

{f > a} = {x | f(x) > a} 77

lim = lim sup 77

f+ = max(f, 0), f− 78

µ Maß 79

∞ Unendlich 79

δp Dirac-Maß 79

ζ Zahlmaß 80

χA charakter. Funktion 81

µ∗ außeres Maß 83

T (µ) Treppenfunktionen 90

N (µ) Nullfunktionen 91∫Y

f dµ Integral 92

L1(µ) integr. Funktionen 93

A⊗B, µ⊗ ν Produkt-Maß 106

dx , dµ , µ(dx) 108

My = {x | (x, y) ∈M} 110

Mf = {(x, t) | 0 ≤ t < f(x)}110

λn Lebesguemaß 113d(y1, . . . , yn)d(x1, . . . , xn)

= detDϕ 116

Γ(u) Gammafunktion 127

B(u, v) Betafunktion 127

cn Volumen des Balls 114, 127

Page 172: Analysis 2 - Broecker

Namen- und Sachverzeichnis

Aableiten, Integral 35 f, 103Ableitung 2, 10− , hohere 22abzahlbar, Meßraum 157, 159− , Uberdeckung 163additiv 80 fσ-additiv 79, 81adjungierte Matrix 40affin 13, 28, 119Algebra, Mengen 81, 107σ-Algebra 74 ffalgebraische Funktion 52Anfangspunkt 3Anordnung, Expon. 22Approx., lineare 13, 47, 51, 60Archimedes 89arithmetisches Mittel 148Atlas 54Auflosung, Gleichung 49 ffaußeres Maß 83, 88, 158Ausschopfung 89, 100Auswahlaxiom 129Aut 38

BBall, Kugel 127 fBanach, Fixpunktsatz 41 f− , Raum 73, 97 102, 115Beppo Levi 98, 105beschrankte stetige Fktn 43Betafunktion 127

Betrag integrabel 94Beweggsinv., Integral 120, 129Bild, direktes 75Bildmaß 159 fBogenlange 5Borelalgebra 76, 107, 162

CCk , C∞ 2, 22, 157Cantormenge 162Caratheodory 85L1-Cauchyfolge 73, 91Cavalieris Prinzip 109, 114charakteristische Funktion 81chinesische Notation 15

DDf 10definit 31, 146det, Determinante 40, 116, 119Diagonalisierung 34diffeomorph 43 ffDiffeomorphismus 43 ff, 154Differential 10, 12, 61Differenzenquotient 10differenzierbar 2, 10, 17 ffdifferenzieren, Integral 35, 102Dimension 53 ffDirac-Maß 79, 159direktes Bild 75Diskriminante 52dominierte Konvergenz 98

Page 173: Analysis 2 - Broecker

168 Namen- und Sachverzeichnis

Doppelreihensatz 159Dreiecksmatrix 136Dreiecksungleichung 91dunn 120, 139, 163

EEigenwert 34, 67einfache Funktion 79einfache Wurzel 52Einhullende 68 ff, 157Einrad 66elementare Funktion 79Elementarwurfel 76Ellipse 3 fEnveloppe 68 ff, 157− , Bedingung 70End(V ) = Hom(V, V ) 40σ-endlich 82, 87, 108Endpunkt 3Erzeugnis, σ-Algebra 75, 107 fEuler, B(u, v) 127− , Relation 151Evolute 71exp konvex 148Exponent 22Extremum 30, 56− , Nebenbdg. 64 ff, 156

Ffakultat 22fast uberall (jeder) 88, 103 ffFixpunktsatz 42Flache 2. Ordnung 56 f, 156Fubini, Satz 111, 161 fFunktion, differenzierbar 10

− , elementar 79− , integrabel 92− , konvex 142− , meßbar 76

GGammafunktion 126 ffGaußverteilung 126geometrisches Mittel 148Geschwindigkeit 2, 5− , Vektor 2, 58gleichmaßig stetig 36− , Limes 18, 43Gleichung, Auflosung 49 ffgrad, Gradient 17, 21, 60, 152Graph 60, 122Grenzfunktion diffbar 18− integrabel 98 ff− meßbar 77großer Umordnungssatz 159großte σ-Algebra 75, 78Guldin, Regel 126

HHahn, Maßerw. 82 ff, 110, 113Halbnorm 90Hauptachsentrf. 32, 67, 135Hesse, Form 32, 135, 156, 163− , Matrix 32, 135, 154Hohenlinie 56hohere Ableitungen 22Holder, Ungl. 149holonom 66Hom 10, 38homogen 151, 153, 156

Page 174: Analysis 2 - Broecker

Namen- und Sachverzeichnis 169

− , Integral 114− , positiv 91Hulle, konvexe 143Huygens, Prinzip 71hyperbolisches Paraboloid 31

IImmersion 143immersiv 134implizite Funktion 43 ff, 49 ff− , Ableitung 53inf(fj | j ∈ N ) meßbar 77infinitesimale Nebenbdg. 65 ffintegrable Funktion 92, 105− , nicht 100, 129integrable Nebenbdg. 66Integral 3, 89 ff, 110− , Abschtzung 8− , Abbildung 101, 110 f− , Invarianz 113, 129, 160− , iteriertes 111− , Konstruktion 89 ff− langs einer Kurve 7− monoton 94− , nicht neg. Fktn. 103, 110− , Regeln 93− , Transformation 115 ff, 163− , uneigentliches 101inv, inverse Matrix 40Invarianz, Integral 113, 129,

160inverse Matrix 40invertierbar 40, 44Iterationsverfahren 42 f

JJacobimatrix 14, 17 f− , Determinante 116 ff, 122 ffJensen, Ungleichung 146Jet 23, 28

KKaffeetasse 72Kardioide 151Karte 54, 61, 62 ffKartenwechsel 48, 63Kaustik 72Kettenregel 13, 16, 25, 152kleinste σ-Algebra 75, 79Kodimension 55kompaktes Intervall 35Komplement 74komplett, vollst. 41, 96, 160Komponente 2, 13 ffkonjug. Exponenten 149Konstruktionslemma 91kontrahierend 41Kontraktionslemma 42kontravariant 63Konvergenz, dominierte 98− , gleichmaßige 18, 41− , L1 97− , monotone 98, 105− , Norm 96− , punktweise 77, 91, 96konvex 142 ff− , Funktion stetig 145Koordinaten 48, 54, 61− , Transformation 48, 63

Page 175: Analysis 2 - Broecker

170 Namen- und Sachverzeichnis

Kreis 3, 5, 130kritisch 29, 55, 69, 135, 139 ff,

154− unter Nebenbdg. 63 ff, 156−− infinitesimal 66− , Wert 30, 69, 138 ffkrummlinig 48, 54Kugel, Volumen 114, 127 fKugelkoordinaten 124Kurve 2 ff, 59

LL1(µ) 93L1(µ) 97Lagrange, Multipl. 64, 71, 156− , Restglied 27Lange 5L1-Cauchyfolge 73, 91, 97Lebesgue, integrabel 92, 105− , Integral 92 ff, 110− , Komplettierung 88− , Konvergenzsatz 98− , Maß 88, 112, 160Levi, monot. Konv. 98, 105L1-lim 97leere Menge 55lineare Abbildung 10, 131Linearitat, Ableitung 13− , Jet 24Lipschitz-stetig 121L1-Norm 73, 90, 94, 97Lp-Norm 150logarithmische Spirale 151lokale Koordinaten 61

lokales Extremum 30−− , Nebenbdg. 63 ff, 156− Maximum 30− Minimum 30, 154−− , Nebenbdg. 63 ff− Verhalten 29, 138lokal invertierbar 44 ff

MMannigfaltigkeit 53 ffMaß 79 ff− , außeres 81, 88, 158− , Beweggsinv. 120, 129, 160− , Bild 159 f− , Dirac 79− , Erweiterung 82− , inneres µ∗ 89− , Lebesgue 88, 112− , Pra 82− , Produkt 106 ff− Raum 79 ff− Regeln 81− , Stieltjes 158− , Transformation 115 ff, 163− , Translationsinvarianz 113,

129, 160− , Zahl 80Matrizenkalkul 11, 15Maximum 30 ffmehrfache Wurzel 52Mengenalgebra 81, 107meßbar 74 ff− , Abbildung 75− , nicht 129 ff

Page 176: Analysis 2 - Broecker

Namen- und Sachverzeichnis 171

µ-meßbar 88µ∗-meßbar 84, 88− , integrable Funktion 95Meßraum 74− , abzahlbar 157, 159metrischer Raum 41Minimum 30 ff, 154Minkowski, Ungl. 149Mittelwertsatz 18 f, 37, 41, 121Monom 22monoton, außeres Maß 83− , Funktion meßbar 157− , Integral 90− , Klassen 107 f− , Konvergenz 98, 105− , Maß 80− , Verteilung 158Morselemma 35, 135 ffMultiindex 22Multiplikatoren 64, 71, 156

NN (µ) 97Nebenbedingung 64 ff, 156− , holonome 66− , infinitesimale 65 ff− , integrable 66negativ definit 31Neilsche Parabel 4nicht meßbare Menge 129 ffnichtnegative Funktion 103Norm, euklidisch 3− , Konvergenzsatz 96− , L1 73, 90, 97

− , Lp 150− , Operator 38 f− , sup 41Nullfunktion 97Nullmenge 88, 94, 120 ff, 138 ff

OoBdA, ohne Beschrankung der

AllgemeinheitOrdnung, Multiindex 22− , Approximation 27Orthogonale Gruppe 163

PParaboloid 30Parameterabhangigkeit,

Integral 35, 102Parametrisierung 6− , durch Bogenlange 7− , Nullstellen 53− , Schar von Mfktn. 68 ff− , Untermannigfaltigkeit 53partiell diffbar 14 ff, 152partielle Ableitung 14Physiker 62Plan, Stadt 42Polarkoord. 44, 122 ff, 152Polynom 18, 29, 52, 153− , Taylor 23, 138positiv definit 31− semidefinit 146positiver Teil f+ 78, 95, 105Potential 21, 67Potenzmenge 75, 83, 158Potenzreihe 24

Page 177: Analysis 2 - Broecker

172 Namen- und Sachverzeichnis

Pramaß 82Produkt von Raumen 1Produktmaß 107 ffProdukt von Maßraumen 106 ffProduktregel 9, 25Punkt, kritisch, regular,

singular 55, 63, 139− , Meßraum 74punktw. Konvergenz 77, 96

QQuader 113quadratische Erganzung 137− Form 32 f, 67Quadrik 56

RRang 54, 134− , Satz 131 ffRechner 34Rechteck 107rechtsstetig 158regular, Matrix 40, 44− , Wert 55, 70, 138 ffRestglied 27, 37, 153− , Abschatzung 28Retraktion f ◦ f = f 162Richtungsableitung 17Riemann-integrabel 73, 160− , nicht 100Riemannintegral 81, 99Ring, C∞-Funktionen 22Rotationskorper 125rotationssymmetrisch 125, 153

SSard, Satz 138 ffSattelpunkt 31, 56Schar von Mannigf. 68 ffSchraubenlinie 4, 19Schwerpunkt 126semidefinit 146Seminorm 90 f, 94σ-additiv 79, 81σ-Algebra 74σ-endlich 82, 87, 108Simplex 143, 160singular 55, 157Skalarprodukt 8Sphare 39, 57, 60− , Tangentialraum 7, 60− , Volumen 128Spitze 4Spur 3Standardbasis 14sternformig 152stetig diffbar 2, 17, 22 ffStetigkeit, diffb. Abb. 11, 152− , Integral 35, 102− , konvexe Abb. 145Stieltjes 158Strahl 71Strecke 142stuckweise 2Stufe 89Stufenfunktion 76,− approx. meßbare 78Stutzhyperebene 147

Page 178: Analysis 2 - Broecker

Namen- und Sachverzeichnis 173

Submersion 134submersiv 134Substitution, Integral 115 ffsup Norm 41sup(fj | j ∈ N ) meßbar 77symmetrische Matrix 32 ff, 56,

67, 135, 156

TT (µ) 90t , transponiert 16Tangente 58, 156Tangentialraum 7, 57 ff− , Vektorraum 63Tangentialvektor 2, 57Taylor, Formel 20 ff, 27, 137 f− , Polynom 23, 138Theo 27Transform., Formel 115 ff, 163translationsinv. Maß 113, 160transponieren 16Treppenfunktion 89, 95

UUmkehrabbildung 43 ff, 132− , Def.-Gebiet 48Umordnungssatz 159uneigentliches Integral 101unendlich ∞ 79Ungleichung, Holder 149− , Jensen 146− , Minkowski 149Untermannigfaltigkeit 53 ff

VVektor 57, 63− , Feld 21verbinden 3Verbindung, kurzeste 9Verruckung, virtuelle 68Vertauschbkt., Ableitgn. 20− , Abltg. u. Intgr. 35 f, 102− , Grenzw. u. Intgr. 35, 102Verteilung 158virtuelle Verruckung 68vollstandig 41, 96, 160

WWeg 2Wellenfront 71Wert, kritischer 30, 55, 138 ffWurfel 113, 120 f, 160Wurzel, einfache 52− , mehrfache 52

ZZahlmaß 80Zeit 3Zentralkraft 67Zentrum 152Zerlegung 90− , Eigenschaft 94Zetafunktion 159Zusammens. f ◦ g 13, 16, 25Zwangskraft 67Zweijet 29Zylinderkoordinaten 122


Recommended