Vorlesungsskript Analysis I und II · Vorlesungsskript Analysis I und II Prof. Bernd Ammann...

Vorlesungsskript Analysis I und II

Prof. Bernd Ammann

Wintersemester 2018/19Sommersemester 2019

Universitat Regensburg

Datum der aktuellen Version: 26. Juli 2019

Offentliche Version

Inhaltsverzeichnis

Vorwort vLogischer Aufbau des ersten Kapitels viiWarnungen vii

Kapitel 1. Elementare Logik und Grundlagen der Mathematik 11. Die Struktur des mathematischen Denkens 12. Aussagenlogik 53. Mengen 114. Quantoren 165. Potenzmenge und Mengensysteme 196. Paare und kartesische Produkte 207. Relationen, funktionale Relationen, Abbildungen 228. Familien 31Literatur fur das bisherige Kapitel 33

Kapitel 2. Zahlen 351. Die naturlichen Zahlen 352. Etwas Kombinatorik 413. Die ganzen Zahlen 474. Die rationalen Zahlen 495. Geordnete Korper 506. Die reellen Zahlen 556.1. Unzulanglichkeit von Q 556.2. Die Supremumseigenschaft 566.3. Axiome der reellen Zahlen 586.4. Dedekindsche Schnitte 607. Die komplexen Zahlen 71

Kapitel 3. Folgen und Reihen 771. Folgen 771.1. Konvergenz von Folgen 771.2. Monotone Folgen 821.3. Teilfolgen 83

i

ii INHALTSVERZEICHNIS

1.4. Erweiterte reelle Zahlen und uneigentliche Konvergenz 841.5. Limes inferior und superior 861.6. Cauchy-Folgen 892. Reihen 912.1. Motivation von Reihen: Dezimal-Darstellung reeller Zahlen 912.2. Definition und elementare Eigenschaften 932.3. Konvergenzkriterien 952.4. Absolute Konvergenz 1002.5. Alternierende Reihen 1012.6. Umordnung von Reihen 1033. Einige durch Reihen definierte Funktionen 1083.1. Exponentialfunktion 1083.2. Sinus- und Kosinus-Funktion 1113.3. Eulersche Zahl 1133.4. Exponentialfunktion (Fortsetzung) 114

Kapitel 4. Stetigkeit und Grenzwerte von Funktionen 1171. Stetigkeit 1172. Zwischenwertsatz 1203. Stetigkeit von exp, cos und sin und Definition von log 1224. Die Kreizahl π und Periodizitat von cos und sin. 1255. Metrische Raume und Grundbegriffe der Topologie 1266. Grenzwerte von Funktionen 132

Kapitel 5. Differential-Rechnung fur Funktionen einer Veranderlichen 1351. Definition und elementare Eigenschaften 1352. Lokale Extrema 1403. Mittelwertsatze 1404. Hohere Ableitungen und Taylorscher Satz 142

Kapitel 6. Integral-Rechnung fur Funktionen einer Veranderlichen 1471. Partitionen und Treppenfunktionen 1472. Das Riemann-Integral 1483. Monotone Funktionen sind Riemann-integrierbar 1544. Stetige Funktionen sind Riemann-integrierbar 1555. Hauptsatz der Differential- und Integralrechnung 1566. Uneigentliche Riemann-Integrale 161

Kapitel 7. Stetigkeit und Differenzierbarkeit von Grenzwerten und Reihen 1651. Metrische Raume: Wiederholung und Cauchy-Folgen 1652. Punktweise und gleichmaßige Konvergenz 1663. Differentiation von Folgen und Reihen 1714. Potenzreihen und analytische Funktionen 174

INHALTSVERZEICHNIS iii

Kapitel 8. Topologie 1771. Normierte Vektorraume 1772. Kontraktionen und Banachscher Fixpunktsatz 1833. Topologische Raume 1853.1. Wiederholung: Eigenschaften eines metrischen Raums 1853.2. Definition topologischer Raume 1853.3. Konvergenz in topologischen Raumen 1884. Zusammenhang und Wegzusammenhang 1915. Folgenkompaktheit 1936. Kompaktheit 195

Kapitel 9. Differential-Rechnung fur Funktionen in mehreren Veranderlichen 2011. Vorbemerkungen 2012. Differenzierbarkeit in mehreren Variablen 2023. Hohere Ableitungen 2143.1. Satz von Schwarz 2143.2. Hohere Ableitungen als multi-lineare Abbildungen 2183.3. Satz von Taylor 2203.4. Einschub: Quadratische Formen 2223.5. Lokale Extrema 2254. Lokale Umkehrung differenzierbarer Abbildungen 2265. Der Satz uber implizit definierte Funktionen 2326. Untermannigfaltigkeiten 2376.1. Definition und erste Beispiele 2376.2. Der Satz vom regularen Wert 2396.3. Der Immersionssatz 2436.4. Einbettungen von Untermannigfaltigkeiten 2456.5. Lokale Parametrisierungen von Untermannigfaltigkeiten 2476.6. Der Tangentialraum 2507. Extrema mit Nebenbedingungen 251

Kapitel 10. Gewohnliche Differentialgleichungen 2551. Motivation 2552. Definition und Reduktion auf autonome Gleichungen erster Ordnung 2573. Flusslinien und Erhaltungsgroßen 2604. Der Satz von Picard-Lindelof 2625. Picard-Lindelof fur gewohnliche Differentialgleichungen hoherer Ordnung 2736. Lineare gewohnliche Differentialgleichungen 2737. Lineare gewohnliche Differentialgleichungen mit konstanten Koeffizienten 2788. Differentialgleichungen mit getrennten Variablen 2799. Mehr zum Fluss eines zeitabhangigen Vektorfelds 28110. Einige Kommentare zum Langzeitverhalten von gew. Diffifferentialgleichungen 283

iv INHALTSVERZEICHNIS

11. Stabilitat und Verhalten in der Nahe von kritischen Punkten 285

Anhang A. Mehr Details zu den Grundlagen der Logik 2891. Das Russellsche Paradoxon 2892. Axiomatische Mengenlehre 290

Anhang B. Die Peano-Axiome 2931. Die Axiome und erste Konsequenzen 2932. Vollstandige Induktion und rekursive Definition 2963. Ordnung der naturlichen Zahlen 299

Anhang C. Konstruktion von R mit Hilfe von Cauchy-Folgen 3031. Mehr zu Aquivalenzrelationen 3032. Folgen, Konvergenz und Cauchy-Folgen 3053. Existenz und Eindeutigkeit der reellen Zahlen 312

Anhang Z. Uberblick uber algebraische Strukturen 317

Anhang. Literaturverzeichnis 319

Anhang. Stichworte 321

Anhang. Symbole 327

VORWORT v

Vorwort

Dies ist das Skript zu den Vorlesungen”Analysis I“ und

”Analysis II“, die ich im Wintersemester

2018/19 und Sommersemester 2019 an der Universitat Regensburg halte. Das Skript sollte un-gefahr das enthalten, was an der Tafel stand, und zusatzlich einige dazu gegebene Erklarungenwiderspiegeln. Anhange erganzen die Themen, sie wurden nicht in der Vorlesung behandelt. EinigeBeispiele und Erweiterungen, die aus Zeitgrunden nicht in der Vorlesung behandelt wurden, sindso gedruckt, und sind naturlich gut fur die Nachbereitung beziehungsweise Vertiefung geeignet.Falls Sie einen Tippfehler finden oder sonstige Verbesserungsvorschlage haben, so senden Sie bitteeine Email an mich. Leider enthalt das Skript bisher nur wenige Bilder und Zeichnungen.

Die aktuelle Version ist unter dem Link

http://www.mathematik.ur.de/ammann/lehre/2019s_analysis2/analysisi+II.pdf

verfugbar.

Die Homepage der Vorlesung ist

http://www.mathematik.ur.de/ammann/lehre/2010s_analysis2.

Regensburg, April 2019,

Bernd Ammann

http://www.mathematik.ur.de/ammann/lehre/2019s_analysis2/analysisi+II.pdf

http://www.mathematik.ur.de/ammann/lehre/2010s_analysis2

WARNUNGEN vii

Logischer Aufbau des ersten Kapitels

Die Abschnitte des ersten Kapitels sind – aus Sichtweise des logischen Aufbaus – nicht optimalangeordnet. Unter anderem werden Begriffe wie Mengen, Funktionen, kartesische Produkte undahnliches teilweise benutzt, bevor sie eingefuhrt werden. Dies erscheint vertretbar, da ich davonausgehe, dass jede(r) Horer(in) bereits eine gewisse Vorstellung von manchen der Begriffen hat,und wenn nicht, dann wird es sich in einem zweiten Durchgang klaren, was gemeint ist. Die inder Vorlesung und im Skript gewahlte Reihenfolge hat den Vorteil, dass man bereits fruh in denUbungen auf die wichtigen Punkte eingehen kann, wie zum Beispiel die Themen Aussagenlogikund Quantoren.

Ich empfehle, mit einem gewissen zeitlichen Abstand dieses Kapitel noch einmal durchzuschauen,dann wird wahrscheinlich manches bisher unklare sich klaren.

Warnungen

Legen Sie das Skript nicht in eine Ecke mit dem ruhigen Gewissen, es ja spater lesen und durch-arbeiten zu konnen. Beginnen Sie sobald wie moglich, die Lucken zu schließen. Schwierige Beweisedurchschauen Sie am besten, wenn Sie sich uberlegen, was der Beweis in konkreten Beispielenmacht.

Bilder, Skizzen und Abschnitte die mit USW angedeutet werden, in der Vorlesung behandelt wur-den, aber aus Zeitgrunden noch nicht getext wurden, sind selbstverstandlich auch relevant furmundliche und schriftliche Prufungen.

KAPITEL 1

Elementare Logik und Grundlagen der Mathematik

1. Die Struktur des mathematischen Denkens17.10.

Die naturlichen Zahlen werden seit Jahrtausenden intuitiv benutzt und untersucht. Sie sind unsvertraut, ohne dass wir aber zunachst wissen, was sie charakterisiert. So ahnlich war es mit vielenmathematischen Konzepten, zum Beispiel dem mathematischen Konzept der unendlichen Summe.Man nutzte viele Konzepte lange in einer vagen Bedeutung, ohne sich zu uberlegen, wie man siedefiniert. Alle Personen stimmen wohl uberein, dass der Wert der unendlichen Summe

1 +1

2+

1

4+

1

8+ · · ·

die Zahl 2 sein sollte. Und derartige unendliche Summen sind oft wichtig, zum Beispiel in derZinseszinsrechnung, bei physikalischen Problemen und vielem mehr. Deswegen wurden Sie bereitsim Mittelalter diskutiert. Leider fuhrte eine genauere Betrachtung zu wachsenden Problemen. Esgab unter anderem viele Diskussionen, was denn der Wert der unendlichen Summe

1 + (−1) + 1 + (−1) + . . .

sei, manche Gelehrte vertraten die Ansicht es sei 0: mit der Begundung

(1 + (−1)) + (1 + (−1)) + (1 + (−1)) + . . . = 0 + 0 + 0 + . . . = 0.

Dies erscheint uberzeugend. Mit derselben Logik kann man aber auch begrunden, dass man denWert 1 erhalt:

1 + ((−1) + 1) + ((−1) + 1) + . . . = 1 + 0 + 0 + . . . = 1.

Derartige Probleme motivierten die Mathematiker, die Mathematik auf solide Grundlagen zu stel-len. Diese Bewegungen, die man Axiomatik nennen kann, begann im Bereich der Geometrie bereitsmit Euklid von Alexandria (ca. 300 v. Chr.) und Aristoteles (384–322 v. Chr.). Wichtige Fort-schritte in der Axiomatik der Geometrie und insgesamt der Axiomatik wurden im 19. Jahrhundertvollbracht.

Das Ziel der Axiomatik ist es, die gesamte Mathematik aus wenigen Grundaussagen, sogenanntenAxiomen, herzuleiten.

Nehmen wir mal an, ich uberlege mir, ob ich uberhaupt existiere oder nicht. Mein Leben undmeine Person konnte ja auch nur das Ergebnis einer Simulation eines gigantischen Großrechnerssein. Was konnte ich tun, um diese Frage zu losen? Ich kann mir selbst wehtun, ich empfinde

1

2 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK

Schmerz, also sollte ich existieren! Falsch, das konnte Teil der gigantischen Simulation sein. Ichkonnte einen Studenten in der hinteren Reihe fragen, ob ich existiere, er sagt ja. Ist dadurchmeine Existenz bewiesen? Nein, denn er konnte Teil derselben Simulation sein. Sie sehen, ich kannmeine eigene Existenz nicht zeigen, ohne andere Grundannahmen zu machen. Dennoch ist es sehrsinnvoll anzunehmen, dass ich existiere. Solche Probleme beschaftigen die Philosophen schon seitJahrhunderten oder besser Jahrtausenden.

Genauso wie aber unser elementares Denken Grundannahmen braucht, benotigt auch die Mathe-matik bestimmte Grundannahmen, und diese Grundannahmen nennt man Axiome. Im Prinzipsollte in der heutigen Mathematik alles auf den Axiomen der Mengenlehre aufbauen. Daraus kon-struiert man sich dann alle Objekte des mathematischen Denkens: Zahlen, Vektorraume, Matrizen,und vieles mehr. Oft versieht man Teilgebiete mit eigenen Axiomen, wie zum Beispiel die Axiomeder klassischen Geometrie.

Axiome sind nicht mehr weiter beweisbar, sie werden einfach als gegeben hingenommen, als Grund-annahmen unseres Denkens. Die Axiome erscheinen sinnvoll, entweder weil man sie als evident, alsooffensichtlich ansieht, oder weil man sie als Kennzeichen der Theorie ansieht. Aus diesen Axiomenwerden dann Schlussfolgerungen gezogen, die ebenfalls durch weitere Axiome geregelt sind. Durcherlaubte Kombinationen von bereits bekannten wahren Aussagen erhalt man neue wahre Aussagen.Eine Sammlung von so aufeinander aufbauenden wahren Aussagen, nennt man Beweis. Falls eineso erhaltene Aussage interessant erscheint, nennt man sie Theorem, Lemma, Korollar, Proposition,Satz, Hilfssatz, Folgerung oder ahnlich. Hierbei ist im allgemeinen ein Satz oder ein Theorem einewichtige Aussage, ein Lemma oder ein Hilfssatz eine Aussage, die nur als Zwischenschritt dient,und eine Proposition hat eine Mittelstellung. Erhalt man eine Aussage nahezu unmittelbar auseinem Theorem oder Satz, so nennt man dies eine Folgerung oder ein Korollar.

Damit die Aussagen nicht immer langer und langer werden, macht man Definitionen. Hierbei gibtman mathematischen Objekten oder mathematischen Sachverhalten einen Namen.

Die Mathematiker sind im Prinzip recht frei in der Wahl ihrer Definitionen. So konnte man diefolgende Definition machen: Ein Auto ist eine Menge, in der die Elemente 1, 2 und 3 enthalten sind.Ein Hund ist eine Menge, in der die Elemente 1 und 2 enthalten sind. Man schließt daraus, dassjedes Auto einen Hund enthalt. Diese Definitionen sind naturlich sehr irrefuhrend, aber prinzipiellerlaubt. Wir Mathematiker bemuhen uns die Dinge so zu benennen, dass sie moglichst etwas mitder

”wirklichen Welt“ zu tun haben. Um Koordinaten auf einer Kugel anzugeben, definiert man

den Begriff einer”Karte“, und ein

”Atlas“ ist dann definiert als Menge von Karten, so dass alles

uberdeckt wird. Diese Begriffe sind dann zwar nicht genau das, was man damit umgangssprachlichmeint, aber auch nicht vollig ohne Zusammenhang. Die mathematischen Begriffe

”Halm“ oder

”Garbe“ der Mathematik haben aber keinerlei Anwendungen in der Landwirtschaft. Die

”Knoten“

der Mathematik sind aber wiederum nahe an dem, was man alltagssprachlich als Knoten bezeichnet.

Um den Unterschied zwischen Definitionen und Aussagen klar zu unterscheiden, nutzen wir diefolgende Notation: a = 1, 234 ist die Aussage

”a ist gleich 1, 234“. Hingegen ist a := 1, 234 eine

Definition, a ist ab sofort eine kurze Schreibweise fur 1, 234.

1. DIE STRUKTUR DES MATHEMATISCHEN DENKENS 3

Viele Definitionen werden von allen Mathematikern gleich gemacht, es herrscht Konsens. Man istsich aber nicht einig, ob die Definition der naturlichen Zahlen die Null einschließen soll oder nicht.Fur unsere Vorlesung gilt: die naturlichen Zahlen sind

N = {0, 1, 2, . . .}.Die Menge N>0 := {1, 2, 3, . . .} bezeichnen wir als naturliche Zahlen ohne Null. Dies ist eine derublichen Definitionen. Viele Mathematiker definieren hingegen die Menge der naturlichen Zahlenals {1, 2 . . .}. Dass verschiedene Mathematiker die Definition verschieden wahlen, ist nicht weiterschlimm. Ob Null eine naturliche Zahl ist oder nicht, ist eben Definitionssache. Man schaut sichdie Definition des Autors an und weiß, was er meint.

In zentralistischen Landern wie Frankreich ist klar geregelt: Null ist eine naturliche Zahl. InDeutschland besagt DIN 5473 ebenfalls, dass Null eine naturliche Zahl ist. Lehrer in der Schu-le sollten sich an diese DIN-Norm halten. Außer man wohnt in Bayern. An bayerischen Schulen istNull keine naturliche Zahl, und daran sollte man sich als Lehrer auch halten, um die Schuler nichtzu verwirren.

Da die meisten Horer dieser Vorlesung ja gleichzeitig Lineare Algebra bei Denis-Charles Cisinskihoren, und er Franzose ist, ist bei uns Null eine naturliche Zahl. Die zukunftigen bayerischen Lehrermogen dies bitte verzeihen und freuen sich vielleicht uber diese

”Zusatzqualifikation“ fur andere

Bundeslander.

Anders ist es bei der Zahl π. Dass der Wert dieser Zahl zwischen 3,1415 und 3,1416 liegt ist eineAussage und keine Definition. Deswegen ist es lacherlich, dass der US-Bundesstaat Indiana 1897den Wert von π auf 3, 2 gesetzlich festlegen wollte, um Berechnungen zu vereinfachen und um esden Schulern einfacher zu machen.

Wenn wir nun aber hier in der Vorlesung alles rigoros mit der eigentlich notwendigen mathe-matischen Strenge einfuhren wurden, so mussten wir dem Aufbau der Mathematik folgen. DieGrundlagen hierbei bilden die Axiome der Logik und der Mengenlehre. Aus ihnen werden vieleAussagen gezeigt, und man kann dann irgendwann die naturlichen Zahlen, die ganzen Zahlen, dierationalen Zahlen und die reellen Zahlen einfuhren1 und deren Eigenschaften studieren. Die reellenZahlen erfullen auch wieder einige wichtige Aussagen, die wir vorlaufig die Grundeigenschaften derreellen Zahlen nennen wollen. Aus diesen Grundeigenschaften der reellen Zahlen kann man nunalle wichtigen Aussagen der Analysis herleiten. Nahezu alles, was wir zusammen in den nachstenSemestern behandeln werden, ergibt sich aus diesen Grundeigenschaften.

Nun gibt es aber ganz verschiedene Moglichkeiten, die reellen Zahlen zu definieren: in der Schulehabe ich die Moglichkeit mit Intervall-Schachtelung kennengelernt, in der Vorlesung hier wollenwir Dedekindsche Schnitte behandeln, vor 5 Jahren in meiner Analysis I habe ich sie mit Hilfevon Cauchy-Folgen definiert. Jeder Zugang hat seine Vorteile und Nachteile in Bezug auf Anschau-lichkeit und Verallgemeinerbarkeit. Wichtig ist hierbei: egal, wie man es macht, es ergeben sichimmer die selben Grundeigenschaften. Deswegen ist es sinnvoll, die Grundeigenschaften der reellen

1mathematisch genauer gesagt: definieren


Zahlen als die Axiome der reellen Zahlen zu bezeichnen und dann alles aus diesen Axiomen derreellen Zahlen herzuleiten. Genauso haben auch die naturliche Zahlen ihre Axiome, die sogenann-ten Peano-Axiome2. Alle von Ihnen, die gleichzeitig die Lineare Algebra I besuchen, lernen dortdie Axiome eines Vektorraums kennen und leiten daraus dann alle Eigenschaften ab, die Sie uberVektorraume wissen sollten.3

In der Vorlesung konnen wir nun aber leider nicht alles streng axiomatisch einfuhren, da dies vielzu lange dauern wurde und die meisten von Ihnen auch nicht die notige Geduld dafur aufbringenwurden – vielleicht nicht einmal ich. Wir mussen also zu Anfang einen Kompromiss zwischen dernotigen Strenge und der angemessenen Kurze finden.

Der Plan ist deswegen, zunachst Begriffe wie Mengen, Abbildungen, logische Operationen und vieleahnliche Begriffe nur intuitiv einzufuhren, also ohne die richtige mathematische Strenge.

Im Anhang A im Skript gebe ich einen kleinen Einblick, wie man die Mengenlehre mathematischstringenter einfuhren kann. Die zugehorigen Abschnitte A.1 und A.2 werde ich in der Vorlesungnicht behandeln, aber ich empfehle ihn allen interessierten Studierenden zur Lekture. Wenn Sie dieMengenlehre noch besser axiomatisch verstehen wollen, so ist es am besten, wenn Sie begleitendsich etwas selbst durcharbeiten, z.B. das Buch [17], aber auch da werden letztendlich Fragenzuruckbleiben. Wenn Sie die Mengenlehre

”richtig“ verstehen wollen, sollten Sie spater mit einer

gewissen mathematischen Reife, also in zwei oder drei Semester, die Logik nochmals systematischstudieren, z.B. an Hand der Bucher [13] oder [20].

Nachdem das einfuhrende Kapitel beendet ist, wenden wir uns den Zahlen zu. Wir beschreibengrundlegende Eigenschaften der naturlichen, ganzen, rationalen, reellen und komplexen Zahlen.Auch da werden wir in Teilen nicht streng mathematisch vorgehen. Ich gehe zum Beispiel davon aus,dass Sie intuitiv wissen, was die naturlichen, ganzen und rationalen Zahlen sind. Eigentlich warees aber auch wichtig, zum Beispiel die naturlichen Zahlen axiomatisch durch die Peano-Axiome(Anhang B) zu beschreiben. Es ist namlich zunachst nicht so recht klar, was denn die Punkte in derDefinition N = {0, 1, 2, . . .} bedeuten soll. Dies soll in der Linearen Algebra I genauer behandeltwerden.

Wir werden dann zu den reellen Zahlen kommen. Da diese fur die Analysis ganz zentral sind,werden wir die Axiome diskutieren und von da an alles grundlich auf den Axiomen der reellenZahlen aufbauen: Folgen, Reihen, Differentiation, Integration und vieles mehr.

Wichtig ist auch, dass Sie sich bewusst werden, was Sie in den nachsten Wochen alles lernen sollten.Den mathematischen Inhalt der Vorlesung sollten Sie durchdringen, damit umgehen lernen unddanach nie wieder vergessen. Viel wichtiger aber noch ist, dass die meisten von Ihnen Ihre gewohnteArbeitsweise umstellen mussen. Es geht dabei beim weitem nicht nur darum, dass Sie von nun an

2siehe Anhang B3Das Wort

”Sie“ ist bewusst groß geschrieben, da ich der Meinung bin, dass alle hier im Publikum dies beherr-

schen sollten.

2. AUSSAGENLOGIK 5

in vieler Hinsicht fur Ihr Lernen und Ihre Lernmethoden selbst verantwortlich sind, sondern vorallem darum, dass Sie das oben diskutierte rigorose Argumentieren lernen.

Sie mussen klar unterscheiden konnen zwischen Axiomen, Definitionen und Aussagen (Satzen,Theoremen, Lemmata, Propositionen,...). Sie mussen lernen, Beweise zu verifizieren. Und Siemussen lernen, Ideen zu bekommen, wie Sie selbst Beweise fuhren, und auch lernen, wie Sie danndiesen Beweis gut aufschreiben. Dies zu lernen, ist nur durch eine intensive Ruckmeldung moglich,und das geht naturlich nicht in der großen Vorlesung hier. Deswegen sind die Ubungen fur Sie ganzwichtig.

2. Aussagenlogik

Was ist eine Aussage?

Beispiele 2.1. Die folgenden Ausdrucke sind Aussagen

A1: 2 ∗ 3 = 6

A2: 2 + 2 = 1 + 3

A3: Die Zahl 27 hat 4 Teiler.

A4: Alle naturliche Zahlen haben eine Primfaktor-Zerlegung

A5: Am 13.9.2018 hatte die Donau in Regensburg Hochwasser

A6: Christian Lindner wurde im September 2018 zum Bundeskanzler gewahlt

Wir gehen davon aus, dass wir eine Sprache haben, die aus Zeichenketten besteht. Manche Zei-chenketten ergeben keinen Sinn, zum Beispiel

”hejekl“ oder

”Hund Maus Loch“, wir nennen sie

syntaktisch nicht sinnvoll. Wenn die Zeichenkette etwas aussagt, so nennen wir sie syntaktischsinnvoll. 4

Definition 2.2. Eine Aussage ist eine syntaktisch sinnvolle Zeichenkette, die entweder wahr (w)oder falsch (f) ist.

Eine dritte Moglichkeit gibt es nicht (lateinisch:”tertium non datur“).

A1 bis A6 sind Aussagen, A1 bis A4 sind wahr, A5 und A6 sind falsch. Wenn eine Aussage wahrist, so sagen wir auch:

”Die Aussage gilt.“

Bemerkung 2.3. Es gibt Wissenschaftsbereiche, in den das”tertium non datur“ nicht gilt, in

denen also neben”wahr“ und

”falsch“ weitere Moglichkeiten zugelassen werden. Z.B. in der Quan-

tenmechanik (Schrodingers Katze ist weder tot noch lebendig), Aussagen in der Wahrscheinlich-keitstheorie (Es regnet morgen mit Wahrscheinlichkeit 0,3), Philosophie, Teilgebiete der Logik. In

4Dies soll hier nicht genauer definiert und spezifiziert werden, da es fur unsere Zwecke unwichtig ist.


unserer Vorlesung sind aber gemaß obiger Definition nur Aussagen zulassig, die entweder wahroder falsch sind.

Man kann Aussagen durch elementare logische Operationen verknupfen. Man kann diese Opera-tionen zum Beispiel durch Wahrheitstafeln definieren.

Definition 2.4 (Negation). Die Negation ¬ wird durch die folgende Wahrheitstafel definiert

A ¬Aw ff w

LEMMA 2.5. Fur alle Aussagen A gilt ¬(¬A) = A

Beweis. Wir unterscheiden zwei Falle.

1. Fall: A ist wahrA ist wahr =⇒ ¬A ist falsch =⇒ ¬(¬A) ist wahr

2. Fall: A = fA ist falsch =⇒ ¬A ist wahr =⇒ ¬(¬A) ist falsch

Definition 2.6 (Aussagenlogische Verknupfungen). Die Und-Verknupfung ∧, die Oder-Verknu-pfung ∨, die Entweder-Oder-Verknupfung Y, die Implikation (Wenn-Dann-Beziehung)→, die umge-kehrte Implikation (Dann-Wenn-Beziehung5)← und die Aquivalenz (Genau-Dann-Wenn-Beziehung)↔ sind durch die folgende Wahrheitstafel definiert

A B A ∧B A ∨B A YB → ← ↔w w w w f w w ww f f w w f w ff w f w w w f ff f f f f w w w

Ist die Aussage A↔ B wahr, so sagen wir auch A und B sind aquivalent .

In zusammengesetzen Ausdrucken sind Negationen zuerst auszufuhren, ansonsten muss man durchKlammern die Reihenfolge klaren sofern notig. Zum Beispiel gilt

¬A ∧B = (¬A) ∧Bund dies ist im allgemeinen nicht dasselbe wie ¬(A∧B). Man darf aber die Klammern weglassen,wenn das Resultat nicht von der Reihenfolge abhangt, Beispiele spater.19.10.

Bisher haben wir nun angenommen A, B seien feste Aussagen. Oft steht der Wahrheitswert voneinem Ausdruck noch gar nicht fest, z.B.

5Beispiel: (Die Straße wird nass.) ← (Es regnet.). In Worten: Die Straße wird (dann) nass, wenn es regnet.

Man kann logisch aquivalent auch sagen: Es regnet nur dann, wenn die Straße nass wird.

2. AUSSAGENLOGIK 7

A: Am 1.2.2024 wird es ein Erbeben in Japan geben

Um auch solche Ausdrucke behandeln zu konnen, deren Wahrheitswert noch nicht festgelegt ist,fuhren wir nun Aussageformen ein.

Definition 2.7 (Ausageform). Eine Aussageform ist eine eine syntaktisch sinnvolle Zeichenkette,die

• entweder eine Aussage ist, oder• die von einer oder mehreren Variablen abhangt und die erst nach Einsetzen von Werten

in diese Variablen zu einer Aussage wird.

Hierbei muss man angeben, welche Werte fur die Variablen uberhaupt zugelassen sind.

Eine Aussageform A(x) in einer Variablen x besteht also aus der Angabe der zulassigen Wertevon x, die wir zu einer MengeM zusammenfassen, und einer AbbildungA : M−→{w, f}, x 7→ A(x).Letztere Schreibweise bedeutet, dass jedem zulassigen Wert von x ein Wert A(x) zugeordnet ist, derentweder wahr (w) oder falsch (f) ist.6 Hangt A(x1, x2, . . .) von mehreren Variablen hat, so sollteeine Wertemenge M1 fur x1, eine Wertemenge M2 fur x2 etc. vorgeben werden. Aussageformen in2 Variablen sind also Abbildungen:

A : M1 ×M2−→{w, f}, (x1, x2) 7→ A(x1, x2).

Beispiele 2.8.

A1(x) : x > 0 Zulassig: x ∈ RA2(X) : Das Auto X ist rot Zulassig: Alle Autos X der Welt

A3(B,C) : B ∨ C Zulassig: B und C sind Aussagen.

A4(B,C,D,E) : (B ∨ C)→ (¬D ∧ E) Zulassig: B, C, D und E sind Aussagen.

Sind wahr und falsch die zulassigen Werte der Variablen x, so nennt man x eine aussagenlogi-sche Variable. Verknupft man ausagelogische Variablen durch die Negation ¬ oder die logischenVerknupfungen ∧, ∨, Y, →, ← und ↔, so nennt man die somit erhaltene Aussageform eine aus-sagenlogische Formel . Es ist hierbei erlaubt, mehrere logische Verknupfungen oder Negationenanzuwenden. Insbesondere sind dann alle Variablen aussagenlogische Variablen. In den obigen Bei-spielen sind A3 und A4 aussagenlogische Formeln, die anderen keine.

Fur aussagenlogische Formeln kann man viele Beziehungen herleiten, zum Beispiel folgende:

PROPOSITION 2.9. Fur alle Belegungen von A, B und C mit Wahrheitswerten w und f sind diefolgenden Aussagen wahr:

6Der Pfeil −→ in der Abbildungsbeschreibung ist nicht zu verwechseln mit der Implikation→, deswegen wollen

wir den ersteren zunachst langer und in roter Farbe schreiben. Spater wird immer klar sein, welche Bedeutung der

Pfeil nun hat und wir schreiben dann immer →. Wir setzen hier voraus, dass die Begriffe”Menge“,

”Produkte

von Mengen“ und”Abbildung“ Ihnen bereits intuitiv vertraut sind, wenn nicht dann sind die Erklarungen dieses

Abschnitts erst in ungefahr zwei Wochen verstandlich.


(a) A ∨ ¬A (Tertium non datur)(b) ¬(A ∧ ¬A) (Widerspruchsfreiheit)(c) A ∨ w(d) ¬(A ∧ f)(e) (A ∧ f) ↔ f(f) (A ∨ f) ↔ A(g) (A ∧ w) ↔ A(h) (A ∨ w) ↔ w(i) (A ∨B) ↔ (B ∨A) (Kommutativitat von ∨)(j) (A ∧B) ↔ (B ∧A) (Kommutativitat von ∧)(k) (A ∨ (B ∨ C)) ↔ ((A ∨B) ∨ C) (Assoziativitat von ∨)(l) (A ∧ (B ∧ C)) ↔ ((A ∧B) ∧ C) (Assoziativitat von ∧)

(m) (A ∨B) ↔ ¬(¬A ∧ ¬B) (de Morgansche Regeln)(n) (A ∧B) ↔ ¬(¬A ∨ ¬B) (de Morgansche Regeln)(o) (A ∧ (B ∨ C)) ↔ ((A ∧B) ∨ (A ∧ C)) (Distributivgesetze)(p) (A ∨ (B ∧ C)) ↔ ((A ∨B) ∧ (A ∨ C)) (Distributivgesetze)(q) (A↔ w) ↔ A(r) (A↔ f) ↔ ¬A(s) (A→ B) ↔ (B ← A)(t) (A→ B) ↔ (¬A ∨B) (Kontraposition)(u) (A← B) ↔ (A ∨ ¬B)(v) (A→ B) ↔ (¬B → ¬A)(w) (A↔ B) ↔ ((¬A ∨B) ∧ (A ∨ ¬B))(x) (A↔ B) ↔ ¬(A YB)(y) (A ∧B) → A

Diese Proposition wird teilweise in den Ubungsgruppen bewiesen, die verbleibenden konnen Sieselbst mit ahnlichen Methoden leicht beweisen. Die obigen Aquivalenzen, d.h. die obigen Aussagenin der Form D ↔ E, beweist man oft am besten, in dem man mit Hilfe einer Wahrheitstabelle Dund E fur alle Belegungen von A, B und C berechnet und dann vergleicht. Nachdem man einigeAussagen gezeigt hat, kann man durch deren Kombination weitere erhalten.

Aus (l) folgt zum Beispiel, dass A∧B ∧C ein syntaktisch sinnvoller Ausdruck ist, da das Ergebnisnicht von der Klammerung abhangt, und analog dazu ist naturlich auch A ∨ B ∨ C ein sinnvollerAusdruck.

Definition 2.10. Wir nennen zwei Aussageformen aquivalent , wenn sie von denselben Variablenabhangen, die Variablen dieselbe zulassigen Werte haben und wenn beide Aussageformen fur alleBelegungen der Variablen mit Werten aquivalente Aussagen ergeben.

Somit sind also die Aussageformen D und E aquivalent genau dann, wenn D ↔ E fur alle Bele-gungen der Variablen wahr ist.

2. AUSSAGENLOGIK 9

Beispiel 2.11. Proposition 2.9 (i) besagt, dass A ∨B aquivalent zu B ∨A ist.Proposition 2.9 (x) besagt, dass A↔ B aquivalent zu ¬(A YB) ist.

LEMMA 2.12. Die aussagenlogischen Formeln E1(A,B,C) := A→ (B → C) und E2(A,B,C) :=(A → B) → C sind nicht aquivalent. (Praziser gesagt: Es ist nicht richtig, dass fur alle Wahlenvon A, B und C die aus E1 und E2 erhaltenen Aussagen aquivalent sind).

Deshalb ist also A → B → C kein syntaktisch sinnvoller Ausdruck, man muss hier Klammernsetzen.

Beweis. Angenommen, die aussagenlogischen Formeln E1 und E2 waren fur alle A, B und Caquivalent. Dann waren sie insbesondere aquivalent im Fall, dass A, B und C falsch sind. Indiesem Fall sind A → B und B → C wahr und somit ist E1 wahr und E2 falsch. Somit habenwir einen Widerspruch zur obigen Annahme erhalten. Die Annahme war also falsch. Also ist dasLemma bewiesen.

Der obige Beweis ist ein Widerspruchsbeweis. Um eine Aussage F zu zeigen, nimmt man zunachst¬F an und leitet daraus einen Widerspruch her.

Hierbei ist

F : Fur alle Wahlen von A, B und C sind die Aussagen E1(A,B,C) und E2(A,B,C) aquivalent.

Ein anderer Typ von Widerspruchsbeweis ist noch haufiger. Man mochte eigentlich die AussageE → F zeigen. Man nimmt nun ¬F an und leitet daraus ¬E her. Man hat somit ¬F → ¬E gezeigt.Dies ist aber mit Proposition 2.9 (v) aquivalent zu E → F .

Bemerkung 2.13. Die Symbole ⇐⇒ und =⇒ nutzen wir ahnlich wie die Symbole ↔ und →,jedoch mit kleinen Unterschieden:

• Wenn wir aussagenlogische Variablen in einer aussagenlogischen Formel zusammenfugen,so wenden wir zuerst ↔, →, ←, ∧,. . . und dann erst ⇐⇒ und =⇒ an.Beispiel: Die Aussageform

3 + 4 = 7⇐⇒ A ∨ ¬A

ist als (3 + 4 = 7)⇐⇒ (A ∨ ¬A) zu lesen.• Wir lesen Implikationsketten wie zum Beispiel A =⇒ B =⇒ C als

”(A impliziert B) und

(B impliziert C)“. Als Beispiel betrachte man den Beweis von Lemma 2.5. Der AusdruckA→ B → C ist hingegen syntaktisch gar nicht sinnvoll, da Klammern benotigt werden.


Analog sind Aquivalenzketten zugelassen und zu interpretieren, zum Beispiel:

¬(A ∨ ¬B) ∧A ”(n)“⇐⇒ (¬A ∧B) ∧A(l)⇐⇒ ¬A ∧ (B ∧A)

(j)⇐⇒ ¬A ∧ (A ∧B)

(l)⇐⇒ (¬A ∧A) ∧B

”(b)“⇐⇒ f ∧B

”(e)“⇐⇒ f

Bei jedem ⇐⇒ findet eine Aquivalenzumformung statt, die direkt aus bereits bekanntenAussagen folgt. Der jeweilige Buchstabe uber einem der ⇐⇒-Pfeile gibt an, welche Ei-genschaft in Proposition 2.9 verwendet wurde. Die Anfuhrungszeichen in der ersten undden beiden letzten Zeilen deuten an, dass man leicht modifizierte Versionen der zitiertenPunkte hernehmen muss. Die Verwendung des Zeichens ⇐⇒ ware naturlich auch ohnedie Erklarungen daruber gestattet. Die obige Umformungskette ist somit ein Beweis7 derTatsache, dass die Aussageform ¬(A ∨ ¬B) ∧ A fur alle Belegungen von A und B mitWahrheitswerten falsch ist.

Eine ahnliche Verwendung wird im folgenden Beispiel verdeutlicht:

¬(A↔ B)⇐⇒ ¬A↔ B

⇐⇒ A↔ ¬B⇐⇒ A YB

⇐⇒ ¬A Y ¬B

Die obigen Zeilen sind eine recht effektive Art und Weise auszudrucken, dass alle obigenAusdrucke paarweise aquivalent sind. Allerdings muss man hier

”etwas arbeiten“ um

jeweils von der linken Seite von⇐⇒ zur rechten zu kommen. Dies geht in diesem Beispielmit einer Wahrheitstafel sehr gut.• Um Missverstandnisse zu vermeiden, verbieten wir es, Ausdrucke, die⇐⇒ und =⇒ enthal-

ten, durch weitere aussagenlogische Verknupfungen zu verbinden. Das heißt beispielswei-se, dass wir A⇐⇒ (B =⇒ C) als syntaktisch nicht sinnvoll betrachten, also vergleichbarzu

”jjkwdh“.

Beispiel: Proposition 2.9 (w) und (x) ergeben dann zusammen

A↔ B ⇐⇒ (¬A ∨B) ∧ (A ∨ ¬B)⇐⇒ ¬(A YB).

7Die Worte”beweisen“ und

”zeigen“ haben in der Mathematik nahezu dieselbe Bedeutung.

3. MENGEN 11

Bemerkung 2.14. Man konnte zunachst auch nur ¬ und ∧ durch eine Wahrheitstafel wie obendefinieren und alle danach anderen aussagenlogischen Verknufungen durch Formeln aus Propositi-on 2.9, z.B. A ∨B := ¬(¬A ∧ ¬B) durch die de Morgansche Regel.

3. Mengen

Beschreibung 3.1 (Georg Cantor, 1845–1918). Unter einer Menge verstehen wir jede Zusam-menfassung M von bestimmten wohlunterschiedenen Objekten unserer Anschauung oder unseresDenkens (welche Elemente von M genannt werden) zu einem Ganzen.

Hier wird erklart, was eine Menge ist. Auch eine Definition erklart, was ein neuer Begriff bedeutet.Dennoch ist die obige Erklarung keine mathematische Definition, sondern eine intuitive Erklarung.Wenn man in der Mathematik sauber definieren will, was eine Menge ist, darf man nur Worteund Strukturen benutzen, die zuvor schon ein klare Bedeutung haben. Es ist nun aber doch etwasunklar, was die Worte

”Zusammenfassung“, “bestimmten“, “wohlunterschieden“ bedeuten.

Die obige”Beschreibung“ sagt uns also lediglich, was wir uns unter einer Menge vorstellen sollen.

Das reicht uns aber fur das folgende, und eine genaue Definition ware zu aufwandig.

Eine Menge enthalt Elemente. Zwei Mengen sind genau dann gleich, wenn sie die gleichen Elementeenthalten.

Schreibweisen:M = {x, y, z} = {x, x, y, z} = {y, x, z} ist die Menge, deren Elemente x, y und z sind.

Man darf Elemente in den Klammern { } mehrfach aufzahlen, sie sind dann aber nur einmalin der Menge. Ein Element kann in einer Menge sein, oder nicht darin sein, es kann aber nichtmehrfach in M enthalten sein.

x ∈M ist die Kurzschreibweise fur”x ist ein Element von M“

x 6∈M ist die Kurzschreibweise fur”x ist kein Element von M“

x 6∈M ⇐⇒ ¬(x ∈M)

Beispiele 3.2.

(1) Vorstellung von M = {x, y, z}

xy

z

(2) Die Menge aller naturlichen Zahlen: N = {0, 1, 2, 3, . . . , }.Ubliche Formulierung: Die Menge N der naturlichen Zahlen.


(3) Die Menge R der reellen Zahlen 8

(4) Die Menge R>0 der positiven reellen Zahlen. (Die Null ist weder positiv noch negativ).9

(5) Ist A(x) eine Aussageform in einer Variablen x, so bilden die zulassigen Werte von x eineMenge, die Definitionsmenge der Aussageform. In Beispiele 2.8 ist die Definitionsmenge vonA2 die Menge aller Autos. Die Definitionsmenge von A1 ist R.

Definition 3.3. Die Menge, die keine Elemente hat, heißt die leere Menge, und wird notiert als ∅oder {}.!ACHTUNG!. ∅ 6= {∅} und 1 6= {1} 6= {{1}}.

Bei Aussagen und aussagenlogischen Formeln schreiben wir ab sofort :⇐⇒ fur”ist definiert als“.

Definition 3.4 (Teilmenge).

(1) Die Menge N ist eine Teilmenge von M , genau dann wenn jedes Element von N auch einElement von M ist. Als Formel schreiben wir N ⊂M .

(2) Die Menge N ist eine echte Teilmenge von M , genau dann wenn N eine Teilmenge M ist undvon M verschieden ist. Wir schreiben hierfur N (M .

Beispiele 3.5.

(1) {1, 2} ⊂ {1, 2, 3} und {1, 2} ( {1, 2, 3}.(2) Fur alle Mengen M gilt: ∅ ⊂M(3) Fur alle Mengen M gilt: M ⊂M

24.10.

Definition 3.6. Ist A eine auf M definierte Aussageform, so definieren wir

{x ∈M | A(x)}als die Teilmenge aller Elemente x von M , fur die A(x) wahr ist.

Es gilt somit fur alle y ∈M :

y ∈ {x ∈M | A(x)} ⇐⇒ A(y)

Umgekehrt: Ist N eine Teilmenge von M , so ist

A(x) :=

{w falls x ∈ Nf falls (x ∈M) ∧ (x 6∈ N)

8Achtung: Was eine reelle Zahl ist, mussen wir eigentlich noch zuerst lernen!9Sehr verbreitet ist auch die Schreibweise R∗+ fur die positiven reellen Zahlen, und dann schreibt man R+ :=

R∗+ ∪ {0} fur alle reellen Zahlen, die nicht negativ sind. In dieser Schreibweise soll + naturlich positiv bedeuten.Deswegen ist auch die Schreibweise R+ verwirrend, denn wir haben 0 ∈ R+, obwohl 0 nicht positiv ist. Ein dritte

Moglichkeit, die man gelegentlich sieht, ist R+ fur die positiven reellen Zahlen zu benutzen, und dann definiert manR+0 := R+ ∪ {0}. Um Verwirrung zu vermeiden, nutzen wir nur R>0 fur die Menge der positiven reellen Zahlen und

R≥0, wenn die Null noch dazugenommen wird.

3. MENGEN 13

eine auf M definierte Aussageform und es gilt dann

N = {x ∈M | A(x)}.

Beispiele 3.7.

(1) Seien A1 und A2 definiert wie in Beispiele 2.8, M2 sei die Menge aller Autos. Dann gilt

{x ∈ R | A1(x)} = {x ∈ R | x > 0} = R>0

und

{x ∈M2 | A2(x)}ist die Menge aller roten Autos.

(2) Die Menge der geraden naturlichen Zahlen ist

2N :={n ∈ N

∣∣ n2∈ N

}.

Sei k ∈ N>0. Die Menge der durch k teilbaren ganzen Zahlen ist

kZ :={n ∈ Z

∣∣ nk∈ Z

}.

Analog kN.

(3) Die Menge der Primzahlen ist

{n ∈ N | n besitzt genau zwei Teiler (in N)}.

Wir fuhren somit noch eine weitere Art und Weise ein, Mengen zu beschreiben.

Definition 3.8. Sei M eine Menge und f(x) ein von x abhangiger Ausdruck10. Dann bezeichne

{f(x) ‖x ∈M}

die Menge aller Objekte, die sich in der Form f(x) fur ein x ∈M schreiben lassen.11 Analoges giltauch wenn f mehrere Variablen besitzt, zum Beispiel

{f(x, y) ‖x ∈M, y ∈ N},

wenn f von den Variablen x ∈M und y ∈ N abhangt.

Wir konnen dann kZ auch einfuhren als

kZ := {kz ‖ z ∈ Z}.

Definition 3.9. Seien M und N Mengen. Wir definieren hieraus neue Mengen

10Die mathematisch prazisere Voraussetzung ware: f ist eine Funktion in einer Variablen x.11In einigen Wochen vereinfachen wir diese Schreibweise zu {f(x) | x ∈M}.


(a) den Schnitt (oder die Schnittmenge) von M und N als

M ∩N := {x ∈M | x ∈ N} = {x ∈ N | x ∈M}.

Man kann auch sagen, M ∩N ist die Menge, so dass gilt:

x ∈M ∩N ⇐⇒ (x ∈M) ∧ (x ∈ N).

(b) die Vereinigung(smenge) von M und N als die Menge M ∪N , so dass

x ∈M ∪N :⇐⇒ (x ∈M) ∨ (x ∈ N).

(c) das Komplement von N in M als

M rN := {x ∈M | x 6∈ N}

oder dazu aquivalent

x ∈M rN ⇐⇒ (x ∈M) ∧ (x 6∈ N)

(d) die symmetrische Differenz von N in M als

M∆N := (M ∪N) r (M ∩N) = (M rN) ∪ (N rM)

oder dazu aquivalent

x ∈M∆N ⇐⇒ (x ∈M) Y (x ∈ N)

3. MENGEN 15

Beispiel 3.10. Sei A := {1, 2, 3} und B := {3, 4, 5}. Dann ist A∩B = {3}, A∪B = {1, 2, 3, 4, 5},ArB = {1, 2} und , A∆B = {1, 2, 4, 5}

1

2

3

4

5

Abbildung 1: Zwei Mengen A := {1, 2, 3} und B := {3, 4, 5} zur Veranschaulichung von A ∩B,A ∪B und A∆B.

Definition 3.11. Zwei Mengen M und N heißen disjunkt, falls M ∩N = ∅.

Es gelten viele zu Proposition 2.9 analoge Aussagen.

PROPOSITION 3.12. Seien P , Q und R Teilmengen von M . Dann gilt

(a) P ∪ (M r P ) = M(b) P ∩ (M r P ) = ∅(c) P ∪M = M(d) P ∩ ∅ = ∅(e) P ∩ ∅ = ∅(f) P ∪ ∅ = P(g) P ∩M = P(h) P ∪M = M(i) P ∪Q = Q ∪ P (Kommutativitat von ∪)(j) P ∩Q = Q ∩ P (Kommutativitat von ∩)(k) (P ∪ (Q ∪R)) = ((P ∪Q) ∪R) (Assoziativitat von ∪)

. . .

Jede Teilaussage dieser Proposition entspricht einer Teilaussage in Proposition 2.9 mit demselbenkleinen Buchstaben. Zum Beispiel ist Proposition 3.12 (a) eine direkte Folgerung aus Propositi-on 2.9 (a), Proposition 3.12 (b) eine Folgerung aus Proposition 2.9 (b), etc.. Man beachte, dassdie Bedeutungen von (d) und (e) in Proposition 2.9 fast diesseblen sind und deswegen dieselben

”Ubersetzungen“ in Proposition 3.12 haben. Analoges gilt fur (c) und (h).

UBUNG 3.13. Ubersetzen Sie die restlichen Aussagen aus Proposition 2.9 (j) bis (p) in Aussagenuber Mengen. Beweisen Sie all diese Aussagen.


4. Quantoren

Aussagen12 in der Art”Fur alle Elemente x ∈ M ist die Aussage A(x) wahr.“ und

”Es gibt

(mindestens) ein Element x ∈M , fur das A(x) wahr ist.“ sind in der Mathematik sehr haufig. Manschreibt kurz hierfur ∀x ∈M : A(x) und ∃x ∈M : A(x). Man nennt ∀ den Allquantor und ∃ denExistenzquantor. Als Beispiel betrachten wir die Definition von Stetigkeit, ein zentraler Begriff derAnalysis.

Definition 4.1. Eine Abbildung f : R−→R ist stetig in x0 ∈ R, genau dann wenn

∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈ R : (|x− x0| < δ)→ (|f(x)− f(x0)| < ε)︸︷︷︸A(x,x0,f,δ,ε)

A(x, x0, f, δ, ε) ist eine Aussageform, die von funf Variablen abhangt. Wir geben die moglichenWerte durch Mengen an: x ∈ R, x0 ∈ R, f ∈ Abb(R,R) (die Menge aller Abbildungen R−→R),δ ∈ R>0 und ε ∈ R>0. Sobald wir am Ende des Abschnitts Abbildungen und Produkte von Mengeneingefuhrt haben, kann man diese Aussageform auch als Abbildung

A : R× R×Abb(R,R)× R>0 × R>0−→{w, f}

betrachten.

Das folgende Regel ist intuitiv klar:

REGEL 4.2 (Negation von Quantoren). Fur jede auf M definierte Aussageform gilt:

¬∀x ∈M : A(x) ⇐⇒ ∃x ∈M : ¬A(x)(4.3)

Indem man A(x) durch ¬A(x) ersetzt und dann die gesamte Aquivalenz auf beiden Seiten negiert,erhalt man

(4.4) ¬∃x ∈M : A(x) ⇐⇒ ∀x ∈M : ¬A(x)

Klammerregel.Sei A(x, y) eine Aussage die von den Parametern x ∈ X und y ∈ Y , dann ist

∀/∃x ∈ X : ∀/∃y ∈ Y : A(x, y)

zu lesen als

∀/∃x ∈ X :(∀/∃y ∈ Y : A(x, y)

).

Es gilt offensichtlich

∀x ∈ X : ∀y ∈ Y : A(x, y) ⇐⇒ ∀y ∈ Y : ∀x ∈ X : A(x, y)

∃x ∈ X : ∃y ∈ Y : A(x, y) ⇐⇒ ∃y ∈ Y : ∃x ∈ X : A(x, y)

12Naturlich erlauben wir hier auch aussagenlogische Formeln und Aussageformen

4. QUANTOREN 17

Man sagt kurz:”zwei af. (aufeinanderfolgende) Allquantoren vertauschen miteinander“, oder man

sagt”zwei af. Allquantoren kommutieren“. Analog kommutieren zwei af. Existenzquantoren.

!ACHTUNG!. Allquantoren kommutieren nicht mit Existenzquantoren!

Die eine Richtung ist immer wahr:

∀x ∈ X : ∃y ∈ Y : A(x, y) ⇐= ∃y ∈ Y : ∀x ∈ X : A(x, y)

Aus der rechten Seite ∃y ∈ Y : ∀x ∈ X : A(x, y) folgt die linke ∀x ∈ X : ∃y ∈ Y : A(x, y). DieAussagen unterscheiden sich aber sehr. Links darf die Wahl von y von x abhangen, rechts darf siees nicht. Man hat hier also weniger Flexibilitat in der Wahl von y, da man eines finden muss, sodass A(x, y) fur alle x ∈ X richtig ist.

Die Umkehrung (d.h. die Richtung von links nach rechts) ist falsch, wie das folgende Beispiel zeigt.

Beispiel 4.5. Die Aussage

(4.6) ∀x ∈ R : ∃y ∈ R : x > y

ist wahr. Denn fur ein gegebenes x ∈ R konnen wir die Zahl y := x−1 hernehmen und diese erfullty < x. Deswegen ist fur alle x ∈ R die Aussage ∃y ∈ R x > y wahr, also auch (4.6).

Die Aussage

(4.7) ∃y ∈ R : ∀x ∈ R : x > y

ist falsch. Denn fur ein gegebenes y ∈ R gilt nicht fur alle x ∈ R die Ungleichung x > y. DieUngleichung gilt zum Beispiel nicht fur x := y. Also gibt es kein y ∈ R, so dass ∀x ∈ R : x > ywahr ist. Also ist (4.7) falsch.

SCHREIBWEISE 4.8. Quantoren fur eine Variable mussen stehen, bevor diese Variable gebrauchtwerden darf. (Sonst gelten sie als nicht syntaktisch sinnvoll.) 13

Beispiel 4.9. Ausdrucke in der Art”Es gilt 2x = x + x fur alle x ∈ R“ erklaren wir ab sofort

und bis auf weiteres als syntaktisch nicht sinnvoll. Erlaubt sind nur Satze wie”Fur alle x ∈ R gilt

2x = x+ x.“

Die Regel ist deswegen wichtig, damit nicht unklar bleibt, wie die folgende Aussage verstandenwerden soll:

Fur alle x ∈ R gilt x > y fur ein y ∈ R.

Diesen Ausdruck konnte man als die wahre Aussage (4.6) oder als die falsche Aussage (4.7) verste-hen. Deswegen legen wir durch die obige Regel fest, dass Ausdrucke wie das obige A syntaktischnicht sinnvoll sind.

13In spateren Semestern wird diese Regel nicht mehr immer befolgt, falls keine Missverstandnisse zu erwarten

sind.


Frage 4.10. Ist die folgende Aussage A wahr?

A :⇐⇒ ∀x ∈ ∅ : x = x+ 1.

Das didaktische Problem hier ist: obwohl uns bisher intuitiv klar war, was ∀x ∈M : A(x) bedeutet,ist ∀x ∈ ∅ : A(x) nicht intuitiv klar. In studentischen Losungen der Aufgabenblatter steht oft inso einem Fall:

”Da die Aussage x = x+ 1 fur kein einziges Element in ∅ gilt, gilt sie naturlich auch

nicht fur alle Elemente in ∅.“ Das ist ein weit verbreiteter Fehler.

REGEL 4.11. In der Mathematik ist die Aussage

∀x ∈ ∅ : A(x)

fur alle Aussageformen A(x) immer wahr und die Aussage

∃x ∈ ∅ : A(x)

fur alle Aussageformen A(x) immer falsch.

Diese Regel ist letztendlich eine Definition, man konnte auch sagen eine Konvention. Es erscheintauch intuitiv klar, dass ∃x ∈ M : A(x) nur dann wahr sein kann, wenn in M uberhaupt irgend-welche Elemente existieren. Bei der anderen Regel konnte man Zweifel haben. Aber: wenn wir hieraber eine andere Konvention wahlen wurden, hatten wir viele Ausnahmen zu berucksichtigen. ZumBeispiel erscheint uns die folgende Aquivalenz fur alle Mengen M intuitiv klar:

∀x ∈M : A(x) ⇐⇒ {x ∈M | ¬A(x)} = ∅.

Die rechte Seite ist fur M = ∅ offensichtlich wahr.

Außerdem, ergibt sich die erste Teil in Regel 4.11 auch aus dem zweiten Grund: ∃x ∈ ∅ : ¬A(x)ist falsch, also auch ¬∀x ∈ ∅ : A(x) falsch, also ∀x ∈ ∅ : A(x) wahr.

Notation 4.12. In vielen Buchern schreibt man auch oft ∃x : A(x). Dies bedeutet, es existierteine Menge, in der ein Element existiert, fur das A(x) wahr ist. Beispiel: die Aussage ∃x : x ∈Mist aquivalent zu M 6= ∅. Analog heißt ∀x : A(x), dass fur alle Mengen und alle Elemente darindie Aussage A(x) wahr ist.14 Analog hierzu: ist A(x) eine auf allen Elementen von allen Mengendefinierte Aussageform, so bezeichnet {x | A(x)} die Menge aller Elemente, fur die A(x) wahr ist.Diese Bezeichnungen sind vor allem in axiomatischen aufgebauten Logik-Buchern wie [13] ublich,sind im Zugang unserer Vorlesung eine gefahrliche Fehlerquelle: zum Beispiel ist {x | A(x)} oft garkeine Menge, siehe Anhang A Abschnitt 1. Wir wollen sie deswegen nicht verwenden.

14Bei dieser”Notation“ handelt es sich eigentlich auch um eine Definition; es ist die Definition einer Schreibwei-

se. Wir verwenden hier den Begriff Notation, um anzudeuten, dass hier kein neuer Begriff eingefuhrt wird, sonderneine neue Schreibweise.

5. POTENZMENGE UND MENGENSYSTEME 19

5. Potenzmenge und Mengensysteme

Definition 5.1. Ist X eine Menge, so ist P(X) definiert als die Menge aller Teilmengen von M .Man nennt P(X) die Potenzmenge von X.

x ∈ P(X) ⇐⇒ x ⊂ X

Beispiele 5.2.

(1) P({1, 2}) = {∅, {1}, {2}, {1, 2}}(2) P(∅) = {∅} 6= ∅

Definition 5.3. Ein Mengensystem (uber einer Grundmenge X) ist eine Teilmenge von P(X).Dies bedeutet, dass M genau dann ein Mengensystem ist, wenn alle Elemente vonM eine Teilmengevon X sind.

Wir definieren dann ⋃M := {x ∈ X | ∃m ∈M : x ∈ m}

und falls zusatzlich M 6= ∅ definieren wir⋂M := {x ∈ X | ∀m ∈M : x ∈ m}.

Offensichtlich gilt⋃M ⊂ X und

⋂M ⊂ X.

Beispiele 5.4. Beliebige Grundmenge X, A ⊂ X, B ⊂ X

(1) Fur M := {A} gilt⋃M =

⋂M = A.

(2) Fur M := {A,B} gilt⋃M = A ∪B und

⋂M = A ∩B.

Mengensysteme uber der Grundmenge Z

(3) Fur M := {{1, 2, 3}, {3, 5, 7}, {1, 3, 5}} gilt⋃M = {1, 2, 3, 5, 7} und

⋂M = {3}.

(4) Sei

M := {kZ ‖ k ∈ Nr {0, 1}} = {2Z, 3Z, 4Z, . . .}.Dann gilt

⋃M = Z r {−1,+1} und

⋂M = {0}.

Falls X ⊂ Y , so ist jedes Mengensystem uber X auch ein Mengensystem uber Y und die obigenDefinitionen von

⋃M und

⋂M hangen nicht von der verwendeten Grundmenge ab. Wir lassen

deswegen die Angabe der Grundmenge in Zukunft weg.⋂∅ ist nicht definiert worden, denn mit obiger Definition ware dann

⋂∅ = X, also von der Wahl

der Grundmenge abhangig. 26.10.


6. Paare und kartesische Produkte

Es gilt {1, 2} = {2, 1}. Eine Menge mit genau zwei Elementen heißt ungeordnetes Paar. In derMathematik brauchen aber auch (geordnete) Paare15. Wir wollen an einem Beispiel erklaren, wiesosie gebraucht werden, und uns dann um eine saubere Defintion kummern.

Rene Descartes (1596–1650):Nach Wahl eines Ursprungs und einer Basis beschreibt man Punkte auf einer Geraden durch einereelle Zahl, Punkte in einer Ebene durch zwei reelle Zahlen und Punkte im Raum durch drei reelleZahlen.

x

y

−4

−4

−3

−3

−2

−2

−1

−1

1

1

2

2

3

3

4

4

0

(3, 4)

{ Punkte in der Ebene } ∼= { geordnete Paare (x, y) von zwei reellen Zahlen x und y}∼= R× R ∼= R2

Paar := geordnetes Paar

”Definition“ 6.1. Sind M und N Mengen, so definieren wir

M ×N := {(m,n) ‖m ∈M, n ∈ N}

wobei (m,n) ein Paar aus m und n ist. Man nennt M×N das (kartesische) Produkt von M und N .

Fur Paare gilt z.B. (3, 4) 6= (4, 3).

Das Wort”kartesisch“ kommt vom Namen

”Cartesius“ und dies ist die lateinische Version von

Descartes.

15Ein Paar ist immer ein geordnetes Paar, es sei denn wir sagen explizit ‘”ungeordnet“ dazu.

6. PAARE UND KARTESISCHE PRODUKTE 21

Das problematische an obiger”Definition“ ist, dass wir den Begriff

”Paar“ noch gar nicht definiert

haben.

Eine Moglichkeit, ware ein Axiom einzufuhren, das uns die Existenz von Paaren liefert.

AXIOM 6.2. Zu jedem m ∈ M und n ∈ N gibt es ein (m,n), genannt Paar, mit der folgendenEigenschaft: fur alle m, m ∈M und alle n, n ∈ N gilt

(m,n) = (m, n)⇐⇒ m = m und n = n.

Ein ahnliches Axiom wurde in der Linearen Algebra so ahnlich eingefuhrt (Axiom 1.1.6), es erganztdie dort prasentierten anderen Axiome. Wenn man aber naiv argumentiert, wie bei uns der Fall,oder die zumeist verwendeten Axiomen-Systeme ZFC oder NBG (siehe Anhang A) nutzt, kannman eine Konstruktion machen, die genau solch eine Paarbildung liefert. Sie macht aus dem obigenDefinitions-Versuch (

”Definition“ 6.1) eine richtige Definition.16 Das heißt, man kann Axiom 6.2

weglassen und durch diese Definition ersetzen.

Definition 6.3 (Konstruktion von Paaren nach Kuratowski). Wir definieren das Paar von m undn als

(m,n) := {{m}, {m,n}}.

Diese Definition ist unanschaulicher als sie zunachst aussieht, wie das folgende Beispiel zeigt:

Beispiel 6.4. Fur M = N = N und m = n = 1 gilt (m,n) = {{1}}.

Aus diesem Grund wahlen manche Bucher andere Definitionen, die aber wieder andere Problemehaben. Wichtig ist fur uns aber letztendlich gar nicht, was Produkte

”wirklich sind“, sondern dass

die Eigenschaft in Axiom 6.2 erfullt ist.

LEMMA 6.5. Fur das von Kuratowski definierte Paar gilt:

(m,n) = (m, n) ⇐⇒ m = m und n = n.

Beweis. Die Richtung”⇐=“ ist offensichtlich.

Zu”=⇒“: Sei (m,n) = (m, n). Also gilt nach Definition

(6.6) {{m}, {m,n}} = {{m}, {m, n}}.Wir wissen bereits, dass {{m}, {m,n}} ein oder zwei Elemente besitzt. Wir mussen zwei Falleunterscheiden.

1. Fall: Die Menge {{m}, {m,n}} besitzt ein Element.In diesem Fall ist dann {m} das einzige Element und somit {m} = {m,n} und deswegen m = n.Wegen (6.6) hat auch {{m}, {m, n}} nur ein Element, also ergibt sich analog m = n. Es gilt nun

{m} = {{m}, {m,n}} = {{m}, {m, n}} = {m}.

16Wir konnen dann also die Anfuhrungsstriche weglassen.


Es folgt m = n = m = n.

2. Fall: Die Menge {{m}, {m,n}} besitzt zwei Elemente.Es gilt also {m} 6= {m,n} und somit m 6= n. Analog enthalt {{m}, {m, n}} die verschiedenenElemente {m} und {m, n}, und daraus folgt m 6= n. Da {m} und {m} genau ein Element enthalten,und da {m,n} und {m, n} genau zwei Elemente enthalten, folgt aus (6.6), dass {m} = {m} undsomit m = m. Außerdem gilt dann {m,n} = {m, n}. Da diese Menge außer m = m noch genauein weiteres Element enthalt, gilt auch n = n.

Definition 6.7. Falls M1, M2, . . . , Mk Mengen sind, so definieren das k-fache kartesische Produkthiervon als

M1 ×M2 × · · · ×Mk := M1 × (M2 × (· · ·Mk−1 ×Mk)) · · · ).

Elemente hiervon nennen wir k-Tupel. Wir schreiben sie in der Form (x1, x2, . . . , xk), wobei xi ∈Mi. Ein Paar ist also ein 2-Tupel. Ein 3-Tupel nennt man auch Tripel . 4-Tupel sind Quadrupel ,5-Tupel sind Quintupel . Wir nutzen auch die Schreibweise

Mk = M ×M × · · · ×M︸︷︷︸k-mal

.

Beispiel: R3 = R× (R× R)

7. Relationen, funktionale Relationen, Abbildungen

Definition 7.1. Eine Relation R auf der Grundmenge M ist eine Teilmenge von M ×M . Wirschreiben dann xRy fur die Aussage(form) (x, y) ∈ R.

Falls M ⊂ N , so ist jede Relation auf M auch eine Relation auf N . Oft ist die Grundmenge ohneBedeutung. Wichtig ist vor allem, dass ein solches Resservoir an moglichen Werten uberhauptexistiert.

Beispiele 7.2.

(1) ∅ ist eine Relation auf jeder Menge.(2) {∅, (1, 2)} ist keine Relation, da ∅ kein Paar ist.(3) Ist M eine Menge, so ist δM := {(x, x) ‖x ∈ M} eine Relation auf M . Man nennt sie die

Diagonale von M .

7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 23

x

y

−4

−4

−3

−3

−2

−2

−1

−1

1

1

2

2

3

3

4

4

0

Abbildung 2: Die Diagonale der Menge M = {−3,−2,−1, 0, 1, 2, 3}.(4) ≤R:= {(x, y) ∈ R2 | x ≤ y} ist eine Relation auf R.(5) Q := {(x, y) ∈ R2 | y = 3x2 + 2} ist eine Relation auf R.(6) M = {1, 2, 3}. Wir definieren die Relationen R1 ⊂ M × M und R2 ⊂ M × M durch das

folgende Bild oder sagen R1 := {(1, 2), (1, 3), (2, 1), (3, 1)} und R2 := {(1, 2), (3, 2)}

•1

•2

•3

R1

•1

•2

•3

R2

Definition 7.3. Sei R eine Relation auf M . Die Relation heißt

(1) reflexiv auf M :⇐⇒ ∀x ∈M : xRx,(2) symmetrisch :⇐⇒ ∀x ∈M : ∀y ∈M :︸︷︷︸

∀x,y∈M :

(xRy → yRx),

(3) antisymmetrisch :⇐⇒ ∀x, y ∈M :((xRy ∧ yRx)→ x = y

),

(4) transitiv :⇐⇒ ∀x, y, z ∈M :((xRy ∧ yRz)→ xRz

),

(5) Aquivalenzrelation auf M , falls R reflexiv auf M , symmetrisch und transitiv ist.(6) Ordnung(srelation) auf M oder partielle Ordnung(srelation) auf M , falls R reflexiv, antisym-

metrisch und transitiv ist.


(7) Erfullt eine Ordnungsrelation R auf M zusatzlich die Eigenschaft

∀x, y ∈M :(xRy ∨ yRx

)dann nennt man R eine totale Ordnung(srelation).17

Beispiele 7.4. Zu den Beispielen 7.2 (3), (4) und (6):

(3) δM ist reflexiv auf M , symmetrisch, und transitiv, also eine Aquivalenzrelation auf M .Es gilt

xδMy ⇐⇒ x = y ∧ x ∈M

(4) ≤R ist reflexiv auf R, antisymmetrisch und transitiv, also eine Ordnungsrelation auf M . DieseOrdnung ist total.

(6) R1 ist nicht transitiv, denn 3R11 und 1R12 sind wahr, aber 3R12 ist falsch. R1 ist auch nichtreflexiv. Also ist R1 auch weder Ordnungsrelation noch Aquivalenzrelation. R1 ist symmetrischund nicht antisymmetrisch.

R2 ist transitiv, antisymmetrisch, nicht reflexiv, nicht symmetrisch.

Beispiele 7.5. Ist X eine Menge, so definieren wir

⊂X := {(A,B) ∈ P(X)2 | A ⊂ B}.

⊂X ist eine Ordnungsrelation auf P(X). Sie ist keine totale Ordnung, wenn X mindestens 2Elemente besitzt. 18

Definition 7.6. Eine Relation F auf M nennen wir eine funktionale Relation, falls gilt:

∀x ∈M : ∀y ∈M : ∀z ∈M :(

(x, y) ∈ F ∧ (x, z) ∈ F)→ y = z.

Zu jedem x ∈M gibt es also hochstens ein y ∈M mit xFy. Wir sagen dann: x wird durch F auf yabgebildet und schreiben x 7→ y oder y = F (x).

Beispiele 7.2 (1), (3) und (5) sind funktionale Relationen. Beispiel (4) ist keine funktionale Relation.In Beispiel 7.2 (6) ist R2 funktional, aber R1 ist nicht funktional.

Beispiel 7.7. Es gelte nun xRy, falls im folgenden Bild ein Pfeil von x nach y fuhrt.

17Manche Quellen nennen solche eine Relation eine lineare Ordnungsrelation. Andere Quellen wiederum be-zeichnen unsere

”Ordnungsrelationen“ als

”Halbordnungen“ und unsere

”totalen Ordnungen“ als

”Ordnungen“.

18Bei Ordnungsrelation werden immer zwei Objekte verglichen: Ist eine Zahl großer als eine andere? Ist eine

Menge in der anderen enthalten? Etc. Insofern sind≤R und⊂X ganz wichtige Beispiele. δM ist auch antisymmetrisch,also auch eine Ordnungsrelation. Sobald M mindestens 2 Elemente besitzt, ist es keine totale Ordnungsrelation.

Dennoch ist δM ein atypisches Beispiel, denn δM ist die einzige symmetrische Ordnungsrelation auf M .


•1

•2

•3

•4

• 5

• 6

• 7• 8

• 9

Dann ist R eine funktionale Relation auf der Grundmenge {1, 2, 3, 4, 5, 6, 7, 8, 9}.

Definition 7.8. Ist R eine Relation auf der Grundmenge M , so definieren wir19:

D(R) := {x ∈M | ∃y ∈M : xRy},Definitionsbereich von R;

B(R) := {y ∈M | ∃x ∈M : xRy},Bild der Relation R;

Beispiel 7.7. (fortgesetzt) Wir zeichnen links die Definitionsmenge D(R), rechts die GrundmengeM . Die bisherigen Pfeile zeichnen wir so ein, dass sie in D(R) beginnen und in M enden. Wirwahlen einen

”Zielbereich“ Y aus mit B(R) ⊂ Y ⊂M .

D(R) M

Zielbereich•1

•2

•3

•4

• 5

• 6

• 7

• 1

• 2

• 8

• 9

• 3

• 4

19Viele Bucher, z.B. [17] bezeichnen B(R) als Wertebereich oder Wertemenge. Es gibt aber auch Bucher, dieden Begriff Wertebereich im Sinne des unten definierten Zielbereichs definieren. Wir werden aus diesem Grund dieBegriffe

”Wertebereich“ und

”Wertemenge“ vermeiden.


Abbildung 3: Eine funktionale Relation R mit D(R) = {1, 2, 3, 4}, B(R) = {1, 5, 7}, Zielbereich{1, 2, 5, 6, 7} und Grundmenge M = {1, 2, 3, 4, 5, 6, 7, 8, 9}.

Definition 7.9. Eine Abbildung ist ein Tripel (f,X, Y ), bestehend aus Mengen X und Y und einerfunktionalen Relation f auf der Grundmenge X ∪ Y , wobei D(f) = X und B(f) ⊂ Y . Zumeist

schreibt man Abbildungen als f : X−→Y oder Xf−→ Y . Man nennt X den Definitionsbereich der

Abbildung f : X−→Y , man nennt Y den Zielbereich der Abbildung und man nennt f den Graphender Abbildung. Eine Abbildung von X nach Y ist eine Abbildung mit Definitionsbereich X undZielbereich Y . Die Menge aller Abbildungen von X nach Y notieren wir als Abb(X,Y ) oder alsY X . Die Notation x 7→ y bedeutet, dass x auf y abgebildet wird, d.h. (x, y) ist ein Element derfunktionalen Relation.Der Begriff

”Funktion“ ist gleichbedeutend zum Begriff

”Abbildung“. Es gibt Situationen, in denen

man haufiger den Begriff”Abbildung“ nutzt, in anderen ist der Begriff

”Funktion“ gebrauchlicher.

Zum Beispiel, wenn der Zielbereich die reellen Zahlen sind, so redet man von (reell-wertigen)Funktionen.

31.10.

Beispiele 7.10.

(a) f := {(x, x2) ‖x ∈ [0, 5]} ⊂ [0, 5]×R ist eine funktionale Relation mit D(f) = [0, 5] und B(f) =[0, 25]. Dann ist f : [0, 5]−→[−4, 40] eine Abbildung. Wir schreiben derartige Abbildungen als

f : [0, 5] −→ [−4, 40]

x 7→ x2

Alternativ kann man die zweite Zeile auch durch f(x) = x2 oder f(x) := x2 ersetzen.(b) Sei f wie oben. Die Abbildungen F1 := (f, [0, 5], [0, 25]) und F2 := (f, [0, 5], [−4, 40]) sind

verschieden, obwohl dieselbe funktionale Relation f zu Grunde liegt.(c) Die Identitat idM von M ist die Abbildung (δM ,M,M), die wir (dem obigen Beispiel folgend)

auch als M−→M , x 7→ x schreiben konnen.(d) Ist M eine Teilmenge von N , so nennen wir die Abbildung (δM ,M,N) die Inklusion von M

in N oder genauer Inklusion der Menge M in die Menge N . 20

Bemerkung 7.11. Aus Ihrer jetzigen Sicht ist der essentielle Unterschied zwischen einer funktiona-len Relation und einer Abbildung, dass im Begriff der Abbildung auch der Zielbereich festgelegt ist,wahrend eine funktionale Relation keinen Zielbereich hat. 21 Spater werden der Definitionsbereichund der Zielbereich zusatzliche Struktur tragen: z.B. eine Vektorraumstruktur, eine Gruppenstruk-tur oder eine Abstandsfunktion. Da wichtige Eigenschaften von Abbildungen wie z.B. Linearitat

20wichtig ist hier die Konjugation von”die Menge“: Genitiv (bzw. von-Konstruktion), dann Akkusativ

21Vergleich zu anderen Lehrbuchern: Es herrscht Uneinigekeit in der Literatur, ob eine Abbildung Informa-

tion uber den Zielbereich tragt oder nicht. Das Lehrbuch [12] unterscheidet in diesem Zusammenhang zwischen

”Funktionen“, die wie unsere

”funktionale Relationen“ definiert sind, und

”Funktionen von X nach Y “, die im

wesentlichen unseren”Abbildungen“ entsprechen. In [17] bedeuten die Begriffe

”funktionale Relation“,

”Funktion“

und”Abbildung“ dasselbe, es bleibt aber dort unklar, ob die oben definierten Abbildungen F1 und F2 in diesem

Buch gleich oder verschieden sind. Wir werden in der Vorlesung die obigen Definitionen nutzen und zulassen, uminnerhalb unserer Analysis I Klarheit zu schaffen.


und Stetigkeit von solcher Zusatzstruktur abhangt, wird es dann hilfreich sein, dass auch derDefinitionsbereich im Tripel einer Abbildung enthalten ist.

Es gibt auch einige Teilbereiche der Mathematik und ihren Anwendungen, in denen man D(f) =X durch D(f) ⊂ X ersetzt. Dies ist zum Beispiel bei den

”dicht definierten Operatoren

”der

Funktionalanalysis und der Quantenmechanik der Fall, zum Beispiel der Orts- und der Impuls-Operator der Quantenmechanik.

Bemerkung 7.12. Zur Interpretation: Aquivalenz- und Ordnungs-Relationen auf der einen Seiteund funktionale Relationen sind zwar ahnlich definiert (als Relationen und somit als Mengen, derenElemente Paare sind). Dennoch interpretiert man sie anders: Aquivalenz- und Ordnungsrelationenvergleichen zwei Objekte. Beispiel: die Relation ≤R, gibt an, ob die links stehende Zahl kleiner odergleich der rechts stehenden ist. Die Interpretation von funktionalen Relationen ist dynamischer,x 7→ x2 ordnet x den Wert x2 zu, so wie ein(e) Platzanweiser(in) im Theater jedem Zuschauer sagt,in welchem Stockwerk er den Theatersaal betreten darf: im Parkett (0. Stockwerk) oder im k-tenRang (k-tes Stockwerk): jedem Zuschauer wird ein Stockwerk zugeordnet. Aus diesem Grund istdie Schreibweise xRy fur Ordnungs- und Aquivalenzrelationen ublich, wohingegen die Schreibweisey = R(x) fur funktionale Relationen ublich ist. Beides ist defniert als (x, y) ∈ R.

Bemerkung 7.13. Sei A eine auf M definierte Aussageform und sei f : M−→N eine Abbildung.Dann gilt

{f(x) ‖x ∈M} = {y ∈ N | ∃x ∈M : f(x) = y} = B(f).

Definition 7.14. Sei f : X−→Y eine Abbildung.

(1) Fur M ⊂ X definieren wir die Einschrankung oder Restriktion von f : X−→Y auf M alsdie Abbildung (f |M ,M, Y ), wobei

f |M := {(x, y) ∈ X × Y | x ∈M ∧ y = f(x)} = {(x, f(x)) ‖x ∈M},

(2) Ist g : Y−→Z eine weitere Abbildung, so definieren wir die Verkettung oder die Kompo-sition von g : Y−→Z mit f : X−→Y als die Abbildung (g ◦ f,X,Z), wobei

g ◦ f(x) := g(f(x)).

Man liest g ◦ f als”g nach f“.

Definition 7.15.

(1) Eine funktionale Relation f bzw. eine Abbildung f : X−→Y heißt injektiv , falls gilt

∀x1, x2 ∈ X : (f(x1) = f(x2)→ x1 = x2).

Dies bedeutet, dass jedes Element in X unter f auf ein anderes Element in Y abgebildet wird.(2) Eine Abbildung f : X−→Y heißt surjektiv , falls B(f) = Y .(3) Eine Abbildung f : X−→Y heißt bijektiv , falls sie injektiv und surjektiv ist.


X = D(f)

Y••••

•••••

injektiv

X = D(f)

Y•••••

••••

surjektiv

X = D(f)

Y••••

••••

bijektiv

Abbildung 4: Schemtische Darstellungen von injektiv, surjektiv und bijektiv.

Wenn f eine funktionale Relation ist, so ist f : D(f)−→B(f) eine surjektive Abbildung.

Beispiele 7.16. (in der Vorlesung ubersprungen = grau)

(a) Die Abbildung R−→R, x 7→ x2 ist weder injektiv noch surjektiv.(b) Die Abbildung R>0−→R, x 7→ x2 ist injektiv, aber nicht surjektiv.(c) Die Abbildung R>0−→R>0, x 7→ x2 ist bijektiv.

Um das obige Beispiel der/s Platzanweisers/in nochmals weiter zu entwickeln: Wenn der Platzan-weiser nicht nur das Stockwerk zuordnet, sondern auch den konkreten Sitzplatz, so ist zu hoffen,dass diese Abbildung injektiv ist, da sonst zwei Leute auf dem selben Platz sitzen mussen. DerKassenwart des Theaters hingegen hofft, dass die Abbildung von der Menge der Zuschauer auf dieMenge der Sitzplatze auch surjektiv ist, da dann das Theater voll besetzt ist.

Definition 7.17. Ist R eine Relation und R ⊂M ×M , dann definieren wir

R−1 := {(y, x) ∈M ×M | xRy},Man nennt R−1 die Umkehrung von R.

UBUNG 7.18.

(a) Sei f eine funktionale Relation. Dann ist f−1 genau dann eine funktionale Relation, wenn finjektiv ist.

(b) Ist f : X−→Y eine Abbildung, so ist f−1 : Y−→X genau dann eine Abbildung, wenn f :X−→Y bijektiv ist.

(c) Ist f : X−→Y eine bijektive Abbildung, so gilt f−1 ◦ f = δX und f ◦ f−1 = δY .

Man nennt dann f−1 : Y−→X die Umkehrabbildung von f : X−→Y .

UBUNG 7.19. Seien f : X−→Y und g : Y−→Z Abbildungen. Zeigen Sie:

(1) Ist g ◦ f : X−→Z surjektiv, dann ist auch g surjektiv.


(2) Ist g ◦ f : X−→Z injektiv, dann ist auch f injektiv.(3) Geben Sie ein Beispiel an, das zeigt, dass die Umkehrung der Aussage (1) nicht gilt. Das heißt:

finden Sie Abbildungen f : X−→Y und g : Y−→Z, so dass g : Y−→Z surjektiv ist, aber nichtg ◦ f : X−→Z.

(4) Geben Sie ein Beispiel an, das zeigt, dass die Umkehrung der Aussage (2) nicht gilt.

UBUNG 7.20. Seien X und Y Mengen, X 6= ∅. Es gibt eine injektive Abbildung f : X−→Y genaudann, wenn es eine surjektive Abbildung g : Y−→X gibt.22

Siehe: Aufgabe 3 auf Ubungsblatt 3

SATZ 7.21 (Schroder, Bernstein). Seien X und Y Mengen. Angenommen, es gibt eine injektiveAbbildung f : X−→Y und eine injektive Abbildung g : Y−→X, dann gibt es auch eine bijektiveAbbildung g : X−→Y .

Beweis: 2. Ubungsblatt der Linearen Algebra I

Definition 7.22. Seien X und Y Mengen. Wir sagen:

• X und Y sind gleich machtig , falls es eine bijektive Abbildung f : X−→Y gibt.• Y ist machtiger als X, falls es eine injektive Abbildung f : X−→Y und es keine bijektive

Abbildung b : X−→Y gibt.• X ist endlich, falls es eine naturliche Zahl n ∈ N gibt, so dass X und {m ∈ N | 0 < m ≤ n}

gleich machtig sind. Wir schreiben dann #X = n und sagen X hat n Elemente.• X ist unendlich, falls X nicht endlich ist. Wir schreiben dann #X =∞.• X ist abzahlbar , falls es eine injektive Abbildung X → N gibt.• X ist uberabzahlbar , wenn X nicht abzahlbar ist. Dann ist X machtiger als N.

UBUNG 7.23. Sei M ein Mengensystem. Fur A,B ∈M definieren wir

A ∼ B :⇐⇒ A und B sind gleichmachtig.

Zeigen Sie, dass ∼ eine Aquivalenzrelation auf M ist.

Beispiele 7.24.(1) #X = 0 ⇐⇒ X = ∅.(2) Endliche Mengen sind abzahlbar (Offensichtlich).(3) X ist abzahlbar unendlich⇐⇒ X und N sind gleich machtig. (Ein Beweis benotigt vollstandige

Induktion, oder die Peano-Axiome oder irgend etwas, was die naturlichen Zahlen charakteri-siert.)

(4) Z und N sind gleich machtig, Q und N sind gleich machtig (Ubung: Beweisen Sie dies!). Alsosind Z und Q abzahlbar unendlich.

(5) R is machtiger als N (wird spater bewiesen!)

!ACHTUNG!. Gilt #X =∞ und #Y =∞, so folgt daraus nicht, dass X und Y gleich machtigsind.

22Leider habe ich in der Vorlesung die Bedingung X 6= ∅ vergessen!


Ist f : X−→Y eine Abbildung und M ⊂ X, so definieren wir

f#(M) := {y ∈ Y | ∃x ∈M : y = f(x)} = {f(x) ‖x ∈M}.

Man nennt f#(M) das Bild von M unter f . Wir erhalten eine Abbildung

P(X) −→ P(Y )(7.25)

M 7→ f#(M)

Analog definiert man fur N ⊂ Y :

f#(N) := {x ∈ X | f(x) ∈ N}.

Man nennt f#(N) das Urbild von N unter f . Wir erhalten eine Abbildung

P(Y ) −→ P(X)(7.26)

N 7→ f#(N)

Die funktionalen Relationen f# bzw. f# werden in der Literatur (und auch in der Linearen Al-gebra I) oft mit f bzw. f−1 bezeichnet. Dies kann zu Missverstandnisse fuhren, da f und f#

verschiedene funktionale Relationen sind und da f−1 nur dann eine funktionale Relation ist, wennf injektiv ist. Wir nutzen deswegen in den nachsten Wochen die Bezeichnungen f# und f# wieoben, um Missverstandnisse zu vermeiden. Spater (ab Analysis II) schreiben wir auch einfach fund f−1.

UBUNG 7.27. Sei f : X−→Y eine Abbildung, A,B ⊂ X und M,N ⊂ Y . Zeigen Sie

(1) f#(A ∩ B) ⊂ f#(A) ∩ f#(B). Geben Sie ein Beispiel an, das zeigt, dass diese Teilmengemanchmal eine echte Teilmenge ist.

(2) f#(A ∪B) = f#(A) ∪ f#(B).(3) A ⊂ B → f#(A) ⊂ f#(B).(4) f#(M ∩N) = f#(M) ∩ f#(N).(5) f#(M ∪N) = f#(M) ∪ f#(N).(6) M ⊂ N → f#(M) ⊂ f#(N).(7) A ⊂ f#(f#(A)). Geben Sie ein Beispiel an, das zeigt, dass diese Teilmenge manchmal

eine echte Teilmenge ist.(8) f#(f#(M)) ⊂ M . Geben Sie ein Beispiel an, das zeigt, dass diese Teilmenge manchmal

eine echte Teilmenge ist.(9) f#(M rN) = f#(M) r f#(N)

Die Aussagen (1) und (2) werden auf dem 3. Ubungsblatt dieser Vorlesung bewiesen. Die Aussagen(7), (8) und (9) wurden auf dem 2. Ubungsblatt der Linearen Algebra gezeigt.

8. FAMILIEN 31

8. Familien

Definition 8.1. Seien I und M Mengen. Eine (I-indizierte) Familie von Elementen von M istdasselbe wie eine Abbildung von I nach M . Wenn man eine Abbildung f : I−→M als Familieinterpretiert, so schreiben wir sie als (f(i))i∈I oder als (f(i) | i ∈M). Die Menge aller I-indiziertenFamilien von Elementen von M ist also M I = Abb(I,M). Eine Familie (f(i))i∈I heißt nicht-leer,falls I nicht die leere Menge ist. Die Menge I heißt Indexmenge. Ist die Indexmenge I := N oderI := N>0, so nennt man die Elemente in M I = Abb(I,M) oft auch M -wertige Folgen oder Folgenin M .

Beispiele 8.2. (a) Eine (reell-wertige) Folge ist definiert als N-indizierte Familie von reellen Zah-len. Eine solche Folge ist also eine Abbildung N−→R, die wir als (ai)i∈N schreiben. Alternativdarf man diese Folge auch in der Form (a0, a1, a2, a3, . . .) schreiben.

(b) Sei M eine Menge. Ein k-Tupel (a1, a2, . . . , ak) ∈Mk definiert dann die Familie (aj)j∈{1,2,...,k}.

Wir erhalten eine bijektive Abbildung F : Mk−→M{1,...,k}, (a1, a2, . . . , ak) 7→ (aj)j∈{1,2,...,k}.

Die Elemente von Mk wurden ganz anders”definiert“ als die Elemente von M{1,...,k}. Den-

noch haben die Elemente von Mk und die von M{1,...,k} nahezu identische Eigenschaften: beidesind durch eine geordnete Liste mit k Elementen von M beschreibbar. Damit uns die Forma-lien nun nicht erdrucken, ist es nun sinnvoll so zu tun, als ware (a1, a2, . . . , ak) dasselbe wie(aj)j∈{1,2,...,k}. Man sagt dazu (a1, a2, . . . , ak) wird mit (aj)j∈{1,2,...,k} identifiziert. Dadurch

identifizieren wir auch automatisch Mk mit M{1,...,k}. Um zu unterstreichen, dass dieses Iden-tifizieren von obigem F abhangt sagen wir: wir identifizieren Mk mit M{1,...,k} vermoge F .Wer das Wort

”vermoge“ nicht mag, kann auch

”mit Hilfe von“ sagen. 23

(c) Die Basis eines Vektorraums ist eine Familie von Vektoren, die linear unabhangig sind und denVektorraum erzeugen.

Bemerkung 8.3. Wenn Sie eine ahnliche Aussage oder Definition wie das obige (b) in der Schu-le gesehen haben, so stand dort wahrscheinlich nicht eine

”Familie von Vektoren“, sondern eine

”Menge von Vektoren“. Dies ist aber aus mehreren Grunden problematisch, z.B. erhalten wir mit

dieser Mengendefinition, dass

B :=

{(10

),

(01

),

(10

)}eine Basis von R2 ist. Man beachte, dass B genau zwei Elemente enthalt, da zwischen obigenMengenklammern zweimal derselbe Vektor steht.Die Aussage

”Seien v1 und v2 Vektoren in R2. Dann ist {v1, v2} eine Basis von R2 genau dann wenn {v1, v2}

linear unabhangig sind.“

23Es stellt sich hier unweigerlich die Frage, wieso wir nicht gleich Elemente in M ×M als Abbildungen von{1, 2}−→M definiert haben. Dies geht aber leider nicht, da wir zur Einfuhrung von Abbildungen bereits wissenmussten, was ein Paar und was ein kartesisches Produkt ist.


ist falsch, denn im Fall v1 = v2 6= 0 ist {v1, v2} = {v1} und somit linear unabhangig. Aber {v1} istkeine Basis von R2. Korrekt ist hingegen die Aussage:

”Seien v1 und v2 Vektoren in R2. Dann ist (vi)i∈{1,2} eine Basis von R2 genau dann wenn

(vi)i∈{1,2} linear unabhangig ist.“

Anschaulich gilt: Familien registrieren Mehrfachnennungen. Uber {1, 2 . . . , k} oder uber N indizier-te Mengen registrieren auch die Ordnung der Elemente.

Definition 8.4. Ist (Mi)i∈I eine Familie von Mengen, (d.h. jedes Mi ist eine Menge), so definierenwir ⋃

(Mi | i ∈ I) :=⋃{Mi | i ∈ I} = {x | ∃i ∈ I : x ∈Mi}

und falls (Mi)i∈I nicht-leer ist⋂(Mi | i ∈ I) :=

⋂{Mi | i ∈ I} = {x | ∀i ∈ I : x ∈Mi}.

Wir schreiben auch⋃i∈IMi fur

⋃(Mi | i ∈ I) und

⋂i∈IMi fur

⋂(Mi | i ∈ I).

Kartesische Produkte von Mengenfamilien.Wir haben bereits Mk mit M{1,...,k} identifiziert. Die Elemente von MN sind also eine Art

”un-

endliches kartesisches Produkt“. Solche Produkte sind seit Ende des 19. Jahrhunderts in vielenBereichen der Mathematik ganz wichtig. Dieser Begriff soll deswegen prazisiert werden. Wir wollenauch gleich Produkte in der Form M1 ×M2 × . . . zulassen, d.h. die Mi (genannt Faktoren) durfenverschieden sein.

Definition 8.5 (Kartesische Produkte von Mengenfamilien). Gegeben sei eine Familie (Mi)i∈Ivon Mengen, d.h. gegeben sei eine Indexmenge I und fur jedes i ∈ I eine Menge Mi. Wir definierenzunachst M :=

⋃i∈IMi. Das kartesische Produkt der Familie (Mi)i∈I ist definiert als∏

i∈IMi :=

{(mi)i∈I ∈M I | ∀i ∈ I : mi ∈Mi

}Beispiele 8.6.

∏i∈IM = M I

Analog zu Beispiele 8.2 (b) kann man∏i∈{1,...,k}Mi mit M1 × · · · ×Mk identifizieren.

Ein Mi in der obigen Definition nennt man den i-ten Faktor oder die i-te Komponente. Fur einfixiertes i0 ∈ I nennt man die Abbildung∏

i∈IMi −→ Mi0

(mi)i∈I 7→ mi0

die i0-te kanonische Projektion.

LITERATUR FUR DAS BISHERIGE KAPITEL 33

Literatur fur das bisherige Kapitel

Das Buch [12] ist eine recht ausfuhrliche und leicht lesbare Einfuhrung in die mengentheoretischenGrundlagen der Mathematik. Das Buch [17] ist deutlich kurzer und beschrankt sich mehr auf daswesentliche, aber fur manche Anfanger vielleicht etwas zu dicht geschrieben. Es fokussiert sichauch mehr auf besonders interssante Aspekte. Die wichtigsten Begriffe in Kurze finden sich auchim Buch von D. Grieser [18], das auf dem Skript seiner Analysis-Vorlesung [19] aufbaut. WeitereLiteratur ist das Buch von Halmos in einer deutschen und englischen Fassung [20]. Einen deutlichtiefer gehenden Einstieg in die Mengenlehre findet man in [13].

KAPITEL 2

Zahlen

2.11.

Ab jetzt schreiben wir → oder −→ fur Abbildungen, statt wie bisher das rote Symbol −→ zuverwenden. Wir schreiben {f(x) | x ∈M} statt {f(x) ‖x ∈M}. Die exakte Bedeutung kann manaus dem Kontext heraus ablesen.

Der einleitende Teil der Vorlesung ist nun beendet und wir – Professoren, Mitarbeiter, Tutorenund die Horer der Vorlesung – sollten uns bemuhen, ab jetzt deutlich rigorosere Begrundungenzu geben. Wenn aus Zeitgrunden nicht alles bewiesen werden kann, so mussen wir klar darstellen,wo genau wir kleinere Lucken lassen, und andeuten, wie diese geschlossen werden konnen (EigenesNachdenken, Anhang, Literatur, Zentralubung, Ubungsblatter, etc.).

1. Die naturlichen Zahlen

Die Axiome fur die naturlichen Zahlen bilden die Peano-Axiome, benannt nach dem italienischenMathematiker Guiseppe Peano (1858–1932).

AXIOME 1.1 (”Axiome“ der naturlichen Zahlen (Peano-Axiome)). Die naturlichen Zahlen beste-

hen aus

• einer Menge N,• einem (ausgewahlten) Element in N, das wir 0 nennen,• und einer Abbildung s : N −→ N, x 7→ s(x), genannt die Nachfolger-Abbildung.

Wir fordern, dass hierfur folgenden Eigenschaften, genannt die Peano-Axiome, erfullt sind:

(P1) 0 6∈ B(s) (das heißt: 0 ist nicht im Bild von s)(P2) Die Abbildung s : N −→ N ist injektiv.(P3) (Induktionsaxiom) Erfullt T ⊂ N die Bedingungen 0 ∈ T und s#(T ) ⊂ T , dann gilt bereits

T = N.

Alles, was Sie uber die naturlichen Zahlen kennen, kann man darauf aufbauen, zum Beispiel Addi-tion, Multiplikation und Exponieren von naturlichen Zahlen, die bekannten Gesetze (zum Beispiel:Kommutativitat von Addition und Multiplikation, Assoziativitat von Addition und Multiplikati-on, Distributivgesetz, Potenzgesetz) kann man daraus herleiten. Da dies in der Linearen Algebra

35

https://de.wikipedia.org/wiki/Giuseppe_Peano

36 2. ZAHLEN

I detailiert besprochen werden soll, werden wir dies in der Analysis I nur erwahnen. Fur Detailsverweisen wir auch auf Anhang B, der manche dieser Aspekte ausfuhrt.

Auf den naturlichen Zahlen N definiert man eine Relation ≤ auf N wie folgt: Fur alle n,m ∈ Ngelte:

n ≤ m⇐⇒ ∃k ∈ N : n+ k = m.

Dies ist eine totale Ordnungsrelation auf N, was auch ein paar hier nicht ausgefuhrte Beweiseerfordert, wenn man alles von Grund auf beweist. Ferner definiert man

n ≥ m :⇐⇒ m ≤ nn < m :⇐⇒ n ≤ m ∧ ¬n = m

n > m :⇐⇒ m < n

Aus den Peano-Axiomen leitet man zwei wichtige Satze her: den Satz uber vollstandige Induktionund den Dedekindschen Rekursionssatz, beide werden in Anhang B bewiesen.

SATZ 1.2 (Dedekindscher Rekursionssatz). Sei M eine Menge, a ∈M und g : M ×N −→M eineAbbildung.1 Dann gibt es genau eine Abbildung f : N −→M so dass f(0) = a und

∀n ∈ N : f(n+ 1) = g(f(n), n).

Wenn man alles sauber aufbauen will, so sind zunachst die Summe +, das Produkt · und dasExponieren durch den Rekursionssatz zu definieren, siehe Anhang B. Wir wollen diese Operationenaber als gegeben voraussetzen.

Beispiel 1.3 (Definition der Fakultat). Wir setzen M := N, a = 1 und g(m,n) := (n + 1) · m.Dann nennt man die Abbildung f , die uns Satz 1.2 liefert, die Fakultat. Wir schreiben n! stattf(n). Klammerkonvention: ! wird vor + und · ausgefuhrt. Somit ist ! : N→ N die einzige Funktion,die die Eigenschaften

0! = 1

∀n ∈ Nr {0} : n! = n · (n− 1)!

erfullt. Es gilt somit 1! = 1, 2! = 1 · 2, 3! = 1 · 2 · 3, . . . , n! = 1 · 2 · · · · · n.

Beispiel 1.4 (Summen- und Produktsymbole). Oft ist es wichtig, Ausdrucke der Form

a1 + . . .+ an

exakt zu beschreiben. Hierzu fuhren wir ein Symbol∑nj=1 ein. Man definiert rekursiv

0∑j=1

aj := 0

1Man schreibt hier und immer in vergleichbaren Situationen dann g(m,n) statt g((m,n)).

1. DIE NATURLICHEN ZAHLEN 37

und fur alle n ∈ Nn+1∑j=1

aj :=

n∑j=1

aj

+ an+1.

Dann ist2

n∑j=1

aj = a1 + . . .+ an.

Analog hierzu0∏j=1

aj := 1

und fur alle n ∈ Nn+1∏j=1

aj :=

n∏j=1

aj

· an+1.

Insbesondere gilt also n! =∏nj=1 j.

Wir nutzen3 auch folgende Verallgemeinerung: Es seien k, n ∈ Z und es gelte k ≤ n + 1. Danndefiniert mann∑j=k

aj :=

n−k+1∑j=1

aj+k−1 = ak + ak+1 + . . .+ an,

n∏j=k

aj :=

n−k+1∏j=1

aj+k−1 = ak · ak+1 · · · · · an.

SATZ 1.5 (Vollstandige Induktion). Sei A( · ) eine auf N definierte Aussageform. Wir setzenvoraus, dass Induktionsanfang und Induktionsschritt erfullt sind:Induktionsanfang: A(0) ist wahr.Induktionsschritt: Fur alle n ∈ N gilt: (A(n) =⇒ A(n+ 1))).Dann gilt fur alle n ∈ N die Aussage A(n).

Im Induktionsschritt nennt man A(n) die Induktionsvoraussetzung .

Beispiel 1.6. Wir wollen zeigen, dass fur alle n ∈ N die folgende Aussage wahr ist

A(n) :

n∑j=1

j =1

2n (n+ 1).

Induktionsanfang n = 0

Fur n = 0 steht auf der linken Seite (l.S.) nach Definition∑nj=1 j = 0.

Auf der rechten Seite (r.S.) haben wir 120 (0 + 1) = 0. Somit l.S. = r.S..

2Dies ist genau genommen keine Aussage, sondern die Definition des Ausdrucks a1 + . . .+ an, der bisher nichtso klar definiert war, da die Bedeutung der Punkte unklar blieb.

3Solange wir Z noch nicht eingefuhrt haben, sollte man k, n ∈ N annehmen.

38 2. ZAHLEN

Deswegen ist A(0) wahr.

Induktionsschritt von n auf n+ 1

Nach Induktionsvorraussetzung gilt bereits die Aussage A(n), also

n∑j=1

j =1

2n (n+ 1).

Zu zeigen ist A(n+ 1), also die Aussage

n+1∑j=1

j =1

2(n+ 1)

((n+ 1) + 1

).

Wir berechnen die linke Seite:n+1∑j=1

j =( n∑j=1

j)

+ (n+ 1) =1

2n (n+ 1) + (n+ 1) =

n (n+ 1) + 2 (n+ 1)

2) =

1

2(n+ 2) (n+ 1).

Wir berechnen die rechte Seite:

1

2(n+ 1)

((n+ 1) + 1

)=

1

2(n+ 1) (n+ 2).

Also wieder l.S. = r.S..

Damit haben wir gezeigt, dass A(n+ 1) aus A(n) folgt.

Schlussfolgerung (wird normalerweise nicht mehr aufgeschrieben, da es bei jeder vollstandigenInduktion immer dasselbe Argument ist)

Die Voraussetzungen von Satz 1.5 sind also erfullt, deswegen gilt fur alle n ∈ N die AussageA(n).

Beispiel 1.7 (Geometrische Summe). Sei q ∈ Nr {1} (oder q ∈ Rr {1} oder q ∈ Cr {1} oder inirgendeinem unitaren Ring R, so dass (1− q)−1 existiert).

Wir wollen zeigen, dass fur alle n ∈ N die folgende Aussage wahr ist

A(n) :

n∑j=0

qj =1− qn+1

1− q.

Wir multiplizieren auf beiden Seiten mit 1 − q und erhalten daraus die zu A(n) aquivalente Aus-sageform

A(n) : (1− q)n∑j=0

qj = 1− qn+1,

die wir durch Induktion uber n zeigen wollen.

Induktionsanfang n = 0

1. DIE NATURLICHEN ZAHLEN 39

Fur n = 0 rechnen wir

(1− q)0∑j=0

qj = (1− q)q0 = (1− q) 1 = 1− q1 = 1− q0+1.

Deswegen ist A(0) wahr.


Nach Induktionsvorraussetzung gilt bereits die Aussage A(n), also

(1− q)n∑j=0

qj = 1− qn+1.

Zu zeigen ist A(n+ 1), also die Aussage

(1− q)n+1∑j=0

qj = 1− q(n+1)+1.

Wir berechnen:

(1− q)n+1∑j=0

qj = (1− q)(( n∑

j=0

qj)

+ qn+1

)= (1− q)

( n∑j=0

qj)

︸︷︷︸=1−qn+1

+(1− q) qn+1

= 1− qn+1 + qn+1 − qn+2 = 1− qn+2.

Also haben wir A(n+ 1) gezeigt.

Auch die folgenden elementaren Gesetze der naturlichen Zahlen mussen bei einem logisch vollstandi-gen Aufbau durch vollstandige Induktion gezeigt werden. Genau genommen, lange bevor wir obigeBeispiele diskutieren konnen. Aus Zeitgrunden werden wir dies nicht ausfuhren, sondern ebenfallswieder auf Anhang B des Skripts verweisen.

SATZ 1.8. (N,+, ·) erfullt die folgenden Eigenschaften:

(Aa) Addition ist assoziativ.Fur alle x, y, z ∈ N gilt

(x+ y) + z = x+ (y + z).

(An) Addition hat neutrales Element.Es gibt ein Element 0 ∈ N, so dass fur alle x ∈ N gilt

x+ 0 = 0 + x = x.

(Diese Null ist unsere bisherige!)

40 2. ZAHLEN

(Ak) Addition ist kommutativ.Fur alle x, y ∈ N gilt

x+ y = y + x.

(Ma) Multiplikation ist assoziativ.Fur alle x, y, z ∈ N gilt

(x · y) · z = x · (y · z).(Mn) Multiplikation hat neutrales Element.

Es gibt ein Element 1 ∈ N, so dass fur alle x ∈ N gilt

x · 1 = 1 · x = x.

(Diese Eins ist unsere bisherige!)(Mk) Multiplikation ist kommutativ.

Fur alle x, y ∈ N gilt

x · y = y · x.(AMd) Addition und Multiplikation erfullen das Distributivgesetz.

Fur alle x, y, z ∈ N gilt

x · (y + z) = x · y + x · z

(y + z) · x = y · x+ z · x

Eine weitere elementare Eigenschaft von N, die in der Linearen Algebra gezeigt wurde, ist die Wohl-ordnung von N. Einen Beweis findet man in Anhang B, wo der Satz nochmals als Proposition 3.3wiederholt ist.

SATZ 1.9 (Wohlordnung von N). Jede nicht-leere Teilmenge T von N besitzt ein Minimum.

Hierbei nennen wir y ein Minimum von T , falls y ∈ T und ∀x ∈ T : y ≤ x. Wenn eine Mengemit Ordungsrelation ein Minimum besitzt, so ist dieses eindeutig; diese Eindeutigkeit folgt direktaus der Antisymmetrie. Falls ein Minimum y in M existiert, so schreiben wir y = minM . Wirerhalten analog die Definition eines Maximums, wenn y ≤ x durch y ≥ x ersetzen, und schreibendann y = maxM .

SATZ 1.10. Ist M eine abzahlbar unendliche Menge, dann sind M und N gleich machtig.

Beweis. Da M abzahlbar ist, gibt es eine injektive Abbildung f : M → N. Wir definieren Q :=f#(M). Da f injektiv ist, ist die Abbildung

M −→ Q

x 7→ f(x)

bijektiv. Also sind M und Q gleich machtig. Zu zeigen bleibt, dass Q und N gleich machtig sind.

Zeichnung mit Q in N und der Abbildung g, die das nachsthohere Element sucht.

2. ETWAS KOMBINATORIK 41

Wir definieren fur k ∈ N:Q>k := {x ∈ Q | x > k}.

Behauptung: ∀k ∈ N : Q>k 6= ∅.

Begrundung: Angenommen Q>k = ∅, dann ware Q ⊂ {1, 2, . . . , k}, also ware Q und somit Nendlich. Widerspruch.

Wir definieren g : Q −→ Q als

g(k) := das Minimum von Qk.

Die Funktion ist wohldefiniert wegen Satz 1.9. Aus der Definition von g ergibt sich insbesondereg(k) > k.

Definiere rekursiv mit Hilfe des Dedekindschen Rekursionssatzes die Funktion h : N→ Q durch

h(0) := das Minimum von Q,

∀n ∈ N : h(n+ 1) := g(h(n)).

Somit gilt h(n+ 1) > h(n), und deswegen zeigt man leicht (durch eine weitere vollstandige Induk-tion), dass h : N → Q injektiv ist.4 Da die Inklusion Q → N injektiv ist, folgt aus dem Satz 7.21von Schroder-Bernstein, dass Q und N gleich machtig sind.

2. Etwas Kombinatorik

Um den Umgang mit naturlichen Zahlen zu uben, zeigen wir einige Aussagen, die in der Kombi-natorik wichtig sind.

SATZ 2.1. Fur endliche Mengen N und Q gilt (#N) · (#Q) = #(N ×Q).

Beweis.

Sei also s := #N und t := #Q. Es gibt also bijektive Abbildung ϕ : N → {1, 2, . . . , s} 5 undψ : N → {1, 2, . . . , t}. Dann ist die Abbildung

ϕ× ψ : N ×Q −→ {1, 2, . . . , s} × {1, 2, . . . , t}(n, q) 7→ (ϕ(n), ψ(q))

bijektiv und man zeigt auch sofort, dass

p : {1, 2, . . . , s} × {1, 2, . . . , t} −→ {1, 2, . . . , ts}(a, b) 7→ a+ s(b− 1)

bijektiv ist. Also

#(N ×Q) = #({1, 2, . . . , s} × {1, 2, . . . , t}) = #({1, 2, . . . , ts}) = ts.

7.11.

4Die Abbildung h : N→ Q ist sogar bijektiv, aber wir benotigen dies im folgenden nicht.5Hier gilt immer: {1, 2, . . . , s} := {r ∈ N | 0 < r ≤ s}, insbesondere ist es die leere Menge, falls s = 0.

42 2. ZAHLEN

SATZ 2.2. Sei n ∈ Nr{0}. Angenommen M hat k Elemente. Dann ist kn die Anzahl der Elementevon Mn = M × · · · ×M︸︷︷︸

n−mal

.

Der Beweis ist eine einfach Induktion, die nun jeder selbst durchfuhren konnen sollte.

Beweis. Wir zeigen den Satz durch vollstandige Induktion uber n ∈ Nr {0}:

A(n) : #(Mn) = (#M)n.


Induktionsanfang n = 1Offensichtlich wegen M1 = M und k1 = k.


#(Mn+1) = #(M ×Mn) = (#M) · (#(Mn)) = (#M) · (#M)n = (#M)n+1

Hierbei folgt das erste Gleichheitsszeichen direkt aus der Definition von Mn+1, das zweite aus demvorangehenden Satz, das dritte nach Induktionsvoraussetzung und das letzte aus der Definitionvon Potenzen in N.

SATZ 2.3. Angenommen, eine Menge M hat n ∈ N Elemente, dann gibt es 2n Elemente in P(M).

Auch dies beweist man durch Induktion uber n.

Beweis. Induktionsanfang n = 0

Die leere Menge ∅ ist die einzige Menge mit 0 Elementen. Sie hat einzige Teilmenge, namlich ∅.


Nun sei #M = n+ 1 und sei x ∈M . Definiere M ′ := M r {x}.

Wir definieren F : P(M ′)× {0, 1} −→ P(M) durch (A, 0) 7→ A und (A, 1) 7→M rA.

Die Umkehr-Abbildung ist

G : P(M) −→ P(M ′)× {0, 1}

B 7→

{(B, 0) falls x /∈ A(M rB, 1) falls x ∈ A

Man uberpruft leicht, dass G die Umkehrfunktion von F ist. Also ist F bijektiv. Wir erhalten nachInduktionsvoraussetzung

#P(M) = #(M ′ × {0, 1}) Satz 2.1= (#M ′)(#{0, 1}) = 2n · 2 = 2n+1.

Ahnlich zeigt man auch: sind M und N endliche Mengen, dann gilt

#(Abb(M,N)) = (#N)(#M),

oder in der anderen Schreibweise

#(NM ) = (#N)(#M).

Definition 2.4. Eine Permutation einer Menge M ist eine bijektive Abbildung von M nach M .

SATZ 2.5. Angenommen M hat n Elemente. Dann ist n! die Anzahl der Permutationen von M .

44 2. ZAHLEN

Interpretation: n! ist die Anzahl der Moglichkeiten, n unterscheidbare Objekte anzuordnen.

Satz 2.5 ist ein Spezialfall von Satz 2.6, folgt also bereits aus Satz 2.6.

SATZ 2.6. Seien M und N endliche Mengen mit #M ≥ #N . Dann ist die Anzahl der injektivenAbbildungen von N nach M gleich

(#M)!

(#M −#N)!.

Interpretation: m!/(m− n)! = m · (m− 1) · . . . · (m− n+ 1) ist die Anzahl der Moglichkeiten, auseiner Menge von m unterscheidbaren Objekten n Objekte herauszunehmen und anzuordnen.

Beweis. Wir zeigen durch Induktion uber n ∈ N fur festes k ∈ N .

A(n, k) :

{Gilt #M = n+ k und #N = n, dann gibt es(n+ k)!/k! viele injektive Abbildungen N −→M .

Induktionsanfang n = 0.

Also N = ∅. Dann ist ∅ : ∅ →M die einzige Abbildung von N nach M . Sie ist injektiv. Andererseitsgilt dann (n+ k)!/k! = k!/k! = 1.

Induktionsschritt von n auf n+ 1.

Sei #N = n+ 1 und #M = n+ 1 +k. Wir wahlen ein a ∈ N . Es gibt n+k+ 1 Moglichkeiten, demElement a ein Element von M zuzuweisen. Sobald festgelegt ist, dass a auf ein b ∈ M abgebildetwird, kann noch eine injektive Abbildung von N r {a} auf M r {b} gewahlt werden. Hierfur gibtes nach Induktionsvoraussetzung (n + k)!/k! Moglichkeiten. Somit ist die Anzahl der injektivenAbbildungen von N nach M durch

(n+ k + 1) · (n+ k)!

k!=

(n+ k + 1) (n+ k)!

k!=

(n+ k + 1)!

k!

gegeben.

SATZ 2.7. Seien m, k ∈ N. Die Anzahl der k-elementigen Teilmengen von einer Menge mit mElementen, m ≥ k ist: (

mk

):=

m!

k! (m− k)!.

Die oben definierte Zahl

(mk

)heißt Binomialkoeffizient .

Beweis. Sei N eine Teilmenge mit k Elementen von M , m = #M . Die Anzahl der bijektivenAbbildungen {1, 2, . . . , k} −→ N ist k!. Jede solche bijektive Abbildung {1, 2, . . . , k} −→ N ergibteine injektive Abbildung {1, 2, . . . , k} −→ M , und umgekehrt ergibt jede injektive Abbildung


f : {1, 2, . . . , k} −→ M , x 7→ f(x) eine bijektive Abbildung f : {1, 2, . . . , k} −→ B(f), x 7→ f(x).Ist deswegen r die Anzahl der k-elementigen Teilmengen von M , dann ist r · k! die Anzahl derinjektive Abbildungen f : {1, 2, . . . , k} −→ M . Nach vorigem Satz also r · k! = m!/(m − k)! unddaraus ergibt sich

r =

(mk

).

Offensichtlich gilt

(mk

)=

(m

m− k

).

Wir setzen zudem

(mk

):= 0 fur m, k ∈ Z, falls k < 0 oder k > m.

Sei M = {1, 2, . . . ,m}. Dann hat M wegen Satz 2.3 2m Teilmengen. Da es

(mk

)Teilmengen mit

k Elementen gibt, folgt:

FOLGERUNG 2.8. Fur m ∈ N gilt

2m =

m∑k=0

(mk

).

SATZ 2.9. Es gelte m, k ∈ Z und m > 0. Dann gilt:

(m− 1k − 1

)+

(m− 1k

)=

(mk

).

Beweis. In den Fallen m = k ∈ Nr {0} und den Fallen k = 0, m ∈ Nr {0} haben wir

(mk

)= 1,

ein Summand ist 0 und der andere 1. Die Behauptung ist trivialerweise richtig, falls k < 0 oderk > m.

46 2. ZAHLEN

In den ubrigen Fallen rechnen wir

(m− 1k − 1

)+

(m− 1k

)=

(m− 1)!

(k − 1)! (m− 1− k + 1)!+

(m− 1)!

k! (m− 1− k)!

=k (m− 1)!

k (k − 1)! (m− k)!+

(m− k)(m− 1)!

k! (m− k) (m− 1− k)!

=(k +m− k) (m− 1)!

k! (m− k)!

=m!

k! (m− k)!

Pascalsches Dreieck

Bild eines Pascalschen Dreiecks

Alternativ auch hier zu sehen.

SATZ 2.10 (Binomische Formel). Seien x, y ∈ R oder in einem beliebigen kommutativen Ring6

mit 1. Sei n ∈ N.

Dann gilt

(x+ y)n =

n∑k=0

(nk

)xkyn−k.

Hierbei nutzen wir die Definition: x0 = y0 = (x+ y)0 = 1.

Beweis. Induktionsanfang n = 0

Auf beiden Seiten steht dann 1.

6Wenn Sie diesen Begriff des nachsten Abschnitts noch nicht kennen, ignorieren Sie bitte diesen Fall und

betrachten Sie zunachst den Fall x, y ∈ N oder x, y ∈ R.

https://de.wikipedia.org/wiki/Pascalsches_Dreieck

3. DIE GANZEN ZAHLEN 47

Induktionsschritt von n− 1 auf n fur n ∈ N>0

(x+ y)n = (x+ y) (x+ y)n−1

= (x+ y)

(n−1∑k=0

(n− 1k

)xkyn−k−1

)

=

n−1∑k=0

(n− 1k

)xk+1yn−k−1 +

n−1∑k=0

(n− 1k

)xkyn−k

=

n∑k=1

(n− 1k − 1

)xkyn−k +

n−1∑k=0

(n− 1k

)xkyn−k

=n∑k=0

(n− 1k − 1

)xkyn−k +

n∑k=0

(n− 1k

)xkyn−k

=

n∑k=0

((n− 1k − 1

)+

(n− 1k

))xkyn−k

=

n∑k=0

(nk

)xkyn−k.

Hierbei nutzen wir die Induktionsvoraussetzung in der zweiten Zeile, das Distributivgesetz in derdritten, in der vierten Zeile wird im ersten Summand k durch k + 1 ersetzt. Danach nutzen wir(

n− 1−1

)=

(n− 1n

)= 0,

dann wieder das Distributivgesetz und letztendlich Satz 2.9.

3. Die ganzen Zahlen

Der nachste Schritt ist nun, die Menge der uns bekannten Zahlen Schritt fur Schritt zu erweitern:

N ⊂ Z ⊂ Q ⊂ R ⊂ C

Wir wollen diese Erweiterungen durch Eigenschaften charakterisieren.

Wir schreibenZ := {. . . ,−2,−1, 0, 1, 2, . . .} ⊃ N

fur die ganzen Zahlen.7

7Wir wollen wiederum Z nur durch charakterisierende Eigenschaften beschreiben, aber kein Modell konstruie-

ren, das diese Eigenschaften erfullt. Ein derartige Modell kann man zum Beispiel konstruieren in dem man auf N×N

48 2. ZAHLEN

Die Addition und die Multiplikation kann man zu Abbildungen

+ : Z× Z −→ Z, (a, b) 7→ a+ b· : Z× Z −→ Z, (a, b) 7→ a · b

erweitern, so dass die Eigenschaften (Aa), (Ak), (An), (Ma), (Mk), (Mn) und (AMd) weiterhingelten, wenn man dort N durch Z ersetzt. Außerdem gilt

(Ai) Addition hat inverse Elemente.Zu jedem x ∈ Z gibt es ein y ∈ Z, so dass

x+ y = y + x = 0.

Man nennt y das Inverse von x bezuglich der Addition und schreibt normalerweise −xanstelle von y.

Schreibweisex− y := x+ (−y).

Hinzu kommt eine Eigenschaft, die anschaulich besagt, dass die ganzen Zahlen”die kleinste Er-

weiterung“ der naturlichen Zahlen sind, die diese Eigenschaften erfullt. Prazise ausgedruckt:

(MEZ) Minimale Erweiterung.Ist T eine Teilmenge von Z mit N ⊂ T und gilt

∀x, y ∈ T : x+ y ∈ Tund

∀x ∈ T : −x ∈ T,dann gilt bereits T = Z.

Auch die Ordnung ≤ setzt sich auf Z fort und die Eigenschaften (1)–(5) in Lemma 3.1in Anhang B.3gelten weiter.

Eine mit Addition und Mulitplikation versehene Menge, die die Eigenschaften (Aa), (Ak), (An),(Ai), (Ma), und (AMd) erfullt, nennt man Ring . Gilt zusatzlich (Mn), so spricht man von einemRing mit Eins. Ein Ring, der zusatzlich (Mk) erfullt, nennt man einen kommutativen Ring.

Somit ist (Z,+, ·) ein kommutativer Ring mit Eins. Ein Ring (R, +, ·), der die naturlichen Zahlenenthalt 8 und (MEZ) erfullt, stimmt

”im wesentlichen“ mit den ganzen Zahlen uberein. Praziser:

es gibt eine bijektive Abbildung b : Z −→ R mit

∀x, y ∈ Z : b(x+ y) = b(x)+b(y) und b(x · y) = b(x)·b(y).

die Aquivalenzrelation (m,n) ∼ (a, b) ⇐⇒ m + b = n + a einfuhrt; dann sind die Element von Z die Aquivalenz-

klassen dieser Relation. Mit einer ahnlichen Konstruktion kann man aus den ganzen Zahlen die rationalen Zahlen

Q konstruieren. Diese beiden Konstruktion sollen in der Linearen Algebra erklart werden.8Gemeint ist hier: als Unterring enthalt, das heißt es wird gefordert, dass sich die bereits auf Z×Z definiterten

Operatoren + und · sich zu + und · fortsetzen.

4. DIE RATIONALEN ZAHLEN 49

Solche eine bijektive Abbildung, die Addition und Multiplikation erhalt, nennt man einen (Ring)-Isomorphismus oder Isomorphismus von Ringen. Wir sagen: (R, +, ·) ist isomorph (als Ring) zu(Z,+, ·) und schreiben (R, +, ·) ∼= (Z,+, ·).

Notation. Den Ring der ganzen Zahlen schreiben wir zumeist als Z an Stelle von (Z,+, ·), da dieAddition und die Multiplikation aus dem Kontext heraus klar sind.

4. Die rationalen Zahlen

Die rationalen Zahlen sind9

Q :={ zn

∣∣∣ z ∈ Z, n ∈ N>0

}.

Hierbei giltz

n=

y

m⇐⇒ zm = yn.

Die Addition und die Multiplikation setzen sich zu Abbildungen

+ : Q×Q −→ Q, (a, b) 7→ a+ b· : Q×Q −→ Q, (a, b) 7→ a · b

fort, und die Eigenschaften (Aa), (Ak), (An), (Ai), (Ma), (Mk), (Mn) und (AMd) gelten weiterhinfur (Q,+, ·). Außerdem gilt

(Mi) Multiplikation hat inverse Elemente.Zu jedem x ∈ Qr {0} gibt es ein y ∈ Q, so dass

x · y = y · x = 1.

Man nennt y das Inverse von x bezuglich der Multiplikation und schreibt normalerweisex−1 anstelle von y.

9.11.

Anschaulich: Q ist die kleinste Erweiterung von N, die diese Eigenschaften hat.Prazise Bedeutung:

(MEQ) Minimale Erweiterung.Ist T eine Teilmenge von Q mit N ⊂ T und gilt

∀x, y ∈ T : x− y ∈ T∀x ∈ T : ∀x ∈ T r {0} : x · y−1 ∈ T,

dann gilt bereits T = Q.

9An dieser Stelle musste eigentlich gesagt werden, wie zn

definiert ist. Dies wurde in der Linearen Algebra

diskutiert und wird deswegen hier nicht erklart.

50 2. ZAHLEN

Auch die Ordnung setzt sich fort. Die Ordnung auf Q ist total.

Mit Addition und Multiplikation versehene Mengen mit mindestens 2 Elementen nennt manKorper , falls die Eigenschaften (Aa), (Ak), (An), (Ai), (Ma), (Mk), (Mn), (Mi) und (AMd) erfulltsind.

Also ist (Q,+, ·) ein Korper. Wie bei den ganzen Zahlen schreiben wir oft Q fur (Q,+, ·). Je-der Korper, der die naturlichen Zahlen enthalt und (MEQ) erfullt, ist isomorph zum Korper derrationalen Zahlen.

In jedem Korper K gilt 0 6= 1. Denn angenommen, wir hatten 0 = 1, so folgt fur alle x ∈ K:x = 1 · x = 0 · x = 0. Also K = {0}. Dies widerspricht der Forderung, dass K mindestens zweiElemente hat.

UBUNG 4.1. Versehe F2 := {0, 1} mit der folgenden Addition und Multiplikation:

+ 0 1

0 0 11 1 0

· 0 1

0 0 01 0 1

Zeigen Sie, dass (F2,+, ·) ein Korper ist. Man nennt ihn den Korper mit 2 Elementen. Ist (K, +, ·)ein Korper, und hat K genau zwei Elemente, dann ist (K, +, ·) isomorph zu (F2,+, ·).

Die Ordnung auf Z setzt sich zu einer Ordnung auf Q wie folgt fort:

Wir definieren zunachst, wann eine Zahl großer oder gleich Null ist. Fur alle m ∈ Z und allen ∈ N>0 definiere

0 ≤ m

n:⇐⇒ 0 ≤ m · n

Dann definieren wir die Relation ≤ fur beliebige Zahlen a, b ∈ Q:

a ≤ b :⇐⇒ 0 ≤ b− a .

5. Geordnete Korper

Definition 5.1. Ein geordneter Korper ist ein Quadrupel (K,+, ·,≤), so dass die folgenden Ei-genschaften erfullt sind:

(a) (K,+, ·) ist ein Korper,(b) ≤ ist eine totale Ordnung auf K,(c) ∀x, y, z ∈ K : (x ≤ y → x+ z ≤ y + z),(d) ∀x, y, z ∈ K : ((x ≤ y ∧ 0 ≤ z)→ x · z ≤ y · z).

Beispiel 5.2. (Q,+, ·,≤) ist ein geordneter Korper.

5. GEORDNETE KORPER 51

Nicht-Beispiel: Sei (F2,+, ·) der Korper mit zwei Elementen aus Ubung 4.1. Dann gibt es keinetotale Ordnung ≤ auf F2, so dass (F2,+, ·,≤) ein geordneter Korper ist. Vergleiche Ubungsblatt4, Aufgabe 3.

Im Rest dieses Abschnitts sei (K,+, ·,≤) ein geordneter Korper.

Notation 5.3.

x < y :⇐⇒ x ≤ y ∧ x 6= y ⇐⇒ ¬(y ≤ x)

x ≥ y :⇐⇒ y ≤ xx > y :⇐⇒ y < x

x ist positiv :⇐⇒ x > 0

x ist negativ :⇐⇒ x < 0

K≤a := {x ∈ K | x ≤ a}K≥a, K<a, K>a analog.

UBUNG 5.4. Seien a, x, y, z ∈ K. Zeigen Sie, dass aus den Eigenschaften (a)–(d) der obigenDefinition folgt:

(a) a ist genau dann positiv, wenn −a negativ ist.(b) 1 > 0(c) Ist z > 0, dann auch z−1 > 0.(d) Ist z < 0, dann gilt auch z−1 < 0 und dann gilt fur alle x, y ∈ K:

x ≤ y ↔ x · z ≥ y · z.

Beweis: Teile (a) und (b) sind Teil von Ubungsblatt 4, Aufgabe 2. Teile (c) und (d) sind ahnlichzu zeigen.

Zu (c): Sei nun z > 0. Wir zeigen durch Widerspruch z−1 > 0. Wir nehmen hierzu an, dass z−1 ≤ 0.Dann folgt mit Lemma 5.1 (d)

1 = z−1z ≤ 0,

was offensichtlich 1 > 0 widerspricht.

Zu (d): z < 0 ⇐⇒ z−1 < 0 ist nun offensichtlich und man zeigt (d) durch Multiplikation mit −zbzw. −z−1 unter Verwendung von Lemma 5.1 (d).

Wir definieren rekursiv eine Abbildung iN : N −→ K, 0N 7→ 0K , iN(n+ 1) = iN(n) + 1.

LEMMA 5.5.

(a) iN erhalt Addition und Multiplikation, d.h. fur alle n,m ∈ N gilt:

iN(n+m) = iN(n) + iN(m) iN(n ·m) = iN(n) · iN(m)(5.6)

(b) ∀n ∈ N>0 : iN(n) > 0,(c) iN : N −→ K ist injektiv,

52 2. ZAHLEN

Beweis.

(a) durch Induktion uber m ∈ N.(b) und (c) sind Teil von Ubungsblatt 4, Aufgabe 2.

Sprechweise Wenn die Gleichungen (5.6) gelten, sagen wir: iN erhalt Addition und Multiplikation.

LEMMA 5.7. Sei (K,+, ·,≤) ein geordneter Korper. Dann gibt es eine injektive Abbildung iQ :Q −→ K, die iN fortsetzt (das heißt: iQ|N = iN) und so dass iQ Addition und Multiplikation erhalt.Außerdem erhalt iQ die Ordnung, das heißt es gilt fur a, b ∈ Q

a ≤ b⇐⇒ iQ(a) ≤ iQ(b).

Beweisskizze: Fur m ∈ N, n ∈ N>0 definieren wir

iQ

(mn

):=

iN(m)

iN(n)

iQ

(−mn

):= − iN(m)

iN(n)

iQ

(0

n

):= 0

Man muss nun zeigen, dass diese Definition Sinn ergibt. Wir durfen einer rationalen Zahl nichtzwei verschiedene Werte zuweisen. Zu uberprufen ist hierzu

m

n=p

q=⇒ iN(m)

iN(n)=iN(p)

iN(q)

fur alle m,n, p, q ∈ N>0. Die entsprechenden Aussagen sind fur m ≤ 0, p ≤ 0 zu uberprufen. Mansagt dann, die Abbildung iQ ist wohldefiniert . Danach kann man die anderen Eigenschaften leichtbeweisen.

Wir identifizieren nun Q mit B(iQ) vermoge iQ, das heißt wir machen keinen Unterschied mehrzwischen r ∈ Q und iQ(r) ∈ K.

Definition 5.8. Ein geordneter Korper (K,+, ·,≤) heißt archimedisch geordneter Korper , 10 falls

∀a ∈ K : ∃n ∈ N : a ≤ n.

Beispiele 5.9. (a) Q ist archimedisch: Man zeigt leicht fur m,n ∈ N>0: mn ≤ m und −mn ≤ m

und 0n ≤ 1.

(b) In Satz 6.6 werden wir zeigen, dass jeder geordnete Korper, der die Supremumseigenschafterfullt, archimedisch ist. Insbesondere: Sobald wir wissen,

”was R ist“, wissen wir auch, dass

R archimedisch geordnet ist.

10Man sagt manchmal auch: Der Korper erfullt das archimedische Axiom. Diese Sprechweise vermeiden wir

aber, da die archimedische Eigenschaft in dem von uns gewahlten Zugang kein Axiom ist.

5. GEORDNETE KORPER 53

(c) Sei dann K ein Korper mit Q ⊂ K ⊂ R mit der Addition, Multiplikation und Ordung von R.Dann ist auch K ein archimedisch geordneter Korper. Zum Beispiel fur q ∈ Q>0:

K := Q[√q] := {a+ b

√q | a, b ∈ Q} .

(d) Der Korper der rationalen Funktionen mit rationalen Koeffizienten 11

K :=

{x 7→ p(x)

q(x)

∣∣∣ p und q sind Polynome mit rationalen Koeffizienten, q 6= 0

}.

Wir definieren Addition und Multiplikation wie bei den rationalen Zahlen:

p(x)

q(x)+p(x)

q(x):=

p(x)q(x) + p(x)q(x)

q(x) · q(x)

p(x)

q(x)· p(x)

q(x):=

p(x) · p(x)

q(x) · q(x).

Dann ist (K,+, ·) ein Korper. Ein Polynom p wie oben schreiben wir im Fall p 6= 0 als p(x) =a0,p + a1,px+ a2,px

2 . . .+ ak,pxk, k ∈ N0, ak,p 6= 0. Dann heißt deg(p) := k ∈ N0 der Grad des

Polynoms. Wir definieren nun

P :=

{p(x)

q(x)∈ K

∣∣∣ adeg(p),p · adeg(q),q > 0

}Weiter definieren fur r, s ∈ K:

r < s :⇐⇒ s− r ∈ P.Zu zeigen, dass (K,+, ·,≤) ein geordneter Korper ist, ist einige Arbeit, aber nicht sehr schwie-rig.

Angenommen, der Korper ware archimedisch geordnet. Dann gibt es ein n ∈ N mit x ≤ n <n+1. Dann ware also x−(n+1) < 0. Dies ist aber ein Widerspruch zu x−(n+1) = x−(n+1)

1 ∈ P .Also ist dieser geordnete Korper nicht archimedisch.

Sei weiterhin (K,+, ·,≤) ein geordneter Korper.

Definition 5.10. Die Betragsfunktion | · | : K −→ K ist definiert durch

|a| := max{a,−a} =

a falls a > 0

−a falls a < 0

0 falls a = 0

Man nennt |a| auch den Absolutbetrag von a.

11Was wird hier eigentlich mit x 7→ p(x)q(x)

gemeint? Dies ist etwas subtil, es gibt verschiedene Moglichkeiten. 1.)

Man kann es als Abbildung von Qr q#({0}) nach Q auffassen, falls p und q keine gemeinsamen Nullstellen haben.Bei dieser Interpretation muss man den Definitionsbereich bei Addition und Multiplikation in naheliegnder Art und

Weise evtl. durch einzelne Punkte erganzen. 2.) Sobald wir die Korper R und C kennen, konnte man es in ahnlicher

Weise auch als Abbildung Rr q#({0}) −→ R oder als Abbildung Cr q#({0}) −→ C auffassen, auch Kombinationenwie Qr q#({0}) −→ R waren denkbar. 3.) Die mathematisch sinnvollste Interpretation des Ausdrucks ist aber eine

andere (die formale Interpretation), die ich leider derzeit noch nicht erklaren kann, und die Sie spater in der Linearen

Algebra kennen lernen werden. Da wir Koeffizienten in Q haben, ist es gar nicht so wichtig, wie wir den Ausdruckformal nun verstehen wollen. Wenn die Koeffizienten in Q durch Koeffizienten in einem endlichen Korper (wie zum

Beispiel F2) ersetzt werden, ist dieser Unterschied aber ganz erheblich.

54 2. ZAHLEN

LEMMA 5.11.

(a) |a| ≥ 0; |a| = 0⇐⇒ a = 0;(b) |−a| = |a|;(c) |a · b| = |a| · |b|;

∣∣ab

∣∣ = |a||b| falls b 6= 0;

(d) |a2| = |a|2 = a2 ≥ 0(e) |a+ b| ≤ |a|+ |b|;(f) |a1 + · · ·+ ak| ≤ |a1|+ · · ·+ |ak|;(g) |a− b| ≥

∣∣∣|a| − |b|∣∣∣Beweis. (a)-(d) folgen direkt aus den Definitionen 5.1 und 5.10.(e): ±a ≤ |a| und ±b ≤ |b| ergeben ±(a+ b) ≤ |a|+ |b|.(f): durch Induktion.(g): Wir setzen a := a− b. Dann gilt

| a+ b︸︷︷︸a

| ≤ |a|+ |b| = |a− b|+ |b|

Also

(5.12) |a− b| ≥ |a| − |b|

Durch Vertauschen von a und b erhalten wir

(5.13) |a− b| = |b− a| ≥ |b| − |a|.

Aus (5.12) und (5.13) erhalten wir das zu Beweisende.

SATZ 5.14. Seien n ∈ N>0; a1, . . . , an ∈ K≥0 gegeben. Dann gilt

a1 · a2 · . . . · an ≤(a1 + a2 + . . .+ an

n

)n.

Bemerkung 5.15. Wenn wir in K die n-te Wurzel ziehen konnen (in Q nicht erlaubt!), bedeutetdies

n√a1 · a2 . . . an︸︷︷︸

geometrisches Mittel

≤ a1 + a2 + . . .+ ann︸︷︷︸

arithmetisches Mittel

.

Beweis des Satzes. Wir beweisen den Satz durch Induktion nach n.

Induktionsanfang : n = 1 ist offensichtlich richtig.

Induktionsschritt von n− 1 nach n fur n ≥ 2:Seien a1, . . . , an ∈ K≥0 gegeben.O.B.d.A. a1 = min{a1, . . . , an}, a2 = max{a1, . . . , an}.

6. DIE REELLEN ZAHLEN 55

M := a1+...+ann . =⇒ a1 ≤M ≤ a2

Wir setzen d := a1 + a2 −M . Dann

Md− a1a2 = M ((a1 + a2)−M)− a1a2 = (a2 −M)(M − a1) ≥ 0

=⇒ a1 · a2 ≤Md(5.16)

Das arithmetische Mittel12 von d, a3, a4, . . . , an ist M , denn

d+ a3 + a4 + . . .+ an = a1 + a2 + . . .+ an −M = (n− 1)M.

Es folgt

a1a2 · · · an(5.16)

≤ M da3 · · · an︸︷︷︸≤Mn−1

nach Annahme

= Mn

6. Die reellen Zahlen

Da die reellen Zahlen R fur die Analysis eine zentrale Rolle spielen, wollen wir hier wieder formalvollstandiger vorgehen.

6.1. Unzulanglichkeit von Q. Wieso reichen uns die rationalen Zahlen nicht aus?

Problem 1 (Algebraisch):

Sei p eine Primzahl. Dann ist x2 = p in Q nicht losbar.

Angenommen es gabe eine Losung x = m/n, m ∈ Z, n ∈ N>0. O.B.d.A. m,n teilerfremd.

Wir erhalten m2

n2 = x2 = p, also m2 = pn2.

Es folgt p|m und daraus p2|m2 = pn2, was wiederum p|n impliziert. Also haben wir einen Wider-spruch zur Teilerfremdheit von m und n.

12Im Fall n = 2 bedeutet ist also das arithmetische Mittel von d, a3, . . . , an als das artithmetische Mittel von

d zu lesen, das heißt es ist d. Es git dann auch M = d.

56 2. ZAHLEN

Problem 2 (Geometrisch):

Bild von einem Kreis

π =Umfang

Durchmesser= 3, 14159265... 6∈ Q

Wichtige geometrische Funktionen konnen in Q nicht beschrieben werden, zum

Bild: Quadrat mit Diagonale runtergedreht

Problem 3 (Physikalisch):

Bild mit Pendel

Ein Pendel bewegt sich auf einem Kreis. Dazu muss es Punkte passieren, die keine rationalenKoordinaten haben, zum Beispiel den Punkt

(− cos(60◦)sin(60◦)

), sin(60◦) =

√3

26∈ Q .

14.11

6.2. Die Supremumseigenschaft. In diesem Abschnitt werden wir eine Eigenschaft ken-nenlernen, die im Korper der rationalen Zahlen Q nicht gilt, aber im Korper der reellen Zahlen R.Zunachst ein paar Vorbemerkungen.

Wiederholung: Sei ≤ eine partielle Ordnung auf einer Menge M . Sei x ∈ A ⊂M .

x = minA ⇐⇒ ∀y ∈ A : x ≤ y.

(Maximum analog mit ≥).

Gegeben sei eine totale Ordnung auf einer endlichen Menge A, dann besitzt A ein Maximum undein Minimum.

Definition 6.1. Sei ≤ eine (partielle) Ordnung auf einer Menge M . Eine Teilmenge A ⊂M heißtnach oben beschrankt in M (bzw. nach unten beschrankt in M), falls es ein r ∈ M gibt, so dassfur alle a ∈ A die Aussage a ≤ r (bzw. a ≥ r) gilt. Ein solches r heißt obere Schranke (bzw. untereSchranke) von A. Wir sagen A ist beschrankt in M , wenn A nach oben und unten beschrankt ist.

Besitzt die Menge

S(A,M) := {r ∈M | r ist obere Schranke von A}ein Minimum, so nennen wir minS(A,M) das Supremum von A in M .

Besitzt die Menge

S(A,M) := {r ∈M | r ist untere Schranke von A}ein Maximum, so nennen wir maxS(A,M) das Infimum von A in M .

Kurzschreibweise: supA und inf A


Beispiele 6.2. (a) M = Q, A = {2, 4, 8}. Dann ist r obere Schranke, gdw r ≥ 8. Und r ist untereSchranke, gdw r ≤ 2. Wir haben maxA = supA = 8 und minA = inf A = 2.

(b) Falls A ein Maximum besitzt, so ist dieses Maximum auch das Supremum. Denn sei a = maxA,dann folgt

S(A,M) = {r ∈M | r ≥ a} =: M≥a.

Also a = minS(A,M) = supA.(c) M = Q, A = {x ∈ Q | 0 < x < 1} besitzt kein Minimum. Denn fur alle x ∈ A gilt: x

2 ∈ A undx2 < x. Ahnlich zeigt man, dass A kein Maximum besitzt.

S(A,M) = Q≥1 S(A,M) = Q≤0

supA = 1 und inf A = 0.

Bemerkungen 6.3.

(1) A ⊂ S(S(A,M),M) und A ⊂ S(S(A,M),M)(2) Gilt x ∈ A ∩ S(A,M), dann gilt ∀a ∈ A : a ≤ x, somit x = maxA und wegen (1) auch

x = minS(A,M).(3) Hat A ein Maximum x, dann ist x ∈ S(A,M).(4) A hat ein Maximum ⇐⇒ A∩ S(A,M) 6= ∅ ⇐⇒ #(A∩ S(A,M)) = 1 ⇐⇒ supA existiert und

supA ∈ A.

Definition 6.4. Sei ≤ eine partielle Ordnung auf M . Wir sagen (M,≤) erfullt die Supremumsei-genschaft (S) falls gilt

(S) SupremumseigenschaftSei A ⊂ M nicht-leer und nach oben beschrankt in M . Dann besitzt A ein Supremumin M .

Beispiel 6.5. (Q,≤) erfullt die Supremumseigenschaft nicht: Die Menge

A := {x ∈ Q |x2 ≤ 2}ist nach oben beschrankt.

S(A,Q) := {x ∈ Q |x > 0 und x2 ≥ 2}.Da es keine rationale Zahl x mit x2 = 2 gibt, folgt

S(A,Q) := {x ∈ Q |x > 0 und x2 > 2}.

Zu gegebenem x ∈ S(A,Q) definieren wir nun

y := x− x2 − 2

2x,

und man zeigt leicht 0 < y < x. Weiter gilt

y2 = x2 − 2xx2 − 2

2x+

(x2 − 2

2x

)2

> x2 − (x2 − 2) = 2,

58 2. ZAHLEN

also auch y ∈ S(A,Q). Da es zu jedem Element in S(A,Q) ein kleineres in S(A,Q) gibt, kann esin S(A,Q) kein Minimum geben. Also besitzt A kein Supremum in Q. Wir werden spater sehen,dass es in R eine positive Losung von x2 = 2 gibt, aufgrund der Supremumseigenschaft.

SATZ 6.6. Ist (K,+, ·,≤) ein geordneter Korper, der die Supremumseigenschaft erfullt, dann ister archimedisch.

Die Umkehrung gilt nicht: Beispiel K = Q.

Beweis. Angenommen (K,+, ·,≤) sei nicht archimedisch. Dann gibt es ein a ∈ K mit

∀n ∈ N : a > n.

Das heißt, N ist in K nach oben beschrankt. Wenn die Supremumseigenschaft erfullt ist, gibt esalso ein Supremum s von N in K. Fur ein beliebiges n gilt also s ≥ n+ 1 also s− 1 ≥ n. Also istauch s− 1 ein obere Schranke von N. Dann ist aber s nicht das Minimum aller oberen Schranken,was ein Widerspruch zur Wahl von s ist. Da wir einen Widerspruch erhalten haben, muss die obigeAnnahme falsch gewesen sein. Wir haben dadurch gezeigt, dass (K,+, ·,≤) archimedisch ist.

6.3. Axiome der reellen Zahlen. Im nachsten Abschnitt werden wir zwei Satze zeigen:

SATZ 6.7 (”Existenz der reellen Zahlen“). Es gibt einen geordneten Korper, der die Supremums-

eigenschaft erfullt.

SATZ 6.8 (”Eindeutigkeit der reellen Zahlen“). Seien (K,+, ·,≤) und (K, +, ·, ≤) zwei geordnete

Korper, die die Supremumseigenschaft erfullen, dann gibt es eine eindeutige bijektive Abbildung

F : K −→ K, die Addition, Multiplikation und Ordnung erhalt.F erhalt die Addition: ∀x, y ∈ K : F (x+ y) = F (x)+F (y)F erhalt die Multiplikation: ∀x, y ∈ K : F (x · y) = F (x)·F (y)

F erhalt die Ordnung: ∀x, y ∈ K : x ≤ y =⇒ F (x)≤F (y)

Man sagt dann oft: (K,+, ·,≤) und (K, +, ·, ≤) sind kanonisch isomorph und F nennt man einenIsomorphismus (von geordneten Korpern). 13.

Die Eigenschaften”geordneter Korper“ und “Supremumseigenschaft“ sind Eigenschaften, die wir

von den reellen Zahlen erwarten. Da sie nun also die reellen Zahlen bis auf Isomorphie festlegenist es sinnvoll, diese beiden Eigenschaft als die

”Axiome der reellen Zahlen “ zu betrachten. Dies

verpflichtet uns dazu, alles was wir fur die reellen Zahlen zeigen wollen, aus diesen Axiomen heraus

13Isomorph hat hier eine andere Bedeutung als bei den naturlichen Zahlen.”Isomorph“ kommt aus dem Grie-

chischen und heißt”von gleicher Gestalt“. Es gibt in der Mathematik viele Strukturen und zu jeder eine eigene

Definition von”isomorph“. Bei der Abbildung F oben im Text handelt es sich um einen Isomorphismus von ge-

ordneten Korpern: dies ist eine bijektive Abbildung, die Addition, Multiplikation und die Ordnung erhalt. Sobald

es einen Isomorphismus von A nach B gibt, nennt man A und B isomorph. Das Wort kanonisch ist nicht ganz so

leicht zu erklaren. Es bedeutet hier, dass es einen Isomorphismus gibt, der sich aus der Struktur bereits ergibt undnicht von zusatzlichen Wahlen abhangt. In der obigen Proposition gilt F (0) = 0 und F (1) = 1 und hierdurch ist der

Isomorphismus F bereits festgelegt. Er ist also bereits durch die Struktur festgelegt und deswegen kanonisch.


zu begrunden. Der große Vorteil dieses axiomatischen Zugangs ist es, dass alle danach hergeleitetenAussagen davon unabhangig sind, wie wir ein Modell der reellen Zahlen im Beweis von Satz 6.7konstruieren.

AXIOME 6.9 (Axiome der reellen Zahlen). Die reellen Zahlen bilden einen geordneten Korper(R,+, ·,≤), der die Supremumseigenschaft erfullt.

Um beispielhaft zu zeigen, wie wir die Supremumseigenschaft nutzen konnen, betrachten wir dasfolgende Lemma.

LEMMA 6.10. Sei a ∈ R, a ≥ 0, n ∈ N>0, so gibt es genau ein r ∈ R mit rn = a und r ≥ 0.

Beweis. Die Aussage ist klar fur n = 1 und klar fur a = 0. Sei nun n ≥ 2 und a > 0.

Eindeutigkeit. Hierzu genugt es zu zeigen:

∀x, y ∈ R : 0 < x < y =⇒ xn < yn

Dies folgt aus der folgenden Umformung

yn − xn = (y − x)

n−1∑i=0

yixn−i−1 > 0,

da∑n−1i=0 y

ixn−i−1 als Summe positiver Zahlen positiv ist.

Existenz. Wir betrachten die Menge A := {x ∈ R | xn ≤ a}. Die Menge A ist nach obenbeschrankt: max{1, a} ist eine obere Schranke von A. Man zeigt leicht, dass

S(A,R) = {x ∈ R | 0 < x ∧ xn ≥ a}.

Da A nicht-leer ist, existiert s := supA = minS(A,R). Offensichtlich gilt s ≥ 0 und sn ≥ a.

Wir nehmen nun an sn > a.

Behauptung: Es gibt ein δ ∈ R, 0 < δ < 1 mit

sn(1− nδ) ≥ a.(6.11)

Mit der Behauptung argumentieren wir wie folgt:

Die Bernoulli-Ungleichung liefert (s(1− δ))n ≥ sn(1− nδ), siehe Ubungsblatt 4, Aufgabe 1 c) mitx := −δ

Es gilt also s > s(1− δ) ∈ S(A,R). Somit ist dann s kein Minimum von S(A,R). Wir haben danneinen Widerspruch zur Annahme sn > a gefunden, und haben deswegen sn = a, was die Existenzliefert.

Begrundung der Behauptung:

60 2. ZAHLEN

Man zeigt mit Standard-Umformungen, dass (6.11) aquivalent zu

δ ≤ 1

n

(1− a

sn

)ist. Die rechte Seite ist zwischen 0 und 1. Wenn wir als δ := 1

n

(1− a

sn

)wahlen, so gilt die

Behauptung.

Bemerkung. Fur b ∈ R, b > 0, dann konnen wir jetzt alle Potenzen der Form bt, mit t ∈ Qbilden. Wir schreiben hierzu t = p/q mit p ∈ Z, q ∈ N. Wenn wir das vorangehende Lemma fura := bp und n := q anwenden, dann besagt dieses Lemma, dass es genau eine Zahl r ∈ R>0 gibt,so dass rq = bp. Wir wurden nun gerne definieren at := r fur dieses r. Damit dies eine sinnvolleDefinition ist, muss man uberprufen, dass r unahangig davon ist, wie wir t als Bruch schreiben.Dazu muss man die folgende Aussage uberprufen:14 Es gelte t = p/q = p/q, p, p ∈ Z, q, q ∈ N. Wirwahlen r, r ∈ R>0 mit rq = bp und rq = bp. Dann gilt r = r.

Man beachte, dass wir den Ausdruck bt fur eine positive reelle Zahl b und eine reelle, nicht-rationaleZahl t noch nicht definieren konnen.

Man kann aus dem bisher Bekannten nun auch leicht zeigen, dass fur b, b ∈ R>0, t, t ∈ Q gilt:

(bb)t = btbt bt+t = btbt

Fr 16.11.

Zur Konstruktion eines Modells der reellen Zahlen, das heißt zum Beweis von Satz 6.7, gibt esverschiedene Methoden, zum Beispiel:

• Die Konstruktion als Dezimalzahlen. Hier muss man zum Beispiel darauf achten, dass1, 49 = 1, 5. Geht genauso im Binarsystem oder bezuglich anderer Basen.• Die Konstruktion durch Intervallschachtelungen. Recht beliebt in Schulen, da anschaulich

und unabhangig davon, ob man in der Basis 10 (=Dezimaldarstellung), in der Basis2 (=Binardarstellung) oder noch einer anderen Basis arbeitet. Siehe zum Beispiel [22,Abschnitt 2.3].• Cauchy-Folgen. Dies fuhrt unter anderem zum Begriff der Vollstandigkeit, der nicht nur in

diesem Kontext wichtig ist, sondern auch zum Beispiel bei Hilbert- und Banach-Raumen.Solche Raume sind z.B. wichtig, um partielle Differentialgleichungen zu losen und umQuantenmechanik zu beschrieben.• Dedekindsche Schnitte. Mathematisch elegant und intuitivere Definition als beim Zugang

uber Intervallschachtelung und Cauchy-Folgen. Wir werden diesem Zugang folgen.

6.4. Dedekindsche Schnitte. Ideen von Richard Dedekind, 1872, Link zur Orginalarbeit

Definition 6.12. Sei K ein archimedisch geordneter Korper. Ein Dedekindscher Schnitt in K isteine Teilmenge α ⊂ K mit den folgenden Eigenschaften

(1) α 6= ∅, α 6= K,

14Diese Uberprufung sollten Sie inzwischen selbst tun konnen.

https://archive.org/details/stetigkeitundir00dedegoog/page/n6


(2) fur a ∈ α und x ∈ K<a gilt x ∈ α,(3) α besitzt kein Maximum.

Man nennt Dedekindsche Schnitte auch Unterklassen. Das Komplement von α schreiben wir alsα′ := K r α und wird die zugehorige Oberklasse genannt.

Wir definieren

K := {α ∈ P(K) | α ist ein Dedekindscher Schnitt}.

Beispiel 6.13. Sei q ∈ K. Dann ist K<q eine Unterklasse.

(1) q − 1 ∈ K<q, also K<q 6= ∅. Und q + 1 6∈ K<q, also K<q 6= K.(2) Sei a ∈ K<q und x ∈ K<a. Dann haben wir x < a und a < q, also auch x < q und somit

x ∈ K<q.(3) Zu jedem a ∈ K<q ist a′ := (a+ q)/2 ein Element a′ ∈ K<q mit a′ > a.

Die Abbildung iK : K −→ K, q 7→ K<q ist injektiv. Denn ist p < q so ist p ∈ K<q und p /∈ K<p.

Anschauliche Motivation fur diese Konstruktion. Wir nehmen mal an, dass wir bereitsQ ⊂ R mit den gewunschten Eigenschaften hatten, K = Q. Definiere Q wie oben. Zu r ∈ Rdefinieren wir die Unterklasse in Q

U(r) := {q ∈ Q | q < r}.

Bild mit einem Zahlenstrahl mit Ober- und Unterklasse

Wir erhalten eine Abbildung U : R −→ Q, r 7→ U(r). Man uberlegt sich leicht, dass sup |Q : Q −→R, α 7→ supα die Umkehrabbildung von U : R −→ Q ist. Somit ist U bijektiv. Wir definierennun Addition +, Multiplikation · und Ordnung ≤ auf Q so, dass U diese Strukturen erhalt; undzwar so, dass wir die Existenz von R gar nicht nutzen. Zu zeigen ist dann, dass (Q,+, ·,≤) eingeordneter Korper ist, der die Supremumseigenschaft erfullt. Wir identifizieren wiederum Q mitB(iQ) ⊂ Q vermoge iQ.

Es stellen sich dann unter anderem die Fragen:

• Was passiert, wenn man die Konstruktion wiederholt zu Q , also K := Q?• Was wissen wir uber K, fur andere archimedisch geordnete Korper K, zum BeispielK := Q[

√2]?

Es ist deswegen sinnvoll, im folgenden immer fur (K,+, ·,≤) einen beliebigen archimedisch geord-neten Korper zuzulassen, aber sich immer den Spezialfall K = Q vorzustellen.

Sei also von nun an (K,+, ·,≤) ein beliebiger archimedisch angeordneter Korper.

LEMMA 6.14. Fur jede Oberklasse α′ gilt:

(a) α′ = {x ∈ K | ∀a ∈ α : a < x}

62 2. ZAHLEN

(b) fur a′ ∈ α′ und x′ ∈ K>a′ gilt x′ ∈ α′.

Beweis. Zu (a): Sei x ∈ α′. Wenn fur (mindestens) ein a ∈ α die Ungleichung a < x nicht gilt,dann haben wir den Widerspruch x ∈ α. Somit α′ ⊂ {x ∈ K | ∀a ∈ α : a < x}.

Sei x ∈ K mit ∀a ∈ α : a < x. Da x < x falsch ist, gilt x 6∈ α. Also α′ ⊃ {x ∈ K | ∀a ∈ α : a < x}.

Zu (b): Dies folgt nun aus der Transitivitat von <.

LEMMA 6.15. Erfullt (K,+, ·,≤) die Supremumseigenschaft, dann ist iK : K −→ K, q 7→ K<q

bijektiv.

Beweis. Ist α eine Unterklasse, dann ist jedes a′ ∈ α′ eine obere Schranke von α. Ist b ∈ S(α,K),dann ist b nicht in α, denn sonst ware ja b ein Maximum von α, welches nicht existiert. Somitb ∈ α′. Deswegen haben wir

α′ = S(α,K).

Erfullt (K,+, ·,≤) die Supremumseigenschaft, dann hat also jede Oberklasse ein Minimum. Wennwir q := supα = minα′ setzen, so ist dann α = K<q.

Beispiel 6.16. In einem geordneten Korper K ist

α := K<0 ∪ {x ∈ K | x2 < 2}.eine Unterklasse. Wenn diese Menge ein Supremum s besitzt, so gilt s2 = 2.

Im Fall K = Q gibt es kein solches s, das heißt α hat kein Supremum. Dann ist iK : K → K nichtsurjektiv.

Im Fall K = R hat α ein Supremum in R, das wir√

2 nennen.

Definition 6.17 (Addition). Zu Dedekindschen Schnitten α und β definieren wir ihre Summe als

α+ β := {a+ b | a ∈ α, b ∈ β}.

Dies ist wiederum ein Dedekindscher Schnitt, denn:

(1) Sei a ∈ α und b ∈ β, dann gilt a+ b ∈ α+ β, also α+ β 6= ∅.Sei a′ ∈ α′ und b′ ∈ β′, dann gilt fur alle a ∈ α und b ∈ β zunachst a < a′ und b < b′ unddeswegen auch a+ b < a′ + b′. Somit a′ + b′ /∈ α+ β, und dies ergibt α+ β 6= K.

(2) Sei x < a+b, a ∈ α, b ∈ β. Setze a0 := x−b < a, somit a0 ∈ α. Deswegen gilt x = a0+b ∈ α+β.(3) Angenommen, es gabe ein Maximum in α + β, dann konnten wir es als a + b mit a ∈ α und

b ∈ β schreiben. Da a kein Maximum von α ist, gibt es ein a1 ∈ α mit a1 > a. Wir erhaltenden Widerspruch

a+ b < a1 + b ∈ α+ β.

Wir erhalten also eine Abbildung + : K ×K → K.

PROPOSITION 6.18. (K,+) ist eine kommutative Gruppe, das heißt es gelten (Aa), (Ak), (An),(Ai).


Beweis. Die Kommutativitat (Ak) ist offensichtlich.

Zu (Aa):

α+ (β + γ) = α+ {b+ c | b ∈ β, c ∈ γ} = {a+ b+ c | a ∈ α, b ∈ β, c ∈ γ}und man erhalt ahnlich denselben Ausdruck fur (α+ β) + γ.

Zu (An): Das neutrale Element ist K<0. Zu zeigen: α = α + K<0. Aus Definition 6.12 (2) folgtdirekt α + K<0 ⊂ α. Um α ⊂ α + K<0 zu zeigen, wahlen wir ein a ∈ α. Da a kein Maximumvon α ist, gibt es ein a1 ∈ α mit a1 > a. Dann ist b := a − a1 < 0 ein Element von K<0. Somita = a1 + b ∈ α+K<0.

Zu (Ai): Sei α ∈ K. Die zugehorige Oberklasse α′ kann ein Minimum besitzen oder nicht. Falls α′

ein Minimum besitzt, dann definiere

β := {−a′ | a′ ∈ α′ r {minα′}},falls α′ kein Minimum besitzt, so definiere

β := {−a′ | a′ ∈ α′}.Da wir in dieser Definition das Minimum von α′ weggenommen haben, falls es existiert, hat β keinMaximum, also (3). Aus Lemma 6.14 ergibt sich (2). Außerdem (1) β 6= ∅ und β 6= K. Wir habenalso β ∈ K.

Nun zeigen wir α+ β = K<0, das heißt β ist das additive Inverse zu α.

Sei a ∈ α und b ∈ β, dann folgt −b ∈ α′ und deswegen −b > a. Dies ergibt a + b < 0, in anderenWorten a+ b ∈ K<0. Also α+ β ⊂ K<0.

Sei nun x ∈ K<0. Wir suchen a ∈ α und b ∈ β mit x = a+ b.

Ansatz: Zu einem festen a0 ∈ α wahle

a := a0 + (n− 1)|x|︸︷︷︸∈α

und b := −(a0 + n|x|︸︷︷︸∈α′

kein Min

)

fur n ∈ N>0. Damit dieser Ansatz erfolgreich ist, muss n das Minimum der Menge

M := {m ∈ N>0 | a0 +m|x| ∈ α′}sein.

Durchfuhrung: Definiere also M wie oben. Als ersten Schritt zeigen wir M 6= ∅.

Wahle ein a′ ∈ α′.a0 +m|x| ≥ a′ ↔ m ≥ a′ − a0

|x|Da K archimedisch ist, gibt es ein m ∈ N>0, das die rechte Ungleichung und damit auch die linkeUngleichung erfullt. Es folgt m ∈ M , also M 6= ∅. Auf Grund der Wohlordnung der naturlichenZahlen (Satz 1.9) besitzt M ein Minimum. Sei n := minM . Definieren wir a und b wie oben, folgt

64 2. ZAHLEN

a ∈ α, −b ∈ α′, a + b = x. Wenn −b nicht ein/das Minimum von α′ ist, so gilt b ∈ β, und wirhaben das zu Zeigende gezeigt.

Wenn α′ ein Minimum besitzt und wenn −b = minα′, dann setze

a := a0 +(n− 1

2

)|x| = −b− 1

2|x| < −b = minα′ ,

und damit a ∈ α, und

b := −(a0 +

(n+

1

2

)|x|︸︷︷︸

∈α′kein Min

)= b− 1

2|x| ∈ β.

Dann gilt a+ b = −|x| = x.Mi 21.11.

Definition 6.19 (Ordnung). Wir definieren auf K eine Relation

α ≤ β :⇐⇒ α ⊂ β.

Da ⊂ eine Ordnungsrelation auf P(M) ist, ist die so definierte Relation ≤ eine Ordnungsrelationauf K.

LEMMA 6.20. Die Ordnung ≤ auf K ist total.

Beweis. Zu zeigen ist: fur alle α, β ∈ K gilt α ⊂ β oder β ⊂ α.

Wenn α keine Teilmenge von β ist, dann konnen wir ein a ∈ α r β wahlen. Fur jedes b ∈ β giltdann b < a, denn sonst ware a ∈ β. Somit ist b ∈ α. Es folgt β ⊂ α.

Schreibe nun 0K := 0K . Wir schreiben |α| = α fur α ≥ 0K und |α| = −α fur α < 0K .

Zeichnung und Beispiel zur Motivation der Multiplikation

Definition 6.21 (Multiplikation). Seien α, β ∈ K.

(a) Falls α ≥ 0K und β ≥ 0K so definieren wir das Produkt von α und β als

α · β := {c ∈ K | c < 0 ∨ ∃a ∈ α : ∃b ∈ β : (a ≥ 0 ∧ b ≥ 0 ∧ c = a · b)}= {a · b | a ∈ α≥0 ∧ b ∈ β≥0} ∪K<0 .

(b) In den anderen Fallen definieren wir

α · β := ±|α| · |β|,

wobei das Vorzeichnen genau dann + ist, wenn α < 0K und β < 0K .

LEMMA 6.22. α · β ∈ K.

Beweis. Die folgenden Argumente werden aus Zeitgrunden in der Vorlesung nicht ausgefuhrt.


(1) −1 ∈ α · β, also α · β 6= ∅.Wahle a′ ∈ α′ und b′ ∈ β′. Fur alle a ∈ α und b ∈ β gilt a < a′ und b < b′, somit ab < a′b′.Somit ist a′b′ /∈ α · β. Also α · β 6= K.

(2) Sei c = a · b mit a ∈ α und b ∈ β. Wir mussen zeigen, dass jedes d ∈ K<c in α · β liegt. dies istklar, falls d < 0. Im Fall 0 ≤ d < c gilt

d = a︸︷︷︸∈α

· d

a︸︷︷︸∈β

,

da da <

ca ∈ β. Somit d ∈ α · β.

(3) Sei a, b, c wie oben. Da α kein Maximum besitzt, gibt es ein a0 ∈ α, a0 > a. Dann ist c0 :=a0 · b ∈ α · β, c0 > c. Somit hat auch α · β kein Maximum.

PROPOSITION 6.23. (K,+, ·) ist ein Korper.

Beweisskizze. Leicht zu prufen sind (Ma), (Mk), (AMd) und die Tatsache, dass es mindestenszwei Elemente gibt (iQ : Q −→ K ist injektiv).

Zu (Mn): Es ist einfach zu zeigen, dass 1K := K<1 ein neutrales Element fur die Multiplikationist. (Beweis ahnlich wie fur das additive Inverse.)

Wir wollen zeigen, dass 1K := K<1 ein neutrales Element fur die Multiplikation ist, das heißt furalle Unterklassen α gilt α ·K<1 = α.

Fall 1: α > 0.

Es gilt dann:

α·K<1def={a·b | a ∈ α≥0∧b ∈ {x ∈ K | 0 ≤ x < 1}

}∪K<0 ⊂ {c ∈ K | ∃a ∈ α : 0 ≤ c < a}∪K<0 ⊂ α.

Um α ⊂ K<1 · α zu zeigen, nehmen wir ein a ∈ α≥0. Da a kein Maximum von α ist, gibt es eina1 ∈ α mit a1 > a. Setze b := a/a1, dann 0 ≤ b < 1. Somit gilt a = a1 · b ∈ α ·K<1. Hieraus folgtα ⊂ K<1 · α aus der Definition der Multiplikation.

Fall 2: α = 0K . Fur alle β ∈ K

0K · β = (0K − 0K) · β = 0K · β − 0K · β = 0K .

Dies gilt insbesondere fur β = 1K .

Fall 3: α < 0.

α ·K<1def= −|α| ·K<1

Fall 1= −|α| = α.

Zu (Mi): Sei α ∈ K, α 6= 0K .Fall 1: α > 0K .

66 2. ZAHLEN

Wenn minα′ nicht existiert, so definieren wir

β := K≤0 ∪ {b ∈ K>0 | b−1 ∈ α′} ,und wenn es existiert, dann

β := K≤0 ∪ {b ∈ K>0 | b−1 ∈ α′ ∧ b 6= minα′} .

Es ist nicht schwer zu zeigen, dass β ∈ K. Mit ahnlichen Argumenten wie im Beweis von (Ai) zeigtman α · β = 1K (etwas Arbeit!). Diese Argumente werden aus Zeitgrunden in der Vorlesung nichtausgefuhrt.

Zu β ∈ K:

(1) 0 ∈ β, also β 6= ∅.Wahle a ∈ α, a > 0. Dann gilt a−1 /∈ β, denn fur alle a′ ∈ α′ gilt (a′)−1 < a−1.

(2) Ist b ∈ β und c ∈ K<b. Im Fall c ≤ 0 gilt c ∈ β. Im Fall 0 < c < b gilt c−1 > b−1 ∈ α′, somitc ∈ β.

(3) Angenommen b ware ein Maximum von β. Im Fall b = 0 bekommt man leicht einen Wider-spruch, da β positive Elemente hat. Im Fall b > 0 ist dann b−1 ein Minumum von α′. dies istaber ausgeschlossen in der Definition von β.

Zu α · β = 1K :

Wir nehmen ein c ∈ α · β. O.B.d.A. c ≥ 0. Wir konnen also schreiben c = a · (a′)−1 mit a ∈ α,a′ ∈ α′, a ≥ 0. Aus a′ > a folgt c < 1. Somit α · β ≤ 1K .

Sei nun c ∈ 1K , also c < 1. Wir wollen c ∈ α · β zeigen. Dies ist trivial, falls c ≤ 0. Deswegen seinun c > 0. Wahle ein festes a0 ∈ α mit a0 > 0. Wir zeigen, die Menge

M := {m ∈ N | a0 · c−m ∈ α}ist endlich. Hierzu wahlen wir ein a′ ∈ α′ und rechnen mit der Bernoulli-Ungleichung

a0 · c−m = a0 ·(

1 +1− cc

)m≥ a0 ·

(1 +m · 1− c

c

)> a′

fur alle ausreichend großen m, da K archimedisch ist. Somit gibt es ein m0 ∈ N, so dass fur allem ≥ m0 gilt: a0 · c−m 6∈ α. Also hat M hochstens m0 Elemente und somit ein Maximum.

Sei nun n := maxM . Setze a := a0 · c−n ∈ α und a′ := a0 · c−n−1 ∈ α′. Den Spezialfall, dass(a′)−1 das Minimum von α′ ist, betrachten wir in einer Fussnote.15 Wir setzen b := (a′)−1 ∈ β,und erhalten c = a · b.

Fall 2: α < 0K

Bestimme ein β ∈ K mit |α| · β = 1. Ein multiplikatives Inverse von α ist dann −β.

15Man kann dann a0 ”etwas“ zu a1 vergroßern, so dass a := a1 · c−n ∈ α immer noch in α liegt, und dann ist

a′ := (a1 · c−n−1)−1 ist dann ein nicht-minimales Element von α′.


SATZ 6.24. (K,+, ·,≤) ist ein archimedischer geordneter Korper. Die Abbildung

iK : K → K

a 7→ K<a

ist eine injektive Abbildung, die Addition, Multiplikation und Ordnung erhalt.

Beweis.

1.) Um zu zeigen, dass (K,+, ·,≤) ein geordneter Korper ist, gehen wir (a)–(d) in der Definition 5.1von geordneten Korpern durch.

Zu (a): (K,+, ·) ist ein Korper (Proposition 6.23).Zu (b): ≤ ist totale Ordnung auf K (Lemma 6.20).Zu (c): Gilt α ⊂ β, dann haben wir

α+ γ = {a+ c | a ∈ α, c ∈ γ} ⊂ {b+ c | b ∈ β, c ∈ γ} = β + γ.

Zu (d): Wir wollen zeigen

(α ≤ β ∧ 0K ≤ γ)→ α · γ ≤ β · γ .

Fall 1: γ ≥ 0K und 0K ≤ α ≤ β

α · γ = {a · c | a ∈ α≥0 ∧ c ∈ γ≥0} ∪K<0

⊂ {b · c | b ∈ β≥0 ∧ c ∈ γ≥0} ∪K<0

= β · γ

Fall 2: γ ≥ 0K und α < 0K ≤ βDann ist α · γ ≤ 0K ≤ β · γ.Fall 3: γ ≥ 0K und α ≤ β < 0KDann gilt −β ≤ −α =⇒ −β · γ ≤ −α · γ =⇒ α · γ ≤ β · γ.

Somit ist (K,+, ·) ein geordneter Korper.2.) Wir wissen bereits, dass iK : K −→ K injektiv ist, und es ist leicht zu prufen, dass diese

Abbildung Addition, Multiplikation und Ordnung erhalt.3.) Nun zeigen wir, dass K archimedisch ist, das heißt: Fur jedes α ∈ K ist ein n · 1K ∈ N zu

finden mit α ≤ n.Wahle ein a′ ∈ α′. Da K archimedisch ist, gibt es ein m ∈ N mit m ≥ a′. Wahle nun

12 ∈ 1K . Dann gilt fur alle a ∈ α

2m · 1

2≥ a′ ≥ a.

Es folgt

2m · 1K ≥ α.

LEMMA 6.25. x ∈ α⇐⇒ iK(x) < α

68 2. ZAHLEN

Beweis.

iK(x) < α ⇐⇒ iK(x) ( α

⇐⇒ Es existiert ein y in αr iK(x)

⇐⇒ ∃y ∈ α : y ≥ x⇐⇒ x ∈ α .

In der letzten Aquivalenz ist”⇒“ eine Konsequenz von Definition 6.12 (2) und

”⇐“ ergibt sich

mit y := x.

PROPOSITION 6.26. Sei (K0,+, ·,≤) ein archimedisch angeordneter Korper. Wir identifizierenQ mit seinem Bild in K0 vermoge der in Lemma 5.7 definierten Abbildung iQ : Q −→ K0. Seiena, b ∈ K0, a < b. Dann gibt es ein q ∈ Q mit a < q < b.

Interpretation fur K0 := R: zwischen zwei verschiedenen reellen Zahlen liegt eine rationale Zahl.

Beweis. Da K0 archimedisch ist, existieren n,m ∈ N mit n > 1b−a und m > −b. Setze b :=

b+m+ 1 > 1 und a := a+m+ 1.

p := max {r ∈ N>0 | r < nb}︸︷︷︸endlich, 6=∅

.

Wegen b− a > 0 erhalten wir n(b− a) = n(b− a) > 1, also na < nb− 1. Also na < p < nb. Somit

a <p

n−m− 1︸︷︷︸∈Q

< b.

SATZ 6.27 (Satz von Dedekind). Sei K = A ∪A′, A 6= ∅, A′ 6= ∅. Es gelte

∀a ∈ A : ∀a′ ∈ A′ : a < a′.

Dann existiert ein eindeutiges β ∈ K mit

∀a ∈ A : ∀a′ ∈ A′ : a ≤ β ≤ a′ .

Man nennt β die Trennungszahl .16

Vorstellung: Im obigen Satz ist A so etwas ahnliches wie eine Unterklasse. Wenn man in Definiti-on 6.12 K durch K ersetzen wurde, dann waren (1) und (2) erfullt, aber es verbleibt unbestimmt,ob A ein Maximum hat. Man stellt sich somit am besten auch dies als die Aufteilung von K ineinem linken Teil A und einen rechten Teil A′ vor.

16Im Satz von Dedekind kann man sich nun uber die gewahlte Bezeichnung wundern: Wieso schreibe ich hier

a ∈ A? Denn dieses a ist ja ein Element von K und damit eine Unterklasse, die bisher typischerweise mit dem

Buchstaben α bezeichnet wurden. Wenn wir aber letzterer Bezeichnungslogik folgen, dann mussen wir die Elementevon A′ mit α′ bezeichnen. In der bisherigen Notation ist α′ immer die Oberklasse zur Unterklasse α definiert. Um

diese Verwechslungsgefahr zu vermeiden, schreibe ich a und a′ in der Aussage des Satzes.


Zahlenstrahl, der K symbolisiert. In der Mitte β, links davon A, rechts davon A′.

Beweis. Existenz:Fall 1: A besitzt ein Maximum.Dann ist maxA eine Trennungszahl.

Fall 2: A besitzt kein Maximum.Setze

β := {b ∈ K | iK(b) ∈ A} .

β ist Dedekindscher Schnitt in K.

Denn

(1) Wahle17 ein α ∈ A und dann ein b ∈ α. Mit Lemma 6.25 folgt iK(b) < α. =⇒ iK(b) ∈ A =⇒b ∈ β =⇒ β 6= ∅.Wahle ein α ∈ A′ und dann ein b′ /∈ α. Mit Lemma 6.25 folgt iK(b′) ≥ α. =⇒ iK(b′) ∈ A′ =⇒b′ /∈ β =⇒ β 6= K.

(2) Sei b ∈ β und x ∈ K<b =⇒ iK(x) = K<x < K<b = iK(b) ∈ A =⇒ iK(x) ∈ A =⇒ x ∈ β.(3) Sei b ∈ β. Somit iK(b) ∈ A. Da A kein Maximum hat, existiert ein α ∈ A mit iK(b) < α. Nach

Proposition 6.26 mit K0 := K gibt es ein a ∈ Q ⊂ K mit iK(b) < iK(a) < α und somit b < a.Aus iK(a) < α ∈ A folgt iK(a) ∈ A, also a ∈ β. Somit war das beliebig vorgegebene b ∈ β keinMaximum.

Somit β ∈ K. Zu zeigen bleibt, dass β eine Trennungszahl ist.

Zu jedem α ∈ A gibt es ein α1 ∈ A mit α < α1. Proposition 6.26 liefert ein b ∈ Q ⊂ K mitα < iK(b) < α1. =⇒ iK(b) ∈ A =⇒ b ∈ β. Mit Lemma 6.25 sehen wir iK(b) < β und somit α < β.

Angenommen es gabe ein α ∈ A′ mit α < β. Proposition 6.26 liefert ein p ∈ Q ⊂ K mit α <iK(p) < β. Wegen Lemma 6.25 haben wir p ∈ β, also iK(p) ∈ A. Gleichzeitig erhalten wir ausα < iK(p) auch iK(p) ∈ A′, also einen Widerspruch.

Eindeutigkeit:Angenommen es gabe zwei Trennungszahlen β1, β2 mit β1 < β2. Setze βm := (β1 + β2)/2 ∈ K.Wir haben β1 < βm und somit βm /∈ A. Wegen βm < β2 folgt βm /∈ A′. Dies widersprichtA ∪A′ = K. Fr 23.11.

SATZ 6.28. Ist K ein archimedisch geordneter Korper, dann ist K ein archimedisch geordneter

Korper, der die Supremumseigenschaft erfullt. Die Abbildung iK : K −→ K ist ein Isomorphismus.

Daraus folgt dann direkt Satz 6.7.

17Im Beweis benotige ich nun Elemente von Elementen von A, deswegen wechsle ich zur alten Notation a ∈α ∈ A. Wir schreiben α fur Elemente von A′, um Verwechslungen zur Oberklasse α′ von α zu vermeiden.

70 2. ZAHLEN

Beweis. Sei B eine nicht-leere nach oben beschrankte Teilmene von K. Wenn B ein Maximumbesitzt, so ist dieses auch das Supremum und wir sind fertig. Andernfalls definieren wir A′ :=S(B,K) und A := K r A′. Die Voraussetzungen in Satz 6.27 sind erfullt. Deswegen gibt es eineTrennungszahl β zur Zerlegung K = A ∪A′.

Dann haben wir β ∈ S(A,K) und damit18 auch β ∈ S(B,K) = A′. Wegen der Folgerung inSatz 6.27 ist dann β das Minimum von A′ = S(B,K) und damit das Supremum von B. Insbeson-dere: das Supremum existiert.

Also erfullt K die Supremumseigenschaft. Deswegen ist iK : K −→ K nach Lemma 6.15 einIsomorphismus.

Wir wenden uns nun dem Beweis von Satz 6.8 zu.

Sei (K,+, ·,≤) ein geordneter Korper, der die Supremumseigenschaft erfullt. Nach Lemma 5.7 gibtes eine injektive Abbildung iKQ : Q −→ K, die Addition, Multiplikation und Ordnung erhalt. Wir

identifizieren im folgenden Q mit dem Bild von iKQ vermoge iKQ . Also Q ⊂ K und Q ⊂ Q.

Sei α ∈ Q, also α sei eine Unterklasse in Q. Dann liefert jedes a′ ∈ α′ eine obere Schranke vonα in K. Somit ist α eine nicht-leere, nach oben beschrankte Teilmenge von K. Somit existiertsupK α ∈ K, wobei supK das Supremum in K bezeichnet. Wir definieren eine Abbildung

s : Q −→ K, α 7→ supK α .

LEMMA 6.29. Zu jedem x ∈ K ist U(x) := {a ∈ Q | a < x} eine Unterklasse in Q.

Beweis. Der geordnete Korper K ist insbesondere archimedisch (Satz 6.6).

K archimedischdef⇐⇒ ∀a ∈ K : ∃n ∈ N : a ≤ n⇐⇒ ∀a ∈ K : ∃n ∈ N : a < n

⇐⇒ ¬ (∃a ∈ K : ∀n ∈ N : n ≤ a)

⇐⇒ N unbeschrankt

Somit ist Z und damit auch Q nach oben und unten unbeschrankt.

Nun zeigen wir, dass U(x) eine Unterklasse in Q ist:

(1) Nutze die Unbeschranktheit von Q:U(x) 6= ∅, da Q nach unten unbeschrankt in K.U(x) 6= Q, da Q nach oben unbeschrankt in K.

(2) a ∈ U(x) und y < a dann haben wir y < a < x.(3) Angenommen a ware ein Maximum von U(x). Also a < x. Nach Proposition 6.26 mit K0 := K

existiert ein q ∈ Q mit a < q < x. Also q ∈ U(x). Widerspruch!

18Es gilt hier sogar S(A,K) = S(B,K): wir haben diese Tatsache aber weder gezeigt noch benutzt. Wir nutzen

hier lediglich C ⊂ D → S(D,K) ⊂ S(C,K).

7. DIE KOMPLEXEN ZAHLEN 71

LEMMA 6.30. Die Abbildung

U : K −→ Q, x 7→ U(x)

ist die Umkehrabbildung von s : Q −→ K.

Beweis. ∀a ∈ α : a < s(α) =⇒ α ⊂ U(s(α))∀a′ ∈ α′ : a′ ∈ S(α,Q) ⊂ S(α,Q) =⇒ a′ ≥ s(α) =⇒ a′ /∈ U(s(α)).Somit α = U(s(α)).

Sei x ∈ K, y := s(U(x)) = supK{q ∈ Q | q < x}. Es folgt y ≤ x. Angenommen y < x, dann existiertnach Proposition 6.26 mit K0 := K ein q ∈ Q mit y < q < x, also q ∈ U(x). Widerspruch!

Man kann zeigen, dass s Addition, Multiplikation und Ordnung bewahrt.19 Nach all diesen Vorar-beiten ist der Beweis von Satz 6.8 ganz kurz.

Beweis von Satz 6.8. Sei nun (K, +, ·, ≤) ein weiterer geordneter Korper ist, der die Supremums-

eigenschaft erfullt. Wir erhalten analog s : Q → K. Dann erfullt F := s ◦ s−1 : K −→ K die inSatz 6.8 geforderten Eigenschaften.

FOLGERUNG 6.31. Ist (K,+, ·,≤) ein archimedisch geordneter Korper, dann gibt es eine injek-tive Abbildung f : K −→ R, die Addition, Multiplikation und Ordnung erhalt.

Interpretation: Jeder archimedisch geordnete Korper ist im wesentlich gleich (mathematisch prazi-ser: als geordneter Korper isomorph) zu einem Unterkorper von R. Ein Unterkorper ist eine Teil-menge von R, die selber ein Korper ist; auf der Teilmenge sollen Addition, Multiplikation undOrdnung wie in R defniert sein.

Beweis. Schranke die bijektive Abbildung K −→ R auf K ein.

7. Die komplexen Zahlen

Motivation. x2 = −1 besitzt keine reelle Losung.

Idee: Erweitere die reelle Zahlengerade zu einer Ebene, der Gaußschen Zahlenebene. Die Elementedieser Ebene sind komplexe Zahlen.

Ein Modell fur die komplexen Zahlen.

19Der Beweis ist wiederum nicht schwer, aber besteht aus einigen Teilbehauptungen, die sich direkt aus der

Definition von +, · und ≤ ergeben.

72 2. ZAHLEN

Definition 7.1. Auf C := R2 definieren wir die folgenden Verknupfungen:

Addition: + : C× C −→ C((x1, y1), (x2, y2)) 7→ (x1, y1) + (x2, y2) := (x1 + x2, y1 + y2)

Multiplikation: · : C× C −→ C((x1, y1), (x2, y2)) 7→ (x1, y1) · (x2, y2) := (x1x2 − y1y2, x1y2 + x2y1)

Gaußsche Zahlenebene und Addition

Die Abbildung iR : R ↪→ C, a 7→ (a, 0) ist injektiv und erhalt Addition und Multiplikation. Wiridentifizieren a mit (a, 0). Wir schreiben i := (0, 1). Dann gilt fur x, y ∈ R:

x+ yi = (x, 0) + (y, 0) · (0, 1) = (x, 0) + (0, y) = (x, y).

Man nennt dann x den Realteil von z = x+ yi und y den Imaginarteil , geschrieben x = Re z undy = Im z.

C = {x+ yi | x, y ∈ R}.

Wir haben i2 = (0− 1) + (0 + 0)i = −1.

Komplexe Zahlen z = x+ yi, x, y ∈ R heißen

• imaginar , falls y = Im z 6= 0,• rein imaginar , falls x = Re z = 0 und y = Im z 6= 0.

LEMMA 7.2. (C,+, ·) ist ein Korper.

Beweis. Assoziativitat und Kommutativitat von Addition und Multiplikation ist einfach nachzu-rechnen: (Aa), (Ak), (Ma), (Mk). Ebenso das Distributivgesetz (AMd). Das neutrale Element derAddition (bzw. Multiplikation) ist 0 = 0 + 0i, (bzw. 1 = 1 + 0i), (An) bzw. (Mn). Das additiveInverse von x+ yi ist (−x) + (−y)i, (Ai).

(Mi): Gegeben sei z := x+ yi ∈ Cr {0}. Es folgt dann x 6= 0 ∨ y 6= 0 und somit x2 + y2 ∈ R>0.

Wir benotigen ein multiplikatives Inverses von z, also ein w ∈ C mit wz = 1. Wir zeigen: Es gibtgenau ein solches w ∈ C.20

Zur Eindeutigkeit:

Angenommen wz = 1 mit z = x+ yi und w = a+ bi. Multipliziere beide Seiten mit x− iy:

(x− yi) = (a+ bi)(x+ yi)(x− yi) = (a+ bi)(x2 + y2) = a(x2 + y2) + b(x2 + y2)i .

20man muss eigentlich hier gar nicht die Eindeutigkeit zeigen, die Existenz reicht aus. Wenn man sich aber die

Eindeutigkeit anschaut, bekommt man eine Idee, wie man die Existenz zeigen kann.


Hieraus folgt x = a(x2 + y2) und −y = b(x2 + y2), also

a =x

x2 + y2,(7.3)

b = − y

x2 + y2.(7.4)

Zur Existenz:

Wir definieren a und b wie in (7.3) und (7.4). Die Definition ergibt Sinn, da x2 + y2 > 0. Manrechnet nach

(x+ yi) · (a+ bi) = 1 .

Fur x, y ∈ R definieren wirx+ yi := x− yi.

Wir erhalten eine R-lineare bijektive Abbildung C −→ C, z 7→ z, die komplexe Konjugation genanntwird.

Die Abbildung

C −→ R, x+ yi 7→ |x+ yi| :=√x2 + y2 =

√(x+ yi)(x+ yi)

heißt die Betragsfunktion der komplexen Zahlen.

Eigenschaften: Seien z, z1, z2 ∈ C.z1 ± z2 = z1 ± z2

z1 · z2 = z1 · z2

z1/z2 = z1/z2

|z1 + z2| ≤ |z1|+ |z2||z1z2| = |z1| · |z2|

Es gelten auch die anderen in Lemma 5.11 aufgezahlten Eigenschaften mit Ausnahme von (d), denman wie folgt abandern muss

|a2| = |a|2 = aa ≥ 0.

Polarkoordinaten und Veranschaulichung der Multiplikation in C.21

21Ein Kommentar, um die logische Stellung dieser Veranschaulichung zu klaren: um eine geometrische Vorstel-lung zu entwickeln, wie man komplexe Zahlen multipliziert, wurde hier die Polar-Darstellung eingefuhrt, obwohl wireigentlich zum jetzigen Zeitpunkt noch gar nicht wissen, was sin und cos bedeuten. Die Ubungsaufgabe (Ubungsblatt

6 Aufgabe 4), die mit dieser Veranschaulichung verbunden ist, nutzt die Additionstheoreme fur Sinus und Cosinus,die wir ebenfalls noch nicht bewiesen haben, die aber wahrscheinlich jeder schon in der Schule gesehen hat. Fur

einen exakten und streng logischen Aufbau ware diese Veranschaulichung und die oben genannte Aufgabe besser

erst dann zu behandeln, wer wir all dies eingefuhrt haben. Da es aber mindestens genauso wichtig ist, dass Siemoglichst bald eine gute Vorstellung von den komplexen Zahlen entwickeln, ist es dennoch richtig hier und nichtspater diese Veranschaulichung zu behandeln.

74 2. ZAHLEN

Bilder zur Polar-Darstellung

Schreibe z1, z2, z3 in Polar-Darstellung

zn = rn(cosϕn + (sinϕn)i), rn ∈ R>0, ϕn ∈ R.rn := |zn|; ϕn = arg(zn), falls ϕn ∈ [0; 2π).

UBUNG 7.5 (Ubungsblatt 6 Aufgabe 4). z3 = z1 · z2 ist aquivalent zu

r3 = r1 · r2 undϕ3 − (ϕ2 + ϕ1)

2π∈ Z

Mi 28.11.

Definition 7.6. Sei d ∈ N und seien a0, a1, . . . , ad ∈ C. Eine Funktion der Form

C −→ C

z 7→ P (z) :=d∑k=0

akzk = a0 + a1z

1 + a2z2 + · · ·+ adz

d

nennt man eine polynomiale Funktion22 uber C. Die Zahlen a0, . . . , ad nennt man die Koeffizienten.Gilt ad 6= 0, so sagen wir P hat Grad d, deg(P ) = d. Die polynomiale Funtion mit C −→ C, z 7→ 0hat Grad −∞, deg(0) = −∞. Hierbei ist −∞ ein Symbol23 mit den Eigenschaften ∀n ∈ N : −∞ <n und ∀n ∈ N : −∞+ n := −∞. Gilt deg(P ) = d ∈ N, so nennt ad den Leitkoeffizient .

Jede polynomiale Funktion P hat einen Grad deg(P ) ∈ {−∞, 0, 1, . . .}.(P +Q)(z) := P (z) +Q(z), (P ·Q)(z) := P (z) ·Q(z), deg(P ·Q) = deg(P ) + deg(Q).

THEOREM 7.7 (Fundamentalsatz der Algebra). Sei P : C −→ C ein Polynom von Grad d ≥ 1.Dann gibt es ein z ∈ C mit P (z) = 0.

Ein solches z nennt man eine Nullstelle von P .

Mindestens einen Beweis dieses Theorems lernen wir in der Analyis III kennen.

KOROLLAR 7.8. Zu jeder polynomialen Funktion P uber C von Grad d ≥ 1 gibt es komplexeZahlen b1, . . . , bd mit

∀z ∈ C : P (z) = ad(z − b1)(z − b2) · · · (z − bd).Die Losungsmenge der komplexen Zahlen z, die P (z) = 0 erfullen, ist somit

{bj | j ∈ {1, . . . , d}}und hat deswegen hochstens d Elemente und mindestens 1 Element.

22Sie haben im Rahmen der Schulmathematik hierfur vielleicht das Wort”Polynom“ statt

”polynomialer Fun-

tion“ benutzt, dies ist nun aber nicht mehr erlaubt, denn das Wort”Polynom“ hat in der Mathematik eine etwas

andere Bedeutung, siehe Lineare Algebra.23Man sollte sich nicht fragen, was −∞ ist. Es ist nur ein Symbol, das N erweitert zu {−∞} ∪ N, und die

Definition der Ordnung ≤ und der Addition + erweitern sich wie in diesen Eigenschaften beschrieben.


Beweis. Man zeigt zuerst die Zerlegung P (z) = an(z − b1)(z − b2) · · · (z − bd) durch Induktionuber d.

Induktionsanfang.Ist P eine polynomiale Funktion von Grad 1, dann gilt P (z) = a1z+ a0 mit a1 6= 0. Daraus ergibtsich

P (z) = a1

(z +

a0

a1

),

also die Aussage mit b1 = −a0/a1.

Induktionsschritt.Sei d ≥ 2 gegeben, und eine polynomiale Funktion P von Grad d. Das Korollar gelte fur d − 1.Nach dem Fundamentalsatz der Algebra gibt es eine Nullstelle bd von P . Wir dividieren P (z) durch(z − bd):

P (z) = Q(z)(z − bd) +R(z),

wobei Q eine polynomiale Funktion von Grad d − 1 ist und R eine polynomiale Funktion ist, dieden Divisionsrest angibt. Nun gilt24 deg(R) < deg(z − bd) = 1, also deg(R) = 0 oder R = 0. Daoffensichtlich R(bd) = 0, folgt R = 0. Die polynomialen Funktionen Q und P haben denselbenLeitkoeffizient, den wir a nennen. Wir wenden nun die Induktionsvoraussetzung auf Q an undschreiben:

Q(z) = a(z − b1) · · · (z − bn−1),

woraus wir

P (z) = a(z − b1) · · · (z − bn)

erhalten.

Nun rechnet man leicht P (bj) fur alle j ∈ {1, . . . , n} nach. Umgekehrt, sieht man fur z 6∈ {bj | j ∈{1, . . . , n}} leicht, dass P (z) als Produkt von nicht-verschwindenden25 Faktoren ebenfalls nicht-verschwindet.

Ist w eine Nullstelle von P , dann nennt man

#{j ={

1, 2, . . . , d} | w = bj

}∈ N

die Multiplizitat der Nullstelle.

Bemerkung 7.9. Die Berechnung der Nullstellen ist im allgemeinen sehr schwierig. Fur polyno-miale Funktionen von Grad d ≤ 4 gibt es eine Losungsformel. In der Schule lernt man die furd = 2, die Formel fur d = 3 und d = 4 sind zunehmend komplizierter. Fur Grad d ≥ 5 gibt eskeine Losungsformel, genauer man kann aus den Koeffizienten ai, den Grundrechenarten +,+, ·, /und Wurzelziehen keinen Ausdruck herleiten, der die Nullstellen angibt. Und man kann zeigen,dass es solche einen Ausdruck gar nicht gibt. Diese Aussagen werden in der Vorlesung

”Algebra“

24Beweis: Lineare Algebra oder Mathematische-Methoden-Vorlesung25

”nicht-verschwindend“ ist eine noblere Form fur

”ungleich 0“

76 2. ZAHLEN

im Rahmen der Galois-Theorie behandelt. Die Galois-Theorie ist nach Evariste Galois benannt,dessen Leben und fruher Tod eine sehr erstaunlich ist, siehe Wikipedia.

https://de.wikipedia.org/wiki/%C3%89variste_Galois

KAPITEL 3

Folgen und Reihen

1. Folgen

1.1. Konvergenz von Folgen. Im folgenden sei K = Q, K = R oder K = C. 1 Es gibt danneine Betragsfunktion K → R, x 7→ |x|.

|x+ y| ≤ |x|+ |y|, |xy| ≤ |x| |y|Definition 1.1. Eine (K-wertige) Folge ist eine Abbildung von N nach K.

Oft bezeichnet man auch auf N>k definierte Abbildungen als Folgen, z.B. N>0 → K.

Definition 1.2. Eine K-wertige Folge (aj)j∈N heißt beschrankt , wenn es ein s ∈ R gibt, so dass

∀j ∈ N : |aj | ≤ s.Ist K ⊂ R, dann ist (aj)j∈N beschrankt genau dann, wenn die Menge {aj | j ∈ N} nach obenund unten beschrankt ist. Fur K ⊂ R nennen wir (aj)j∈N nach oben bzw.2 nach unten beschranktgenau dann, wenn {aj | j ∈ N} nach oben bzw. nach unten beschrankt ist. Die Begriffe obereSchranke, untere Schranke, Minimum, Maximum, Supremum, Infimum definiert man fur Folgenanalog, also z.B. a ∈ R ist obere Schranke von (aj)j∈N genau dann, wenn es obere Schranke von{aj | j ∈ N} ist.

Beispiele 1.3.

(a) (2j)j∈N ist nach unten, aber nicht nach oben beschrankt.(b) (3 + 4/j)j∈N>0

ist nach unten beschrankt durch 3 und nach oben beschrankt durch 7.

Definition 1.4 (Konvergenz von Folgen). Eine K-wertige Folge (aj)j∈N konvergiert gegen a ∈ K,falls gilt

∀ε ∈ R>0 : ∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤ ε).Man nennt a den Grenzwert oder Limes der Folge (aj)j∈N und schreibt a = limj→∞ aj oder aj → afur j → ∞. Wir sagen (aj)j∈N konvergiert (in K), falls es ein derartiges a ∈ K gibt. Folgen, die

1Alles, was wir im folgenden zeigen werden, gilt auch fur jeden archimedisch geordneten Korper. Da aber alle

diese Korper zu einem Unterkorper von R isomorph sind, ist dies keine wirkliche Verallgemeinerung.2Die Abkurzung

”bzw.“ steht fur

”beziehungsweise“ und dieses Wort besagt, dass diese Definition nun in zwei

Version gelesen werden kann. Zunachst mit den Worten”nach oben“ an beiden Stellen, aber auch mit den Worten

”nach unten“. Hierbei ist wichtig, dass im Haupt- und im Nebensatz denselben Begriff nutzt.

77

78 3. FOLGEN UND REIHEN

gegen 0 konvergieren, nennt man Nullfolgen. Falls eine Folge nicht konvergiert, so sagen wir dazusie divergiert.

!ACHTUNG!. Wenn wir a = limj→∞ aj schreiben, so bedeutet dies immer:

• der Grenzwert existiert, und• der Grenzert ist a.

Bemerkungen 1.5.

(a) Falls eine Folge einen Grenzwert besitzt, so ist dieser eindeutig bestimmt. Seien a und a′ zweiGrenzwerte von (aj)j∈N. Zu einem gegebenen ε ∈ R>0 gilt also:

∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤ ε).∃j′0 ∈ N : ∀j ∈ N : (j ≥ j′0 =⇒ |aj − a′| ≤ ε).

Wahle nun so ein j0 und j′0. Dann gilt fur alle j ≥ max{j0, j′0}:

|a− a′| ≤ |a− aj |+ |aj − a′| ≤ ε+ ε = 2ε.

Dies gilt fur alle ε ∈ R>0. Angenommen wir haben a 6= a′, so gilt dies insbesondere furε := |a − a′|/3 > 0. Also folgt 3ε ≤ 2ε und somit ergibt sich der Widerspruch ε ≤ 0. DieAnnahme a 6= a′ war also falsch, d.h. es gilt a = a′.

(b) Falls (aj)j∈N konvergiert, so ist (aj)j∈N beschrankt. Begrundung: sei a := limj→∞aj . Wirwahlen zu ε := 1 ein passendes j0. Es gilt somit fur alle j ∈ N mit j ≥ j0:

|aj | ≤ |aj − a|+ |a| ≤ |a|+ 1.

Nun setzen wir

r := max{|a0|, |a1|, . . . , |aj0−1|, |a|+ 1}.Dann gilt fur alle j ∈ N: |aj | ≤ r. Somit ist (aj)j∈N beschrankt.

(c) Zu jedem ε ∈ R>0 existiert ein n ∈ N>0 mit ε ≥ 1/n (siehe Ubungsblatt 5 Aufgabe 3).Deswegen gilt3

a = limj→∞

aj gdw ∀n ∈ N>0 : ∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤1

n).

Beispiele 1.6.

(a) Eine Folge (aj)j∈N heißt konstant, falls a0 = a1 = a2 = . . .. Konstante Folgen sind beschranktund konvergieren. a0 = limj→∞ ai.

(b) ( 1j )j∈N>0

ist eine Nullfolge. (Nutze z.B. Bem. 1.5 (c) und setze j0 := n).

(c) Die Folge((−1)j

)j∈N hat 1 als obere und −1 als untere Schranke und ist somit beschrankt.

Wir werden bald sehen, dass sie nicht konvergiert.

3Um die Gefahr von Verwechslungen zwischen dem Grenzwert-Pfeil (z.B. j → ∞) und dem Pfeil fur logischeImplikation (z.B. (a∧ b)→ (c∨ d) klein z halten, benutzen wir ab nun oft =⇒ an Stellen, wo wir bisher → benutzthatten, z.B. in der folgenden Formel

1. FOLGEN 79

(d) Gilt |q| < 1, dann ist (qj)j∈N eine Nullfolge. (Hierbei ist q0 := 1.)Um dies zu zeigen, bestimme mit dem folgenden Lemma zu gegebenem ε ∈ R>0 ein n ∈ N mit|q|n < ε. Dann gilt fur alle j ∈ N, j ≥ n:

|qj | = |q|j = |q|j−n︸︷︷︸≤1

|q|j ≤ ε.

Wir haben also gezeigt:

∀ε ∈ R>0 : ∃n ∈ N : ∀j ∈ N :(j ≥ n =⇒ |qj − 0| ≤ ε

).

LEMMA 1.7. Sei r ∈ R>0 mit r < 1 und ε ∈ R>0. Dann gibt es ein n ∈ N mit rn < ε.

Beweis. Offensichtlich gilt

rn < ε⇐⇒(1

r

)n>

1

ε(1.8)

Auf Ubungsblatt 4 Aufgabe 1 c) haben wir fur x ∈ R≥−1 die Bernoulli-Ungleichung gezeigt:

(1 + x)n ≥ 1 + nx .

Wende die Bernoulli fur x := (1/r)− 1 > 0 an und erhalte

(1.9)

(1

r

)n≥ 1 + nx .

Aufgrund der archimedischen Eigenschaft existiert ein n ∈ N mit

n >1

x

(1

ε− 1

).

und dies ist aquivalent zu

1 + nx >1

ε,

und mit (1.9) impliziert dies (1.8) und somit rn < ε. Fr 30.11.

PROPOSITION 1.10. Seien (aj)j∈N und (bj)j∈N konvergente Folgen. Dann gilt:

limj→∞

(aj + bj) = limj→∞

aj + limi→∞

bj(1)

limj→∞

(aj − bj) = limj→∞

aj − limi→∞

bj(2)

limj→∞

(aj · bj) = limj→∞

aj · limi→∞

bj(3)

Gilt zusatzlich: ∀i ∈ N : bj 6= 0, und ist (bj)i∈N keine Nullfolge, so gilt auch

(4) limj→∞

ajbj

=

limj→∞

aj

limi→∞

bj.


Beweis von Proposition 1.10 (1).

(1): Angenommen a = limj∈N aj und b = limj∈N bj . Dies bedeutet, dass wir fur jedes ε ∈ R>0 diefolgenden Aussagen haben:

∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤ ε)∃k0 ∈ N : ∀j ∈ N : (j ≥ k0 =⇒ |bj − b| ≤ ε)

Wir wahlen nun solch ein j0 und solch ein k0. Dann gilt fur `0 := max{j0, k0}.∀j ∈ N : (j ≥ `0 =⇒ |aj − a| ≤ ε ∧ |bj − b| ≤ ε).

Wir rechnen fur j ≥ `0:

|(aj + bj)− (a+ b)| = |(aj − a) + (bj − b)| ≤ |aj − a|+ |bj − b| ≤ ε+ ε = 2ε.

Also ergibt sich insgesamt

∀ε ∈ R>0 : ∃`0 ∈ N : ∀j ∈ N :(j ≥ `0 =⇒ |(aj + bj)− (a+ b)| ≤ 2ε.

)︸︷︷︸

A(2ε):=

Nach dem folgenden Lemma konnen wir in dieser Aussage 2ε durch ε zu ersetzen. Somit ist

a+ b = limj→∞

(aj + bj)

und damit auch (1) gezeigt.

LEMMA 1.11. Sei A( · ) eine auf R>0 definierte Aussageform, und q ∈ R>0. Dann gilt

∀ε ∈ R>0 : A(ε) ⇐⇒ ∀ε ∈ R>0 : A(qε)

Das Lemma gibt es vielen Variationen. Wichtiger als die Aussage des Lemmas ist es, zu verstehen,wie man das Lemma (oder eine Variation davon!) kurz beweist.

Beweis des Lemmas.

”=⇒“: Es gelte

(1.12) ∀ε ∈ R>0 : A(ε).

Fur ein gegebenes ε > 0 wollen wir nun A(qε) zeigen. Wir wenden (1.12) fur ε := qε an, und habendann das gewunschte.

”⇐=“: Analog mit ε := q−1ε

Beweis von Proposition 1.10 (Fortsetzung).(2): Der Beweis fur (aj − bj)j∈N ist vollig analog zur Summe.

(3): Sei wieder a := limj→∞ aj und b := limj→∞ bj . Fur das Produkt (aj · bj)j∈N muss man etwasanders vorgehen. Zunachst nutzen wir die Tatsache, dass (aj)j∈N beschrankt ist. Also gibt es einr ∈ R mit

∀j ∈ N : |aj | ≤ r

1. FOLGEN 81

Dann argumentieren wir wie bei der Summe, rechnen aber wie folgt:

|ajbj − ab| = |aj(bj − b) + (aj − a)b| ≤ |aj ||bj − b|+ |aj − a||b| ≤ rε+ ε|b| = (r + |b|)ε.

Nun argumentiert man wie bei der Summe, wobei man das Lemma mit q := r + |b| nutzt.

(4): Sei b := limj→∞ bj 6= 0. Wir zeigen, dass 1/bj gegen 1/b konvergiert. Die Aussage (4) folgtdann mit (3).

Fur ε1 := |b|/2 gibt es ein j0 ∈ N, so dass fur alle j ∈ N≥j0 gilt |bj − b| ≤ ε1 = |b|/2. NachLemma 5.11 (g) haben wir dann

|bj | ≥ |b| − |b− bj | ≥ |b| −|b|2

=|b|2.

Wir nutzen nun wieder die Definition des Grenzwerts: fur jedes ε ∈ R>0 haben wir

∃k0 ∈ N : ∀j ∈ N : (j ≥ k0 =⇒ |bj − b| ≤ ε)

Fur j ≥ `0 := max{j0, k0} rechnen wir

∣∣∣∣ 1

bj− 1

b

∣∣∣∣ =

∣∣∣∣b− bjbbj

∣∣∣∣ =|b− bj ||b| |bj |

≤ ε

(|b|/2) |b|=

2

|b|2ε .

Wir haben also gezeigt

∀ε > 0 : ∃`0 ∈ N : ∀j ∈ N :(j ≥ `0 =⇒

∣∣∣∣ 1

bj− 1

b

∣∣∣∣ ≤ 2

|b|2ε).

Aus dem Lemma mit q := 2|b|2 folgt dann

1

b= limj→∞

1

bj.


1.2. Monotone Folgen.

Definition 1.13. Seien (M,≤) und (N,≤) geordnete Mengen, f : M → N . Wir sagen f ist

monoton wachsend :⇐⇒ ∀i, j ∈M :(i ≤ j =⇒ f(i) ≤f (j))

)⇐⇒ f erhalt die Ordnung

monoton fallend :⇐⇒ ∀i, j ∈M :(i ≤ j =⇒ f(i) ≥ f(j)

)⇐⇒ f ist ordnungsumkehrend

streng monoton wachsend :⇐⇒ ∀i, j ∈M :(i < j =⇒ f(i) < f(j)

)streng monoton fallend :⇐⇒ ∀i, j ∈M :

(i < j =⇒ f(i) > f(j)

)monoton:⇐⇒ f ist monoton wachsend oder monoton fallend

streng monoton:⇐⇒ f ist streng monoton wachsend oder streng monoton fallend

⇐⇒ f ist monoton und injektiv

Beispiele 1.14.

(1) R −→ R, x 7→ x3 ist streng monoton wachsend,(2) (n)n∈N und (1− 1

n )n∈N>0 sind streng monoton wachsende Folgen.(3) Fur r ∈ R ist

brc := max(S({r},R) ∩ Z

),

also die großte ganze Zahl ≤ r. Analog ist dre als die kleinste ganze Zahl ≥ r definiert.Dann ist (bn2 c)n∈N = (0, 0, 1, 1, 2, 2, 3, 3, . . .) monoton wachsend, aber nicht streng monoton.Gleiches gilt fur (dn2 e)n∈N = (0, 1, 1, 2, 2, 3, 3, . . .).

(4) Injektive monotone Funktionen sind streng monoton.(5) Ist (M,≤) total geordnet, (N,≤) partiell geordnet und ist f : M −→ N streng monoton, dann

ist f : M −→ N injektiv. Denn seien x, y ∈M . Es gilt x < y, x = y oder x > y. Falls f strengmonoton wachsend ist und falls x < y, dann folgt f(x) < f(y), also f(x) 6= f(y). Die anderenFalle sind analog.

Nun betrachten wir reell-wertige Folgen, also M = N, N = R.

Monoton wachsende (bzw. fallende) Folgen (ai)i∈N haben a0 als Minimum (bzw. Maximum), sindalso immer nach unten (bzw. oben) beschrankt.

PROPOSITION 1.15. Alle beschrankten monotonen R-wertige Folgen konvergieren (in R).

Beweis. Sei (aj)j∈N eine beschrankte monotone Folge, o.B.d.A. monoton wachsend, aj ∈ R. Defi-nieren A := {aj | j ∈ N}, a := supA. Zu jedem ε ∈ R>0 gibt es ein j0 ∈ N mit aj0 > a − ε, dennsonst ware a− ε eine obere Schranke von A.

1. FOLGEN 83

Also gilt fur alle j ∈ {j0, j0 + 1, . . .}: a − ε < aj0 ≤ aj ≤ a. Daraus ergibt sich |a − aj | ≤ ε. Wirerhalten a = limj→∞ aj .

Beispiel 1.16. Sei

aj :=

j∑k=1

1

k2 + k5.

Die Folge (aj)j∈N ist streng monoton. Spater werden wir sehen: (aj)j∈N ist beschrankt. Somitkonvergiert (aj)j∈N.

In Abschnitt 2 uber Reihen im aktuellen Kapitel werden wir viele ahnliche Beispiele sehen.

Beispiel 1.17. Wallissches Produkt und ein Algorithmus zur Wurzelberechnung, siehe Zentralubungoder [22, Abschnitt 5.3 und 5.4].

1.3. Teilfolgen. Von nun an wieder K = Q, R oder C.

Definition 1.18. Ist f : N −→ N eine streng monotone wachsende Abbildung, dann nennt man(af(k))k∈N eine Teilfolge von (aj)i∈N.

Beispiel 1.19. Die Folge (j)j∈N = (0, 1, 2, 3, . . .) hat unter anderem folgende Teilfolgen: 4

• sich selbst, das heißt (j)j∈N = (k)k∈N, also f(k) = k• die Folge der ungeraden Zahlen (1, 3, 5, 7, . . .), also f(k) = 2k + 1• die Folge der Primzahlen (2, 3, 5, 7, . . .).

LEMMA 1.20. Konvergiert (aj)j∈N gegen a, so konvergiert jede Teilfolge ebenfalls gegen a.

Beweis. Sei (af(k))k∈N eine Teilfolge von (aj)j∈N, also f : N −→ N streng monoton.

Sei ε ∈ R>0 gegeben. Wir haben

∃j0 ∈ N : ∀j ∈ N≥j0 : |aj − a| ≤ ε.Wahle zu solch einem j0 ein k0 ∈ N mit f(k0) ≥ j0, zum Beispiel k0 := j0. Dann gilt fur dieses k0

∀k ∈ N≥k0 : |af(k) − a| ≤ ε.Insgesamt also

∀ε ∈ R>0 : ∃k0 ∈ N : ∀k ∈ N : (k ≥ k0 =⇒ |ak − a| ≤ ε).Ingesamt also a = limk→∞ af(k).

Anwendung 1.21. Die Folge((−1)j

)j∈N aus Beispiele 1.6 (c) divergiert.

Beweis. Angenommen, die Folge((−1)j

)j∈N konvergiert gegen ein a ∈ K. Dann konvergieren auch

die Teilfolgen((−1)2k

)k∈N = (1)k∈N und

((−1)2k+1

)k∈N = (−1)k∈N gegen a. Da diese Teilfolgen

konstant sind, erhalten wir den Widerspruch a = 1 und a = −1. Mi 5.12.

4Diese Folge hat naturlich noch viel mehr Teilfolgen!


Sei K = Q, R oder C.

Definition 1.22. Sei (ai)i∈N eine K-wertige Folge, a ∈ K. Wir sagen a ist ein Haufungspunkt derFolge (ai)i∈N, falls eine Teilfolge existiert, die gegen a konvergiert.

Beispiele 1.23. Die Haufungspunkte der Folge((−1)n

)n∈N sind −1 und +1.

K = C. Die Haufungspunkte der Folge(in)n∈N = (1, i,−1,−i, . . .) sind −1, +1, −i und +i.

1.4. Erweiterte reelle Zahlen und uneigentliche Konvergenz. In diesem Unterab-schnitt ist immer K = R.

Nach unseren bisherigen Definition besitzen zum Beispiel die folgenden Teilmenge von R wederSupremum noch Infimum: ∅, Z, Q, R, . . ..

Notation 1.24. Wir definieren sup ∅ := −∞, inf ∅ := ∞. Und supM := ∞, falls M nicht nachoben beschrankt. Und inf M := −∞, falls M nicht nach unten beschrankt.

Fortsetzung der Ordnung auf R := R ∪ {−∞,+∞}. ∞ = +∞.

∀x ∈ R : −∞ ≤ x ≤ ∞.Man nennt R die erweiterten reellen Zahlen. Addition und Multiplikation sind hierauf nicht defi-niert.

Intervalle5: Seien a, b ∈ R, a ≤ b(a, b) := {x ∈ R | a < x < b} offenes Intervall[a, b) := {x ∈ R | a ≤ x < b} halboffenes Intervall(a, b] := {x ∈ R | a < x ≤ b} halboffenes Intervall[a, b] := {x ∈ R | a ≤ x ≤ b} abgeschlossenes Intervall

Definition 1.25. Sei (an)n∈N eine reell-wertige Folge. Wir sagen

(an)n∈N konvergiert gegen unendlich

⇐⇒ ∀x ∈ R : ∃n0 ∈ N : ∀n ∈ N≥n0: an ≥ x

Alternative Ausdrucksweisen:an →∞ fur n→∞(an)n∈N konvergiert gegen ±∞.limj→∞ aj =∞

Wir sagen (an)n∈N konvergiert gegen −∞, wenn (−an)n∈N gegen +∞ konvergiert. Konvergenzgegen ∞ oder −∞ nennt man uneigentliche Konvergenz .6 Wir sagen, dass ∞ (bzw. −∞) einHaufungspunkt von (an)n∈N ist, falls eine Teilfolge gegen ∞ (bzw. −∞) konvergiert.

5An Stelle von (0, 1] schreibt man in Schulen oft ]0, 1]. Dies ist in der Mathematik in den Universitaten weniger

ublich, da eine Klammer ] am Ende eines einzuklammernden Ausdrucks stehen sollte. In den meisten Buchern

schreibt man deswegen (0, 1].6In manchen Buchern, z.B. [14] wird der Begriff

”uneigentliche Konvergenz“ durch

”bestimmte Divergenz“

ersetzt.

1. FOLGEN 85

Wir nutzen den Begriff”eigentlich konvergent“ inhaltlich aquivalent zu

”konvergiert“, das Wort

”eigentlich“ wird benutzt, wenn man nochmals unterstreichen will, dass es sich nicht um

”unei-

gentliche Konvergenz“ handelt.

Wir sagen eine Folge konvergiert in R, falls sie eigentlich oder uneigentlich konvergiert.

Beispiel 1.26. Sei k ∈ N>0. Dann gilt:

limn→N

nk =∞.

Wenn wir a = limn→∞ an schreiben, so bedeutet dies ab jetzt (fur K = R):

• der Grenzwert existiert im eigentlichen oder uneigentlichen Sinn,• der Grenzwert ist a ∈ R.

!ACHTUNG!. Wenn wir ohne weitere Zusatze sagen:”die reell-wertige Folge konvergiert“, dann

ist hier immer die Konvergenz im eigentlichen Sinne gemeint, d.h. gegen eine reelle Zahl. Uneigent-lich konvergente Folgen sind somit immer divergent. 7

!ACHTUNG!. In der gesamten Analysis I und II gilt: Im Fall K = C gibt es keine uneigentlicheKonvergenz von Folgen. Wer diesen Begriff in der Klausur oder auf dem Ubungsblatt fur K = Cnutzt, macht einen Fehler.

LEMMA 1.27. Eine Folge ist genau dann nach oben (bzw. nach unten) beschrankt, wenn ∞ (bzw.−∞) kein Haufungspunkt ist.

Beweis. Sei (aj)j∈N eine Folge.

Angenommen ∞ ist ein Haufungspunkt. Sei f : N → N ist streng monoton wachsend undlimn→∞ af(n) =∞. Fur x ∈ R gilt dann

∃n0 ∈ N : ∀n ∈ N≥n0: af(n) ≥ x.

Also ist x− 1 keine obere Schranke. Also (aj)j∈N unbeschrankt.

Sei (aj)j∈N nach oben unbeschrankt.

(1.28) ∀x ∈ R : ∃k ∈ N : ak > x

Definiere induktiv f : N→ N. Wahle f(0) := 0. Seien nun f(0), f(1), . . . , f(n) fur n ∈ N definiert.Wende (1.28) fur x := max{af(0), af(1) . . . , af(n), n} an und erhalte ein k. Setze f(n + 1) := k.Dann konvergiert die Teilfolge (af(n))n∈∞ gegen ∞.

Also ist die Folge nach oben unbeschrankt genau dann, wenn ∞ Haufungspunkt ist.

7Aber wir haben schon gesehen, dass es divergente Folgen gibt, die nicht uneigentlich konvergieren, z.B.

((−1)n)n∈N.


(aj)j∈N nach unten beschrankt

⇐⇒(−aj)j∈N nach oben beschrankt

⇐⇒∞ kein Haufungspunkt von (−aj)j∈N⇐⇒−∞ kein Haufungspunkt von (aj)j∈N

PROPOSITION 1.29. Jede monotone R-wertige Folge konvergiert eigentlich oder uneigentlich (inR).

Beweis. Ist die Folge beschrankt, so wissen wir bereits, dass sie eigentlich konvergiert.

Sei (aj)j∈N unbeschrankt und o.B.d.A. monoton wachsend. Dann ist die Folge also nach obenunbeschrankt. Dies impliziert insbesondere

∀x ∈ R : ∃j0 ∈ N : aj0 > x.

Wegen der Monotonie gilt dann auch aj > x fur alle j ≥ j0. Wir erhalten also limj→∞ aj =∞.

Wir definieren nun die Abbildung ϕ : [−1, 1] −→ R,

ϕ(x) =

1

1−x −1

1+x fur x ∈ (−1, 1)

∞ fur x = 1

−∞ fur x = −1

Diese Abbildung ist streng monoton und bijektiv. Sei ψ := ϕ−1 : R −→ [−1, 1].

PROPOSITION 1.30. Sei (an)n∈N eine R-wertige Folge. Es gilt fur alle a ∈ R:

a = limn→∞

an ⇐⇒ ψ(a) = limn→∞

ψ(an)

a Haufungspunkt von (an)n∈N ⇐⇒ ψ(a) Haufungspunkt von (ψ(an))n∈N

Graphen der Funktion x 7→ ϕ(x) und ihrer Umkehrfunktion

In wenigen Wochen (Bemerkung 5.14 in Kapitel 4) werden wir starke Hilfsmittel haben, um dieseProposition ganz einfach zu zeigen. Der Beweis wird deswegen hier ausgelassen.

1.5. Limes inferior und superior. In diesem Unterabschnitt ist wiederum immer K = R.

Sei (aj)j∈N eine R-wertige Folge. Definiere fur k ∈ N

bk := inf{aj | j ∈ N≥k} ∈ [−∞,∞).

Es gilt bk ≤ bk+1, denn fur A ⊂ B ⊂ R gilt inf B ≤ inf A.

1. FOLGEN 87

Somit ist (bk)k∈N eine monoton wachsende R-wertige Folge und limk→∞ bk existiert in R. Im Fall∀k ∈ N : bk = −∞ definiert man hierfur limk→∞ bk = −∞.

Definition 1.31. Sei (ai)i∈N eine R-wertige Folge.

(1) Wir definieren den Limes inferior als

lim infj→∞

aj := limk→∞

inf{aj | j ∈ N≥k} ∈ R.

(2) Der Limes superior ist

lim supj→∞

aj := − lim infj→∞

(−aj) = limk→∞

sup{aj | j ∈ N≥k} ∈ R.

Beispiel 1.32. lim infj→∞(−1)j = −1, lim supj→∞(−1)j = 1

lim infj→∞

aj ≤ lim supj→∞

aj

SATZ 1.33. Sei (ai)i∈N eine R-wertige Folge.

(1) lim infj→∞

aj ∈ R ist ein Haufungspunkt von (aj)j∈N.

(2) lim supj→∞

aj ∈ R ist ein Haufungspunkt von (aj)j∈N.

(3) Konvergiert (aj)j∈N in R, dann haben wir

lim infj→∞

aj = limj→∞

aj = lim supj→∞

aj

(4) Gilt b := lim infj→∞

aj = lim supj→∞

aj ∈ R, dann konvergiert (aj)j∈N gegen b.

(5) Ist (af(`))`∈N eine Teilfolge von (aj)j∈N, dann gilt

lim infj→∞

aj ≤ lim inf`→∞

af(`)

lim sup`→∞

af(`) ≤ lim supj→∞

aj

(6) Ist b ein Haufungspunkt der Folge (aj)i∈N gilt

lim infj→∞

aj ≤ b ≤ lim supj→∞

aj .

Beweis.Zu (1): Wir definieren wieder bk := inf{aj | j ∈ N≥k}. Sei b := lim infj→∞ aj = limk→∞ bk. Wirhaben dann bk ≤ b.

Wir betrachten zunachst den Fall b ∈ R. Wir geben eine rekursive Definition von f : N → N an.Wir wahlen f(0) := 0. Zu gegebenem n ∈ N>0 nehmen wir nun an, dass f(n− 1) definiert ist undwir wollen nun f(n) definieren. Wegen b = limk→∞ bk und bk ≤ b gibt es ein k0 ∈ N, so dass furalle k ∈ N≥k0 die Ungleichung b− 1

n ≤ bk ≤ b gilt. Wahle k := max{k0, f(n− 1) + 1} nun fest.


Auf Grund der Definition von bk0 als Infimum gibt es ein ` ∈ N≥k mit bk ≤ a` ≤ bk + 1n . Wir

setzen f(n) := ` und erhalten somit

b− 1

n≤ bk ≤ af(n) ≤ bk +

1

n≤ b+

1

n.

Das heißt, das Kriterium in Bemerkung 1.5 (c) fur die Konvergenz b = limn→∞ af(n) ist erfullt.

Die Falle lim infj→∞

aj = ∞ und/oder lim infj→∞

aj = −∞ gehen ahnlich und werden auf dem Ubungs-

blatt 8 behandelt.

Zu (2): Wende (1) auf die Folge (−aj)j∈N an. Wir erhalten eine Teilfolge (−af(n))n∈N mit

limn→∞

(−af(n)) = lim infj→∞

(−aj) ∈ R.

Somitlimn→∞

af(n) = − lim infj→∞

(−aj) = lim supj→∞

aj ∈ R.

Zu (3): Wahle eine Teilfolge gemaß (1) die gegen lim infj→∞

aj konvergiert. Wegen Lemma 1.20 konver-

giert sie auch gegen limj→∞

aj . Also lim infj→∞

aj = limj→∞

aj . Genauso zeigt man die die andere Gleichung

mit (2).Fr 7.12.

Zu (4): Wir haben

bj := inf{ak | k ≥ j} ≤ aj ≤ bj := sup{ak | k ≥ j}(bj) ist monoton wachsend, (bj) monoton fallend, also beide konvergent in R.

b = limj→∞ bj = limj→∞ bj , also konvergiert nach Ubungsblatt 7, Aufgabe 3 b) (Sandwich-Lemma)auch (aj) gegen diesen Grenzwert.

Zu (5): Wir haben{aj | j ∈ N≥f(`)} ⊃ {af(m) | m ∈ N≥`}

und somitbf(`) = inf{aj | j ∈ N≥f(`)} ≤ inf{af(m) | m ∈ N≥`} =: b`

Also

lim infj→∞

aj = limj→∞

bjTF= lim

`→∞bf(`)

(∗)≤ lim

`→∞b` = lim inf

`→∞af(`)

(bj) und (b`) sind monoton wachsende Folgen, also konvergieren sie in RZu TF: Ubergang zu Teilfolge, siehe Lemma 1.20(∗): siehe Ubungsblatt 7, Aufgabe 3, a)

Zu (6): Folgt nun aus (3) und (5)

Aus Satz 1.33 folgt:

1. FOLGEN 89

KOROLLAR 1.34. Jede reell-wertige Folge besitzt eine in R konvergente Teilfolge.

In anderen Worten: Jede reell-wertige Folge besitzt einen Haufungspunkt in R.

KOROLLAR 1.35 (Satz von Bolzano-Weierstraß). Jede beschrankte reell-wertige Folge besitzt eine(in R) konvergente Teilfolge.

In anderen Worten: Jede beschrankte reell-wertige Folge besitzt einen Haufungspunkt in R.

Beweis. Auf Grund des Korollars 1.34 besitzt jede reell-werte Folge mindestens einen Haufungs-punkt in R. Wegen Lemma 1.27 sind −∞ und∞ keine Haufungspunkte, wenn die Folge beschranktist. Wir haben also einen Haufungspunkt in R.

SATZ 1.36 (Satz von Bolzano-Weierstraß in C). Jede beschrankte C-wertige Folge besitzt eine(in C) konvergente Teilfolge.

Beweis. Sei (an)n∈N eine beschrankte Folge, an ∈ C. Dann sind auch (Re an)n∈N und (Im an)n∈Nbeschrankt. Es gibt somit eine streng monotone Abbildung f1 : N −→ N, so dass (Re af1(n))n∈Nkonvergiert. Da auch (Im af1(n))n∈N beschrankt ist, gibt es eine streng monotone Abbildungf2 : N −→ N, so dass auch (Im af1◦f2(n))n∈N konvergiert. Wir folgern, dass (af1◦f2(n))n∈N inC konvergiert.

1.6. Cauchy-Folgen. In diesem Unterabschnitt sei K = C oder sei K ein archimedischgeordneter Korper (z.B. K = R oder K = Q).

Betragsfunktion | · | : K → R, x 7→ |x|.

Definition 1.37. Eine K-wertige Folge (aj)i∈N heißt K-wertige Cauchy-Folge, falls

∀ε ∈ R>0 : ∃j0 ∈ N : ∀j, k ∈ N≥j0 : |aj − ak| ≤ ε.

SATZ 1.38. Jede konvergente Folge ist eine Cauchy-Folge.

Beweis. Es gelte limj→∞ aj = a. Das heißt: fur alle ε ∈ R>0 gibt es ein j0 ∈ N, so dass fur allenaturlichen Zahlen j ≥ j0 gilt: |aj − a| ≤ ε.

Fur solch ein ε und ein passendes j0 nehmen wir nun naturliche Zahlen j ≥ j0 und k ≥ j0 undrechnen nach:

|aj − ak| ≤ |aj − a|+ |a− ak| ≤ ε+ ε = 2ε.

Wir haben nun also gezeigt:

∀ε ∈ R>0 : ∃j0 ∈ N : ∀j, k ∈ N≥j0 : |aj − ak| ≤ 2ε.

Wegen Lemma 1.11 ist dies aquivalent zur definierenden Eigenschaft einer Cauchy-Folge.

LEMMA 1.39. Jede Cauchy-Folge ist beschrankt.


Beweis. Sei (aj)j∈N eine Cauchy-Folge. Wir wahlen zu ε := 1 ein passendes j0 wie in Definiti-on 1.37. Es gilt somit fur alle j ∈ N mit j ≥ j0:

|aj | ≤ |aj − aj0 |+ |aj0 | ≤ |aj0 |+ 1.

Nun setzen wirr := max{|a0|, |a1|, . . . , |aj0−1|, |aj0 |+ 1}.

Dann gilt fur alle j ∈ N: |aj | ≤ r. Somit ist (aj)j∈N beschrankt.

Definition 1.40. Sei K = C oder ein archimedisch geordneter Korper. Wir nennen K vollstandig ,wenn jede K-wertige Cauchy-Folge in K konvergiert.

SATZ 1.41. Sei K = C oder sei K ein archimedisch geordneter Korper, in dem jede beschrankteFolge einen Haufungspunkt besitzt. Dann ist K vollstandig. Insbesondere sind R und C vollstandig.

Beweis. Sei (aj)j∈N eine K-wertige Cauchy-Folge. Nach Lemma 1.39 ist die Folge beschrankt undbesitzt deswegen aufgrund der Annahmen im Satz eine konvergente Teilfolge (af(n))n∈N, der Limesdieser Teilfolge sei a ∈ K. Zu gegebenem ε ∈ R>0 bestimmen wir nun ein n0 ∈ N, so dass

∀n ∈ N≥n0 : |af(n) − a| ≤ ε .Wir bestimmen zudem ein j0 ∈ N, so dass

∀j, k ∈ N≥j0 : |aj − ak| ≤ ε.Wir wahlen nun ein n ∈ N≥n0

mit f(n) ≥ j0. (Eine mogliche Wahl ist n := max{j0, n0}, denndann gilt f(n) ≥ n ≥ j0.) Fur j ≥ j0 erhalten wir

|aj − a| ≤ |aj − af(n)|+ |af(n) − a| ≤ 2ε .

Mit Lemma 1.11 folgt a = limj→∞ aj .

Bemerkung 1.42. Man kann zeigen: Ist K ein vollstandiger archimedisch geordneter Korper, soerfullt er die Supremums-Eigenschaft. Somit sind fur einen archimedisch geordneten Korper diefolgenden Eigenschaften aquivalent:

(1) K erfullt die Supremums-Eigenschaft(2) Jede beschrankte Folge besitzt einen Haufungspunkt (Bolzano-Weierstraß-Eigenschaft)(3) K ist vollstandig(4) K ist isomorph zu R

Beispiel 1.43. Wir konstruieren rekursiv eine Q-wertige Folge (vergleiche Zentralubung)

a0 := 2, an+1 =1

2

(an +

2

an

).

In R – das heißt, wenn wir sie als R-wertige Folge interpretieren – konvergiert diese Folge gegen√2 6∈ Q. Deswegen ist sie eine Cauchy-Folge in R und in Q.

Andererseits konvergiert sie nicht in Q, denn wenn sie in Q gegen a ∈ Q konvergieren wurde,so hatte sie in R auch a 6=

√2 als Grenzwert, was nicht moglich ist. Deswegen konvergiert diese

Cauchy-Folge nicht in Q.

2. REIHEN 91

Cauchy-Folgen sind wichtig, denn man kann hiermit die Konvergenz von Folgen zeigen, ohne denGrenzwert im voraus angeben zu mussen.

2. Reihen

2.1. Motivation von Reihen: Dezimal-Darstellung reeller Zahlen. Notationen.

Eine Dezimal-Darstellung einer positiven reellen Zahl x ist gegeben durch eine Zahl ` ∈ Z undeiner Abbildung

Z≥` → {0, 1, 2 . . . , 9}, n 7→ an.

Wir erhalten hieraus die reelle Zahl

x =

∞∑n=`

10−n · an.

Nun sind mehrere Punkte ungeklart:

• Was ist solch eine unendliche Summe? (Siehe Abschnitt 2.2)• Hat jede positive reelle Zahl eine Dezimal-Darstellung?• Wenn ja, ist sie eindeutig?

Sobald dies geklart ist, kann man”schreiben“, falls ` ≤ 0:

x = a`a`+1 . . . a0, a1a2 . . .

bzw. falls ` > 0:x = 0, 0 . . . , 0︸︷︷︸

`−1 mal

a`a`+1 . . . . . .

Wir sagen:(an)n∈Z≥` ist eine Dezimal-Darstellung von x .

Beispiele 2.1.

(1)1

7= 0, 142857142857 . . . = 0, 142857

1

13= 0, 076923

1

17= 0, 0588235294117647

1

28= 0, 03571428

3, 14159265 . . .

(2) Die Dezimal-Darstellung ist periodisch, genau dann wenn die dadurch beschriebene zu-gehorige reelle Zahl eine rationale Zahl ist.


Problem: Man kann im allgemeinen nicht alle Ziffern hinschreiben, da es ja unendlich viele sind.

UBUNG 2.2. Gegeben sei die Dezimal-Darstellung (an)n∈Z einer positiven rationalen Zahl pq ,

p, q ∈ N teilerfremd. Wir zerlegen

q = 2a5bqc11 · · · qcrrwobei 2, 5q1, . . . , qr verschiedene Primzahlen sind, a, b, c1, . . . , cr ∈ N. Dann teilt die Periodenlange

die Zahl∏rj=1(qj−1)q

cj−1j . Die Zahl der Ziffern zwischen dem Komma und dem Beginn der Periode

ist max{a, b}.

Im Fall r = 1 kann man dies mit Schulwissens beweisen. Einen Beweis erhalt man (im Fall r = 1)eigentlich schon, wenn man sich genau anschaut, wie man in der 4. Klasse das Dividieren lernt. Fureinen systematischeren Beweis, der auch r > 1 abdeckt, sind Kongruenzen hilfreich. Ein Web-Linkhierzu ist auch

http://m.schuelerlexikon.de/mobile mathematik/Endliche und periodische Dezimalbrueche.htm

Im aktuellen Abschnitt wollen wir nun solche unendlichen Summen einfuhren. Man benutzt aberdas Wort

”Reihe“ an Stelle des Wortes

”Unendliche Summe“.

Bemerkung 2.3. (a) Jede Dezimal-Darstellung”beschreibt“ eine reelle Zahl.

(b) Jede positive reelle Zahl besitzt eine Dezimal-Darstellung.(c) Die Dezimal-Darstellung ist nicht eindeutig. Sind (an)n∈Z≥` , a` 6= 0, und (bn)n∈Z≥k , bk 6=

0, verschiedene Dezimal-Darstellungen derselben positiven Zahl, so hat mindestens eine derbeiden Darstellungen eine Periode 9.

Zu (a): Im nachsten Abschnitt wird klar werden, was hier mit”beschreibt“ gemeint ist, namlich

der Grenzwert einer konvergenten Reihe. Die Aussage wird auch im nachsten Abschnitt gezeigt.

Zu (b) und (c): Dies sollte nach dem nachsten Abschnitt jeder als Ubungsaufgabe beweisen konnen.Tipp zu (b): Zunachst mal uberlegt man sich zu einer gegebenen reellen Zahl x, wie eine Dezimal-darstellung aussehen muss, wenn sie existiert. Danach uberlegt man sich, dass diese Darstellungtatsachlich die gegebene Zahl x beschreibt. Man muss hier u.a. die Supremums-Eigenschaft von Rnutzen.

Beispiele 2.4.

(1) 0, 9 und 1, 0 sind Dezimal-Darstellungen von 1(2) Jede positive reelle Zahle hat also eine eindeutige Periode-9-freie Dezimal-Darstellung.

In der Zentralubung wurde bereits das folgende gezeigt:

PROPOSITION 2.5. Es gibt keine surjektive Abbildung von N nach R.

Beweis. Angenommen es gibt eine surjektive Abbildung f : N −→ R.

http://m.schuelerlexikon.de/mobile_mathematik/Endliche_und_periodische_Dezimalbrueche.htm

2. REIHEN 93

Fur k ∈ N schreiben f(k) als Dezimalzahl

f(k) = ±ak`k . . . ak0 , a

k1ak2 . . .

O.B.d.A. konnen wir annehmen, dass j(k) keine Periode 9 hat. Wir definieren h : {0, 1, . . . , 9} −→{0, 1, . . . , 9} durch

h(m) :=

{1 fur m = 2

2 fur m 6= 2

Also h(m) 6∈ {m, 9, 0}. Fur k ∈ N setze nun bk := h(akk), und dann

x := 0, b1b2b3 . . .

Nun ist x 6= f(k), den die beiden reellen Zahlen haben in ihrer Periode-9-freien Darstellung eineverschiedene Ziffer an der k-ten Stelle. Also gilt x 6∈ B(f) = f#(N). Somit ist f gar nicht surjektiv,entgegen der Annahme. Mi 12.12.

2.2. Definition und elementare Eigenschaften. Ziel: Definiere∑∞j=0 aj

Alle Folgen in diesem Abschnitt sind Folgen in K = R oder K = C. In anderen Worten es sindR-wertige oder C-wertige Folgen. Der Fall Q-wertiger Folgen ist naturlich damit auch abgedeckt,da Q ⊂ R, wir diskutieren aber nicht die Konvergenz in Q, sondern nur die Konvergenz in R.

Beachte im folgenden: eine Folge (an)n∈N ist genau dann eine Nullfolge, wenn (|an|)n∈N eine Null-folge ist.

Definition 2.6. Sei (aj)j∈N eine Folge in K. Wir definieren die n-te Teilsumme oder Partialsummeals

sn :=

n∑j=0

aj .

Die Folge (sn)n∈N nennt man dann (unendliche) Reihe mit den Summanden aj . Man schreibt eineReihe in der Form

∞∑j=0

aj .

Falls die Folge der Partialsummen (sn)n∈N konvergiert, so sagen wir die Reihe konvergiert undman definiert

∞∑j=0

aj := limn→∞

sn.

Die Reihe divergiert, wenn die Folge der Partialsummen divergiert. Bei Folgen in R definiert mananalog die uneigentliche Konvergenz.

Wir erlauben auch, dass Reihen nicht bei 0, sondern bei einer beliebigen anderen ganzen Zahl k0

beginnen und schreiben dann eben∑∞j=k0

aj .


!ACHTUNG!.∑∞j=1 aj hat zwei Bedeutungen:

1.) die Folge der Partialsummen. Dann ist∑∞j=0 aj ∈ Abb(N,K)

2.) der Limes dieser Folge (falls er existiert). Dann ist∑∞j=0 aj ∈ K

Welche Bedeutung gemeint ist, wird immer aus dem Kontext heraus deutlich. Wenn man sagt”die

Reihe∑∞j=1 aj konvergiert oder divergiert in K“, dann ist immer die Folge der Partialsummen

gemeint. Wenn man 5 =∑∞j=1 aj schreibt, dann ist der Limes der Folge der Partialsummen gemeint

(und es ist dann implizit klar, dass wir fordern, dass dieser dann existieren muss). Um diesenUnterschied deutlicher zu machen, schreiben wir in den nachsten Zeilen aus didaktischen Grunden1.) die Folge der Partialsummen immer in dieser Farbe2.) den Limes dieser Folge immer in dieser Farbe

∞∑j=1

aj konvergent

⇐⇒ ∃s ∈ K : ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0:∣∣∣( n∑j=1

aj)− s∣∣∣ ≤ ε

⇐⇒ ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0: ∀m ∈ N≥n :

∣∣∣ m∑j=n+1

aj

∣∣∣ ≤ ε (Cauchy-Kriterium)

8

Jede Folge kann realisiert werden als Folge von Partialsummen. Denn sei (sn)n∈N gegeben. Definieredann a0 := s0 und fur n ≥ 1: an = sn − sn−1. Dann ist sn die n-te Partialsumme von (an)n∈N.

Beispiele 2.7.

(a) Konvergente geometrische Reihe:∑∞r=0 z

r = 11−z fur |z| < 1.

Denn wir rechnen:

(z0 + z1 + z2 + · · ·+ zn︸︷︷︸sn=

)(1− z) = 1− zn+1,

Nun ist (zn+1)n∈N eine Nullfolge, da (|z|n+1)n∈N ebenfalls eine Nullfolge ist.(b) Divergente geometrische Reihe:

∑∞r=0 z

r divergiert fur |z| ≥ 1: siehe unten (Prop. 2.8) undbeachte, dass (zr)r∈N keine Nullfolge ist.

(c) Die harmonische Reihe∑∞r=1

1r divergiert:

Dieser Teil ist noch nicht gesetzt.

(d)∑∞r=1

1r2 konvergiert:

Dieser Teil ist noch nicht gesetzt.

PROPOSITION 2.8. Wenn∑∞j=0 aj konvergiert, dann ist (aj)j∈N eine Nullfolge.

8Hier gilt die Konvention∑nj=n+1 aj = 0

2. REIHEN 95

Beweis. Sei s =∑∞j=0 aj . Dann gilt

an =

n∑j=0

aj −n−1∑j=0

aj → s− s = 0 fur n→∞.

Die Umkehrung dieser Aussage ist falsch: Die Reihe∑∞r=1

1r divergiert, aber ( 1

r )r∈Nr{0} ist Null-folge.

EIGENSCHAFTEN 2.9.

(a) Wenn∑∞j=0 aj und

∑∞j=0 bj konvergieren, dann gilt

∞∑j=0

(aj ± bj) =

∞∑j=0

aj ±∞∑j=0

bj .

(b) In einer konvergenten Reihe durfen Klammern gesetzt werden (Ubergang zu einer Teilfolge derPartialsummen). Man darf im allgemeinen Klammern nicht weglassen:1 − 1 + 1 − 1 + 1 · · · divergiert, aber (1 − 1) + (1 − 1) + (1 − 1) · · · konvergiert gegen 0 und1 + (−1 + 1) + (−1 + 1) · · · konvergiert gegen 1.

(c) Es gelte fur alle r ∈ N: ar ∈ R≥0. Dann ist (sn)n∈N monoton wachsend. Also ist nach Propo-sition 1.15

∑∞r=0 ar genau dann konvergent in K, wenn (sn)n∈N beschrankt ist.

2.3. Konvergenzkriterien.

Einige vereinfachende Notationen

Um in Zukunft uber Folgen und Reihen effizienter sprechen zu konnen, fuhren wir noch einigeNotationen ein.

Definition 2.10. Sei A( · ) eine auf N definierte Aussageform.

Fur fast alle j ∈ N gilt A(j)

:⇐⇒ Es gibt ein j0 ∈ N, so dass fur alle j ∈ N≥j0 : A(j)

⇐⇒ Die Menge {j ∈ N | ¬A(j)} ist endlich

Beispiel:

limj→∞

aj = a

⇐⇒ Fur alle ε ∈ R>0 gilt fur fast alle j ∈ N: |aj − a| ≤ ε6⇐⇒ Fur fast alle j ∈ N gilt fur alle ε ∈ R>0: |aj − a| ≤ ε

Die Bedingung der letzten Zeile ist genau dann erfullt, wenn die Folge (aj)j∈N nach endlich vielenpotentiellen Ausnahmen konstant gleich a ist. Solche Folgen konvergieren zwar gegen a, aber esgibt viel mehr Folgen, die gegen a konvergieren.


Notation:Da wir immer wieder Ausdrucke der Art

∀j ∈ N≥j0 : A(j)

haben, schreiben wir hierfur kurz

∀j ∈ {j0, j0 + 1, . . .} : A(j).

PROPOSITION 2.11 (Majoranten-Kriterium). Sei (ar)r∈N eine Folge in R oder C und (br)r∈Neine Folge in R≥0, so dass fur fast alle r ∈ N: |ar| ≤ br. Konvergiert

∑∞r=0 br, dann auch

∑∞r=0 ar.

Man nennt in diesem Fall∑∞r=0 br eine konvergente Majorante.

Beweis. Fur alle ε ∈ R>0 existiert n0 ∈ N so dass fur alle n ∈ {n0, n0 + 1, . . .}:

|an+1 + · · ·+ am| ≤ |an+1|+ · · ·+ |am| ≤ bn+1 + · · ·+ bm ≤ ε.

Das Majoranten-Kriterium liefert sofort: Divergiert∑∞r=0 ar, so divergiert auch

∑∞r=0 br. In die-

sem Fall gilt dann:∑∞r=0 br = ∞ (uneigentliche Konvergenz), da die Folge der Partialsummen

(∑nr=0 br)n∈N monoton wachsend ist.

Beispiele 2.12. (a)∑∞r=1

1rk

konvergiert fur k ≥ 2, denn∑∞r=1

1r2 ist eine konvergente Majorante.

(b)∑∞r=1

1√r

divergiert, denn es ist eine Majorante von∑∞r=1

1r .

(c)∑∞r=1

1r! konvergiert, weil

∑∞r=2

1(r−1)2 =

∑∞k=1

1k2 eine konvergente Majorante von

∑∞r=2

1r!

ist.

LEMMA 2.13. Sei (bj)j∈N eine Folge in R.

(i) lim infj→∞ bj > 1 genau dann, wenn es ein q ∈ R , q > 1, gibt, so dass fur fast alle j ∈ N:bj ≥ q.

(ii) lim supj→∞ bj < 1 genau dann, wenn es ein q ∈ R, q < 1 gibt, so dass fur fast alle j ∈ N:bj ≤ q.

Beweis. Zu (i) =⇒:

cn := inf{bj | j ≥ n}.cn monoton wachsend, c := limn→∞ cn = lim infj→∞ bj > 1.

q :=c+ 1

2.

Somit gilt fur fast alle n ∈ N: cn > q. Also fur fast alle j ∈ N: bj > q.

Hieraus folgt die Aussage”=⇒“ fur den Limes inferior.Fr 14.12.

Zu (i) ⇐=: Sei wieder

cn := inf{bj | j ≥ n}.

2. REIHEN 97

Gegeben sei q ∈ R>1, so dass fur fast alle j ∈ N gilt: bj ≥ q. In anderen Worten: es gibt ein j0 ∈ N,so dass fur j ∈ N≥j0 : bj ≥ q. Somit

q ≤ cj0 ≤ lim infj→∞

bj .

Zu (ii): Die Aussagen fur den Limes superior zeigt man ganz analog.

Die Ausdrucke limn→∞ an, lim infn→∞ an und lim supn→∞ an ergeben immer noch Sinn, wenn angar nicht mehr fur alle n ∈ N, sondern nur noch fur fast alle n ∈ N definiert ist.

PROPOSITION 2.14 (Quotienten-Kriterium). Sei∑∞j=0 aj eine Reihe in R oder in C, so dass

fur fast alle j ∈ N: aj 6= 0.

(a) Gilt lim supj→∞

∣∣∣aj+1

aj

∣∣∣ < 1 dann konvergiert∑∞j=0 aj.

(b) Gilt lim infj→∞

∣∣∣aj+1

aj

∣∣∣ > 1, dann divergiert∑∞j=0 aj.

Beweis. Zu (a): Lemma 2.13 liefert uns ein j0 ∈ N und q < 1, so dass gilt:

∀j ∈ N≥j0 : aj 6= 0 und ∀j ∈ N≥j0 :

∣∣∣∣aj+1

aj

∣∣∣∣ ≤ q.Dann zeigt man durch Induktion fur n ∈ N≥j0 : |an| ≤ qn−j0 |aj0 |. Somit ist

∑∞n=0 q

n−j0 |aj0 | einekonvergente Majorante von

∑∞j=0 aj und deswegen ist

∑∞j=0 aj konvergent.

Zu (b): Man geht ahnlich vor wie oben und erhalt |an| ≥ qn−j0 |aj0 | fur q > 1. Daraus folgt, dass(|an|)n∈N keine Nullfolge ist, damit auch nicht (an)n∈N und somit divergiert die Reihe

∑∞n=0 an.

Beispiel 2.15. Sei t = pq ∈ Q, p ∈ Z, q ∈ Nr {0}. Definiere fur r ∈ R≥0:

rt := ( q√r)p

Sei x ∈ C. 9 Betrachte die Reihe∑∞n=0 an fur an = ntxn. Fur n ≥ 1:

an+1

an=

(n+ 1

n

)t· x

1 ≤(n+ 1

n

)t=

(q

√1 +

1

n

)p(∗)≤(

1 +1

n

)p→ 1

fur n→∞, wobei wir in (∗) genutzt haben, dass fur s ≥ 1 gilt: 1 ≤ q√s ≤ s und somit q

√sp ≤ sp.

Wir erhalten dann

limn→∞

∣∣∣∣an+1

an

∣∣∣∣ = |x| limn→∞

(n+ 1

n

)t= |x|

Also ist∑∞n=0 n

txn konvergent fur |x| < 1; und∑∞n=0 n

txn ist divergent fur |x| > 1.

9Wir beschranken uns hier auf rationale t, da wir rt noch nicht fur beliebige reelle t definiert haben.


PROPOSITION 2.16 (Wurzel-Kriterium). Sei (ar)r∈N eine Folge. 10

(a) Wenn lim supr→∞r√|ar| < 1, dann konvergiert

∑∞r=0 ar.

(b) Gilt fur unendlich viele r ∈ N: r√|ar| ≥ 1, dann ist

∑∞r=0 ar divergent.

(c) Wenn lim supr→∞r√|ar| > 1, dann ist

∑∞r=0 ar divergent.

Beweis. Zu (a): Unter Benutzung des Lemmas 2.13 gilt fur ein geeignetes q und fast alle r ∈ Nr√|ar| ≤ q < 1.

Also |ar| ≤ qr. Also ist∑∞r=0 q

r eine konvergente Majorante von∑∞r=0 ar.

Zu (b): r√|ar| ≥ 1 ⇐⇒ |ar| ≥ 1. Gilt dies fur unendlich viele r, dann ist (ar)r∈N keine

Nullfolge, also kann∑∞r=0 ar nicht konvergent sein.

Zu (c): Im Fall lim supr→∞r√|ar| > 1 gibt es eine Teilfolge (af(n))n∈N so dass limn→∞ n

√|af(n)| =

lim supr→∞r√|ar| > 1. Es gilt dann n

√|af(n)| > 1 fur fast alle n ∈ N. Also gibt es unendlich viele

r ∈ N mit |ar| > 1.

Beispiele 2.17. Eine Reihe der Form∑∞r=0 arx

r nennt man eine Potenzreihe in x.

(a) Sei x ∈ R≥0 und ar ≥ 0 11

∞∑r=0

arxr

lim supr→∞

r√arxr = x lim sup

r→∞r√ar, falls x 6= 0

lim supr→∞

r√arxr =∞ =⇒ ∀x ∈ R>0 :

∞∑r=0

arxr divergiert

0 < lim supr→∞

r√arxr <∞ =⇒ ∀x ∈

0,1

lim supr→∞

r√ar

:

∞∑r=0

arxr konvergiert

∀x ∈

1

lim supr→∞

r√ar,∞

:

∞∑r=0

arxr divergiert

lim supr→∞

r√arxr = 0 =⇒ ∀x ∈ R≥0 :

∞∑r=0

arxr konvergiert

10In der folgenden Formel ist r√|ar| < 1 fur r = 0 nicht definiert. Dies stort uns nicht, da die Folge nur fur fast

alle r ∈ N definiert zu sein braucht, damit wir den Limes superior definieren konnen.11Wdh: Fur x ∈ C definieren wir x ≥ 0 als: x ∈ R und x ≥ 0. Es ist hier im Text also implizit die Information

enthalten, dass x ∈ R und ar ∈ R.

2. REIHEN 99

Wir definieren

ρ :=

1

lim supr→∞

r√ar

falls lim supr→∞

r√ar ∈ R>0

0 falls lim supr→∞

r√ar =∞

∞ falls lim supr→∞

r√ar = 0∑∞

r=0 arxr konvergiert fur x < ρ und divergiert fur x > ρ.

ρ heißt Konvergenzradius der Potenzreihe.

x

0 ρ

Konvergenz Divergenz

Abbildung 5:

(b) Sei nun x ∈ C und ai ∈ C. Wir definieren dann

ρ :=

1

lim supr→∞

r√|ar|

falls lim supr→∞

r√|ar| ∈ R>0

0 falls lim supr→∞

r√|ar| =∞

∞ falls lim supr→∞

r√|ar| = 0

Dann konvergiert∑∞r=0 arx

r im Fall |x| < ρ und divergiert im Fall |x| > ρ.Die Begrundung kann man vollig analog zu Beispiel (a) fuhren, wenn man |x| an Stelle

von x und |ar| an Stelle von ar schreibt. Alternativ kann die Konvergenz auch aus (a) mitdem Majoranten-Kriterium gezeigt werden.

(c) Fur |x| = ρ kann keine Aussage getroffen werden. Die Potenzreihen∑∞r=0 rx

r und∑∞r=1

1r2x

r

besitzen beide Konvergenzradius 1, denn limr→∞

r√r = 1 und lim

r→∞r√r−2 = ( lim

r→∞r√r)−2 = 1.

(Details hier12) Nun ist die Reihe∑∞r=0 rx

r fur x ∈ C, |x| = 1 offensichtlich divergent. Wirhaben gesehen, dass fur x = 1 die Reihe

∑∞r=1

1r2x

r konvergiert (Beispiel 2.7 (d)), und aufGrund des Majoranten-Kriteriums konvergiert diese Reihe dann fur alle x ∈ C mit |x| = 1.

LEMMA 2.18. Sei ar ∈ Cr {0}. Dann gilt

lim supn→∞

n√|an| ≤ lim sup

n→∞

|an+1||an|

.

12Wir wollen zeigen, dass limr→∞

r√r = 1. Hierzu ist zu zeigen, dass xr := r

√r− 1 eine Nullfolge ist. Man rechnet

nun mit der binomischen Formel nach, dass (xr + 1)r︸︷︷︸r=

≥ r(r−1)2

x2r. Also 0 ≤ x2r ≤ 2/(r − 1).


Beweis. Sei α := lim supn→∞|an+1||an| . Fixiere ein β > α. Es gilt also13 fur fast alle n ∈ N:

(2.19)|an+1||an|

≤ β.

Bestimme also ein n0 ∈ N, so dass fur alle n ∈ N≥n0die Ungleichung (2.19) gilt.

|an| ≤ βn−n0 |an0|

n√|an| ≤ n

√βn︸︷︷︸

β=

n√β−n0 |an0

|︸︷︷︸→1

Wr haben genutzt, dass fur jedes s ∈ R>0 die Aussage limn→∞n√s = 1 gilt. 14 Daraus folgt also

lim supn→∞

n√|an| ≤ β.

Da dies fur alle β > α gilt, folgt die Aussage.

Bemerkung 2.20. Die Konvergenzaussage im Wurzel-Kriterium (Prop. 2.16 (a)) ist also starkerals die Konvergenzaussage im Quotienten-Kriterium (Prop. 2.3 (a)), denn es zeigt dieselbe Aussagemit einer schwacheren Voraussetzung.

Mi 19.12.

2.4. Absolute Konvergenz.

Definition 2.21 (Absolute Konvergenz). Seien ar ∈ C. Wir sagen die Reihe∑∞r=0 ar konvergiert

absolut , falls∑∞r=0 |ar| konvergiert.

Das Majoranten-Kriterium fur br := |ar| impliziert also: Jede absolut konvergente Reihe ist kon-vergent.

Majoranten-Kriterium, Quotienten-Kriterium und Wurzel-Kriterium liefern nicht nur die Konver-genz einer Reihe, sondern sogar ihre absolute Konvergenz, siehe unten.15 Insbesondere ist einePotenzreihe

∑∞n=0 anx

n absolut konvergent, wenn |x| kleiner als der Konvergenzradius ist.

PROPOSITION 2.22 (Majoranten-Kriterium mit absoluter Konvergenz). Sei (ar)r∈N eine Folge16

und (br)r∈N eine Folge in R≥0, so dass fur fast alle r ∈ N: |ar| ≤ br. Konvergiert∑∞r=0 br, dann

ist∑∞r=0 ar absolut konvergent.

PROPOSITION 2.23 (Quotienten-Kriterium mit absoluter Konvergenz). Sei∑∞j=0 aj eine Reihe,

so dass fur fast alle j ∈ N: aj 6= 0.

13eine Moglichkeit, dies zu sehen, ist Lemma 2.13 (ii) fur bj =|aj+1|α|aj |

anzuwenden.

14Beweis fur s > 1: s = ( n√s)n = ( n

√s− 1 + 1)n =

∑nj=0

(n

j

)( n√s− 1)j1n−j ≥ n( n

√s− 1). Somit 1 ≤ n

√s ≤

1 + 1n

. Im Fall s < 1 wissen wir deswegen n√

1/s→ 1 und somit konvergiert n√s = 1

n√

1/sauch gegen 1.

15Die Beweise sind wortwortlich gleich16Wenn wir nichts anderes hinschreiben, ist unter einer Folge immer eine Folge in C gemeint, und eine Folge

in R ist auch eine Folge in C.

2. REIHEN 101

(a) Gilt lim supj→∞

∣∣∣aj+1

aj

∣∣∣ < 1, dann konvergiert∑∞j=0 aj absolut.

(b) wie zuvor.

PROPOSITION 2.24 (Wurzel-Kriterium mit absoluter Konvergenz). Sei (ar)r∈N eine Folge.

(a) Wenn lim supr→∞r√|ar| < 1, dann konvergiert

∑∞r=0 ar absolut.

(b) und (c) wie zuvor.

2.5. Alternierende Reihen.

Definition 2.25. Eine alternierende Reihe ist eine Reihe in der Form∞∑n=0

(−1)nan

oder17

∞∑n=0

(−1)n+1an,

wobei ∀n ∈ N : an ∈ R≥0.

PROPOSITION 2.26 (Regel von Leibniz). Sei (an)n∈N eine monoton fallende Nullfolge, an ≥ 0.Dann konvergiert die Reihe

∞∑n=0

(−1)nan.

Beweis. Gegeben seien naturliche Zahlen m,n, n0 mit m ≥ n ≥ n0.

Idee (noch nicht prazise):Um das Cauchy-Kriterium anzuwenden, wollen wir

(−1)n+1an+1 + (−1)n+2an+2 + · · ·+ (−1)mam

kontrollieren.

Prazise Ausfuhrung der Idee:

an+1 + (−1)an+2 + · · ·+ (−1)m−n+1am

=

(an+1 − an+2)︸︷︷︸

≥0

+ · · ·+ (am−1 − am)︸︷︷︸≥0

≥ 0 falls m− n gerade

(an+1 − an+2)︸︷︷︸≥0

+ · · ·+ am︸︷︷︸≥0

≥ 0 falls m− n ungerade

17Wir betrachten ab jetzt immer nur den ersten Fall, um die Notation einfach zu halten


an+1 + (−1)an+2 + · · ·+ (−1)m−n+1am

=

an+1 +

≤0︷︸︸︷((−1)an+2 + an+3) + · · ·+

≤0︷︸︸︷(−1)am

≤ an+1 falls m− n gerade

an+1 +

≤0︷︸︸︷((−1)an+2) + an+3) + · · ·+

≤0︷︸︸︷((−1)am−1 + am)

≤ an+1 falls m− n ungerade

Also

|m∑

k=n+1

(−1)kak| = |(−1)n+1an+1 + (−1)n+2an+2 + · · ·+ (−1)mam| ≤ |an+1|.

Da (an) eine Nullfolge ist, haben wir gezeigt:

∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0: ∀m ∈ N≥n : |

m∑k=n+1

(−1)kak| ≤ ε.

Beispiele 2.27.

(a) Die harmonische alternierende Reihe

∞∑n=1

(−1)n+1 1

n

konvergiert.(b) Die Reihe

∑∞n=1(−1)nan mit

an :=

{1n fur n gerade1n2 fur n ungerade

divergiert. Denn sei

α :=

∞∑k=0

1

(2k + 1)2.

(Anschaulich ist α die unendliche Summe der an uber alle ungeraden n.)Dann gilt

2r∑n=1

an ≥ (

r∑k=1

1

2r)− α

und dies konvergiert uneigentlich gegen ∞ fur r →∞, da die harmonische Reihe konvergiert.

2. REIHEN 103

2.6. Umordnung von Reihen.

Definition 2.28. Sei∑∞n=0 an eine Reihe. Ein Umordnung dieser Reihe ist eine Reihe der Form∑∞

n=0 af(n), wobei f : N −→ N eine Bijektion ist.

SATZ 2.29 (Umordnungssatz). Ist∑∞n=0 an eine absolut konvergente Reihe in R oder C, so ist

jede Umordnung∑∞n=0 af(n) dieser Reihe ebenfalls absolut konvergent und es gilt

∞∑n=0

an =

∞∑n=0

af(n).

Beweis spater.

SATZ 2.30 (Riemannsche Umordnungssatz). Ist∑∞n=0 an eine konvergente Reihe in R, die nicht

absolut konvergiert.

(1) Sei α ∈ R gegeben. Dann gibt es eine Umordnung dieser Reihe, die gegen α eigentlich oderuneigentlich konvergiert.

(2) Es gibt eine Umordnung, die beschrankt und divergent ist.

Beispiel 2.31. Die Folge∑∞n=1(−1)n 1

n ist konvergent, aber nicht absolut konvergent. Zu jedem

α ∈ R gibt es eine Umordnung von∑∞n=1(−1)n 1

n , die gegen α konvergiert.

Beweis von Satz 2.29. Sei∑∞n=0 an absolut konvergent. Dies bedeutet nach dem Cauchy-Kriterium:

Zu jedem ε ∈ R>0 gibt es ein n0 ∈ N, so dass fur alle n, n ∈ N mit n0 ≤ n ≤ n gilt18 :∑nj=n+1 |aj | ≤ ε.

Wir fixieren nun ε und ein passendes n0. Sei nun∑∞n=0 af(n) eine Umordnung dieser Reihe. Ins-

besondere sei f : N→ N als bijektiv vorausgesetzt. Wir setzen nun

m0 := max f#({0, 1, . . . , n0}) := max{f−1(0), f−1(1), . . . , f−1(n0)}.

Hier steht eine Zeichnung, die noch nicht gesetzt ist.

Dies bedeutet, fur alle ` > m0 gilt f(`) > n0. Somit gilt fur m, m ∈ N mit m0 ≤ m < m:

m∑`=m+1

|af(`)| ≤N∑

j=n0+1

|aj | ≤ ε

wobei N ∈ N eine “genugend große” naturliche Zahl ist, zum Beispiel

(2.32) N := max f#({m+ 1,m+ 2, . . . , m}) = max{f(m+ 1), f(m+ 2), . . . , f(m)} > n0

oder jede Zahl die mindestens so groß wie dieses Maximum ist. Dann ist also das Cauchy-Kriteriumfur die Reihe

∑∞n=0 |af(n)| erfullt, in anderen Worten

∑∞n=0 af(n) ist absolut konvergent.

18Ja, die Betragsstriche sind hier um den richtigen Ausdruck, denn es handelt sich um absolute Konvergenz!


Wir wissen nun also, dass die Reihen (absolut) konvergieren, und wir studieren nun deren Grenz-werte

∑∞n=0 an und

∑∞n=0 af(n). Wir wahlen zu ε ∈ R>0 passende Zahlen n0 und m0 wie oben.

Außerdem definieren wir

N0 := max{f(0), f(1), . . . , f(m0)} = max f#({0, 1, . . . ,m0}) ≥ n0.

Fur alle n, n ∈ N mit n0 ≤ n ≤ n gilt

(2.33) |n∑j=0

aj −n∑j=0

aj | = |n∑

j=n+1

aj | ≤n∑

j=n+1

|aj | ≤ ε

und dies impliziert im Limes n→∞ fur n := N0(≥ n0)

|∞∑j=0

aj −N0∑j=0

aj | ≤ ε.

Wenn wir N wie in (2.32) definieren ergibt sich analog:

|m∑`=0

af(`) −m0∑`=0

af(`)| = |m∑

`=m0+1

af(`)| ≤N∑

j=n0+1

|aj | ≤ ε

und somit im Limes m→∞

|∞∑`=0

af(`) −m0∑`=0

af(`)| ≤ ε.

AußerdemN∑j=0

aj −m0∑`=0

af(`) =∑j∈I

aj

wobei I := {0, 1, . . . , N}rf#({0, 1, . . . ,m0}).19 Nach Konstruktion vonm0 sind I und {0, 1, . . . , n0}disjunkt20. Es folgt mit (2.33)

|∑j∈I

aj | ≤∑j∈I|aj | ≤

N∑j=n0+1

|aj | ≤ ε.

Dies ergibt∣∣∣∣∣∣∞∑j=0

aj −∞∑`=0

af(`)

∣∣∣∣∣∣ ≤∣∣∣∣∣∣∞∑j=0

aj −N∑j=0

aj

∣∣∣∣∣∣︸︷︷︸≤ε

+

∣∣∣∣∣∣N∑j=0

aj −m0∑`=0

af(`)

∣∣∣∣∣∣︸︷︷︸≤ε

+

∣∣∣∣∣m0∑`=0

af(`) −∞∑`=0

af(`)

∣∣∣∣∣︸︷︷︸≤ε

≤ 3ε

19An dieser Stelle gab es in der Vorlesung gegen Vorlesungsende eine Frage: es stimmt so wie es an der Tafelstand und so wie hier im Skript.

20Denn sei j ∈ I. Dann folgt j /∈ f#({0, 1, . . . ,m0}) und somit f−1(j) > m0 und mit der Definition von m0

erhalten wir dann, j /∈ {0, 1, . . . , n0}.

2. REIHEN 105

Da diese Aussage fur alle ε ∈ R>0 gilt, sind die Grenzwerte gleich. Fr 21.12.

Beweis von Satz 2.30. Wir beweisen (1) im Fall α ∈ R. Die anderen Falle und Ausage (2) beweistman ahnlich, wir geben hierfur aus Zeitgrunden aber keine Details.

Zu (1) fur α ∈ R: Sei∑∞n=0 an eine konvergente Reihe, die nicht absolut konvergiert. Wir definieren

I+ := {n ∈ N | an ≥ 0} und I− := {n ∈ N | an < 0}.Die Mengen I+ oder I− sind unendlich. (Denn: Wenn eine endlich ware, dann ware die Reiheabsolut konvergent; Widerspruch.)

Somit existieren streng monoton wachsende Abbildungen f± : N → N, mit B(f±) = I±. Wdh:B(f+) ist das Bild von f+.

Wir setzen nun bn := af+(n), cn := af−(n).∑∞n=0 bn ist die Teilreihe der nicht-negativen Glieder, und

∑∞n=0 cn die Teilreihe der negativen

Glieder. Fur jede dieser Teilreihen gilt

beschrankt⇐⇒ konvergent⇐⇒ absolut konvergent.

Wenn genau eine dieser beiden Teilreihen nicht beschrankt ist, dann ist∑∞n=0 an nicht beschrankt,

also nicht konvergent. Widerspruch.

Wenn beide Teilreihen beschrankt sind, dann ist∑∞n=0 an absolut konvergent. Widerspruch.

Also sind beide Teilreihen unbeschrankt.

lim`→∞

∑n=0

bn =∞ lim`→∞

∑n=0

cn = −∞.

Nach Proposition 2.8 ist (an)n∈N eine Nullfolge, deswegen auch (bn)n∈N und (cn)n∈N, somit auchderen Teilfolgen (brj )j∈N und (csj )j∈N. Ohne Beschrankung der Allgemeinheit konnen wir anneh-men, dass (cn)n∈N monoton wachsend ist. (Wenn nicht, dann konnen wir dies durch Umordnenerreichen; jede R<0-wertige Nullfolge kann in eine monoton wachsende umgeordnet werden.) Ana-log konnen wir annehmen, dass die Teilfolge der positiven Summanden in (bn)n∈N monoton fallendist.21

Bestimme nun zuerst das kleinste r1 ∈ N mit

b0 + b1 + b2 + · · ·+ br1 ≥ α.

21Subtilitat: Wir konnen dies nicht fur die gesamte Folge erreichen: denn die Nullen machen Probleme. Da

(bn)n∈N unbeschrankt ist, muss es unendlich viele positive bn geben. Jede monoton fallende Nullfolge, die eineNull als Folgenglied hat, hat aber nur endlich viele positive Folgenglieder. Man lasst also die Folgenglieder, die

Null sind einfach an ihrer Position stehen. Diese Folgenglieder haben sowieso auf die Partialsumme keine Wirkung.

Didaktische Anmerkung: die Nullen sind also zum einen ziemlich unerheblich fur das Verstandnis des Beweises, aberein bisschen lastig fur die Ausformulierung, da sie Spezialfalle erzeugen; deswegen habe ich die Diskussion in der

Vorlesung nicht im Detail diskutiert.


Bestimme dann das kleinste s1 ∈ N mit

b0 + b1 + · · ·+ br1 + c0 + c1 + c2 · · ·+ cs1 < α.

Dann gilt b0+b1+· · ·+br1 +c0+c1+c2 · · ·+cs1−1 ≥ α. 22 Hieraus folgt |α−(b0+b1+· · ·+cs1)| ≤ |cs1 |

Bestimme nun das kleinste r2 ∈ N>r1 mit

b0 + b1 + · · ·+ br1 + c0 + c1 · · ·+ cs1 + br1+1 + br1+2 + · · ·+ br2 ≥ α.

Wir erhalten |α − (b0 + b1 + · · ·+ br2)| ≤ br2 .23 Wir machen so weiter24 und erhalten letztendlicheine Reihe

∞∑n=0

dn := b0 + b1 + · · ·+ br1 + c0 · · ·+ cs1 + br1+1 + · · ·+ br2 + cs1+1 + · · ·+ cs2 + · · · .

Fur j ∈ N und ` ≥ rj + sj + 1 gilt also

α+ csj ≤∑n=0

dn ≤ α+ bsj .

Deswegen gilt

α = limj→∞

(α+ csj ) = lim`→∞

∑n=0

dn︸︷︷︸∞∑n=0

dn

= limj→∞

(α+ bsj ).

Es gibt nun viele Variationen des Umordnungssatzes. Eine davon liegt der nun folgenden Multipli-kation von Reihen zu Grunde. Wenn man diese (verallgemeinerten) Umordnungen systematischerverstehen will, sollte man sich mit summierbaren Familien und dem Großen Umordnungssatz (z. B.[22, Abschnitt 6.3]) beschaftigen. Wir uberspringen aber aus Zeitgrunden diesen Aspekt und kon-zentrieren uns auf die fur uns wichtige Multiplikation.

Multiplikation von Reihen.

Definition 2.34. Seien∑∞n=0 an und

∑∞n=0 bn Reihen in R oder in C. Wenn N → N × N, n 7→

(kn, `n) bijektiv ist, so nennen wir die Reihe∑∞n=0 aknb`n eine Produktreihe von

∑∞n=0 an und∑∞

n=0 bn.

Beispiele 2.35.

(a) Eine Anordnung nach Quadraten(b) Eine Anordnung nach Diagonalen

22Im Fall s1 = 0 ist dies zu lesen als b0 + b1 + b2 + · · ·+ br1 ≥ α.23Insbesondere gilt dann br2 > 0.24Genau genommen werden nun alle rj und sj rekursiv definiert und alle Aussagen dann rekursiv gezeigt

2. REIHEN 107

SATZ 2.36 (Produktreihen). Sind∑∞n=0 an und

∑∞n=0 bn absolut konvergent, so ist jede Produkt-

reihe von∑∞n=0 an und

∑∞n=0 bn absolut konvergent und hat den Grenzwert( ∞∑

n=0

an

) ( ∞∑n=0

bn

).

Beweis.1.) pn := aknb`n , rn := max{k0, k1, . . . , kn}, tn := max{`0, `1, . . . , `n} Dann gilt fur alle n ∈ N

|p0|+ |p1|+ · · ·+ |pn| ≤

rn∑j=0

|aj |

tn∑j=0

|bj |

≤

∞∑j=0

|aj |

∞∑j=0

|bj |

Somit sind die Partialsummen der Reihe

∑∞n=0 |pn| beschrankt, sie bilden also eine beschrankte

monoton wachsende Folge, die somit konvergiert.

Wir haben somit gesehen, dass alle Produktreihen absolut konvergieren.

2.) Wir betrachten nun zunachst den Spezialfall, dass die Produktreihe nach Quadraten geordnetist.

Dann erhalten wir

p0 + p1 + · · ·+ pn2−1 =

n−1∑j=0

aj

︸︷︷︸→

∑∞j=0 aj

n−1∑j=0

bj

︸︷︷︸→

∑∞j=0 bj

.

Wir haben somit eine Teilfolge der Partialsummen, die gegen( ∞∑n=0

an

) ( ∞∑n=0

bn

)konvergiert. Da die Folge der Partialsummen konvergiert, konvergiert sie ebenfalls gegen diese Zahl.Die Aussage fur diese spezielle Anordnung ist somit gezeigt.

3.) Durch eine Umordnung im Sinne von Definition 2.28 kann man jede Produktreihe in einenach Quadraten angeordnete Produktreihe umformen. Deswegen ist jede Produktreihe absolutkonvergent.

Aus der Anordnung nach Diagonalen ergibt sich durch Klammersetzen25 das folgende:

25dies ist erlaubt, vergleiche Eigenschaften 2.9 (b)


KOROLLAR 2.37 (Satz vom Cauchy-Produkt). Sind∑∞n=0 an und

∑∞n=0 bn absolut konvergent,

und setzen wir

cn :=

n∑k=0

akbn−k,

dann ist auch∑∞n=0 cn absolut konvergent und

∞∑n=0

cn =

( ∞∑n=0

an

) ( ∞∑n=0

bn

).

Anwendung auf Potenzreihen:

Seien∑∞n=0 anz

n und∑∞n=0 bnz

n, Potenzreihen an, bn ∈ C mit Konvergenzradien ρa und ρb. Seiz ∈ C gegeben mit |z| < min{ρa, ρb}. Wieder cn :=

∑nk=0 akbn−k. Dann ist |z| auch kleiner als der

Konvergenzradius von∑∞n=0 cnx

n, denn wenn∑∞n=0 an|z|n und

∑∞n=0 bn|z|n konvergieren, dann

konvergiert nach dem Satz vom Cauchy-Produkt (Korollar 2.37) auch∑∞n=0 cn|z|n.

(a0 + a1z + a2z2 + · · · )(b0 + b1z + b2z

2 + · · · )= (a0b0)︸︷︷︸

c0

+ (a0b1 + a1b0)︸︷︷︸c1

z + (a0b2 + a1b1 + a2b0)︸︷︷︸c2

z2 + · · ·

Anschaulich: Man darf hier nach Potenzen in z ordnen. Alle Grenzwerte existieren und es giltGleichheit.

3. Einige durch Reihen definierte Funktionen

Sei z ∈ C. Potenzreihen definieren mehrere wichtige Funktionen:

3.1. Exponentialfunktion.

exp z :=

∞∑n=0

1

n!zn.

Diese Reihe nennt man die Exponentialreihe.

Wir bestimmen den Konvergenzradius: Wir wenden hierzu das Quotienten-Kriterium an

∣∣∣∣an+1zn+1

anzn

∣∣∣∣ =|z|n+ 1

lim supn→∞

∣∣∣∣an+1

an

∣∣∣∣ = limn→∞

|z|n+ 1

= 0 < 1

3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 109

Die Exponentialreihe konvergiert also absolut fur alle z ∈ C. Wir sagen sie konvergiert (absolut)auf C. 26 Der Konvergenzradius muss dann ρ = ∞ sein, denn angenommen wir hatten ρ < ∞,dann wurde die Reihe fur z := ρ+ 1 divergieren, was einen Widerspruch ergibt.

Wir erhalten eine Funktion27 exp : C −→ C, z 7→ exp(z), die komplexe Exponentialfunktion.

Ist z ∈ R, so ist auch exp(z) ∈ R. Wir erhalten somit eine Funktion exp : R −→ R, x 7→ expx, diereelle Exponentialfunktion. 28

PROPOSITION 3.1 (Funktionalgleichung der Exponentialfunktion). Fur alle x,w ∈ C gilt

exp(z + w) = exp z · expw

Beweis. Wir rechnen:

1

n!(z + w)n =

1

n!

n∑k=0

(nk

)zkwn−k =

n∑k=0

1

k! (n− k)!zkwn−k =

n∑k=0

1

k!zk

1

(n− k)!wn−k

Wende den Satz vom Cauchy-Produkt an fur

an :=1

n!zn und bn :=

1

n!wn und cn :=

1

n!(z + w)n.

Mi 9.1.

Spezialfall: exp(0) :=∑∞n=0 = 00 + 01 + 02 + . . . = 1

Man definiert immer 00 := 1.

Also exp 0 = 1.

Es folgt dann auch1 = exp 0 = exp(z − z) = (exp z)(exp(−z)).

Also

exp(−z) =1

exp z.

Es gilt (Ubung) limn→∞(1 + z

n

)n= ez.

Klammer-”Regel“ fur exp und die demnachst definierten Funktionen sin und cos.

26Das Wort absolut wird hier normalerweise weggelassen, denn fur jede Potenzreihe gilt: wenn sie in allen

Punkten z ∈ C konvergiert, so ist der Konvergenzradius ∞ und deswegen konvergiert sie in allen z ∈ C sogarabsolut.

27Wie gesagt: wir nutzen den Begriff”Funktion“ gleichbedeutend zum Begriff

”Abbildung“, allerdings ist es

ublich, dass Funktionen den Zielbereich R oder C haben.28Die Relation, die der reellen Exponentialfunktion unterliegt, erhalt man durch Restriktion der Relation,

die der komplexen Exponentialfunktion unterliegt. Es handelt sich also um zwei verschiedene Relationen, die gemaßunseren Definitionen im ersten Kapitel auch verschiedene Symbole haben sollte. Wir benutzen aber dennoch dasselbeSymbol exp, da dies so ublich ist und in der Praxis nur selten zu Missverstandnissen fuhrt.


Man lasst bei exp und anderen wichtigen Funktionen die sonst bei Funktionen ublichen Klammernweg. Man schreibt also exp z und nicht exp(z). Nun stellt sich die Frage, ob bei Ausdrucken in derArt exp ab und exp a+ b zuerst exp ausgefuhrt wird oder zuerst verknupft wird.

Ein Blick in die Literatur ergibt leider: das ist nicht ganz so klar geregelt, man nutzt hier eine bunteMischung spezieller Konventionen. Im allgemeinen reiht man – wenn keine Klammern stehen – aberwie folgt, wobei die oben stehenden Operationen zuerst ausgefuhrt werden:

(1) Potenzen,(2) Produkte, Vorzeichen, Quotienten29

(3) exp, sin, cos,(4) Addition und Subtraktion

Oft wird jedoch (3) vor (2) oder hinter (4) ausgefuhrt. Also lieber großzugig Klammern setzen!

exp it = exp(it)

cos 2a = cos(2a)

cos−α/2 = cos(−α/2)

exp a+ b = (exp a) + b meistens! Besser also Klammern setzen.

sin a sin b =? Nach den obigen Regeln hatten wir dann sin(a(sin b)). Das interpretiert aber niemandso. Solch ein Ausdruck wird immer als (sin a)(sin b) interpretiert.

Besser treffend ware also

(1) Potenzen,(2) Produkte mit kurzen Faktoren, Vorzeichen, Quotienten(3) exp, sin, cos,(4) Produkte mit langen Faktoren(5) Addition

Nur: was ist lang und was ist kurz? Ab wann wird exp abcdefghijklm · · · lang?

Die Verwirrung wird noch schlimmer: Da man ja fur Funktionen f : M −→M immer definiert

f2(x) := f(f(x))

wurde dann sin2 a als sin(sin(a)) zu lesen sein. Das macht aber auch niemand. Solch ein Ausdruckwird immer als (sin a)2 interpretiert.

Um das Durcheinander zu beseitigen, wurde nur eine von der Kultusminister-Konferenz eingesetzteExperten-Kommission helfen, die sich zuerst mit europaischen Instanzen zusammenschließt undnach reiflicher, mehrjahriger Diskussion eine DIN-Norm erlasst.30 Das ware Burokratismus pur.

29Quotienten werden oft als Bruch geschrieben, dann ist die Reihenfolge zumeist klar30Gibt es vielleicht sogar?


Und selbst, wenn die DIN erlassen ware, ginge es dieser Reform vielleicht nicht anders als mitder letzten Rechtschreibreform: manche Bundeslander wurden sie einfuhren, andere ablehnen. Etc.Oder es gibt sie und niemand kennt sie. 31

Und den meisten Mathematiker sind solche Diskussionen sowieso lastig.

Also: da leben wir lieber mit weniger Ordnungen und setzen ein paar Klammern mehr.

3.2. Sinus- und Kosinus-Funktion. Sei wieder i die komplexe Zahl mit i2 = −1.

Betrachte nun

exp iz =

∞∑n=0

1

n!(iz)n =

∞∑n=0

n gerade

1

n!(iz)n +

∞∑n=0

n ungerade

1

n!(iz)n

32

Wir definieren den Kosinus

cos z :=

∞∑n=0

n gerade

1

n!(iz)n =

∞∑k=0

1

(2k)!(iz)2k =

∞∑k=0

1

(2k)!(−1)kz2k = 1− 1

2z2 +

1

24z4 − · · ·

Was ist der Konvergenzradius dieser Reihe?

n gerade: | 1n! (iz)

n| ≤ 1n! |z|

n

n ungerade: 0 ≤ 1n! |z|

n

Nach dem Majoranten-Kriterium und der Konvergenz der Exponentialfunktion, konvergiert dieKosinusreihe auf ganz C. Der Konvergenzradius ist also ∞.

Wir definieren den Sinus

sin z :=1

i

∞∑n=0

n ungerade

1

n!(iz)n =

1

i

∞∑k=0

1

(2k + 1)!(iz)2k+1

=

∞∑k=0

1

(2k + 1)!(−1)kz2k+1 = z − 1

6z3 +

1

120z5 − · · ·

Der Konvergenzradius ist ebenfalls ∞.

31Vielleicht ist es sogar so?32Hier handelt es sich rechts um zwei Reihen, wo eigentlich an den ungeraden bzw. geraden Stellen n eine Null

steht. Nullen in einer Reihen haben keinen Einfluss auf den Grenzwert einer Reihe, sie konnen beliebig hinzugefugt

oder gestrichen werden. Mit dieser Interpretation ist die letzte Gleichung eine Folge von∑n=0(an+bn) =

∑n=0 an+∑

n=0 bn


exp iz = cos z + i sin z

cos(−z) = cos z

sin(−z) = − sin z

exp iz + exp(−iz)2

=cos z + i sin z + cos z − i sin z

2= cos z

exp iz − exp(−iz)2i

= sin z

Ist x reell, dann sind auch cosx und sinx reell. Dann gilt also

cosx = Re exp ix sinx = Im exp ix.

Man uberlegt sich auch leicht, dass fur jede Reihe in C gilt

∞∑n=0

an =

∞∑n=0

an, Re

∞∑n=0

an =

∞∑n=0

Re an, Im

∞∑n=0

an =

∞∑n=0

Im an .

Somit gilt fur x ∈ R:

| exp(ix)|2 = exp ix exp ix = exp ix exp(−ix) = (exp ix) (exp ix)−1 = 1

exp ix exp(−ix) = (cosx+ i sinx) · (cosx− i sinx) = (cosx)2 + (sinx)2

Also | exp(ix)|2 = cos2 x+ sin2 x = 1.

Hier nutzen wir die Schreibwweisen sin2 x := (sinx)2 und cos2 := (cosx)2.

PROPOSITION 3.2 (Additionstheoreme). Fur alle a, b ∈ C gilt

cos(a+ b) = cos a cos b− sin a sin b,

sin(a+ b) = sin a cos b+ cos a sin b.

Wir geben zunachst einen Beweis fur a, b ∈ R und dann einen fur a, b ∈ C. Der erste Beweis ist alsoaus Sichtweise des logischen Aufbaus der Vorlesung unnotig. Allerdings ist der erste Beweis vielbesser zu merken und die Additionstheoreme sind vor allem fur reelle a und b wichtig. Deswegenist der erste fur unser Verstandnis der wichtigere.


Beweis fur reelle a und b.

cos(a+ b) = Re exp i(a+ b) = Re ((exp ia)(exp ib))

= Re((cos a+ i sin a)(cos b+ i sin b)

)= cos a cos b− sin a sin b

sin(a+ b) = Im exp i(a+ b) = Im ((exp ia)(exp ib))

= Im((cos a+ i sin a)(cos b+ i sin b)

)= cos a sin b+ sin a cos b

Beweis fur alle a und b.

cos(a+ b) =exp i(a+ b) + exp(−i(a+ b))

2=

exp ia exp ib+ exp(−ia) exp(−ib)2

cos a cos b =exp ia exp ib+ exp ia exp(−ib) + exp(−ia) exp ib+ exp(−ia) exp(−ib)

4

sin a sin b =exp ia exp ib− exp ia exp(−ib)− exp(−ia) exp ib+ exp(−ia) exp(−ib)

−4

Dies ergibt die Formel fur cos(a+ b). Der Beweis der Formel fur sin(a+ b) geht vollig analog.

33

3.3. Eulersche Zahl. Die Eulersche Zahl ist

e := exp(1) =

∞∑n=0

1

n!> 1 + 1 +

1

2+

1

6= 2, 6666 . . .

Numerisch34: e = 2, 718 281 828 459 045 235 360 287 471 352 662 497 757 247 . . .

Wdh: Fur t ∈ R>0, n ∈ N, m ∈ Nr {0} ist definiert:

tn: rekursivm√t: durch Lemma 6.10 in Kapitel 2.

tn/m := m√tn.

t−n/m := 1tn/m

:

33Wir hatten gerne naturlich noch ganz andere Eigenschaften: zum Beispiel, dass sin und cos die ublichengeometrischen Eigenschaften haben, und dass sie periodisch sind, genauer dass cos(z+2π) = cos z und sin(z+2π) =sin z. Das konnen wir aber noch nicht sagen, denn wir mussen ja erst mal π definieren. Man definiert π/2 als dieerste positive Nullstelle von sin, aber wir konnen leider noch gar nicht zeigen, dass die oben definierte Funktion

uberhaupt eine positive Nullstelle beseitzt.34Dieser Wert ist hier nicht vollstandig angegeben, kann auch nicht vollstandig als Dezimalzahl angegeben

werden. Wir wollen hier nicht begrunden, wieso dies die ersten Stellen der Eulerschen Zahl sind. Wir werden diesen

Naherungswert im folgenden nie benotigen. Der Naherungswert dient allein der Anschauung und dem Vergleich zuanderer Literatur und anderen Konstanten!


LEMMA 3.3. Fur alle q ∈ Q gilteq = exp(q)

Beweis. Durch Induktion zeigt man zunachst fur alle n ∈ N und alle z ∈ C: exp(nz) = (exp z)n.Angewendet auf z := 1 ergibt dies exp(n) = exp(n · 1) = en > 0. Fur m ∈ Nr {0} gilt dann

exp(n/m) :=

∞∑j=0

1

j!

( nm

)j> 0.

Nun setzen wir z := n/m in exp(nz) = exp(z)n und erhalten

(expn/m)m = exp(mn/m) = en.

Somit ist x := exp(n/m) eine positive reelle Zahl, die xm = en erfullt. Also x = en/m. Wir habensomit die Aussage fur alle q ∈ Q>0 gezeigt. Die Aussage ist trivial fur q = 0 und folgt direkt ausder Funktionalgleichung der Exponentialfunktion (Proposition 3.1) fur q ∈ Q<0.

Definition 3.4. Fur z ∈ C definieren wir ez := exp(z).

Funktionalgleichung: ez+w = ez · ew

Bemerkung 3.5. Die Eulersche Zahl ist irrational. Sie ist sogar transzendent, d.h. ist p(x) =adx

d + · · · + a0x0, p 6≡ 0, 35 eine polynomiale Funktion mit rationalen Koeffizienten, dann gilt

p(e) 6= 0. (Ohne Beweis)

3.4. Exponentialfunktion (Fortsetzung). In diesem Abschnitt studieren wir die reelleExponentialfunktion exp : R −→ R.

SATZ 3.6.

(a) ∀r ∈ R : exp r > 0, also exp#(R) ⊂ R>0.(b) Die reelle Exponentialfunktion exp : R −→ R ist streng monoton wachsend.(c) Sie wachst schneller als jede polynomiale Funktion im folgenden Sinn: Fur jede polynomiale

Funktion p(x) = adxd + · · ·+ a0x

0, gilt:

∀ε ∈ R>0 : ∃x0 ∈ R : ∀x ∈ R≥x0 :

∣∣∣∣ p(x)

exp(x)

∣∣∣∣ ≤ εInsbesondere: ist (ak)k∈N eine Folge, die uneigentlich gegen ∞ konvergiert, dann ist(

p(ak)

exp(ak)

)k∈N

eine Nullfolge.

35Fur eine Funktion f : M → R bedeutet f ≡ 0, dass fur alle x ∈M gilt f(x) = 0. Oben gilt dann also

p 6≡ 0 ⇐⇒ ¬(p ≡ 0) ⇐⇒ ¬(ad = ad−1 = · · · = a0 = 0)

.


Beweis.Zu (a): bereits gezeigt.Zu (b): Es gelte x, y ∈ R, x < y.

exp y

expx= exp(y − x) = 1 +

∞∑n=1

1

n!(y − x)n︸︷︷︸

>0

> 1.

Zu (c): Sei ε ∈ R>0 gegeben. Wir setzen

x0 :=max{1! |a0|, 2! |a1|, . . . , (d+ 1)! |ad|}

ε> 0.

Somit haben wir fur ∀x ∈ R≥x0∣∣a`x`∣∣ ≤ ε

(`+ 1)!|x0| · |x`| ≤

ε

(`+ 1)!x`+1,

|p(x)| = |adxd + · · ·+ a0x0| ≤ ε

d+1∑n=1

1

n!xn < ε exp(x).

KOROLLAR 3.7. Konvergiert (ak)k∈N uneigentlich gegen∞, dann konvergiert exp(−ak)→ 0 undexp(ak)→∞.

Frage 3.8. Ist exp(R) = R>0?

Es erscheint uns, dass die Antwort ja sein sollte, obwohl wir es noch nicht zeigen konnen. Die Frageist auch wichtig, weil wir gerne den (naturlichen) Logarithmus als Umkehrfunktion der reellenExponentialfunktion definieren wollen, und der Logarithmus sollte auf allen positiven reellen Zahlendefiniert sein.

Beispiel 3.9. Betrachte die Funktion f : R −→ R

f(x) :=

{expx x ≤ 0

1 + expx x > 0

Die Funktion f : R→ R aus Beispiel 3.9

Diese Funktion erfullt alle Eigenschaften in Satz 3.6 und Korollar 3.7. Aber f#(R) = (0; 1]∪(2;∞) 6=R>0.

Anschaulich: Da exp : R −→ R keine”Sprunge macht“, sollte jeder Wert zwischen 0 und ∞ von

der Funktion einmal angenommen werden.

Uns fehlt also ein wichtiges Hilfsmittel. Wir wollen deswegen im folgenden Kapitel klaren, was esbedeutet, dass eine Funktion

”keine Sprunge macht“. Dies fuhrt zum Begriff

”Stetigkeit“.

KAPITEL 4

Stetigkeit und Grenzwerte von Funktionen

Fr 11.1.

1. Stetigkeit

Notationswiederholung f#(D) = {f(x) | x ∈ D}, siehe (7.25).

Im folgenden sei: D ⊂ C, x0 ∈ D, f : D −→ C.

Stellen Sie sich am besten zunachst den SpeziallfallD ⊂ R vor und nehmen Sie zunachst f#(D) ⊂ Ran. Wenn Sie diesen Fall richtig verstanden haben, betrachten Sie den Fall D ⊂ C. In spaterenSemestern werden wir aber noch wesentlich allgemeinere Definitionsbereiche D benotigen, zumBeispiel 4-dimensionale gekrummte Raumzeiten, unendlich-dimensionale Vektorraume oder

”topo-

logische Raume“ und wir wollen die jetzt gemachten Definitionen moglichst so wahlen, dass sichalles auf diesen allgemeineren Kontext verallgemeinert.

Frage 1.1. Sind Funktionen mit dem Grenzwert von Folgen vertraglich?Es gelte an → x0. Folgt dann f(an)→ f(x0)?

Definition 1.2. Eine Funktion f : D −→ C heißt folgenstetig in x0, falls gilt: 1

(1.3) Ist (an)n∈N eine beliebige Folge in D mit limn→∞

an = x0, dann folgt limn→∞

f(an) = f(x0).

Eine Funktion f : D −→ C heißt folgenstetig , falls sie in allen x0 ∈ D folgenstetig ist.

Beispiele 1.4.

(a) Konstante Funktionen folgenstetig. Die Identitaten idR : R → R und idC : C → C sindfolgenstetig.

(b) Ist f : D → C folgenstetig in x0 und x0 ∈ D ⊂ D, dann ist auch f |D : D −→ C in x0

folgenstetig. 2

1Damit es keine Missverstandnisse gibt, wie (1.3) zu verstehen ist, wollen wir noch eine logisch prazisereFormulierung von (1.3) geben, in der der Allquantor deutlich wird. Es ist: Fur allle Folgen (an)n∈N in D gilt:

limn→∞

an = x0 =⇒ limn→∞

f(an) = f(x0).

2Denn: Wenn man D verkleinert, muss man weniger Folgen uberprufen.

117

118 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN

(c) Die Heaviside-Funktion Θ1 : R→ R

Θ1(x) :=

{0 x ≤ 0

1 x > 0

ist nicht folgenstetig in 0. Denn die Folge (1/n)n∈Nr{0} konvergiert gegen 0, aber Θ1(1/n) = 1konvergiert nicht gegen Θ1(0) = 0.

Funktionsgraph der Heaviside-Funktion Θ1

Anderseits ist Θ1 in allen anderen x0 folgenstetig. Denn ist zum Beispiel x0 > 0, und gilt an →x0, dann folgt fur fast alle n ∈ N: an > 0, also Θ1(an) = 1, und somit Θ1(an) → Θ1(x0) = 1.Der Fall x0 < 0 ist analog.

(d) Ist p : C −→ C, x 7→∑dk=0 bkx

k eine polynomiale Funktion, so ist p in jedem x0 ∈ Rfolgenstetig. Es gelte limn→∞ an = x0. Dann

limn→∞

p(an) =

d∑k=0

limn→∞

bk(an)k =

d∑k=0

bk( limn→∞

an)k = p(x0).

Dies folgt direkt aus Proposition 1.10 in Kapitel 3.(e) Realteil Re : C → C, Imaginarteil Im : C → C und Konjugation C → C, z 7→ z sind

folgenstetig.(f) Die Funktion f aus Beispiel 3.9 in Kapitel 3 ist in 0 nicht folgenstetig. Denn fur an := 1

n gilt:

f(an) > 2, f(0) = f(lim an) = 1; deswegen kann f(an) nicht gegen f(lim an) konvergieren. 3

Definition 1.5.

(a) Eine Funktion f : D −→ C heißt stetig in x0, falls gilt:

(1.6) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈ D : (|x− x0| < δ =⇒ |f(x)− f(x0)| < ε).

(b) f : D −→ C heißt stetig , wenn f in jedem x0 ∈ D stetig ist.

Bild zur Veranschaulichung der Stetigkeit

LEMMA 1.7. x0 ∈ D ⊂ C, f : D −→ C

f ist folgenstetig in x0 ⇐⇒ f ist stetig in x0.

In anderen Worten: (1.3) ⇐⇒ (1.6).

Beweis.

Zu”=⇒“: Sei f nicht stetig in x0. Dann gilt

∃ε ∈ R>0 : ∀δ ∈ R>0 : ∃x ∈ D : (|x− x0| < δ ∧ |f(x)− f(x0)| ≥ ε).

3Achtung: Diese Aussage ist – so wie sie steht – korrekt. Wir haben noch nicht gezeigt, dass f(an) konvergiert,denn wir wissen noch nicht, ob die Exponentialfunktion stetig in 0 ist. Wir haben aber im obigen Satz auch nichtbehauptet, dass diese Folge konvergiert!

1. STETIGKEIT 119

Wir fixieren solch ein ε ∈ R>0. Fur ein n ∈ N r {0} setzen wir δ := 1/n, und wahlen ein an ∈ Dmit

|an − x0| < 1/n und |f(an)− f(x0)| ≥ ε.Dann konvergiert (an)n∈Nr{0} gegen x0, aber (f(an))n∈Nr{0} konvergiert nicht gegen f(x0).

Zu”⇐=“: Sei f stetig in x0, und (an) sei eine Folge in D, die gegen x0 konvergiert.

Zu zeigen ist: f(an)→ f(x0), d.h.: 4

(1.8) ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0: |f(an)− f(x0)| < ε

Wir fixieren also ein ε ∈ R>0. Wir wahlen ein dazu passendes δ ∈ R>0 wie in (1.6), d.h. es gilt:

(1.9) ∀x ∈ D : (|x− x0| < δ =⇒ |f(x)− f(x0)| < ε).

Wegen an → x0 gibt es ein n0 ∈ N mit

(1.10) ∀n ∈ N≥n0 : |an − x0| < δ

Die Aussagen (1.9) und (1.10) zusammen ergeben

(1.11) ∀n ∈ N≥n0 : |f(an)− f(x0)| < ε

Insgesamt haben wir nun (1.8) verifiziert.

Sprachgebrauch: Wir nennen (1.3) das Folgen-Kriterium fur Stetigkeit und (1.6) das ε-δ-Kriteriumfur Stetigkeit.

LEMMA 1.12. Seien f, g : D −→ C in x0 stetige Funktionen, a, b ∈ C. Dann sind auch diefolgenden Funktionen D −→ C stetig in x0:

(a · f + b · g)(x) := a · f(x) + b · g(x)

(f · g)(x) := f(x) · g(x)

Gilt außerdem 0 6∈ g#(D), dann ist auch(f

g

)(x) :=

f(x)

g(x)

stetig in x0.

Aus Proposition 1.10 in Kapitel 3 folgt obiges Lemma mit dem Folgenkriterium fur Stetigkeit.

LEMMA 1.13. Sei f : D −→ C stetig in x0 ∈ D und sei g : D −→ C stetig in y0 ∈ D. Es gelte

f(x0) = y0 und B(f) = f#(D) ⊂ D. Dann ist g ◦ f : D −→ C ebenfalls stetig in x0.

Beweis. Wir uberprufen das Folgenkriterium. Es gelte fur n → ∞: an → x0. Aus den Vor-aussetzungen folgt zunachst f(an) → f(x0) = y0 und daraus dann g(f(an)) → g(y0), also(g ◦ f)(an)→ (g ◦ f)(x0). Somit ist g ◦ f folgenstetig in x0.

4Bisher hatten wir in der Definition von Konvergenz von Folgen ≤ ε. Es ist aber klar, dass man hier auch < ε

schreiben kann.


Beispiel 1.14. Sei K = C oder K = R. Dann ist die Betragsfunktion

| · | : K → R, z 7→ |z|stetig.

Begrundung: Wir zeigen die Stetigkeit in x0 ∈ K. Fur ε ∈ R>0 wahle δ := ε. Zu zeigen ist

|x− x0| < ε =⇒∣∣|x| − |x0|

∣∣ < ε.

Dies folgt direkt aus Lemma 5.11 (g) in Kapitel 2.

UBUNG 1.15 (Ubungsblatt 11, 2. Aufgabe). Sei D ⊂ C, x0 ∈ D und f : D → C eine Funktion,und sei r ∈ R>0 fixiert. Wir definieren Br(x0) := {z ∈ C | |z − x0| < r}. Zeigen Sie: f ist stetig inx0 genau dann, wenn f |D∩Br(x0) stetig in x0 ist.

Wir sagen hierzu: Stetigkeit ist eine lokale Eigenschaft.

2. Zwischenwertsatz

In diesem Abschnitt ist der Definitionsbereich D von f eine Teilmenge von R, f : D −→ R.

SATZ 2.1 (Zwischenwertsatz). Sei f : [a, b] −→ R eine stetige Funktion, und sei f(a) ≤ y ≤ f(b)oder f(a) ≥ y ≥ f(b). Dann gibt es ein c ∈ [a, b] mit f(c) = y.

Wir haben dann also

[f(a), f(b)] ⊂ f#([a, b]) oder [f(b), f(a)] ⊂ f#([a, b])

Bild mit der obigen Funktion f

Beweis. O.B.d.A. f(a) ≤ y ≤ f(b).

Wir definieren rekursiv die Folgen (an) und (bn).

a0 := a, b0 := b.

Seien an−1 und bn−1 definiert. Setze

zn−1 :=an−1 + bn−1

2Wir definieren dann an und bn wie folgt:

• Im Fall f(zn−1) ≤ y setzen wir an := zn−1 und bn := bn−1.• Im Fall f(zn−1) > y setzen wir an := an−1 und bn := zn−1.

Die Folge (an) ist monoton wachsend und beschrankt. Also existiert c := limn→∞ an. Da bn−an =(b− a)/2n → 0 haben wir auch c = limn→∞ bn. Mit der Folgenstetigkeit von f in c sehen wir:

f(c) = limn→∞

f(an) ≤ y und f(c) = limn→∞

f(bn) ≥ y.Mi 16.1.

2. ZWISCHENWERTSATZ 121

Beispiel 2.2. Die Funktion f : [−1, 2]→ R, f(x) = x2 ist stetig. Es gilt

[f(−1), f(2)] = [1, 4] ( [0, 4] = f#([−1, 2]).

Beispiel 2.3. Sei a ∈ R>0 und n ∈ N≥2. Betrachte die stetige Funktion f : R −→ R, x 7→ xn − a.Es gilt f(0) = −a < 0 und

f(a+ 1) =

n∑j=0

(nj

)aj

− a ≥ (n− 1)a+ 1 > 0.

Also besitzt f eine Nullstelle im Intervall [0, a + 1]. Dies ist ein alternativer Beweis der Existenzvon n

√a.

KOROLLAR 2.4. Sei I ⊂ R ein Intervall und f : I −→ R stetig. Dann ist f#(I) ebenfalls einIntervall.

Beachte: Intervalle konnen hier offen, halboffen oder abgeschlossen sein! Sie konnen beschranktoder unbeschrankt sein!

Voruberlegung: Eine Teilmenge J von R ist genau dann ein Intervall, wenn gilt:

∀u, v ∈ J : u ≤ v =⇒ [u, v] ⊂ J

Beweis. Seien u, v ∈ f#(I). Wir schreiben u = f(a), v = f(b), a, b ∈ I. O.B.d.A. a ≤ b. Nach demZwischenwertsatz gilt

[u, v] = [f(a), f(b)] ⊂ f#([a, b]) ⊂ f#(I).

Also ist f#(I) ein Intervall.

Beispiel 2.5. Die Funktion f : (−1, 2] → R, f(x) = x2 ist stetig. f#((−1, 2]) = [0, 4]. Die Bilderhalboffener Intervalle konnen also abgeschlossen sein.

Beispiel 2.6. f : (−1, 1) −→ R x 7→ x2. Dann ist f#((−1, 1)) = B(f) = [0, 1). Wir haben hier ein

Intervall erhalten. Das Bild-Intervall ist nicht mehr offen, sondern nur noch halb-offen. AhnlicheBeispiele zeigen: die Bilder offener Intervalle konnen abgeschlossen sein.

SATZ 2.7. Sei I ⊂ R ein Intervall, und f : I −→ R eine streng monotone, stetige Funktion,J := f#(I). Dann ist f−1 : J −→ I wohldefiniert und stetig.

Beweis. Da f : I −→ J eine bijektive Funktion ist, ist die Umkehrfunktion f−1 : J −→ Iwohldefiniert.

Graph einer stetigen streng monotonen Funktion f : I → J

Wir zeigen nun die Stetigkeit von f−1 in einem beliebigen y0 ∈ J . O.B.d.A. sei f streng monotonwachsend.5 Zu zeigen ist:

∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀y ∈ J : (|y − y0| < δ =⇒ |f−1(y)− f−1(y0)| < ε).

5Dies bedeutet: Wir betrachten nur den Fall, dass f streng monoton wachsend ist. Der Fall, dass f strengmonoton fallend ist, folgt dann durch Vorzeichenwechsel.


Setze x0 := f−1(y0).

1. Fall: inf J < y0 < sup J . Dies ist aquivalent zu inf I < x0 < sup I. In Worten anschaulich: y0

liegt nicht am Rand des Intervalls J .

Sei ε ∈ R>0 gegeben. Setze

ε := min{ε, (x0 − inf I)/2, (sup I − x0)/2} > 0

Dann inf I < x0− ε < x0 < x0 + ε < sup I. Setze y± := f(x0± ε) und δ := min{(y+−y0), (y0−y−)}.Also

y− ≤ y0 − δ < y0 < y0 + δ ≤ y+.

Da f−1 ebenfalls streng monoton wachsend ist, gilt fur alle y ∈ (y0 − δ, y0 + δ):6

x0 − ε ≤ x0 − ε = f−1(y−) ≤ f−1(y0 − δ)

≤ f−1(y) ≤ f−1(y0 + δ) ≤ f−1(y+) = x0 + ε ≤ x0 + ε .

Also

|f−1(y)− f−1(y0)| = |f−1(y)− x0| ≤ ε.

2. Fall: inf J = y0 oder sup J = y0. Anschaulich: y0 ist am Rand des Intervalls J .

Geht ganz ahnlich. Man muss dabei nur eine der Seiten weglassen.

Beispiele 2.8. Die folgenden Funktionen sind streng monoton, stetig und surjektiv und habendeswegen eine stetige Umkehrabbildung:

f : R −→ R, f(x) := x3 + x

f : R −→ R, f(x) = x2n+1, n ∈ N

f : R≥0 −→ R≥0, f(x) = xn, n ∈ Nr {0}

Also sind die Wurzelfunktionen n√

: R≥0 −→ R≥0 und 2n+1√

: R −→ R stetig.

3. Stetigkeit von exp, cos und sin und Definition von log

LEMMA 3.1. Sei∑∞j=1 aj eine absolut konvergierende Reihe, aj ∈ C. Dann gilt∣∣∣ ∞∑

j=1

aj

∣∣∣ ≤ ∞∑j=1

|aj |.

6Das heißt: fur alle y ∈ J mit y0 − δ < y < y0 + δ

3. STETIGKEIT VON exp, cos UND sin UND DEFINITION VON log 123

Beweis. ∣∣∣ ∞∑j=1

aj

∣∣∣ Bsp. 1.14= lim

n→∞

∣∣∣ n∑j=1

aj

∣∣∣Dreiecks-

Ungl.

≤ limn→∞

n∑j=1

∣∣aj∣∣ def=

∞∑j=1

∣∣aj∣∣SATZ 3.2. Die komplexe Exponentialfunktion exp : C→ C ist stetig.

Beweis. Wir zeigen zunachst die Stetigkeit in 0. Dazu rechnen wir fur x ∈ C mit |z| ≤ 12 :

| exp z − exp 0| = | exp z − 1| =∣∣∣ ∞∑j=1

1

j!zj∣∣∣

Lem. 3.1≤

∞∑j=1

∣∣∣ 1

j!zj∣∣∣ ≤ ∞∑

j=1

∣∣∣zj∣∣∣ =

∞∑j=1

|z| |z|j−1

≤ |z|∞∑k=0

|z|k ≤ |z|∞∑k=0

∣∣∣∣12∣∣∣∣k︸︷︷︸

=2

= 2 |z|.

Fur gegebenes ε ∈ R>0 setze nun δ := min{ 12 ,

ε2}. Dann gilt

|z − 0| < δ =⇒ | exp z − exp 0| < ε.

Also ist exp : C→ C in 0 stetig.

Ist f : C → C in 0 stetig, dann auch af : z 7→ a · f(z) fur a ∈ C. Wir setzen f := exp unda := exp z0. Somit ist

g : C→ C, z 7→ g(z) := (exp z0) · (exp z) = exp(z + z0)

stetig in 0. Da h : C→ C, h(z) := z − z0 stetig ist, folgt mit Lemma 1.13 die Stetigkeit von g ◦ hin z0. Offensichtlich exp = g ◦ h.

Es folgt daraus, dass auch die folgenden Funktionen C→ C stetig sind:

z 7→ exp(iz), z 7→ exp(−iz)

z 7→ cos z =exp iz + exp(−iz)

2

z 7→ sin z =exp iz − exp(−iz)

2i

Durch Einschrankung auf R folgt auch, dass exp : R → R, cos : R → R und sin : R → R stetigsind. Aufgrund des Zwischenwertsatzes ist exp(R) ein Intervall. Wegen limn→∞ expn = ∞ undlimn→∞ exp(−n) = 0 folgt exp#(R) = R>0.


KOROLLAR 3.3. Die reelle Exponentialfunktion exp : R −→ R>0 ist streng monoton, stetig undbijektiv.

Definition 3.4. Die Umkehrfunktion von exp : R −→ R>0 nennt man den (naturlichen)7 Loga-rithmus log : R>0 −→ R.

Wegen Satz 2.7 des aktuellen Kapitels 4 ist der Logarithmus stetig. Die Funktionalgleichung derExponentialfunktion, siehe Satz 3.1 in Kapitel 3 ubersetzt sich nun in die Funktionalgleichung derLogarithmusfunktion:

∀r, s ∈ R>0 : log(rs) = log r + log s.

log 1 = 0, log e = 1

LEMMA 3.5. Sei r ∈ R>0 und z ∈ C. Es gilt

rz = exp(z log r)

in den folgenden Fallen.

(1) r = e und z ∈ C(2) r ∈ R>0 und z ∈ Q

Fur alle anderen Kombination von r ∈ R>0 und z ∈ C wurde rz noch gar nicht definiert.8

Beweis.(1) folgt direkt aus Definition 3.4 in Kapitel 3.(2) Die Aussage ist klar fur z = 1. Dann folgt (2) ganz analog wie Lemma 3.3 in Kapitel 3.

Definition 3.6. Fur r ∈ R>0 und z ∈ C definiert man nun

rz := exp(z log r)

Auf Grund des obigen Lemmas verallgemeinert dies also bisherige Definitionen von rz in den beidenobigen Fallen.

rz+w = rzrw (rs)z = rzsz

log rs = log exp(s log r) = s log r

fur r, s ∈ R>0, z, w ∈ C. Es gilt auch(rs)t = rst

fur r ∈ R>0 und s, t ∈ R.

7In der Mathematik wird der naturliche Logarithmus fast immer mit log bezeichnet. In technischen und vielenalltaglichen Bereichen wird der naturliche Logarithhmus mit dem Symbol ln bezeichnet und das Symbol log wird

dann – anders als in unserer Vorlesung – fur den Zehner-Logarithmus, also den Logarithmus zur Basis 10 genutzt.

Im Mathematik-Studium wird aber nur der naturliche Logarithmus eine Rolle spielen. Deswegen wird der Zehner-Logarithmus hier weder definiert, noch mit einem Symbol versehen.

8Wir haben auch schon (−1)3 und (1 + i)−2 definiert, aber es interessieren uns derzeit nur r ∈ R>0.

4. DIE KREIZAHL π UND PERIODIZITAT VON cos UND sin. 125

4. Die Kreizahl π und Periodizitat von cos und sin.

cosx =

∞∑n=0

(−1)n1

(2n)!x2n︸︷︷︸

an

Fur x ∈ (0, 2] und n ≥ 1 gilt an > 0 und

an+1

an=

x2

(2n+ 1)(2n+ 2)≤ 1.

Also

cosx = a0 − a1 + (a2 − a3)︸︷︷︸≥0

+ (a4 − a5)︸︷︷︸≥0

. . . ≥ a0 − a1 = 1− x2

2

cosx = a0 − a1 + a2 + (−a3 + a4)︸︷︷︸≤0

+ (−a5 + a6)︸︷︷︸≤0

. . . ≤ a0 − a1 + a2 = 1− x2

2+x4

24

Also fur x ∈ [0, 2]

1− x2

2 ≤ cosx ≤ 1− x2

2 + x4

24

Ganz ahnlich fur 0 ≤ x ≤ 4

x− x3

6 ≤ sinx ≤ x.

cos 0 = 1, cos 2 ≤ 1− 2 +2

3= −1

3< 0.

Aus dem Zwischenwertsatz folgt:

A := {x ∈ [0, 2] | cosx = 0} 6= ∅.

Setze α := inf A. Zu jedem n ∈ N wahle ein xn ∈ A mit xn ≤ α+ 1n . Dann gilt xn → α fur n→∞

und

cosα = cos( limn→∞

xn) = limn→∞

cosxn︸︷︷︸0

= 0.

π := 2α ∈ [0, 4].

Definition 4.1. Die Kreiszahl π ist definiert als das Doppelte der ersten positiven Nullstelle derreellen Kosinusfunktion.


π = 3, 14159265...

Es folgt aus den bisher bewiesenen Eigenschaften in Abschnitt 3.2 in Kapitel 3 nun durch einfacheRechnung:

• sinπ/2 = 1, da sinπ/2 ≥ π2

(1−

(π2

)2/6)> 0 und sin2 α+ cos2 α = 1,

• sin(x+ (π/2)) = cosx, cos(x+ (π/2)) = − sinx, (Additionstheoreme)• cos(2π + x) = − cos(π + x) = cosx, sin(2π + x) = − sin(π + x) = sinx,• e2πi = cos 2π + i sin 2π = 1

Aus

cosx− cos y = cos

(x− y

2+x+ y

2

)− cos

(y − x

2+x+ y

2

)= cos

x− y2

cosx+ y

2− sin

x− y2

sinx+ y

2− cos

y − x2

cosx+ y

2+ sin

y − x2

sinx+ y

2

= 2 siny − x

2sin

x+ y

2

folgt cosx > cos y fur 0 ≤ x < y ≤ 2.

−2 −1 1 2 3 4 5 6 7

−1

1

x

cos(x) und sin(x)

Abbildung 6: Die Graphen von cos und sinFr 18.1.

5. Metrische Raume und Grundbegriffe der Topologie

Der Begriff der”Stetigkeit“ gehort zum mathematischen Teilgebiet mit dem Namen

”Topologie“,

so wie der Begriff”lineare Abbildungen“ zum Teilgebiet

”Lineare Algebra“ gehort. Im Laufe Ihres

Studiums werden Sie immer wieder von stetigen Abbildungen horen, und die topologischen Begriffewerden dann immer wichtiger.

Dies betrifft zum einen die Mathematiker unter Ihnen, und zwar sowohl diejenigen die sich an ReinerMathematik orientieren (Topologische Raume sind da fast schon omniprasent), als auch diejenigen,die sich an Angewandter Mathematik orientieren (Beschreibung von Flachen im Raum, Mannigfal-tigkeiten, partielle Differentialgleichung, Modellierung von physikalischen Systemen). Und es trifftauch auf Physiker zu. Zum Beispiel benotigt eine prazise Formulierung selbst einfacher quanten-mechanischer Systeme wie dem Wasserstoff-Atom solche topologischen Grundbegriffe (Energie-,

5. METRISCHE RAUME UND GRUNDBEGRIFFE DER TOPOLOGIE 127

Orts-, Impulsoperatoren sind”dicht definierte“

”unstetige“

”abgeschlossene“ Operatoren)9 und die

zugrundeliegenden Raume der klassischen Mechanik, der Allgemeinen Relativitatstheorie und derElektrodynamik sind Mannigfaltigkeiten und damit mit einer Topologie versehen. Naturlich trifftvieles davon auch auf Computational Science und Nanoscience zu.

In diesem Abschnitt lernen wir nun einige Grundbegriffe der Topologie kennen: Stetigkeit in einemetwas allgemeineren Sinn, offene Mengen, abgeschlossene Mengen, Haufungspunkte und Umge-bungen. Diese Begriffe werden (in noch allgemeinerer Form) Ihnen haufig im Studium begegnen.Wir wollen aber noch nicht das zentrale Objekt der Topologie, namlich

”topologische Raume“

einfuhren, sondern uns zunachst auf metrische Raume spezialisieren.

Definition 5.1. Ein metrischer Raum ist ein Paar (M,d), wobei M eine Menge ist und d :M ×M −→ R≥0 eine Abbildung ist mit folgenden Eigenschaften, die fur alle x, y, z ∈ M geltensollen:

(a) d(x, y) = 0 ⇐⇒ x = y (Definitheit)(b) d(x, y) = d(y, x) (Symmetrie)(c) d(x, y) ≤ d(x, z) + d(z, y) (Dreiecks-Ungleichung)

Man nennt d eine Metrik auf M .

Beispiele 5.2.

(1) Sei M ⊂ R oder M ⊂ C. Fur z, w ∈M definieren wir

d(z, w) := |z − w| =√

(Re (z − w))2 + (Im (z − w))2.

(2) Sei M ⊂ Rn. Zu x = (x1, x2, . . . , xn) ∈ M ⊂ Rn und y = (y1, y2, . . . , yn) ∈ M ⊂ Rndefinieren wir den euklidischen Abstand als

deukl(x, y) := ‖x− y‖ =√

(x1 − y1)2 + (x2 − y2)2 + · · ·+ (xn − yn)2.

In beiden Beispielen sind (a) und (b) klar. Fur (1) wurde (c) schon diskutiert. Die Ungleichung (c)fur (2) wird in der Linearen Algebra I (und dem Kurs

”Mathematische Methoden“ fur Physiker)

gezeigt.

Beispiel 5.3. Ist (M,d) ein metrischer Raum und N ⊂ M . Dann ist (N, d|N×N ) ebenfalls einmetrischer Raum. Wir nennen dN×N die von (M,d) auf N induzierte Metrik .

Schreibweise: Sei f : M −→ M eine Abbildung und sind (M,d) und (M, d) metrische Raume, dann

schreiben wir hierfur oft f : (M,d) −→ (M, d).

Ist eine Abbildung f : (M,d) −→ (M, d) bijektiv und gilt fur alle x, y ∈M : d(x, y) = d(f(x), f(y)),dann nennt man die Abbildung eine Isometrie. Man sieht sofort, dass (x, y) 7→ x+iy eine Isometrievon (R2, deukl) nach (C, d) ist, wobei d die Metrik im obigen Beispiel ist. Da wir oft R2 mitCidentifizieren, schreiben wir ebenfalls deukl fur diese Metrik auf C.

9Es ist derzeit nicht wichtig, dass Sie diese Begriffe kennen, wichtig ist: es sind Begriffe der Topologie.


Definition 5.4 (ε-δ-Kriterium fur Stetigkeit fur Abbildungen zwischen metrischen Raumen). f :

(M,d) −→ (M, d) ist stetig in x0 ∈M , falls gilt:

(5.5) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈M : (d(x, x0) < δ =⇒ d(f(x), f(x0)) < ε).

f stetig ⇐⇒ f stetig in allen x0 ∈M .

Im Fall M ⊂ C, d(z, w) = |z−w| stimmt diese Definition offensichtlich mit Definition 1.5 uberein.

Definition 5.6. Sei (M,d) ein metrischer Raum, x ∈M , r ∈ R>0. Der (offene) Ball von Radius rum x in (M,d) ist die Menge

Br(x) := {y ∈M | d(y, x) < r}.Eine Teilmenge U ⊂ M heißt Umgebung von x in (M,d), falls es ein r ∈ R>0 gibt, so dassBr(x) ⊂ U .

Definition 5.7. Eine Teilmenge O von M heißt offen in (M,d), wenn fur jeden Punkt x ∈ Ogilt, dass O eine Umgebung von x in (M,d) ist. Eine Teilmenge A von M heißt abgeschlossen in(M,d), falls M rA offen ist.

Beispiele 5.8.

(a) Die leere Menge und M sind offen in (M,d). Diese beiden Mengen sind auch abgeschlossen.(b) O ⊂ R2 ∼= C

Bild einer offenen Menge O in R2, darin ein x und ein geeigneter Ball Br(x).

(c) Alle offenen Intervalle in R sind offen in (R, deukl). Alle abgeschlossenen Intervalle in R sindabgeschlossen in (R, deukl).

(d) Die Menge (0, 1)× (0, 1) ist offen in (R2, deukl)(e) Fur alle r ∈ R>0 und alle x ∈M ist Br(x) eine offene Teilmenge von (M,d). Begrundung: Sei

y ∈ Br(x), ρ := d(x, y). Dann gilt Br−ρ(y) ⊂ Br(x) (Dreiecks-Ungleichung).

Zeichnung von Br−ρ(y) ⊂ Br(x) in R2.

(f) Ist U Umgebung von x und U ⊂ V ⊂M , dann ist V ebenfalls Umgebung von x.

LEMMA 5.9. Sei x ∈ M und U ⊂ M . Dann ist U eine Umgebung von x, genau dann wenn esein O ⊂M gibt, das

• in (M,d) offen ist, und• so dass x ∈ O ⊂ U .

Solch ein O ist also eine offene Umgebung von x.

Beweis.

”=⇒“: klar, da offene Balle offen sind.

”⇐=“: Wenn O offen ist und x ∈ O, dann ist O eine Umgebung von x. Aus O ⊂ U ergibt sich,

dass U Umgebung von x ist.


PROPOSITION 5.10.

(a) Sei x ∈ M und seien U1 und U2 Umgebungen von x in (M,d). Dann ist auch U1 ∩ U2 eineUmgebung von x.

(b) Sind O1 und O2 offene Teilmengen von (M,d), so ist O1 ∩O2 offen.(c) Sei (Oj)j∈I eine Familie offener Teilmengen von (M,d), dann ist auch⋃

j∈IOj

eine offene Teilmenge.

Beweis.Zu (a): Da U1 und U2 Umgebungen von x sind, gibt es r1, r2 ∈ R>0 mit Br1(x) ⊂ U1 undBr2(x) ⊂ U2. Fur r := min{r1, r2} gilt Br(x) ⊂ U1 ∩ U2.

Zu (b): Gegeben sei ein x ∈ O1 ∩ O2 ist. Da O1 und O2 offen sind, sind sie Umgebungen von x.Aus (a) folgt, dass O1 ∩ O2 ebenfalls Umgebung von x ist. Da dies fur jedes x ∈ O1 ∩ O2 gilt, istO1 ∩O2 offen.

Zu (c): Sei x ∈⋃j∈I Oj . Fixiere ein k ∈ I mit x ∈ Ok. Da Ok offen ist, ist Ok eine Umgebung von x

in (M,d), und damit auch⋃j∈I Oj ⊃ Ok. Also ist

⋃j∈I Oj eine Umgebung von jedem x ∈

⋃j∈I Oj ,

also offen.

!ACHTUNG!.

• Fur n ∈ Nr {0} ist (−1/n, 1/n) offen in R, aber nicht offen in C.• Proposition 5.10 besagt: endliche Durchschnitte offener Mengen sind offen und beliebi-

ge (also auch unendliche!) Vereiningung offener Mengen sind auch wieder offen. Aller-dings ist ein unendlicher Durchschnitt offener Mengen im allgemeinen nicht mehr offen:⋂n∈N(−1/n, 1/n) = {0} ist nicht offen!

•”Abgeschlossen“ ist nicht das Gegenteil zu

”offen“.

PROPOSITION 5.11 (Umgebungskriterium fur Stetigkeit). Gegeben sei eine Abbildung f : (M,d) −→(M, d) und ein x0 ∈M . Diese Abbildung ist stetig in x0 genau dann, wenn gilt:

fur alle Umgebungen U von f(x0) in (M, d) gilt: f#(U) ist eine Umgebung von x0 in (M,d).

Beweis. Die umrahmte Aussage ist eine Umformulierung des ε-δ-Kriteriums unter Nutzung desoben definierten Begriffs

”Umgebung“.

Kurz kann man hierfur sagen: Urbilder von Umgebungen sind Umgebungen.

PROPOSITION 5.12. Eine Funktion f : (M,d) −→ (M, d) ist genau dann stetig, wenn fur alle

offenen Teilmengen O von (M, d) gilt: f#(O) ist offen in (M,d).

Kurz kann man hierfur sagen: Urbilder offener Mengen sind offen.


Beweis. Folgt direkt aus dem Umgebungskriterium fur Stetigkeit (Proposition 5.11).

Definition 5.13. Eine Folge (an)n∈N konvergiert in (M,d) gegen x0 ∈ M , falls fur jede Umge-bung U von x0 gilt:

∃n0 ∈ N : ∀n ∈ N≥n0: an ∈ U.

Die ist aquivalent zu

∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N :(n ≥ n0 =⇒ d(an, x0) < ε

),

und dies stimmt mit Definition 1.4 uberein, falls d(an, x0) = |an − x0|. Die Folge konvergiertin (M,d), wenn es in M solch ein x0 gibt.

Diese Definition verallgemeinert die Konvergenz von Folgen in R und C. Man definiert limn→∞und die Folgenstetigkeit gleich wie zuvor. Folgenstetigkeit und Stetigkeit sind wieder aquivalenteEigenschaften. Um dies zu beweisen, ersetze man im Beweis von Lemma 1.7 |x − x0| < δ durchd(x, x0) < δ und so weiter.Mi 23.1.

Bemerkung 5.14. R := R∪{−∞,∞}. In der Diskussion vor Proposition 1.30 in Kapitel 3 habenwir eine bijektive Abbildung ϕ : [−1, 1] −→ R definiert,

ϕ(x) =

1

1−x −1

1+x fur x ∈ (−1, 1)

∞ fur x = 1

−∞ fur x = −1

Graph der Funktion ϕ.

Wir versehen nun R mit der Metrik

dR(x, y) :=∣∣ϕ−1(x)− ϕ−1(y)

∣∣ .Dann ist (R, dR) ein metrischer Raum. Fur eine reell-wertige Folge (an)n∈N und ein a ∈ R gilt

Fur im klassischen Sinn im Sinn metrischer Raume

a ∈ R limn→∞ an = aim eigentlichen Sinn

⇐⇒ limn→∞ an = aim metrischen Raum (R, dR)

a = ±∞ limn→∞ an = aim uneigentlichen Sinn

⇐⇒ limn→∞ an = aim metrischen Raum (R, dR)

Proposition 1.30 aus Kapitel 3, folgt nun unmittelbar.

!ACHTUNG!. Wir wiederholen nochmals erlaubte und unerlaubte Sprechweisen klaren an Handdes Beispiels an := n2.Erlaubt: (an)n∈N konvergiert uneigentlich gegen ∞.

(an)n∈N konvergiert in (R, dR) gegen ∞.Nicht erlaubt: (an)n∈N konvergiert.


Schreibweise: Wenn aus dem Kontext heraus klar ist, welche Metrik gemeint ist, dann schreibt manoft einfach M statt (M,d). Teilmengen X ⊂ M tragen die induzierte Metrik d|X×X , wenn nichtsanderes angegeben.

Definition 5.15. Sei X Teilmenge eines metrischen Raums (M,d). Wir nennen x0 ∈ M einenHaufungspunkt von X in (M,d), falls jede Umgebung von x0 unendlich viele Punkte von X enthalt.

Beispiele 5.16.

(a) Endliche Mengen haben keine Haufungspunkte.(b) Die Mengen N und Z haben keine Haufungspunkte in R und C.(c) Die Menge aller Haufungspunkte von Q in C ist R.(d) Seien a, b ∈ R, a < b. Die Menge aller Haufungspunkte von (a, b) in R (oder in C) ist die Menge

[a, b].

LEMMA 5.17. Sei X Teilmenge eines metrischen Raums (M,d), und sei y ∈M . Aquivalent sinddann die folgenden Aussagen:

(1) y ist Haufungspunkt von X

(2) Fur jede Umgebung U von y gilt U ∩X r {y} 6= ∅(3) Es gibt eine Folge (an) in X r {y} mit limn→∞ an = y

(4) Es gibt eine Folge in X r {y}, so dass y Haufungspunkt dieser Folge ist.

Beweis.

”(1)=⇒(2)“: klar.

”(2)=⇒(3)“: B1/n(y) ∩X besitzt ein Element an 6= y. Dann d(an, y) ≤ 1/n→ 0.

”(3)=⇒(1)“: Sei (an)n∈N eine Folge wie in (2), und U eine Umgebung von y. Es gibt ein n0 ∈ N,

so dass ∀n ∈ N≥n0: an ∈ U . Wenn P := {d(an, y) | n ∈ N≥n0

} nur endlich viele Elementeenthalt, dann ist inf{d(an, y) | n ∈ N} > 0. Widerspruch. Somit hat P unendlich viele Elementeund deswegen auch U ∩X.

”(3)⇐⇒(4)“: siehe Definition 1.22 in Kapitel 3.

!ACHTUNG!. Die Definitionen von”Haufungspunkt einer Menge“ (siehe oben) und

”Haufungs-

punkt einer Folge“ (Definition 1.22 in Kapitel 3) sind zwar verwandt, aber doch verschieden, wiedas folgende Beispiel zeigt. Die reell-wertige Folge (an)n∈N mit an := 1 hat den Haufungspunkt 1,aber die Menge {an | n ∈ N} hat keine Haufungspunkte.

Bemerkung 5.18 (Aufgabe 4 auf Blatt 12). Eine Teilmenge eines metrischen Raumes (M,d) istabgeschlossen, genau dann wenn sie alle ihre Haufungspunkte enthalt.

Definition 5.19. Wir nennen einen metrischen Raum (M,d) folgenkompakt , wenn jede Folge inM eine in (M,d) konvergente Teilfolge besitzt. Eine Teilmenge X ⊂M nennt man folgenkompakt,wenn (X, d|X×X) folgenkompakt ist.10.

10Achtung: Der Grenzwert muss dann in X liegen!


LEMMA 5.20. Folgenkompakte Teilmengen eines metrischen Raumes sind abgeschlossen.

Beweis. Sei X eine folgenkompakte Teilmenge von (M,d) und y ein Haufungspunkt von X. Danngibt es eine Folge (an)n∈N in X mit limn→∞ an = y. Da X folgenkompakt ist, gibt es eine Teilfolge(af(k))k∈N in X, f : N→ N streng monoton wachsend, mit z := limk→∞ af(k) ∈ X. Diese Teilfolgekonvergiert auch in M , also haben wir y = z. Somit enthalt X jeden Haufungspunkt und ist somitabgeschlossen (Bemerkung 5.18).

Beispiel 5.21. Sei I ein Interval mit der von deukl induzierten Metrik. Dann ist I folgenkompaktgenau dann, wenn I abgeschlossen und beschrankt ist. Denn:

• Ist I folgenkompakt, dann ist I abgeschlossen in (R, deukl) aufgrund des obigen Lemmas.• Ist I folgenkompakt, dann ist I beschrankt. Denn wenn I nicht nach oben (bzw. unten)

beschrankt ist, dann gibt es eine Folge, die uneigentlich gegen +∞ (bzw. −∞) konvergiert.Diese Folge hat keine konvergente Teilfolge. 11

• Ist I beschrankt, dann besitzt jede Folge in I aufgrund des Satzes von Bolzano-Weierstraß(Satz 1.35 in Kapitel 3) einen Haufungspunkt, also eine in R konvergente Teilfolge. Ist Izusatzlich abgeschlossen, dann ist der Grenzwert in I. Somit ist I folgenkompakt.

SATZ 5.22. Seien (M,d) und (M, d) metrische Raume. Ist (M,d) folgenkompakt und f : (M,d)→(M, d) stetig, dann ist B := f#(M) mit der Metrik d|B×B ebenfalls folgenkompakt.

Beweis. Sei (yn)n∈N eine Folge in f#(M). Wahle xn ∈ M mit f(xn) = yn und danach einekonvergente Teilfolge (xh(k))k∈N, h : N→ N streng monoton wachsend. Dann gilt

limk→∞

yh(k) = limk→∞

f(xh(k)) = f(

limk→∞

xh(k)︸︷︷︸∈M

)∈ f#(M).

Also ist f#(M) folgenkompakt.

FOLGERUNG 5.23. Seien a, b ∈ R, a ≤ b und f : [a, b] → R stetig. Dann ist f#([a, b]) einabgeschlossenes beschranktes Intervall. Es existieren also x1, x2 ∈ [a, b] mit

∀x ∈ [a, b] : f(x1) ≤ f(x) ≤ f(x2).

Die Folgerung folgt direkt aus dem obigen Beispiel und dem obigen Satz.

6. Grenzwerte von Funktionen

LEMMA 6.1. Seien (M,d) und (N, d) metrische Raume, D ⊂M , und x0 ∈M ein Haufungspunktvon D. Zu jeder Abbildung f : D → N gibt es hochstens eine Abbildung F : D∪{x0} → N , so dass

11Alternative Beweise: a) Ubungsblatt 13, Aufgabe 4. Zweiter Beweis: Ist (I, deukl) folgenkompakt,d ann ist

auch (I, dR|I×I) folgenkompakt. Also ist I abgeschlossen in R. Somit sind −∞ und +∞ keine Haufungspunkte von

I in (R, dR), was bedeutet, dass I beschrankt ist.

6. GRENZWERTE VON FUNKTIONEN 133

• F |Dr{x0} = f |Dr{x0}• und so dass F stetig in x0 ist.

Definition 6.2. Wenn solch ein F existiert, so sagen wir der Grenzwert oder Limes

limx→x0

f(s)

existiert. Wir nennen F (x0) den Grenzwert oder Limes von f in x0 und schreiben

limx→x0

f(x) := F (x0).

Bemerkung 6.3. Es sind die Falle x0 ∈ D und x0 6∈ D zugelassen. Im Fall x0 ∈ D muss nichtf(x0) = F (x0) gelten.

Beweis des Lemmas. Wahle eine Folge (an)n∈N in D r {x0} mit an → x0. Wenn ein F wie obenexistiert, dann gilt

F (x0) = F ( limn→∞

an) = limn→∞

F (an) = limn→∞

f(an).

Es gibt also hochstens einen passenden Wert fur F (x0). Auf Dr{x0} ist F sowieso schon bestimmt.Also kann es hochstens eine solche Abbldung F geben.

Definition 6.4. Sei D ⊂ R, und sei x0 ∈ R ein Haufungspunkt von D ∩ [x0,∞). Dann definiertman den rechtsseitigen Grenzwert/Limes als

limx↘x0

f(x) := limx→x0

(f |D∩[x0,∞)).

Wenn wir [x0,∞) durch (−∞, x0] ersetzen, erhalten wir die Definition des linksseitigen Grenz-werts/Limes

limx↗x0

f(x).

Fur x0 ∈ D ⊂ R, x0 Haufungspunkt von D ∩ [x0,∞) und D ∩ (−∞, x0]:

f : D → R ist stetig in x0

⇐⇒ limx→x0

f(x) existiert und limx→x0

f(x) = f(x0)

⇐⇒ limx↘x0

f(x) und limx↗x0

f(x) existieren und limx↘x0

f(x) = limx↗x0

f(x) = f(x0)

Beispiel 6.5. Definiere f : R −→ R.

f(x) :=

1 fur x > 0

0 fur x = 0

−1 fur x < 0

limx→0 f(x) existiert nicht. Hingegen existieren limx↘0 f(x) = 1 und limx↗0 f(x) = −1.


Bemerkung 6.6. Wir versehen N ∪ {∞} mit der Metrik12

dinv(x, y) =

∣∣∣∣ 1

x+ 1− 1

y + 1

∣∣∣∣ ,wobei wir in diesem13 Zusammenhang 1

∞ := 0 setzen. Dieses dinv ist eine Metrik auf N∪ {∞}. Sei(an) eine Folge in (M,d), und sei f : N −→M die Abbildung mit f(n) = an. Dann gilt

limn→∞

an = a im Sinne von Kap. 2 ⇐⇒ limn→∞

f(n) = a im Sinne des aktuellen Abschnitts

12Die folgende Metrik ist nur ein Beispiel einer Metrik, die verwendet werden kann. Die Einchranung von dRauf (N ∪ {∞})× (N ∪ {∞}) ist zum Beispiel ebenfalls eine Metrik, fur die die folgenden Aussagen richtig sind.

13Wenn wir es brauchen, wird 1∞ jedesmal neu definiert, denn man kann diese Definition nicht so machen,

dass alle ulichen Rechenregeln gelten. Man kommt dann immer wieder zu Fragen wie: 10

= ∞ oder 10

= −∞. Ist∞−∞ = 0 oder ∞−∞ = 17?

”Beweis“ der letzten Aussage: ∞+ 17 =∞. Lose diese Gleichung nach 17 auf. Beim

Rechnen mit ∞ funktioniert eben alles mogliche nicht mehr richtig.

KAPITEL 5

Differential-Rechnung fur Funktionen einer Veranderlichen

1. Definition und elementare Eigenschaften

Ab sofort nutzen wir ε > 0 oft im Sinne von ε ∈ R>0, falls aus dem Kontext heraus klar ist,dass ε eine reelle Zahl ist. Wir betrachten in den folgenden Abschnitten nur Funktionen der Formf : D −→ R, D ⊂ R.

Definition 1.1. Sei D ⊂ R offen, x0 ∈ D.1 Eine Funktion f : D −→ R nennt man differenzierbarin x0, wenn der Grenzwert

limx→x0

f(x)− f(x0)

x− x0

existiert. Wenn er existiert, so nennt man

f ′(x0) := limx→x0

f(x)− f(x0)

x− x0

die Ableitung von f an der Stelle x0. Die Funktion f ist differenzierbar, wenn sie in jedem x0 ∈ Ddifferenzierbar ist. Den Quotient

f(x)− f(x0)

x− x0

nennt man den Differenzenquotient .

Graph einer Funktion f mit einem Dreieck, das den Differenzenquotient andeutet.

Interpretation: Die Zahl f ′(x0) gibt an, wie stark der Graph der Funktion an der Stelle (x0, f(x0))ansteigt.

Alternative Bezeichnungen:

f ′(x0) =df

dx(x0) =

∂f

∂x(x0) = Df(x0)

f differenzierbar in x0 ⇐⇒ Die Ableitung von f existiert in x0

⇐⇒ f ′(x0) existiert

1Damit diese Definition sinnvoll ist, reicht hier eigentlich bereits, dass D eine Umgebung von x0, oder sogar

nur, dass x0 ein Haufungspunkt von D ist.

135

136 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN

Beispiele 1.2.

(1) Konstante Funktionen R→ R, x 7→ a sind differenzierbar und f ′(x0) = 0 fur alle x0 ∈ R.(2) Die Identitat idR : R −→ R, x 7→ x ist differenzierbar und f ′(x0) = 1 fur alle x0 ∈ R.(3) Differenzierbarkeit ist eine lokale Eigenschaft: Ist U eine Umgebung von x0, enthalten in

den Definitionsbereichen von f und f , und gilt f |U = f |U , dann ist f differenzierbar in

x0 genau dann, wenn f in x0 differenzierbar ist. Dann gilt f ′(x0) = f ′(x0).(4) Die Funktion f : Rr {0} → Rr {0}, x 7→ x−1 ist differenzierbar und es gilt

f ′(x0) = − 1

x20

.

Denn:

1x −

1x0

x− x0=

x0 − xxx0(x− x0)

=−1

xx0→ − 1

x20

fur x→ x0

Fr 25.1.

Umformungen:

f ′(x0) existiert

⇐⇒ ∀ε > 0 : ∃δ > 0 : ∀x ∈ D r {x0} :

(|x− x0| < δ =⇒

∣∣∣∣f(x)− f(x0)

x− x0− f ′(x0)

∣∣∣∣ < ε

)⇐⇒ ∀ε > 0 : ∃δ > 0 : ∀x ∈ D :(

|x− x0| < δ =⇒ |f(x)− f(x0)− f ′(x0)(x− x0)| ≤ ε |x− x0|)

Interpretation:Differenzierbarkeit =

”gute“ Approximierbarkeit durch eine lineare Funktion

SATZ 1.3. Seien D und f wie oben. Ist f differenzierbar in x0, so ist f stetig in x0.

Die Umkehrung gilt nicht, siehe Ubungen.

Beweis. Definiere

g(x) :=f(x)− f(x0)

x− x0fur x 6= x0

limx→x0

((x− x0)g(x)) = ( limx→x0

(x− x0))( limx→x0

g(x)) = 0 · f ′(x0) = 0

1. DEFINITION UND ELEMENTARE EIGENSCHAFTEN 137

2

f(x) = f(x0) + (x− x0)g(x) fur x 6= x0

Alsolimx→x0

f(x) = f(x0) + 0 · f ′(x0) = f(x0).

Somit ist f stetig in x0.

REGELN 1.4. Im folgenden sei D offen in R, f, fj , g : D −→ R.

(1) Sind fj differenzierbar in x0, aj ∈ R fur j ∈ {1, 2, . . . , r}, dann gilt r∑j=1

ajfj

′ (x0) =

r∑j=1

ajf′j(x0).

Solche Aussagen sind immer so zu verstehen, dass alle angegebenen Ableitungen in x0

existieren und die obige Gleichung fur die so erhaltenen Zahlen gilt.(2) Produktregel.

Sind f und g differenzierbar in x0, dann gilt

(f · g)′(x0) = f ′(x0)g(x0) + f(x0)g′(x0).

Die Existenz der Ableitung (f · g)′(x0) ist wieder eine implizite Teilaussage der obigenFormelzeile.Begrundung:

(f · g)(x)− (f · g)(x0)

x− x0=f(x)(g(x)− g(x0))

x− x0+

(f(x)− f(x0))g(x0)

x− x0

→ f(x0)g′(x0) + f ′(x0)g(x0)

fur x→ x0.(3) Quotientenregel.

Sind f und g differenzierbar in x0, g(x0) 6= 0, dann gilt(f

g

)′(x0) =

f ′(x0)g(x0)− f(x0)g′(x0)

g(x0)2.

Die Existenz der Ableitung auf der linken Seite ist wieder eine implizite Teilaussage derobigen Formelzeile.Begrundung 1: Ahnlich wie oben, siehe [22].Begrundung 2: Folgt unten aus Kettenregel

2Hier haben wir benutzt: sind g : D −→ R und h : D −→ R Funktionen, x0 ein Haufungspunkt von D und

existieren limx→x0 g(x) und limx→x0 h(x), dann existiert auch limx→x0 (g(x)h(x)) und es gilt

limx→x0

(g(x)h(x)) =

(limx→x0

g(x)

)(limx→x0

h(x)

).

Dies ist eine leichte Ubungsaufgabe. Analoges gilt fur Summen, Differenzen und, falls limx→x0 h(x) 6= 0, auch fur die

Quotientenfuntion x 7→ g(x)/h(x) nach Einschrankung des Definitionsbereichs auf D∩h#(Rr {0}) = Drh#({0}).


(4) Kettenregel.Sei f : D −→ R, g : E −→ R mit f#(D) ⊂ E. Sei f in x0 ∈ D differenzierbar und sei gin f(x0) differenzierbar. Dann gilt

(g ◦ f)′(x0) = g′(f(x0))f ′(x0).

Die Existenz der Ableitung auf der linken Seite ist wieder eine implizite Teilaussage derobigen Formelzeile.Begrundung: fur y0 := f(x0) Wir rechnen

(g ◦ f)(x)− (g ◦ f)(x0)

x− x0=g(f(x))− g(y0)

f(x)− y0· f(x)− f(x0)

x− x0

Aus

limy→y0

g(y)− g(y0)

y − y0= g′(y0)

und Lemma 1.13 in Kapitel 4 folgt

limx→x0

g(f(x))− g(y0)

f(x)− y0= g′(y0)

Wir erhalten

limx→x0

(g ◦ f)(x)− (g ◦ f)(x0)

x− x0= g′(y0)f ′(x0)

Begrundung der Quotientenregel: Sei h(x) := 1/x. Dann(1

g

)′(x0) = (h ◦ g)′(x0) = − 1

g(x0)2g′(x0)

(f

g

)′(x0) = f ′(x0)

1

g(x0)+ f(x0)

(− 1

g(x0)2g′(x0)

)=f ′(x0)g(x0)− f(x0)g′(x0)

g(x0)2

Bemerkung 1.5. Sei D ⊂ R, f : D −→ R injektiv und stetig.

(1) Ist D ein Intervall, dann ist f streng monoton. Denn angenommen f ist nicht streng monoton,dann gibt es a, b, c ∈ D mit a < b < c und (f(a) < f(b) > f(c) oder f(a) > f(b) < f(c)). Diesergibt mit dem Zwischenwertsatz einen Widerspruch zur Injektivitat.

(2) Ist D offen, dann auch f#(D). Denn sei y ∈ f#(D), dann schreibe y = f(x). Wahle a, b ∈ Dso dass x ∈ (a, b) ⊂ [a, b] ⊂ D. Wegen (1) ist f |[a,b] streng monoton. O.B.d.A. streng monotonwachsend (sonst ersetze x 7→ f(x) durch x 7→ f(−x)). Somit gilt y ∈ (f(a), f(b)) ⊂ f#(D).

(3) Ist D offen und f differenzierbar in x0 ∈ D und f−1 differenzierbar in f(x0), dann gilt

1 = id′D(x0) = (f−1)′(f(x0)) (f ′(x0)).

Also f ′(x0) 6= 0.

1. DEFINITION UND ELEMENTARE EIGENSCHAFTEN 139

PROPOSITION 1.6 (Ableitung der Umkehrfunktion.). Sei D offen, f : D −→ R injektiv undstetig, und sei f differenzierbar in x0 ∈ D, f ′(x0) 6= 0. Dann ist f−1 differenzierbar in y0 := f(x0)und

(f−1)′(y0) =1

f ′(x0).

Beweis. Wahle a, b ∈ D, so dass x0 ∈ (a, b) ⊂ D. Dann ist f |(a,b) streng monoton. y = f(x),y0 = f(x0).

f−1(y)− f−1(y0)

y − y0=

x− x0

f(x)− f(x0)

y→y0−→ 1

f ′(x0),

denn mit y → y0 geht auch x→ x0, da f−1 stetig ist (Satz 2.7 und Lemma 1.13 in Kapitel 4).

Beispiel 1.7.

(1) Wir betrachten exp : R→ R.

exp′(x) = limh→0

exp(x+ h)− exp(x)

(x+ h)− x= limh→0

((expx)

exp(h)− exp(0)

h

)= (expx) lim

h→0

(exph)− 1

h= (expx) lim

h→0

( ∞∑n=1

1

n!hn−1

)(∗)= expx.

Bei (∗) haben wir genutzt, dass wir wegen Lemma 3.1 in Kapitel 4 wissen, dass∣∣∣ ∞∑n=2

1

n!hn−1

∣∣∣ ≤ ∞∑n=2

∣∣ 1

n!hn−1

∣∣ ≤ ∞∑n=2

∣∣hn−1∣∣ =

|h|1− |h|

,

falls |h| < 1 und dies konvergiert gegen 0 fur h→ 0.(2) Aus log = (exp)−1 folgt dann mit Proposition 1.6 fur x ∈ R>0

log′(x) =1

exp(log x)=

1

x.

Beispiel 1.8. Sei f : R>0 −→ R, f(x) = xa, a ∈ Q. Dann gilt

(1.9) f ′(x0) = axa−10 .

Dies zeigt man

• fur a ∈ N mit id′R(x0) = 1 und der Produktregel.• fur a = 1/n, n ∈ N r {0} mit Umkehrfunktion. Sei f(x) = xa = n

√x. Dann f = g−1 mit

g(x) = xn.

f ′(x0) =1

g′(f(x0))=

1

n( n√x0)n−1

= ax(1−n)/n0 = axa−1

0 .

• Dann fur a ∈ Q≥0 mit der Kettenregel xp/q = q√xp.


• Dann fur a ∈ Q<0 mit der Quotientenregel

Ein anderer Beweis gilt sogar fur alle a ∈ R:3

f(x) = xa = exp(a log x)

f ′(x) = exp′(a log x) · (a log′ x) = exp(a log x) · ax

= xa · ax

= axa−1 ,

und somit (1.9) fur alle a ∈ R.30.1.

2. Lokale Extrema

Definition 2.1. Sei (M,d) ein metrischer Raum, f : M −→ R, x0 ∈ M . Wir sagen f hat einlokales Maximum (bzw. lokales Minimum) in x0, falls es eine Umgebung U von x0 gibt, so dass

∀x ∈ U : f(x) ≤ f(x0) (bzw. f(x) ≥ f(x0)).

lokales Extremum in x0 :⇐⇒ lokales Maximum oder Minimum in x0

SATZ 2.2. Sei D ⊂ R offen, f : D −→ R, f differenzierbar in x0 ∈ D. Wenn f ein lokalesExtremum in x0 besitzt, so gilt f ′(x0) = 0.

Beweis. O.B.d.A. lokales Maximum in x0.

f(x)− f(x0)

x− x0≤ 0 fur x > x0, x ∈ U

Somit f ′(x0) ≤ 0.

f(x)− f(x0)

x− x0≥ 0 fur x < x0, x ∈ U

Somit f ′(x0) ≥ 0.

3. Mittelwertsatze

Wiederholung: (Folgerung 5.23 aus Kapitel 4)

Seien a, b ∈ R, a ≤ b, f : [a, b]→ R stetig. Dann nimmt f ein Maximum und ein Minimum an, d.h.es gibt x1, x2 ∈ [a, b], so dass fur alle x ∈ [a, b]:

f(x1) ≤ f(x) ≤ f(x2).

SATZ 3.1 (Satz von Rolle, benannt nach Michel Rolle, 1652–1719). Sei a < b. Sei f : [a, b] −→ Rdifferenzierbar4 auf (a, b) und stetig auf [a, b] und f(a) = f(b). Dann existiert ein c ∈ (a, b) mitf ′(c) = 0.

3Er gilt sogar fur alle a ∈ C, wenn man obige Definitionen sinngemaß auf Funktionen f : D → C mit D ⊂ Rverallgemeinert.

4Differenzierbar auf A (bzw. stetig auf A) bedeutet differenzierbar (bzw. stetig) in allen x ∈ A.

https://de.wikipedia.org/wiki/Michel_Rolle

3. MITTELWERTSATZE 141

Zeichnung zu Satz von Rolle

Beweis. A := [a, b], wahle x1 und x2 wie oben.1. Fall: x1 ∈ {a, b} und x2 ∈ {a, b}. Dann gilt

f(a) = f(b) = max f#([a, b]) = min f#([a, b])

Also f konstant, also f ′(x0) = 0 fur alle x0 ∈ (a, b).2. Fall: x1 ∈ (a, b) oder x2 ∈ (a, b), o.B.d.A. x1 ∈ (a, b). Dann gilt f ′(x1) = 0 wegen Satz 2.2.

SATZ 3.2 (1. Mittelwertsatz). Sei a < b. Sei f : [a, b] −→ R differenzierbar auf (a, b) und stetigauf [a, b]. Dann existiert ein c ∈ (a, b) mit

f(b)− f(a) = (b− a)f ′(c).

Zeichnung zu 1. Mittelwertsatz

Beweis.

F (x) := f(x)− f(b)− f(a)

b− a(x− a)

F (a) = f(a) = F (b). Wende den Satz von Rolle an.

0 = F ′(c) = f ′(c)− f(b)− f(a)

b− a

SATZ 3.3 (2. Mittelwertsatz). Sei a < b. Seien f, g : [a, b] −→ R differenzierbar auf (a, b) undstetig auf [a, b]. Ferner gelte fur alle x ∈ (a, b): g′(x) 6= 0. Dann existiert ein c ∈ (a, b) mit

f(b)− f(a)

g(b)− g(a)=f ′(c)

g′(c).

Beweis. Der Satz von Rolle liefert: g(b) 6= g(a). Definiere

F (x) := f(x)− f(a)− f(b)− f(a)

g(b)− g(a)(g(x)− g(a)).

Also F (a) = F (b) = 0. Nach dem Satz von Rolle gibt es ein c ∈ (a, b) mit

0 = F ′(c) = f ′(c)− f(b)− f(a)

g(b)− g(a)g′(c).


KOROLLAR 3.4. Sei f : (a, b) −→ R differenzierbar, so gilt:

f ′(x) > 0 fur alle x ∈ (a, b) =⇒ f ist streng monoton wachsend

f ′(x) < 0 fur alle x ∈ (a, b) =⇒ f ist streng monoton fallend

f ′(x) ≥ 0 fur alle x ∈ (a, b)⇐⇒ f ist monoton wachsend

f ′(x) ≤ 0 fur alle x ∈ (a, b)⇐⇒ f ist monoton fallend

f ′(x) = 0 fur alle x ∈ (a, b)⇐⇒ f ist konstant

Beweis. Die =⇒-Pfeile folgen direkt aus dem 1. Mittelwertsatz. Sei nun f monoton wachsend, dann

gilt f ′(x0) = limx→x0

f(x)−f(x0)x−x0

≥ 0. Und analog folgt aus”monoton fallend“ dann f ′(x0) ≤ 0.

Der dritte ⇐⇒-Pfeil folgt aus den beiden ersten.

4. Hohere Ableitungen und Taylorscher Satz

Sei I ⊂ R ein offenes Intervall.

C0(I) := {f : I −→ R | f stetig}Ist f auf I differenzierbar, so erhalten wir f ′ : I −→ R, x 7→ f ′(x).

Falls zusatzlich f ′ stetig ist, so nennen wir f stetig differenzierbar .

Ist f ′ differenzierbar, so nennt man f zweimal differenzierbar.. . . . Ist f ′ k-mal differenzierbar, sosagen wir: f ist (k + 1)-mal differenzierbar.

f (0) := f , f (1) := f ′, f (k+1) := (f ′)(k).

f nennt man (k+1)-mal differenzierbar in x0 ∈ I, wenn f k-mal differenzierbar auf einer Umgebungvon x0 ist und f (k) in x0 differenzierbar ist.

Fur k ∈ N nennt man

Ck(I) := {f : I −→ R | f ist k-mal differenzierbar und f (k) ∈ C0(I)}

die Menge der k-mal stetig differenzierbaren Funktionen.

C∞(I) :=⋂k∈N C

k(I), die Menge der unendlich oft differenzierbaren Funktionen, glatt = unendlichoft differenzierbar.

SATZ 4.1. Sei f : (a, b) −→ R differenzierbar auf (a, b) und 2-mal differenzierbar in x0 ∈ (a, b).

(1) Es gelte f ′(x0) = 0 und f ′′(x0) < 0. Dann besitzt f in x0 ein lokales Maximum.(2) Es gelte f ′(x0) = 0 und f ′′(x0) > 0. Dann besitzt f in x0 ein lokales Minimum.(3) Besitzt f in x0 ein lokales Maximum, so gilt f ′(x0) = 0 und f ′′(x0) ≤ 0.(4) Besitzt f in x0 ein lokales Minimum, so gilt f ′(x0) = 0 und f ′′(x0) ≥ 0.

4. HOHERE ABLEITUNGEN UND TAYLORSCHER SATZ 143

Beweis.Zu (1): Die Funktion

g(x) :=

{f ′(x)−f ′(x0)

x−x0fur x 6= x0

f ′′(x0) fur x = x0

ist stetig in x0. Aus f ′′(x0) < 0 folgt dann mit dem ε-δ-Kriterium: Zu ε := |f ′′(x0)|/2 gibt es dannein δ > 0, so dass fur alle x ∈ (x0 − δ, x0 + δ) gilt:

x ∈ (a, b) und

∣∣∣∣f ′(x)− f ′(x0)

x− x0− f ′′(x0)

∣∣∣∣ < ε.

Daraus folgt

f ′(x)−

=0︷︸︸︷f ′(x0)

x− x0< f ′′(x0) + ε =

1

2f ′′(x0) < 0.

Also gilt f ′(x) < 0 fur x ∈ (x0, x0 +δ) und f ′(x) > 0 fur x ∈ (x0−δ, x0). Dies impliziert, zusammenmit Korollar 3.4 und der Stetigkeit von f in x0, dass f(x0) = max f#((x0 − δ, x0 + δ)).

Zu (2): Analog.

Zu (3): Es folgt zunachst f ′(x0) = 0. Wenn f ′′(x0) > 0 ware, so hatte f in x0 ein lokales Maximumund Minimum, ware also konstant auf einer Umgebung von x0. Somit f ′′(x0) = 0. Widerspruch.

Zu (4): Analog.

SATZ 4.2 (Satz von Taylor). Sei f : (a, b) −→ R (n + 1)-mal differenzierbar, x, x0 ∈ (a, b).Definiere das Restglied Rx0

n (x) durch

f(x) = f(x0) + (x− x0)f ′(x0) +(x− x0)2

2!f (2)(x0) + · · ·+ (x− x0)n

n!f (n)(x0) +Rx0

n (x)

=

n∑j=0

(x− x0)j

j!f (j)(x0) +R x0

n (x)

Dann gilt:

(1) limx→x0

Rx0n (x)

(x− x0)n+1existiert und ist gleich

f (n+1)(x0)

(n+ 1)!.

(2)Rx0n (x)

(x− x0)n+1=f (n+1)(x0 + ϑ(x− x0))

(n+ 1)!fur ein ϑ ∈ (0, 1).

Lagrangesche Restglieddarstellung

Bemerkung: Der Fall n = 0 ist der 1. Mittelwertsatz.


Beweis. Wir fixieren ein x0. Setze g(x) := Rx0n (x), x 6= x0. Man rechnet nach 0 = g(x0) = g′(x0) =

g(2)(x0) = · · · = g(n)(x0) und g(n+1)(x0) = f (n+1)(x0).

Rx0n (x)

(x− x0)n+1=

g(x)− g(x0)

(x− x0)n+1 − (x0 − x0)n+1

2.MWS=

g′(ξ1)

(n+ 1)(ξ1 − x0)n

=g′(ξ1)− g′(x0)

(n+ 1)(ξ1 − x0)n − (n+ 1)(x0 − x0)n

2.MWS=

g(2)(ξ2)

n(n+ 1) (ξ2 − x0)n−1

...

=g(n)(ξn)− g(n)(x0)

(n+ 1)! (ξn − x0)

2.MWS=

g(n+1)(ξn+1)

(n+ 1)!=f (n+1)(ξn+1)

(n+ 1)!

fur geeigenete ξj , mit x0 < ξn+1 < ξn < · · · < ξ1 < x oder x0 > ξn+1 > ξn > · · · > ξ1 > x. Hierausfolgt Teil (2) des Satzes.

In der zweitletzten Zeile der Umformung steht (bis auf den Faktor (n+1)!) der Differenzenquotientvon g(n), der fur ξn → x0 gegen

1

(n+ 1)!g(n+1)(x0) =

1

(n+ 1)!f (n+1)(x0)

konvergiert.

Wegen |ξn − x0| ≤ |x− x0| haben wir dieselbe Aussage auch im Limes x→ x0. Somit

limx→x0

Rx0n (x)

(x− x0)n+1=

1

(n+ 1)!f (n+1)(x0)

Somit gilt auch (1).

Definition 4.3. Sei f : (a, b) −→ R n-mal differenzierbar, x0 ∈ (a, b). Dann nennt man

T x0n f (x) :=

n∑j=0

f (j)(x0)

j!(x− x0)j

das Taylor-Polynom n-ten Grades von f mit Entwicklungspunkt x0. Ist f ∈ C∞((a, b)), dann nenntman

T x0f (x) =

∞∑j=0

f (j)(x0)

j!(x− x0)j

die Taylorreihe von f mit Entwicklungspunkt x0.

4. HOHERE ABLEITUNGEN UND TAYLORSCHER SATZ 145

!ACHTUNG!. Die Konvergenz der Taylor-Reihe ist zunachst unklar. Und selbst wenn sie kon-vergiert, ist unklar, ob sie mit der ursprunglichen Funktion ubereinstimmt. Man kann zeigen: jedePotenzreihe (also auch jede Potenzreihe mit Konvergenzradius 0) ist die Taylor-Reihe einer glattenFunktion, siehe https://www.semanticscholar.org/paper/Peano’s-Unnoticed-Proof-of-Borel’s-Theorem-Besenyei/3f06a77700dfdfb470d1786fc9348b1865b286ca fur einen Beweis.

In Analysis II und III werden wir sehen: Ist f durch eine konvergente Potenzreihe gegeben, dannstimmt die Taylorreige T 0f mit Entwicklungspunkt 0 mit dieser Potenzreiheuberein. 1.2.

Anwendung: Potenzreihendarstellung der Logarithmus-Funktion.

Entwicklungspunkt: x0 = 1

log′(x) = 1x , log(j)(x) = (−1)j−1 (j−1)!

xj

log(1) = 0, log(j)(1) = (−1)j−1(j − 1)!

T 1n log(x) =

log(1)

0!(x− 1)0︸︷︷︸0

+∑nj=1

(−1)j−1(j−1)!j! (x− 1)j =

∑nj=1

(−1)j−1

j (x− 1)j

Fragen 4.4.

• Konvergiert die Potenzreihe T 1log (x) fur manche x 6= 1? In anderen Worten: ist derKonvergenzradius der Reihe positiv?• Falls ja: gilt im Konvergenzbereich log(x) = T 1log (x)?

Antwort: Ja fur x ∈ (0, 2).

Wir wollen die Aussage fur x ∈ [1, 2) zeigen. Fur x ∈ (0, 1) kann man die Ausage mit einer anderenVersion des Satzes von Taylor zeigen, der Cauchyschen Restglieddarstellung, siehe [1, Kap. IV,Korollar 3.8 und Anwendungen].

Nach dem Satz von Taylor existiert ein ϑ ∈ (0, 1) mit

log x− T 1n log (x) = R1

n(x) =(x− 1)n+1

(n+ 1)!log(n+1)(1 + ϑ(x− 1))

= (−1)n(x− 1)n+1

(n+ 1)!

n!

(1 + ϑ(x− 1))n+1

Also

| log x− T 1n log (x)| =

∣∣∣∣ (x− 1)n+1

(n+ 1)!

n!

(1 + ϑ(x− 1))n+1

∣∣∣∣ ≤ 1

n+ 1

Somit T 1n log (x)

n→∞−→ log(x) fur x ∈ [1, 2).

https://www.semanticscholar.org/paper/Peano's-Unnoticed-Proof-of-Borel's-Theorem-Besenyei/3f06a77700dfdfb470d1786fc9348b1865b286ca

https://www.semanticscholar.org/paper/Peano's-Unnoticed-Proof-of-Borel's-Theorem-Besenyei/3f06a77700dfdfb470d1786fc9348b1865b286ca


PROPOSITION 4.5. Die Taylorreihe von log : R>0 → R mit Entwicklungspunkt 1 ist

T 1log (x) =

∞∑j=1

(−1)j−1

j(x− 1)j .

Die Reihe konvergiert fur |x − 1| < 1, also fur insbesondere fur x ∈ (0, 2). Außerdem gilt fur allex ∈ (0, 2):

log x = T 1log (x).

Beweis. Dass die Reihe fur x ∈ [1, 2) gegen log x konvergiert, wurde oben gezeigt. Dass die Reihefur |x − 1| < 1 konvergiert, folgt (z.B.) aus dem Quotientenkriterium. Die Aussage T 1log (x) =log(x) fur x ∈ (0, 1) zeigen wir aus Zeitgrunden nicht mehr, einen Beweis findet man wieder in [1,Kap. IV, Korollar 3.8 und Anwendungen].

Ubrigens: In der Analysis III werden Sie Satze kennenlernen, die besagen: wenn log x = T 1log (x)fur alle x ∈ [1, 2) gilt, dann auch fur alle x ∈ (0, 1).

KAPITEL 6

Integral-Rechnung fur Funktionen einer Veranderlichen

Ziel: Integration von Funktionen. Flacheninhalt unter dem Graphen einer Funktion.

Graph einer Funktion. Flacheninhalt darunter im Intervall [a, b] markiert.

1. Partitionen und Treppenfunktionen

Sei I eine Menge. (Partielle) Ordnung auf Abb(I,R) = RI 3 f, g:

f ≤ g :⇐⇒ ∀x ∈ I : f(x) ≤ g(x).

Definition 1.1. Eine Zerlegung oder Partition von I = [a, b], a, b ∈ R ist ein Tupel (t0, t1, . . . , tk) ∈Rk+1 mit a = t0 < t1 < · · · < tk = b. Wir schreiben Z = {t0 < t1 < · · · < tk}. Man nenntZ1 = {s0 < s1 < · · · < s`} eine Verfeinerung von Z2 = {t0 < t1 < · · · < tk}, wenn Z1 durchHinzufugen von Punkten aus Z2 entsteht, in anderen Worten falls

{ti | i = 0, 1, . . . , k} ⊂ {si | i = 0, 1, . . . , `}.

Zu zwei Zerlegungen Z1 und Z2 von [a, b] gibt es Zerlegung Z3 die feiner als Z1 und feiner als Z2

ist: vereinige hierzu die Mengen der Zerlegungspunkte und ordne sie.

Definition 1.2. Eine Funktion f : [a, b] → R heißt Treppenfunktion, falls es eine ZerlegungZ = {t0 < t1 < · · · < tk} gibt, so dass f |(tj−1,tj) konstant ist fur alle j ∈ {1, 2, . . . , k}. Wir nennendieses Z eine Zerlegung, die zu der Treppenfunktion passt. Jede Verfeinerung einer passendenZerlegung passt ebenfalls. Die Menge der Treppenfunktionen [a, b]→ R nennen wir T [a, b].

Treppenfunktionen sind beschrankt, da sie nur endlich viele Werte annehmen.

LEMMA 1.3. Sind f, f1, f2 ∈ T [a, b], λ1, λ2 ∈ R, dann folgt auch

(a) λ1f1 + λ2f2 ∈ T [a, b], d.h. T [a, b] ist ein Vektorraum.1

(b) f1f2 ∈ T [a, b], d.h. T [a, b] ist ein Ring bzw. eine Algebra.2

1Hier wird wieder wie immer definiert (λ1f1 + λ2f2)(x) := λ1f1(x) + λ2f2(x).2Hier wird wieder wie immer definiert (f1f2)(x) := f1(x)f2(x).

147

148 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN

(c) max{f1, f2} ∈ T [a, b] und min{f1, f2} ∈ T [a, b] 3

(d) |f | = max{f,−f} ∈ T [a, b]

Beweis klar.

Definition 1.4. Fur eine Treppenfunktion f ∈ T [a, b] mit passender Zerlegung Z = {t0 < t1 <· · · < tk} definieren wir das Integral∫ b

a

(Z) f(x) dx :=

k∑j=1

(tj − tj−1) f

(tj−1 + tj

2

)∈ R.

Positive Treppenfunktion. Die Flache darunter ist bunt und ergibt das Integral

Wenn Z1 und Z2 zu einer Treppenfunktion f passen, so gilt∫ b

a

(Z1) f(x) dx =

∫ b

a

(Z2) f(x) dx.

Wir schreiben hierfur deswegen ab sofort einfach∫ b

a

f(x) dx.

PROPOSITION 1.5. Die Abbildung∫ ba

: T [a, b]→ R ist

(1) linear, d.h.

∀f1, f2 ∈ T [a, b] : ∀λ1, λ2 ∈ R :

∫ b

a

(λ1f1(x) + λ2f2(x)) dx = λ1

∫ b

a

f1(x) dx+ λ2

∫ b

a

f2(x) dx

(2) monoton, d.h.

∀f1, f2 ∈ T [a, b] :(f1 ≤ f2 =⇒

∫ b

a

f1(x) dx ≤∫ b

a

f2(x) dx)

Beweis klar aus der Konstruktion des Integrals.

2. Das Riemann-Integral

f ∈ R[a,b] ist nach oben beschrankt ⇐⇒ ∃g ∈ T [a, b] : g ≥ f ⇐⇒ (T [a, b])≥f 6= ∅

f ∈ R[a,b] ist nach unten beschrankt ⇐⇒ ∃g ∈ T [a, b] : g ≤ f ⇐⇒ (T [a, b])≤f 6= ∅

3Hier wird wieder wie immer definiert max{f1, f2}(x) := max{f1(x), f2(x)} und min{f1, f2}(x) :=

min{f1(x), f2(x)}

2. DAS RIEMANN-INTEGRAL 149

Definition 2.1. Sei f : [a, b] → R eine beschrankte Funktion. Wir definieren das riemannscheOberintegral als ∫ b

a

f(x) dx := inf

{∫ b

a

g(x) dx∣∣∣ g ∈ (T [a, b])≥f

}und das riemannsche Unterintegral als∫ b

a

f(x) dx := sup

{∫ b

a

g(x) dx∣∣∣ g ∈ (T [a, b])≤f

}

Fur die beschrankte Funktion f gilt

−∞ <

∫ b

a

f(x) dx ≤∫ b

a

f(x) dx < ∞

Ist f ∈ T [a, b], so gilt ∫ b

a

f(x) dx =

∫ b

a

f(x) dx =

∫ b

a

f(x).

Definition 2.2. Man nennt f ∈ R[a,b] Riemann-integrierbar , falls f beschrankt ist und falls∫ b

a

f(x) dx =

∫ b

a

f(x) dx.

In diesem Fall nennt man ∫ b

a

f(x) dx :=

∫ b

a

f(x) dx

das Riemann-Integral von f .

R[a, b] := {f ∈ R[a,b] | f ist Riemann-integrierbar}

LEMMA 2.3 (Riemannsches Kriterium). Sei f ∈ R[a,b]. Dann gilt

f ∈ R[a, b] ⇐⇒ ∀ε ∈ R>0 : ∃gu, go ∈ T [a, b] : ( gu ≤ f ≤ go)∧

(∫ b

a

go(x) dx−∫ b

a

gu(x) dx ≤ ε

).

Fur gu und go wie oben gilt dann wegen der Monotonie∫ b

a

gu(x) dx ≤∫ b

a

f(x) dx ≤∫ b

a

go(x) dx.

Eine stetige Funktion mit Treppenfunktionen gu darunter und go daruber.


Beweis.

”=⇒“: Auf Grund der Definition des Oberintegrals gibt es eine Treppenfunktion go ≥ f mit∫ bago(x) dx ≤

∫ baf(x) dx+ ε/2. Auf Grund der Definition des Unterintegrals gibt es eine Treppen-

funktion gu ≤ f mit∫ bagu(x) dx ≥

∫ baf(x) dx−ε/2. Da da Oberintegral von f mit dem Unterintegral

ubereinstimmt, gilt ∫ b

a

go(x) dx−∫ b

a

gu(x) dx ≤ ε

”⇐=“: Gilt die rechte Seite, so haben wir fur jedes ε > 0:

0 ≤∫ b

a

f(x) dx−∫ b

a

f(x) dx ≤∫ b

a

go(x) dx−∫ b

a

gu(x) dx ≤ ε.

Daraus folgt die Riemann-Integrierbarkeit.Mi 6.2.

LEMMA 2.4. Sei a ≤ b. Sind f, f1, f2 ∈ R[a, b], λ1, λ2 ∈ R dann gilt:

(a) −f ∈ R[a, b] und ∫ b

a

(−f)(x) dx = −∫ b

a

f(x) dx .

(b) λ1f1 + λ2f2 ∈ R[a, b], d.h. R[a, b] ist ein Vektorraum. Die Abbildung∫ b

a

: R[a, b]→ R, f 7→∫ b

a

f(x) dx

ist linear.(c) f1f2 ∈ R[a, b], d.h. R[a, b] ist ein Ring bzw. eine Algebra.(d) max{f1, f2} ∈ R[a, b] und min{f1, f2} ∈ R[a, b](e) |f | = max{f,−f} ∈ R[a, b]

Beweis.(a): Aus

g ∈ (T [a, b])≤−f ⇐⇒ −g ∈ (T [a, b])≥f

folgt ∫ b

a

(−f)(x) dx = −∫ b

a

f(x) dx

und genauso ∫ b

a

(−f)(x) dx = −∫ b

a

f(x) dx .


(b):Fall λ1 ≥ 0 und λ2 ≥ 0: Sei f1,u ∈ (T [a, b])≤f1 und f2,u ∈ (T [a, b])≤f2 , dann gilt wegen Lem-ma 1.3 (a) λ1f1,u + λ2f2,u ∈ (T [a, b])≤λ1f1+λ2f2 . Es folgt∫ b

a

(λ1f1(x) + λ2f2)(x) dx ≥∫ b

a

(λ1f1,u + λ2f2,u)(x) dx

Prop. 1.5(1)= λ1

∫ b

a

f1,u(x) dx+ λ2

∫ b

a

f2,u(x) dx

und somit durch Bildung der Suprema∫ b

a

(λ1f1(x) + λ2f2)(x) dx ≥ λ1

∫ b

a

f1(x) dx+ λ2

∫ b

a

f2(x) dx.

Analog mit oberen Schranken:∫ b

a

(λ1f1(x) + λ2f2)(x) dx ≤ λ1

∫ b

a

f1(x) dx+ λ2

∫ b

a

f2(x) dx.

Der allgemeine Fall: folgt dann mit (a).

(d): Wir zeigen zunachst: Ist f ∈ R[a, b], dann auch f+ := max{f, 0}.

Sei also f ∈ R[a, b] und ε > 0 gegeben. Wir nehmen g, h ∈ T [a, b] mit g ≤ f ≤ h und∫ bah(x) dx−∫ b

ag(x) dx ≤ ε. Wir setzen g+ := max{g, 0} ∈ T [a, b] und h+ := max{h, 0} ∈ T [a, b]. Dann gilt

g+ ≤ f+ ≤ h+ und

h+(x)− g+(x) =

{h(x)− g+(x) falls h(x) ≥ 0

0 falls h(x) < 0

}≤ h(x)− g(x)

Also ∫ b

a

h+(x) dx−∫ b

a

g+(x) dx ≤∫ b

a

h(x) dx−∫ b

a

g(x) dx ≤ ε.

Also ist dann f+ ∈ R[a, b].

Wegen max{f1, f2} = f2 + max{f1− f2, 0} und min{f1, f2} = f2−max{f2− f1, 0} folgt dann (d).

(c):Der Fall f1 ≥ 0 und f2 ≥ 0: Bestimme zu j ∈ {1, 2}: fj,u, fj,o ∈ T [a, b] mit

0 ≤ fj,u ≤ fj ≤ fj,o ≤ Cj := sup{fj(x) | x ∈ [a, b]}

und ∫ b

a

fj,o(x) dx−∫ b

a

fj,u(x) dx ≤ ε.


Aus Lemma 1.3 (b) folgt f1,uf2,u ∈ T [a, b] und f1,of2,o ∈ T [a, b]. Ferner gilt∫ b

a

f1,o(x)f2,o(x) dx−∫ b

a

f1,u(x)f2,u(x) dx

≤∫ b

a

f1,o(x)(f2,o(x)− f2,u(x)

)dx+

∫ b

a

(f1,o(x)− f1,u(x)

)f2,u(x) dx

≤ C2ε+ C1ε .

Der allgemeine Fall folgt dann aus der Gleichung

f1f2 = max{f1, 0}max{f2, 0} −max{−f1, 0}max{f2, 0}−max{f1, 0}max{−f2, 0}+ max{−f1, 0}max{−f2, 0}.

(e): folgt direkt aus (d).

LEMMA 2.5 (Monotonie). Seien, f1, f2 ∈ R[a, b]. Ist f1 ≤ f2, so haben wir∫ b

a

f1(x) dx ≤∫ b

a

f2(x) dx.

Beweis. 0 ∈ T [a, b], 0 ≤ f2 − f1. Es folgt

0 =

∫ b

a

0 dx(∗)≤∫ b

a

(f2 − f1)(x) dxLemma 2.4(b)

=

∫ b

a

f2(x) dx−∫ b

a

f1(x) dx .

Die Ungleichung (∗) gilt nach Definition des Unterintegrals: 4 es ist definiert als das Supremumder Menge

A :={∫ b

a

g(x) dx∣∣ g ∈ (T [a, b])≤f

}3∫ b

a

0 dx = 0.

Notation: Fur f : D → R definiere ‖f‖∞ := sup{|f(x)|

∣∣x ∈ D} ∈ [0,∞].

PROPOSITION 2.6. Fur f ∈ R[a, b] gilt:∣∣∣∫ b

a

f(x) dx∣∣∣ ≤ ∫ b

a

|f(x)| dx ≤ ‖f‖∞(b− a)

4 An der Stelle (∗) kann man nicht mit der Monotonie des Integrals argumentieren. Denn die Monotonie fur

Treppenfunktion (Proposition 1.5 (2)) ist nicht anwendbar, da f im allgemeinen keine Treppenfunktion ist. Und die

Monotonie fur Riemann-integrierbare Funktionen wollen wir ja hier erst zeigen. Wenn wir sie verwenden wurden, soware dies ein Zirkelschluss: Ein Beweis, in dem man die zu beweisende Aussage bereits verwendet und der deswegen

nicht zulassig ist.


Beweis. Wegen f = max{f, 0} −max{−f, 0} und |f | = max{f, 0}+ max{−f, 0} folgt∣∣∣∫ b

a

f(x) dx∣∣∣ ≤

∣∣∣∫ b

a

max{f(x), 0} dx︸︷︷︸≥0

−∫ b

a

max{−f(x), 0} dx︸︷︷︸≥0

∣∣∣(∗)≤

∫ b

a

max{f(x), 0} dx+

∫ b

a

max{−f(x), 0} dx

=

∫ b

a

|f(x)| dx,

wobei wir an der Stelle (∗) die Dreiecks-Ungleichung |a− b| ≤ |a|+ |b| benutzt haben.

Wegen |f(x)| ≤ ‖f‖∞ folgt mit der Monotonie∫ b

a

|f(x)| dx ≤∫ b

a

‖f‖∞ dx ≤ ‖f‖∞(b− a).

LEMMA 2.7. Seien a, b, c ∈ R mit a < b < c, und f : [a, c]→ R. Dann gilt

f ∈ R[a, c] ⇐⇒ f |[a,b] ∈ R[a, b] und f |[b,c] ∈ R[b, c]

und wenn f Riemann-integrierbar ist, so gilt∫ c

a

f(x) dx =

∫ b

a

f |[a,b](x) dx+

∫ c

b

f |[b,c](x) dx.

Beweis. Man wahlt wieder geeignete Treppenfunktionen oberhalb und unterhalb von f und setztdiese zusammen oder durchtrennt sie an der Stelle b.

Notation 2.8. Die Integrationsvariable (bis jetzt immer x) kann durch jede andere noch nichtvergebene Variable ersetzt werden:∫ b

a

f(x) dx =

∫ b

a

f(y) dy = · · · =∫ b

a

f(t) dt .

Aber bereits vergebene Variablen durfen nicht als Integrationsvariable benutzt werden, zum Bei-spiel ist ∫ b

a

f(a) da

ist nicht erlaubt.

Gilt [a, b] ⊂ [c, d] und f ∈ R[c, d], dann schreiben wir∫ b

a

f(x) dx :=

∫ b

a

f |[a,b](x) dx.


Gilt a > b, und f ∈ R[b, a], so definieren wir∫ b

a

f(x) dx := −∫ a

b

f(x) dx.

Insbesondere gilt fur alle reelle Zahlen a, b, c ∈ [d, e] ⊂ R und fur alle f ∈ R[d, e]:∫ c

a

f(x) dx =

∫ b

a

f(x) dx+

∫ c

b

f(x) dx.

3. Monotone Funktionen sind Riemann-integrierbar

SATZ 3.1. Sei a, b ∈ R, a < b, und f : [a, b]→ R eine monotone Funktion. Dann ist f ∈ R[a, b].

Beweis. O.B.d.A. sei f monoton wachsend. Sei ε ∈ R>0 gegeben. Zu einer Zahl k ∈ N, die wirnoch geeignet wahlen werden, definieren wir:

tj := a+ jb− ak

.

Insbesondere ist {t0 < t1 < · · · < tk} eine Zerlegung von [a, b]. Wir definieren die Treppenfunktio-nen go, gu ∈ T [a, b], so dass fur alle j ∈ {1, 2, . . . k} und alle x ∈ [tj−1, tj) gilt

go(x) = f(tj), gu(x) = f(tj−1);

und go(b) = gu(b) = f(b).

Bild einer monoton wachsenden Funktion f und von Treppenfunktionen gu, go wie oben.

Da f monoton wachsend ist gilt gu ≤ f ≤ go. Außerdem∫ b

a

go(x) dx =

k∑j=1

(tj − tj−1) go

(tj−1 + tj

2

)=

k∑j=1

b− ak

f(tj),

∫ b

a

gu(x) dx =

k∑j=1

(tj − tj−1) gu

(tj−1 + tj

2

)=

k∑j=1

b− ak

f(tj−1).

Somit ∫ b

a

go(x) dx−∫ b

a

gu(x) dx =b− ak

k∑j=1

f(tj)−k−1∑`=0

f(t`)

=b− ak

(f(b)− f(a))

Wenn wir also bei der obigen Konstruktion der tj , die Zahl k ∈ N so groß wahlen, dass

k ≥ b− aε

(f(b)− f(a)),

dann gilt∫ bago(x) dx −

∫ bagu(x) dx ≤ ε. Mit dem riemannschen Kriterium Lemma 2.3 folgt die

Riemann-Integrierbarkeit.

4. STETIGE FUNKTIONEN SIND RIEMANN-INTEGRIERBAR 155

4. Stetige Funktionen sind Riemann-integrierbar

LEMMA 4.1. Sei f : [a, b]→ R stetig. Dann ist f auch gleichmaßig stetig, d.h.

(4.2) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x, y ∈ [a, b] :(|x− y| < δ =⇒ |f(x)− f(y)| < ε

).

Beweis. Angenommen f ist nicht gleichmaßig stetig. Es gibt dann ein ε > 0, so dass

(4.3) ∀δ ∈ R>0 : ∃x, y ∈ [a, b] :(|x− y| < δ

)∧(|f(x)− f(y)| ≥ ε

).

Zu jedem n ∈ N, und δ := δn := 1/n wahlen wir xn, yn ∈ [a, b] wie in (6.15). Auf Grund des Satzesvon Bolzano-Weierstraß (Korollar 1.35 in Kapitel 2) gibt es eine Teilfolge (xnk)k∈N, so dass

limk→∞

xnk

existiert. Sei x := limk→∞ xnk ∈ [a, b]. Wegen |xnk − ynk | < 1/nk gilt auch x = limk→∞ ynk . Da fstetig ist gilt dann auch

f(x) = limk→∞

f(xnk) = limk→∞

f(ynk),

alsolimk→∞

(f(xnk)− f(ynk)) = 0.

Dies widerspricht jedoch der obigen Wahl von xnk und ynk , denn diese haben wir so gewahlt, dassfur alle k ∈ N die Ungleichung |f(xnk)− f(ynk)| ≥ ε gilt.5

Wir haben gezeigt, dass die Annahme, f sei nicht gleichmaßig stetig, einen Widerspruch impliziert.Also muss f gleichmaßig stetig sein.

SATZ 4.4. Sei f : [a, b]→ R stetig. Dann ist f Riemann-integrierbar. In anderen Worten:

C0([a, b]) ⊂ R[a, b].

Beweis. Zu einem gegebenen ε > 0 wahle δ > 0 wie in (4.2). Dann wahlen wir kε ∈ N r {0} sogroß, dass (b− a)/kε < δ. Definiere ahnlich wie oben

tj := a+ jb− akε

.

Wir definieren die Treppenfunktionen go, gu ∈ T [a, b], so dass fur alle j ∈ {1, 2, . . . k} und allex ∈ [tj−1, tj) gilt

go(x) = sup{f(x) | x ∈ [tj−1, tj)}, gu(x) = inf{f(x) | x ∈ [tj−1, tj)}und go(b) = gu(b) = f(b). Dann gilt 0 ≤ go(x)− gu(x) ≤ ε, und deswegen∫ b

a

go(x) dx−∫ b

a

gu(x) dx ≤ ε(b− a),

und offensichtlich gu ≤ f ≤ go. Mit Lemma 2.3 folgt die Riemann-Integrierbarkeit.

5Und naturlich fur das feste oben gewahlte ε > 0!


!ACHTUNG!. Wenn eine Funktion f : (a, b)→ R stetig ist, so kann man daraus nicht schließen,dass f Riemann-integrierbar ist. Beispiel: Die Funktion f : (0, 1) → R, x 7→ 1/x, ist stetig, abernicht beschrankt und somit auch nicht Riemann-intergierbar.

5. Hauptsatz der Differential- und Integralrechnung

SATZ 5.1 (Hauptsatz der Differential- und Integralrechnung, Teil I). Sei f ∈ R[a, b], γ ∈ [a, b].Definiere

F : [a, b] → R, F (x) :=

∫ x

γ

f(t) dt.

Dann gilt

(1) F ist stetig auf [a, b].(2) Ist f stetig in x0 ∈ (a, b), so ist F differenzierbar in x0, und F ′(x0) = f(x0).

Fr 8.2.

Beweis.

(1) f ∈ R[a, b], also f beschrankt, somit

‖f‖∞(def)= sup

{|f(x)|

∣∣x ∈ [a, b]}<∞.

Sei x, x0 ∈ [a, b].∣∣∣F (x)− F (x0)∣∣∣ =

∣∣∣∣∫ x

x0

f(t) dt

∣∣∣∣ ≤ ∣∣∣∣∫ x

x0

|f(t)| dt∣∣∣∣ ≤ |x− x0| ‖f‖∞

Zu gegebenem ε > 0 wahlen wir nun δ := ε/‖f‖∞ > 0 und dann ist das ε-δ-Kriterium furStetigkeit in x0 erfullt.

(2) ∣∣∣∣F (x)− F (x0)

x− x0− f(x0)

∣∣∣∣ =

∣∣∣∣ 1

x− x0

∣∣∣∣ ∣∣∣∣∫ x

x0

(f(t)− f(x0)) dt

∣∣∣∣≤

∣∣∣∣ 1

x− x0

∣∣∣∣ ∣∣∣∣∫ x

x0

|(f(t)− f(x0))| dt∣∣∣∣

≤ sup{|f(t)− f(x0)|

∣∣∣ t ∈ [x, x0] bzw. t ∈ [x0, x]}

Wir fixieren nun ein ε > 0. Da f in x0 stetig gibt es zu diesem ε > 0 ein δ > 0, so dass fur allet ∈ [a, b] mit |t− x0| ≤ δ gilt:

|f(t)− f(x0)| ≤ ε,insbesondere gilt fur x ∈ [a, b] ∩ [x0 − δ, x0 + δ]:∣∣∣∣F (x)− F (x0)

x− x0− f(x0)

∣∣∣∣ ≤ sup{|f(t)− f(x0)|

∣∣∣ t ∈ [x, x0] bzw. t ∈ [x0, x]}≤ ε.

5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 157

Daraus ergibt sich

limx→x0

(F (x)− F (x0)

x− x0− f(x0)

)= 0

und somit die Behauptung im zweiten Teil.

Ist I 6= ∅ ein Intervall, so sei◦I := (inf I, sup I) das offene Intervall mit denselben Grenzen wie I.

Bsp: I := [a, b],◦I = (a, b). Ist J ein offenes Intervall in R, dann

◦J = J .

Fur offene Teilmengen U definieren wir◦U := U .

Definition 5.2. Sei I ein Intervall oder eine offene Teilmenge von R, und f : I → R. Wir sagenF : I → R ist eine Stammfunktion von f , wenn F stetig ist, F |◦

Idifferenzierbar ist und F ′(x) = f(x)

fur alle x ∈◦I.

Beispiele 5.3.

(1) Der Hauptsatz der Diff.- und Int.-Rechnung I besagt, dass stetige Funktionen f : [a, b]→R immer eine Stammfunktion haben.

(2) Auch stetige Funktionen f : (c, d) → R besitzen immer eine Stammfunktion: wahleγ ∈ (c, d), dann ist F (x) =

∫ xγf(t) dt eine Stammfunktion.

(3) Ist U ⊂ R offen und f : U → R stetig, dann besitzt f ebenfalls eine Stammfunktion.Denn ist U ⊂ R offen, dann gibt es eine Familie offener Intervalle (Uα)α∈A, so dass U =⋃α∈A Uα, Uα∩Uβ = ∅ fur α 6= β6. Man konstruiert nun auf jedem Uα die Stammfunktion

wie in (2).(4) Es gibt Riemann-integrierbare Funktionen ohne Stammfunktion. Beispiel

f : [−1, 1]→ R, f(x) :=

{−1 , falls x ≤ 0

1 , falls x > 0

f ∈ R[−1, 1], da f eine Treppenfunktion ist. Angenommen f hatte eine StammfunktionF : [−1, 1]→ R. Dann gilt F ′(x) = 1 fur x > 0, somit gibt es eine c ∈ R, so dass fur allex ∈ (0, 1) gilt: F (x) = c + x. Es gilt F ′(x) = −1 fur x ≤ 0, somit gibt es ein d ∈ R mirF (x) = d−x fur d ≤ 0. Da F stetig ist, gilt c = d, also F (x) = c+ |x| fur alle x ∈ [−1, 1].Diese Funktion ist nicht in 0 differenzierbar, also ist F keine Stammfunktion.

(5) Es gibt nicht-Riemann-integrierbare Funktionen mit Stammfunktion. Wir definieren:

F : R→ R, F (x) :=

x2 sin

(1

x2

), falls x > 0

0, falls x ≤ 0.

6Man sagt zu letzterer Eigenschaft: (Uα)α∈A ist eine Familie von paarweise disjunkten offenen Intervallen


Dann ist F differenzierbar auf ganz R und somit ist F |[−1,1] eine Stammfunktion vonf := F ′|[−1,1] : [−1, 1]→ R. Man rechnet nach fur j →∞:

xj := (2πj + π)−1/2 → 0

f(xj) = 21√

2πj + πsin (2πj + π)︸︷︷︸

=0

− 2√

2πj + π cos (2πj + π)︸︷︷︸=−1

→ ∞

Deswegen ist f nicht beschrankt und deswegen auch nicht Riemann-integrierbar.

SATZ 5.4 (Hauptsatz der Differential- und Integralrechnung, Teil II). Sei f : [a, b]→ R Riemann-integierbar, und F sei eine Stammfunktion von f . Dann gilt fur x, y ∈ [a, b]:

(5.5)

∫ x

y

f(t) dt = F (x)− F (y).

Beweis.

1. Fall: f ist stetig.F0(x) :=

∫ xyf(t) dt ist eine Stammfunktion von f , und deswegen F (x) = F0(x) + F (y). Daraus

folgt die Aussage.

2. Fall: allgemeinO.B.d.A. y < x. Sei go ∈ T [y, x], go ≥ f , und sei Z = {t0 < t1 < . . . < tk} eine zu go passendeZerlegung von [y, x].

F (x)− F (y) =

k∑j=1

(F (tj−1)− F (tj))

1.MWS=

k∑j=1

(tj − tj−1)F ′(ξj)

fur geeignete ξj ∈ (tj−1, tj). Wir rechnen weiter

F (x)− F (y) =

k∑j=1

(tj − tj−1)f(ξj)

≤k∑j=1

(tj − tj−1)go(ξj)

=

∫ x

y

go(t) dt

5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 159

Da dies fur alle Treppenfunktionen oberhalb von f gilt, folgt durch Infimumsbildung:

F (x)− F (y) ≤∫ x

y

f(t) dt

Die Gleichung

F (x)− F (y) ≥∫ x

y

f(t) dt

zeigt man ganz analog. Da f Riemann-integrierbar ist, folgt die Aussage.

Beispiele 5.6.

(1) Eine Stammfunktion der Funktion f : R → R, x 7→∑nk=0 akx

k ist F : R 7→ R, x 7→∑nk=0

akk+1x

k+1.

(2) Die Stammfunktion der Funktion

f : R→ R, x 7→ 1

x2 + 1

ist F = arctan : R→ (−π/2;π/2) ⊂ R, die Umkehr-Funktion des Tangens. Denn mit

tan′(y) =1

cos2 y=

sin2 y + cos2 y

cos2 y= tan2 y + 1

und mit Proposition 1.6 in Kapitel 5 sieht man

arctan′(x) =1

tan2(arctan(x)) + 1=

1

x2 + 1.

(3) Es gibt viele Tabellen mit vielen Stammfunktionen, siehe zum Beispiel:

http://de.wikipedia.org/wiki/Tabelle_von_Ableitungs-_und_Stammfunktionen

Notation 5.7.

F (x)∣∣∣bx=a

:= F (b)− F (a)

Dann schreibt sich (5.5) als ∫ b

a

f(x) dx = F (x)∣∣∣bx=a

.

C0([a, b]) :={f : [a, b]→ R | f stetig

}f ∈ C1([a, b]) ⇐⇒ f ∈ C0([a, b]), f |(a,b) differenzierbar und f ′ kann man zu einer stetigen Funk-

tionen f ′ : [a, b]→ R fortsetzen.7

7Wir bezeichnen diese Fortsetzung auch einfach mit f ′ und es gilt dann auch

f ′(a) = limx↘a

f(x)− f(a)

x− a, f ′(b) = lim

x↗b

f(x)− f(b)

x− b.

http://de.wikipedia.org/wiki/Tabelle_von_Ableitungs-_und_Stammfunktionen


SATZ 5.8 (Partielle Integration). Seien a, b ∈ R, a < b und f, g ∈ C1([a, b]). Dann∫ b

a

f ′(x)g(x) dx = f(x)g(x)∣∣∣bx=a−∫ b

a

f(x)g′(x) dx

Beweis. x 7→ f(x)g(x) ist Stammfunktion von x 7→ f ′(x)g(x) + f(x)g′(x).

Beispiel 5.9. Zu berechnen ist A :=∫ ba

cos3 x dx. Setze f(x) = sinx und g(x) = cos2 x. Es folgtmit partieller Integration:

A =

∫ b

a

f ′(x)g(x) dx = sinx cos2 x∣∣∣bx=a−∫ b

a

(sinx)(−2) sinx cosx dx

Wenn wir nun sin2 x = 1− cos2 x nutzen, so ergibt sich

A = sinx cos2 x∣∣∣bx=a

+ 2

∫ b

a

cosx dx− 2A.

Also

A =1

3(sin b cos2 b− sin a cos2 a)− 2

3(sin b− sin a).

SATZ 5.10 (Integration durch Substitution). Seien a, b, c, d ∈ R, a < b und c < d. Gegeben sei

• f ∈ C0([a, b]),• ϕ ∈ C1([c, d]) mit ϕ#([c, d]) ⊂ [a, b]

Dann gilt ∫ ϕ(d)

ϕ(c)

f(s) ds =

∫ d

c

f(ϕ(t))ϕ′(t) dt.

Beweis. Die Integranden, d.h. die Funktionen f und t 7→ f(ϕ(t))ϕ′(t) =: f(t) sind stetig, alsoRiemann-integrierbar und besitzen Stammfunktionen. Sei F : [a, b] → R eine Stammfunktion

von f , dann ist nach Kettenregel F ◦ ϕ : [c, d]→ R eine Stammfunktion von f .∫ ϕ(d)

ϕ(c)

f(s) ds = F (ϕ(d))− F (ϕ(c)) =

∫ d

c

f(ϕ(t))ϕ′(t) dt.

Merkregel: Die Leibnizsche Differentialschreibweise (= Verwendung von den”unendlich kleinen“

Zahlen ds, dt) liefert eine gute Merkregel. 8

s = ϕ(t),

8Sie ist nicht mathematisch prazise, denn es bleibt ja unklar, was eine unendlich kleine Zahl denn sein soll. Sie

ist aber sehr effizient als Merkregel.

6. UNEIGENTLICHE RIEMANN-INTEGRALE 161

also auch f(ϕ(t)) = f(s). Schreibe

ϕ′(t) = limt→t

ϕ(t)− ϕ(t)

t− t= limt→t

s− st− t

=ds

dt

Man lost aufds = ϕ′(t) dt

und ersetzt die t-Integrationsgrenzen c und d durch die s-Integrationsgrenzen ϕ(c) und ϕ(d). Undman hat die Subsitutionsformel.

Typische Anwendungen.1.) ∫ b

a

tet2

dt =1

2

∫ b2

a2es ds =

1

2eb

2

− 1

2ea

2

Hier wurde f(s) = es und ϕ(t) = t2 genutzt.

2.) Sei 0 < a < b.∫ b

a

1

(et − 1)(et + 1)dt =

∫ b

a

1

et(et − 1)(et + 1)et dt =

∫ eb

ea

1

s(s− 1)(s+ 1)ds = siehe Zentralubung

Hier wurde f(s) = 1s(s−1)(s+1) und ϕ(t) = et genutzt.

Wir machen einen Partialsummenansatz1

s(s− 1)(s+ 1)=a

s+

b

s− 1+

c

s+ 1

und rechnen aus, dass dieser Ansatz fur a = 1 und b = c = −1/2 funktioniert. somit hat f : Rrdie Stammfunktion

log(s)− 1

2log(s− 1)− 1

2log(s+ 1)

und damit kann dieses Integral explizit berechnet werden.

6. Uneigentliche Riemann-Integrale

Wdh.: F : R −→ R, a ∈ Ra = lim

x→∞F (x) ⇐⇒ ∀ε ∈ R>0 : ∃x0 ∈ R : ∀x ∈ R≥x0 : |F (x)− a| < ε

Analog fur F : [a,∞) −→ R und andere Definitionsbereiche.

Definition 6.1 (Uneigentliches Riemann-Integral, oberes Ende). Sei a ∈ R, b ∈ R ∪ {∞}, a < b,f : [a, b) −→ R.Wir sagen f ist (am oberen Ende) uneigentlich Riemann-integrierbar falls f |[a,β] ∈ R[a, β] fur alleβ ∈ (a, b) und falls

(6.2)

∫ b

a

f(x) dx := limβ↗b

∫ β

a

f(x) dx


existiert. Wir sagen dazu auch∫ baf(x) dx konvergiert. Wir sagen: das Integral konvergiert absolut ,

falls∫ ba|f(x)| dx konvergiert.

Man beachte: die linke Seite von (6.2) ist eine Definition!

Spezialfall: Wenn b <∞ und falls f = f[a,b) fur ein f ∈ R[a, b] ist, dann gilt wegen dem Hauptsatz

der Differential- und Integralrechnung9:∫ b

a

f(x) dx = limβ→b

∫ β

a

f(x) dx

In diesem Fall gilt also ∫ b

a

f(x) dx =

∫ b

a

f(x) dx.

Definition 6.3 (Uneigentliches Riemann-Integral, unteres Ende und an beiden Enden). Sei a ∈R ∪ {−∞}, b ∈ R, a < b, f : (a, b] −→ R.Wir sagen f ist (am unteren Ende) uneigentlich Riemann-integrierbar falls f |(α,b] ∈ R[α, b] fur alleα ∈ (a, b) und falls

(6.4)

∫ b

a

f(x) dx := limα↘a

∫ b

α

f(x) dx

existiert.

Sei a ∈ R ∪ {−∞}, b ∈ R ∪ {∞}, a < b, f : (a, b) −→ R. Wir sagen f ist (an beiden Enden)uneigentlich Riemann-integrierbar, falls fur ein γ ∈ (a, b) die Summe

(6.5)

∫ b

a

f(x) dx :=

∫ γ

a

f(x) dx+

∫ b

γ

f(x) dx

existiert.10

Beispiele 6.6.

(1)∫∞

1xa dx konvergiert genau dann, wenn a < −1. Denn

F (r) :=

∫ r

1

xa dx =

{1a+1 (ra+1 − 1) fur a 6= −1

log r fur a = −1

Im Limes r →∞ gilt

F (r)→

{∞ fur a ≥ −1

− 1a+1 fur a < −1

9Die folgende Zeile ist keine Definition, sondern eine Aussage!10Hierzu mussen beide Integrale der rechten Seite von (6.5) konvergieren. Die Existenz und der Wert von∫ b

a f(x) dx ist dann unabhangig von γ.

6. UNEIGENTLICHE RIEMANN-INTEGRALE 163

(2)∫ 1

0xa dx konvergiert genau dann, wenn a > −1.

ENDE DER VORLESUNG ANALYSIS I

KAPITEL 7

Stetigkeit und Differenzierbarkeit von Grenzwerten undReihen

24.4.

Vereinfachte Notationen ab jetzt:

• Quantoren hinter Aussagen sind erlaubt, falls keine Missverstandnisse zu erwarten sind.• Wir schreiben im(f) fur B(f),• f(A) fur f#(A),• und f−1(A) fur f#(A).• Wir schreiben oft ∀ε > 0 statt ∀ε ∈ R>0, analog ∃δ > 0, . . .

1. Metrische Raume: Wiederholung und Cauchy-Folgen

Ein metrischer Raum ist ein Paar (M,d), wobei die Metrik d : M ×M −→ R≥0 die folgendenEigenschaften fur alle x, y, z ∈M erfullen moge


r ∈ R≥0, x ∈Moffener Ball Br(x) := {y ∈M | d(x, y) < r}abgeschlossener Ball Br(x) := {y ∈M | d(x, y) ≤ r}

Sei (xn)n∈N eine M -wertige Folge, a ∈M .Konvergenz.

(xn)n∈N konvergiert gegen a

:⇐⇒ limn→∞

xn = a

:⇐⇒ limn→∞

d(xn, a) = 0

⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀n ∈ N≥N : d(xn, a) < ε

⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀n ∈ N≥N : xn ∈ Bε(a)

165

166 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN

Cauchy-Folge.

(xn)n∈N ist eine Cauchy-Folge

⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀n,m ∈ N≥N : d(xn, xm) < ε

SATZ 1.1. Jede konvergente Folge ist eine Cauchy-Folge.

Den Beweis erhalt man aus dem Beweis von Satz 1.38 aus Kapitel 3, indem man |x − y| durchd(x, y) ersetzt.

Beweis. Es gelte limj→∞ aj = a. Das heißt: fur alle ε ∈ R>0 gibt es ein j0 ∈ N, so dass fur allenaturlichen Zahlen j ≥ j0 gilt: d(aj , a) ≤ ε.

Fur solch ein ε und ein passendes j0 nehmen wir nun naturliche Zahlen j ≥ j0 und k ≥ j0 undrechnen nach:

d(aj , ak) ≤ d(aj , a) + d(a, ak) ≤ ε+ ε = 2ε.


∀ε ∈ R>0 : ∃j0 ∈ N : ∀j, k ∈ N≥j0 : d(aj , ak) ≤ 2ε.

Wegen Lemma 1.11 aus Kapitel 3 ist dies aquivalent zur definierenden Eigenschaft einer Cauchy-Folge.

Definition 1.2. Ein metrischer Raum (M,d) heißt vollstandig , wenn jedeM -wertige Cauchy-Folgein (M,d) konvergiert.

Ist (M,d) ein metrischer Raum und N eine Teilmenge. Dann ist d|N×N eine Metrik auf N , die von(M,d) auf N induzierte Metrik, siehe Beispiel 5.3 in Kapitel 4.

UBUNG 1.3. Sei (M,d) ein metrischer Raum. Dann ist N ⊂M abgeschlossen genau dann, wennfur alle N -wertigen Folgen, die in (M,d) konvergieren, der Grenzwert in N liegt.

UBUNG 1.4. Sei N eine Teilmenge eines metrischen Raumes (M,d) und sei d die induzierteMetrik auf N .

(a) Ist (N, d) vollstandig, so ist N abgeschlossen in M .(b) Ist (M,d) vollstandig, so gilt

(N, d) vollstandig ⇐⇒ N abgeschlossen in M.

2. Punktweise und gleichmaßige Konvergenz

Im folgenden sei (Y, d) ein metrischer Raum

Die wichtigsten Beispiele, an die Sie im folgenden denken sollten, sind Y = R und Y = C mitd(x, y) := |x− y|. Spater werden wir zum Beispiel fur Y auch Vektorraume (mit einer Norm) odernoch andere Raume betrachten. Wir betrachten nun Funktionen D −→ Y .

2. PUNKTWEISE UND GLEICHMASSIGE KONVERGENZ 167

Definition 2.1. Eine Folge von Funktionen besteht aus einer Menge D, einem metrischen Raum(Y, d), und einer Folge (fn)n∈N, wobei wir fur jedes n ∈ N eine Funktion fn : D −→ Y haben.Sei f : D −→ Y eine weitere Funktion. Wir sagen dann: (fn) konvergiert punktweise gegen f :D −→ Y , falls fur alle x ∈ D gilt:

limn→∞

fn(x) = f(x).

Der Begriff der punktweisen Konvergenz erscheint ein naheliegender Begriff fur die Konvergenzvon solchen Funktionen.

Beispiel 2.2. Y := C. Gegeben sei eine Potenzreihe p(x) :=∑∞j=0 ajx

j mit Konvergenzradius ρ.

fn(x) :=

n∑j=0

ajxj .

Dann konvergiert (fn : Bρ(0) −→ C)n∈N punktweise gegen p : Bρ(0) −→ C.

Da nun alle fn stetig sind, kann man hoffen, dass wir dadurch zeigen konnen, dass p : Bρ(0) −→ Cstetig ist. Hierbei tritt aber ein Problem auf, das am folgenden Beispiel deutlich wird.

Beispiel 2.3. D = [0, 1], Y := R, fn(x) := xn.

0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

1f0

f1

f2

f3 f4

x

fn(x)

Abbildung 7: Die Graphen der Funktionen fn


fn(x)→ f(x) :=

{0 fur x < 1

1 fur x = 1

(fn) konvergiert punktweise gegen f : [0, 1] −→ R. Alle Funktionen fn : [0, 1] −→ R sind stetig.Dennoch ist die Grenzfunktion f nicht stetig.

Losung des Problems: Gleichmaßige Konvergenz.

Wir machen aus Abb(D,Y ) = Y D einen metrischen Raum. Fur f, g ∈ Abb(D,Y ) definieren wirdie Supremums-Distanz

dsup(f, g) := supx∈D

{d(f(x), g(x)

)}∈ [0,∞].

(Abb(D,Y ), dsup) erfullt (a) Definitheit, (b) Symmetrie, (c) Dreiecks-Ungleichung; aber es istkeine Norm, da dsup(f, g) =∞ moglich ist. Wir setzen deswegen

dglm(f, g) := min{dsup(f, g), 289}.

Dann ist (Abb(D,Y ), dglm) ein metrischer Raum1.

Definition 2.4. Sei (fn : D −→ Y )n∈N eine Folge von Funktionen. Wir definieren

(fn) konvergiert gleichmaßig gegen f : D −→ Y

:⇐⇒ (fn) konvergiert gegen f im metrischen Raum (Abb(D,Y ), dglm)

⇐⇒ dglm(fn, f)→ 0 fur n→∞

⇐⇒ supx∈D

{d(f(x), g(x)

)}→ 0 fur n→∞

⇐⇒ ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀x ∈ D : d(fn(x), f(x)) ≤ εY⊂C⇐⇒ ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀x ∈ D : |fn(x)− f(x)| ≤ ε

Logische Verknupfung

∃x ∈M : ∀y ∈ N : A(x, y) =⇒ ∀y ∈ N : ∃x ∈M : A(x, y)

Somit:

∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0: ∀x ∈ D : d(fn(x), f(x)) ≤ ε

=⇒ ∀x ∈ D : ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : d(fn(x), f(x)) ≤ ε

Also:

Gleichmaßige Konvergenz =⇒ Punktweise Konvergenz

1Man kann in dieser Konstruktion naturlich 289 durch jede andere positive reelle Zahl ersetzen.

2. PUNKTWEISE UND GLEICHMASSIGE KONVERGENZ 169

!ACHTUNG!. Die Umkehrung ist falsch. Punktweise Konvergenz impliziert nicht gleichmaßige.In Beispiel 2.3 konvergiert (fn) punktweise gegen f , aber nicht gleichmaßig.

Von nun an sei D ein metrischer Raum mit Metrik dD, zum Beispiel ein Intervall, eine Teilmengevon Rn oder eine Teilmenge von Cn mit der induzierten Metrik.

SATZ 2.5. Sei (fn : D −→ Y )n∈N eine Folge von stetigen Funktionen, die gleichmaßig gegenf : D −→ Y konvergiert. Dann ist auch f : D −→ Y stetig.

Beispiel 2.6 (Fortsetzung Beispiel 2.2). Sei wieder ρ der Konvergenzradius von p(x) =∑∞j=0 ajx

j ,0 < R < ρ. Definiere die Partialsummen

fn(x) :=

n∑j=0

ajxj .

Dann gilt fur x ∈ BR(0):

|fn(x)− p(x)| =∣∣∣ ∞∑j=n+1

ajxj∣∣∣ ≤ ∞∑

j=n+1

|aj ||x|j ≤∞∑

j=n+1

|aj |Rj → 0.

Wir haben Konvergenz gegen 0, da∑∞j=0 ajR

j absolut konvergiert. Also konvergiert (fn : BR(0) −→C)n∈N gleichmaßig gegen p : BR(0) −→ C. 2 Wir sehen also somit, dass p|BR(0) : BR(0) −→ Cstetig ist. Da dies fur alle R ∈ (0, ρ) gilt, sehen wir, dass p|Bρ(0) : Bρ(0) −→ C ebenfalls stetig ist.

26.4.

Beweis des Satzes. Damit unsere Notation einfach ist, beschranken wir uns auf den Fall D ⊂ C,Y ⊂ C, dD(x, y) = |x− y|, d(x, y) = |x− y|. Den allgemeinen Fall beweist man vollig analog.

Wir zeigen die Stetigkeit von f in x0. Sei ε ∈ R>0 gegeben. Wir wahlen hierzu ein N ∈ N, so dassfur alle naturlichen Zahlen n ≥ N gilt:

dglm(f, fn) < ε :=ε

3

Da fN stetig in x0 stetig ist, gibt es ein δ ∈ R>0, so dass

|x− x0| < δ =⇒ |fN (x)− fN (x0)| < ε.

Wir schließen, dass fur x ∈ D mit |x− x0| < δ gilt:

|f(x)− f(x0)| ≤ |f(x)− fN (x)|+ |fN (x)− fN (x0)|+ |fN (x0)− f(x0)| < 3ε = ε.

Wir haben also die Stetigkeit von f in x0 gepruft. Da x0 ein beliebiges Element von D ist, ist fstetig (auf ganz D).

2Achtung: Fur viele Potenzreihen konvergiert f ′n : Bρ(0)→ C nicht gleichmaßig. Erst nach Einschrankung auf

einen etwas kleineren Ball BR(0) erhalten wir gleichmaßige Konvergenz.


Beweis des Satzes (volle Allgemeinheit). Wir zeigen die Stetigkeit von f in x0. Sei ε ∈ R>0

gegeben. Wir wahlen hierzu ein N ∈ N, so dass fur alle naturlichen Zahlen n ≥ N gilt:

dglm(f, fn) < ε :=ε

3Da fN stetig in x0 stetig ist, gibt es ein δ ∈ R>0, so dass

dD(x, x0) < δ =⇒ d(fN (x), fN (x0)) < ε.

Wir schließen, dass fur x ∈ D mit d(x, x0) < δ gilt:

d(f(x), f(x0)) ≤ d(f(x), fN (x)) + d(fN (x), fN (x0)) + d(fN (x0), f(x0)) < 3ε = ε.

Wir haben also die Stetigkeit von f in x0 gepruft. Da x0 ein beliebiges Element von D ist, ist fstetig (auf ganz D).

LEMMA 2.7. Sei D eine Menge und (Y, d) ein vollstandiger metrischer Raum.3 Sei (fn : D →Y )n∈N eine Folge von Funktionen. Dann sind die folgenden Aussagen aquivalent:

(1) (fn)n∈N konvergiert gleichmaßig (gegen eine Funktion D → R)(2)

∀ε ∈ R>0 : ∃n0 ∈ N : ∀j, k ∈ N≥n0: dglm(fj , fk) < ε

(3)∀ε ∈ R>0 : ∃n0 ∈ N : ∀j, k ∈ N≥n0 : ∀x ∈ D : d(fj(x), fk(x)) < ε

Im Fall D = {x0} steht hier: (fn(x0)) konvergiert genau dann, wenn (fn(x0)) eine Cauchy-Folgeist.

Offensichtlich ist:(1) ⇐⇒ (fn)n∈N konvergiert in (Abb(D,Y ), dglm).(2) ⇐⇒ (fn)n∈N ist Cauchy-Folge in (Abb(D,Y ), dglm).

Beweis.”(2)⇐⇒(3)“ folgt direkt aus der Definition von dglm.

”(1)=⇒(2)“: jede konvergente Folge ist eine Cauchy-Folge (Satz 1.1).

”(3)=⇒(1)“: Wegen (3) ist (fn(x)) eine Cauchy-Folge, sei f(x) := limn→∞ fn(x), f : D → R. Zu

gegebenem ε > 0 wahle man ein n0 wie in (3). Fur j, k ∈ N≥n0:

d(f(x), fj(x)) ≤ d(f(x), fk(x)) + d(fk(x), fj(x)) < d(f(x), fk(x))︸︷︷︸→0

+ε

fur k →∞. Somit d(f(x), fj(x)) ≤ ε.

Da dies fur alle x ∈ D gilt, haben wir

dglm(f, fj) ≤ ε.

3Wichtig sind hier vor allem die Falle Y = R, X = C und Y = Rk mit der Standardmetrik.

3. DIFFERENTIATION VON FOLGEN UND REIHEN 171

Wir haben also gezeigt:

∀ε > 0 : ∃n0 ∈ N : ∀j ∈ N≥n0: dglm(fj , f) ≤ ε

und dies ist (1).

KOROLLAR 2.8. Sei D eine nicht-leere Menge und (Y, d) ein metrischer Raum. Dann ist (Abb(D,Y ), dglm)genau dann vollstandig, wenn (Y, d) vollstandig ist.

Beweis. Wegen Lemma 2.7 (2)=⇒(1) folgt aus der Vollstandigkeit von (Y, d) die Vollstandigkeitvon (Abb(D,Y ), dglm).

Umgekehrt kann jedes y ∈ Y als konstante Funktion y : D → Y , x 7→ y betrachtet werden, diewir mit y bezeichnen. Wegen dglm(x, y) = d(x, y) bildet D → Abb(D,Y ), y 7→ y Cauchy-Folgenauf Cauchy-Folgen ab. Grenzwerte konstanter Funktionen in (Abb(D,Y ), dglm) sind wiederumkonstant. Aus der Vollstandigkeit von (Abb(D,Y ), dglm) folgt dann auch die Vollstandigkeit von(Y, d).

3. Differentiation von Folgen und Reihen

Sei fn : (a, b) −→ R eine Folge differenzierbarer Funktionen, die gleichmaßig gegen f : (a, b) −→ Rkonvergiert.

Frage 3.1. Ist dann f ebenfalls differenzierbar?

Beispiele 3.2.

(1) fn(x) :=√x2 + 1

n konvergiert gleichmaßig gegen f(x) = |x|.Denn fur reelle Zahlen a, b ∈ R gilt

a2 + b2 ≤ |a|2 + |b|2 + 2|a| |b| = (|a|+ |b|)2

und somit √a2 + b2 ≤ |a|+ |b|.

Wenden wir dies auf a := x und b := 1/√n an, so erhalten wir

|x| ≤ fn(x) ≤ |x|+ 1√n.

Also |fn(x)−f(x)| ≤ 1√n

, d.h. dglm(fn, f) ≤ n−1/2. Nun sind alle Funktionen fn differenzierbar

(auf R), aber f ist in 0 nicht differenzierbar. Siehe auch [22, Abschnitt 9.5].(2) Wir betrachten die Reihe

fn : R→ R, fn(x) :=

n∑`=1

1

`2sin(`2x)


(fn : R→ R)n∈N konvergiert gleichmaßig, denn

|fj(x)− fk(x)| = |j∑

`=k+1

1

`2sin(`2x)| ≤

j∑`=k+1

1

`2≤

∞∑`=k+1

1

`2→ 0 fur j ≥ k, k →∞

Gliedweises Differenzieren liefert:

f ′n(x) =

n∑`=1

cos(`2x)

Diese Reihe ist divergent, u.a. da fur viele x ∈ R, z.B. fur x = 1 die Folge (cos(`2x))` keineNullfolge ist.

THEOREM 3.3. Seien a, b, x0 ∈ R mit a < x0 < b. Sei fn : (a, b) −→ R eine Folge von differen-zierbaren Funktionen, so dass

(1) (fn(x0))n∈N konvergiert (Konvergenz in einem Punkt)(2) (f ′n)n∈N konvergiert gleichmaßig

Dann gilt:

(i) fn : (a, b) −→ R konvergiert gleichmaßig gegen eine Funktion, die wir f : (a, b) −→ R nennen.(ii) f ist differenzierbar auf (a, b)

(iii) f ′n konvergiert gegen f ′

Beweis. Sei x1 ∈ (a, b) und j, k ∈ N.

I :=

{[x0, x1] falls x1 ≥ x0,

[x1, x0] falls x1 < x0.

Wir wenden den 1. Mittelwertsatz auf die Funktion I → R, x 7→ fj(x)− fk(x) an: Es existiert einξ ∈ I ⊂ (a, b), so dass

(fj(x0)− fk(x0))− (fj(x1)− fk(x1)) = (x0 − x1)(f ′j(ξ)− f ′k(ξ)).

Dies ergibt

|fj(x1)− fk(x1)| ≤ |x0 − x1| |f ′j(ξ)− f ′k(ξ)|+ |fj(x0)− fk(x0)|

Wir wahlen fur ein gegebenes ε > 0 die Zahl n0 so groß, dass fur alle j, k ∈ N≥n0gilt: |fj(x0) −

fk(x0)| ≤ ε/2. Dies ist moglich, da (fn(x0))n∈N eine Cauchy-Folge ist, siehe (1).

Wir wahlen nun eine Zahl n1, so dass fur alle j, k ∈ N≥n1und fur alle x ∈ (a, b) gilt:

|f ′j(x)− f ′k(x)| < ε

2(b− a).

Dies ist moglich, da f ′j gleichmaßig konvergiert, siehe (2).

3. DIFFERENTIATION VON FOLGEN UND REIHEN 173

Somit gilt fur n2 := max{n0, n1} fur alle j, k ∈ N≥n2und alle x1 ∈ (a, b) die Ungleichung

|fj(x1)− fk(x1)| ≤ |x0 − x1| |f ′j(ξ)− f ′k(ξ)|︸︷︷︸< ε

2(b−a)

+ |fj(x0)− fk(x0)|︸︷︷︸<ε/2

<ε|b− a|2(b− a)

+ε

2= ε

Also dglm(fj , fk) ≤ ε, das heißt (fn)n∈N ist eine Cauchy-Folge in (Abb((a, b),R), dglm).

Da R vollstandig ist, ist nach Korollar 2.8 auch (Abb((a, b),R), dglm) vollstandig; es existiert alsoeine Funktion f : (a, b)→ R, so dass (fn) gegen f gleichmaßig konvergiert. Es folgt Aussage (i). Fr. 3.5.

Sei nun g(x) := limn→∞ f ′n(x). Dieser Limes ist gleichmaßig nach Voraussetzung. Wahle zu gege-benem ε > 0 ein n3 ∈ N, so dass fur j, k ∈ N≥n3

gilt: dglm(f ′j , f′k) < ε und dglm(f ′j , g) < ε.

Fur solche j und k wenden wir ahnlich wie oben wieder den 1. Mittelwertsatz auf die Funktionx 7→ fj(x)− fk(x) an.∣∣∣∣ (fj(x)− fk(x))− (fj(x2)− fk(x2))

x− x2

∣∣∣∣ 1. MWS= |f ′j(ξ)− f ′k(ξ)| < ε

fur ein ξ zwischen x und 2. Im Grenzwert k →∞ erhalten wir

(3.4)

∣∣∣∣ (fj(x)− f(x))− (fj(x2)− f(x2))

x− x2

∣∣∣∣ ≤ ε.Diese Abschatzung gilt fur alle x ∈ (a, b), x 6= x2, j ≥ n3; und n3 hangt nicht von x ab, sondernnur von ε. Manchmal schreibt man hierfur kurz n3 = n3(ε), um auszudrucken, dass n3 nur von εabhangt, auch wenn diese Formulierung leicht falsch verstanden werden kann.

Da die Funktion fj in x2 differenzierbar ist, gibt es 4 zu oben gegebenem ε > 0 und j ≥ n3(ε) einδj > 0, so dass fur alle x ∈ (x2 − δj , x2 + δj) gilt:

(3.5)

∣∣∣∣fj(x)− fj(x2)

x− x2− f ′j(x2)

∣∣∣∣ ≤ ε.Aus (3.4), (3.5) und dglm(f ′j , g) ≤ ε folgt fur j ≥ n3(ε)

(3.6) ∀x ∈ (x2 − δj , x2 + δj) :

∣∣∣∣f(x)− f(x2)

x− x2− g(x2)

∣∣∣∣ ≤ 3ε.

Wir haben gezeigt: Fur jedes ε > 0 haben wir ein j gefunden, und dann dazu ein δj > 0, so dass(3.6) gilt. Dies ergibt

limx→x2

f(x)− f(x2)

x− x2= g(x2)

und somit die Aussagen (ii) und (iii).

4Achtung: wir behaupten hier: fur jedes j gibt es solch ein δj . Man muss hier aber davon ausgehen, dass dieses

δj von j abhangen kann.


4. Potenzreihen und analytische Funktionen

SATZ 4.1.∑∞j=0 ajx

j, aj ∈ R eine Potenzreihe mit Konvergenzradius ρ > 0. Dann ist die Funktion

f : (−ρ, ρ)→ R, x 7→∞∑j=0

ajxj

differenzierbar und

f ′(x) =

∞∑j=1

jajxj−1.

Man kann also in dieser Situation die Ableitung in die unendliche Summe”hineinziehen“. Obige

Beispiele zeigen aber, dass dies eben nicht fur alle gleichmaßig konvergenten Reihen von Funktionengilt.

Beweis. Wahle ein R ∈ (0, ρ). Wir wollen Theorem 3.3 anwenden fur: fn : (−R,R)→ R, fn(x) =∑nj=0 ajx

j , x0 = 0. Die Konvergenz in x0 = 0 ist klar. Hierzu uberprufen wir, dass f ′n : (−R,R)→R gleichmaßig konvergiert. 5

Wir rechnen

f ′n(x) =

n∑j=0

jajxj−1

Fur festes x 6= 0 konvergiert f ′n(x) fur n→∞ genau dann, wenn hn(x) :=∑nj=0 jajx

j konvergiert.

Wir berechnen den Konvergenzradius ρ′ der Potenzreihe∑∞j=0 jajx

j .

lim supj→∞

j

√j|aj | =

(limj→∞

j√j

)︸︷︷︸

=1

(lim supj→∞

j

√|aj |)

Also ρ′ = ρ, das heißt der Konvergenzradius von∑∞j=0 jajx

j−1 ist ρ.

Wegen Beispiel 2.6 konvergiert die Potenzreihe∑∞j=0 jajx

j−1 auf (−R,R) gleichmaßig, das heißtdie Folge von Funktionen

gn : (−R,R)→ R, x 7→n∑j=0

jajxj−1.

konvergiert gleichmaßig gegen eine Funktion g : (−R,R)→ R.

Beispiele 4.2.

5Achtung: Fur viele Potenzreihen konvergiert f ′n : (−ρ, ρ)→ R nicht gleichmaßig. Erst nach Einschrankung aufein etwas kleineres Intervall (−R,R) erhalten wir gleichmaßige Konvergenz. Siehe die analoge Fussnote in Kapitel 4,

Abschnitt 2.

4. POTENZREIHEN UND ANALYTISCHE FUNKTIONEN 175

(1) exp : R→ R, x 7→∑∞j=0

1j!x

j ist differenzierbar und

exp′(x) =

∞∑j=1

j

j!xj−1 =

∞∑j=1

(j − 1)!

x

j−1

= exp(x).

(2) sin : R→ R, x 7→∑∞j=0(−1)j 1

(2j+1)!x2j+1 ist differenzierbar und

sin′(x) =

∞∑j=0

1

(2j)!x2j = cos(x).

Analog

cos′(x) = − sin(x).

FOLGERUNG 4.3. Potenzreihen mit Konvergenzradius ρ > 0 sind auf dem Intervall (−ρ, ρ) glatt,d.h. unendlich oft differenzierbar. Die Taylorreihe mit Entwicklungspunkt 0 von einer Potenzreiheist wieder genau diese Potenzreihe.

T 0(

∞∑j=0

ajxj)(x) =

∞∑j=0

ajxj .

FOLGERUNG 4.4. Seien f(x) =∑∞n=0 anx

n und g(x) =∑∞n=0 bnx

n Potenzreihen mit Konver-genzradien ρa > 0 und ρb > 0. Gibt es ein ε ∈ (0,min{ρa, ρb}] so dass

f(x) = g(x) fur alle x mit |x| < ε,

dann gilt an = bn fur alle n ∈ N.

Definition 4.5. Sei I ein offenes Intervall. Eine Funktion f : I → R heißt analytisch oder reell-analytisch, falls es zu jedem x0 ∈ I ein ε > 0 und eine Potenzreihe p(x) =

∑∞j=0 ajx

j gibt, so dassgilt

• der Konvergenzradius ρ der Potenzreihe ist in (0,∞],• f(x+ x0) = p(x) fur alle x ∈ R mit |x| < ρ und x+ x0 ∈ I.

Cω(I) := {f : I −→ R | f ist analytisch.}

Cω ⊂ C∞ ⊂ · · · ⊂ Ck+1 ⊂ Ck ⊂ · · · ⊂ C1 ⊂ C0.

LEMMA 4.6. Potenzreihen sind auf ihrem Konvergenzbereich analytisch.


Beweis. kommt noch (folgt aus dem Umordnungssatz)

SATZ 4.7 (Eindeutige Fortsetzbarkeit analytischer Funktionen). Sei I ein offenes Intervall undsind f, g : I −→ R analytische Funktionen. In x0 ∈ I gelte eine der folgenden Bedingungen:

(a) Fur alle n ∈ N gilt f (n)(x0) = g(n)(x0).(b) Es gibt ein ε > 0 mit f |(x0−ε,x0+ε) = g|(x0−ε,x0+ε)

Dann haben wir sogar f = g.

Die Beweise des Lemmas und des Satzes wurden in der Vorlesung ausgelassen, da wir in derAnalysis III analoge Aussagen fur komplex-analytische Funktionen beweisen werden.

Beweis. Mit Folgerung 4.3 sehen wir, dass aus (a) die Voraussetzung (b) folgt. Sei I = (a, b), a < b,a, b ∈ R. Wir definieren nun

t1 := sup{t ∈ [x0, b) | f = g auf [x0, t]}.Aus dieser Definition folgt f = g auf [x0, t1). Angenommen t1 < b. Da f − g stetig ist, gilt auchf(t1) = g(t1), also stimmen f und g auf [x0, t1] uberein. Hieraus ergibt sich fur alle n ∈ N:f (n)(t1) = g(n)(t1). Da f und g analytisch sind, gibt es ein ε > 0, so dass f = g auf [t1, t1 + ε).Dies ist ein Widerspruch zur Wahl von t1. Also t1 = b. Deswegen gilt f = g auf [x0, b). Auf demIntervall (a, x0] argumentiert man analog.

KAPITEL 8

Topologie

Als Literatur in diesem Kapitel emfehle ich das erste Kapitel von [34] (normierte Vektorraumeund metrische Raume) und Kapitel VI von [9] (inklusive topologische Raume).

1. Normierte Vektorraume

Vorbemerkung zur Vektorraumen: Im Gegensatz zur Linearen Algebra ist es in der Analysis nichtublich und zumeist auch nicht hilfreich, streng zwischen Zeilen- und Spaltenvektoren zu unterschei-den.1

K = R oder K = C.

Definition 1.1. Sei V ein K-Vektorraum. Eine Norm auf V ist eine Abbildung ‖ · ‖ : V → R, sodass fur alle x, y ∈ V , λ ∈ K gilt:

(a) Definitheit der Norm: ‖0‖ = 0 und fur x 6= 0 gilt ‖x‖ > 0,(b) Homogenitat der Norm: ‖λx‖ = |λ| ‖x‖(c) Dreiecksungleichung der Norm: ‖x+ y‖ ≤ ‖x‖+ ‖y‖

Man nennt dann (V, ‖ · ‖) einen normierten Vektorraum.

Beispiele 1.2.

(1) Sei 〈 · , · 〉 ein Skalarprodukt auf dem K-Vektorraum V , wie in der Linearen Algebra IIbehandelt. Dann ist

x 7→ ‖x‖ :=√〈x, x〉

eine Norm auf V .Ist 〈 · , · 〉 das Standardskalarprodukt auf Kn, so nennt man die zugehorige Norm die

Standardnorm auf Kn.

1Sobald man anfangt, Matrizen mit Vektoren zu multiplizieren, mussen wir naturlich sorgfaltiger werden. Dies

ist allerdings aus Sicht der Analysis nur ein kurzer Zwischenschritt auf dem Weg zu”Tensoren“. Vektoren haben

einen Index, Matrizen zwei und Tensoren beliebig viele. Die in der Linearen Algebra erfolgreiche Notation mit Zeilen

und Spalten versagt, sobald wir mindestens drei Indizes haben. Tensoren werden in der Analysis benotigt, um den

mehrdimensionalen Satz von Taylor zu erhalten. Spater sind Tensorfelder ein wichtiges Hilfsmittel in der Analysis IV.Tensoren sind omniprasent in der Physik (Allgemeine Relativitatstheorie, Materialwissenschaft, Elektrodynamik)

und vielen anderen Anwendungen in Chemie und Technik.

177

178 8. TOPOLOGIE

(2) Sei D eine Menge. Eine Funktion f : D −→ K heißt beschrankt , wenn

‖f‖∞ := supx∈D{|f(x)|}

endlich ist. Die Menge B(D,K) der beschrankten Funktionen von D nach K bildet mitder ublichen punktweisen Addition und Multiplikation mit Skalaren einen K-Vektorraum.Dann ist ‖ · ‖∞ eine Norm auf B(D,K). Definitheit, Homogenitat und Dreiecksunglei-chung sind leicht zu prufen. Man nennt diese Norm die Supremumsnorm.Wir erhalteninsbesondere eine weitere Norm auf Kn = Abb({1, 2, . . . , n},K) = B({1, 2, . . . , n},K).

(3) Sei p ∈ [1,∞), n ∈ N. Fur z = (z1, . . . , zn) ∈ Kn definieren wir die p-Norm

‖z‖p :=

n∑j=1

|zj |p1/p

∈ R≥0.

Dann ist ‖ · ‖2 die Standardnorm auf Kn aus Beispiel (1).Es ist eine Norm fur alle p ∈ [1,∞): Definitheit und Homogenitat von ‖ · ‖p werden

in Ubungsblatt 3, Aufgabe 3 gezeigt.

Bild aller Punkte x ∈ R2 mit ‖x‖p = 1 fur p = 1, 54 , 2, 5,∞.

Die Dreiecksungleichung ist klar fur p = 1.Sei nun p > 1. Bestimme q ∈ (1,∞) mit 1

p + 1q = 1. Also q = p/(p−1). Nach Ubungs-

blatt 3, Aufgabe 3 gilt fur alle a = (a1, . . . , an), b = (b1, . . . , bn) ∈ Rn die HolderscheUngleichung

n∑j=1

|ajbj | ≤ ‖a‖p · ‖b‖q.

Wir setzen sj := |xj+yj |p−1 und s = (s1, . . . , sn). Wir wenden die Holdersche Ungleichungzunachst auf a = x und b = s an und dann nochmals auf a = y und b = s, und erhalten.

‖x+ y‖pp =

n∑j=1

|xj + yj |p ≤n∑j=1

|xj | |sj |+n∑j=1

|yj | |sj | ≤ ‖x‖p‖s‖q + ‖y‖p‖s‖q

Man rechnet nun

‖s‖q =( n∑j=1

|sj |q)1/q

=( n∑j=1

|xj + yj |p)(1/p)·(p−1)

= ‖x+ y‖p−1p .

Insgesamt folgt

‖x+ y‖p ≤ ‖x‖p + ‖y‖p.Diese Ungleichung nennt man die Minkowski-Ungleichung .Mi 8.5.

(4) Ist (V, ‖ · ‖) ein normierter Vektorraum und W ein Untervektorraum von V . Dann ist‖ · ‖∣∣

W: W → R ein Norm auf W , die wir die von ‖ · ‖ induzierte Norm auf W nennen.

(5) Ist ‖ · ‖ eine Norm auf einem C-Vektorraum V . Dann ist V auch ein R-Vektorraum, und‖ · ‖ ist dann auch eine Norm auf V im Sinn von R-Vektorraumen.

1. NORMIERTE VEKTORRAUME 179

Definition 1.3. Ist (V, ‖ · ‖) ein normierter Raum, so definiert

d(x, y) := ‖x− y‖

eine Metrik auf V . Man nennt sie die von ‖ · ‖ induzierte Metrik auf V . Dadurch sind dietopologischen Begriffe, also Begriffe wie

”offen“,

”abgeschlossen“, konvergent“,

”Cauchy-Folge“,

”Haufungspunkte“ etc. definiert. Insbesondere: Eine V -wertige Folge (x(k))k∈N konvergiert gegena in (V, ‖ · ‖), falls ‖x(k) − a‖ → 0 fur k → ∞. Aus der Dreiecksungleichung sieht man leicht:Konvergiert x(k) gegen a, so konvergiert ‖x(k)‖ gegen ‖a‖.2 Die Norm-Funktion

‖ · ‖ : V → R, x 7→ ‖x‖

ist also (folgen-)stetig.

Beispiel 1.4. Die von der Supremumsnorm ‖ · ‖∞ induzierte Metrik aufB(D,K) ist die Supremums-Distanz dsup aus Kapitel 7.

Eine Folge (x(k))k∈N heißt beschrankt im normierten Raum (V, ‖ · ‖), falls es ein C ∈ R>0 gibt,so dass fur alle k ∈ N gilt: ‖x(k)‖ ≤ C.

LEMMA 1.5. Sei xj(k) ∈ K bzw. aj ∈ K die j-te Komponente von x(k) ∈ Kn bzw. a ∈ Knbezuglich der Standard-Basis. Dann gilt fur jede Norm auf V :

limk→∞

x(k) = a in (Kn, ‖ · ‖∞) ⇐⇒ ∀j ∈ {1, 2, . . . , n} : limk→∞

xj(k) = aj .

Beweis.

limk→∞

x(k) = a in (Kn, ‖ · ‖∞

⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀k ∈ N≥N : ‖x(k)− a‖∞ < ε

⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀k ∈ N≥N : ∀j ∈ {1, . . . , n} : |xj(k)− a| < ε

(∗)⇐⇒ ∀j ∈ {1, . . . , n} : ∀ε > 0 : ∃N ∈ N : ∀k ∈ N≥N : |xj(k)− a| < ε

⇐⇒ ∀j ∈ {1, 2, . . . , n} : limk→∞

xj(k) = aj .

Fur die Umformung (∗) haben wir die Umformung

∃N ∈ N : A(j,N) : ∀j ∈ {1, . . . , n} : A(j,N) ⇐⇒ ∀j ∈ {1, . . . , n} : ∃N ∈ N : A(j,N)

benutzt, und wir mussen begrunden wieso wir die Quantoren vertauschen durfen. Die Richtung

”=⇒“ ist offensichtlich. Fur

”⇐=“ argumentieren wir wie folgt: auf der rechten Seite erhalten wir

fur jedes j ein potenziell j-abhangiges N = Nj . Da j aber nur endlich viele Werte durchlauft, ist

N := max{Nj | j ∈ {1, 2, . . . , n}} eine naturliche Zahl, so dass die linke Seite fur N = N gilt.

LEMMA 1.6 (Bolzano-Weierstraß auf (Rn, ‖ · ‖∞)). Ist (x(k))k∈N eine beschrankte Folge in(Rn, ‖ · ‖∞), dann besitzt diese Folge eine konvergente Teilfolge.

2Denn |‖x(k)‖ − ‖a‖| ≤ ‖x(k)− a‖ oder verwende Ubungsblatt 3 Aufgabe 4.

180 8. TOPOLOGIE

Der folgende Beweis wurde das Ergebnis auch fur alle anderen p-Normen liefern. Diese Verallge-meinerung folgt aber bald ganz einfach.

Beweis. Schreibe x(k) = (x1(k), . . . , xn(k)). Es gilt |xj(k)| ≤ ‖x(k)‖∞. Somit ist (xj(k))k∈Neine beschrankte R-wertige Folge. Nach dem Satz von Bolzano-Weierstraß (Korollar 1.35 in Kapi-tel 2) besitzt die Folge (x1(k))k∈N eine (in R) konvergente Teilfolge (x1(f1(k)))k∈N. Weiter besitzt(x2(f1(k)))k∈N eine konvergente Teilfolge (x2(f1 ◦ f2(k)))k∈N. Und so weiter. Nachdem wir n-malzu einer derartigen Teilfolge ubergegangen sind, konvergiert

(xj(f1 ◦ f2 ◦ · · · ◦ fn︸︷︷︸f :=

(k)))k∈N

fur alle j. Sei aj := limk→∞ xj(f(k)). Dann ‖a− x(f(k))‖∞ → 0 fur k →∞.

Definition 1.7. Zwei Normen ‖ · ‖ und ||| · ||| auf einem Vektorraum V nennt man aquivalent, fallses ein C ∈ R>0 gibt, so dass fur alle x ∈ V gilt:

‖x‖ ≤ C|||x||| und |||x||| ≤ C‖x‖.

SATZ 1.8. Alle Normen auf Rn sind aquivalent.

Beweis. Es reicht, den Satz zu zeigen fur ‖ · ‖ = ‖ · ‖∞ und eine weitere Norm ||| · |||. Sei (e1, . . . , en)die Standardbasis von R.

|||x||| =∣∣∣∣∣∣∣∣∣ n∑j=1

xjej

∣∣∣∣∣∣∣∣∣ ≤ n∑j=1

|xj ||||ej ||| ≤ ‖x‖∞ (|||e1|||+ . . .+ |||en|||)︸︷︷︸C1:=

.

Dies liefert nun die rechte der zu zeigenden Ungleichungen.

Angenommen, die Normen sind nicht aquivalent, d.h. es gibt kein C wie oben. Dann gibt es eineFolge (x(k))k∈N in Rn mit ‖x(k)‖∞ > k|||x(k)|||. O.B.d.A. ‖x(k)‖∞ = 1 (sonst ersetze x(k) durchx(k)/‖x(k)‖∞). Wir konnen auch annehmen, dass diese Folge konvergiert, da wir gegebenenfalls zueiner in (Rn, ‖ · ‖∞) konvergenten Teilfolge ubergehen konnen (siehe Lemma 1.6). Sei a der Grenz-wert. Wegen |||x(k)− a||| ≤ C1‖x(k)−a‖∞ → 0 ist a auch der Grenzwert bezuglich der ||| · |||-Norm.Es folgt ‖a‖∞ = limk→∞ ‖x(k)‖∞ = 1 und wegen |||x(k)||| < 1

k auch |||a||| = limk→∞ |||x(k)||| = 0.Also a = 0, was ‖a‖∞ = 1 widerspricht.

Der obige Satz gilt wegen Beispiele 1.2 (5) auch, wenn wir Rn durch Cn ersetzen.

Sind zwei Normen ‖ · ‖ und ||| · ||| aquivalent, so gilt

limk→∞

‖x(k)− a‖ = 0 ⇐⇒ limk→∞

|||x(k)− a||| = 0.

(x(k))k∈N beschrankt in (V, ‖ · ‖) ⇐⇒ (x(k))k∈N beschrankt in (V, ||| · |||).

Da jeder endlich-dimensionale K-Vektorraum (als Vektorraum) isomorph zu Kn fur ein geeignetesn ∈ N ∪ {0} ist, folgt hieraus unmittelbar das folgende Korollar.

KOROLLAR 1.9. Fur einen endlich-dimensionalen K-Vektorraum V gilt:

1. NORMIERTE VEKTORRAUME 181

(a) Alle Normen auf V sind zueinander aquivalent.(b) Bezuglich einer beliebigen Basis sei xj(k) bzw. aj die j-te Komponente von x(k) bzw. von a

gilt:

limk→∞

x(k) = a ⇐⇒ ∀j ∈ {1, 2, . . . ,dimV } : limk→∞

xj(k) = aj .

(c) Jede beschrankte V -wertige Folge besitzt eine konvergente Teilfolge. (Satz von Bolzano-Weierstraßfur endlich-dimensionale Vektorraume).

Wir betrachten nun einige unendlich-dimensionale normierte Raume.

Beispiel 1.10. Fur p ∈ [1,∞) und x = (xj) ∈ Abb(N,K) definieren wir

‖x‖p :=( ∞∑j=0

|xj |p)1/p

.

Hierbei weisen wir der Reihe genau dann den Wert ∞ zu, wenn sie divergiert, das heißt wenn sieunbestimmt gegen ∞ konvergiert. Wir setzen ∞1/p := ∞. Fur p = ∞ definieren wir ‖x‖∞ wie inBeispiele 1.2 (2). Man definiert nun

`p(K) := {x ∈ Abb(N,K) | ‖x‖p <∞}.

Dann ist ‖ · ‖p eine Norm auf `p(K): Die Homogenitat und Definitheit ist klar. Die Dreiecks-Ungleichung ist klar fur p =∞. Um die Dreiecks-Ungleichung fur p <∞ zu zeigen, definieren wirzu x ∈ Abb(N,K) den Vektor x(n) ∈ Abb(N,K), n ∈ N durch

x(n)j :=

{xj fur j ≤ n,0 fur j > n.

Fur x ∈ `p(K) gilt

‖x− x(n)‖pp =

∞∑j=n+1

|xj |p → 0 fur n→∞,

und somit gilt x(n) → x. Wir konnen x(n) als Vektor (x0, . . . , xn) ∈ K(n+1) betrachten und danndie Dreiecks-Ungleichung von Beispiele 1.2 (3) anwenden:

‖x(n) + y(n)‖p ≤ ‖x(n)‖p + ‖y(n)‖p.

Im Limes n→∞ ergibt sich dann

‖x+ y‖p ≤ ‖x‖p + ‖y‖p.Fr 10.5.

UBUNG 1.11. Zeigen Sie, dass `p(R) fur alle p ∈ [1,∞] vollstandig ist.

Bemerkung 1.12. Auf unendlich-dimensionalen Vektorraumen gibt es nicht-aquivalente Normen.Sei

Abbc(N,K) :={

(xj) ∈ Abb(N,K)∣∣∣#{j ∈ N | xj 6= 0} <∞

}.

182 8. TOPOLOGIE

Dieser Vektorraum besitzt eine Basis (χj)j∈N, wobei

χj(k) =

{1 falls j = k ,

0 falls j 6= k .

Dann gilt Abbc(N,K) ⊂ `p(K) fur alle p ∈ [1,∞], und wir erhalten eine induzierte p-Norm aufAbbc(N,K) ⊂ `p(K). Fur p 6= p sind die Normen ‖ · ‖p und ‖ · ‖p nicht aquivalent. Betrachten wir

zum Beispiel die Folge(

1n

∑nj=0 χj

)n∈N

. Dann gilt

∥∥∥ 1

n

n−1∑j=0

χj

∥∥∥1

= 1,∥∥∥ 1

n

n−1∑j=0

χj

∥∥∥∞

=1

n.

Somit ist diese Folge eine Nullfolge in der Norm ‖ · ‖∞, aber keine Nullfolge in der Norm ‖ · ‖1.

Beispiel 1.13. Betrachte den Vektorraum V = C0([a, b],K), b > a, K = R oder K = C. Wirdefinieren: f ∈ C0([a, b],K)

‖f‖1 :=

∫ b

a

|f(x)| dx, ‖f‖∞ := sup{|f(x)| | x ∈ [a, b]}.

Die Normen ‖ · ‖1 und ‖ · ‖∞ sind nicht aquivalent. Es gilt zwar ‖f‖1 ≤ (b − a)‖f‖∞. Es gibtaber keine Konstante C ∈ R>0 mit

‖f‖∞ ≤ C‖f‖1.Um dies zu zeigen, betrachte man fur n ≥ 1/(b− a) die Funktion

fn : [a, b]→ R, f(x) :=

{1− n(x− a) falls a ≤ x ≤ a+ 1

n

0 falls a+ 1n < x ≤ b

Es gilt ‖fn‖∞ = 1 und ‖fn‖1 = 1/(2n) → 0. Die Folge (fn)n∈N ist also eine Nullfolge in(C0([a, b],K), ‖ · ‖1), aber nicht in (C0([a, b],K), ‖ · ‖∞). Die Folge (fn)n∈N besitzt keine kon-vergente Teilfolge in ((C0([a, b],K), ‖ · ‖∞).

Definition 1.14. Einen normierten Vektorraum (V, ‖ · ‖) nennt man einen Banachraum odereinen vollstandigen normierten Vektorraum, falls die induzierte Metrik auf V vollstandig ist. Eineneuklidischen oder unitaren Vektorraum (V, 〈 · , · 〉) nennt man einen Hilbertraum, wenn (V, x 7→‖x‖ :=

√〈x, x〉) ein Banachraum ist.

Aus dem Satz von Bolzano-Weierstraß erhalten wir das folgende Korollar.

KOROLLAR 1.15. Alle endlich-dimensionalen normierten Vektorraume sind Banachraume. Alleendlich-dimensionalen euklidischen oder unitaren Vektorraume sind Hilbertraume.

Hilbertraume und Banachraume (beliebiger Dimension) sind unter anderem von zentraler Bedeu-tung

2. KONTRAKTIONEN UND BANACHSCHER FIXPUNKTSATZ 183

• in der Quantenmechanik. Hier ist insbesondere der Hilbertraum `2(C) mit dem Skalar-produkt

〈(xj), (yj)〉 :=

∞∑j=0

xjyj

ganz wichtig.3

• in der konkreten Berechung von aufwandigen mathematischen Probleme mit Hilfe desComputers (Numerik von partiellen Differentialgleichungen)

2. Kontraktionen und Banachscher Fixpunktsatz

Wiederholung:

Ein metrischer Raum ist ein Paar (X, d), wobei die Metrik d : X × X −→ R≥0 die folgendenEigenschaften fur alle x, y, z ∈ X erfullen moge


limn→∞

xn = a ⇐⇒ limn→∞

d(xn, a) = 0

Beispiel 2.1. Ist (V, ‖ · ‖) ein normierter Vektorraum, so definiert d(x, y) := ‖x− y‖ eine Metrikauf V , die von ‖ · ‖ auf V induzierte Metrik.

Sei (X, d) ein metrischer Raum, Y ⊂ X, f : Y → X.

Definition 2.2. Man nennt x ∈ Y einen Fixpunkt von f , falls f(x) = x. Die Abbildung f : Y → Xwird Kontraktion genannt, falls es ein L ∈ [0, 1) gibt, so dass fur alle y, z ∈ Y gilt:

d(f(y), f(z)) ≤ Ld(y, z).

Beispiel 2.3. a ∈ (−1, 1), b ∈ R, X = Y = R. Dann ist f(x) = ax + b eine Kontraktion mitL = |a|.

Kontraktionen sind immer stetig.

Kontraktionen besitzen hochstens einen Fixpunkt. Denn sind x1 und x2 Fixpunkte, so gilt d(x1, x2) ≤Ld(x1, x2), also d(x1, x2) = 0.

3Beispiel: Angenommen ein quantenmechanisches Teilchen kann abzahlbar viele reine Zustande annehmen,die wir mit den naturlichen Zahlen N. Zum Beispiel die moglichen Anregungszustande eines Elektrons um einen

Atomkern mit verschiedener Energie. Das Teilchen wird dann durch einen Vektor ψ ∈ `2(C) mit ‖ψ‖2 = 1 beschrie-

ben, und |ψk|2 ist die Wahrscheinlichkeit, dass eine Messung den k-ten reinen Zustand ergibt. Der Raum `2(C)beschreibt aber auch noch viel kompliziertere Systeme. Solange man noch keine Quantenfeldtheorie betreibt sindalle Hilbert-Raume entweder isomorph zu Ck, k ∈ N mit dem Standard-Skalarprodukt oder zu `2(C).

184 8. TOPOLOGIE

Beispiel 2.4. X = Y = Rr {0}. Dann ist f(x) = x/2 eine Kontraktion ohne Fixpunkte.

SATZ 2.5 (Banachscher Fixpunktsatz). Sei X ein vollstandiger metrischer Raum, A ⊂ X eineabgeschlossene Teilmenge, und Y ⊂ X eine beliebige nicht-leere Teilmenge. Sei f : Y → X eineKontraktion mit f(Y ) ⊂ A ⊂ Y . Dann besitzt f genau einen Fixpunkt.

Beweis. Wahle ein x0 ∈ Y und definiere dann rekursiv

xn+1 = f(xn)

d(xn+1, xn) = d(f(xn), f(xn−1)) ≤ Ld(xn, xn−1)

Fur k ∈ N:

d(xn+k, xn) ≤k∑j=1

d(xn+j , xn+j−1) ≤ (L+ L2 · · ·+ Lk) d(xn, xn−1) ≤ Ld(xn, xn−1)

1− L≤ Ln d(x1, x0)

1− L.

Hieraus sieht man sofort, dass (xn)n∈N eine Cauchy-Folge ist. Da X vollstandig ist, ist sie konver-gent in X.

x := limn→∞

xn = limn→∞

f(xn−1)

Somit ist x Haufungspunkt der Menge f(Y ) und deswegen (nach Aufgabe 4 Ubungsblatt 12 derAnalysis I) in A.

f(x) = f( limn→∞

xn) = limn→∞

f(xn) = limn→∞

xn+1 = x

Also ist x ein Fixpunkt, und nach obiger Bemerkung der einzige.

Beispiel 2.6. Betrachte die Funktion f : [1, 2] → R, f(x) = x + 12 cosx. Dann gilt f ′(x) =

1− 12 sinx ≥ 1/2, also ist f streng monoton wachsend. Auf Grund der Ergebnisse in Abschnitt 4 in

Kapitel 4 gilt cos 1 ≥ 1/2, also f(1) ≥ 5/4, und cos 2 < 0, also f(2) < 2. Es folgt f([1, 2]) ⊂ [5/4, 2].Wegen sinx ≥ x− x3/6 gilt fur alle x ∈ [1, 2] die Ungleichung sinx ≥ 2/3 und somit

f ′(x) ≤ 1− 1

2

2

3=

2

3.

Mit dem Mittelwertsatz ergibt sich daraus |f(x) − f(y)| ≤ (2/3)|x − y| fur x, y ∈ [1, 2], d.h. f isteine Kontraktion. Da [1, 2] vollstandig ist, konvergiert nach dem Banachschen Fixpunktsatz (unddesen Beweis) die rekursiv definierte Folge

x0 := 1, xn+1 := f(xn)

gegen den eindeutigen Fixpunkt a von f . Wegen π/2 ∈ [1, 2] folgt a = π/2 und wir bekommen

|π/2− xn| ≤(

2

3

)n.

Hiermit konnte man ein Computer-Programm zur Berechnung von π schreiben. Es gibt aber deut-lich effizientere Verfahren zur Berechnung von π.

Mi 15.5.

3. TOPOLOGISCHE RAUME 185

3. Topologische Raume

3.1. Wiederholung: Eigenschaften eines metrischen Raums. Wir definieren in einemmetrischen Raum (M,d) fur O,U ⊂M , x ∈M , r > 0:

B(M,d)r (x) := Br(x) := {y ∈M | d(x, y) < r}

U ist Umgebung von x in (M,d) ⇐⇒ ∃r > 0 : Br(x) ⊂ U.

U ist offen in (M,d) ⇐⇒ U ist Umgebung von allen y ∈ U.

Wir haben gesehen (Proposition 5.10 in Kapitel 4):

(1) ∅ und M offen in (M,d).(2) Sind U1 und U2 offene Teilmengen, dann ist auch U1 ∩ U2 offen.(3) Sei (Uj)j∈I eine Familie offener Teilmengen von (M,d), dann ist auch⋃

j∈IUj

eine offene Teilmenge.

In (c) ist wichtig, dass beliebige Indexmengen I erlaubt sind: auch abzahlbar unendliche unduberabzahlbare.

Wir definieren

OM,d := {U ⊂M | U offen in (M,d)}

Wir nennen A ⊂M abgeschlossen, falls M rA offen ist.

Auf Grund der Dreicksungleichung ist Br(x) offen.

Beispiel 3.1. Die diskrete Metrik auf M :

ddisc(x, y) =

{1 falls x 6= y

0 falls x = y.

Fur r = 1/2 und alle x ∈M gilt Br(x) = {x}. Daraus folgt, dass jede Teilmenge von M offen undabgeschlossen ist. Also OM,ddisc

= P(M).

3.2. Definition topologischer Raume.

Definition 3.2. Sei X eine Menge und O ⊂ P(X). Man nennt O eine Topologie auf X, falls gilt:

(1) ∅ ∈ O, X ∈ O,(2) Aus U1 ∈ O und U2 ∈ O folgt U1 ∩ U2 ∈ O,(3) Ist (Ui)i∈I eine Familie, Ui ∈ O, dann gilt auch

⋃i∈I Ui ∈ O.

186 8. TOPOLOGIE

Ein topologischer Raum ist ein Paar (X,O), wobei O eine Topologie auf X ist. Man sagt: U ist eineoffene Menge in (X,O) genau dann, wenn U ∈ O. Wenn die Topologie auf X aus dem Kontextheraus klar ist, schreibt man oft auch X fur (X,O).

Beispiele 3.3. (a) Ist (X, d) ein metrischer Raum, so ist OX,d eine Topologie auf X. Man nenntsie die von d induzierte Topologie.

(b) O := P(X) ist eine Topologie auf X, die sogenannte diskrete Topologie. Sie wird von derdiskreten Metrik ddisc induziert.

(c) Die Klumpentopologie auf X ist definiert als OKlump := {∅, X}.(d) Ist OX eine Topologie auf X. Sei Y ⊂ X. Dann ist

OY := {U ∩ Y | U ∈ OX}eine Topologie auf Y , genannt die Spurtopologie auf Y oder einfach die auf Y induzierteTopologie.

Bild von einer kompakten Teilmenge Y mit glattem Rand in R2, die mit einem offenen Ballin R2 geschnitten wird und so eine offene Teilmenge von Y definiert.

Die Elemente von OY nennt oft auch in Y offene Mengen.(e) Sind ‖ · ‖ und ||| · ||| aquivalente Normen auf dem Vektorraum V , so induzieren sie dieselbe

Topologie auf V . Denn angenommen es gilt fur alle x ∈ V‖x‖ ≤ C|||x||| und |||x||| ≤ C‖x‖.

Dann folgt fur x ∈ V , r > 0:

B(V,‖ · ‖)r (x) ⊂ B(V,||| · |||)

Cr (x), B(V,||| · |||)r (x) ⊂ B(V,‖ · ‖)

Cr (x).

Also fur U ⊂ V :

U offen in (V, ‖ · ‖) ⇐⇒ U offen in (V, ||| · |||).Umgekehrt gilt: Nicht-aquivalente Normen induzieren verschiedene Topologien.

(f) Die Metrik dglm definiert eine Topologie Oglm auf Abb(D,R)(g) Auf dem Raum Abb(D,R) definieren wir die Produkttopologie wie folgt: Fur a, b ∈ R und

x ∈ D definiere

Uxa,b := {f ∈ Abb(D,R) | a < f(x) < b} ⊂ Abb(D,R).

Dann definiere

S := {Uxa,b | a < b und x ∈ D} ⊂ P(Abb(D,R)).

B := {U1 ∩ . . . ∩ Uk | k ∈ N>0 und U1, . . . , Uk ∈ S} ∪ {Abb(D,R)} ⊂ P(Abb(D,R)).

U ∈ Oprod :⇐⇒ ∀x ∈ U : ∃B ∈ B : x ∈ B ⊂ UOprod ist eine Topologie auf Abb(D,R): Die Eigenschaften (1)–(3) in Definition 3.2 sind leichtzu prufen. 4 Man kann mit etwas mehr Aufwand auch zeigen:

4Diese Produkttopologie ist ein Spezialfall einer allgemeineren Konstruktion, siehe [17, Kap. 10].


• Oprod ⊂ Oglm und falls D unendlich: Oprod ( Oglm

• Ist D uberabzahlbar unendlich, z.B. D = [0, 1], dann gibt es keine Metrik auf Abb(D,R),die die Topologie Oprod induziert.

• Oprod ”beschreibt“ punktweise Konvergenz, wie wir bald sehen werden.

Bemerkung 3.4. Wieso sind topologische Raume wichtig?

• Es gibt wichtige topologische Raume, die nicht von irgendeiner Metrik induziert werden.Ein Beispiel dafur ist (Abb([0, 1],R),Oprod). Es gibt keine Metrik, die diese Topologieinduziert, siehe hierzu auch Beispiel 3.17.• Oft besitzt ein Raum M verschiedene Metriken, die dieselbe Topologie O induzieren. Zum

Beispiel fuhren alle Normen zur selben Topologie auf Rn. Wenn man nun Definition undSatze erstellt, die nur die Topologie O nutzen, aber nicht die Metrik, dann ist klar, dassdie definierten Begriffe und Satze nicht von der Wahl der passenden Metrik abhangen.• Manche topologische Raume besitzen zwar eine Metrik, diese sieht aber ziemlich un-

handlich aussieht. Auf dem Vektorraum C∞(R,R) der glatten Funktionen wird oft eine

”naturliche“ Topologie definiert5. Die Topologie wird zwar von einer geeigneten Metrik d

induziert. Diese ist aber fur praktische Zwecke unhandlich. Inbesondere gibt es keineNorm auf C∞(R,R), die diese Topologie induziert.

Es ist wichtig, dass Sie moglichst fruh mit topologischen Raumen umgehen, damit Ihnen automa-tisch bewusst ist, welche Definitionen topologischer Natur sind, und welche Definitionen zusatzlicheStruktur (Metriken, Normen, Vektorraume) benotigen.

Definition 3.5. U Umgebung von x :⇐⇒ Es existiert eine offene Menge W mit x ∈W ⊂ U .

A ⊂ X heißt abgeschlossen in (X,O) :⇐⇒ X rA offen in (X,O).

Definition 3.6. Ist N eine Teilmenge eines topologischen Raumes (X,O), dann definieren wir:

den Abschluss oder die abgeschlossene Hulle von N als

N :=⋂{A ⊂ X | N ⊂ A und A abgeschlossen in X} ,

das Innere von N oder den inneren Kern von N als

◦N :=

⋃{U ⊂ N | U offen in X} ,

den Rand von N als

∂N := N r◦N.

LEMMA 3.7.5Wir wollen dies hier nicht tun, sondern nur anmerken, dass sie zum Beispiel wichtig ist, wenn man die in der

Physik oft benutzte”δ-Funktion“ mathematisch sauber verstehen will.

188 8. TOPOLOGIE

(a)◦N = X r (X rN), N = X r

◦︷︸︸︷(X rN)

(b) x ∈◦N ⇐⇒ N Umgebung von x

(c) x ∈ N ⇐⇒ fur alle Umgebungen U von x gilt: U ∩N 6= ∅(d) x ∈ ∂N ⇐⇒ fur alle Umgebungen U von x gilt: U ∩N 6= ∅ und U ∩ (X rN) 6= ∅.

Beweis. Ubung.

Beispiel 3.8. N = [0, 1]× (0, 1) ⊂ R2, Standard-Norm.◦N = (0, 1)× (0, 1)

N = [0, 1]× [0, 1]

∂N = ([0, 1]× {0, 1}) ∪ ({0, 1} × [0, 1])

Zeichnung von diesen Mengen

Definition 3.9. Eine Teilmenge N ⊂ X heißt dicht , falls N = X.

Beispiel 3.10. Q ist dicht in R (versehen mit Standard-Norm und der induzierten Topologie).

Definition 3.11. Seien (X,OX) und (Y,OY ) topologische Raume, und f : X → Y eine Abbildung,x0 ∈ X. Man nennt f stetig in x0, falls gilt:

Fur jede Umgebung U von f(x0) in Y ist f−1(U) eine Umgebung von x0.

(Kurz: Urbilder von Umgebungen sind Umgebungen.)Man nennt f stetig , falls gilt:

Fur alle U ∈ OY gilt f−1(U) ∈ OX .

(Kurz: Urbilder offener Mengen sind offen.)

Man sieht leicht: f ist genau dann stetig, wenn es in allen x0 ∈ X stetig ist.

Diese Definition verallgemeinert alle bisherigen Definitionen von Stetigkeit.

3.3. Konvergenz in topologischen Raumen.

Definition 3.12. Ein topologischer Raum (X,O) wird Hausdorffraum genannt, falls die Hausdorff-Eigenschaft gilt:

fur alle x, y ∈ X mit x 6= y gibt es offene Mengen Ux und Uy, so dass x ∈ Ux, y ∈ Uy undUx ∩ Uy = ∅.


•x

•y

Ux Uy

Abbildung 8: Hausdorff-Eigenschaft

6

LEMMA 3.13. Jeder metrische Raum ist ein Hausdorffraum.

Beweis. Seien x, y ∈ X, x 6= y. Zu r := d(x, y)/3 definiere die offenen Mengen

Ux := Br(x) Uy := Br(y).

Wegen der Dreiecksungleichung gilt Ux ∩ Uy = ∅.

Wiederholung (Definition 2.10 in Kapitel 3):Sei A( · ) eine auf N definierte Aussageform.

Fur fast alle j ∈ N gilt A(j)

:⇐⇒ Es gibt ein j0 ∈ N, so dass fur alle j ∈ N≥j0 : A(j)

⇐⇒ Die Menge {j ∈ N | ¬A(j)} ist endlich

Definition 3.14. Sei (X,O) ein Hausdorffraum, (xi)i∈N eine Folge in X, a ∈ X.

a = limi→∞

xi ⇐⇒ Fur jede Umgebung U von a gilt xi ∈ U fur fast alle i ∈ N

⇐⇒ Zu jeder Umgebung U von a gibt es ein i0 ∈ N, so dass fur alle i ≥ i0: xi ∈ U .

Grenzwerte in Hausdorffraumen sind eindeutig, falls sie existieren. Denn angenommen a und bwaren Grenzwert der Folge (xi)i∈N, a 6= b. Da X ein Hausdorffraum ist, gibt es offene Mengen Uaund Ub mit a ∈ Ua, b ∈ Ub und Ua ∩Ub = ∅. Da Ua eine Umgebung von a ist, gibt es ein i0 ∈ N, sodass fur i ≥ i0 gilt: xi ∈ Ua. Analog dazu gibt es ein j0 ∈ N, so dass fur i ≥ j0 gilt: xi ∈ Ub. Danngilt fur k ≥ max{i0, j0} sogar xk ∈ Ua ∩ Ub = ∅, was offensichtlich nicht moglich ist. Also war dieAnnahme falsch, dass es zwei verschiedene Grenzwerte gibt. 7

Bemerkung 3.15. Nicht jede Topologie wird von einer Metrik induziert.

6Der Hausdorffraum ist nach Felix Hausdorff bennannt, ein Blick in die Biographie wird empfohlen, http:

//de.wikipedia.org/wiki/Felix_Hausdorff.7Man kann Konvergenz auch in topologischen Raumen betrachten, die nicht mehr hausdorffsch sind. Dazu

benotigt man die Theorie der”Filter“, das ist aber in Ihrer Situation doch recht aufwandig im Vergleich zum

Nutzen.

http://de.wikipedia.org/wiki/Felix_Hausdorff

http://de.wikipedia.org/wiki/Felix_Hausdorff

190 8. TOPOLOGIE

Beispiel 3.16. SeiOKlump := {∅, X} die Klumpentopologie auf X. Im Fall #X ≥ 2 ist (X,OKlump)kein Hausdorffraum, also nicht von einer Metrik induziert. 8

Beispiel 3.17. Auf der Menge Abb([0, 1],R) gibt es eine Topologie (die sogenannte Produktto-pologie, siehe z. B. [17, Kap. 10] oder siehe Beispiele 3.3 (g)). Die Produkt-Topologie erfullt dieHausdorff-Eigenschaft. Außerdem gilt: eine Folge genau dann konvergiert, wenn sie punktweisekonvergiert. Es gibt aber keine Metrik auf Abb([0, 1],R), fur die eine Folge von Funktionen ge-nau dann konvergiert, wenn sie punktweise konvergiert. Man kann sogar die starkere Aussage9

zeigen: Es gibt auf C0([0, 1],R) keine Metrik d, so dass eine Folge von stetigen Funktionen genaudann punktweise konververgiert, wenn sie in (C0([0, 1],R), d) konvergiert: M. K. Fort, A note onpointwise convergence, Proc. AMS 2 (1951), 34–35.

Bemerkung 3.18. Ist X ein Hausdorffraum, x ∈ X. Dann ist {x} abgeschlossen. (Begrundung:Ist y ∈ Xr{x}, so liefert die Hausdorff-Eigenschaft eine offene Umgebung Uy von y, die in Xr{x}enthalten ist. Also ist X r {x} offen.)

Definition 3.19. Seien (X,OX) und (Y,OY ) Hausdorffraume. Eine Abbildung ist folgenstetig ,wenn fur alle Folgen (xj)j∈N in X und a ∈ X gilt:

Wenn a = limj→∞

xj , dann f(a) = limj→∞

f(xj)

LEMMA 3.20. Seien X und Y topologische Raume, f : X → Y .

(1) Ist f stetig, dann ist f auch folgenstetig.(2) Ist dX bzw. dY eine Metrik auf X bzw. auf Y , die die Topologie auf X bzw. Y induziert. Dann

ist f genau dann stetig, wenn f folgenstetig ist.

Beweis.Zu (1): Es gelte a = limj→∞ xj in X. sei U eine Umgebung von f(a) in Y . Da f stetig in a ist, istf−1(U) eine Umgebung von a. Somit gilt xj ∈ f−1(U) fur fast alle j ∈ N. Daraus folgt fur diese jauch f(xj) ∈ U . Es folgt f(a) = limj→∞ f(xj).

Zu (2):”=⇒“ ist nun gezeigt. Den Beweis von

”⇐=“ erhalten wir aus dem Beweis von Lemma 1.7

”=⇒“ aus Kapitel 4, indem wir |x− x0| durch dX(x, x0) und |f(x)− f(x0)| durch dY (f(x), f(x0))

ersetzen.10

8Man kann genau sagen, welche topologischen Raume von einer Metrik induziert werden und welche nicht. Der

Metrisierungssatz von Bing, Nagata und Smirnow gibt hierfur Kriterien, die hinreichend und notwendig sind, siehe

[29, Satz 10.14]. Die Formulierung und der Beweis dieses Satzes ist eine wichtige kulturelle Leistung der Mathematik,aber gebraucht habe ich bisher den Satz leider noch nie. Wenn man sich jedoch zu dem Satz durcharbeitet, lerntmal sehr viele nutzliche Hilfsmittel kennen.

9Begrunden Sie als Ubung, wieso diese Aussage starker ist!10Solche Beweise, in denen Teile in alten Beweisen ersetzt werden, mag ich eigentlich nicht. Denn man macht

da ganz schnell Fehler. Um solche Verallgemeinerungen zu vermeiden, hatten wir aber noch fruher metrische Raumeeinfuhren mussen. Und dies ist auch der Grund, wieso wir jetzt topologische Raume behandeln: damit wir spaterdie kommenden Aussagen nicht noch einmal so ahnlich zeigen mussen.

https://www.ams.org/journals/proc/1951-002-01/S0002-9939-1951-0040647-7/S0002-9939-1951-0040647-7.pdf

https://www.ams.org/journals/proc/1951-002-01/S0002-9939-1951-0040647-7/S0002-9939-1951-0040647-7.pdf

4. ZUSAMMENHANG UND WEGZUSAMMENHANG 191

!ACHTUNG!. Es gibt eine Abbildung f : X → Y , X und Y topologische Raume11, mit denfolgenden Eigenschaften

• f ist folgenstetig, d.h. fur xi, x ∈ X folgt aus x = limi→∞ xi auch f(x) = limi→∞ f(xi).• f ist nicht stetig

Da solche”exotischen“ Beispiele in der Vorlesung keine Rolle spielen werden, wird diese Tatsache

nur im Skript kurz erwahnt.

4. Zusammenhang und WegzusammenhangFr 17.5.

Schreibweise: X fur (X,OX), wenn klar ist, welche Topologie auf X zu wahlen ist. Beispiel: Rntragt (fast immer) die von der Standard-Norm induzierte Topologie.

Schreibweise: Disjunkte Vereinigung U•∪ V = X bedeutet U ∪ V = X und U ∩ V = ∅.

Definition 4.1. Ein topologischer Raum X heißt nicht zusammenhangend , wenn es nicht-leere of-

fene Mengen U, V ⊂ X mit U•∪ V = X gibt. Zusammenhangend := nicht nicht zusammenhangend.

Ist A ⊂ X und ist OX eine Topologie auf X, dann definiert man auch :

A ist zusammenhangend :⇐⇒ (A,OA) ist zusammenhangend

Hierbei ist OA die auf A induzierte Topologie (Spurtopologie).

Beispiele 4.2.

(a) Die Menge {0, 1} ⊂ R ist nicht zusammenhangend.12 Denn {0} = B1/2(0) ∩ {0, 1} ist offen in{0, 1}. Analog ist {1} offen in {0, 1}. Und

{0, 1} = {0}•∪ {1}.

(b) Mehrere Bilder, u.a. eines mit zwei disjunkten Ballen in R2.Nicht zusammenhangend.

(c) Sei Q mit der Standardtopologie (d.h. mit der von d(x, y) = |x−y| induzierte Topologie) verse-

hen. Dann ist Q nicht zusammenhangend. Definiere U := (−∞,√

2)∩Q und V := (√

2,∞)∩Q.

Die Mengen U und V sind offen in Q. 13 U•∪ V = X.

(d) eine Teilmenge A von R ist zusammenhangend, gdw A ein Intervall ist. (Ubungsblatt 5 Aufgabe1)

11Dies geht naturlich nicht mit metrischen Raumen, wie oben gezeigt!12Wenn nichts anderes angegeben ist, hat R immer die Standard-Topologie und eine Teilmenge von R die

induzierte Topologie. In diesem Spezialfall ist die diskrete Topologie auf {0, 1}.13Sie sind nicht offen in R, aber offen in Q. Wer dies nicht versteht, muss nochmals genau die Definition der

Spurtopologie lesen.

192 8. TOPOLOGIE

PROPOSITION 4.3. Seien X und Y topologische Raume, f : X → Y stetig und X zusam-menhangend. Dann ist f(X) (mit der Spurtopologie von Y versehen) ebenfalls zusammenhangend.

Beweis. Angenommen f(X) ist nicht zusammenhangend. Dann gibt es Mengen U und V mit denfolgenden Eigenschaften:

• U•∪ V = f(X),

• U offen in f(X), d.h. es gibt eine offene Teilmenge U von Y mit U = Y ∩ U (sieheDefinition der Spurtopologie),

• V offen in f(X), d.h. es gibt eine offene Teilmenge V von Y mit V = Y ∩ V (sieheDefinition der Spurtopologie).• U 6= ∅ und V 6= ∅

Da f stetig ist, ist auch f−1(U) = f−1(U) offen, und offensichtlich gilt f−1(U) 6= ∅. Analog fur

f−1(V ). Außerdem haben wir X = f−1(U)•∪ f−1(V ).

Beispiel 4.4. Ist f : X → R stetig und X zusammenhangend. Dann ist f(X) ein Intervall.

Wenn wir den Spezialfall betrachten, dass X = I ein Intervall ist, und Y = R, so erhalten wirwieder die folgende Aussage, die wir als Korollar 2.4 in Kapitel 4 bereits bewiesen haben

KOROLLAR 2.4 in Kap. 4. Sei I ⊂ R ein Intervall und f : I −→ R stetig. Dann ist f(I) ebenfallsein Intervall.

Aus diesem Korollar erhalt man auch den Zwischenwertsatz. Proposition 4.3 verallgemeinert alsoden Zwischenwertsatz.

Definition 4.5. Sei X ein topologischer Raum, x, y ∈ X. Ein Weg von x nach y in X ist einestetige Abbildung s : [0, 1]→ X mit s(0) = x und s(1) = y.

Ein topologischer Raum X ist wegzusammenhangend , wenn es zu allen Punkten x, y ∈ X einenWeg von x nach y gibt.

PROPOSITION 4.6. Ist X wegzusammenhangend, so ist X auch zusammenhangend.

Beweis: Ubungsblatt 5.

Beispiel 4.7. Eine Menge A ⊂ Rn heißt sternformig bezuglich x0 ∈ A, falls gilt: ist x ∈ A undt ∈ [0, 1], dann haben wir auch (1− t)x0 + tx ∈ A.

Bild einer sternformigen Menge mit Zentrum x0 und einem Punkt x, sowie derVerbindungsstrecke dieser Punkte

Sternformige Mengen sind wegzusammenhangend, also auch zusammenhangend.

5. FOLGENKOMPAKTHEIT 193

Bemerkung 4.8. Wir betrachten die folgende Teilmenge von R2

M :=({0} × [−1, 1]

)∪ {(x, sin(π/x)) | x ∈ R>0}

und versehen M mit der von der Standardtopologie auf R2 induzierten Topologie.

Bild dieser Menge

Die Menge M ist zusammenhangend, aber nicht wegzusammenhangend.

UBUNG 4.9. Ist X wegzusammenhangend und f : X → Y stetig. Dann ist auch f(X) wegzu-sammenhangend.

5. Folgenkompaktheit

Definition 5.1. Sei (X,OX) ein Hausdorffraum. Wir sagen, (X,OX) ist folgenkompakt , wennjede Folge in X eine (in (X,OX)) konvergente Teilfolge besitzt. Eine Teilmenge A ⊂ X nennt manfolgenkompakt, wenn (A,OA) folgenkompakt ist, wobei OA die Spurtopologie auf A ist.

Diese Definition verallgemeinert die analoge Definition fur metrische Raume, siehe Definition 5.19in Kapitel 4.

SATZ 5.2. Sei (V, ‖ · ‖) ein endlich-dimensionaler reeller oder komplexer Vektorraum. Wir ver-sehen V mit der von ‖ · ‖ induzierten Topologie. Eine Teilmenge A von V ist genau dann folgen-kompakt, wenn sie abgeschlossen und beschrankt ist.

Wdh: A beschrankt ⇐⇒ ∃C ∈ R≥0 : ∀x ∈ A : ‖x‖ ≤ C

Beispiele 5.3. Ein Intervall I ist genau dann folgenkompakt, wenn es abgeschlossen und be-schrankt ist, d.h. wenn es a, b ∈ R, a ≤ b gibt mit I = [a, b].

Die folgenden Teilmengen von V = Rn sind folgenkompakt:Abgeschlossene Balle Br(x0) := {x ∈ V | ‖x− x0‖ ≤ r} bezuglich beliebiger Normen.Quader [a1, b1]× [a2, b2]× · · · × [an, bn].

Ist (V, ‖ · ‖) ein normierter Vektorraum. Aus der Dreiecks-Ungleichung folgt∣∣∣‖x‖ − ‖y‖∣∣∣ ≤ ‖x− y‖und hieraus folgt die Stetigkeit der Norm V → R, x 7→ ‖x‖.

Beweis von Satz 5.2. O.B.d.A. V = Rn.

”=⇒“: Sei A folgenkompakt.

Dann ist A abgeschlossen nach Lemma 5.20 aus Kapitel 4 (Es besagt: Folgen-kompakte TeilmengenA in einem metrischen Raum X sind in X abgeschlossen.)

194 8. TOPOLOGIE

Angenommen A ist nicht beschrankt. Dann gibt es eine Folge (ai) mit ‖ai‖ → ∞. Eine Teilfolge(af(i)) konvergiert dann gegen y ∈ A. Es folgt

‖y‖ = limi→∞

‖af(i)‖ =∞.

Widerspruch.

”⇐=“: Ist A beschrankt, so ist jede A-wertige Folge (ai)i∈N beschrankt. Nach dem Satz von

Bolzano-Weierstraß (Lemma 1.6 bzw. Korollar 1.9) besitzt die Folge eine konvergente Teilfolge(af(i))i∈N mit Grenzwert a. Wenn A zusatzlich abgeschlossen ist, so konvergiert die Teilfolge in Agegen a. Somit ist A folgenkompakt.

SATZ 5.4 (Verallgemeinert Satz 5.22 in Kapitel 4). Seien X,Y Hausdorffraume und sei f : X → Yfolgenstetig14. Ist X folgenkompakt, dann ist auch B := im(f) (versehen mit der Spurtopologie)folgenkompakt.

Der Beweis geht vollig gleich wie der Beweis von Satz 5.22 in Kapitel 4.

Beweis. Sei (an)n∈N eine Folge in B. Wahle bn ∈ X mit f(bn) = an. Wahle eine konvergenteTeilfolge (bj(n)), b := limn→∞ bj(n). Da f stetig ist, haben wir

f(b) := limn→∞

f(bj(n))︸︷︷︸=aj(n)

.

Somit ist eine konvergente Teilfolge von (an)n∈N gefunden. Wir haben die Folgenkompaktheit von Buberpruft.

Beispiel 5.5. Ist f : [a, b] → R stetig, dann ist f([a, b]) ein folgenkompaktes Intervall, d.h.f([a, b]) = [c, d] fur geeignete c, d ∈ R.

KOROLLAR 5.6. Ist X ein folgenkompakter Hausdorffraum und f : X −→ R (folgen-)stetig.Dann nimmt f ein Maximum und ein Minimum an, d.h. es gibt x1, x2 ∈ X, so dass fur allex ∈ X:

f(x1) ≤ f(x) ≤ f(x2).

Schreibweise: max f := max f(X) = max{f(x) | x ∈ X}. min f analog.

Beweis. Schreibe das folgenkompakte Intervall im(f) als [a1, a2]. Wahle xi mit f(xi) = ai.

Bemerkung 5.7. Folgenkompakte metrische Raume sind vollstandig. Denn besitzt eine Cauchy-Folge eine Teilfolge, die gegen x0 konvergiert, so konvergiert die gesamte Cauchy-Folge gegen x0.

Den Rest des Abschnitts wollen wir zunachst in der Vorlesung aus Zeitgrunden uberspringen. DieResultate werden spater im Beweis von

”folgenkompakt =⇒ kompakt“ in Theorem 6.7 nutzen.

14Die Proposition ist naturlich auch richtig, wenn wir”folgenstetig“ durch

”stetig“ ersetzen, denn jede stetige

Funktion ist folgenstetig.

6. KOMPAKTHEIT 195

LEMMA 5.8. Sei (X, d) ein folgenkompakter metrischer Raum, und ε > 0. Dann gibt es k ∈ Nund {x1, x2, . . . xk} ⊂ X, so dass

X = Bε(x1) ∪Bε(x2) ∪ · · · ∪Bε(xk).

Beweis. O.B.d.A. X 6= ∅. Wahle ein x1 ∈ X. Wahle nun weitere xi rekursiv: Falls x1, x2,. . .xjgewahlt sind, so setze

Aj := X r (Bε(x1) ∪Bε(x2) ∪ · · · ∪Bε(xj)).Im Fall Aj = ∅ ist die Behauptung gezeigt. Andernfalls wahle ein xj+1 ∈ Uj .

Wenn die Aussage des Lemmas nicht gilt, so erhalten wir eine Folge (xi)i∈N mit d(xi, xj) ≥ ε furalle i 6= j. Solch eine Folge besitzt keine konvergente Teilfolge. Also ist X nicht folgenkompakt.

FOLGERUNG 5.9. Ist X ein folgenkompakter metrischer Raum, so existiert eine Folge (xj)j∈N,so dass {xj | j ∈ N} dicht ist. In anderen Worten: X besitzt eine abzahlbare dichte Teilmenge.

Beweis. Zu n ∈ Nr {0} wahle kn ∈ N und xnj ∈ X, so dass

X =

kn⋃j=1

B1/n(xnj ).

Wir nehmen nun die Folge

(xj)j∈N = (x11, . . . x

1k1 , x

21, . . . , x

2k2 , x

31, . . .)

Sei nun ein beliebiges y ∈ X gegeben. Zu zeigen ist, dass y im Abschluss von A := {xj | j ∈ N}liegt. Zu jedem n ∈ N wahle ein jn, so dass y ∈ B1/n(xnjn), also d(y, xjn) < 1/n. Also ist (xjn)n∈Neine Folge in A, die gegen y konvergiert. Somit y ∈ A.

6. Kompaktheit

Wir fuhren nun eine andere Eigenschaft ein, die sich”Kompaktheit“ nennt, und werden dann die

erstaunliche und weitreichende Tatsache beweisen, dass metrische Raume genau dann kompaktsind, wenn sie folgenkompakt sind.

Definition 6.1. Sei X ein topologischer Raum.

(1) Eine offene Uberdeckung von X ist eine Familie (Ui)i∈I von offenen Mengen15 mit X =⋃i∈I Ui.

(2) Wir sagen X erfullt die Heine-Borel-Eigenschaft , falls gilt:Zu jeder offenen Uberdeckung (Ui)i∈I von X gibt es ein k ∈ N und i1, i2, . . . , ik ∈ I mit

X = Ui1 ∪ Ui2 ∪ · · · ∪ Uik .

15Gemeint ist damit naturlich: alle Ui sind offen in X.

196 8. TOPOLOGIE

16 Man nennt eine solche Uberdeckung eine endliche Teiluberdeckung .17

(3) Man nennt X kompakt , falls X ein Hausdorffraum ist und die Heine-Borel-Eigenschaft erfullt.18

LEMMA 6.2. Wir versehen X mit der diskreten Topologie. Dann ist X kompakt, genau dannwenn X endlich ist.

Beweis. Offensichtlich ist jede endliche Menge kompakt.

Angenommen X ist kompakt und diskret (d.h. mit der diskreten Topologie versehen). Fur x ∈ Xist Ux := {x} offen. Also ist (Ux)x∈X eine offene Uberdeckung von X. Da X kompakt ist, gibt eseine endliche Menge J ⊂ X, so dass X =

⋃x∈J Ux = J . Also ist bereits X endlich.

PROPOSITION 6.3. Sei X ein kompakter topologischer Raum und sei A eine abgeschlosseneTeilmenge. Dann ist A ebenfalls kompakt.

Beweis. Sei (Ui)i∈I eine offene Uberdeckung von A. Da A die Spurtopologie von X tragt, gibt es

Mengen Ui, offen in X mit Ui = A ∩ Ui. Sei i0 6∈ I, J := I ∪ {i0}, Ui0 := X rA. Dann ist (Ui)i∈Jeine offene Uberdeckung von X. Da X kompakt ist, gibt es eine endliche Menge K ⊂ J , so dass

(Ui)i∈K bereits X uberdeckt. Dann uberdeckt (Ui)i∈Kr{i0} bereits A.

UBUNG 6.4. () Zeigen Sie, dass Lemma 6.2 und Proposition 6.3 auch dann gelten, wenn man

”kompakt“ durch

”folgenkompakt“ ersetzt.

PROPOSITION 6.5. Sei X ein Hausdorffraum und A eine kompakte Teilmenge 19. Dann ist Aabgeschlossen.

Beweis. Wir zeigen, dass X r A offen ist. Sei y ∈ X r A. Zu jedem x ∈ A gibt es auf Grundder Hausdorff-Eigenschaft disjunkte offene Mengen Ux und Uxy , so dass x ∈ Ux und y ∈ Uxy .Achtung: Wie die Notation ja bereits andeutet, hangt Uxy von x ab! Nun ist (A ∩ Ux)x∈A eine

offene Uberdeckung von A. Auf Grund der Kompaktheit von A gibt es x1, . . . , xk ∈ A mit

A = (A ∩ Ux1) ∪ . . . ∪ (A ∩ Uxk)

Wir setzen

Vy :=

k⋂i=1

Uxiy offen in X.

16Man wundert sich vielleicht, wieso wir nicht k ∈ N r {0} genommen haben. Dies liegt am Spezialfall X = ∅,der (Ui)i∈∅ als offene Uberdeckung hat. Fur ihn wahlt man k = 0. Die leere Menge erfullt also die Heine-Borel-

Eigenschaft und ist kompakt.17Teiluberdeckung bedeutet hier nicht, dass der Raum nur zum Teil uberdeckt wird. Er wird ganz uberdeckt. Die

Aussage ist vielmehr: Man kann alle bis auf endlich viele der Ui’s weglassen und hat immer noch eine Uberdeckung.

Man uberdeckt mit einem endlichen Teil der offenen Mengen.18Achtung: Manche Mathematiker nennen einen topologischen Raum kompakt, sobald er die Heine-Borel-

Eigenschaft erfullt, ohne die Hausdorff-Eigenschaft einzuschließen. Wenn Sie ein Buch oder Skript zu diesem Themain die Hand nehmen, mussen Sie immer uberprufen, welche Definition nun benutzt wird. Ahnlich wie in der Frage,ob 0 eine naturliche Zahl ist oder nicht, gibt es hier eben verschiedene ubliche Konventionen.

19wie immer: bezuglich der Spur-Topologie

6. KOMPAKTHEIT 197

Also ist X rA =⋃y∈XrA Vy ebenfalls offen.

PROPOSITION 6.6. Seien X,Y Hausdorffraume und sei f : X → Y stetig. Ist X kompakt, dannist auch das Bild im(f) = f(X) (versehen mit der Spurtopologie) kompakt.

Beweis. Sei (Ui)i∈I eine offene Uberdeckung von f(X), Ui offen in f(X). Dann ist(f−1(Ui)

)i∈I

eine offene Uberdeckung von X. Wegen der Kompaktheit von X gibt es eine endliche Menge J ,so dass bereits

(f−1(Ui)

)i∈J die Menge X uberdeckt. Wegen f(f−1(Ui)) = Ui ∩ f(X) = Ui folgt,

dass (Ui)i∈J bereits f(X) uberdeckt.

THEOREM 6.7. Sei X ein metrischer Raum. Dann ist X genau dann folgenkompakt, wenn Xkompakt ist.

Beweis des Theorems.

”kompakt =⇒ folgenkompakt“: Sei X kompakt. Sei (an)n∈N eine Folge in X.

1. Fall: A := {an | n ∈ N} besitzt keinen Haufungspunkt in XAlso ist A abgeschlossen, und somit kompakt. Außerdem ist die Topologie auf A diskret. WegenLemma 6.2 ist dann A endlich. Nach dem Schubfach-Prinzip 20 gibt es also ein a ∈ A, so dassI := {n ∈ N | an = a} unendlich ist. Dann ist (an)n∈I eine Teilfolge21 von (an)n∈N, die konstantgleich a ist und somit gegen a konvergiert.

2. Fall: {an | n ∈ N} besitzt einen Haufungspunkt x0 in XEs folgt mit Lemma 5.17 aus Kapitel 4 die Existenz einer konvergenten Teilfolge.

”folgenkompakt =⇒ kompakt“:

Sei X folgenkompakt. Gegeben sei eine offene Uberdeckung (Ui)i∈I von X.

Wir zeigen in einem ersten Schritt, dass es eine abzahlbare Menge J ⊂ I gibt, so dass (Ui)i∈J eine(offene) Uberdeckung ist. 22. In einem zweiten Schritt zeigen wir dann, dass es eine endliche MengeK ⊂ J gibt, so dass (Ui)i∈K eine (offene) Uberdeckung ist.

1. Schritt:Sei D eine abzahlbare dichte Teilmenge von X, die es auf Grund von Folgerung 5.9 in X gibt.Dann ist

B := {B1/n(p) | n ∈ N, p ∈ D}

20Das sogenannte Schubfach-Prinzip besagt anschaulich: wenn ich unendlich viele Kugeln in endlich viele Schub-laden einsortieren, dann habe ich einer Schublade (= Schubfach) unendlich viele Kugeln. Mathematisch praziser:

Ist eine Funktion g : N → A, gegeben mit A endlich, so gibt es ein a ∈ A mit unendlichem g−1(a). Es sollte Ihneninzwischen klar sein, wie man des Schubfach-Prinzips beweist.

21Wir schreiben hier Teilfolgen zum ersten Mal auf eine andere Art und Weise. Wenn man die eindeutige streng

monoton wachsende Bijektion f : N→ I wahlt, so ist mit (an)n∈I die Teilfolge (af(n))n∈N gemeint.22Der erste Schritt wird in der Vorlesung ubersprungen

198 8. TOPOLOGIE

eine abzahlbare Menge offener Mengen. Man sieht schnell, dass jede offene Menge in X eine Ver-einigung geeigneter Elemente von B ist. Sei nun

B′ := {U ∈ B | ∃i ∈ I : U ⊂ Ui}und zu jedem U ∈ B′ wahlen wir solch ein i = f(U), also U ⊂ Ui(U), f : B′ → I. Sei J := f(B′).Da B abzahlbar ist, ist es auch B′ und somit J .

Wir mussen fur diesen Schritt noch zeigen, dass (Ui)i∈J uberdeckt. Sei also x ∈ X. Dann gibt esi ∈ I mit x ∈ Ui. Wahle n ∈ N, so dass B2/n(x) ⊂ Ui. Wahle ein p ∈ D mit d(p, x) < 1/(2n).Dann gilt x ∈ B1/n(p) ⊂ B2/n(x) ⊂ Ui und B1/n(p) ∈ B′. Also auch x ∈ Uf(B1/n(p)).

2. Schritt:Sei nun also (Ui)i∈J eine offene Uberdeckung mit J abzahlbar. O.B.d.A. J = N. Wir nehmenan, dass Vn :=

⋃ni=1 Ui eine echte Teilmenge von X ist23 fur alle n ∈ N. Wahle xn ∈ X r Vn.

Wahle eine konvergente Teilfolge (xf(n))n∈N der Folge (xn)n∈N. Es gibt nun ein j ∈ N, so dasslimn→∞ xf(n) ∈ Uj . Da Uj offen ist, liegt fur fast alle n ∈ N dann xf(n) ∈ Uj . Unter anderem gibtes ein n ∈ N, f(n) ≥ j, mit xf(n) ∈ Uj , was offensichtlich ein Widerspruch zur Konstruktion derxj ist.

Also gibt es ein Vn mit Vn = X.

Bemerkung 6.8. Es gibt Hausdorffraume, die kompakt, aber nicht folgenkompakt sind. Es gibtauch Hausdorffraume, die folgenkompakt, aber nicht kompakt sind. Siehe im Buch [32].

Mehr zum Thema folgenkompakte/kompakt inklusive schoner Bilder findet man hier: http://

simomaths.wordpress.com/2013/02/24/topology-sequentially-compact-spaces-and-compact-spaces

Beispiel 6.9. Fur eine Teilmenge A eines endlich-dimensionalen normierten Vektorraums sindaquivalent:

(1) A ist beschrankt und abgeschlossen(2) A ist kompakt(3) A ist folgenkompakt

Mi 22.5.

Definition 6.10. Seien X und Y topologische Raume. Eine Abbildung f : X → Y nennt manHomoomorphismus, falls gilt:

• f ist stetig• f ist bijektiv• f−1 : Y → X ist stetig

In anderen Worten: f ist eine Bijektion mit der Eigenschaft

U offen in X ⇐⇒ f(U) offen in Y.

23Erinnerung:”A echte Teilmenge von X“ bedeutet: A ⊂ X und A 6= X.

http://simomaths.wordpress.com/2013/02/24/topology-sequentially-compact-spaces-and-compact-spaces

http://simomaths.wordpress.com/2013/02/24/topology-sequentially-compact-spaces-and-compact-spaces

6. KOMPAKTHEIT 199

Existiert ein Homoomorphismus von X nach Y , so nennt man X und Y homoomorph. Homoomor-phie ist eine Aquivalenzrelation auf der Klasse 24 aller topologischer Raume.

SATZ 6.11. Ist X ein kompakter topologischer Raum, Y ein Hausdorffraum und f : X → Ybijektiv und stetig, dann ist f ein Homoomorphismus.

Beweis. Aufgabe 1 auf Ubungsblatt 6.

Definition 6.12. Sind (M,dM ) und (N, dN ) metrische Raume. Eine Abbildung f : M → N heißtgleichmaßig stetig , falls

(6.13) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x, y ∈M :(dM (x, y) < δ =⇒ dN (f(x), f(y)) < ε

).

LEMMA 6.14. Sind (M,dM ) und (N, dN ) metrische Raume, und f : M → N stetig. Ist Mkompakt, so ist f gleichmaßig stetig.

Insbesondere folgt hieraus das noch nicht bewiesene Lemma 4.1 in Kapitel 6.

Beweis. Angenommen f ist nicht gleichmaßig stetig. Es gibt dann ein ε > 0, so dass

(6.15) ∀δ ∈ R>0 : ∃x, y ∈M : dM (x, y) < δ ∧ dN (f(x), f(y)) ≥ ε.

Zu jedem n ∈ N r {0} und δ := δn := 1/n wahlen wir xn, yn ∈ M wie in (6.15). Da M kompaktund somit folgenkompakt ist, gibt es eine Teilfolge (xnk)k∈N, so dass

x := limk→∞

xnk

in M existiert. Wegen d(xnk , ynk) < 1/nk gilt auch x = limk→∞ ynk . Da f (folgen-)stetig ist giltdann auch

f(x) = limk→∞

f(xnk) = limk→∞

f(ynk),

also

limk→∞

dN(f(xnk), f(ynk)

)= 0.

Dies widerspricht jedoch der obigen Wahl von xnk und ynk , denn diese haben wir so gewahlt, dassfur alle k ∈ N die Ungleichung dN

(f(xnk), f(ynk)

)≥ ε gilt.25

Wir haben gezeigt, dass die Annahme, f sei nicht gleichmaßig stetig, einen Widerspruch impliziert.Also muss f gleichmaßig stetig sein.

Sei (X, d) ein metrischer Raum und ∅ 6= Y ⊂ X. Definiere fur x ∈ X

d(x, Y ) := inf{d(x, y) | y ∈ Y }

24Die Gesamtheit aller topologischer Raume ist so groß, dass es keine Menge mehr ist, sondern eine Klasse.Siehe den Anfang der Analysis I.

25Und naturlich fur das feste oben gewahlte ε > 0!

200 8. TOPOLOGIE

Dann gilt

d(x, Y ) = 0 ⇐⇒ x ∈ Y ,d(x,X r U) ≥ r ⇐⇒ Br(x) ⊂ U.

UBUNG 6.16 (Aufgabe 4 (ii) (a) auf Ubungsblatt 3). Die Funktion X → R, x 7→ d(x, Y ) iststetig.

Beweis. (Losung der Aufgabe)

d(x1, y) ≤ d(x1, x2) + d(x2, y)

Nehme das Infimum uber y ∈ Y :

d(x1, Y ) ≤ d(x1, x2) + d(x2, Y )

und analoges gilt, wenn wir x1 und x2 vertauschen. Es folgt

|d(x1, Y )− d(x2, Y )| ≤ d(x1, x2).

Daraus folgt, dass x 7→ d(x, Y ), X → R stetig ist.

PROPOSITION 6.17. Sei (X, d) ein kompakter metrischer Raum und (Ui)i∈I eine offene Uber-deckung. Dann gibt es ein ε > 0 mit der folgenden Eigenschaft: Zu jedem x ∈ X gibt es ein i ∈ Imit Bε(x) ⊂ Ui.

Solch ein ε nennt man eine Lebesguesche Zahl .Fr 24.5.

Eine kompakte Teilmenge in R2 mit Uberdeckung und darin ε-Balle.

Beweis. Da X kompakt ist, gibt es eine endliche Teiluberdeckung (Ui)i∈J , also J ⊂ I endlich.O.B.d.A. J = {1, 2, . . . , k}. Die Funktion

f : X → R, x 7→ 1

k

k∑i=1

d(x,X r Ui)

ist stetig. Gilt x ∈ Ui, so ist d(x,X r Ui) > 0. Da jedes x ∈ X in U1 ∪ . . . ∪ Uk enthalten ist, giltf(x) > 0. Da X kompakt ist, nimmt f sein Minimum in einem Punkt x0 ∈ X an.

Setzeε := min f = f(x0) > 0.

Aus f(x) ≥ ε folgt, dass es mindestens ein i ∈ {1, 2, . . . , k} gibt mit d(x,X r Ui) ≥ ε, alsoBε(x) ⊂ Ui.

KAPITEL 9

Differential-Rechnung fur Funktionen in mehrerenVeranderlichen

1. Vorbemerkungen

Die Worte”Veranderliche“ und

”Variable“ haben im folgenden dieselbe Bedeutung.

In diesem Kapitel versehen wir Rn mit irgendeiner Norm ‖ · ‖. Die davon induzierte Topologie istdie Standard-Topologie, denn alle Normen auf Rn sind aquivalent.

Standard-Basis von Rn: (e1, e2, . . . , en).

L(Rn,Rk) :={

Lineare Abbildungen von Rn nach Rk} ∼= {k × n-Matrizen} =: Rk×n

Bei Prof. Cisinski wurde Mk×n(K) an Stelle von Kk×n verwendet.

Abweichend von unserer bisherigen Schreibweise, ubernehmen wir von nun an die in der LinearenAlgebra ubliche Konvention, dass Elemente von Rn als Spaltenvektoren geschrieben werden. Wirschreiben auch

x = (x1, x2, . . . , xn)T =

x1

x2

...xn

∈ Rn

LEMMA 1.1. Ist A : Rn → Rk eine lineare Abbildung, dann ist A stetig.

Beweis. Schreibe x = (x1, . . . , xn)T =∑nj=1 xjej ∈ Rn und

Ax =

k∑i=1

n∑j=1

aijxjei.

201

202 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN

Da alle Normen auf Rn und Rk aquivalent sind, reicht es, die Behauptung fur die Supremumsnormzu zeigen.

‖Ax‖∞ ≤

maxi∈{1,2...,k}

n∑j=1

|aij |

︸︷︷︸

C:=

‖x‖∞ ≤ C‖x‖∞.

Zu gegebenem ε > 0 setze δ := ε/C. Dann gilt

d∞(x, y) = ‖x− y‖∞ < δ =⇒ d∞(Ax,Ay) = ‖Ax−Ay‖∞ = ‖A(x− y)‖∞ < ε.

KOROLLAR 1.2. Sind V und W endlich-dimensionale normierte Vektorraume, und A : V →Wlinear, dann ist A stetig.

Bemerkung 1.3. Sei V ein Vektorraum mit Basis (bn | n ∈ N), den wir mit der zugehorigenSupremumsnorm

‖∑n=0

xnbn‖∞ := maxn∈{0,...,`}

|xn|

versehen. Dann gibt es genau eine lineare Abbildung A : V → R mit A(bn) = n. Diese Abbildungist nicht stetig. Denn setzen wir an := 1√

nbn ∈ V , dann ist (an)n∈Nr{0} eine Nullfolge in (V, ‖ · ‖∞),

aber f(an) =√n→∞ fur n→∞.

Bemerkung 1.4. Das meiste, was wir in diesem Kapitel machen, gilt ebenso (zumeist mit densel-ben Beweisen), wenn man

• Rn, Rk und ahnliche Raume durch beliebige (auch unendlich-dimensionale) Banachraume1

ersetzt und• lineare Abbildungen (und endliche Matrizen) durch stetige lineare Abbildungen ersetzt.

Fur Details verweisen wir auf das Buch [2]. Der mathematische Mehraufwand ist gering. In derVorlesung schranken wir uns auf Raume Rn, Rk,. . . ein, damit klar ist, dass dies zunachst diewichtigen Beispiele sind, die Sie moglichst grundlich verstehen mussen. Es folgt dann auch unmit-telbar2, dass alle von uns bewiesenen Aussagen dann auch in endlich-dimensionalen normiertenVektorraumen V gelten, indem wir eine Basis von V wahlen und dann mit Rn identifizieren.

2. Differenzierbarkeit in mehreren Variablen

1also vollstandige normierte Vektorraume2Das heißt hier: ohne nochmals in die Beweise schauen zu mussen.

2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 203

Definition 2.1. Sei U ⊂ Rn offen, p ∈ U . Wir sagen, f : U → Rk ist total differenzierbar in poder differenzierbar in p, falls es eine lineare Abbildung A : Rn → Rk gibt mit

(2.2) limh→0

f(p+ h)− f(p)−Ah‖h‖

= 0.

Wir sagen, f ist differenzierbar auf W ⊂ U , wenn f in allen p ∈ W differenzierbar ist. Und f istdifferenzierbar, wenn f auf U differenzierbar ist.

3

PROPOSITION 2.3. Sei f , U , p wie oben. Dann gibt es hochstens ein A ∈ Rk×n, fur das (2.2)gilt.

Falls f differenzierbar in p ist, dann nennt man das obige (eindeutig bestimmte) A die (totale)Ableitung oder das (totale) Differential von f in p und schreibt sie als Dpf := A und f ′(p) := A.

PROPOSITION 2.4. Ist f differenzierbar in p, dann ist f stetig in p.

Beweis der beiden vorangehenden Propositionen. (2.2) ist aquivalent zu der Aussage: Es gibt einein p stetige Funktion r : U → Rk mit r(p) = 0 und

f(p+ h) = f(p) +Ah+ r(p+ h)‖h‖ fur alle h ∈ Rn mit p+ h ∈ U.

Wir schreiben x fur p+h. Die Funktionen U 3 x 7→ f(p) ∈ Rk, x 7→ A(x−p) und x 7→ r(x)‖x−p‖sind stetig in p und somit auch x 7→ f(x). Also ist Proposition 2.4 gezeigt.

Wir zeigen nun Proposition 2.3. Angenommen (2.2) gilt fur A := A1 ∈ Rk×n und A := A2 ∈ Rk×n.O.B.d.A. sei U ⊃ Bε(p0). Bestimme4 nun zugehorige ri zu Ai. Es gilt fur x = p+ h ∈ U :

A1h+ r1(p+ h)‖h‖ = A2h+ r2(p+ h)‖h‖

Wenn wir nun fur t ∈ [0, 1] die Variable h durch th ersetzen, ergibt sich

t(A1 −A2)(h) = (A1 −A2)(th) = (r2(p+ th)− r1(p+ th)) ‖th‖ = (r2(p+ th)− r1(p+ th)) t‖h‖.

Wir dividieren durch t und bekommen:

(A1 −A2)h = (r2(p+ th)− r1(p+ th))︸︷︷︸→0

‖h‖ → 0

fur t→ 0. Da dies fur alle h ∈ Bε(0) gilt, gilt es insbesondere fur h := ε2e`, also (A1−A2)(e`) = 0.

Es folgt A1 = A2.

3So wie die Definitionen bisher gewahlt sind, ist das Wortchen”total“ ein erlaubtes Vorwortchen, hat aber keine

inhaltliche Bedeutung. Spater werden wir auch den Begriff”partiell differenzierbar“ kennen lernen. Man benutzt

dann das Vorwortchen “total“ um nochmals zu betonen, dass hier nicht”partiell differenzierbar“ gemeint ist. Aber

selbst dann ist die Bedeutung von”differenzierbar“ und

”total differenzierbar“ die gleiche.

4Achtung: in der Vorlesung habe ich die Funktionen ri etwas anders definiert. Das andert aber wenig an der

Beweisstruktur.


Beispiel 2.5. Die Funktion f : R2 → R, (x1, x2)T 7→ x1x2 ist differenzierbar in jedem Punktp = (p1, p2)T . Denn, wenn wir A := (p2, p1) setzen5, so gilt fur x = (x1, x2)T und h = (h1, h2)T

f(p+ h)− f(p)−Ah = (p1 + h1)(p2 + h2)− p1p2 − (p2h1 + p1h2) = h1h2 = r(p+ h)‖h‖,

wobei wir fur h ∈ R2 r {0} definieren

r(p+ h) :=h1h2

‖h‖und r(p) = 0. Es gilt im Fall ‖ · ‖ = ‖ · ‖∞:∣∣∣∣ h1h2

‖h‖∞

∣∣∣∣ ≤ ∣∣∣∣‖h‖∞‖h‖∞‖h‖∞

∣∣∣∣ ≤ ‖h‖∞,das heißt in diesem Fall haben wir limh→0 r(p + h) = 0 = r(p). Wegen der Aquivalenz allerNormen auf gilt diese Aussage auch fur beliebige Normen ‖ · ‖. Also ist f differenzierbar in p undf ′(p) = (p2, p1).

Bemerkung 2.6. Differenzierbarkeit ist eine lokale Eigenschaft. D.h. ist U offen in Rn, p ∈ U undstimmen die Funktionen g, f : U → Rk auf einer Umgebung von p uberein, dann gilt:

(a) f ist genau dann in p differenzierbar, wenn g in p differenzierbar ist.(b) Wenn f in p differenzierbar ist, dann gilt f ′(p) = g′(p).

Bemerkung 2.7. Schreibe f : U → Rk in Komponenten f(x) = (f1(x), f2(x), . . . , fk(x))T mitfi : U → R. Sei p ∈ U . Es gilt wegen Korollar 1.9 (b) in Kapitel 8

f ist stetig in p ⇐⇒ f1, f2,. . . und fk sind stetig in p

limh→0

f(p+ h) =

limh→0

f1(p+ h)

limh→0

f2(p+ h)

...limh→0

fk(p+ h)

Diese Zeile ist so zu lesen: wenn eine der beiden Seiten existiert, dann auch die andere und dannsind die Werte gleich.

f ist differenzierbar in p ⇐⇒ f1, f2,. . . und fk sind differenzierbar in p

f ′(p) =

f ′1(p)f ′2(p)

...f ′k(p)

∈ Rk×n

Also: f ′i(p) ∈ R1×n ist eine Zeile der Matrix f ′(p).

5kein Tippfehler bei A: es ist ein Zeilenvektor!


Bemerkung 2.8. Sind V und W Vektorraume, dimV = n, dimW = k, U offen in V , f : U →W .Die Wahl von Basen liefert Isomorphismen ϕ : Rn → V und ψ : Rk →W .

Wir sagen: f ist differenzierbar in p ∈ U gdw f := ψ−1 ◦ f ◦ ϕ ist differenzierbar in ϕ−1(p).

Diese Definition ist unabhangig von der Wahl der Basen. Man erhalt ein

f ′(p) ∈ L(V,W )

das ebenfalls unabhangig von der Basis definiert ist, und

ψ−1 ◦ f ′(p) ◦ ϕ = f ′(ϕ−1(p)).

Bemerkung 2.9. Ist f : U → Rk differenzierbar, so erhalten wir eine Abbildung f ′ : U →L(Rn,Rk) ∼= Rk×n ∼= Rkn. Ist f ′ wieder differenzierbar (also f zweimal differenzierbar), so erhaltenwir

f ′′ : U → L(Rn,L(Rn,Rk)) ∼= L(Rn,Rkn) ∼= Rn2k

Ist f r-mal differenzierbar, dann

f (r) : U → Rnrk

Wie berechnet man die Koeffizienten von f ′(p)?

Definition 2.10. Sei U offen in Rn, f : U → Rk, p ∈ U ,

(1) Zu v ∈ Rnr{0} wahle ε > 0 so klein, dass fp,v : (−ε, ε)→ Rk, fp,v(t) := f(p+tv) wohldefiniertist. Wir sagen: f ist differenzierbar in p in Richtung v, falls fp,v in 0 differenzierbar ist. Wirnennen dann

∂p,vf := f ′p,v(0)

die Richtungsableitung von f an der Stelle p in Richtung v.(2) Wir sagen f ist in p partiell differenzierbar falls f in Richtung ei differenzierbar ist fur alle

i ∈ {1, 2, . . . , n}. Schreibweise p = (p1, . . . , pn). Man nennt

∂f

∂xi(p) := f ′p,ei(0) =

d

dt|t=0

(t 7→ f(p1, p2, . . . , pi−1, pi + t, pi+1, . . . , pn)

)die i-te partielle Ableitung von f an der Stelle p.

Mi 29.5.

LEMMA 2.11. f , U , n, k, p wie oben. Ist f (total) differenzierbar in p, dann ist f in p in jedeRichtung differenzierbar. Fur alle v ∈ Rn gilt dann

∂p,v = f ′(p) · v.

Beweis. Gegeben sei ein v ∈ Rn r {0}. Wahle ε > 0 so klein, dass fur alle t ∈ (−ε, ε) gilt: tv ∈ U .Mit t→ 0 gilt dann auch tv → 0. Es gelte

limh→0

f(p+ h)− f(p)−Ah‖h‖

= 0


fur A = f ′(p) ∈ L(Rn,Rk). Dann gilt auch

0 = limt→0

f(p+ tv)− f(p)−A(tv)

‖tv‖=

1

‖v‖limt→0

f(p+ tv)− f(p)−A(tv)

|t|und somit

0 =

(limt→0

f(p+ tv)− f(p)

t−Av

).

Also existiert die Richtungsableitung und nimmt den folgenden Wert an:

∂p,vf = f ′p,v(0) = limt→0

f(p+ tv)− f(p)

t= Av

KOROLLAR 2.12. Ist f in p differenzierbar, dann ist die Ableitung in p:

f ′(p) =(∂f∂x1

(p) ∂f∂x2

(p) . . . ∂f∂xn

(p))∈ Rk×n

Also ist ∂f∂xi

(p) die i-te Spalte der Matrix f ′(p).

Bemerkung 2.13. Es gilt also fur U , p, n, k, f wie oben:

f diffbar in p =⇒ f diffbar in jede Richtung in p =⇒ f partiell diffbar in p.

Aber man kann durch Beispiele zeigen, dass die Umkehrungen nicht gelten:

f diffbar in p 6⇐= f diffbar in jede Richtung in p 6⇐= f partiell diffbar in p.

Beispiel 2.14 (Ausfuhrlich diskutiert in der Zentralubung am 28.5., in der Vorlesung nur kurz).

f : R2 → R, f(x, y) :=

{2xyx2+y2 falls (x, y) 6= 0

0 falls x = y = 0

f ist in 0 partiell differenzierbar und

∂f

∂x(0) = 0,

∂f

∂y(0) = 0.

Aber fur v := 1√2(1, 1)T ist t 7→ f(tv) nicht einmal stetig in 0. Denn f(tv) = 1 fur t 6= 0 und

f(0) = 0. Also ist f in 0 nicht in Richtung v differenzierbar. Dadurch ist f auch nicht totaldifferenzierbar in 0.

f ist also partiell differenzierbar in 0. Nach einem Basiswechsel ist f aber nicht mehr partielldifferenzierbar.

Achsenkreuz, beschriftet x und y mit Hohenlinien der Funktion f .

Es gibt Funktionen f : R2 → R, die in 0 in alle Richtungen differenzierbar sind mit ∀v ∈ R2 :∂p,vf = 0, die aber dennoch nicht in 0 stetig sind. Sie sind also auch in 0 nicht total differenzierbar.

PROPOSITION 2.15. f , U , n, k, p wie oben. Aquivalent sind:


(1) f auf U partiell differenzierbar und alle partiellen Ableitungen

∂f

∂xi: U → Rk, i ∈ {1, 2, . . . , n}

sind stetig.(2) f auf U total differenzierbar und

f ′ : U → L(Rn,Rk) ∼= Rk×n

ist stetig

Ist (1) bzw. (2) erfullt, so sagen wir f ist stetig differenzierbar .

Sei U offen in Rn.

C1(U,Rk) := {f : U → Rk | f ist stetig differenzierbar}.

Cr+1(U,Rk) := {f ∈ C1(U,Rk) | f ′ ∈ Cr(U,L(Rn,Rk)) = Cr(U,Rk×n)}Elemente in Cr(U,Rk) nennt man r-mal stetig differenzierbar.

Beweis der Proposition.”(2) =⇒ (1)“ folgt direkt aus dem oben gesagten.

”(1) =⇒ (2)“:

Zu zeigen ist die Differenzierbarkeit in einem beliebigen p ∈ U . Die Stetigkeit der Ableitungergibt sich dann direkt aus der Stetigkeit der partiellen Ableitungen. Sobald wir wissen, dass fdifferenzierbar ist, erhalten wir aus den partiellen Ableitungen die totale Ableitung

(2.16) A :=(∂f∂x1

(p) ∂f∂x2

(p) . . . ∂f∂xn

(p))∈ Rk×n .

Da man die Differenzierbarkeit komponentenweise uberprufen kann, konnen wir ohne Beschrankungder Allgemeinheit annehmen, dass k = 1.

Zu ε > 0 wahle ein δ > 0, so dass fur alle η ∈ Rn mit ‖η‖∞ < δ gilt:

p+ η ∈ U und fur i ∈ {1, 2, . . . , n} gilt

∣∣∣∣ ∂f∂xi (p+ η)− ∂f

∂xi(p)

∣∣∣∣ < ε

n.

Zu h = (h1, . . . , hn)T ∈ Rn mit ‖h‖∞ < δ setze

q(0) := p = (p1, . . . , pn)T

q(1) := (p1 + h1, p2, . . . , pn)T ,

......

q(`) := (p1 + h1, . . . , p` + h`, p`+1, . . . , pn)T

......

q(n) := p+ h = (p1 + h1, . . . , pn + hn)T


Wir fixieren nun alle Variablen außer der i-ten Koordinate und wenden dann den 1. Mittelwertsatzder Analysis I auf die Funktion t 7→ f(q(i−1) + tei), definiert fur t ∈ [0, hi] bzw. t ∈ [hi, 0] an. Wirerhalten

f(q(i))− f(q(i−1))1. MWS

= hi∂f

∂xi(p1 + h1, . . . , pi−1 + hi−1, pi + ϑihi, pi+1, . . . , pn)︸︷︷︸

=:ξ(i)

fur ein geeignetes ϑi ∈ [0, 1]. Mit ‖ξ(i) − p‖∞ < δ, folgt∣∣∣∣f(q(i))− f(q(i−1))− hi∂f

∂xi(p)

∣∣∣∣ ≤ |hi| εnEs ergibt sich fur die in (2.16) definierte Matrix A

|f(p+ h)− f(p)−Ah| ≤n∑i=1

∣∣∣∣f(q(i))− f(q(i−1))− hi∂f

∂xi(p)

∣∣∣∣ ≤ ε ‖h‖∞.Wir haben das ε-δ-Kriterium fur den Grenzwert

limh→0

f(p+ h)− f(p)−Ah‖h‖∞

= 0

uberpruft, und dies besagt, dass f in p differenzierbar mit Ableitung A ist. 6

PROPOSITION 2.17 (Summenregel). Seien U , n, k, p, wie oben. Seien f, g : U → Rk, a, b ∈ R,v ∈ Rn r {0}. Sind f und g in p differenzierbar (bzw. in Richtung v differenzierbar, bzw. partielldifferenzierbar), dann ist af + bg : U → Rk ebenfalls in p differenzierbar (bzw. in Richtung vdifferenzierbar, bzw. partiell differenzierbar). Es gilt dann

(af + bg)′(p) = af ′(p) + bg′(p)

bzw.

∂p,v(af + g) = a∂p,vf + b∂p,vg

bzw.∂(af + bg)

∂xi(p) = a

∂f

∂xi(p) + b

∂g

∂xi(p).

Beweis. Offensichtlich.

Bemerkung 2.18. Sei f = (f1, . . . , fk)T : U → Rk in p ∈ U partiell differenzierbar. Wenn wirf ′(p) als Matrix in Rk×n (und nicht als lineare Abbildung in L(Rn,Rk)) ansehen, dann gilt

f ′(p) =

(∂fi∂xj

(p)

)i∈{1,2,...,k}j∈{1,2,...,n}

.

6Ist Ihnen klar, wieso es hilfreich war, uns auf den Fall k = 1 einzuschranken? Der Grund ist, dass wir den

1. Mittelwertsatz nutzen, den wir nur fur Funktionen I → R, I ein Intervall, bewiesen haben; also fur k = 1. Wirwerden eine Verallgemeinerung des Mittelwertsatz auf Funktionen f : U → R, U offen in Rn zwar bald kennenlernen,

eine Verallgemeinerung auf Funktionen nach Rk, k > 1 ist jedoch nicht moglich, siehe Beispiel 2.24.


Man nennt diese Matrix oft auch die Jacobi-Matrix von f in p. Da wir auf Rn und Rk die Stan-dardbasen verwenden und lineare Abbildungen mit Matrizen identifizieren Rk×n = L(Rk,Rn), istdie Jacobi-Matrix dasselbe wie die Ableitung. Sobald man aber Rk und Rn durch beliebige Vek-torraume V und W ersetzt, so ist die Ableitung f ′(p) ∈ L(V,W ) unabhangig von der gewahltenBasis definiert. Die Jacobi-Matrix ist dann die Matrix-Darstellung von f ′(p) bezuglich zu wahlenderBasen.

SATZ 2.19 (Kettenregel). Sei U offen in Rn, V offen in Rm, f : U → Rm, g : V → Rr, f(U) ⊂ V .Ist f differenzierbar in p und g differenzierbar in q := f(p), dann ist g ◦ f differenzierbar in p und

(g ◦ f)′(p) = g′(q) · f ′(p).

Man kann g′(q) · f ′(p) als Verkettung der linearen Abbildungen f ′(p) ∈ L(Rn,Rm) und g′(q) ∈L(Rm,Rr) ansehen, 7 oder f ′(p) und g′(q) als Matrizen betrachten (also als Jacobi-Matrizen!) unddann gilt f ′(p) ∈ Rm×n, g′(q) ∈ Rr×m, g′(q) · f ′(p) ∈ Rr×n.

!ACHTUNG!. Es gilt nicht g′(q) · f ′(p) = f ′(p) · g′(q). Die rechte Seite ist fur r 6= n gar nichtdefiniert, und auch im Fall n = r gilt hier im allgemeinen keine Gleichheit.

Beweis der Kettenregel. (Bewiesen am Fr. 31.5.)

f(p+ h) = f(p) + f ′(p) · h+ ‖h‖ε(h), limh→0

ε(h) = 0

g(q + k) = g(q) + g′(q) · k + ‖k‖δ(k), limk→0

δ(k) = 0

Fur h→ 0 geht auch k := f(p+ h)− f(p) gegen Null.

g(f(p+ h)) = g(f(p)) + g′(f(p))( =k︷︸︸︷f ′(p) · h+ ‖h‖ε(h)

)+ ‖k‖δ(k)

= g(q) + g′(q) · f ′(p) · h+ ‖h‖(g′(q)ε(h) +

‖k‖δ(k)

‖h‖

)Die Funktion h 7→ γ(h) := g′(q) · ε(h) ist die Verkettung der in 0 stetigen Funktion ε mit derlinearen (und somit stetigen) Funktion k 7→ g′(q) · k. Also ist γ stetig in 0 und γ(0) = 0.

Mit h→ 0 gilt auch δ(k)→ 0. Wir zeigen, dass es eine Konstante C > 0 gibt, so dass ‖k‖/‖h‖ ≤ Cfur alle h in einer Umgebung von 0 gilt. Sobald dies gezeigt ist, folgt

limh→0

‖k‖δ(k)

‖h‖= 0,

wobei man k als Funktion in h betrachten sollte. Und hieraus ergibt sich dann die Aussage desSatzes (Kettenregel).

7Bei dieser Interpretation ware es eigentlich sauberer g′(q) ◦ f ′(p) an Stelle von g′(q) · f ′(p) zu schreiben.Da wir aber sowieso lineare Abbildungen mit Matrizen identifizieren, ist es auch sinnvoll die Verkettung linearerAbbildungen mit Matrizen-Multiplikation zu identifizieren.


Es reicht,‖k‖/‖h‖ ≤ C fur die Supremums-Norm auf Rn, Rm und Rm×n zu zeigen, da auf jedemdieser Vektorraume alle Normen aquivalent sind.

Fur A ∈ Rm×n und h ∈ R gilt‖Ah‖∞ ≤ n‖A‖∞‖h‖∞

Also

‖k‖∞‖h‖∞

=‖f ′(p) · h+ ‖h‖∞ε(h)‖∞

‖h‖∞

≤ n‖f ′(p)‖∞ ‖h‖∞ + ‖h‖∞ ‖ε(h)‖∞‖h‖∞

≤ n‖f ′(p)‖∞ + ‖ε(h)‖∞Da ε(h)→ 0 fur h→ 0 gilt, ist ‖ε(h)‖∞ auf einer ausreichend kleinen Umgebung von 0 beschrankt.

KOROLLAR 2.20 (Produktregel). Sei U offen in Rn, f, g : U → R. Sind f und g differenzierbarin p ∈ U , dann auch f · g : U → R, x 7→ f(x) · g(x), und es gilt

(f · g)′(p) = g(p)f ′(p) + f(p)g′(p)

Beweis. Betrachte

F : U → R2, F (x) :=

(f(x)g(x)

).

Nach Voraussetzung ist F differenzierbar in p.

F ′(p) =

(f ′(p)g′(p)

)∈ R2×n.

Die Abbildung ϕ : R2 → R, (x1, x2)T 7→ ϕ(x) = x1x2 ist (uberall) differenzierbar und es giltϕ′(x1, x2) = (x2, x1) ∈ R1×2, siehe Beispiel 2.5 oder berechne es uber die partiellen Ableitungen.

f · g = ϕ ◦ FAlso ist nach Kettenregel f · g in p differenzierbar und es gilt

(f · g)′(p) = ϕ′(F (p)) · F ′(p) = (g(p), f(p)) ·(f ′(p)g′(p)

)= g(p)f ′(p) + f(p)g′(p).

Fr 31.5.

Ubersicht: Wichtige Beispiele und Methoden, um Differenzierbarkeit zu zeigen.

• Sei f : Rn → Rk von der Form f(x) = Ax + b, A ∈ Rk×n, b ∈ Rk. Dann ist f uberalldifferenzierbar und es gilt f ′(x) = A uberall, denn

f(x+ h)− f(x)−Ah‖h‖

=0

‖h‖.

Also ist f ′ : Rn → Rk×n konstant und deswegen f ′′(x) = 0 ∈ L(Rn,L(Rn,Rk)).


• Ist f : U → Rk (k-mal) differenzierbar und V ⊂ U offen, dann ist auch f |V (k-mal)differenzierbar. Dasselbe fur k-mal stetig differenzierbar.• Ist f : U → Rk ist auf U partiell differenzierbar und die partiellen Ableitungen sind

stetig, dann ist f : U → Rk stetig differenzierbar8 (Proposition 2.15).• Summen-, Produkt-, Quotienten-, Kettenregel.• Polynome in mehreren Variablen sind glatt (= beliebig oft differenzierbar), z.B.

R3 → R, (x, y, z)T 7→ x3 + x2y4 + 3xyz.

• Ebenso Funktionen wie

f : Rn → R, f(x) = ei〈ξ,x〉, ξ ∈ Rn;

f : Rn → R, f(x) = ‖x‖22 =

n∑j=1

x2j ;

f : Rn → R, f(x) = x1 · arctan(1 + ‖x‖22 − cos ‖x‖2

).

(Es wurde insbesondere verwendet, dass g : R → R, g(s) :=∑∞j=0

(−1)j

(2j)! sj glatt ist und

g(t2) = cos(t) fur t ∈ R erfullt. Obige Aussage sind richtig fur die Standard-Norm ‖ · ‖2,aber nicht fur alle Normen: die Funktionen Rn 3 x 7→ ‖x‖2∞ und Rn 3 x 7→ ‖x‖21 sindzum Beispiel nicht differenzierbar.)

ENDE DER UBERSICHT

KOROLLAR 2.21 (Quotientenregel). Sei U offen in Rn, f : U → R, g : U → R r {0}. Sind fund g differenzierbar in p ∈ U , dann auch f/g : U → R, x 7→ f(x)/g(x), und es gilt(

f

g

)′(p) =

g(p)f ′(p)− f(p)g′(p)

g(p)2.

Beweis. Ahnlich wie die Produktregel, aber mit ϕ : R× (Rr {0})→ R, (y, z) 7→ y/z.

ϕ′(y, z) = (1/z,−y/z2)(f

g

)′(p) = ϕ′(F (p)) · F ′(p) = (1/g(p),−f(p)/g(p)2)

(f ′(p)g′(p)

)=g(p)f ′(p)− f(p)g′(p)

g(p)2.

Bemerkungen 2.22.

(1) Produktregel, Quotientenregel, Summenregel richtig fur Richtungsableitungen, insbesonderefur partielle Ableitungen

8Also insbesondere differenzierbar!


(2) Die Kettenregel gilt nicht mehr fur alle partiell differenzierbare Funktionen. Ein Beispielwird in der Zentralubung diskutiert. Man9 betrachte die differenzierbare Funktion

h : R2 → R2, h(x, y) =

(x+ yx− y

)=

(1 11 −1

)·(xy

), h′(x, y) =

(1 11 −1

)und die Funktion f : R2 → R aus Beispiel 2.14. Dann ist f in 0 partiell differenzierbar und esgilt

∂f

∂x(0) =

∂f

∂y(0) = 0

Aber

(f ◦ h)(x, y) =2(x+ y)(x− y)

(x+ y)2 + (x− y)2=

(x2 − y2)

x2 + y2,

also∂(f ◦ h)

∂x(0) = 1,

∂(f ◦ h)

∂x(0) = −1.

(0, 0) ·(

1 11 −1

)= (0, 0) 6= (1,−1)

Wenn die Kettenregel gultig ware, so wurde sie besagen, dass die linke und die rechte Seitegleich sind. Also ist dies ein Gegenbeispiel.

Mittelwertsatz.

Der Mittelwertsatz fur Funktionen Rn ⊃ U → R ergibt sich direkt aus dem der Analysis I.

PROPOSITION 2.23 (Mittelwertsatz). Sei U offen in Rn, p, q ∈ U mit

[p, q] := {p+ t(q − p) | t ∈ [0, 1]} ⊂ U.Die Funktion f : U → R sei stetig auf [p, q] und differenzierbar auf

{p+ t(q − p) | t ∈ (0, 1)}.Dann gibt es ein ϑ ∈ (0, 1) mit

f(q) = f(p) + f ′(p+ ϑ(q − p)) · (q − p).

Beweis. ϕ : [0, 1]→ Rn, t 7→ p+ t(q − p).

f ◦ ϕ stetig auf [0, 1] und differenzierbar auf (0, 1). Aus dem ersten Mittelwertsatz (Satz 3.2 ausKapitel 5) folgt die Existenz eines ϑ ∈ (0, 1) mit

f(q)−f(p) = (f ◦ϕ)(1)− (f ◦ϕ)(0)1. MWS

= (f ◦ϕ)′(ϑ) = f ′(ϕ(ϑ)) ·ϕ′(ϑ) = f ′(p+ϑ(q−p)) · (q−p).

9In Beispielen wie diesem benutzen wir ab jetzt die Notation h(x, y) als alternative, kurzere Schreibweise fur

h

((x

y

))= h

((x y)T

)


!ACHTUNG!. Man kann hier nicht ohne weiteres die Zielmenge R durch Rk ersetzen. Wenn wirf = (f1, . . . , fk)T schreiben, kann man zwar den Mittelwert-Satz fur jedes fi anwenden, und wirerhalten jedesmal ein ϑi ∈ [0, 1] mit

fi(q) = fi(p) + f ′i(p+ ϑi(q − p)) · (q − p).

Man findet aber kein ϑ ∈ [0, 1] mit

f(q) = f(p) + f ′(p+ ϑ(q − p)) · (q − p).

Beispiel 2.24. f : R → R2, f(t) = (cos t, sin t)T , p = 0, q = 2π. Dann gilt f(p) = f(q), aberf ′(t) = (− sin t, cos t)T 6= 0 ∈ R2. Es kann also kein solches ϑ geben.

Definition 2.25. Sei X ein topologischer Raum und Y eine Menge. Eine Funktion f : X → Yheißt lokalkonstant , wenn jedes x ∈ X eine Umgebung U in X besitzt, so dass f |U konstant ist.

Konstante Funktionen sind lokal konstant. Ist X diskret (zum Beispiel X = {1, 2, 3} ⊂ R), dannist jede Funktion f : X → Y lokal konstant.

Ist f : X → Y lokal konstant und A ⊂ X, dann ist f |A lokal konstant.

LEMMA 2.26. Ist f : A→ Y lokal konstant und ist A zusammenhangend, dann ist f konstant.

Beweis. Sei a ∈ A gegeben. Dann folgt aus der lokalen Konstantheit, dass U1 := {x ∈ A | f(x) =

f(a)} offen in A ist und dass U2 := {x ∈ A | f(x) 6= f(a)} offen ist. Aus A = U1

•∪ U2, U1 6= ∅

und A zusammenhangend folgt U2 = ∅.

Aus dem Mittelwertsatz ergibt sich das folgende Korollar:

KOROLLAR 2.27. Sei f : U → R wie oben. Dann gilt

f ′(x) = 0 fur alle x ∈ U ⇐⇒ f ist lokal konstant.

Beweis.

”⇐=“ ist klar.

”=⇒“: Zu p ∈ U wahle ε > 0 mit Bε(p) ⊂ U . Fur jedes q ∈ Bε(p) gibt es ein ϑ ∈ [0, 1] mit

f(q) = f(p) + f ′(p+ ϑ(q − p)) · (q − p) = f(p) + 0.

Also ist f |Bε(p) konstant.

Definition 2.28. Eine Teilmenge G ⊂ Rn nennt man Gebiet , wenn G nicht-leer, offen und zu-sammenhangend ist.

KOROLLAR 2.29. Sei f : U → R wie oben, und U ein Gebiet.

f ′(x) = 0 fur alle x ∈ U ⇐⇒ f ist konstant.


3. Hohere Ableitungen

3.1. Satz von Schwarz. Sei U offen in Rn, f : U → Rk.

Die i-te partielle Ableitung ist

∂f

∂xi: U → Rk.

Man nennt es auch die partielle Ableitung nach xi.

Wenn wir diese Ableitung nun nach xj partiell ableiten, erhalten wir

∂2f

∂xj∂xi:=

∂

∂xj

(∂f

∂xi

): U → Rk

Beispiel: f(x1, x2) = x21x2, ∂f

∂x1(x1, x2) = 2x1x2, ∂2f

∂x2∂x1(x1, x2) = 2x1.

Zu i1, i2, . . . , i` ∈ {1, 2, . . . , n} definieren wir rekursiv:

∂`f

∂xi1∂xi2 · · · ∂xi`:=

∂

∂xi1

(∂`−1f

∂xi2 · · · ∂xi`

): U → Rk.

Die Anzahl der partiellen Ableitungen von der Ordnung ` ist n`. Sind alle diese Ableitungenverschieden?

Wir betrachten nun den Spezialfall k = 1 und ` = 2.

Definition 3.1. Wenn f : U → R auf U differenzierbar ist und (f ′)T : U → Rn = Rn×1 in p ∈ Udifferenzierbar ist, dann nennt (

∂2f

∂xj∂xi(p)

)i,j

=((f ′)T

)′(p)

die Hesse-Matrix von f in p.

Die zugehorige bilineare Abbildung ist die Hesse-Abbildung

Hesspf : Rn × Rn → R,

x1

...xn

,

y1

...yn

7→ n∑

i,j=1

xi∂2f

∂xj∂xi(p) yj

Die Hesse-Matrix ist die Matrix-Darstellung der Hesse-Abbildung.

Schreibweise fur Hesse-Matrix: f ′′(p) :=((f ′)T

)′(p) ∈ Rn×n.

Wir zeigen nun folgenden Satz:

3. HOHERE ABLEITUNGEN 215

SATZ 3.2 (Satz von Schwarz). Sei f : U → Rk, U offen in Rn, p ∈ U , ` ≥ 2. Ist f (` − 1)-mal differenzierbar auf U und `-mal differenzierbar im Punkt p, dann sind die `-ten partiellenAbleitungen in p unabhangig von der Reihenfolge der Ableitungen.

10

Zum Beispiel: Ist f zweimal differenzierbar auf U , dann gilt

∂2f

∂xj∂xi(x1, . . . , xn) =

∂2f

∂xi∂xj(x1, . . . , xn)

das heißt f ′′(p) ist eine symmetrische Matrix.

Dies bedeutet, wir brauchen danach gar nicht mehr darauf zu achten, welcher Index von ∂2f∂xi∂xj

die Zeile und welcher die Spalte angibt.

Im Beweis dieses Satzes von Schwarz ist es aber naturlich sehr wichtig, welche Rolle Zeilen undSpalten haben: f ′(p) ∈ R1×n ist ein Zeilen-Vektor, f ′(p)T ∈ Rn×1 ist ein Spalten-Vektor, und dieHesse-Matrix ist (

(f ′)T)′

(p) =

(∂2f

∂xj∂xi(p)

)i,j

.

Mi 5.6.

Beweis. O.B.d.A. ` = 2.11 O.B.d.A. k = 1 (komponentenweise Argumentation). O.B.d.A. ‖ · ‖ =‖ · ‖2. Sei ε > 0 gegeben und zunachst fixiert. Wahle ρ > 0 so, dass

B3ρ(p) = {x ∈ Rn | ‖x− p‖2 < 3ρ} ⊂ U.

Wahle u, v ∈ Rn mit 0 < ‖u‖2 = ‖v‖2 ≤ ρ. Definiere

g : [0, 1]→ R, g(t) := f(p+ tu+ v)− f(p+ tu).

Wir rechnen fur eine reelle Zahl ϑ ∈ (0, 1). Sie darf zunachst beliebig sein, und spater mit dem 1.Mittelwertsatz so gewahlt, dass g(1)− g(0) = g′(ϑ).

g′(ϑ) =(f ′(p+ ϑu+ v)− f ′(p+ ϑu)

)u

=(f ′(p+ ϑu+ v)− f ′(p)− (f ′(p+ ϑu)− f ′(p))

)u

Da f ′′(p) existiert, wissen wir, dass

‖(f ′)T

(p+ ϑu+ v)−(f ′)T

(p)− f ′′(p) · (ϑu+ v)︸︷︷︸a:=

‖ ≤ ε ‖ϑu+ v‖ ≤ ε (‖u‖+ ‖v‖),

10Nach Hermann Amandus Schwarz (1843-1921) siehe http://de.wikipedia.org/wiki/Hermann_Amandus_

Schwarz11Wenn wir zwei Ableitungen vertauschen konnen, dann konnen wir alle Ableitungen miteinander sukzessive

vertauschen.

http://de.wikipedia.org/wiki/Hermann_Amandus_Schwarz

http://de.wikipedia.org/wiki/Hermann_Amandus_Schwarz


gilt, falls ρ > 0 genugend klein gewahlt wurde. 12 Und analog erhalten wir fur genugend kleinesρ > 0:

‖(f ′)T

(p+ ϑu)−(f ′)T

(p)− f ′′(p) · (ϑu)︸︷︷︸b:=

‖ ≤ ε ‖ϑu‖ ≤ ε (‖u‖+ ‖v‖).

Dies ergibt13

g′(ϑ) =(g′(ϑ)

)T= uT

((f ′)T

(p+ ϑu+ v)−(f ′)T

(p)−((f ′)T (p+ ϑu)− (f ′)T (p)

))= uT

(a− b+ f ′′(p) · v

)Wir erhalten unter Benutzung der Cauchy-Schwarz-Ungleichung14

∀x, y ∈ Rn : xT y = 〈x, y〉 ≤ ‖x‖2‖y‖2

|g′(ϑ)− uT f ′′(p)v| = |uT (a− b)| ≤ ‖u‖ · 2ε (‖u‖+ ‖v‖) ≤ 2ε (‖u‖+ ‖v‖)2.

Mit dem 1. Mittelwertsatz konnen wir nun ϑ ∈ (0, 1) so wahlen, dass

g′(ϑ)1. MWS

= g(1)− g(0) = f(p+ u+ v)− f(p+ u)− f(p+ v) + f(p).

Somit

|f(p+ u+ v)− f(p+ u)− f(p+ v) + f(p)− uT f ′′(p)v| = |uT (a− b)| ≤ 2ε (‖u‖+ ‖v‖)2.

Der Ausdruck f(p + u + v) − f(p + u) − f(p + v) + f(p) andert sich nicht, wenn wir u und vvertauschen.

Also

|uT f ′′(p)v − vT f ′′(p)u| ≤ 4ε(‖u‖+ ‖v‖)2.

Wir setzen u := λei, v = λej , λ > 0 genugend klein.∣∣∣∣λ2 ∂2f

∂xj∂xi(p)− λ2 ∂2f

∂xi∂xj(p)

∣∣∣∣ ≤ 4ελ2(1 + 1)2.

∣∣∣∣ ∂2f

∂xj∂xi(p)− ∂2f

∂xi∂xj(p)

∣∣∣∣ ≤ 16ε.

12Genaue Logik: zu obigem ε > 0 gibt es ein ρ1 ∈ (0, ρ] , so dass die Aussage fur 0 < ‖u‖2 = ‖v‖2 ≤ ρ1 gilt.Im nachsten Schritt erhalten wir dann ein ρ2 ∈ (0, ρ1] mit analogen Eigenschaften.

13Identifiziere R ∼= R1 ∼= R1×1

14Dies ist wieder Hermann Amandus Schwarz, allerdings ist es fraglich, ob hier der Name Schwarz so angebracht

ist. Schwarz wurde 1843 geboren, obwohl der Satz von Cauchy-Schwarz in Rn bereits 1821 von Cauchy veroffentlicht

wurde. Die Integral-Version stammt von Buniakovsky (1859), siehe http://jeff560.tripod.com/c.html. Dennochsollte man die Ungleichung die Cauchy-Schwarz-Ungleichung nennen, denn nur mit diesem seit ca. 1930 ublichenNamen weiß man, welche Ungleichung gemeint ist.

http://jeff560.tripod.com/c.html


Da wir ε > 0 zu Beginn des Beweises beliebig klein15 wahlen konnten16, ergibt sich

∂2f

∂xj∂xi(p) =

∂2f

∂xi∂xj(p).

17

Beispiel 3.3 (Zentralubung). Sei f : R2 → R,

(x, y) 7→

{xy x

2−y2x2+y2 falls (x, y) 6= (0, 0),

0 falls (x, y) = (0, 0).

Man rechnet nach, dass f zweimal partiell differenzierbar ist. Aber es gilt

∂2f

∂y ∂x(0, 0) = −1,

∂2f

∂x ∂y(0, 0) = 1

Schreibweise

Oft verwendet man x, y, z an Stelle von x1, x2, x3. Dann

∂f

∂x,∂f

∂y,∂f

∂z.

18

15Hier bedeutet”beliebig klein“

”beliebig nahe an 0“

16und dann eben auch ρ, λ etc klein, aber positiv wahlen17Kommentar zu den Quellen: verschiedene Beweise in der Literatur benutzen etwas andere Voraussetzungen.

Die obige Version kenne ich von einem Vorlesungsskript Prof. Helmut Klingen, Freiburg, WS 1988/89. In Konigs-berger [23] benotigt man andere Voraussetzungen an Stelle der `-fachen Differenzierbarkeit in p, namlich (im Fall

` = 2), dass eine der ∂2f∂xj∂xi

fur ein festes i und j stetig in p sein soll. Es folgt dann ebenfalls die obige Gleich-

heit. Die Konigsbergerschen Voraussetzungen sind weder schwacher noch starker als unsere. Viele Bucher nehmen2-mal stetig differenzierbar an, und erhalten dann eine Aussage, die echt schwacher als unsere obige und als die

Konigsbergersche ist.18Bei physikalischen Anwendungen ist oft die Reihenfolge der Variablen unklar, und bestimmte Buchstaben

bedeuten immer bestimmte Großen. Eine gewisse Menge Gas soll bei einer Temperatur T und einem Volumen V den

Druck p haben. Dann ist p eine Funktion in T und V , also p : R2>0 → R>0, (T, V ) 7→ p(T, V ) oder (V, T ) 7→ p(V, T ).

Welches von beiden, weiß man eben nicht so recht, und ist aber irrelevant. Jedenfalls ist in beiden Fallen klar, was

mit ∂p/∂V gemeint ist. Hier ist die eingefuhrte Notation sehr effektiv und ungefahrlich. Gefahrlich wird es aber inder Physik, wenn wir nun den Blickwinkel wechseln und sagen, der Druck des Gases hangt von dem Volumen V undder im Gas enthaltenen Enthalpie H ab, (V,H) 7→ p(V,H). Dann erhalt ∂p/∂V eine andere Bedeutung, denn nun ist

damit die infinitesimale Anderung des Drucks bei Volumenanderung und konstanter Enthalpie gemeint, wohingegenzuvor damit die infinitesimale Anderung des Drucks bei Volumenanderung und konstanter Temperatur gemeint war.

Dieser Sachverhalt hat mich in der Thermodynamik damals als Student etwas verwirrt.


3.2. Hohere Ableitungen als multi-lineare Abbildungen. In diesem Abschnitt sei wie-der U offen in Rn. Sei V ein reeller Vektorraum. Alles was wir bisher fur Funktionen g : U → Rkmit beliebigem k ∈ N definiert und gezeigt haben, konnen wir auch – mit leichten redaktionellenModifikationen – fur Funktionen g : U → V definieren und zeigen19. Ist g : U → V differenzierbar,so erhalten wir die Ableitung g′ : U → L(Rn, V ). Ein Vorteil dieser Sichtweise ist dann, dass dieDifferenzierbarkeit und die Ableitung von g unabhangig von der verwendeten Basis von V definiertsind.

Diese Sichtweise erlaubt uns auch, eine (mindestens) `-mal differenzierbare Funktion f : U → R `-mal zu differenzieren. Im Fall ` = 2 ist f ′ : U → L(Rn,R) ∼= Rn×1. Wir wenden dies auf g = f ′ undV = L(Rn,R) an und erhalten g′ = f ′′ : U → L(Rn,L(Rn,R)). Die Transposition oder aquivalentdazu die Matrix-Darstellung in der Standard-Basis liefert wie in der Linearen Algebra ublich einen

Isomorphismus L(Rn,R)∼=−→ Rn, v 7→ vT . Dies ergibt

L(Rn,L(Rn,R)) ∼= L(Rn,Rn) ∼= Rn×n ∼= Rn2

.

Wenn wir dies iterativ fur hohere Ableitungen durchfuhren, dann ist es ab der dritten Ableitungnicht mehr moglich und sinnvoll, den Formalismus der Linearen Algebra, der streng zwischen Zeilen-und Spaltenvektoren unterscheidet, einzuhalten. Die `-te Ableitung hat ` Indizes und fur das ublicheMatrizen-Kalkul brauchten wir dann ein `-dimensionales Blatt Papier um die Matrix zu notieren.Eine mathematisch konzeptionelle Sichtweise zur Beschreibung dieser multilinearen Abbildungenist mit Hilfe von Tensoren (Lineare Algebra II), ein Begriff, den wir hier nur andeuten wollen. Inkonkreten Berechnungen arbeitet man oft am einfachsten mit iterierten partiellen Ableitungen.

Sei p ∈ U .

f(p) ∈ R, (0, 0)-Tensor=Skalar

f ′(p) =

(∂f

∂xi(p)

)i=1,...,n

∈ L(Rn,R) ∼= R1×n ∼= Rn, (0, 1)-Tensor=(Zeilen-)Vektor

f ′ : U → Rn

f ′′(p) ∈ L(Rn,L(Rn,R))

L(Rn,L(Rn,R)) ∼= {bilineare Abb. Rn × Rn → R} ∼= Rn×n ∼= Rn2

, (0, 2)-Tensor=Matrix

f ′′ : U → Rn×n

f ′′(p) =

(∂2f

∂xi ∂xj(p)

)i,j∈{1,...,n}

19Eine Ausnahme ist hier naturlich der Mittelwertsatz, da das Ziel 1-dimensional sein muss.


f ′′′(p) ∈ L(Rn,L(Rn,L(Rn,R)))

L(Rn,L(Rn,L(Rn,R))) ∼= {trilineare Abb. Rn × Rn × Rn → R} ∼= Rn×n×n (0, 3)-Tensor

f ′′′ : U → Rn×n×n

f ′′′(p) =

(∂3f

∂xi ∂xj ∂xk(p)

)i,j,k∈{1,...,n}

...

f (`)(p) : Rn × · · · × Rn︸︷︷︸`-mal

→ R, `-linear, (0, `)-Tensor

f (`) :=(f (`−1)

)′`-linear

f (`) = f : U → {`-lineare Abb. Rn × · · · × Rn︸︷︷︸`-mal

→ R}

f (`)(p) =

(∂`f

∂xi1 ∂xi2 · · · ∂xi`

)i1,...,i`∈{1,...,n}

(p)

Der Satz von Schwarz besagt, dass all diese multi-linearen Abbildung in allen Eintragen symme-trisch sind.20 Wir haben dies bereits benutzt und die Reihenfolge der Indizes getauscht.

Beispiel 3.4. Sei U offen in Rn, seien p = (p1, . . . , pn)T ∈ U , q = (q1, . . . , qn)T ∈ Rn, f : U → Rsei `-mal differenzierbar. Es gilt c(p+tq) ∈ U fur t ∈ (−ε, ε) fur ein kleines ε > 0. Sei g(t) := f(c(t))fur t ∈ (−ε, ε), d.h. g = fp,q in der Notation von Definition 2.10.

c(0) = p, c′(t) = q, c(`)(t) = 0 fur ` ≥ 2.

20Das heißt, man darf die Eintrage in der Reihenfolge tauschen, also zum Beispiel f (k)(p)(h1, h2, . . . , hk) =

f (k)(p)f(h2, h1, h3, . . . , hk) = f (k)(p)f(hk, hk−1, . . . , h1)


g′(t) = f ′(c(t))c′(t) =

n∑i1=1

∂f

∂xi1(c(t)) qi1

g′′(t) = c′(t)T f ′′(c(t))c′(t) + f ′(c(t)) c′′(t)︸︷︷︸=0

= Hessc(t)f(c′(t), c′(t)

)=

n∑i1,i2=1

∂2f

∂xi1∂xi2(c(t)) qi1qi2

g′′′(t) =(

trilineare Abb. zu f ′′′(c(t)))(c′(t), c′(t), c′(t)

)=

n∑i1,i2,i3=1

∂3f

∂xi1∂xi2∂xi3(c(t)) qi1qi2qi3

...

g(`)(t) =(`-lineare Abb. zu f (`)(c(t))

)(c′(t), . . . , c′(t)︸︷︷︸

`-mal

)=

n∑i1,...,i`=1

∂`f

∂xi1∂xi2 · · · ∂xi`(c(t)) qi1 · · · qi`

3.3. Satz von Taylor.

SATZ 3.5 (Taylor). Sei U offen in Rn und f : U → R. Seien p = (p1, . . . , pn)T , x = (x1, . . . , xn)T ∈U mit [p, x] ⊂ U . Die Funktion f sei `-mal differenzierbar auf U und (` + 1)-mal differenzierbarauf

{p+ t(x− p) | t ∈ (0, 1)}.Wir definieren das Restglied Rp` (x) so, dass gilt:

f(x) = f(p) +

n∑i=1

∂f

∂xi(p) · (xi − pi) +

1

2!

n∑i1,i2=1

∂2f

∂xi1 ∂xi2(p) · (xi1 − pi1) · (xi2 − pi2)

+ · · ·+ 1

`!

n∑i1,i2,...,i`=1

∂`f

∂xi1 ∂xi2 · · · ∂xi`(p) · (xi1 − pi1) · (xi2 − pi2) · · · (xi` − pi`)

+Rp` (x)

Dann gibt es ein ϑ ∈ (0, 1) mit

Rp` (x)

=1

(`+ 1)!

n∑i1,i2,...,i`+1=1

(∂`+1f

∂xi1 ∂xi2 · · · ∂xi`+1

(p+ ϑ(x− p))

)· (xi1 − pi1) · · · (xi`+1

− pi`+1)

Die blauen Klammern geben exemplarisch an, wie man derartige Ausdrucke verstehen muss, dieseKlammern werden aber normalerweise nicht gesetzt.

Beweis. Anwendung des Satzes von Taylor aus Analysis I auf die Funktion

g(t) := f(p+ t(x− p))

ergibt:


(3.6) g(t) =∑j=0

tj

j!g(j)(0) + r0

` (t)

mit

r0` (t) =

t`+1

(`+ 1)!g(`+1)(ϑt)

fur ein ϑ ∈ (0, 1). Nun setzen wir t = 1 in (3.6), wenden Beispiel 3.4 fur obiges p und q = x− p anund erhalten mit Rp` (x) := r0

` (1) die Behauptung.

Notation 3.7 (Multi-Indizes). Sei α = (α1, . . . , αn) ∈ Nn, h = (h1, . . . , hn) ∈ Rn, p ∈ U ,f : U → R. Dann definieren wir

α! := α1!α2! · · ·αn!

|α| := α1 + · · ·+ αn

hα := hα11 · · ·hαnn

Dαf |p :=∂|α|f

∂xα(p) :=

∂α1+···+αnf

∂x1 · · · ∂x1︸︷︷︸α1-mal

· · · ∂xn · · · ∂xn︸︷︷︸αn-mal

(p)

Die Bezeichnung ∂|α|f∂xα (p) wird ofter verwendet, u.a. in der Physik. Die Bezeichnung Dαf |p erscheint

mir zweckmaßiger und effektiver.Fr. 7.6.

Wenn wir nun den Satz von Schwarz benutzen, gleiche Terme in der obigen Taylorschen Formelzusammenfassen, und elementare Formeln der Kombinatorik nutzen21 (siehe Zentralubung am18.6.), dann erhalten wir den folgenden Satz.

FOLGERUNG 3.8 (Satz von Taylor in Multi-Index-Notation). Sei U , p, x, f wie oben.

Wir definieren das Restglied Rp` (x) so, dass gilt:

f(x) =∑α∈Nn|α|≤`

1

α!Dαf |p(x− p)α +Rp` (x) .

Dann gibt es ein ϑ ∈ (0, 1) mit

Rp` (x) =∑α∈Nn|α|=`+1

1

α!Dαf |p+ϑ(x−p)(x− p)α .

21um abzuzahlen bzw. zu berechnen, wie oft jeder Term vorkommt


3.4. Einschub: Quadratische Formen. Um den Term 2. Ordnung in der Taylor-Entwicklunggenauer zu verstehen, betrachten wir quadratische Formen.

Definition 3.9. Sei K ein Korper mit 2 6= 0, z.B. K ∈ {Q,R,C}. Sei V ein K-Vektorraum. Einequadratische Form ist eine Abbildung Q : V → K in der Form

Q(x) = b(x, x)

fur eine K-bilineare Abbildung b : V × V → K.

Bemerkungen 3.10.

(1) Die Bilinearform b in obiger Definition kann symmetrisch gewahlt werden. Denn fur eine be-liebige bilineare Abbildung b : V × V → K schreiben wir

b±(x, y) :=b(x, y)± b(y, x)

2.

Also b(x, y) = b+(x, y) + b−(x, y). Nun ist b+ ist symmetrisch: b+(x, y) = b+(y, x). Und b− istantisymmetrisch b−(x, y) = −b−(y, x). Wegen b−(x, x) = −b−(x, x) = 0 gilt b(x, x) = b+(x, x).

(2) Fur Q(x) = b(x, x) gilt

Q(x+ y)−Q(x− y) = b(x+ y, x+ y)− b(x− y, x− y) = 2b(x, y) + 2b(y, x) = 4b+(x, y).

Der symmetrische Anteil von b ist also durch Q eindeutig festgelegt.

Definition 3.11. Sei K = R. Eine quadratische Form Q auf V heißt

positiv definit :⇐⇒ ∀x ∈ V r {0} : Q(x) > 0

negativ definit :⇐⇒ ∀x ∈ V r {0} : Q(x) < 0

positiv semi-definit :⇐⇒ ∀x ∈ V : Q(x) ≥ 0

negativ semi-definit :⇐⇒ ∀x ∈ V : Q(x) ≤ 0

indefinit :⇐⇒ Q ist weder positiv semi-definit noch negativ semi-definit

⇐⇒ Es existieren x+, x− ∈ V mit Q(x+) > 0 und Q(x−) < 0.

Nun22 sei V = Rn. Jede quadratische Matrix A ∈ Rn×n definiert eine quadratische Form

QA(x) = xTAx.

Umgekehrt kann man zu einer gegebenen quadratischen Abbildung Q : Rn → R definieren:

aij :=Q(ei + ej)−Q(ei − ej)

4, AQ := (aij)ij ∈ Rn×n

22Man kann ahnlich vorgehen fur beliebige endlich-dimensionale relle Vektorraume V , in dem man zuerst eine

basis von V wahlt, die uns dann erlaubt, V mit Rn zu identifizieren. Es stellt sich dann naturlich die Frage, wie sichdie definierten Objekte transformieren, wenn wir die Basis wechseln. Dies sollte im Rahmen der Linearen Algebra

diskutiert werden.


Wir erhalten eine Bijektion

{Quadratische Formen auf Rn} → {A ∈ Rn×n | AT = A}Q 7→ AQ

QA ← [ A

Wir nennen eine quadratische Matrix A positiv definit (bzw. positiv semi-definit, negativ (semi-)definit, indefinit), falls A symmetrisch ist und QA die gleichnamige Eigenschaft hat.

Alle symmetrische Matrizen sind diagonalisierbar (siehe Korollar 1.8.5 der Linearen Algebra II vonProf. Cisinski). Man sieht dann leicht, dass fur symmetrische Matrizen gilt:

A ist positiv (bzw. negativ) definit :⇐⇒ alle Eigenwerte von A sind positiv (bzw. negativ)

A ist positiv (bzw. negativ) semi-definit :⇐⇒ alle Eigenwerte sind nicht-negativ (bzw. nicht-positiv)

A ist indefinit :⇐⇒ A hat positive und negative Eigenwerte

Beispiele 3.12.

Elliptisches Paraboloid E Hyperbolisches Paraboloid H

Die Bilder sind von der Webseite http://de.wikipedia.org/wiki/Paraboloid gezichnet von Lars Rohwedder (RokerHRO) - german wi-

kipedia, Gemeinfrei, Paraboloid https://commons.wikimedia.org/w/index.php?curid=213587, Hyperbolid erzeugt mit Povray 3.6, https:

//commons.wikimedia.org/w/index.php?curid=23859326

Die Menge E der Punkte mit z = x2 + y2 ist der Graph der Funktion f1(x, y) = x2 + y2. DieFunktion f1 ist die quadratische Form zum euklidischen Skalarprodukt auf R2. Sie ist positivdefinit. Die zugehorige symmetrische Matrix ist die Matrix(

1 00 1

).

http://de.wikipedia.org/wiki/Paraboloid

https://commons.wikimedia.org/w/index.php?curid=213587




Graphen von positiv definiten quadratischen Formen nennt elliptisches Paraboloid .

Die MengeH der Punkte mit z = x2−y2 ist der Graph der Funktion f2(x, y) = x2−y2. Die Funktionf2 ist die quadratische Form zur bilinearen Abbildung b : R2×R2 → R, b((x, y)T , (x, y)T ) = xx−yy.Sie ist indefinit. Die zugehorige symmetrische Matrix ist(

1 00 −1

).

Graphen von indefiniten quadratischen Formen nennt hyperbolisches Paraboloid .

Wir versehen nun Rn×n mit einer beliebigen Norm ‖ · ‖, und erhalten so eine Topologie auf Rn×n,die unabhangig von der Norm ist.

LEMMA 3.13. Sei A ∈ Rn×n eine quadratische Matrix, so dass QA positiv definit (bzw. negativdefinit, bzw. indefinit) ist. Dann gibt es eine Umgebung U von A in Rn×n, so dass fur alle B ∈ Uauch QB positiv definit (bzw. negativ definit, bzw. indefinit) ist.

Ersetzt man definit durch semi-definit, so ist das Lemma nicht mehr gultig!

Im indefiniten Fall zeigen wir sogar etwas mehr:

ZUSATZ 3.14. Gilt QA(x+) > 0 und QA(x−) < 0, dann gibt es eine Umgebung U von A in Rn×n,so dass fur alle B ∈ U gilt: QB(x+) > 0 und QB(x−) < 0.

23

Beweis. Angenommen es gebe ein x ∈ Rn r {0} mit xTAx > 0. Indem wir x durch x/‖x‖2ersetzen, konnen wir annehmen, dass

x ∈ Sn−1 := {x ∈ Rn | ‖x‖2 = 1}

Da die Abbildung F : Sn−1 × Rn×n → R, (y,B) 7→ yTBy stetig ist, gibt es zu jedem x wie obenein ε(x) > 0, so dass:

(3.15) ∀y ∈ Sn−1 : ∀B ∈ Rn×n : ‖x− y‖2 < ε(x) ∧ ‖B −A‖ < ε(x) =⇒ F (y,B) > 0.

Die Zahl ε(x) hangt naturlich von x ab!

Eine analoge Konstruktion geht auch im Fall QA(x, x) < 0.

1. Fall: Ist nun QA indefinit, dann existieren x+, x− ∈ Sn−1 mit QA(x+) > 0 und QA(x−) < 0.Dann gilt fur ‖B −A‖ < min{ε(x+), ε(x−)}: QB(x+) > 0 und QB(x−) < 0.

23Dagegen ist die folgende Aussage falsch: Ist QA indefinit, dann gibt es eine Umgebung U von A in Rn×n,

so dass gilt∀B ∈ U : ∀x ∈ Rn : (QA(x) > 0 =⇒ QB(x) > 0).

Wie so oft ist hier die Reihenfolge der Quantoren zu beachten! Wahr ist: fur alle x mit QA(x) > 0, gibt es eineUmgebung U so dass . . . . Falsch ist hingegen: Es gibt ein U so dass fur alle x mit QA(x) > 0 gilt, . . . . In anderenWorten: das U kann nicht unabhangig von x gewahlt werden.


2. Fall: Ist QA positiv definit, dann wahle zu jedem x ∈ Sn−1 ein ε(x) > 0 wie in (3.15). Dann ist(Bε(x)(x) ∩ Sn−1)x∈Sn−1 eine offene Uberdeckung von Sn−1. Da Sn−1 kompakt ist, kann man zu

dieser Uberdeckung eine Lebesguesche Zahl ε > 0 wahlen (die nun nicht mehr von x abhangt!).Dies bedeutet, dass es zu jedem y ∈ Sn−1 ein x ∈ Sn−1 gibt mit Bε(y) ∩ Sn−1 ⊂ Bε(x)(x) ∩ Sn−1.

Es gilt24 dann

∀B ∈ Rn×n : ∀y ∈ Sn−1 : ‖B −A‖ < ε =⇒ F (y,B) = QB(y) > 0.

Also ist fur solche B die quadratische Form QB positiv definit.

3. Fall: negativ analog. Folgt durch Vorzeichenwechel aus dem 2. Fall.

3.5. Lokale Extrema.Wiederholung.Sei (M,d) ein metrischer Raum, f : M → R, p ∈M . Wir sagen f hat ein lokales Maximum (bzw.lokales Minimum) in p, falls es eine Umgebung U von p gibt, so dass

∀x ∈ U : f(x) ≤ f(p) (bzw. f(x) ≥ f(p)).

lokales Extremum in p :⇐⇒ lokales Maximum oder Minimum in p

Wir sagen f hat ein lokales striktes Maximum (bzw. lokales striktes Minimum) in p, falls es eineUmgebung U von p gibt, so dass

∀x ∈ U r {p} : f(x) < f(p) (bzw. f(x) > f(p)).

LEMMA 3.16. Sei U ⊂ Rn offen, f : U → R. Die Funktion f habe ein lokales Minimum in p ∈ U .

(1) Wenn die Richtungsableitung ∂p,vf existiert, so gilt ∂p,vf = 0.(2) Wenn f in p differenzierbar ist, so gilt f ′(p) = 0.(3) Wenn f auf einer Umgebung von p differenzierbar ist und in p zweimal differenzierbar ist, so

ist f ′′(p) = Hesspf positiv semi-definit.

Bei lokalen Maxima in p gilt alles analog, wenn wir positiv semi-definit durch negativ semi-definitersetzen.

Beweis. Wenn f ein lokales Minimum in p hat, dann hat fp,v, fp,v(t) := f(p + tv) ein lokalesMinimum in 0. Es folgt ∂p,vf = f ′p,v(0) = 0, falls es existiert. Es folgt f ′(p) = 0 falls es existiert.Weiter gilt (falls f ′′(p) existiert):

vT f ′′(p)v = Hesspf(v, v) = f ′′p,v(0) ≥ 0.

Lokales Maximum analog.

Definition 3.17. Man nennt p einen kritischen Punkt oder einen stationaren Punkt von f , fallsf ′(p) = 0.

24Wir schließen auch hieraus, dass alle zu y so gewahlten x die Ungleichung ε ≤ ε(x) erfullen. Achtung: Wirhaben aber nicht behauptet ∀x ∈ Sn−1 : ε ≤ ε(x). Man konnte dies durch geschicktere Konstruktion von ε(x)erreichen, aber wir haben keine Kontrolle, ob es mit dme oben gewahlten funktioniert.


Also

lokales Extremum in p =⇒ p kritischer Punkt

SATZ 3.18. Sei U offen in Rn, f ∈ C2(U,R) (d.h. f : U → R ist zweimal stetig differenzierbar).Sei p ein kritischer Punkt von f .

(1) Ist f ′′(p) positiv definit, dann hat f ein lokales striktes Minimum in p.(2) Ist f ′′(p) negativ definit, dann hat f ein lokales striktes Maximum in p.(3) Ist f ′′(p) indefinit, dann hat f weder ein lokales Maximum noch ein lokales Minimum in p.

!ACHTUNG!. Keine derartige Aussage moglich, falls f ′′(p) semi-definit ist.Mi 12.6.

Beweis. Ist f ′′(p) positiv definit (bzw. negativ definit), so gibt es wegen Lemma 3.13 und derStetigkeit von U → Rn×n, x 7→ f ′′(x) eine Umgebung V von p in U , so dass f ′′(q) ebenfalls positivdefinit (bzw. negativ definit) fur alle q ∈ V ist. Wir wenden die Taylorformel fur ` = 1 an:

f(p+ h) = f(p) +1

2

n∑i,j=1

∂2f

∂xi ∂xj(p+ ϑh)hihj = f(p) +

1

2hT f ′′(p+ ϑh)h,

falls [p, p+h] ⊂ V , h 6= 0. Also ist f(p+h) > f(p) (bzw. f(p+h) < f(p)) fur alle p+h ∈ V r {p}.

Der indefinite Fall ist ahnlich. Wir wahlen h+, h− ∈ Rn mit hT+f′′(p)h+ > 0 und hT−f

′′(p)h− < 0.

Nach Zusatz 3.14 gibt es eine Umgebung V um p in U , so dass hT+f′′(q)h+ > 0 und hT−f

′′(q)h− < 0fur alle q ∈ U . Es folgt dann fur genugend kleines λ > 0:

f(p+ λh+) > f(p) f(p+ λh−) < f(p).

Beispiel 3.19. f : R2 → R, f(x, y) = x3 − 4x− xy + 12y

2.

f ′(x, y) = (3x2−4−y,−x+y). Die kritische Punkte sind also p1 := (−1,−1) und p2 := (4/3, 4/3).

Wir rechnen weiter

f ′′(x, y) =

(6x −1−1 1

).

Es ist also f ′′(p1) indefinit: dies ist ein Sattelpunkt. Und f ′′(p2) ist positiv definit: dies ist einlokales striktes Minimum.

4. Lokale Umkehrung differenzierbarer Abbildungen

Frage:Sei ∅ 6= U ⊂ Rn offen, f : U → Rk stetig, sei V := f(U) offen in Rk. Wann besitzt f eine (stetige)Umkehrfunktion g : V → U?

4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN 227

Teil-Antwort:Fall: n 6= k. Dann hat keine Funktion f wie oben eine Umkehrfuntion! Beweis nicht ganz einfach(In der Vorlesung Topologie I)25.

Ab jetzt n = k.

Wenn U = Rn und wenn f eine lineare Abbildung ist, sagen wir f(x) = Ax, A ∈ Rn×n, dannwurde diese Frage intensiv in der Linearen Algebra diskutiert:

f besitzt eine Umkehrfunktion

⇐⇒ f besitzt eine lineare Umkehrfunktion

⇐⇒ f ist injektiv

⇐⇒ f ist surjektiv

⇐⇒ detf 6= 0

⇐⇒ A ist eine invertierbare Matrix

Hierbei detf = detA.

Ahnlich gilt fur A ∈ Rn×n, p ∈ Rn und f : Rn → Rn, f(x) := Ax+ p:

f invertierbar⇐⇒ A invertierbar

und gegebenenfalls f−1(y) = A−1(y − p).

Notation fur die Einheitsmatrix:

11n =

1 0 0 . . . 00 1 0 . . . 00 0 1 0...

.... . .

...0 0 0 . . . 1

∈ Rn×n

GL(n,R) := {A ∈ Rn×n | detA 6= 0}.

Ab jetzt sei f differenzierbar (aber wir nehmen nicht mehr an, dass f linear sein muss).

LEMMA 4.1. Sei U offen in Rn und f : U → Rn differenzierbar in x ∈ U . Sei V := f(U) offenin Rn und g : V → Rn differenzierbar in f(x) mit g ◦ f = idU . Dann gilt:

g′(y) · f ′(x) = 11n, wobei y = f(x)

Insbesondere ist dann f ′(x) eine invertierbare Matrix.

25Und man muss hier sehr genau aufpassen, wie man argumentiert. Man konnte zum Beispiel vermuten, dassf nicht surjektiv ist, falls n > k. Dies ist aber nicht richtig. Es gibt zum Beispiel stetige surjektive AbbildungenR→ Rn fur alle n ∈ N>0. Diese Funktionen sind aber nicht injektiv.


Beweis. Kettenregel.

Aus Kapitel 5 wissen wir (Proposition 1.6 und einige verbundene Aussagen):

PROPOSITION. Sei (a, b) ein Intervall, f : (a, b) → R differenzierbar, mit f ′(x) 6= 0 fur allex ∈ (a, b). Dann ist f injektiv und f((a, b)) ist auch ein offenes Intervall. Die Umkehrfunktion

g := f−1 : f((a, b))→ (a, b)

existiert, ist differenzierbar und es gilt fur alle x ∈ (a, b)

g′(y) =(f ′(x)

)−1

, wobei y = f(x)

Ein ahnlicher Satz ist nicht nur fur n = 1, sondern fur alle n ∈ N richtig, der lokale Umkehrsatz.

Definition 4.2. Sei U offen in Rn, p ∈ U und f : U → Rn. Wir sagen f ist bei p lokal umkehrbar ,falls es eine offene Umgebung V von p in U und eine offene Umgebung W von f(p) in Rn gibt, sodass f |V : V →W bijektiv ist.

SATZ 4.3 (Lokaler Umkehrsatz). Sei U offen in Rn, p ∈ U . Sei f ∈ C`(U,Rn), ` ≥ 1. Istdet(f ′(p)) 6= 0, dann gibt es offene Umgebung V von p in U und eine offene Umgebung W vonf(p) in Rn, so dass gilt

(1) f |V : V →W bijektiv. Somit ist f lokal umkehrbar bei p.

(2) (f |V )−1

: W → V ⊂ Rn ist `-mal stetig differenzierbar. 26

(3)[(f |V )

−1]′

(y) = (f ′(x))−1

, fur alle x ∈ V , wobei y = f(x)

Der Satz weicht an einigen wichtigen Stellen von der obigen Proposition ab. Zum einen muss mannaturlich

”f ′(x) 6= 0“ durch

”f ′(x) invertierbar“ ersetzen. Es gibt aber einige weitere wichtige

Unterschiede

• Keine globale Aussage fur Umkehrung, nur eine lokale Aussage.• Wir benotigen stetige Differenzierbarkeit.

Beispiele 4.4.

(1) Ist f affin-linear, sagen wir f(x) = Ax + p, mit A ∈ Rn×n, p ∈ Rn. Dann ist f ′(p) = A. FallsA ∈ GL(n,R), dann kann man V = W = Rn wahlen, f−1 siehe oben.

(2) Wir betrachten die komplexe Exponentialfunktion exp : C → C mit Hilfe von C ∼= R2 alsFunktion f : R2 → R2,

f(x, y) =

(Re exp(x+ iy)Im exp(x+ iy)

)=

(ex cos yex sin y

)f ′(x, y) =

(ex cos y −ex sin yex sin y ex cos y

)= ex

(cos y − sin ysin y cos y

)26In anderen Worten (f |V )−1 ∈ C`(W,Rn).


detf ′(x, y) = e2x · 1 6= 0.

Der Definitionsbereich R2 von f ist zusammenhangend, f ′(p) ist invertierbar fur alle p ∈ D(f),aber dennoch ist f nicht injektiv. Deswegen: nur lokale Umkehrung moglich.

Beweis.

O.B.d.A. p = 0, f(p) = 0, f ′(p) = 11n.

Wenn f dies nicht erfullt, dann definiere

g(x) = f(x+ p)− f(p)

undf(x) = g′(0)−1g(x).

Dann haben wir f(0) = 0 und f ′(0) = 11n. Und wenn wir den lokalen Umkehrsatz fur f in 0 zeigen,dann folgt hieraus unmittelbar der lokale Umkehrsatz fur f in p.

Zu (1); Teil (i): Bestimmung von V und W .Im folgenden sei ‖ · ‖ immer die Supremumsnorm auf Rn und auf Rn×n, d.h.∥∥∥∥∥∥∥∥∥

a1

a2

...an

∥∥∥∥∥∥∥∥∥ = max{|a1|, . . . , |an|},

∥∥(aij)i,j∈{1,...,n}∥∥ = max{|a11|, |a12|, . . . , |a1n|, |a21|, . . . , |ann|}.

Also ‖Ax‖ ≤ n‖A‖ ‖x‖ fur x ∈ Rn, A ∈ Rn×n.

Definiere ϕ(x) = x− f(x), also ϕ′(0) = 0.

Bestimme r > 0 so, dass27

(a) B2r(0) = {x ∈ Rn | ‖x‖ < 2r} ⊂ U(b) ‖ϕ′(x)‖ < 1

2n fur alle x ∈ B2r(0)

(b) ist moglich, da ϕ stetig differenzierbar ist28.

Fur x, y ∈ Br(0) = {x ∈ Rn | ‖x‖ ≤ r}, wenden wir nun den Mittelwertsatz auf die j-te Kompo-nente ϕj von ϕ an29 und erhalten fur ein ϑ ∈ (0, 1):

|ϕj(y)− ϕj(x)| = |ϕ′j(x+ ϑ(y − x)︸︷︷︸z:=

) · (y − x)| ≤ ‖ϕ′(z) · (y − x)‖ ≤ n‖ϕ′(z)‖ ‖y − x‖ ≤ n

2n‖y − x‖.

27Eine kleine Bemerkung zu den hier verwendeten”Ballen“ Br(p). Es sind Balle nicht – wie zumeist ublich –

bezuglich der Standardnorm, sondern bezuglich der Supremumsnorm. Deswegen ist BR(p) eigentlich ein achsenpar-

alleler Wurfel mit Seitenlange 2R und mit Schwerpunkt p.28und da Urbilder offener Mengen unter stetigen Abbildungen wieder offen sind29Also ϕj : U → R, ϕ(x) = (ϕ1(x), . . . , ϕn(x))T


Daraus ergibt sich dann

(4.5) ‖ϕ(y)− ϕ(x)‖ ≤ 1

2‖y − x‖.

Setze nun W := Br/2(0) und V := Br(0)∩f−1(W ). Letzteres ist eine offene Umgebung von 0. Wirhaben

f(V ) ⊂ f(f−1(W )) ⊂WFr 14.6.

Zu (1); Teil (ii): f |V : V →W ist bijektiv.

f |V injektiv: Seien x, y ∈ V mit f(x) = f(y). Dann gilt x− ϕ(x) = y − ϕ(y), also

‖y − x‖ = ‖ϕ(y)− ϕ(x)‖(4.5)

≤ 1

2‖y − x‖

Also y = x.

f |V surjektiv: Gegeben sei w ∈W . Wir definieren

ψw : Br(0)→ Rn, x 7→ w + ϕ(x).

Die Abbildung ist eine Kontraktion, denn

‖ψw(y)− ψw(x)‖ = ‖ϕ(y)− ϕ(x)‖(4.5)

≤ 1

2‖y − x‖.

Es gilt ψw(Br(0)) ⊂ Br(0), denn aus (4.5) folgt:

‖ψw(x)‖ ≤ ‖w‖︸︷︷︸<r/2

+ ‖ϕ(x)−=0︷︸︸︷ϕ(0) ‖︸︷︷︸

≤r/2

< r.

Da Br(0) vollstandig ist, gibt es nach dem Banachschen Fixpunktsatz30 ein z ∈ Br(0) mit ψw(z) =z und man sieht dann z ∈ Br(0).31 Es gilt also

z = ψw(z) = w + ϕ(z) = w + z − f(z),

also f(z) = w. Daraus folgt dann auch z ∈ f−1(W ), d.h. z ∈ V .

Zu (2); Teil (i): (f |V )−1

: W → V ⊂ Rn ist differenzierbar auf W .

Uberprufe Differenzierbarkeit in w ∈W , w = f(p). Zu h mit p+ h ∈ V wahle ein k mit

f(p+ h) = w + k.

Wir konnen hier aber auch h als Funktion in k betrachten, da f |V bijektiv.

k = f(p+ h)− f(p) = f ′(p) · h+ ε(h)‖h‖, limh→0

ε(h) = 0

30angewendet auf f := ψw und Y := X := Br(0)31Denn es ist ja im Bild von ψw.


Wir multiplizieren diese vektorielle Gleichung mit (f ′(p))−1, falls es existiert.

(f ′(p))−1k = h+ ‖h‖(f ′(p))−1ε(h)

= (p+ h)− p+ ‖h‖(f ′(p))−1ε(h)

= f−1(w + k)− f−1(w)− ‖k‖δ(k)

wobei wir definieren

δ(k) = −‖h‖‖k‖

(f ′(p))−1ε(h) .

Die Behauptung folgt also, sobald wir limk→0 δ(k) = 0 gezeigt haben.

Wir rechnen:

ϕ(p+ h)− ϕ(p) = p+ h− f(p+ h)− p+ f(p) = h− kAlso

‖h‖ ≤ ‖ϕ(p+ h)− ϕ(p)‖+ ‖k‖(4.5)

≤ 1

2‖h‖+ ‖k‖.

Es folgt ‖h‖ ≤ 2‖k‖ und somit

limk→0

δ(k) = 0.

Wir haben gezeigt: ist f ′(p) invertierbar, dann ist (f |V )−1

differenzierbar in w = f(p) und es gilt

dann(

(f |V )−1)′

(w) =(f ′(p)

)−1.

Die Umgebung V wurde so gewahlt, dass ‖ϕ′(p)‖ < 12n fur alle p ∈ V . Aus ϕ(x) = x− f(x) folgt

ϕ′(p) = 11n − f ′(p), somit

‖f ′(p) · x‖ ≥ ‖x‖ − ‖ϕ′(p) · x‖ ≥ ‖x‖ − n‖ϕ′(p)‖ ‖x‖ ≥ ‖x‖ − n

2n‖x‖ ≥ 1

2‖x‖.

Also ist f ′(p) eine invertierbare Matrix. Somit ist (f |V )−1

differenzierbar auf W ; und es gilt (3).Zu (3).

Diese Formel folgt nun direkt aus den Uberlegungen unter (2), Teil (i).

Zu (2); Teil (ii): `-fache stetige Differenzierbarkeit.

Auf Grund von (3) bildet die Komposition

W(f |V )−1

−→ Vf ′−→ GL(n,R)

inv−→ GL(n,R)

w ∈W auf[(f |V )

−1]′

(w) ab. Da die Inversen-Abbildung

inv : GL(n,R)→ GL(n,R), A 7→ A−1


glatt ist,32 folgt durch Induktion aus der `-fachen stetigen Differenzierbarkeit von f auch die `-fachestetige Differenzierbarkeit von (f |V )

−1.

Beispiel 4.6. f : R2 → R2, f(x, y) :=(

12x

2 + y, xy)T

.

f ′(x, y) :=

(x 1y x

), detf ′(x, y) = x2 − y .

Also ist f bei allen Punkten (x, y) mit x2 6= y lokal umkehrbar. In den Punkten der Form (x, x2)macht der lokale Umkehrsatz keine Aussage, ob eine lokale Umkehrfunktion existiert. Wenn dortaber in (x, x2) eine lokale Umkehrfunktion existiert, so ist sie nach Lemma 4.1 in f(x, x2) nichtdifferenzierbar.

Es gibt also sehr oft lokale Umkehrfunktionen. In den meisten Fallen kann man diese lokale Um-kehrfunktion aber nicht explizit (d.h. als Formelausdruck) angeben. Man kennt dann die Existenzder Umkehrfunktion, ohne sie als Formelausdruck hinschreiben zu konnen.

Definition 4.7. Sind U und V offene Mengen in Rn, ` ∈ N≥1. Man nennt f : U → V einenC`-Diffeomorphismus (von U auf V ), falls f : U → V bijektiv ist und sowohl f als auch f−1 `-malstetig differenzierbar sind. In der Analysis II und III verwenden wir das Wort Diffeomorphismusim Sinne von C1-Diffeomorphismus.

Der lokale Umkehrsatz liefert:

LEMMA 4.8. Sei U offen in Rn und f : U → Rn eine Funktion, V := f(U). Dann ist f genaudann ein Diffeomorphismus von U auf V , wenn

• f ∈ C1(U,Rn),• detf ′(x) 6= 0 fur alle x ∈ U ,• f injektiv ist.

5. Der Satz uber implizit definierte Funktionen

Motivation: Gegeben sei eine Funktion F : R2 → R. Wir wollen alle Losungen von

F (x, y) = 0

bestimmen. Am liebsten ware es uns, wenn wir eine Losungsfunktion hatten, d.h. eine differenzier-bare Funktion f : (a, b)→ R, so dass F (x, f(x)) = 0 und so dass alle oder moglichst viele Losungenvon der Form (x, f(x)) sind.

32Die Formel fur A−1, die Sie aus der Linearen Algebra inzwischen kennen sollten, hat Eintrage, die rationaleFunktionen in den Koeffizienten von A sind. Die Nenner dieser rationalen Funktionen sind nicht Null, da die Matrixinvertierbar ist.

5. DER SATZ UBER IMPLIZIT DEFINIERTE FUNKTIONEN 233

Beispiele 5.1.

(1) F (x, y) := y − x3 + x2 − 1 = 0. Dann ist f(x) = x3 − x2 + 1 solch eine Losungsfunktion.

Bild der zugehorigen Losungsmenge

∂F

∂y= 1 6= 0 in allen Losungen (x, y)

(2) F (x, y) := y2 − x2 − 1 = 0. Dann benotigen wir zwei Funktionen, um die Losungen zubeschreiben

f+(x) =√x2 + 1, f−(x) = −

√x2 + 1, f± : R→ R.

Bild der Graphen von f+ und f−.

∂F

∂y= 2y 6= 0 in allen Losungen (x, y)

(3) F (x, y) = x− y2 = 0.


Eine Beschreibung der Losungen in der Form (x, f(x)) ist schwierig, da wir zum einenzwei Funktionen benotigen (x 7→

√x und x 7→ −

√x) und da die Wurzelfunktion in 0 nicht

differenzierbar ist. 33

∂F

∂y= 2y 6= 0 in allen Losungen außer in (0, 0)

Problemlos moglich, wenn wir x und y vertauschen. Sei g : R → R, g(y) = y2. DieLosungsmenge von x− y2 = 0 ist

{(g(y), y) | y ∈ R}.∂F

∂x= 1 6= 0 in allen Losungen

(4) F (x, y) = x− y3 = 0.


Eine Beschreibung der Losungen in der Form (x, f(x)) ist moglich durch die Kubik-wurzel x 7→ 3

√x, aber sie ist in 0 nicht differenzierbar.

∂F

∂y= 3y2 6= 0 in allen Losungen außer in (0, 0)

Die Differenzierbarkeit ist aber wiederum gegeben, wenn wir zunachst x und y ver-tauschen. Sei g : R→ R, g(y) = y3. Die Losungsmenge von x− y3 = 0 ist

{(g(y), y) | y ∈ R}.

33Da die Quadratwurzelfunktion auf [0,∞) definiert ist, haben wir streng genommen gar nicht definiert, was

”differenzierbar in 0“ bedeutet, denn wir benotigen eigentlich dazu, dass die Funktion auf einer Umgebung der

0 definiert ist. Definition 1.1 in Kapitel 5 ist aber auch sinnvoll, wenn wir nur fordern dass der Punkt x0 ein

Haufungspunkt der Definitionsmenge ist. Mit dieser Definition ist die Wurzelfunktion nicht differenzierbar in 0.


∂F

∂x= 1 6= 0 in allen Losungen

(5) F (x, y) = x2 − y2 = 0. Zwei Losungsfunktionen f±(x) = ±x, die sich schneiden


∂F

∂y= −2y 6= 0 in allen Losungen außer in (0, 0)

(6) F (x, y) = x3 − y2 = 0.

Bild der zugehorigen Losungsmenge {( 3√y2, y)T | y ∈ R}

∂F

∂y= −2y 6= 0 in allen Losungen außer in (0, 0)

(7) F (y, x) = x2 + y2 = 0. Losungsmenge {(0, 0)}. Nur ein Punkt!

∂F

∂y(0, 0) = 0

Vermutung: Es geht gut, wenn ∂F∂y (x, y) 6= 0 fur alle Losungen (x, y). Der Satz uber implizite

Funktionen macht genau solch eine Aussage.

Notation.34 Von nun an sei U 6= ∅ offen in Rn+m und F : U → Rm stetig differenzierbar. Punkte inRn+m schreiben wir zumeist als (x, y) mit x = (x1, . . . , xn)T ∈ Rn, y = (y1, . . . , ym)T ∈ Rm,F (x, y) = (F1(x, y), . . . , Fm(x, y)).

∂F

∂x(x, y) :=

(∂Fi∂xj

(x, y)

)i=1,...,mj=1,...,n

∈ Rm×n

∂F

∂y(x, y) :=

(∂Fi∂yj

(x, y)

)i=1,...,mj=1,...,m

∈ Rm×m

Ziel: Finde Funktionen

y1 = y1(x1, . . . , xn)

y2 = y2(x1, . . . , xn)

......

ym = ym(x1, . . . , xn)

so dass (x, y(x)) Losungen von F (x, y) = 0.

SATZ 5.2 (Satz uber implizite Funktionen). Sei ∅ 6= U ⊂ Rn+m offen, und F : U → Rm stetigdifferenzierbar. In einem Punkt (x, y) ∈ U soll F (x, y) = 0 und det∂F∂y (x, y) 6= 0 gelten. Dann gibtes

34Die Indizes k, n und M wechseln etwas ihre Rollen im Vergleich zu den vorherigen Kapiteln

5. DER SATZ UBER IMPLIZIT DEFINIERTE FUNKTIONEN 235

• eine offene Umgebung V von x in Rn,• eine offene Umgebung W von y in Rm,• eine Funktion f : V →W

mit den folgenden Eigenschaften

(a) V ×W ⊂ U(b) {(x, y) ∈ V ×W | F (x, y) = 0} = {(x, f(x)) | x ∈ V }(c) f ist stetig differenzierbar und es gilt

f ′(x) = −(∂F

∂y(x, f(x))

)−1∂F

∂x(x, f(x))

19.6.

Veranschaulichung des Satzes uber implizite Funktionen

Bemerkung 5.3. Zu gegebenem F , U , x und y liefert der Satz: f , V , W . Diese sind nicht eindeutig,z.B. kann man V verkleinern und dann f einschranken. Erfullen f , V , W ebenfalls den Satz undsetzen wir Z := V ∩ V ∩ f−1(W ∩ W ), dann gilt f |Z = f |Z .

Bemerkung 5.4. Sei U ⊂ Rm offen und f : U → Rm stetig differenzierbar. Wenn wir den Satzuber implizite Funktionen auf F : Rm × U → Rm, F (x, y) := x − f(y) anwenden (n = m), soerhalten wir den lokalen Umkehrsatz.

Bemerkung 5.5. Zu gegebenem F , U , x und y liefert der Satz: f , V , W . Diese sind nicht eindeutig,z.B. kann man V verkleinern und dann f einschranken. Erfullen f , V , W ebenfalls den Satz undsetzen wir Z := V ∩ V ∩ f−1(W ∩ W ), dann gilt f |Z = f |Z .

Bemerkung 5.6. Sei U ⊂ Rm offen und f : U → Rm stetig differenzierbar. Wenn wir den Satzuber implizite Funktionen auf F : Rm × U → Rm, F (x, y) := x − f(y) anwenden (n = m), soerhalten wir den lokalen Umkehrsatz.

Definition 5.7. Die Funktion f nennt man eine durch F (x, y) = 0 implizit definierte Funktion.

Bemerkung 5.8. Aussage (b) besteht eigentlich aus zwei Teilen. Zum einen besagt die Aussage,dass (x, f(x)) eine Losung ist, also F (x, f(x)) = 0 fur alle x ∈ V . Zum anderen sind lokal (d.h.heißt hier in V ×W ) alle Losungen von dieser Form.

Bemerkung 5.9. Oft kann man implizite Funktionen nicht explizit angeben.”Explizit angeben“

heißt hier durch einen Formelausdruck, der sich aus Standard-Operationen zusammensetzt.

ZUSATZ 5.10 (zum Satz5.2 uber implizite Funktionen). Sei ` ≥ 1. Ist F `-mal stetig differenzier-bar, so ist f ebenfalls `-mal stetig differenzierbar.

Beispiel 5.11. Wir betrachten die Funktion

F : Rn+1 → R, F (z) := 〈z, z〉 − 1.

F ∈ C∞(Rn+1,R). Dann ist die Losungsmenge die n-dimensionale Sphare

Sn := {z ∈ Rn+1 | F (z) = 0} = {z ∈ Rn+1 | ‖z‖2 = 1}.


Wir schreiben z = (x, y) mit x ∈ Rn und y ∈ R. Nun ist (∂F/∂y)(x, y) = 2y und dies ist fury 6= 0 nicht Null. Zu jedem (x, y) ∈ Sn mit y 6= 0 kann man den Satz uber implizite Funktionenanwenden.

Wir beschranken uns auf den Fall y > 0. Dann sind mogliche Wahlen:

V := B1(0,Rn) := {x ∈ Rn | ‖x‖ < 1}, W := (0,∞), f(x) :=√

1− ‖x‖22Eine andere Wahl ware, falls ‖x‖ < 1− δ:

V := B1−δ(0,Rn), W := (0,∞), f(x) :=√

1− ‖x‖22

Eine weitere mogliche Wahl ist: V := B1(0,Rn), W :=(

0, 10011000

), f(x) :=

√1− ‖x‖22

Nicht erlaubt sind:

V := B1(0,Rn), W := (0, 1), (W zu klein)

V := B1(0,Rn), W := R, (W zu groß)

Zeichnung des Standardkreises mit den oben erklarten Mengen.

Beweis des Satzes5.2 uber implizite Funktionen und des Zusatzes. Sei F wie im Satz gegeben. Wir

definieren: G : U → Rn+m, G(x, y) :=

(x

F (x, y)

). Wir haben G ∈ C`(U,Rm+n) und

G′(x, y) =

(11n 0∗ ∂F

∂y (x, y)

)Also

det G′(x, y) = (det11n)︸︷︷︸=1

·(

det∂F

∂y(x, y)

)6= 0 .

Wende den lokalen Umkehrsatz auf G im Punkt p := (x, y) an. Es gibt dann eine offene Umgebung

V von p in U und eine offene Umgebung W von G(p) in Rn+m, so dass G|V : V → W bijektiv ist

und so dass (G|V )−1 ∈ C`(W,Rn+m). Offensichtlich hat (G|V )−1 die Form

(G|V )−1(x, y) :=

(x

ψ(x, y)

)fur ein ψ ∈ C`(W,Rm). Durch Differenzieren von idV = (G|V )−1 ◦GV erhalten wir

(5.12) 11n+m =[(G|V )−1

]′(x, F (x, y)) ◦G′(x, y) =

(11n 0

∗ ∂ψ∂y (x, F (x, y))

)(11n 0∗ ∂F

∂y (x, y)

).

Ausmultiplizieren und Vergleichen des rechten unteren Blocks auf beiden Seiten ergibt

11m =

(∂ψ

∂y(x, F (x, y))

)(∂F

∂y(x, y)

).

6. UNTERMANNIGFALTIGKEITEN 237

O.B.d.A. konnen wir annehmen,35 dass V die Gestalt V = V0 ×W hat mit V0 offen in Rn und Woffen in Rm. Die Abbildung ψ bildet W in W ab, und ψ(x, 0) = (x, y)T . Auf Grund der Stetigkeit

von ψ finden wir eine offene Umgebung V von x mit V ⊂ V0 und V ×{0} ⊂ W . Dann ist f : V →W ,f(x) := ψ(x, 0) eine wohldefinierte C`-Abbildung und F (x, f(x)) = 0. Wir haben somit (a),

”⊃“

in (b) und f ∈ C`.

Ist (x, y) ∈ V ×W mit F (x, y) = 0, dann ist G(x, y) = (x, 0)T , also (G|V )−1(x, 0) = (x, y)T . Diesimpliziert f(x) = y. Wir erhalten

”⊂“ in (b).

Wenn wir die Stern-Eintrage in (5.12) berucksichtigen, sieht man

0 =∂ψ

∂x(x, F (x, y)) +

∂ψ

∂y(x, F (x, y))

∂F

∂x(x, y),

also

f ′(x) =∂ψ

∂x(x, 0) = −∂ψ

∂y(x, 0)

∂F

∂x(x, f(x)) = −

(∂F

∂y(x, f(x))

)−1∂F

∂x(x, f(x)).

6. Untermannigfaltigkeiten

6.1. Definition und erste Beispiele.

Definition 6.1. Sei ` ≥ 1, k ≥ n. Sei M eine Teilmenge von Rk. Wir nennen M eine n-dimensionale Untermannigfaltigkeit von Rk mit Regularitat C`, falls es zu jedem p ∈ M offe-ne Mengen U, V ⊂ Rk und einen C`-Diffeomorphismus ϕ : U → V gibt, so dass p ∈ U undϕ(U ∩M) = V ∩ (Rn × {0}). Solch ein ϕ nennt man eine Untermannigfaltigkeitskarte von M .

Anschaulich: der Diffeomorphismus ϕ verbiegt U ∩M in eine offene Teilmenge von Rn×{0} ⊂ Rk.

Ein Bild, das eine Untermannigfaltigkeitskarte graphisch darstellt mitUntermannigfaltigkeitskarte

Untermannigfaltigkeit mit Regularitat C` := C`-Untermannigfaltigkeit

In der Analysis II und III nutzen wir den Begriff”Untermannigfaltigkeit“ (ohne weitere Angabe

der Regularitat) immer im Sinne von”C1-Untermannigfaltigkeit“.

Spezielle Dimensionen.In manchen Dimensionen haben Untermannigfaltigkeiten spezielle Namen:36

2-dimensionale Untermannigfaltigkeiten von Rk =: Flachen in Rk

35Wenn dies nicht der Fall ist, ersetzen wir einfach V durch eine kleinere offene Umgebung von p, die die

gewunschte Produktgestalt hat, und W ist dann entsprechend zu verkleinern.36Der Fall n = 1 is hier leider etwas kompliziert: zusammenhangende 1-dimensionale Untermannigfaltigkeit =:

regulare eingebettete Kurve


(k − 1)-dimensionale Untermannigfaltigkeiten von Rk =: Hyperflachen in Rk

Beispiele 6.2.

(1) Sei M ⊂ Rk ein n-dimensionaler Untervektorraum (mit n ≤ k). Wahle eine Basis (v1, . . . , vn)von M . Wie in der Linearen Algebra I gezeigt, existieren Vektoren vn+1, . . . , vk in Rk, so dass(v1, . . . , vn, vn+1, . . . , vk) eine Basis von Rk ist. Betrachte die lineare Abbildung ϕ : Rk → Rk,vi 7→ ei, wobei ei der i-te kanonische Basisvektor ist. Dann ist ϕ ein linearer Isomorphismus,insbesondere ein C∞-Diffeomorphismus mit

ϕ(M) = ϕ(Span{v1, . . . , vn})= Span{e1, . . . , en}= Rk ∩ (Rn × {0}).

Also ist M eine n-dimensionale Untermannigfaltigkeit der Regularitat C∞ von Rk.(2) Ist W offen in Rn, f ∈ C`(W,Rm). Dann ist der Graph von f

Graphf := {(x, f(x)) | x ∈W}

eine n-dimensionale Untermannigfaltigkeit von Rn+m mit Regularitat C`. Denn

ϕ : W × Rm︸︷︷︸U :=

→W × Rm︸︷︷︸V :=

, (x, y) 7→ (x, y − f(x))

ist eine `-mal stetig differenzierbare Abbildung mit `-mal stetig differenzierbarer Umkehrab-bildung

ϕ−1 : W × Rm →W × Rm, (x, y) 7→ (x, y + f(x)) .

U ∩Graphf = Graphf = {(x, f(x) | x ∈W} ϕ→ W × {0} = V ∩ (Rn × {0})(x, f(x)) 7→ (x, 0)

Ein Bild, das die Abbildung ϕ darstellt

(3) Ist W offen in Rn, f−, f+ ∈ C`(W,Rm) mit f− < f+. Dann ist Graphf− ∪ Graphf+ einen-dimensionale Untermannigfaltigkeit von Rn+m. Definiere zum Beispiel

ϕ− : {(x, y) | x ∈W ∧ y < f+(x)}︸︷︷︸U :=

→ {(x, y) | x ∈W ∧ y < f+(x)− f−(x)}︸︷︷︸V :=

, (x, y) 7→ (x, y−f−(x))

ϕ+ : {(x, y) | x ∈W ∧ f−(x) < y}︸︷︷︸U :=

→ {(x, y) | x ∈W ∧ −f+(x) + f−(x) < y}︸︷︷︸V :=

, (x, y) 7→ (x, y−f+(x))

Ein Bild, das die Abbildungen ϕ+ und ϕ− darstelltFr. 21.6.

(4) M ist 0-dimensionale Untermannigfaltigkeit von Rk ⇐⇒ M ist eine diskrete Teilmenge vonRk :⇐⇒ Die Spurtopologie auf M ist die diskrete TopologieZum Beispiel ist {1/n | n ∈ N>0} eine 0-dimensionale Untermannigfaltigkeit von R.

(5) M ist k-dimensionale Untermannigfaltigkeit von Rk ⇐⇒ M ist eine offene Teilmenge von Rk


(6) Ist M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit der Regularitat C`, so ist auch jedeoffene Teilmenge M ′ von M eine n-dimensionale C`-Untermannigfaltigkeit von Rk. Denn zugegebenem p ∈M ′ wahle eine Untermannigfaltigkeitskarte ϕ : U → V mit p ∈ U . Da M ′ offenin M ist, gibt es eine in Rk offene Teilmenge U ′ mit M ′ = M ∩U ′. Dann ist ϕ|U∩U ′ : U ∩U ′ →ϕ(U ∩ U ′) eine Untermannigfaltigkeitskarte von M ′ mit p ∈ U ∩ U ′.

(7) Es folgt hieraus, dass die Untermannigfaltigkeits-Eigenschaft lokal ist, das heißt: Eine Teil-menge M ⊂ Rk ist genau dann eine n-dimensionale C`-Untermannigfaltigkeit, wenn jederPunkt p ∈ M eine offene Umgebung U besitzt, so dass U ∩ M eine n-dimensionale C`-Untermannigfaltigkeit ist.

Untermannigfaltigkeiten sind insbesondere fur Anwendungen in der Physik und anderen Natur-wissenschaften, aber auch zum Beispiel fur (nicht-lineare) Optimierungsprobleme in der Betriebs-wirtschaftslehre sehr wichtig.

Untervektorraume von Rk kann man auf verschiedene Arten beschreiben, zum Beispiel

(1) durch Gleichungen, z.B. V := {(x1, . . . , xk) ∈ Rk | x1 + 2x2 = 0}(2) als Graph, das heißt V := Graphf einer linearen Funktion f : Rn → Rk−n(3) V := Bild(f) fur eine lineare Abbildung f : Rm → Rk(4) durch Parametrisierung, z.B. definiere zu v1, v2 ∈ Rk:

V := {tv1 + sv2 | t, s ∈ R}.

(5) Durch eine lineare Untermannigfaltigkeitskarte wie in Beispiel 6.2 (1).

Jede dieser Beschreibungen verallgemeinert sich zu einer Beschreibung von Untermannigfaltigkei-ten:

(1) Abschnitt 6.2: lokal als Urbild eines regularen Werts,(2) Abschnitt 6.2: lokal als Graph, das heißt lokal als Graphf einer C`-Funktion f : U → Rk−n,

U offen in R(3) Abschnitt 6.3: lokal als Bild einer Immersion,(4) Abschnitt 6.5: durch eine lokale Parametrisierung(5) durch eine Untermannigfaltigkeitskarte wie in Definition 6.1

Hierbei ist (5) fur theoretische Uberlegungen sehr hilfreich ist, aber oft wenig geschickt fur konkreteRechnungen. Moderne Programme, die gekrummte Flachen modellieren mussen, z.B. Raytracerwie povray nutzen verschiedene dieser Methoden, um Flachen zu beschreiben. Sie haben zumeistHilfsmittel, um von einer Form in die andere umrechnen zu konnen.

6.2. Der Satz vom regularen Wert. Ein wichtiges Kriterium, um zu zeigen, dass eineTeilmenge von Rk eine Untermannigfaltigkeit ist, ist der Satz vom regularen Wert.

http://www.povray.org


Definition 6.3. Sei U offen in Rk, F : U → Rm `-mal stetig differenzierbar, ` ≥ 1. Wir sagenz ∈ Rm ist ein regularer Wert von F , falls gilt

(6.4) ∀p ∈ F−1({z}) : F ′(p) hat Rang m.

Ist z kein regularer Wert, so nennt man z einen singularen Wert .

!ACHTUNG!. Im Fall z /∈ F (U) ist z ein regularer Wert! Denn der Allquantor geht uber die leereMenge, die Aussage (6.4) ist also wahr. Wenn z ein regularer Wert von F , so impliziert dies nicht,dass z ein Wert von F ist.

Beispiele 6.5. (1) Ist F : Rn → Rk eine lineare Funktion. Dann gilt:

F ist surjektiv

⇐⇒ 0 ist ein regularer Wert

⇐⇒ Alle z ∈ Rk sind regulare Werte

(2) Wir betrachten (ahnlich wie in Beispiel 5.11) die Funktion

F : Rn+1 → R, F (x) := 〈x, x〉.

F ′(x) = 2xT .

Dann ist 0 kein regularer Wert, aber jedes z ∈ R r {0} ist ein regularer Wert. Fur z < 0 istF−1({z}) = ∅ und dann ist z ein regularer Wert, siehe die obige Achtung-Bemerkung. Furz > 0 gilt ‖F ′(x)‖2 = 2

√z falls F (x) = z. In diesem Fall hat also F ′(x) Rang 1.

Sn := F−1({1}) = {x ∈ Rn+1 | ‖x‖2 = 1}.

Definition 6.6. Sei

Sk :={

Permutationen︸︷︷︸=Bijektionen

{1, 2, . . . , k} → {1, 2, . . . , k}}

Zu σ ∈ Sk sei Lσ die lineare Abbildung Rk → Rk mit ej 7→ eσ(j).

SATZ 6.7 (Satz vom regularen Wert). Sei M eine Teilmenge von Rk, ` ≥ 1. Aquivalent sind:

(1) M ist n-dimensionale Untermannigfaltigkeit von Rk mit Regularitat C`

(2) Zu jedem p ∈M existiert eine offene Umgebung U in Rk und eine Funktion F ∈ C`(U,Rk−n),so dass 0 regularer Wert von F ist und F−1({0}) = U ∩M .

(3) Zu jedem p ∈M existiert eine offene Umgebung U in Rk und eine Funktion F ∈ C`(U,Rk−n),ein z ∈ Rk−n, so dass z regularer Wert von F ist und F−1({z}) = U ∩M .

(4) Lokal ist M nach Permutation der Komponenten von Rk der Graph einer Funktion, genauer:zu jedem p ∈M existiert ein σ ∈ Sk, eine offene Teilmenge V von Rn, eine offene TeilmengeW von Rk−n und eine C`-Funktion f : V →W , so dass

(V ×W ) ∩ Lσ(M) = Graph(f).

Beispiele 6.8.


(1) Sn ist eine Untermannigfaltigkeit von Rn+1 mit Regularitat C∞, da 1 ein regularer Wert derFunktion F aus dem letzten Beispiel ist.

(2) Sei wieder W offen in Rn, f ∈ C`(W,Rm), Graphf := {(x, f(x)) | x ∈W}. Dann ist

F : W × Rm︸︷︷︸U :=

→ Rm, (x, y) 7→ y − f(x)

ist eine `-mal stetig differenzierbare Abbildung. Wir rechnen

F ′(x, y) = (−f ′(x) 11m)

und deswegen ist jedes z ∈ Rm ein regularer Wert von F , insbesondere ist 0 regularer Wert.Dies liefert einen neuen Beweis, dass Graphf eine C`-Untermannigfaltigkeit von Rn+m ist.

Bemerkung 6.9. In den obigen Beispielen ist die Untermannigfaltigkeit eine Teilmenge von U .Es gibt aber auch n-dimensionale C∞-Untermannigfaltigkeiten M ⊂ Rk, fur die es kein F ∈C1(U,Rk−n) wie oben mit M ⊂ U gibt. Ein Beispiel hierfur ist das Mobius-Band , das wir spaternaher betrachten wollen. Um solche Untermannigfaltigkeiten als Nullstellen regularer Werte dar-zustellen, benotigt man mehrere offene Mengen U ⊂ Rk und Abbildungen F : U → Rk−n wieoben.

Bemerkung 6.10. (Wiederholung aus der Linearen Algebra) Sei A ∈ Rm×k und m ≤ k, z.B.obiges F ′(x). Dann gilt

A hat Rang m

⇐⇒ A hat maximalen Rang

⇐⇒ Die Abbildung Rk → Rm, x 7→ Ax ist surjektiv

⇐⇒ Die Abbildung Rm → Rk, x 7→ ATx ist injektiv

⇐⇒ Nach Umordnen der Spalten von A, bilden die letzten m Spalten eine invertierbare Matrix

Beispiel 6.11.

A :=

(1 2 43 1 2

)Die letzten beiden Spalten sind linear abhangig. Nach Vertauschen der ersten und dritten Spaltehaben wir (

4 2 12 1 3

).

Wegen

det

(2 11 3

)= 5 6= 0

sehen wir, dass A Rang 2 besitzt.

Beweis von Satz 6.7.

”(1) =⇒ (2)“: Zu p ∈ M sei eine Untermannigfaltigkeitskarte ϕ gegeben. Sei π : Rk → Rk−n die

Projektion auf die letzten k−n Komponenten. Dann ist F := π◦ϕ : U → Rk−n eine C`-Abbildung.Weiter ist 0 ist ein regularer Wert, denn F ′(p) = π′(ϕ(p))ϕ′(p), der Rang von π′(ϕ(p)) ist k − n,


und da ϕ′(p) invertierbar ist, bleibt der Rang einer (k − n)× k-Matrix unverandert, wenn wir sievon rechts mit ϕ′(p) multiplizieren. Außerdem gilt F−1({0}) = ϕ−1(V ∩ (Rn × {0})) = U ∩M .

”(2) =⇒ (3)“: Offensichtlich.

”(3) =⇒ (4)“: Zu p ∈ M sei eine offene Umgebung U in Rk gegeben, eine Abbildung F ∈C`(U,Rk−n) und ein z ∈ Rk−n, so dass z regularer Wert ist und F−1({z}) = U ∩ M . Insbe-sondere F (p) = z, also hat F ′(p) Rang m := k − n. Nach Umordnen der Komponenten von Rk,konnen wir annehmen, dass die hintersten m Spaltenvektoren in F ′(p) ∈ Rm×k eine invertierbareMatrix bilden. Somit sind die Voraussetzung erfullt, um den Satz 5.2 uber implizite Funktionenim Punkt (x, y) := p und mit F (x, y) := F (x, y)− z statt F anzuwenden. Die damit erhaltenen V ,W und f erfullen (4).

”(4) =⇒ (1)“: Folgt direkt aus Beispiele 6.2 (2)

”Graphen sind Untermannigfaltigkeiten“ und (7)

”Die Untermannigfaltigkeits-Eigenschaft ist lokal“.

Beispiel 6.12 (Torus). Fur ein R ∈ (0, 1) betrachten wir

TR :=

{(x, y, z) ∈ R3 |

(√x2 + y2 − 1

)2

+ z2 = R2

}⊂ R3.

Abbildung 9: Eine Zentralprojektion von TR fur R ≈ 0, 2.Quelle: Wikipedia https: // commons. wikimedia. org/ wiki/ File: Torus. svg

GNU Free Documentation License, Version 1.2

UBUNG 6.13. Zeigen Sie, dass TR eine zwei-dimensionale Untermannigfaltigkeit von R3 ist.

Losung (von Nicolas Ginoux): Die Teilmenge TR ist ein sogenannter Drehtorus im R3: er entstehtdurch Drehung eines Kreises in der x-z-Ebene mit Mittelpunkt (x, z) = (1, 0) und mit Radius Rum die z-Achse.Sei

U :={

(x, y, z) ∈ R3 | (x, y) 6= (0, 0) und (‖(x, y)‖2 = 1 =⇒ z 6= 0)}

= R3 r{R · e3 ∪ (S1×{0})

}⊂ R3

https://commons.wikimedia.org/wiki/File:Torus.svg


und F : U → R, (x, y, z) 7→(√

x2 + y2 − 1)2

+ z2 − R2. Die Teilmenge U ist offen im R3 mit

TR ⊂ U : wegen 0 < R < 1 hat die Gleichung 1 + z2 = R2 keine (reelle) Losung und damit gilt(x, y) 6= (0, 0) fur alle (x, y) ∈ TR; außerdem gilt, im Fall (x, y, z) ∈ TR mit ‖(x, y)‖2 = 1, dieGleichung z2 = R2, insbesondere z 6= 0.Nun ist TR = F−1({0}). Um zu beweisen, dass TR eine zwei-dimensionale Untermannigfaltigkeitvon R3 ist, reicht es daher, zu beweisen, dass 0 ein regularer Wert der Funktion F ist.

Da (x, y) 7→√x2 + y2 auf R2r{(0, 0)} unendlich oft differenzierbar ist, ist die Funktion F : U → R

als Verknupfung unendlich oft differenzierbarer Abbildungen unendlich oft differenzierbar. Fur alle(x, y, z) ∈ U ist die Matrix von F ′(x, y, z) in den kanonischen Basen gegeben durch

2

(x(√x2+y2−1)√x2+y2

y(√x2+y2−1)√x2+y2

z

).

Gilt√x2 + y2 = 1, so verschwinden die beiden ersten Komponenten von F ′(x, y, z); ist nun

(x, y, z) ∈ U , so gilt dann z 6= 0 und damit ist F ′(x, y, z) 6= 0. Gilt√x2 + y2 6= 1, so konnen

wegen (x, y) 6= (0, 0) nicht beide erste und zweite Komponenten von F ′(x, y, z) verschwinden,d.h., es gilt auch in diesem Fall F ′(x, y, z) 6= 0. Insgesamt haben wir bewiesen, dass fur jedes(x, y, z) ∈ U die Abbildung F ′(x, y, z) nicht verschwindet und ist damit – weil F ′(x, y, z) seineWerte im 1-dimensionalen Vektorraum R hat – surjektiv. Daraus folgt, dass 0 ein regularer Wertder Funktion F ist. Dies liefert das Ergebnis.

Bemerkung 6.14. Man zeigt leicht, dass

TR := {TR(α, β) | α, β ∈ R} ,wobei TR : R× R→ R3,

TR(α, β) :=

(1 +R cosα) cosβ(1 +R cosα) sinβ

R sinα

.

Mi 26.6.

6.3. Der Immersionssatz.

Definition 6.15. Sei W eine offene Teilmenge von Rn und Ψ : W → Rk. Man nennt Ψ eineImmersion , wenn Ψ stetig differenzierbar ist und wenn fur alle p ∈ W die Matrix f ′(p) Rang nhat (d.h. die zu f ′(p) gehorende lineare Abbildung Rn → Rk, x 7→ f ′(p) ·x ist injektiv). Man nenntΨ eine C`-Immersion37, wenn zusatzlich f ∈ C`, ` ≥ 1.

Insbesondere ist dann k ≥ n, falls W 6= ∅. Die Eigenschaften”Ψ ist injektiv“ und

”Ψ ist eine

Immersion“ sind unabhangig voneinander.

Beispiele 6.16.

(1) Die Abbildung Ψ : R→ R2, Ψ(t) := (cos t, sin t)T erfullt Ψ′(t) := (− sin t, cos t)T 6= 0. Also istΨ eine Immersion, aber nicht injektiv.

37Also: C1-Immersion=Immersion


(2) Ψ : R → R, Ψ(t) := t3 ist ein Homoomorphismus, also insbesondere injektiv, aber keineImmersion, denn Ψ′(0) = 0.

(3) Die in Beispiel 6.14 definierte Funktion TR : R2 → R3 ist fur R ∈ (0, 1) eine C∞-Immersion(Beweis: kleinere Rechnung!).

SATZ 6.17 (Immersionssatz). Sei W eine offene Teilmenge von Rn und Ψ : W → Rk eineC`-Immersion, ` ≥ 1. Dann gibt es zu jedem p ∈ W eine offene Umgebung U ⊂ W , so dassΨ(U) eine n-dimensionale C`-Untermannigfaltigkeit von Rk ist und so dass Ψ|U : U → Ψ(U) einHomoomorphismus ist.

Beweis des Immersionssatzes. Sei Ψ: W −→ Rk eine Immersion und p ∈ W . Da Ψ′(x0) Rangn hat, sind die Vektoren ∂Ψ

∂x1(p), . . . , ∂Ψ

∂xn(p) linear unabhangig in Rk. Deswegen existieren k − n

Vektoren vn+1, . . . , vk in Rk so, dass(∂Ψ∂x1

(p), . . . , ∂Ψ∂xn

(p), vn+1, . . . , vk

)eine Basis von Rk ist.

Betrachte nun die Abbildung

Φ : W × Rk−n −→ Rk, (x, α) 7−→ Ψ(x) +

k∑j=n+1

αjvj ,

wobei x ∈W und α = (αn+1, . . . , αk) ∈ Rk−n. Offensichtlich ist Φ ∈ C`. Wir rechnen:

Φ′(p, 0) =

(∂Ψ

∂x1(p)

∂Ψ

∂x2(p) · · · ∂Ψ

∂xn(p) vn+1 · · · vk

).

Die Spalten bilden – wie oben konstruiert – eine Basis, d.h. Φ′(p, 0) ist eine invertierbare Matrix.

Nach dem lokalen Umkehrsatz existieren eine offene Umgebung V1 von (p, 0) in W ×Rk−n und eineoffene Umgebung V2 von Φ(p, 0) = Ψ(p) in Rk, so dass ΦV1 : V1 −→ V2 ein C`-Diffeomorphismusist.

Durch Verkleinern von V1 und V2 konnen wir erreichen, dass V1 von der Form V1 = U ×U ′ ist (mitp ∈ U ⊂W , 0 ∈ U ′).

Dann ist ϕ := (Φ|U×U ′)−1: V2 → U×U ′ eine Untermannigfaltigkeitskarte von Ψ(U) = Φ(U×{0}).

Da Φ|U×U ′ : U × U ′ → V2 ein Homoomorphismus ist, ist auch Ψ|U = (Φ|U×U ′)∣∣U×{0} : U × {0} ∼=

U → Ψ(U) ein Homoomorphismus.

Zeichnung von Ψ(W ) als Kurve in R2 und von Φ(U ×U ′) = V2 mit ϕ Abbildungspfeil auf U ×U ′.

ZUSATZ 6.18. Die Voraussetzungen seien wie im vorangehenden Satz. Außerdem nehmen wir an,Ψ : W → Ψ(W ) sei ein Homoomorphismus. Sei V ⊂ Rr eine offene Teilmenge und h : V → Rkeine C`-Abbildung mit h(V ) ⊂ Ψ(W ). Dann ist Ψ−1 ◦ h : V →W ebenfalls in C`.

Zeichnung zur Veranschaulichung des Zusatzes


Beweis. Wir zeigen die stetige Differenzierbarkeit auf einer Umgebung eines beliebigen Punktsx ∈ V . Wir definieren ϕ wieder wie im Beweis des Satzes auf einer kleinen offenen Umgebung V2

von h(x) = Ψ(p), U eine offene Umgebung von p wie oben. Wir setzen V0 := h−1(V2), dies ist eineoffene Umgebung von x. Es gilt fur y ∈ V0:

ϕ ◦ h(y) = Ψ−1 ◦ h .Die linke Seite ist `-mal stetig differenzierbar als Funktion in y also auch die rechte, was zu zeigenwar.

Beispiele 6.19. Es gibt injektive Immersionen Ψ : W → Rk, so dass Ψ : W → Ψ(W ) eine unstetigeUmkehrabbildung besitzt:

(1) Die Abbildung Ψ : (0, 2π)→ R2, Ψ(t) := (sin t, sin(2t))T erfullt Ψ′(t) := (cos t, 2 cos(2t))T .Aus cos t = 0 folgt t = π(k+ 1

2 ) fur k ∈ Z, also t ∈ {π/2, 3π/2}. Dann aber gilt cos(2t) 6= 0.Es folgt Ψ′(t) 6= 0 fur alle t ∈ (0, 2π), das heißt Ψ ist eine Immersion. Man sieht auch leicht,dass Ψ injektiv ist. Allerdings ist Ψ kein Homoomorphismus von (0, 2π) auf Ψ((0, 2π)).Denn fur eine Folge von ti ∈ (0, 2π) mit limi→∞ ti = 0 gilt pi := Ψ(ti) → 0 = (0, 0) =Ψ(π) ∈ R2. Somit gilt pi → 0 ∈ R2, aber Ψ−1(pi) = ti 6→ π = Ψ−1(0). Somit ist Ψ−1

nicht (folgen-)stetig.

Bild von Ψ((0, 2π))

(2) Sei wieder TR wie in Beispiel 6.14 definiert. Zu einer Zahl ρ ∈ R definieren wir

Ψρ : R→ R3, Ψρ(t) := TR(2πρt, 2πt).

Fall 1: ρ = p/q ∈ Q, seien p,q ∈ Z teilerfremd. Dann ist Ψρ periodisch: Ψρ(t+q) = Ψρ(t).Ψ(R) ist eine geschlossene Kurve38, die sich in einem Durchlauf p-mal um die

”Seele“ S1 × {0} ⊂ R3 des Torus windet und q-mal um die z-Achse. Man nennt

Ψ(R) einen (p, q)-Torus-Knoten. 39

Fall 2: ρ ∈ R r Q. Dann ist Ψρ eine injektive Immersion. Ihr Bild Ψρ(R) liegt dicht inTR, aber Ψρ ist kein Hooomorphismus auf sein Bild. Denn sind 1, ρ in τ rationallinear unabhangige reelle Zahlen, dann ist jedes x ∈ TR Haufungspunkt der Folgeak := ψ(kτ). Eine Teilfolge konvergiert dann gegen ein x ∈ Ψ(R). Deswegen istΨ−1 nicht folgenstetig.

6.4. Einbettungen von Untermannigfaltigkeiten. In diesem Abschnitt sei πx : Rk → Rndie Projektion auf die ersten n Komponenten und πy : Rk → Rk−n die Projektion auf die letztenk − n Komponenten.

LEMMA 6.20. Sei M eine n-dimensionale40 Untermannigfaltigkeit von Rk mit einer Unterman-nigfaltigkeitskarte ϕ : U → V , p ∈ U ∩M , und sei Ψ : W → Rk eine injektive Immersion mitΨ(W ) ⊂M und p ∈ Ψ(W ). Sei Tp ⊂ Rk das Bild von Ψ′(Ψ−1(p)). Dann gilt ϕ′(p) ·Tp = Rn×{0}.

38genauer: es ist eine zusammenhangende kompakte 1-dimensionale Untermannigfaltigkeit von R3

39Torusknoten sind derzeit ein beliebtes Kinderspielzeug und sind unter dem Namen”Flow ring“ im Handel

erhaltlich und auch auf Video-Plattformen findet man alles mogliche.40Das Wort

”n-dimensional“ habe ich wahrscheinlch in der Vorlesung leider vergessen, ist aber sehr wichtig.

https://www.youtube.com/watch?v=5kh0X_EINhA


Das Lemma gilt in leicht veranderter Form, wenn Ψ nicht mehr injektiv ist, sondern nur nocheine Immersion. Wir wollen dies aber nicht naher betrachten, da man jede Immersion durch Ein-schrankung auf eine genugend kleine Umgebung eines gegebenen Punktes injektiv machen kann(Immersionsatz).

Zeichnung zu obigem Satz

Beweis. Setze W0 := Ψ−1(U) ⊂W und x0 := Ψ−1(p). Man pruft leicht, dass πy ◦ϕ◦Ψ|W0: W0 →

Rk−n alles auf 0 abbildet. Nach Kettenregel ist dann

0 = π′y(ϕ(p))︸︷︷︸= (0 11k−n)

· ϕ′(p) ·Ψ′(x0) ,

das heißt, das Bild der Matrix A := ϕ′(p) ·Ψ′(x0) liegt in Rn ×{0}, und da Ψ′(x0) Rang n besitztund ϕ′(p) invertierbar ist, wissen wir, dass das Bild von A gleich Rn × {0} ist. Da das Bild von Agleich ϕ′(p) · Tp ist, folgt die Behauptung.Fr 28.6.

SATZ 6.21. Sei Ψ : W → Rk eine injektive C`-Immersion, ` ≥ 1. Dann ist Ψ(W ) eine C`-Untermannigfaltigkeit von Rk genau dann, wenn Ψ : W → Ψ(W ) ein Homoomorphismus ist.

Zeichnung zu diesem Satz

Beweis. Setze M := Ψ(W ).

”⇐= “: Wir wollen zeigen, dass M eine C`-Untermannigfaltigkeit von Rk ist. Sei dazu p ∈ M

und p = Ψ(x0), x0 ∈ W . Nach dem Immersionssatz 6.17 gibt es eine offene Umgebung W ′ vonx0 in W , so dass M ′ := Ψ(W ′) eine C`-Untermannigfaltigkeit von Rk ist. Da Ψ : W → Ψ(W )ein Homoomorphismus ist und da W ′ offen in W ist, ist M ′ = Ψ(W ′) eine offene Teilmenge vonM = Ψ(W ), d.h. es existiert eine in Rn offene Menge U1 mit M ′ = U1 ∩M .

Sei ϕ2 : U2 → V2 eine Untermannigfaltigkeitskarte von M ′ mit p ∈ U2. Setze U := U1 ∩ U2 3 p,V := ϕ2(U) und ϕ := ϕ2

∣∣U

. Dann sind U und V offen in Rk, und ϕ : U → V ist ein C`-Diffeomorphismus, fur den gilt:

ϕ(U ∩M) = ϕ2(U ∩M ′) = V ∩ ϕ2(M ′) = V ∩ V2︸︷︷︸=V

∩(Rn × {0}).

Also ist ϕ : U → V eine Untermannigfaltigkeitskarte von M mit p ∈ U .

”=⇒ “: Wir zeigen, dass Ψ−1 : M →W folgenstetig ist. Sei hierzu eine Folge (pi)i∈N in M gegeben

mit limi→∞ pi = p ∈M . Da nach Voraussetzung M eine C`-Untermannigfaltigkeit ist, konnen wireine Untermannigfaltigkeitskarte ϕ : U → V mit p ∈ U wahlen. Es liegen fast alle pi in U ∩Mund deswegen sind fast alle qi := πx ◦ ϕ(pi) ∈ π(V ) ⊂ Rn wohldefiniert und konvergieren gegenq := πx ◦ ϕ(p) ∈ Rn. Insbesondere ϕ(pi) = (qi, 0).

Setze wieder W0 := Ψ−1(U) ⊂ W und x0 := Ψ−1(p). Wie im vorangehenden Lemma gezeigt, istdas Bild von ϕ′(p)Ψ′(x0) gleich Rn × {0}.


Somit ist

(πx ◦ ϕ ◦Ψ|W0)′(x0) = π′y(ϕ(p))︸︷︷︸

= (11n 0)

· ϕ′(p) ·Ψ′(x0)

eine invertierbare Matrix in Rn×n. Also ist nach dem lokalen Umkehrsatz ρ := πx◦ϕ◦Ψ|W0 lokal umx0 umkehrbar und xi := ρ−1(qi)→ x0 := ρ−1(q). Wegen Ψ(xi) ∈M haben wir ϕ ◦Ψ(xi) = (qi, 0)und aus der Injektivitat von ϕ folgt Ψ(xi) = pi, also Ψ−1(pi) = xi → x0 = Ψ−1(p). Wir habenalso die Folgenstetigkeit und somit die Stetigkeit von Ψ−1 : M →W gezeigt.

Beispiel 6.22 (Fortsetzung von Beispiel 6.19 (1)). Sei wieder Ψ : (0, 2π)→ R2, Ψ(t) := (sin t, sin(2t))T .Diese Abbildung ist eine injektive C∞-Immersion, aber kein Homoomorphismus von (0, 2π) aufΨ((0, 2π)

): das haben wir oben bereits alles gezeigt. Das Bild M := Ψ

((0, 2π)

)ist keine Unter-

mannigfaltigkeit, da es keine Untermannigfaltigkeitskarte von M gibt, die 0 = Ψ(π) ∈ R2 enthalt.Die Nicht-Existenz einer Untermannigfaltigkeitskarte kann man auch elementar beweisen, beque-mer geht es aber mit dem obigen Satz.

Nochmals dieselbe Zeichnung vom Bild von Ψ.

Definition 6.23. Eine injektive Immersion, die ein Homoomorxphismus auf ihr Bild ist, nenntman eine Einbettung einer Untermannigfaltigkeit.

6.5. Lokale Parametrisierungen von Untermannigfaltigkeiten.

Definition 6.24. Sei M ⊂ Rk eine Teilmenge. Eine n-dimensionale lokale C`-Parametrisierungvon M ist eine C`-Immersion Ψ : W → Rk mit den folgenden Eigenschaften:

(a) W ⊂ Rn ist offen,

(b) Ψ(W ) ist offen in M , das heißt Ψ(W ) = U ∩M fur eine offene Teilmenge U von Rk,

(c) Ψ : W → Ψ(W ) ist ein Homoomorphismus.

LEMMA 6.25. Ist Ψ : W → Rk eine lokale C`-Parametrisierung von M ⊂ Rk wie in obigerDefinition und W0 eine offene Teilmenge von W . Dann ist auch Ψ|W0

: W0 → Rk ebenfalls einelokale C`-Parametrisierung von M .

Beweis. Wahle zu Ψ ein U wie in (b).

Offensichtlich ist Ψ := Ψ|W0eine C`-Immersion, die (a) und (c) mit Ψ statt Ψ erfullt.


Zu (b) fur Ψ: Da Ψ : W → Ψ(W ) ein Homoomorphismus ist, ist Ψ(W0) offen in Ψ(W ).41 Es gibt

also eine offene Teilmenge U von Rk mit Ψ(W0) = Ψ(W )∩ U . Es folgt Ψ(W0) = (U ∩ U)︸︷︷︸offen in Rk

∩M .

PROPOSITION 6.26. Sei M ⊂ Rk eine Teilmenge. Dann sind aquivalent:(a) M ist eine n-dimensionale C`-Untermannigfaltigkeit.(b) Fur alle p ∈ M existiert eine n-dimensionale lokale C`-Parametrisierung von M der Regula-ritat C`, deren Bild p enthalt.

Beweis.

”(a) =⇒ (b)“ Sei p ∈ M beliebig. Sei ϕ : U → V eine Untermannigfaltigkeitskarte von M mitp ∈ U . Definiere W := V ∩ (Rn × {0}) und Ψ := (ϕ−1)|W : W → Rk. Dann ist W offen in Rn,Ψ ist C` (da ϕ−1 ∈ C`) mit Ψ′(x) = (ϕ−1)′(x)|Rn×{0} injektiv ∀x ∈W , es gilt Ψ(W ) = ϕ−1(W ) =U ∩M und Ψ : W → Ψ(W ) ist die Einschrankung eines Homoomorphismus, ist also selbst einHomoomorphismus.

”(b) =⇒ (a)“ Sei p ∈ M beliebig. Sei Ψ: W → Rk eine lokale C`-Parametrisierung von M mitp = Ψ(x0) ∈ Ψ(W ). Nach dem Immersionssatz 6.17 gibt es eine offene Umgebung W0 von x0, sodass Ψ(W0) 3 p eine Untermannigfaltigkeit ist.

Da Ψ−1 : Ψ(M)→M stetig ist, ist Ψ(W0) offen in Ψ(W ) und damit wegen (b) von Definition 6.24offen in M . Es gibt also eine in Rk offene Menge U 3 p mit Ψ(W0) = U ∩M . Wir haben also zujedem p ∈M eine in Rk offene Umgebung U gefunden, so dass U ∩M eine Untermannigfaltigkeitvon Rk ist. Da die Untermannigfaltigkeitseigenschaft eine lokale Eigenschaft ist (Beispiele 6.2 (7)),folgt daraus, dass M eine C`-Untermannigfaltigkeit ist.

Beispiele 6.27.

(1) Sei U ⊂ Rn offen und f ∈ C`(U,Rm). Betrachte

Graphf := Mf := {(x, f(x)) |x ∈ U} ⊂ Rn × Rm = Rn+m.

Dann ist die Abbildung Ψ : U −→ Rn+m, x 7−→ (x, f(x))T eine n-dimensionale globale C`-

Parametrisierung von Mf : die Abbildung Ψ ist C`, es gilt Ψ′(x) =(

11nf ′(x)

), ∀x ∈ U , wobei 11n

die n×n Einheitsmatrix bezeichnet – insbesondere gilt rg(Ψ′(x)) = n – und Ψ(U) = Mf , wobeiΨ: U −→ Mf ein Homoomorphismus ist mit Umkehrabbildung Mf −→ U , (x, f(x)) 7−→ x(Projektion auf die n ersten Koordinaten).

(2) Sei M := Sn ⊂ Rn+1. Sei U := {x ∈ Rn : ‖x‖2 < 1} ⊂ Rn. Definiere Ψ+ : U −→ Rn+1,

x 7−→ (x,√

1− ‖x‖22)T sowie Ψ− : U −→ Rn+1, Ψ−(x) := (x,−√

1− ‖x‖22)T . Dann sind Ψ+

41In der Notation fur Bilder und Urbilder, die wir in der Analysis I benutzt haben, wird dies etwas klarer: esgilt Ψ#(W0) = (Ψ−1)#(W0) und diese Menge ist als Urbild der offenen Menge W0 bezuglich der stetigen Abbildung

Ψ−1 : Ψ(W )→W wieder offen.


und Ψ− n-dimensionale lokale C∞-Parametrisierungen von Sn. Es gilt

Ψ+(U) = Sn ∩(Rn × (0,∞)

)=

x1

x2

...xn+1

∈ Sn ∣∣∣ xn+1 > 0

.

Uberdeckung von S1 ⊂ R2 durch die Bilder von 4 Parametrisierungen

Wir vertauschen nun die Komponenten von Rn+1 so, dass die `-te Komponente zur letztenKomponente wird. Wir erhalten dann zu jedem ` = 1, . . . , n, zwei weitere lokale Parametrisie-rungen Ψ`

±, setze Ψn+1± := Ψ±. Es gilt

Ψ`±(U) =

x1

x2

...xn+1

∈ Sn ∣∣∣ ± x` > 0

,

und somit

Sn = Ψ1+(U) ∪Ψ2

+(U) ∪ · · · ∪Ψn+1+ (U) ∪Ψ1

−(U) ∪Ψ2−(U) ∪ · · · ∪Ψn+1

− (U).

Die Sphare wird also von den Bildern von 2(n+ 1) lokalen Parametrisierungen uberdeckt.(3) Seien a, b ∈ R und R ∈ (0, 1). Sei TR der Torus und TR definiert wie in Beispiel 6.14. Dann ist

die Abbildung(a, a+ 2π)× (b, b+ 2π)→ R3, (α, β) 7→ TR(α, β)

eine lokale C∞-Parametrisierung von TR.

Bemerkung 6.28. Sei i : Rn → Rk die Abbildung x 7→ (x, 0). Ist ϕ : U → V eine C`-Unterman-nigfaltigkeitskarte von M , so ist Ψ := ϕ−1 ◦ i : W → Rk, W := i−1(V ) ∼= V ∩ (Rn×{0}) eine lokaleC`-Parametrisierung: Die C`-Eigenschaft und die Offenheit von W ist klar, ebenso Ψ(W ) = V ∩Mund somit die Offenheit von Ψ(W ) in M . Da i eine Immersion ist und ϕ ein Diffeomorphismus ist,ist auch Ψ eine Immersion. Die Umkehrabbildung von Ψ : W → Ψ(W ) ist πx ◦ ϕ|V ∩M und dieseAbbildung ist offensichtlich stetig.

Umgekehrt kann man zu jeder lokalen Parametrisierung Ψ eine Untermannigfaltigkeitskarte ϕfinden, so dass man Ψ wie oben aus ϕ erhalt (ohne Beweis). Die lokale Existenz von solch einemϕ haben wir im Beweis des Immersionssatzes 6.17 gezeigt, dort haben wir Ψ zu einer Funktion Φfortgesetzt, die eine lokale Umkehrfunktion ϕ besitzt. Man kann mit großerem Aufwand solch einϕ : U → V konstruieren, so dass Ψ(M) ⊂ U .

Bild zu dieser Bemerkung

Bemerkung 6.29. Man kann sich nun naturlich fragen: sind die Eigenschaften (b) und (c) inDefinition 6.24 wirklich notwendig? Wir haben im letzten Abschnitt gesehen, dass wir (c) benotigen,damit das Bild eine Untermannigfaltigkeit ist. Wenn (c) nicht erfullt ist, haben wir Gegenbeispiele.Bedingung (b) ist ebenfalls notwendig. Die Menge M := [0, 1]×Rn ist keine Untermannigfaltigkeit


von Rn+1.42 Wir definieren nun zu jedem (x, y) ∈ [0, 1] × Rn ist Ψx : Rn → Rn+1, Ψx(t) = (x, t)eine injektive Immersion, die (a) und (c), aber nicht (b) erfullt. Offensichtlich ist (x, y) im Bildvon Ψx.

6.6. Der Tangentialraum.

Definition 6.30. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit und p ∈ M ein Punkt.Der Tangentialraum an M im Punkt p ist

TpM := {v ∈ Rk | ∃ ε > 0 und c : (−ε, ε) −→ Rk ist C1-Kurve mit c((−ε, ε)) ⊂M,c(0) = p und c′(0) = v} ⊂ Rk.

PROPOSITION 6.31. Sei M ⊂ Rk eine Untermannigfaltigkeit und p ∈M ein Punkt.

(a) Sei Ψ: W −→ Rk eine n-dimensionale lokale C1-Parametrisierung von M um p. Sei x0 :=Ψ−1(p) ∈W . Dann gilt

TpM = Bild(Ψ′(x0)

).

(b) Sei ϕ : U −→ V eine Untermannigfaltigkeitskarte von M um p. Dann gilt

TpM = ϕ′(p)−1 · (Rn × {0}) .

(c) Sei U ⊂ Rk offene Umgebung von p und F : U −→ Rk−n C` mit 0 als regularem Wert undF−1({0}) = U ∩M . Dann gilt

TpM = ker(F ′(p)).

Insbesondere ist TpM ein n-dimensionaler Untervektorraum von Rk.

Beweis. Zu (a): Sei v ∈ TpM . Dann existiert c : (−ε, ε) −→ Rk C1 (fur ein ε > 0) mitc((−ε, ε)) ⊂ M , c(0) = p und c′(0) = v. Nach moglicher Verkleinerung von ε konnen wir an-nehmen, dass c((−ε, ε)) ⊂ Ψ(W ) gilt. Dann ist c := Ψ−1 ◦ c : (−ε, ε) −→ Rn stetig differenzierbarwegen Zusatz 6.18.

v = c′(0) = (Ψ ◦ c)′(0) = Ψ′(c(0)︸︷︷︸x0

) · c′(0) ,

also v ∈ Bild(Ψ′(x0)

)und damit TpM ⊂ Bild

(Ψ′(x0)

).

Umgekehrt sei v ∈ Bild(Ψ′(x0)), sagen wir v = Ψ′(x0) ·w mit w ∈ Rn. Wir definieren dann c(t) :=x0 + tw. Fur ein kleines ε > 0 gilt c

((−ε, ε)

)⊂ W . Fur |t| < ε gilt c(t) := Ψ

(c(t))∈ Ψ(W ) ⊂ M .

42Begrundung: Es ist keine (n + 1)-dimensionale Untermannigfaltigkeit, da es nicht offen in Rn+1 ist. Es ist

keine 0-dimensionale Untermannigfaltigkeit, da es keine diskrete Teilmenge ist. Somit ist die Aussage im Fall n = 0gezeigt. Fur n > 0 kann man auch alle anderen Dimensionen ausschließen (etwas Arbeit!). Fur unser Beispiel reicht

es aber, den Fall n = 0 zu betrachten.

7. EXTREMA MIT NEBENBEDINGUNGEN 251

Die Kurve c ist in C1 und c(0) = p, c′(0) = Ψ′(x0

)· w = v. Somit ist v ∈ TpM . Insgesamt also

Bild(Ψ′(x0)

)⊂ TpM .

Zu (b): Sei wieder i : Rn → Rk die Inklusions-Abbildung x 7→ (x, 0). Nach Bemerkung 6.28 istΨ := ϕ−1 ◦ i eine lokale Parametrisierung. Sei ϕ(p) = (x0, 0), x0 ∈ Rn. Also haben wir

TpM(a)= Ψ′(x0) · Rn = (ϕ−1)′(i(x0)︸︷︷︸

=ϕ(p)

) · i′(x0) · Rn︸︷︷︸=Rn×{0}

=(ϕ′(p)

)−1

·(Rn × {0}

).

Ein alternativer Beweis von (b) wird durch Lemma 6.20 geliefert.

Zu (c): Sei Ψ : W → Rk eine lokale Parametrisierung mit p ∈ Ψ(W ), W0 := Ψ−1(U), p = Ψ(x0).Also ist F ◦ Ψ|W0

konstant 0, also 0 = F ′(p) · Ψ(x0). Somit haben wir TpM = Bild(Ψ′(x0)

)⊂

ker(F ′(p)). Da F ′(p) Rang k−n hat, besagt der Rangsatz, dass n = dim ker(F ′(p)) = dim Bild(Ψ′(x0)

).

Es folgt TpM = ker(F ′(p)).

Beispiele 6.32.

(1) Sei M eine nichtleere offene Teilmenge von Rk. Dann ist M eine k-dimensionale C∞-Untermannigfaltigkeit von Rk: wahle U = V = M und ϕ := IdM als Untermannigfaltig-keitskarte. Aus Proposition 6.31 folgt, ∀p ∈M :

TpM = Rk.

(2) Sei M := Mf wie in den Beispielen 6.5. Dann ist Ψ: U −→ Rk, x 7−→ (x, f(x))T eineglobale C1-Parametrisierung von Mf nach den Beispielen 6.27. Nach Proposition 6.31 giltdann, fur p = (p, f(p))T ∈Mf :

TpM = Ψ′(p)(Rn) = {(v, f ′(p) · v)T | v ∈ Rn}= Graph(f ′(p))(= Mf ′(p)).

(3) Sei M := Sn ⊂ Rn+1. Sei F : Rn+1 −→ R, x 7−→ ‖x‖22 − 1. Dann ist 0 ∈ R regularerWert von F mit F−1({0}) = Sn. Aus Proposition 6.31 folgt, fur jedes p ∈ Sn: TpM =ker(F ′(p)), mit F ′(p) = 2pT , d.h.,

TpM = {v ∈ Rn+1 | pT v = 0}= {v ∈ Rn+1 | 〈p, v〉 = 0}= p⊥ (= Orthogonales Komplement von p).

Mi 3.7.

7. Extrema mit Nebenbedingungen

Definition 7.1. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit von Rk und U ⊂ Rk eineoffene Teilmenge von Rk mit M ⊂ U . Sei f : U −→ R eine Funktion.


(a) Ist f differenzierbar in p ∈ M ⊂ U , so heißt p stationarer (oder kritischer) Punkt vonf|M : M −→ R, wenn f ′(p)|TpM = 0 gilt.43

(b) Ein Punkt p ∈ M heißt lokales Maximum (bzw. Minimum) von f |M : M −→ R, wenneine offene Umgebung V von p in M so existiert, dass f(p) ≥ f(q) (bzw. f(p) ≤ f(q)) furalle q ∈ V gilt.

(c) Ein Punkt p ∈M heißt lokales Extremum von f|M : M −→ R, wenn p ein lokales Minimumoder ein lokales Maximum von f |M ist.

Wie findet man lokale Extrema? Wir fuhren zwei Moglichkeiten auf:

• Wahle eine Parametrisierung Ψ : W → Rk der Untermannigfaltigkeit. Wir wissen bereits,wie man lokale Extrema von f ◦Ψ : W → R findet. Und x ist lokales Extremum von f ◦Ψgenau dann, wenn Ψ(x) lokales Extremum von f |M ist. Insbesondere folgt fur p = Ψ(x)aus der Kettenregel

x ist station. Punkt von f ◦Ψ ⇐⇒ f ′(p) ·Ψ′(x) = 0 ⇐⇒ f ′(p)|TpM = 0.

Diese Methode sollten Sie nun also durch Kombination bereits behandelter Technikenbeherrschen.

• Durch Lagrange-Multiplikatoren: siehe unten.

PROPOSITION 7.2. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit, U ⊂ Rk eine offeneUmgebung von M und f : U −→ R differenzierbar. Ist p ∈ M lokales Extremum von f|M , so ist pein stationarer Punkt von f|M .

Beweis. Sei v ∈ TpM . Dann existieren ε > 0 und eine C1-Abbildung c : (−ε, ε) −→ Rk mitc((−ε, ε)) ⊂ M , c(0) = p und c′(0) = v. Die Abbildung f ◦ c : (−ε, ε) −→ R ist dann C1 mitf ◦ c(0) = f(p). Da p ein lokales Extremum von f|M ist, ist 0 ∈ (−ε, ε) ebenfalls ein lokalesExtremum von f ◦ c. Daraus folgt (f ◦ c)′(0) = 0, d.h., mit der Kettenregel, f ′(p) · v = 0. Damitbekommen wir f ′(p)|TpM = 0, was zu beweisen war.

SATZ 7.3 (Satz uber Lagrange-Multiplikatoren). Sei M ⊂ Rk eine n-dimensionale Unterman-nigfaltigkeit, U ⊂ Rk eine offene Umgebung von M und f : U −→ R differenzierbar. Sei p ∈ Mein stationarer Punkt (z.B. ein lokales Extremum) von f|M und F : V −→ Rk−n eine in einer

offenen Umgebung V von p in Rk definierte C1-Abbildung mit 0 ∈ Rk−n als regularem Wert undF−1({0}) = V ∩M . Schreibe F (x) = (F1(x), . . . , Fk−n(x)) ∀x ∈ V . Dann gibt es eindeutige reelleZahlen λ1, . . . , λk−n mit

f ′(p) =

k−n∑j=1

λjF′j(p).

Diese Zahlen λ1, . . . , λk−n heißen Lagrange-Multiplikatoren von f unter den NebenbedingungenF1, . . . , Fk−n an der Stelle p.

43Mit f ′(p)|TpM ist hier die lineare Abildung Rk ⊂ TpM 3 x 7→ f ′(p) · x ∈ R gemeint.

7. EXTREMA MIT NEBENBEDINGUNGEN 253

ZUSATZ 7.4. Umgekehrt gilt: existieren solche Lagrange-Multiplikatoren, dann ist p ein stati-onarer Punkt von f |M .

Die Lagrange-Multiplikatoren sind nach dem Mathematiker und Physiker Joseph-Luis Lagrangebenannt, der insbesondere die Lagrangesche Formulierung der klassischen Mechanik in der Physkvorangetrieben hat. Es ist aber auch ein wichtiges Hifsmittel zum Beispiel in den Wirtschafts-wissenschaften, wenn man eine Optimierung unter gegebenen nicht-linearen Zwangsbedingungendurchfuhren will.

Beweis des Korollars. Nach Voraussetzung gilt f ′(p)|TpM = 0 (im Fall, wo p ∈ M ein lokales

Extremum von f|M ist, folgt dies aus Proposition 7.2). Nach Proposition 6.31 gilt aber

TpM = ker(F ′(p)) mitF ′(p) =

F ′1(p)...

F ′k−n(p)

=

k−n⋂j=1

ker(F ′j(p)).

Mitker(F ′j(p)) = {v ∈ Rk |F ′j(p) · v = 0} = {v ∈ Rk | 〈F ′j(p)T , v〉 = 0}

= (F ′j(p)T )⊥

folgt TpM =k−n⋂j=1

(F ′j(p)T )⊥ = Span{F ′1(p)T , . . . , F ′k−n(p)T }⊥ (siehe LA II). Die Bedingung f ′(p)|TpM =

0 ist zu 〈f ′(p)T , v〉 = 0 ∀v ∈ TpM aquivalent, d.h. zu f ′(p)T ∈ (TpM)⊥ ⊂ Rk. Insgesamt folgt

(7.5) f ′(p)T ∈ (Span{F ′1(p)T , . . . , F ′k−n(p)T }⊥)⊥ = Span{F ′1(p)T , . . . , F ′k−n(p)T },

d.h., ∃λ1, . . . , λk−n ∈ R mit f ′(p)T =k−n∑j=1

λjF′j(p)

T , d.h., f ′(p) =k−n∑j=1

λjF′j(p). Da F ′j(p), . . . , F

′k−n(p)

linear unabhangig sind, sind λ1, . . . , λk−n eindeutig mit dieser Eigenschaft.

Der Zusatz folgt, indem wir die obigen Argmente umkehren: Wenn Lagrange-Multiplikatoren exis-tieren, dann gilt (7.5) und somit f ′(p)T ∈ (TpM)⊥. Dann verschwindet v 7→ f ′(p) · v auf TpM .

https://de.wikipedia.org/wiki/Joseph-Louis_Lagrange

KAPITEL 10

Gewohnliche Differentialgleichungen

Literatur zu diesem Kapitel.

• [15], Kapitel 2 (gut zu lesen)• [7], Kapitel 14 (Rolle des Banachschen Fixpunktsatzes klarer)• [11] (umfassender, tiefer gehend)• [23]Mehr zu Stabilitat• [35]noch mehr zu Stabilitat, deutlich ausfuhrlicher und umfassender als [23], sehr gut

lesbar.• [27]• [4]

1. Motivation

Wir motivieren an Hand eines ebenen Pendels aus der Physik. Es gibt auch viele Systeme in anderenWissenschaften (Chemie, Biologie, Medizin, Wirtschaftswissenschaften,...), die durch gewohnlicheDifferentialgleichungen modelliert werden.

Bild eines Pendels mit eingezeichneten Kraften, siehe Vorlesung.

ϕ : R→ R

(1.1) ϕ′′(t) = −g`

sin(ϕ(t))

wobei g = 9, 81N/kg die Gravitationskonstante, ` die Pendellange und ϕ der Auslenkungswinkelist.

Wichtige physikalische Fragen:

• Beschreibt dieses Modell die physikalische Situation? (Problematisch: Reibung, Drehener-gie des Korpers, Masse des Stabes, Storeinflusse, ...)• Wie genau sind die Ausgangswerte ϕ(0), ϕ′(0) und die Parameter g, `,...?

255

256 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN

Dies ist nicht das Thema der Vorlesung!

Wichtige mathematische Fragen:

• Gibt es Funktionen ϕ : R → R, die (1.1) losen? (Wenn nicht, dann ist dies sicher keingutes Modell!) Wir werden sehen: es gibt Losungen!• Wenn ja, wieviele Losungen gibt es? Wir werden sehen: zu gegebenem ϕ(0) und ϕ′(0)

gibt es genau eine Losungsfunktion. Die Gleichung (1.1) hat also einen zwei-dimensionalenLosungsraum.1

• Gibt es Losungen ϕ : (a, b)→ R, die sich nicht zu Losungen auf ganz R fortsetzen lassen?Wir werden sehen:

”Nein“ fur diese Gleichung, aber bei vielen physikalischen Systemen

”Ja“.

• Sind alle Losungen periodisch? Man kann zeigen: viele, aber nicht alle. 2

• Kann man die Losungen explizit angeben? Antwort: Es geht noch mit großem Aufwand.Man braucht

”elliptische Integrale“, siehe http://en.wikipedia.org/wiki/Pendulum_

(mathematics). Bei komplizierteren physikalischen Systemen nahezu unmoglich.• Wie lang ist die Periodenlange von periodischen Losungen? Antwort: Als Potenzreihe

angebbar. Bei komplizierteren Gleichungen nicht explizit berechenbar.• Hangt sie von der maximalen Auslenkung ab? Antwort: Die Periodenlange wird langer,

wenn die maximale Auslenkung langer wird.• Erhaltungsgroßen? Antwort: Energieerhaltung, Drehimpulserhaltung (beim raumlichen

Pendel),. . .

Ziel: Moglichst großes systematisches Verstandnis solcher Gleichungen. Beschreibung des qualita-tiven Verhaltens, falls die Losungen nicht explizit zu finden sind.

Oft hilfreich: Linearisierte Gleichung. Ersetze nicht-lineare Terme durch das Taylorpolynom erstenGrades. Im Pendel-Beispiel: ersetze

sinϕ =

∞∑j=0

(−1)j

(2j + 1)!ϕ2j+1 = 0 + ϕ+ 0 · ϕ2 − 1

6ϕ3 + · · ·

durch ϕ. Wir erhalten

ϕ′′(t) = −g`ϕ(t)

1Den Begriff”zwei-dimensional“ haben wir hier noch gar nicht sauber definiert. Der Losungsraum ist eine

zwei-dimensionale Untermannigfaltigkeit des unendlich-dimensionalen Vektorraums C∞(R,R). Die obige Aussage

interpretieren Sie am besten so, dass der Losungsraum durch die beiden Anfangswert ϕ(0) und ϕ′(0) parametrisiertwird.

2Alle Losungen, deren Gesamtenergie unterhalb von E0 := mg` liegt, konnen keine Uberschlage (=loopings)machen, sie sind periodisch. Losungen ϕ mit Gesamt-Energie großer als E0 sind im Sinne von Funktionen ϕ :R → R nicht periodisch. Die zugehorige raumliche Bewegungskurve R → R3, t 7→ (` sinϕ(t), 0,−` cosϕ(t))T ist

aber periodisch. Ist die Gesamtenergie gleich E0, dann ist weder ϕ noch die zugehorige raumliche Bewegungskurveperiodisch. Dann gilt limt→±∞ ϕ(t) = ±π und die raumliche Bewegungskurve konvergiert in beide Richtungen gegen

(0, 0,−`)T .

http://en.wikipedia.org/wiki/Pendulum_(mathematics)

http://en.wikipedia.org/wiki/Pendulum_(mathematics)

2. DEFINITION UND REDUKTION AUF AUTONOME GLEICHUNGEN ERSTER ORDNUNG 257

Viel leichter zu losen:

ϕ(t) = a cos

(√g

`t

)+ b sin

(√g

`t

)Beschreiben die Losungen der vereinfachten Gleichung auch hinreichend gut die Losungen derursprunglichen Gleichung?

2. Definition und Reduktion auf autonome Gleichungen erster Ordnung

Definition 2.1. Seien m,n, k ∈ N. Gegeben sei

U ⊂ R× (Rn)k+1 = R× Rn × · · · × Rn︸︷︷︸k+1-mal

und eine Funktion F : U → Rm. Wir sagen ϕ : (a, b) → Rn, a, b ∈ R, a < b eine Losung derdurch F gegebenen gewohnlichen Differentialgleichung, falls gilt:

(1) ϕ ist k-mal differenzierbar(2) (t, ϕ(t), ϕ′(t), . . . , ϕ(k)(t)) ∈ U fur alle t ∈ (a, b)(3) Fur alle t ∈ (a, b) gilt

(2.2) F (t, ϕ(t), ϕ′(t), . . . , ϕ(k)(t)) = 0.

Man nennt (a, b) das Losungsintervall der Losung. Eine Gleichung der Form (2.2) nennt man einegewohnliche Differentialgleichung von Ordnung ≤ k.3 Wir nennen F die definierende Funktion dergewohnlichen Differentialgleichung. Wir sagen, die gewohnliche Differentialgleichung ist autonom,falls die definierende Gleichung nicht von t abhangt. Wir schreiben dann oft

F (ϕ(t), ϕ′(t), . . . , ϕ(k)(t)) = 0,

d.h. F : U → Rm, U ⊂ (Rn)k+1.

Beispiele 2.3.

(1) Pendel: m = n = 1, k = 2, U = R4,

F (t, ϕ0, ϕ1, ϕ2) = ϕ2 +g

`sinϕ0

(2) Linearisiertes Pendel: wie oben aber

F (t, ϕ0, ϕ1, ϕ2) = ϕ2 +g

`ϕ0

(3) m = n = k = 1, U = R3. Sei a ∈ RF (t, ϕ0, ϕ1) = ϕ1 − aϕ0

Wir erhalten die Differentialgleichung

ϕ′(t) = aϕ(t).

3Man sagt, die Ordnung ist gleich k, falls F tatsachlich von ϕ(k) abhangt.


Dann ist ϕ(t) = eat eine Losung.(4) Sei g : (a, b)→ R. Wir definieren

F (t, ϕ0, ϕ1) = ϕ1 − g(t).

Dann ist G eine Losung von

F (t, G(t), G′(t)) = 0,

genau dann, wenn G eine Stammfunktion zu g ist.(5) Sei f : R2 → R. Fur

F (t, ϕ0, ϕ1) = ϕ1 − f(t, ϕ0).

haben wir die Differentialgleichung

(2.4) ϕ′(t) = f(t, ϕ(t)).

Die ersten drei Beispiele sind autonom, die letzten beiden nicht.

Bemerkungen 2.5. Wichtig sind auch Differentialgleichungen, in denen Funktionen in mehrerenVeranderlichen gesucht werden, so dass die definierende Funktion von partiellen Ableitungen inmehreren Veranderlichen abhangt. Solche Differentialgleichungen nennt man partielle Differenti-algleichung. Genauer gesagt: eine partielle Differentialgleichung ist eine Differentialgleichung, diekeine gewohnliche Differentialgleichung ist.

Zum Beispiel sei V offen in R` und ϕ : V → Rn. Wir definieren den Laplace-Operator ∆ :C2(V,Rn)→ C0(V,Rn)

∆ϕ :=∑i=1

∂2

∂x2`

ϕ

Dann ist ∆ϕ = 0 eine partielle Differentialgleichung, die in vielen Bereichen der Anwendungen(Physik, Chemie, Biologie, Finanzmathematik,. . . ) sehr wichtig ist.

Wir behandeln in dieser Vorlesung nur gewohnliche Differentialgleichungen. Die Losungstheoriepartieller Differentialgleichungen wird in fortgeschritteneren Vorlesungen behandelt.

Bemerkung 2.6.

(1) Man kann jede gewohnliche Differentialgleichung von k-ter Ordnung in eine Differenti-algleichung erster Ordnung uberfuhren. Hierzu definieren wir fur ϕ : (a, b) → Rn dieFunktionen ψi(t) := ϕ(i)(t) und fassen diese Funktionen zu Ψ : (a, b) → (Rn)k alsΨ(t) := (ψ0(t), ψ1(t), . . . , ψk−1(t)) zusammen. Wir haben genau dann eine Losung vonGleichung (2.2), falls wir eine Losung von

0 = F (t, ψ0(t), ψ1(t), . . . , ψk−1(t), ψ′k−1(t))

0 = ψ′0(t)− ψ1(t)

... =...

0 = ψ′k−2(t)− ψk−1(t)

2. DEFINITION UND REDUKTION AUF AUTONOME GLEICHUNGEN ERSTER ORDNUNG 259

haben. Wir konnen nun die gesamte rechte Seite in der Form F (t,Ψ(t),Ψ′(t)) schreiben,

wobei F : U → Rm × (Rn)k−1 fur eine geeignete Teilmenge U von R× (Rn)k × (Rn)k.

F (t,Ψ(t),Ψ′(t)) =

F (t, ψ0(t), ψ1(t), . . . , ψk−1(t), ψ′k−1(t))ψ′0(t)− ψ1(t)

...ψ′k−2(t)− ψk−1(t)

∈ Rm+(k−1)n.

Wir haben eine gewohnliche Differentialgleichung von k-ter Ordnung fur ϕ : (a, b) →Rn durch eine gewohnliche Differentialgleichung erster Ordnung fur Ψ : (a, b) → Rnkausgedruckt.

Im Beispiel des Pendels fuhren wir also eine Funktion ρ : (a, b) → R ein,4 die ϕ′

reprasentieren soll, und losen das System

0 = ρ′(t) +g

`sinϕ(t)

0 = ϕ′(t)− ρ(t)

Wir definieren dann

F (t,

(ϕρ

),

(ϕρ

)) =

(ρ+ g

` sinϕϕ− ρ

)∈ R2.

Die dadurch definierte gewohnliche Differentialgleichung ist

0 = F (t,

(ϕ(t)ρ(t)

),

(ϕ(t)ρ′(t)

)) =

(ρ′(t) + g

` sinϕ(t)ϕ′(t)− ρ(t)

)∈ R2.

Dies ist eine autonome gewohnliche Differentialgleichung erster Ordnung.(2) Man kann jede gewohnliche Differentialgleichung in eine autonome Differentialgleichung

uberfuhren. Hierzu fuhren wir eine neue Funktion τ(t), die τ ′(t) = 1 und τ(t0) = t0erfullt. Es gilt dann also τ(t) = t. Wir setzen nun Ψ(t) := (τ(t), ϕ(t)), Ψ : (a, b)→ Rn+1

setzen und dann die definierenden Funktion F : U → Rm durch eine weitere Komponente

τ ′(t) = 1 zu einer Funktion F : U → Rm+1 erganzen.5

Wir betrachten dazu Beispiel 2.3 (5). Wir uberfuhren die bisherige gewohnliche Dif-ferentialgleichung fur ϕ(t) in eine fur Ψ(t) = (τ(t), ϕ(t)). Dazu definieren wir

F

((τ0u0

),

(τ1u1

))=

(τ1 − 1

u1 − f(τ0, u0).

)Diese Funktion definiert die autonome gewohnliche Differentialgleichung

(2.7)

{τ ′(t) = 1

u′(t) = f(τ(t), u(t))

4Also ψ0(t) = ϕ(t), ψ1(t) = ρ(t) in der Notation von oben.5Der Definitionsbereich von F andert sich nicht, aber die Interpretation der t-Variable.


Ist u eine Losung von (2.4), dann istΨ(t) := (t, u(t)) eine Losung von (2.7). Ist umgekehrtΨ(t) = (τ(t), u(t)) eine Losung von (2.7). Dann folgt τ(t) = t + t0 fur eine Konstantet0 ∈ R. Wir setzen dann u(t) := u(t− t0). Dann gilt

u′(t) = u′(t− t0) = f(t, u(t− t0)) = f(t, u(t)).

Also ist u eine Losung von (2.4).Fr 5.7.

3. Flusslinien und Erhaltungsgroßen

Wir haben diskutiert:

• Jede gewohnliche Differentialgleichung kann auf eine Differentialgleichung erster Ordnungreduziert werden• Jede gewohnliche Differentialgleichung kann auf eine autonome Differentialgleichung (der

gleichen Ordnung) reduziert werden

Viele (gewohnliche)6 Differentialgleichungen haben keine Losung oder konnen nur schwer gelostwerden. Zum Beispiel hat

(ϕ(t)2 + (ϕ′(t)− 1)2 = 0

keine Losung ϕ : (a, b)→ R.

In guten Situationen hingegen kann man Differentialgleichungen erster Ordnung nach ϕ′(t) auflosen,und dann sind die Gleichungen besser zu behandeln:

ϕ′(t) = f(t, ϕ(t))

oderϕ′(t) = f(ϕ).

Man nennt dies eine explizite gewohnliche Differentialgleichung .

Definition 3.1. Sei U offen in Rn. Ein (glattes) Vektorfeld ist eine (glatte) Abbildung f : U → Rn.

Vorstellung: Im Punkt x beginnt der Pfeil, der durch f(x) beschrieben wird.

Bild eines Vektorfelds, symbolisiert duruch viele Pfeile in R2.

Definition 3.2. Eine Flusslinie oder Integralkurve des Vektorfeldes f : U → Rn ist eine Losungvon

ϕ′(t) = f(ϕ(t)).

autonome explizite gew. Diff’glng auf U = Vektorfeld auf U .

6Wir lassen das Wort”gewohnlich“ nun oft weg, da alle Differentialgleichungen in der Vorlesung gewohlich

sind.

3. FLUSSLINIEN UND ERHALTUNGSGROSSEN 261

Definition 3.3. Eine Erhaltungsgroße oder ein erstes Integral zum Vektorfeld f ist eine FunktionE : U → R, so dass t 7→ E(ϕ(t)) entlang jeder Flusslinie von f konstant ist.

Schreibweise: schreibe auch ddth fur die Ableitung von h nach t.

Beispiel 3.4 (Pendel). Wir betrachten die Gleichung

(3.5) ϕ′′(t) = − sinϕ(t).

Wir formen in eine Differentialgleichung erster Ordnung um, indem wir ρ(t) = ϕ′(t) setzen, Ψ(t) =(ϕ(t), ρ(t))T ∈ R2. (

ϕ(t)ρ(t)

)′=

((ρ(t)

− sinϕ(t)

))Losung sind Flusslinien von f(ϕ, ρ) = (ρ,− sinϕ)T . Ist Ψ(t) = (ϕ(t), ρ(t))T eine Flusslinie von f ,so ist ϕ(t) eine Losung von (3.5).

Multipliziere (3.5) mit ϕ′(t),

1

2

d

dt((ϕ′(t))2) = ϕ′(t)ϕ′′(t) = −ϕ′(t) sin(ϕ(t)) =

d

dt(cosϕ(t))

Wir definieren E : R2 → R, E(ϕ, ρ) = 12ρ

2 − cosϕ. Dann ist

d

dt(E((ϕ(t), ρ(t))T )) =

1

2

((ϕ′(t))2 − cosϕ(t)

)′= 0.

Also ist E eine Erhaltungsgroße.

Die Hohenlinien der Funktion (ϕ, ρ) 7→ E(ϕ, ρ). Zusammenhangskomponenten einer Hohenlinie(ohne stationare Punkte) bilden die Orbits, das heißt die Kurven, entlang derer sich die Losung

bewegt. Siehe”Phase diagram“ auf der Webseite

http://physique.unice.fr/sem6/2011-2012/PagesWeb/PT/Pendule/En/study1_simple.html

UBUNG 3.6 (Nutzt den Satz von Picard-Lindelof, siehe unten). Sei f : U → Rn ein stetig differen-zierbares Vektorfeld. Sei E : U → R differenzierbar. Dann ist E genau dann eine Erhaltungsgroßevon f , wenn 7

f(x) ∈ kerE′(x)

fur alle x ∈ U .

Losung: Zentralubung

Beweis. Es gelte f(x) ∈ kerE′(x) fur alle x ∈ U . Sei ϕ : (a, b) → U eine Flusslinie von f , danngilt

(E ◦ ϕ)′(t) = E′(ϕ(t)) · ϕ′(t) = E′(ϕ(t)) · f(ϕ(t)) = 0.

Also ist E eine Erhaltungsgroße.

7Hier wird E′(x) als lineare Abbildung Rn → R betrachtet. Wenn wir E′(x) als Zeilenvektor betrachten, heißt

die analoge Aussage (E′(x))T ⊥ f(x) oder aquivalent E′(x) · f(x) = 0.

http://physique.unice.fr/sem6/2011-2012/PagesWeb/PT/Pendule/En/study1_simple.html


Umgekehrt sei E eine Erhaltungsgroße. Da f stetig differenzierbar ist, ist f Orts-Lipschitz-stetig.Zu jedem x0 ∈ U existiert also nach dem Satz von Picard-Lindelof ein ε > 0 und eine Flusslinieϕ : (−ε, ε)→ U von f mit ϕ(0) = x0. Da E ◦ ϕ konstant ist, rechnen wird

0 = (E ◦ ϕ)′(0) = E′(ϕ(0)) · ϕ′(0) = E′(x0) · f(x0).

Somit gilt f(x0) ∈ kerE′(x0) fur alle x0 ∈ U .

UBUNG 3.7 (Nutzt den Satz von Picard-Lindelof, siehe unten). Sei M eine Untermannigfaltigkeitvon Rn, M ⊂ U , U offen in Rn und sei M abgeschlossen in Rn. Sei f : U → Rn ein Lipschitz-stetigesVektorfeld. Ist f tangential an M (d.h. es gelte f(p) ∈ TpM fur alle p ∈M) und ist c : (a, b)→ Rneine Integralkurve von f mit a < t0 < b und c(t0) ∈M , so ist c(t) ∈M fur alle t ∈ (a, b).

Losung: Zentralubung

Bemerkung 3.8. Im allgemeinen ist es sehr schwer, eine oder mehrere Erhaltungsgroßen zu er-halten. In der Lagrange-Mechanik der klassischen Physik liefert das Noethersche Theorem zu jederSymmetrie eines mechanischen Systems eine Erhaltungsgroße. Typische Erhaltungsgroßen in derPhysik sind Energie, Komponenten des Impulsvektors, Komponenten des Drehimplusvektors, etc..

Wenn Erhaltungsgroßen E1, . . . , E` existieren, dann bilden diese eine erhaltene Abbildung E =(E1, . . . , E`) : U → R`. Jede Flussline ϕ : I → U mit E(ϕ(t0)) = E0, t0 ∈ I erfullt dann alsoϕ(I) ⊂ E−1({E0}). Ist E0 ein regularer Wert von E, dann bewegt sich die Flusslinie entlang der(n − `)-dimensionalen Untermannigfaltigkeit M := E−1({E0}). Durch Verwendung einer lokalenParametrisierung Ψ : W →M kann man die durch f gegebene gewohnliche Differentialgleichung ineine autonome gewohnliche Differentialgleichung erster Ordnung auf W umwandeln.8 Somit habenwir die Losung der Differentialgleichung lokal auf die Losung einer anderen Differentialgleichungreduziert, die oft einfacher zu losen ist, da die Dimension n− ` kleiner ist.

4. Der Satz von Picard-Lindelof

Im folgenden Abschnitt besteht die Gefahr, Intervalle (a, b) ⊂ R mit dem Paar (a; b) ∈ R2 zuverwechseln. Wir schreiben deswegen weiterhin (a, b) fur das Paar und (a; b) fur das Intervall.

Ab jetzt: Sei U offen in R× Rn, f : U → Rn.

Elemente in R× Rn 3 (t, x), t ∈ R Zeit, x ∈ Rn Ort.

Definition 4.1. Sei f wie oben. Wir sagen f ist Orts-Lipschitz-stetig , falls es ein L ∈ R gibt, sodass fur alle (t, x), (t, y) ∈ U gilt:

‖f(t, x)− f(t, y)‖ ≤ L‖x− y‖.

Wir sagen auch f ist Orts-Lipschitz-stetig mit Lipschitz-Konstante L.

8Genauer: Man definiert ein Vektorfeld f : W → Rn−` so, dass Ψ′(p)f(p) = f(Ψ(p)) fur alle p ∈ W . Dannist

ϕ : I →W eine Flusslinie von f , wenn ϕ := Ψ ◦ ϕ eine Flusslinie von f ist.

4. DER SATZ VON PICARD-LINDELOF 263

Wir sagen f ist lokal Orts-Lipschitz-stetig , falls jedes (t, x) ∈ U eine offene Umgebung V in Ubesitzt, so dass f |V Orts-Lipschitz-stetig ist.

9

Beispiele 4.2.

(1) Sei f : U → Rn Lipschitz-stetig, das heißt, es gebe ein L ∈ R, so dass fur alle (t, x), (s, y) ∈U :

‖f(t, x)− f(s, x)‖ ≤ L√|t− s|2 + ‖x− y‖2.

Dann ist f Orts-Lipschitz-stetig. Insbesondere ist jede lineare Funktion (Orts-)Lipschitz-stetig.

(2) f : R × R → R, f(t, x) = 3√t ist Orts-Lipschitz-stetig und stetig, aber nicht Lipschitz-

stetig.(3) Lipschitz-stetige Funktionen sind stetig, aber es gibt nicht-stetige Orts-Lipschitz-stetige

Funktionen(4) Schreibe (t, x) = (t, x1, . . . , xn). Angenommen die partiellen Ableitungen

∂

∂x1f, . . . ,

∂

∂xnf : U → Rn

existieren und sind stetig (als Funktionen U → Rn). Sei Bε(t0, x0) ∈ U . Wir definieren

C := maxi=1,...,n

max(s,y)∈Bε(t0,x0)

∥∥∥∥ ∂

∂xif(s, y)

∥∥∥∥∞<∞.

Das hintere Maximum wird angenommen (und ist deswegen endlich), da Bε(t0, x0) kom-pakt ist. Schreibe f(t, x) = (f1(t, x), . . . , fn(t, x)). Dann gilt nach dem Mittelwertsatz

fj(s, y)− fj(s, z) =

n∑i=1

(yi − zi)∂fj∂xi

(s, wj)

fur ein wj auf der Strecke von y nach z. Also

|fj(s, y)− fj(s, z)| ≤ ‖y − z‖∞nC,falls (s, y), (s, z) ∈ Bε(t0, x0). Bezuglich der Norm ‖ · ‖∞ ist f |Bε(t0,x0) also Orts-Lipschitz-stetig. Es folgt, dass f lokal Orts-Lipschitz-stetig ist.

SATZ 4.3 (Satz von Picard-Lindelof). Seien U ⊂ R×Rn offen, f : U → Rn lokal 10 Orts-Lipschitz-stetig und stetig. Sei (t0, x0) ∈ U . Dann gibt es ein ε0 ∈ R>0, so dass es fur jedes ε ∈ (0; ε0] genaueine stetig differenzierbare Abbildung ϕ : (t0 − ε; t0 + ε)→ Rn gibt mit:

• ϕ(t0) = x0 (Anfangswert)• fur alle t ∈ (t0 − ε; t0 + ε) gelte (t, ϕ(t)) ∈ U

9Die Eigenschaften Orts-Lipschitz-stetig und lokal Orts-Lipschitz-stetig sind unabhangig von der gewahltenNorm auf Rn. Die moglichen Konstanten L hangen aber von der Wahl der Norm ab.

10Die Aussage ist naturlich auch noch immer richtig, wenn wir das Wort”lokal“ weglassen.


• und fur alle t ∈ (t0 − ε; t0 + ε) gelte

(4.4) ϕ′(t) = f(t, ϕ(t)).

Beweis. Im folgenden sei

B∞δ (x0) := {x ∈ Rn | ‖x− x0‖∞ < δ}.

Wir wahlen δ > 0, so dass V := (t0 − δ; t0 + δ) × B∞δ (x0) ⊂ V := [t0 − δ; t + δ] × B∞δ (x0) ⊂ U .Wenn wir δ > 0 genugend klein wahlen, dann ist f |V Orts-Lipschitz-stetig, und sei L ∈ R hierzueine Lipschitz-Konstante. Da f stetig ist, ist f beschrankt auf der kompakten Menge V .

ε ∈ (0; δ) wird spater festgelegt.

Notation: I = (t0 − ε; t0 + ε),

Sei E := Cb(I,Rn) der Vektorraum der beschrankten stetigen Funktionen von I nach Rn. Furϕ ∈ E definiere11

|||ϕ|||∞ := supt∈I‖ϕ(t)‖∞

ϕi → ϕ in (E, ||| · |||∞)(def)⇐⇒ ϕi konvergiert gleichmaßig gegen ϕ

LEMMA 4.5. (E, ||| · |||∞) ist ein Banachraum, d.h. jede Cauchy-Folge in E konvergiert.

Beweis des Lemmas. Wir wenden Korollar 2.8 aus Kapitel 7 an, wobei (Y, d) der metrische Raumzum normierten Raum (Rn, ‖ · ‖∞) ist und D = I. Wir erhalten, dass (Abb(I,Rn), dglm) vollstandigist. Wir haben E = {ϕ ∈ Abb(I,Rn) | ϕ ist beschrankt und stetig}. Wegen Satz 2.5 aus Kapitel 7ist ein gleichmaßiger Grenzwert stetiger Funktionen wiederum stetig. Da auch Beschrankheit untergleichmaßigen Limites erhalten bleibt, ist E abgeschlossen in Abb(I,Rn). Somit ist E vollstandigbzgl. dglm. Hieraus folgt, dass (E, ||| · |||∞) vollstandig ist.

Sei ϕ0 konstant x0, d.h. ϕ0(t) = x0 ∀t ∈ I. Wir definieren die folgende Teilmenge von E:

Eδ,ε := {ϕ ∈ E | ∀t ∈ (t0 − ε; t0 + ε) : ‖ϕ(t)− x0‖∞ ≤ δ} = {ϕ ∈ E | |||ϕ− ϕ0|||∞ ≤ δ}.

Man sieht leicht, dass Eδ,ε eine abgeschlossene Teilmenge von (E, ||| · |||∞) ist. Insbesondere ist Eδ,εmit der von ||| · |||∞ induzierten Metrik ein vollstandiger metrischer Raum.

Wir definieren12

A : Eδ,ε → E, A(ϕ)(t) = x0 +

∫ t

t0

f(τ, ϕ(τ)) dτ.

Die Beschranktheit von A(ϕ) folgt aus der Beschranktheit von f |V .

11Um die Norm auf Rn und die auf E genauer zu unterscheiden, schreiben wir fur letztere im Skript ||| · |||∞.12Im folgenden ist immer A(ϕ)(t) als

(A(ϕ)

)(t) zu lesen


LEMMA 4.6 (Umformulierung der Gew. Dgl. in ein Fixpunktproblem eines Integraloperators). Esgilt A(ϕ) = ϕ genau dann, wenn ϕ eine stetig differenzierbare Losung von (4.4) ist mit ϕ(t0) = x0.

Beweis des Lemmas. Es gelte A(ϕ) = ϕ. Dann gilt (inklusive Existenz der Ableitung!)

ϕ′(t) =d

dt

∫ t

t0

f(τ, ϕ(τ)) dτ = f(t, ϕ(t)).

Aus dieser Formel folgt auch die stetige Differenzierbarkeit von ϕ.

Umgekehrt: ist ϕ eine stetig differenzierbare Losung von (4.4) mit ϕ(t0) = x0, dann ist

A(ϕ)(t) = x0 +

∫ t

t0

f(τ, ϕ(τ)) dτ = x0 +

∫ t

t0

ϕ′(τ) dτ = ϕ(t).

bis hier: Fr 5.7.

ab hier: Mi 17.7.

Im folgenden seien die Lipschitz-Konstanten immer bezuglich der Norm ‖ · ‖∞ definiert.

LEMMA 4.7. Sei f |V Orts-Lipschitz-stetig mit Lipschitz-Konstante L. Dann ist die AbbildungA : Eδ,ε → E Lipschitz-stetig mit Konstante εL.

Beweis des Lemmas. Seien ϕ, ψ ∈ Eδ,ε.

A(ϕ)(t)−A(ψ)(t) =

∫ t

t0

(f(τ, ϕ(τ)

)− f

(τ, ψ(τ)

))dτ

∥∥∥A(ϕ)(t)−A(ψ)(t)∥∥∥∞≤

∫ t

t0

∥∥f(τ, ϕ(τ))− f

(τ, ψ(τ)

)∥∥∞ dτ

≤∣∣∣∣∫ t

t0

L∥∥ϕ(τ)− ψ(τ)

∥∥∞ dτ

∣∣∣∣≤ εL sup

τ∈I‖ϕ(τ)− ψ(τ)‖∞

Also

|||A(ϕ)−A(ψ)|||∞ ≤ εL|||ϕ− ψ|||∞.

LEMMA 4.8. Sei C := max{‖f(t, x)‖∞ | (t, x) ∈ V }. Wenn wir

(4.9) ε ≤ ε0 := min{ δ

2(C + δL),δ

2

}wahlen, dann gilt A(Eδ,ε) ⊂ Eδ/2,ε.


Beweis.

|||A(ϕ0)− ϕ0|||∞ ≤ supt∈I‖A(ϕ0)(t)− x0‖∞

= supt∈I

∥∥∥∥x0 +

∫ t

t0

f(τ, x0) dτ − x0

∥∥∥∥∞

= supt∈I

∣∣∣∣∫ t

t0

‖f(τ, x0)‖∞ dτ

∣∣∣∣≤ sup

t∈I|t− t0|C = εC.

Also gilt fur beliebiges ϕ ∈ Eδ,ε:|||A(ϕ)− ϕ0|||∞ ≤ |||A(ϕ)−A(ϕ0)|||∞ + |||A(ϕ0)− ϕ0|||∞

≤ εL|||ϕ− ϕ0|||∞ + εC

≤ εLδ + εC ≤ δ

2,

falls ε ≤ ε0 ≤ δ/2 wie oben gewahlt wird. Es folgt A(Eδ,ε) ⊂ Eδ/2,ε.

Aus (4.9) folgt auch εL < 1/2. Das heißt, dann ist A : Eδ,ε → Eδ,ε eine Kontraktion. Es giltϕ0 ∈ Eδ,ε 6= ∅. Nach dem Banachschen Fixpunktsatz (Satz 2.5 in Kapitel 8) besitzt also A eineneindeutigen Fixpunkt in Eδ,ε. Den Fixpunkt nennen13 wir ϕε. Insbesondere haben wir nun denExistenzteil des Theorems gezeigt.

Ist nun 0 < ε < ε, dann istϕ := (ϕε)|(t0−ε;t0+ε) ∈ Eδ,ε

eine Losung von (4.4) mit ϕ(t0) = x0 und deswegen gilt ϕε = ϕ.

Das Theorem (=der Satz von Picard-Lindelof) ist nun bewiesen, sobald wir das folgende Lemmahaben. Dann ist namlich auch die im Theorem behauptete Eindeutigkeit gezeigt.

LEMMA 4.10. Sei ρ ∈ (0; ε0] und ψ : (t0− ρ; t0 + ρ)→ Rn eine Losung von (4.4) mit ψ(t0) = x0,(t, ψ(t)) ∈ U ∀t. Dann gilt ψ ∈ Eδ,ρ.

Aus dem Lemma folgt namlich, dass ψ ein und damit der einzige Fixpunkt von A|Eδ,ρ ist.

Beweis. Wir zeigen, dass fur alle t ∈ (t0 − ρ; t0 + ρ) gilt:

‖ψ(t)− x0‖∞ < δ.

Angenommen diese Ungleichung gilt nicht fur alle solchen t. Dann ist

T :={s ∈ [0, ρ)

∣∣∣ ‖ψ(t0 + s)− x0‖∞ = δ oder ‖ψ(t0 − s)− x0‖∞ = δ}

13Wir schreiben ϕε um klar zu machen, dass wir noch nichts daruber wissen, ob es von ε abhangt. Achtung: wirhaben auch noch nicht geklart, ob die Losung von δ abhangt. Und selbst bei L konnen wir verschiedene Konstanten

wahlen, und die wahlbaren Konstanten hangen auch wieder von der Wahl von δ ab. Kurzum: ϕε konnte noch von

vielen Wahlen abhangen, und wir werden nun sehen, dass es dies eigentlich gar nicht tut.


eine nicht-leere abgeschlossene14 Teilmenge von [0, ρ).

Setze ρ := minT , und wir haben 0 < ρ < ρ ≤ ε0. Wir erhalten ‖ψ(t)−x0‖∞ < δ fur t ∈ (t0−ρ; t0+ρ)und somit ψ|(t0−ρ;t0+ρ) ∈ Eδ,ρ, also insbesondere

(4.11) ψ(t) = ϕε0(t) ∀t ∈ (t0 − ρ; t0 + ρ)

Auf Grund der Stetigkeit von ψ und ϕε0 folgt die Gultigkeit von (4.11) fur t ∈ [t0 − ρ; t0 + ρ]. Esfolgt der Widerspruch

δρ∈T= ‖ψ(t0 ± ρ)− x0‖∞ = ‖ϕε0(t0 ± ρ)− x0‖∞ ≤

δ

2.

Aus Lemma 4.10 folgt dann auch: Losungen von (4.4) mit dem selben Anfangswert stimmen aufdem Durchschnitt ihrer Definitionsbereiche uberein.15

Der Beweis des Theorems liefert noch mehr

• Ein numerisches16 Berechnungsverfahren fur die Losung. Definiere rekursiv: ϕ0(t) = x0,ϕk+1 := A(ϕk). Dann konvergiert ϕk gegen die Losung. (Ohne Beweis!)• Information daruber wie ϕ(t) vom Anfangswert x0 abhangt, siehe folgender Zusatz 4.13.

Beispiele 4.12.

(a) Ist f : U → Rn stetig differenzierbar, dann ergibt der Satz von Picard-Lindelof zu jedemAnfangswert ϕ(t0) = x0 eine Losung ϕ : I → Rn von ϕ′(t) = f(ϕ(t)). Wir werden sehen: esgibt ein maximales Intervall, auf dem die Funktion ϕ definiert werden kann.

(b) n = 1, f(t, x) = 3√t ist Orts-Lipschitz-stetig. Also erfullt ϕ′(t) = 3

√t, ϕ(t) ∈ R die Vorausset-

zungen des Satzes von Picard-Lindelof. Man kann explizit die Losung bestimmen:

ϕ(t) =3

4t4/3.

14Da s 7→ ‖ψ(t0 + s)− x0‖∞ stetig ist und {δ} abgeschlossen in R.15Die oben konstruierte Zahl ε0 hangt von der Wahl von δ ab. Die Losung ϕ ist aber im folgenden Sinn von

δ unabhangig: Sind Losungen zu zwei verschiedenen Wahlen von δ gegeben, so stimmen diese Losungen auf einer

Umgebung von t0 uberein.16

”Numerisch“ bedeutet: man bekommt keine explizite Formel fur die Losung heraus, dafur aber ein Verfahren,

das in ein Computer-Programm umsetzbar ist und das dann beliebig genaue Naherungslosungen liefert.


(c) n = 1, f(t, x) = 3√x ist nicht Orts-Lipschitz-stetig. Picard-Lindelof ist nicht anwendbar. Den-

noch gibt es Losungen. Falls ϕ(t) 6= 0:

ϕ′(t) = 3√ϕ(t)

⇐⇒ ϕ′(t)3√ϕ(t)

= 1

⇐⇒ d

dt

3

2(ϕ(t))2/3 = 1

⇐⇒ ∃c ∈ R :3

2(ϕ(t))2/3 = t+ c

⇐⇒ ∃c ∈ R : ϕ(t) = (2

3(t+ c))3/2.

Dies liefert Losungen auf (−c,∞). Nun ist

ϕ(t) =

{( 2

3 (t+ c))3/2 t > −c0 t ≤ −c

stetig differenzierbar. Zum Anfangswert ϕ(0) = 0 gibt es viele Losungen (zu jedem c ≥ 0 eine).Weitere Losungen

ϕ(t) =

{−( 2

3 (t+ c))3/2 t > −c0 t ≤ −c

.

Existenz, aber keine Eindeutigkeit!

In der Aussage des Satzes 4.3 von Picard-Lindelof lasst sich nicht ablesen, wie ε0 von x0 abhangt.Wenn man den Beweis des Satzes von Picard-Lindelof genau betrachtet, so erhalt man aber fol-gendes:

ZUSATZ 4.13 (zum Satz von Picard-Lindelof). Es sollen die Voraussetzungen von Satz 4.3 vonPicard-Lindelof gelten. Jeder Punkt (t0, x0) besitzt dann eine Umgebung W und ein ε0 > 0, so dassfur jedes (t1, x1) ∈W der Satz von Picard-Lindelof eine eindeutige Losung ϕ : (t1−ε0; t1+ε0)→ Rnmit Anfangswert ϕ(t1) = x1 liefert.

Beweis des Zusatzes (skizziert). Sei wieder f : U → Rn, (t0, y0) ∈ U wie oben. Hierzu sei δ,ε wie im Beweis des Satzes 4.3 von Picard-Lindelof konstruiert gewahlt. Sei (t1, x1) ∈ U mit‖(t1, x1) − (t0, x0)‖∞ ≤ δ/4. Wenn man den Beweis des Satzes 4.3 von Picard-Lindelof genauanschaut, so sieht man, dass die Differentialgleichung auch eine Losung ϕt1,y1 : (t1−ε0; t1+ε0)→ Rnmit ϕt1,x1

(t1) = x1 besitzt. Der Zusatz ist also richtig fur W := B∞δ/4((t0, x0)

)⊂ U .

Dasselbe ε0 kann also zu allen Startwerten in W gewahlt werden. Man beachte aber, dass wirweder hier noch im Satz von Picard-Lindelof gefordert haben, dass ε0 in irgendeinem Sinne ma-ximal gewahlt wird. Diese Abhangigkeit von den Anfangswerten wird spater in Satz 4.20) wiederaufgegriffen.Ende Mi 17.7.

Fr 19.7.


Wdh. Picard-Lindelof.

Sei U offen in R× Rn, f : U → Rn Orts-Lipschitz-stetig und stetig. Zu jedem (t0, x0) gibt es

• ε > 0 und• Eine eindeutige C1-Funktion ϕt0,x0 : (t0−ε; t0 +ε)→ Rn, so dass fur alle t ∈ (t0−ε; t0 +ε)

gilt:

(t, ϕt0,x0(t)) ∈ U und ϕ′t0,x0

(t) = f(t, ϕt0,x0(t))

Ab jetzt: Losung = Losung von ϕ′(t) = f(t, ϕ(t)).

SATZ 4.14 (Satz von Picard-Lindelof auf maximalen Intervallen). Seien U , f , t0 und x0 wie imSatz von Picard-Lindelof. Setze

tmax := sup{t > t0 | Es existiert ε > 0 und eine Losung ϕ : (t0 − ε; t)→ Rn

von (4.4) mit Anfangswert x0} ∈ (t0;∞]

tmin := inf{t < t0 | Es existiert ε > 0 und eine Losung ϕ : (t; t0 + ε)→ Rn

von (4.4) mit Anfangswert x0} ∈ [−∞; t0).

(1) Dann existiert auch eine Losung ϕmax : (tmin; tmax) → Rn mit Anfangswert ϕmax(t0) = x0.Man nennt (tmin; tmax) das maximale Losungs-Intervall.

(2) Jede Losung ϕ : I → Rn mit demselben Anfangswert erfullt I ⊂ (tmin; tmax) und ϕ = ϕmax|I .

Beweis. 1. Schritt: Sind ϕ : I → Rn und ϕ : I → Rn mit ϕ(t0) = ϕ(t0) = x0; I, I offene

Intervalle. Wir zeigen, dass ϕ und ϕ auf I ∩ I ubereinstimmen.

Wir definieren

T := {t ∈ I ∩ I | ϕ(t) = ϕ(t)}.Da h : t 7→ ϕ(t) − ϕ(t) stetig ist und da {0} abgeschlossen in R, ist T = h−1({0}) ebenfalls

abgeschlossen in I ∩ I. Wegen t0 ∈ T wissen wir T 6= ∅. Wir zeigen nun, dass T offen in I ∩ I ist.Da I ∩ I zusammenhangend ist, folgt dann T = I ∩ I und somit der erste Schritt.

Sei also t1 ∈ T . Wahle ε1 > 0 so, dass (t1 − ε1; t1 + ε1) ⊂ I ∩ I. Nach dem Satz 4.3 von Picard-Lindelof gibt es ein ε ∈ (0; ε1], so dass es genau eine Losung ϕ : J := (t1 − ε; t1 + ε) → Rn mitAnfangswert ϕ(t1) = ϕ(t1) gibt. Also

ϕ ≡ ϕ|J ≡ ϕ|J .

Somit J ⊂ T . Wir haben gesehen, dass T offen ist. Der erste Schritt ist somit beendet.

2. Schritt: Wir wollen nun die Losung ϕmax : (tmin; tmax) → Rn mit Anfangswert ϕmax(t0) = x0

definieren.

Zu t ∈ (tmin; tmax) wahlen wir eine Losung ϕ : I → Rn, I offenes Intervall, t0, t ∈ I mit ϕ(t0) = x0.Dann setzen wir ϕmax(t) = ϕ(t). Der erste Schritt garantiert, dass die Definition von ϕmax(t) nicht


davon abhangt, wie wir I und ϕ gewahlt haben. Und fur derartige ϕ gilt dann

ϕmax|I = ϕ.

Insbesondere ist nun ϕmax auf (tmin; tmax) wohldefiniert und eine stetig differenzierbare Losung.

PROPOSITION 4.15. Seien U , f , (t0, x0) wie im Satz von Picard-Lindelof. Sei ϕ eine Losungmit ϕ(t0) = x0 mit maximalem Losungs-Intervall (tmin; tmax).

Gilt tmax <∞, dann gibt es kein x∞ mit (tmax, x∞) ∈ U und

x∞ = limt→tmax

ϕ(t).

Analog fur tmin > −∞.

In anderen Worten: Wenn der Grenzwert existiert, dann ist er nicht in U .17

Beweis. Wir betrachten nur die Aussage um tmax.

Angenommen solch ein x∞ existiert. Es existiert nun ein ε > 0 und eine Umgebung V von(tmax, x∞) in R×Rn, so dass fur alle (s, y) ∈ V gilt: es gibt eine Losung ϕs,y : (s− ε; s+ ε)→ Rnmit ϕs,y(s) = y.

Es existiert nun ein δ > 0 so dass fur alle t ∈ (tmax − δ; tmax): (t, ϕ(t)) ∈ V . Wahle nun ein t1 mittmax − ε/2 < t1 < tmax, tmax − δ < t1.

Wir erhalten nun eine Losung

ϕ(t) :=

{ϕ(t) fur tmin < t ≤ t1ϕt1,ϕ(t1)(t) fur t ≥ t1

Ein passendes Bild

die auf dem Intervall [tmin; t1 + ε) definiert ist, aber t1 + ε > tmax. Dies ist ein Widerspruch.

Bemerkung. Unter den Voraussetzung von Proposition 4.15 erhalten wir mit genau den gleichenArgumenten wie im obigen Beweis sogar eine etwas starkere Aussage:

Gilt tmax <∞, dann gibt es keine Folge ti ↗ tmax, so dass

x∞ = limi→∞

ϕ(ti)

existiert und (tmax, x∞) ∈ U . Insbesondere folgt hieraus: Im Fall tmax <∞, gilt fur t0 ∈ (tmin; tmax)

U ∩ {(t, ϕ(t)) | t0 ≤ t < tmax}ist nicht kompakt.

17Es gibt ein Beispiele fur alle denkbaren Falle: tmax < ∞ und Grenzwert existiert außerhalb U . tmax < ∞und Grenzwert existiert nicht. Im Falle tmax = ∞ kann man keine Aussage machen. Ein uneigentlicher Grenzwertkann nicht existieren, außerhalb von U existieren oder in U existieren. Analog fur tmin.


Bemerkung 4.16 (Unter Nutzung des nachsten Abschnitts, der in der Vorlesung zeitlich zu vorbehandelt wurde.). Ist f stetig differenzierbar, und ϕ eine Losung von ϕ′(t) = f(t, ϕ(t)). Dannerhalten wir aus der Kettenregel ϕ ∈ C2 und

ϕ′′(t) =∂

∂tf(t, ϕ(t)) +

∂

∂xf(t, ϕ(t)) · ϕ′(t) .

Dies kann man bis zur k-ten Ableitung iterieren, falls f ∈ Ck. Wenn man nun die so erhaltenegewohnliche Differentialgleichung k-ter Ordnung studiert, erhalt man wichtige Aussagen uber dieAbleitungen von ϕ. Insbesondere: ist f ∈ Ck, dann ist ϕ ∈ Ck+1.

Frage 4.17. Hangt die Losung stetig von t0 und x0 ab?

LEMMA 4.18 (Gronwall). Sei I ein Intervall, C,L ∈ R≥0, g : I → R stetig, a ∈ I und es geltefur alle t ∈ I

g(t) ≤

{C + L

∫ tag(τ) dτ falls t ≥ a

C + L∫ atg(τ) dτ , falls t ≤ a .

Dann gilt fur alle t ∈ I:

g(t) ≤ eL |t−a| C .

Beweis. Wir betrachten zunachst t ≥ a. Sei ψ(t) := C + L∫ tag(τ) dτ , das heißt g(t) ≤ ψ(t) fur

t ∈ I mit t ≥ a. Nach dem Hauptsatz der Differenial- und Integralrechnung ist ψ diffbar mitψ′(t) = Lg(t) ≤ Lψ(t). Wir rechnen

d

dt

(ψ(t) e−L(t−a)

)= ψ′(t)︸︷︷︸

≤Lψ(t)

e−L(t−a) − Lψ(t)) e−L(t−a) ≤ 0 .

Durch Integration uber das Intervall [a, t] folgt

ψ(t) e−L(t−a) ≤ ψ(a) e−L(a−a) = C ,

und somit die Behauptung.

Der Fall t ≤ a folgt, in dem wir den bereits beweisenen Fall auf g(τ) := g(2a− τ) anwenden.

PROPOSITION 4.19 (Losungsabschatzung). Sei U ⊂ R × Rn offen und f : U → Rn Orts-Lipschitz-stetig mit Lipschitz-Konstante L und stetig. Sei I ein Intervall und a ∈ I. Seien ϕ1, ϕ2 :I → Rn Losungen von

ϕ′(t) = f(t, ϕ(t)) .

(Also insbesondere seien beide differenzierbar und fur alle t ∈ I gelte (t, ϕ1(t)) ∈ U und (t, ϕ2(t)) ∈U .) Dann gilt fur alle t ∈ I:

‖ϕ1(t)− ϕ2(t)‖∞ ≤ eL |t−a| ‖ϕ1(a)− ϕ2(a)‖∞ .


Beweis. Mit Lemma 4.6 erhalten wir

ϕ1(t)− ϕ2(t) = ϕ1(a)− ϕ2(a) +

∫ t

a

(f(τ, ϕ1(τ))− f(τ, ϕ2(τ)))︸︷︷︸≤L‖ϕ1(τ)−ϕ2(τ)‖

dτ .

Hieraus erhalten wir daraus

‖ϕ1(t)− ϕ2(t)‖∞ ≤ ‖ϕ1(a)− ϕ2(a)‖∞ + L∣∣∣∫ t

a

‖ϕ1(τ)− ϕ2(τ)‖∞ dτ∣∣∣ .

Wir wenden das Lemma von Gronwall fur g(t) := ‖ϕ1(t) − ϕ2(t)‖∞ und C := ‖ϕ1(a) − ϕ2(a)‖∞an und erhalten die Aussage.

SATZ 4.20 (Stetige Abhangigkeit von den Anfangsbedinungen). Es sollen die Voraussetzungenund Definitionen aus dem Satz 4.3 von Picard-Lindelof und dem Zusatz 4.13 gelten. Das heißt:Seien U ⊂ R × Rn offen, f : U → Rn lokal Orts-Lipschitz-stetig und stetig. Sei (t0, x0) ∈ U .Es sei eine offene Umgebung W von (t0, x0) in U und ein ε0 > 0 gegeben, so dass es zu jedemAnfangswert (t1, x1) ∈W eine Losung ϕt1,x1 : (t0 − ε0; t0 + ε0)→ Rn von

ϕ′(t) = f(t, ϕ(t))

gibt.18 Dann hangt ϕt1,x1(t) auch stetig von t1 und x1 ab. Genauer: die Funktion

Φ : (t0 − ε0; t0 + ε0)×W → Rn, (t, t1, x1) 7→ ϕt1,x1(t) = ϕt0,x1(t− t1 + t0)

ist stetig.

Beweis. Man sieht die Folgenstetigkeit der Funktion Φ ganz einfach aus der vorangehenden Pro-position.

Skizze eines alternativen Beweises.19 (Details siehe z.B. [11, Chap. 1, Sec. 5])

Man nutzt Zusatz 4.13 um ein gemeinsames Definitionsintervall fur alle (t1, x1) nahe (t0, x0) zufinden. Man definiert iterativ fur |t − t1| < ε/2 (fur das ε aus Beweis des Satzes 4.3 von Picard-Lindelof):

Φ0(t, t1, x1) := x1, Φj+1(t, t1, x1) := x1 +

∫ t

t1

f(τ,Φj(τ, t1, x1)) dτ.

Man zeigt iterativ, dass Φj stetig ist fur alle j und zeigt dann, dass Φj lokal gleichmaßig gegen Φkonvergiert. Die Stetigkeit ist nun fur |t − t1| < ε/2 gezeigt. Um es fur alle t, t1 zu zeigen wahltman Zahlen t(0), . . . , t(L) mit t(0) = t1, t(L) = t und |t(i)− t(i− 1)| < ε/2. Die Stetigkeit von Φfolgt dann aus der Verkettung von stetigen Funktionen wie folgt

Φ(t, t1, y) = Φ(t(L), t(L− 1),Φ(t(L− 1), t(L− 2),Φ(. . . ,Φ(t(1), t(0), x1) . . .).

18Dieselbe Aussage gilt zunachst fur ϕt1,x1 : (t1 − ε0; t1 + ε0) → Rn und daraus folgt obige Aussage nach

Verkleinerung von ε0 und W .19Der alternative Beweis erfordert im Beweis des Satzes von Picard-Lindelof etwas hoheren Abstraktions-

aufwand (Gleichmaßigkeit in weiteren Variablen, ist aber letztendlich effektiver gefuhrt. Der oben aufgefuhrte istanschaulicher, sobald man Picard-Lindelof als bewiesen akzeptiert.

6. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN 273

5. Picard-Lindelof fur gewohnliche Differentialgleichungen hoherer Ordnung

Wir schreiben wieder (a, b) fur das Intervall.

Aus dem Satz von Picard-Lindelof ergibt sich unmittelbar durch Nutzen der Reduktion auf Systemeerster Ordnung (Bemerkung 2.6 (1)):

SATZ 5.1. Gegeben sei eine explizite Differentialgleichung k-ter Ordnung

ϕ(k)(t) = f(t, ϕ(t), . . . , ϕk−1(t))

f : U → Rn stetig und lokal Orts-Lipschitz-stetig20, U ⊂ R×(Rn)k offen. Sei (t0, ϕ0, ϕ1, . . . , ϕk−1) ∈U , dann gibt es ein ε0 ∈ R>0, so dass es fur jedes ε ∈ (0, ε0] genau eine genau eine Losungϕ : (t0 − ε, t0 + ε)→ Rn mit ϕ(t0) = ϕ0, ϕ′(t0) = ϕ1, . . . und ϕ(k−1)(t0) = ϕk−1.

Wenn wir mit maximalen Intervallen arbeiten und Satz 4.14 anwenden, dann erhalten wir dieseVersion:

SATZ 5.2. Gegeben sei eine explizite Differentialgleichung k-ter Ordnung

ϕ(k)(t) = f(t, ϕ(t), . . . , ϕk−1(t))

f : U → Rn stetig und lokal Orts-Lipschitz-stetig21, U ⊂ R×(Rn)k offen. Sei (t0, ϕ0, ϕ1, . . . , ϕk−1) ∈U , dann gibt es genau eine auf einem maximalen Intervall definiert Losung ϕ mit ϕ(t0) = ϕ0,ϕ′(t0) = ϕ1, . . . und ϕ(k−1)(t0) = ϕk−1. Jede auf einem beliebigen Intervall definierte Losungerhalt man Restriktion aus der obigen.

6. Lineare gewohnliche Differentialgleichungen

Definition 6.1. Sei I ein offenes Intervall, n ∈ N. Gegeben seien stetige Abbildungen

A0, A1, . . . , Ak−1 : I → Rn×n

und b : I → Rn. Eine Gleichung der Form

(6.2) ϕ(k)(t) = Ak−1(t)ϕ(k−1)(t) + . . . A1(t)ϕ′(t) +A0(t)ϕ(t) + b(t)

nennt man eine explizite lineare gewohnliche Differentialgleichung k-ter Ordnung; und eine Losungist ein ϕ ∈ Ck(J,Rn), J ein offenes Intervall in I, so dass (6.2) fur alle t ∈ J gilt. Man nennt (6.2)homogen, falls b ≡ 0, sonst ist es inhomogen.

20Das heißt: Lipschitz-stetig in allen Komponenten (außer der t-Komponente), und die Lipschitz-Konstante

kann stetig in t gewahlt werden.21Das heißt: Lipschitz-stetig in allen Komponenten (außer der t-Komponente), und die Lipschitz-Konstante

kann stetig in t gewahlt werden.


Reduktion auf Ordnung 1 (Wiederholung/Spezialfall)

Schreiben wir Φ(t) =

ϕ(t)ϕ′(t)

...ϕ(k−1)(t))

∈ Rnk.

Ist ϕ eine Losung von (6.2), so erfullt das oben definierte Φ die Gleichung

(6.3) Φ′(t) =

0 11n 0 · · · 00 0 11n · · · 0...

......

0 0 0 · · · 11nA0(t) A1(t) A2(t) · · · Ak−1(t)

Φ(t) +

00...0b(t)

.

Umgekehrt: ist Φ eine Losung von (6.3), dann bilden die ersten n-Komponenten von Φ eine Losungvon (6.2). Es reicht also, sich auf Gleichungen erster Ordnung einzuschranken.

Ab jetzt k = 1, d.h.

(6.4) ϕ′(t) = A(t)ϕ(t) + b(t) kurz: ϕ′ = Aϕ+ b

Das Wort”Losung“ benutzen wir in diesem Abschnitt immer im Sinn

”stetig differenzierbare

Losung“.

Zusatzlich zu den obigen Voraussetzungen seien von nun an A und b stetig.

SATZ 6.5. Sei J 6= ∅ ein offenes Teil-Intervall von I. Eine Losung ϕ : J → Rn lasst sich zu einerauf I definierten Losung fortsetzen.

Beweis spater.

Eine Moglichkeit, diesen Satz zu zeigen, ist, geeignete Abschatzungen zu machen und dann Pro-position 4.15 zu verwenden. Siehe zum Beispiel [23], Abschnitt 4.3 und die Vorarbeiten zuvor.

Wir wollen einen anderen Weg beschreiten und werden sehen, dass wir bald den Satz ohne Rechen-aufwand zeigen konnen. Unser Weg hat auch den Vorteil, dass wir dann nicht Zusatz 4.13 nutzen,dessen Beweis nur skizziert wurde.

Da wir in den folgenden Zeilen den Satz noch nicht nutzen konnen, mussen wir alle nun folgendenAussagen so formulieren, dass wir keine Probleme erhalten, falls eine Losung nicht auf ganz Idefinierbar sein sollte. Sobald dann aber Satz 6.5 gezeigt ist, konnen wir davon ausgehen, dassdann alle Losungen zu Losungen I → Rn erweitert werden konnen.

Die zu (6.4) gehorende homogene Differentialgeleichung ist:

(6.6) ϕ′(t) = A(t)ϕ(t)

LEMMA 6.7. Sei J ein offenes Teil-Intervall von I.


(1) Sei ϕ eine auf J definierte Losungen der inhomogenen Gleichung (6.4). Dann gilt

ϕ ist eine auf J definierte Losung der homogenen Gleichung (6.6)

⇐⇒ ϕ+ ϕ ist eine auf J definierte Losung der inhomogenen Gleichung (6.4)

(2) Die auf J definierten Losungen von (6.6) bilden einen Untervektorraum von C1(J,Rn). Wirnennen ihn LJ .

Beweis. Nachrechnen.

LEMMA 6.8. Zu jedem t0 ∈ I gibt es ein ε > 0, so dass gilt: zu jedem v ∈ Rn existiert genau eineauf (t0 − ε, t0 + ε) definierte Losung ϕ von (6.4) mit ϕ(t0) = v.

Beweis. Die Funktion f(t, y) := A(t)y + b(t) ist Orts-Lipschitz-stetig. Nach dem Satz 4.3 vonPicard-Lindelof gibt es Zahlen ε > 0, ε1 > 0,. . . , εn > 0 und folgende Losungen:

• Eine C1-Funktion ϕ : (t0 − ε, t0 + ε)→ Rn mit ϕ′ = Aϕ+ b, ϕ(t0) = 0.• Fur i ∈ {1, . . . , n}: C1-Funktionen ϕi : (t0 − εi, t0 + εi)→ Rn mit ϕ′i = Aϕi, ϕi(t0) = ei.

Setze nun ε := min{ε, ε1, . . . , εn} > 0.

Zu jedem v = (v1, . . . , vn)T ∈ Rn ist

ϕ := ϕ+

n∑i=1

viϕi

eine auf (t0 − ε, t0 + ε) definierte Losung von

ϕ′ = Aϕ+ b, ϕ(t0) = v.

nach der Eindeutigkeitsaussage im Satz 4.3 von Picard-Lindelof ist dies die einzige Losung.

Insbesondere ist die Auswertungsabbildung

ιt0 : L(t0−ε,t0+ε) → Rn, ϕ 7→ ϕ(t0)

ein Isomorphismus (von Vektorraumen) und

dimL(t0−ε,t0+ε) = n.

Sind J1, J2 Intervalle mit ∅ 6= J1 ⊂ J2 ⊂ I, dann ist wegen der Eindeutigkeitsaussage im Satz 4.3von Picard-Lindelof (bzw. der daraus gefolgerten Aussage Satz 4.14 (2)) die Restriktionsabbildung

LJ2 → LJ1 , ϕ 7→ ϕ|J1injektiv.22 Also

(6.9) dimLJ2 ≤ dimLJ1 ≤ n.

Beweis von Satz 6.5. Sei ϕ : (t1, t2)→ Rn eine Losung von (6.4), (t1, t2) ⊂ I.

22Sobald der Satz gezeigt ist, steht hier uberall”=“.


Im Fall t2 ∈ I, werden wir zeigen, dass sich die Losung auf ein großeres offenes Intervall fortsetzt,das t2 enthalt. Analoges gilt fur t1 ∈ I. Wenn also (t1, t2) das maximale Losungs-Intervall ist, somuss (t1, t2) = I gelten.

Sei also t2 ∈ I. Bestimme ε > 0 und ϕ wie im Beweis des letzten Lemmas fur t0 := t2. Dann ist

ϕ|(t2−ε,t2) − ϕ|(t2−ε,t2) ∈ L(t2−ε,t2).

Wegen den obigen Uberlegungen (6.9) gilt

n = dimL(t2−ε,t2+ε) ≤ dimL(t2−ε,t2) ≤ n.Also gilt uberall

”=“ und die Restriktion L(t2−ε,t2+ε) → L(t2−ε,t2) ist surjektiv. Es gibt also ein

ψ ∈ L(t2−ε,t2+ε), mit

ψ|(t2−ε,t2) = ϕ|(t2−ε,t2) − ϕ|(t2−ε,t2).

Somit ist

ϕ(t) :=

{ϕ(t) t ∈ (t1, t2)

ϕ(t) + ψ(t) t ∈ [t2, t2 + ε)

eine stetig differenzierbare Losung von ϕ′ = Aϕ + b, die auf (t1, t2 + ε) definiert ist. Nach denAusfuhrungen zu Beginn des Beweises folgt daraus der Satz.

FOLGERUNG 6.10.

{Auf I definierte Losungen von ϕ′ = Aϕ+ b} → Rn, ϕ 7→ ϕ(t0)

ist bijektiv und dimLI = n.

FOLGERUNG 6.11. Gegeben seien ϕ1, . . . , ϕn ∈ LI , t0 ∈ I. Dann gilt

(ϕ1, . . . , ϕn) ist Basis von LI ⇐⇒ det(ϕ1(t0), . . . , ϕn(t0)) 6= 0.

Diese Determinante nennt man Wronski-Determinante. Sie ist hilfreich, um zu prufen, ob manschon alle Losungen der homogenen DGl gefunden hat.

Falls es eine Basis ist, so nennt man Φ = (ϕ1, . . . , ϕn) : I → Rn×n eine Fundamentallosung vonϕ′ = Aϕ.

Losungs-Strategie zur Losung von (6.4)1.) Bestimme die Menge aller Losungen der homogenen DGl.2.) Dann finde eine Losung der inhomogenen DGl.Mit Hilfe von Lemma 6.7 erhalten wir dann alle Losungen der inhomogenen DGl.

Wie erhalt man alle Losungen der homogenen DGl?n = 1: 23 Losungen von ϕ′ = Aϕ verschwinden entweder nie oder uberall (Eindeutigkeit in Picard-Fr 12.7.

Lindelof), o.B.d.A. sei ϕ(t) 6= 0 ∀t.

23Dies ist ein Spezialfall der Methode “getrennte Variable”, siehe Abschnitt 8.


ϕ′ = Aϕ ⇐⇒ ϕ′

ϕ= A

⇐⇒ d

dtlog |ϕ(t)| = A(t)

ϕ(t) = C exp

(∫ t

t0

A(τ) dτ

).

Alle Losungen sind von dieser Form mit C ∈ R.

n > 1: im allgemeinen haufig schwer losbar.

Spezialfall: A konstant. O.B.d.A. I = R.

Dann ist die Menge der Losungen ϕ′ = Aϕ

{t 7→ ϕ(t) = exp(At)ϕ0 | ϕ0 ∈ Rn}

Hierbei ist

exp(At) :=

∞∑j=0

1

j!Ajtj ∈ Rn×n.

Diese Reihe konvergiert absolut: wir rechnen ‖AB‖∞ ≤ n‖A‖∞‖B‖∞, ‖Aj‖∞ ≤ nj−1‖A‖j∞∥∥∥∥ 1

j!Ajtj

∥∥∥∥∞≤ 1

j!nj−1‖A‖j∞|t|j := aj

ajaj−1

=n

j‖A‖∞|t| → 0.

d

dtexp(tA) = A exp(tA) = exp(tA)A .

exp(0 ·A) = exp(0n) = 11n .

Φ(t) := exp(At) ist eine Fundamentallosung.

Wir werden dies im nachsten Abschnitt nochmals betrachten.

Wie erhalt man eine Losung der inhomogenen DGl?

PROPOSITION 6.12 (Variation der Konstanten). A ∈ C0(I,Rn×n), b ∈ C0(I,Rn), t0 ∈ I. SeiΦ : I → Rn×n eine Fundamentallosung von ϕ′(t) = A(t)ϕ(t). Dann ist

t 7→ Φ(t)

∫ t

t0

Φ(τ)−1b(τ) dτ

eine Losung von ϕ′(t) = A(t)ϕ(t) + b(t).


Beweis.

d

dt

(Φ(t)

∫ t

t0

Φ(τ)−1b(τ) dτ

)= Φ′(t)

∫ t

t0

Φ(τ)−1b(τ) dτ + Φ(t)Φ(t)−1b(t)

= A(t)Φ(t)

∫ t

t0

Φ(τ)−1b(τ) dτ + b(t)

= A(t)

(Φ(t)

∫ t

t0

Φ(τ)−1b(τ) dτ

)+ b(t)

7. Lineare gewohnliche Differentialgleichungen mit konstanten Koeffizienten

!ACHTUNG!. Dieser Abschnitt ist noch nicht in latex aufgeschrieben und es ist unklar, ob undgegebenenfalls wann dies getan wird. Bitte benutzen Sie Ihre Vorlesungsmitschrift der Vorlesungvom 12.7..

Beispiele 7.1.

(1) Phasenportrait von ϕ′(t) =

(−2 00 −1

)ϕ(t).

Losungen: ϕ(t) =

(e−2t 0

0 e−t

)ϕ0, ϕ0 ∈ R2.

Ein passendes Bild


(1 00 1

)ϕ(t).

Losungen: ϕ(t) =

(et 00 et

)ϕ0, ϕ0 ∈ R2.

Ein passendes Bild


(−2 00 1

)ϕ(t).

Losungen: ϕ(t) =

(e−2t 0

0 et

)ϕ0, ϕ0 ∈ R2.

Ein passendes Bild


(0 1−1 0

)ϕ(t).

Losungen: ϕ(t) =

(cos t sin t− sin t cos t

)ϕ0, ϕ0 ∈ R2.

Ein passendes Bild

8. DIFFERENTIALGLEICHUNGEN MIT GETRENNTEN VARIABLEN 279


(0 10 0

)ϕ(t).

Losungen: ϕ(t) =

(1 t0 1

)ϕ0, ϕ0 ∈ R2.

Ein passendes Bild

8. Differentialgleichungen mit getrennten VariablenMi 24.7.

Definition 8.1. Gegeben seien offene Intervalle I und J , und g : I → R und h : J → R stetig.Eine Differentialgleichung der Form

ϕ′(t) = g(t)h(ϕ(t))

nennt man eine gewohnliche Differentialgleichung mit getrennten Variablen24. Kurzschreibweise

(8.2) ϕ′ = g(t)h(ϕ).

Der Satz 4.3 von Picard-Lindelof ist nicht anwendbar, da

f(t, x) = g(t)h(x)

im allgemeinen25 nicht Orts-Lipschitz-stetig ist.

Schmutzige Rechnung (streng mathematisch nicht gerechtfertigt, aber in der Praxis oft erfolgreich)

dϕ

dt= g(t)h(ϕ)

⇐⇒ dϕ

h(ϕ)= g(t) dt

⇐⇒∫

dϕ

h(ϕ)= c+

∫g(t) dt

Ist nun H eine Stammfunktion von 1/h und G eine Stammfunktion von g, dann sollte es eineKonstante c ∈ R geben mit

H(ϕ(t)) = c+G(t),

also ϕ(t) = H−1(c+G(t)).

Bestimme nun c so, dass Anfangsdaten erfullt sind.

Jetzt eine exakte Herleitung:

24oder auch”mit getrennten Veranderlichen“, da eine Variable dasselbe wie eine Veranderliche ist.

25”im allgemeinen“ heißt hier: es gibt Funktionen g und h, so dass dies nicht erfullt ist. Beispiel g(t) = 1,

h(x) = 3√x.


SATZ 8.3 (Trennung der Variablen). Gegeben sei eine gewohnliche Differentialgleichung mit ge-trennten Variablen wie in Definition 8.1, h(x) 6= 0 auf J . Sei t0 ∈ I, x0 ∈ J . Die Stammfunktionvon t 7→ g(t) sei G : I → R und die von x 7→ 1/h(x) sei H : J → R. Dann gibt es bis aufRestriktion genau eine stetig differenzierbare Losung von

ϕ′(t) = g(t)h(ϕ(t)

)ϕ(t0) = x0,

die auf einer offenen Umgebung von t0 definiert ist, namlich

(8.4) ϕ(t) = H−1(G(t) +H(x0)−G(t0)).

Beweis. Offensichtlich ist t 7→ 1/h(x) stetig. Also existiert H, ist stetig differenzierbar und mo-noton. Wir wenden Proposition 1.6 aus Kapitel 5 auf die Funktion H : J → R an und erhaltenwegen H ′(t) = 1/h(t) 6= 0:

• K := H(J) ist ein offenes Intervall,• H−1 : K → J existiert,

• H−1 ist differenzierbar mit(H−1

)′(s) = 1/(1/h(H−1(s))) = h(H−1(s)).

Also auch H−1 ∈ C1(K). Wegen G ∈ C1(I,R) ist die in Gleichung (8.4) definierte Funktion ϕ aufder offenen Menge

{t ∈ I | G(t) +H(x0)−G(t0) ∈ K} 3 t0in C1. Man rechnet leicht nach, dass ϕ eine Losung von (8.2) mit ϕ(t0) = x0 ist.

Nehmen wir, dass ϕ eine Losung von (8.2) mit ϕ(t0) = x0 ist. Dann gilt

g(t) =ϕ′(t)

h(ϕ(t))=

d

dt(H(ϕ(t)) ,

also ist G(t)−H(ϕ(t)) eine Konstante, namlich G(t0)−H(x0). Und dies ergibt (8.4).

Beispiel 8.5. g : R→ R, g(t) = 1. h : Rr {0} → R, h(x) = −x2 6= 0. Die Differentialgleichung

ϕ′(t) = −ϕ(t)2

besitzt unter anderem die Losung ϕ ≡ 0. Jede andere Losung wird nie Null (Eindeutigkeit inPicard-Lindelof). Im Fall ϕ 6≡ 0 konnen wir umformulieren in

− ϕ′(t)

ϕ(t)2= 1

⇐⇒ d

dt

1

ϕ(t)= 1

⇐⇒ 1

ϕ(t)= t+ c

⇐⇒ ϕ(t) =1

t+ c

9. MEHR ZUM FLUSS EINES ZEITABHANGIGEN VEKTORFELDS 281

Beim Anfangswert ϕ(0) = α < 0 bekommen wir c = 1/α und das maximale Losungs-Intervallist (−∞, 1/|α|). Die Losung hort also bei 1/|α| auf zu existieren. Wir haben gesehen, dass diesesPhanomen bei den linearen Gleichungen nie auftreten kann.

Beispiel 8.6. ϕ′(t) = A(t)ϕ(t). NICHT GETIPPT...

Beispiel 8.7. ϕ′(t) = π( 12 t

3 + 14 t)(4 + ϕ(t)2). NICHT GETIPPT...

9. Mehr zum Fluss eines zeitabhangigen Vektorfelds

Sei wieder U ⊂ R× Rn eine offene Teilmenge und f : U → Rn Orts-Lipschitz-stetig und stetig.

Wir definieren jetztD ⊂ R× R× Rn

durch (t, s, y) ∈ D ⇐⇒ (s, y) ∈ U und es existiert eine Losung ϕs,y : I → Rn von

(9.1) ϕ′(t) = f(t, ϕ(t))

mit ϕs,y(s) = y und t ∈ I.26 Es folgt aus Zusatz 4.13:

{(t, t, y) | (t, y) ∈ U} ⊂◦D

Wir sehen spater, dass D offen in R× R× Rn ist, also◦D = D.

Wir definieren nun den Fluss Φ von f wie folgt:

Φ : D → Rn, Φ(t, s, y) := ϕs,y(t).

Dann gilt offensichtlichΦ(t, t, y) = y.

LEMMA 9.2.(t, s, y) ∈ D ⇐⇒ (s, t,Φ(t, s, y)) ∈ D

undΦ(s, t,Φ(t, s, y)) = y.

Beweis. Nach Definition von Φ gilt Φ(t, s, y) = ϕs,y(t). Daraus folgt

ϕs,y ≡ ϕt,Φ(t,s,y).

Wir erhalten dann an der Stelle s

y = ϕs,y(s) = ϕt,Φ(t,s,y)(s) = Φ(s, t,Φ(t, s, y)).

So ahnlich zeigt manΦ(r, t,Φ(t, s, y)) = Φ(r, s, y),

26In anderen Worten t liegt im zugehorigen maximalen Definitionsbereich.


falls alle Ausdrucke wohldefiniert sind.Begrundung:

Φ(r, s, y) = ϕs, y(r) = ϕt,Φ(t,s,y)(r) = Φ(r, t,Φ(t, s, y)) .

LEMMA 9.3. D ist offen.

Beweisskizze. 27 Sei (t, s, y) ∈ D. Wir wollen eine offene Umgebung von (t, s, y) konstruieren, die inD enthalten ist. O.B.d.A. t ≥ s. Wahle zu jedem τ ∈ [s; t] ein ε(τ) > 0 mit Bε(τ)((τ, τ,Φ(τ, s, y)) ⊂D. Dies liefert eine offene Uberdeckung ((τ − ε(τ); τ + ε(τ))τ∈[s;t] von [s; t]. Wahle mit Proposi-

tion 6.17 aus Kapitel 8 zu dieser Uberdeckung eine Lebesguesche Zahl ε > 0, und ein m ∈ N,m > 1/ε. Wir definieren

ti := s+i

m(t− s).

Wir schreiben ϕ1(s, y) := Φ(t1, s, y)

ϕi(y) := Φ(ti, ti−1, y) 2 ≤ i ≤ m− 1

ϕm(t, y) := Φ(t, tm−1, y)

Wir konnen nun schreiben:

Φ(t, s, y) = Φ(t, tm−1,Φ(tm−1, tm−2,Φ(. . .Φ(t1, s, y)

= ϕm(t, ϕm−1(ϕm−2(. . . ϕ2(ϕ1(s, y)) . . .)))

Wir betrachten beide Seiten der Gleichung als Funktion in t, s und y, also (t, s, y) 7→ Rn. Diesist eine

”Verkettung“ von stetigen Funktionen, wobei die Funktionen nicht uberall definiert sind.

Ist (t, s, y) im Definitionsbereich der Verkettung, dann auch in D. Im folgenden sei D(h) derDefinitionsbereich einer Funktion h. Der Definitionsbereich der Verkettung (s, y) 7→ ϕ2(ϕ1(s, y))ist

D(ϕ1) ∩(ϕ1

)−1(D(ϕ2)

),

also der Schnitt zweier offener Menge und somit wieder offen. Man zeigt dann induktiv, dass derDefinitionsbereich der Verkettung

(s, y) 7→ ϕm−1(ϕm−2(. . . ϕ2(ϕ1(s, y)) . . .)))

die Menge

V := D(ϕ1) ∩ (ϕ1)−1(D(ϕ2)

)∩ (ϕ2 ◦ ϕ1)−1

(D(ϕ3)

)∩ · · · (ϕm−2 ◦ · · · ◦ ϕ2 ◦ ϕ1)−1

(D(ϕm−1)

),

ist; und diese Menge ist als Schnitt offener Mengen ebenfalls offen. Der Definitionsbereich derVerkettung

(t, s, y) 7→ ϕm(t, ϕm−1(ϕm−2(. . . ϕ2(ϕ1(s, y)) . . .)))

27Diese Beweisskizze wurde in der Vorlesung aus Zeitgrunden ubersprungen.

10. EINIGE KOMMENTARE ZUM LANGZEITVERHALTEN VON GEW. DIFFIFFERENTIALGLEICHUNGEN283

ist dann(R× V ) ∩

(idR × (ϕm−1 ◦ · · · ◦ ϕ2 ◦ ϕ1)

)−1D(ϕm),

also auch offen.

PROPOSITION 9.4. Der Fluss Φ : D → Rn ist stetig.

Beweisskizze. Wegen Satz 4.20 wissen wir bereits, zu jedem (τ, y) ∈ U gibt es eine UmgebungW von (τ, y) in U und ein ε0 > 0, so dass Φ auf (τ − ε0; τ + ε0) ×W stetig ist. Man beachten

ε0 = ε0(τ, ε) hangt von τ und ε ab. Zu der Uberdeckung(

(τ − ε0; τ + ε0))τ∈[t;s]

von [t; s] wahle

eine Lebesguesche Zahl ε > 0, dann m > 1/ε. Der restliche Beweis geht ahnlich, wie der Beweis derOffenheit von D: wir schreiben lokal Φ als Verkettung vieler Abbildungen, bei denen wir bereitsdie Stetigkeit wissen.

ZUSATZ 9.5. Ist f ∈ Ck(U,Rn), dann ist auch Φ ∈ Ck(D,Rn).

Anschaulich: ist f ∈ Ck, dann ist die Losung ϕt0,x0(t) ist nicht nur Ck in t sondern auch Ck in t0und x0.28

Beweis. Dies zeigt man induktiv uber k, indem man ahnlich wie in Bemerkung 4.16 argumentiert.

KOROLLAR 9.6. Autonomer Fall: Sei U offen in Rn, f : U → Rn, ϕ′(t) = f(ϕ(t)) und Φ :D → Rn der zugehorige Fluss. Wir sagen f ist ein vollstandiges Vektorfeld, falls D = R×R×U .Dann ist Φ(t, s, y) = Φ(t + c, s + c, y) und Φ(t, s, · ) : U → U ist ein Homoomorphismus. (DennΦ(s, t, · ) : U → U ist die (stetige) Umkehrfunktion.)

Leicht zu prufen.

10. Einige Kommentare zum Langzeitverhalten von gew. DiffifferentialgleichungenFr. 26.7.

Wir haben mit dem Satz von Picard-Lindelof gesehen, dass wir fur kurze Zeiten Existenz undEindeutigkeit von Losungen von gewohnlichen Differentialgleichungen mit gegebenen Anfangswer-ten haben, vorausgesetzt, dass die Differentialgleichung in expliziter Form ist und die Gleichungstetig differenzierbar von den niedrigeren Ableitungen und der Zeit t abhangen. Gleiches gilt dannnaturlich auch fur die zugehorigen Flusse.

Man interessiert sich nun aber auch fur das langfristige Verhalten der Losungen und der zugehorigenFlusse. Wir haben bereits in Proposition 4.15 einige Ergebnisse zur Frage erhalten, wie langeLosungen existieren. Wir betrachten nun den Fall, dass Losungen ϕ fur alle zukunftigen bzw. allevergangenen Zeiten existieren, d.h. tmax = +∞ oder tmin = −∞. Wir betrachten der Einfachheithalber nur den autonomen, das heißt nicht explizit zeitabhangigen Fall.

28Aber die Formulierung im Zusatz ist noch etwas starker!


Falls dann ϕ(t) fur t → ±∞ gegen ein x±∞ konvergiert, und dieses29 im Definitionsbereich dergewohnlichen Differentialgleichung liegt, so ist existiert eine konstante Losung ϕ±(t) := x±∞.Dieser Fall wird im Rahmen der Stabilitatstheorie untersucht, uber die wir im folgenden Abschnitteinen kleinen Uberblick geben wollen.

Es kann aber auch vorkommen, dass ϕ periodisch ist, das heißt, es gibt ein kleinstes L > 0, diePeriode, mit ϕ(L + t) = ϕ(t) fur alle t. Man fragt sich dann, ob Losung in der Nahe ebenfallsperiodisch sind. Andere Verhalten sind ebenfalls moglich, z.B. “quasiperiodisches Verhalten” oder“ergodisches Verhalten”, wobei man fur letzteres manchmal auch das aufreißerischer klingendeWort “chaotisches Verhalten” nutzt. Die mathematischen Gebiete, die sich damit beschafitgennennen sich dann je nach Ausrichtung “dynamische Systeme”, “Chaos-Theorie”, “Ergodentheorie”,. . . .

Eine reiche Quelle wichtiger und interessanter gewohnlicher Differentialgleichungen ist die klassi-sche Physik, hier insbesondere die Hamiltonsche Mechanik, die letztendlich auch die Himmelsme-chanik umfasst. Wir wollen mal ein Beispiel geben, um anzudeuten, welche Art von Resultatenhier erwartet werden konnen.

Wenn man zum Beispiel das langfristige Verhalten unseres Sonnensystems betrachtet und dieEntstehung des Lebens, die ja letztendlich einen uber astronomische Zeitraume hinweg relativkonstanten Abstand zur Sonne benotigt, so erscheint es unabdingbar zu fordern, dass sich allePlaneten nahezu periodisch um die Sonne bewegen. Dieses Verhalten kann auch relativ leichtmathematisch hergeleitet werden, wenn nur ein Planet um die Sonne kreisen wurde (Zwei-Korper-Problem). Es ist auch einfach zu zeigen, wenn man zwei Naherungen annimmt: zum einen nimmtman an, dass die Sonne auf grund der großen Masse sich nicht mehr bewegt und und zum anderen,dass sich die Planeten gegenseitig nicht anziehen. Wenn man diese Naherungen annimmt, dannhat man viele Erhaltungsgroßen, so dass man schließlich die Bewegung sehr gut beschreiben kann;man hat ein sogenanntes vollstandig integrables dynamisches System. Die Losungen solcher Systemesind immer quasiperiodisch (sie sind nur dann periodisch, wenn die Verhaltnisse der Umlaufzeitender Planeten rationale Zahlen sind, sonst sind sie eben fast periodisch, was mit quasiperdidischbezeichnet wird).

Diese beiden Naherungen sind aber leider in astronomischen Zeitskalen nicht mehr angebracht. Eshandelt sich also um eine Storung eines vollstandig integrablen Systems. Der Satz von Kolgomo-row, Arnold und Moser aus den Jahren 1954-1963 besagt, dass fast alle Losungen von derartigenStorungen von vollstandig integrablen Systemen ebenfalls quasiperiodisch sind, vorausgesetzt, dieStorungen sind nicht zu groß. Siehe zum Beispiel unter diesem Link fur weitere Informationen:

https://de.wikipedia.org/wiki/Kolmogorow-Arnold-Moser-Theorem.

All diese Satze werden wir aber leider im Rahmen des Analysis-Zyklus aus Zeitgrunden nicht weiterbehandeln konnen.

29Bei Differentialgleichungen ϕ(k)(t) = f(ϕ(t), . . . , ϕ(k−1)(t) der Ordnung k muss man hier naturlich uber-

prufen, ob (x±∞, 0, . . . , 0) = lim(ϕ(t), ϕ′(t), . . . ϕ(k−1)(t)) im Definitionsbereich der Funktion f liegt.

https://de.wikipedia.org/wiki/Kolmogorow-Arnold-Moser-Theorem

11. STABILITAT UND VERHALTEN IN DER NAHE VON KRITISCHEN PUNKTEN 285

11. Stabilitat und Verhalten in der Nahe von kritischen Punkten

In diesem Abschnitt wollen wir auf einige Beweise verzichten. In der Darstellung halten wir unseng an [23], Abschnitt 4.5 und an [35], Kapitel VII. In diesen beiden Buchern findet man auch diefehlenden Beweise.

Im ganzen Abschnitt sei U eine offene Teilmenge von Rn und v : U → Rn ein stetig differenzierbaresVektorfeld.

Definition 11.1. x0 ∈ U heißt kritischer Punkt von v, falls v(x0) = 0. Einen kritischen Punktx0 nennen wir stabil , falls fur jede Umgebung V ⊂ U von x0 eine offene Umgebung W ⊂ V vonx0 gibt, so dass jede Integralkurve ϕ von v mit ϕ(0) ∈ W auf [0,∞) definiert werden kann, undso dass ϕ([0,∞)) ⊂ V . Ein kritischer Punkt x0 wird Attraktor genannt, falls er stabil ist und fallsdas obige W so gewahlt werden kann, dass fur alle Integralkurven ϕ von v mit ϕ(0) ∈ W giltlimt→∞ ϕ(t) = x0.

30

Beispiele 11.2. Wir setzen die Beispiele 7.1 fort.

(1) In diesem Beispiel ist 0 ein Attraktor zum Vektorfeld

v : x 7→(−2 00 −1

)x

0 ist kein stabiler Punkt zum Vektorfeld −v.(2) In diesem Beispiel ist 0 kein stabiler Punkt zum Vektorfeld

v : x 7→(

1 00 1

)x

0 ist Attraktor zum Vektorfeld −v.(3) In diesem Beispiel ist 0 kein stabiler Punkt zum Vektorfeld

v : x 7→(−2 00 1

)x

0 ist auch kein stabiler Punkt zum Vektorfeld −v.(4) In diesem Beispiel ist 0 stabiler Punkt zum Vektorfeld

v : x 7→(

0 1−1 0

)x

0 ist auch stabiler Punkt zum Vektorfeld −v. Aber weder Attraktor zu v noch Attraktor zu−v.

30Man beachte, dass die hier verwendete Definition nicht ganz mit der in [23] verwendeten ubereinstimmt.

Wir haben Stabilitat in die Definition des Attraktors hineingenommen, und sind damit in Ubereinstimmung mitdem Großteil der fortgeschrittenen Literatur in diesem Gebiet. Der unten zitierte Beweis des Satzes von Poincare-

Ljapunow in [23] zeigt aber sogar unsere (starkere) Version des Attraktors.


(5) In diesem Beispiel ist 0 weder stabiler Punkt zum Vektorfeld

v : x 7→(

0 10 0

)x

noch ein stabiler Punkt zum Vektorfeld −v.

Allgemein gilt fur v(x) := Ax: 0 ist Attraktor, genau dann, wenn jeder Eigenwert von A einennegativen Realteil hat. 31

Beispiel 11.3. (aus [23])Sei v : R → R, v(x) = −xk, k ∈ N r {0}. Der einzige kritische Punkt ist 0. Mit Trennung derVariablen sieht man, dass ϕ′ = v(ϕ) fur ϕ 6= 0 aquivalent zu

d

dt

1

(k − 1)ϕ(t)k−1= 1

ist, falls k > 1. Fur k = 1 ahnlich mit Logarithmus. Mit Standard-Umformungen erhalt man mitAnfangswert ϕ(0) = x1

ϕ(t) =

{x1e−t k = 1

x1k−1√

1+(k−1)xk−11 t)

k > 1

Fur x1 > 0 oder k ungerade, existiert die Losung fur alle t ∈ [0,∞) und sie konvergiert gegen 0.Fur k gerade und x1 < 0 existiert die Losung nur endlich lange. Deswegen ist 0 ein Attraktor, fallsk ungerade, und 0 ist nicht einmal stabil, falls k gerade ist.

Ein passendes Bild

Definition 11.4. Die Linearisierung von v in x0 ∈ U ist die Abbildung Dx0v : Rn → Rn,x 7→ v′(x0)x.

Idee der folgenden Resultate: die Flusslinien (= Integralkurven) des Vektorfelds v sehen”ahnlich“

aus wie wie Flusslinien der Linearisierung. Das Phasenportrait in einer kleinen Umgebung deskritischen Punkt ist eine

”verbogene“ Version des Phasenportraits der Linearisierung.

THEOREM 11.5 (Poincare-Ljapunow). Sei x0 ein kritischer Punkt von des C1-Vektorfelds v :U → Rn. Fur jeden komplexen Eigenwert λ der Matrix v′(x0) gelte Re λ < 0. Dann ist x0 einAttraktor.

Beweis. Siehe [23], Abschnitt 4.5.

Definition 11.6. Eine Ljapunow-Funktion zum C1-Vektorfeld v : U → Rn und zum kritischenPunkt x0 ist eine C1-Funktion L : U → R, so dass 32

31Hier ware eigentlich ein Beweis notig, zu dem wir keine Zeit mehr haben: Falls A diagonalisierbar ist, dann ist

jede Losung eine Linearkombination von Losungen der Form etλ0ϕ0, mit Aϕ=λ0ϕ0. Wenn A nicht diagonalisierbarist, ist die Argumentation ahnlich.

32Im folgenden ist ∂x,vf wieder die Richtungsableitung von f im Punkt x in Richtung v.

11. STABILITAT UND VERHALTEN IN DER NAHE VON KRITISCHEN PUNKTEN 287

• L(x0) = 0• L(x) > 0, falls x ∈ U r {x0}• Fur alle x ∈ U gilt: ∂x,v(x)L ≤ 0. Oder es gilt fur alle x ∈ U : ∂x,v(x)L ≥ 0

Beispiel: Ist E eine Erhaltungsgroße, die in x0 ein absolutes Minimum hat, so ist E − E(x0) eineLjapunow-Funktion.

Konsequenz: Ist ϕ eine Flusslinie von v, dann gilt

d

dtL(ϕ(t)) = L′(ϕ(t))ϕ′(t) = ∂ϕ(t),v(ϕ(t))L ≤ 0 bzw. ≥ 0

THEOREM 11.7 (Ljapunow). Sei v, x0 und L wie oben.

(a) Falls ∀x ∈ U : ∂x,v(x)L ≤ 0, dann ist x0 ein stabiler Punkt.(b) Falls ∀x ∈ U r {x0} : ∂x,v(x)L < 0, dann ist x0 ein Attraktor(c) Falls ∀x ∈ U r {x0} : ∂x,v(x)L > 0, dann ist x0 kein stabiler Punkt.

Beweis. Siehe [23], Abschnitt 4.5.

Beispiel 11.8. Die Lienardsche Gleichung, siehe [23], Ende Abschnitt 4.5.

THEOREM 11.9 (Linearisierungssatz von Grobman und Hartman, 1959–1960). Sei x0 ein kri-tischer Punkt eines stetig differenzierbaren Vektorfelds v : U → Rn. Wir nehmen an, dass furjeden Eigenwert λ von v′(x0) gilt: Reλ 6= 0. Sei Dx0

v : Rn → Rn die Linearisierung von v in x0.Dann gibt es eine offene Umgebung V von x0 in U , eine offene Umgebung W von 0 und einenHomoomorphismus h : V →W , h(x0) = 0, so dass gilt

ϕ : (a, b)→ V ist Flusslinie zu v

⇐⇒ h ◦ ϕ : (a, b)→W ist Flusslinie zu Dx0v

Der Homoomorphismus h bildet Flusslinien auf Flusslinien ab. Die Flusslinien der Linearisierungsind die Abbildungen t 7→ eAtϕ0 mit ϕ0 ∈ Rn, A := v′(x0).

Wir bekommen alsoϕ(t) = h−1(eAth(ϕ(0)))

vorausgesetzt wir sind”nahe genug“ bei x0.

Wenn man das Theorem von Grobman und Hartman liest, so stellt sich die Frage, ob man nichtdas Wort

”Homoomorphismus“ durch

”Ck-Diffeomorphismus“ ersetzen kann, sobald v genugend

oft differenzierbar ist.

Man kann zeigen (siehe Abschnitt 2.9 von [28] fur mehr Details):

• Ist v ∈ C2, so gibt es einen C1-Diffeomorphismus h mit den obigen Eigenschaften.• Es gibt Vektorfelder v ∈ C∞, fur die es keinen C2-Diffeomorphismus h mit den obigen

Eigenschaften gibt

ANHANG A

Mehr Details zu den Grundlagen der Logik

1. Das Russellsche Paradoxon

(Auch Russellsche Antinomie genannt. Vorlaufer sind die Cantorsche Antinomie und das Burali-Forti-Paradoxon, siehe Wikipedia.)

Am Anfang der Vorlesung haben wir gesagt, dass unser Ziel ist, eine axiomatisch aufgebauteMathematik zu erhalten. Diesem Anspruch sind wir bisher nicht gerecht geworden. Immer wiederwurde die Intuition genutzt, um Objekte zu definieren, anstatt wirklich saubere mathematischeDefinitionen hinzuschreiben. Das Vorgehen war bis weit ins 19. Jahrhundert ganz ahnlich. Dasintuitive Verwenden des Mengenbegriffs fuhrte dann aber zu dem Russellschen Paradoxon.

Frage 1.1. Gibt es die Menge aller Mengen?

Stand der Mathematik gegen Ende des 19. Jahrhunderts: Nach Cantors Beschreibung (Beschrei-bung 3.1) sollte es die Menge M aller Mengen geben. Das Elementzeichen ∈ ist dann eine aufE ×M definierte Aussageform, wobei E die Menge aller Elemente irgendeiner Menge bezeichne,also E =

⋃M.

E ×M −→ {w, f}(x,M) 7→ x ∈M

Russell bildete nun daraus

N := {x ∈M | x 6∈ x}.

Gilt nun N ∈ N ? Fur alle Mengen x gilt

x ∈ N ⇐⇒ x 6∈ x

und wenn wir x := N setzen, so erhalten wir

N ∈ N ⇐⇒ N 6∈ N .

Aussagen in der Form A↔ ¬A sind aber immer falsch, also haben wir einen Widerspruch erhalten.

289

290 A. MEHR DETAILS ZU DEN GRUNDLAGEN DER LOGIK

Um die Mengenlehre und somit die Mathematik sauber auf Axiomen aufzubauen, mussen wir alsoviel genauer als bisher vorgehen und intuitive Argumente durch formal korrekte Beweise ersetzen.

Wie lost man dieses Paradoxon auf: Nicht jede”Zusammenfassung von bestimmten wohlunterschie-

denen Objekten“ ist eine Menge. Die Axiome sollen regeln, wann solche eine Zusammenfassung eineMenge ist. Insbesondere ist die

”Zusammenfassung“ M aller Mengen selbst keine Menge, sondern

etwas großeres, das wir Klasse nennen wollen. Analog sind auch N und E keine Mengen, sondernKlassen.

2. Axiomatische Mengenlehre

Wir wollen nun skizzieren, wie man die Mengenlehre sauber auf Axiomen aufbauen kann. Mannimmt hierzu mehrere Axiomen an, all diese Axiome zusammen nennt man dann ein Axiomen-System. Historisch sind hier wichtige Fortschritte zu Ende zu 19. Jahrhunderts und zu Beginndes 20. Jahrhunderts gemacht worden. Nun haben verschiedene Mathematiker verschiedene Axio-mensysteme entwickelt und benutzt. Das wohl bekannteste Axiomensystem heißt ZFC nach denMathematikern Zermelo und Fraenkel und C fur

”Axiom of Choice“ (= Auswahlaxiom). Wir stel-

len ein anderes vor (NBG), das sehr ahnliche Eigenschaften hat. Man kann zeigen, dass man mitZFC und NBG dieselben Satze uber Mengen herleiten kann. Die Axiome von ZFC machen oftrein mengentheoretische Argumente einfacher, wahrend die Axiome von NBG fur das praktischeArbeiten oft besser geeignet sind.

Grundlegende Ideen:

• Man will gar nicht mehr erklaren, was eine Menge ist, sondern fordert axiomatischeEigenschaften fur Mengen.• Man nimmt an, dass auch alle Elemente von Mengen ebenfalls Mengen sind. In anderen

Worten: jede Menge ist ein Mengensystem uber einer geeigneten Menge. In der Notationdes letzten Abschnitts gilt also nun M = E . Die Zusammenfassung aller RegensburgerAutos ist dann keine Menge. Der Satz

”Es existiert kein Auto“ ist also in einer streng

axiomatisch aufgebauten Vorlesung uber Logik und Mengenlehre eine wahre Aussage,denn ein Auto ist ja keine Menge von Mengen.• Trotz dieser Einschrankungen kann man immer noch naturliche, ganze, rationale und

reelle Zahlen und vieles mehr als Mengen definieren. Die Zahl π ist also eine Menge,deren Elemente wieder Mengen sind, deren Elemente wieder Mengen sind, . . . . Siehedazu auch die Peano-Axiome in Abschnitt B in Kapitel

”Zahlen“.

Die Axiome ubernehme ich aus [17], siehe auch [25]. Zum Vergleich zu ZFC verweise ich auf [13].

AXIOME 2.1 (Axiome der Mengenlehre nach von Neumann, Bernays, Godel (NBG)).

• Es gibt zwei Sorten von Objekten, Mengen und Klassen. Außerdem gibt es noch die Be-ziehung ∈, die besagt, wann eine Klasse das Element einer anderen Klasse ist.• Jede Menge ist eine Klasse.

2. AXIOMATISCHE MENGENLEHRE 291

• Alle Elemente von Klassen sind Mengen.• Extensionalitat. Zwei Klassen sind genau dann gleich, wenn sie dieselben Elemente ent-

halten.• Komprehension. Ist C eine auf allen Mengen definierte Aussagenform, die nach strikt

festgelegten Regeln aufgebaut ist, die wir hier der Kurze halber nicht genauer diskutieren.1

Dann ist {x ist eine Menge

∣∣ C(x)}

eine Klasse.• Die leere Klasse ∅ := {x ist eine Menge | x 6= x} ist eine Menge.• Aussonderungsmengenaxiom. Jede Teilklasse einer Menge ist eine Menge.

Benutzt wurde hierbei die folgende Definition: Eine Klasse A ist eine Teilklasse einerKlasse B, wenn jedes Element von A ein Element von B ist.• Paarmengenaxiom. Sind A und B Mengen, so ist auch {A,B} eine Menge.• Vereinigungsaxiom. Ist A eine Menge, so ist auch⋃

A :={x∣∣ ∃y ∈ A : x ∈ y

}eine Menge, die Vereinigungsmenge von A.• Potenzmengenaxiom. Ist A eine Menge, so ist auch P(A) := {x | x ⊂ A} eine Menge,

die Potenzmenge von A.• Fundierungsaxiom. Ist A 6= ∅, so gibt es ein x ∈ A mit x ∩A = ∅.• Ersetzungsaxiom.Sind X und Y Klassen und ist F eine funktionale

”Relationsklasse“2

mit D(F ) = X und B(F ) ⊂ Y . Ist die Teilklasse A ⊂ X eine Menge, so ist auch B(F |A)eine Menge.• Unendlichkeitsaxiom. Es gibt eine induktive Menge; eine Menge A heißt induktiv, wenn∅ ∈ A und wenn fur alle x ∈ A auch x ∪ {x} ∈ A ist.• Auswahlaxiom. Sei I eine nicht-leere Menge und (Mi)i∈I eine Familie von nicht-leeren

Mengen. Dann ist∏i∈IMi nicht die leere Menge.

Bemerkungen 2.2.

(a) Besonders interessant ist das Auswahlaxiom. Es folgt bereits aus den Axiomen zuvor, dass∏i∈IMi eine Menge ist. Falls I endlich ist, so gilt offensichtlich

∏i∈IMi 6= ∅. Fur unendliche

Indexmengen kann man aber∏i∈IMi 6= ∅ im allgemeinen nicht aus den anderen Axiomen

herleiten. Wenn man es annimmt,”weiß“ man zwar, dass

∏i∈IMi mindestens ein Element

besitzt, es kann aber vorkommen, dass kein einziges Element von∏i∈IMi angegeben werden

kann.Es ist nun ganz lehrreich, zu untersuchen, welche Aussagen der Mathematik nur unter Hin-zunahme des Auswahlaxioms gezeigt werden konnen, und fur welche Aussagen, das Auswahl-axiom notig ist. Angenommen wir hatten nur die Axiome bis zum Unendlichkeitsaxiom. Dann

1Siehe hierzu [17] und [13]. Gemeint ist eine Aussagenform 1. Stufe, in der nicht uber Klassenvariable quanti-

fiziert wird.2Unter einer Relationsklasse verstehen wir eine Klasse, deren Elemente Paare sind. Man kann dann die ublichen

Begriffe einer Relation definieren, z.B.”funktional“, Definitionsbereich, Bild, etc.

292 A. MEHR DETAILS ZU DEN GRUNDLAGEN DER LOGIK

kann man zeigen, dass das Auswahlaxiom aquivalent zur Aussage”Jeder Vektorraum besitzt

eine Basis“ ist.Wenn wir das Auswahlaxiom annehmen, dann gibt es einen Vektorraum, der zwar eine Basisbesitzt, aber zugleich kann keine Basis angegeben werden.Das Auswahlaxiom ist auch aquivalent zur Aussage:

”Sind X und Y Mengen, dann gibt es eine

injektive Abbildung f : X −→ Y oder es gibt eine injektive Abbildung f : Y −→ X“.(b) Man kann aus den Axiomen der Mengenlehre nicht folgern, dass die Mengenlehre widerspruchs-

frei ist! (Zweiter Godelscher Unvollstandigkeitssatz). Die Mathematik beruht auf der Annahme,dass die Axiome der Mengenlehre widerspruchsfrei sind.

(c) Es gibt Aussagen, von denen gezeigt werden kann, dass weder diese Aussage noch die Negationdieser Aussage beweisbar ist. Die Cantorsche Kontinuumshypothese ist solch eine Aussage:

”Sei M eine Menge, so dass es keine injektive Abbildung M −→ N gibt.

Dann gibt es eine injektive Abbildung R −→M .“

Solche Aussagen gibt es in jedem hinreichend großen logischen System (Erster GodelscherUnvollstandigkeitssatz).

Bemerkung 2.3. Das Auswahlaxiom ist”unabhangig“ von den anderen Axiomen der Mengen-

lehre. Aufgrund der Nicht-Konstruktivitat und etwas ungewohnlicher Konsequenzen wird im Nor-malfall explizit angegeben, wenn ein Beweis das Auswahlaxiom verwendet.

Aus den obigen Axiomen kann man nun Schritt fur Schritt die ganze Mathematik heraus herleiten.

ANHANG B

Die Peano-Axiome

1. Die Axiome und erste Konsequenzen

Die naturlichen Zahlen wurden von Dedekind (1888) und Peano (1889) axiomatisiert. Siehe [17,Kapitel 3 und 4], [20], oder [13, Kapitel V] fur mehr Details.

AXIOME 1.1 (”Axiome“ der naturlichen Zahlen (Peano-Axiome)). Gegeben sei

• eine Menge N ,• ein (ausgewahltes) Element in N , das wir 0 nennen,• eine Abbildung s : N −→ N , x 7→ s(x), genannt die Nachfolger-Abbildung.

Wir sagen, dass (N, 0, s) die Peano-Axiome erfullt, falls gilt:

(P1) 0 6∈ B(s)(P2) Die Abbildung s : N −→ N ist injektiv.(P3) (Induktionsaxiom) Erfullt T ⊂ N die Bedingungen 0 ∈ T und s#(T ) ⊂ T , dann gilt bereits

T = N .

Wenn (N, 0, s) die Peano-Axiome erfullt, sagt man (N, 0, s) ist ein Modell der naturlichen Zahlen.

PROPOSITION 1.2. Es gibt eine Menge N ein Element 0 ∈ N und eine Nachfolger-Abbildungs : N −→ N , so dass (N, 0, s) die Peano-Axiome erfullt.

Beweis folgt unten.

PROPOSITION 1.3. Wenn (N , 0, s) und (N , 0, s) die Peano-Axiome erfullen, dann gibt es eine

bijektive Abbildung F : N −→ N , so dass F (0) = 0 und F ◦ s = s ◦ F .

Man sagt dann oft: (N , 0, s) und (N , 0, s) sind kanonisch isomorph.

Beweis spater.

Die letzte Gleichung schreibt man am besten als Diagramm, ein sogenanntes kommutatives Dia-gramm

293

294 B. DIE PEANO-AXIOME

N N

N N

F

F

s s

Alles, was man ublicherweise mit naturlichen Zahlen macht (Addition, Multiplikation, Teilbarkeit,Primzahlen, etc.) beruht letztendlich auf dem Tripel (N, 0, s) und den Peano-Axiomen. Deswegenbesagt Prop. 1.3, dass alle Eigenschaften von (N, 0, s) die man aus den Peano-Axiomen herleitenkann, entweder in allen Modellen gelten oder in keinem. Beispiele: In jedem Modell gibt es unendlich

viele Primzahlen, n ist eine Zahl mit 4 Teilern in (N , 0, s) genau dann wenn F (n) eine Zahl mit 4

Teilern in (N , 0, s) ist. Es kann uns also egal sein, welches Modell die naturlichen Zahlen beschreibt,wichtig sind allein die Peano-Axiome.

Bemerkung 1.4. Sind die Peano-Axiome weitere Axiome? Oder eine Definition? Oder Aussagen?Es gibt hier zwei verschiedene Sichtweisen. Je nach Anwendung und Dozent wird die eine oderandere bevorzugt.

(a) Die mengentheoretische Sichtweise: Die Peano-Axiome sind eine Definition.Proposition 1.2 besagt: Es gibt mindestens ein Tripel (N, 0, s), das die Peano-Axiome erfullt.

Und: Erfullen (N , 0, s) und (N , 0, s) die Peano-Axiome, so sind (N , 0, s) und (N , 0, s)”im

wesentlichen gleich“ (Proposition 1.3).(b) Die axiomatische Sichtweise: wir wollen im mathematischen Teilgebiet

”Theorie der naturlichen

Zahlen“ annehmen, dass es eine Menge N , ein 0 ∈ N und eine Nachfolger-Abbildung gibt undnehmen die Peano-Axiome als Axiome dieses Teilgebiets. Proposition 1.2 besagt dann,dass es ein mengentheoretisches Modell gibt, das die Axiome erfullt. Wie dieses Modell aberaussieht, ist fur unsere weiteren Uberlegungen irrelevant, da wir nur die Axiome fur weitereSchritte nutzen.

Beweis von Proposition 1.2. Wiederholung: eine Menge A heißt induktiv , wenn ∅ ∈ A und wennfur alle x ∈ A auch x ∪ {x} ∈ A ist.

Nach dem Unendlichkeitsaxiom gibt es eine induktive Menge A. Wir setzen 0 := ∅. Wir definierennun die Nachfolger-Abbildung

s : A −→ A, x 7→ x ∪ {x}.Das Tripel (A, 0, s) erfullt offensichtlich (P1).

Fur (P2) muss etwas gearbeitet werden, wir beweisen die Injektivitat von s : A −→ A mit einemWiderspruchsbeweis.

Angenommen die Abbildung sei nicht injektiv. Dies bedeutet:

(1.5) ∃x, y ∈ A : x 6= y ∧ s(x) = s(y)

1. DIE AXIOME UND ERSTE KONSEQUENZEN 295

Es folgt x ∪ {x} = y ∪ {y} und hieraus folgen wiederum die Aussagen

(1.6) x ∈ y ∨ x ∈ {y}

und

(1.7) y ∈ x ∨ y ∈ {x}.

Nun ist aber x ∈ {y} gleichbedeutend mit x = y und dies haben wir oben ausgeschlossen. Somiterhalten wir aus (1.6) dann x ∈ y, und analog erhalten wir y ∈ x aus (1.7).

Wir definieren nun B := {x, y}. Wegen B 6= ∅ ergibt das Fundierungsaxiom die Existenz einesb ∈ B mit b ∩ B = ∅. Im Fall b = x erhalten wir x ∩ {x, y} ⊃ {y} also b ∩ B 6= ∅. Im Fallb = y zeigen wir b ∩ B 6= ∅ analog. Wir haben einen Widerspruch erhalten, da wir gleichzeitigb∩B 6= ∅ und b∩B = ∅ erhalten haben. Also war eine Annahme (1.5) falsch. Wir haben mit einemWiderspruchsbeweis die Injektivitat von s gezeigt.

Es verbleibt aber unklar, ob (A, 0, s) auch (P3) erfullt.

Wir setzen nun

N :=⋂{B ∈ P(A) | B ist induktiv}.

Der Schnitt dieser induktiven Mengen ist wieder induktiv. Das Tripel (N, 0, s|N ) erfullt offen-sichtlich (P1) und (P2). Erfullt T die Voraussetzungen in (P3), so ist T induktiv und es giltT ∈ P(N) ⊂ P(A). Also folgt N ⊂ T , somit T = N . Wir erhalten (P3).

Beispiel 1.8. Die Konstruktion liefert dann 0 = ∅, 1 = s(0) = {∅}, 2 = s(1) = {∅, {∅}}, 3 =s(2) = {∅, {∅}, {∅, {∅}}}.

PROPOSITION 1.9. Jede naturliche Zahl ungleich 0 ist der Nachfolger genau einer naturlichenZahl.

Beweis (Direkter Beweis). Wir wissen bereits, dass jede naturliche Zahl der Nachfolger hochstenseiner naturlichen Zahl ist. Zu zeigen bleibt also, dass jede naturlichen Zahl n ungleich 0 Nachfolgereiner naturlichen Zahl ist. Wir definieren:

U := {n ∈ N |n ist Nachfolger einer naturlichen Zahl}

und dann

T := U ∪ {0}.

Die Menge T erfullt die Eigenschaften im Peano-Axiom (P3): 0 ist in T , und wenn n in T enthaltenist, dann ist n eine naturliche Zahl, und somit ist s(n) eine naturliche Zahl, die Nachfolger einernaturlichen Zahl ist. Somit ist s(n) in T . Axiom 3 besagt also, dass T gleich N ist. Daraus folgtU = N oder U = N r{0}. Also ist jede Zahl ungleich 0 Nachfolger einer naturlichen Zahl. Mankann den Beweis auch anders fuhren, als sogenannten Widerspruchsbeweis.


Beweis (Widerspruchsbeweis). Wir nehmen an, die Aussage des Lemmas ist falsch, undwollen daraus einen Widerspruch herleiten. Wenn die Aussage des Lemmas falsch ist,dann konnen wir annehmen: Es gebe eine naturliche Zahl n ungleich 0, die nicht Nachfolgereiner naturlichen Zahl ist. Wir definieren T := N r {n}. Die Menge T enthalt 0, da n 6= 0. Istt ∈ T , so ist t auch eine naturliche Zahl und somit ist auch der Nachfolger s(t) eine naturlicheZahl. Da n kein Nachfolger einer naturlichen Zahl ist, folgt s(t) 6= n und somit s(t) ∈ T . DieMenge T erfullt also die Eigenschaften in Peano-Axiom (P3) und somit gilt T = N . Zusammenmit n ∈ N und n 6∈ T ergibt sich ein Widerspruch. Da die Existenz einer Zahl n mit denobigen Eigenschaften zu einem Widerpruch fuhren wurde, wissen wir, dass es einsolches Gegenbeispiel nicht gibt, und die Aussage des Lemmas ist somit bewiesen.

2. Vollstandige Induktion und rekursive Definition

In diesem Abschnitt nehmen wir an, dass (N, 0, s) die Peano-Axiome erfullt. Die Addition + istnoch nicht definiert! Wir schreiben 1 fur s(0), 2 fur s(1) etc.. Die Notation n+ 1 ist im Sinne vons(n) zu lesen.

SATZ 2.1 (Vollstandige Induktion). Sei A( · ) eine auf N definierte Aussageform. Wir setzenvoraus, dass Induktionsanfang und Induktionsschritt erfullt sind:Induktionsanfang: A(0) ist wahr.Induktionsschritt: Fur alle n ∈ N gilt: (A(n) =⇒ A(n+ 1))).Dann gilt fur alle n ∈ N die Aussage A(n).

Im Induktionsschritt nennt man A(n) die Induktionsvoraussetzung .

Beweis. SeiT := {n ∈ N | A(n)}.

Auf Grund des Induktionsanfangs ist 0 in T . Der Induktionsschritt besagt: wenn n ∈ T , dann istauch n + 1 in T . Die Menge T erfullt also die Eigenschaften in Peano-Axiom (P3) und somit giltT = N .

Viele Variation hiervon, z.B.

SATZ 2.2 (Vollstandige Induktion, Starke Version). Sei A(n) eine auf N definierte Aussage. Wirsetzen voraus, dass Induktionssanfang und der modifizierte Induktionsschritt erfullt sind:Induktionsanfang: A(0) ist wahr.Modifizierter Induktionsschritt: Fur alle n ∈ N gilt: Aus A(0) ∧A(1) ∧ . . . ∧A(n) folgt A(n+ 1)).Dann gilt fur alle n ∈ N die Aussage A(n).

Beweis. Ubungsblatt 4, Aufgabe 4

SATZ 2.3 (Dedekindscher Rekursionssatz). Sei M eine Menge, a ∈ M und g : M × N −→ Meine Abbildung. Dann gibt es genau eine Abbildung f : N −→M so dass f(0) = a und

∀n ∈ N : f(s(n)) = g(f(n), n).

2. VOLLSTANDIGE INDUKTION UND REKURSIVE DEFINITION 297

Naturlich kann man hier auch wieder n+ 1 statt s(n) schreiben.

Wenn eine Abbildung auf diese Art und Weise definiert wird, nennen wir dies eine rekursive Defi-nition.

Beweis. Wir beweisen zunachst durch vollstandige Induktion die folgende Aussage A(n), n ∈ N :

Es gibt eine eindeutige1 Abbildung fn : {0, 1, 2, . . . , n} −→M mit den Eigenschaften2

fn(0) = m und ∀i ∈ {0, 1, 2, . . . , n− 1} : fn(i+ 1) = g(fn(i), i).

Induktionsanfang: n = 0. Die Abbildung f0 : {0} −→ M , 0 7→ m ist solch eine Abbildung. Undes ist offensichtlich die einzige.

Induktionsschritt:Induktionsvoraussetzung: A(n)Also wir haben eine Abbildung fn wie oben.

Wir definieren dann

fn+1(i) :=

{fn(i) falls i ∈ {0, 1, 2, . . . , n},g(fn(n), n) falls i = n+ 1.

Diese Abbildung erfullt die in A(n + 1) genannte Eigenschaft und man sieht leicht, dass es dieeinzige ist.

Wir setzen nun: f(n) := fn(n). Die so definierte Abbildung f : N −→M erfullt die Eigenschaftendes Satzes.

Wir konnen nun Proposition 1.3 zeigen.

Beweis von Prop. 1.3. Wir definieren rekursiv F (1) = 1 und fur n ∈ N : F (s(n)) = s(F (n)). Dies

ergibt eine Abbildung F : N −→ N . Analog definiert man eine G : N −→ N durch G(1) = 1und G(s(n)) = s(G(n)). Man zeigt nun durch Induktion G ◦ F = ∆N und F ◦ G = ∆N , d.h.

G : N −→ N ist die Umkehrfunktion von F : N −→ N und somit ist F : N −→ N bijektiv. Dieubrigen Eigenschaften dieser Abbildung folgen direkt aus der Definition von F .

Aus Proposition 1.3 folgt: alles was wir fur aus den Peano-Axiomen heraus fur (N, s, 0) zeigen, giltauch fur (N ′, s′, 0′). Es ist also unerheblich, welches Modell wir nutzen. Wir nehmen nun eines her

1”eindeutig“ bedeutet: es gibt so eine Funktion, und dies ist die einzige Funktion, die das erfullt!

2Man muss sich an dieser Stelle eigentlich Gedanken machen, was hier mit {0, 1, 2 . . . , n} gemeint ist. Es ist die

Menge Kn mit den Eigenschaften

(1) 0 ∈ Kn,

(2) s#(Kn r {n}) ⊂ Kn,(3) Ist T eine Menge mit 0 ∈ T und s#(T r {n}) ⊂ T , dann gilt Kn ⊂ T .

Dann ist zu zeigen dass s(n) 6∈ Kn und Kn+1 = Kn ∪ {s(n)}. Man sieht also, dass Kn genau das ist, was wir uns

unter {0, 1, 2, . . . , n} vorstellen.


und schreiben ab sofort N an Stelle von N , n 7→ n+ 1 an Stelle von s und weiterhin 0. Wir nennenN die Menge der naturlichen Zahlen.

Beispiele 2.4.

(1) Addition: Sei M = N, g(m,n) := s(m), a ∈ N. Wir erhalten eine Abbildung αa : N −→ Nmit αa(0) = a und mit ∀n ∈ N : αa(s(n)) = s(aa(n)). Wir schreiben a+ n := αa(n). Furn = 1 stimmt dies mit der bisherigen Definition von a+ 1 uberein.

(2) Multiplikation: Sei M = N, i ∈ N, g : N × N −→ N, (m,n) 7→ m + i. Wir erhalten eineAbbildung µi : N −→ N mit µi(0) = 0 und mit ∀n ∈ N : µi(s(n)) = µi(n) + i. Wirschreiben i ·m := µi(m).

(3) Potenzieren: Sei M = N, i ∈ N, g : N × N −→ N, (m,n) 7→ m · i. Wir erhalten eineAbbildung pi : N −→ N mit pi(0) = 1 und mit ∀n ∈ N : pi(s(n)) = pi(n) · i. Wirschreiben im := pi(m).

(4) Fakultat : Sei M = N, g : N× N −→ N, (m,n) 7→ (n+ 1) ·m. Wir definieren dadurch dieAbbildung ! : N −→ N durch 0! := 1 und (m+ 1)! := m! · (m+ 1). Also n! = 1 · 2 · · · · · n.

SATZ 2.5. (N,+, ·) erfullt die folgenden Eigenschaften:

(Aa) Addition ist assoziativ.Fur alle x, y, z ∈ N gilt

(x+ y) + z = x+ (y + z).

(An) Addition hat neutrales Element.Es gibt ein Element 0 ∈ N, so dass fur alle x ∈ N gilt

x+ 0 = 0 + x = x.

(Ak) Addition ist kommutativ.Fur alle x, y ∈ N gilt

x+ y = y + x.

(Ma) Multiplikation ist assoziativ.Fur alle x, y, z ∈ N gilt


Es gibt ein Element 1 ∈ N, so dass fur alle x ∈ N gilt

x · 1 = 1 · x = x.

(Mk) Multiplikation ist kommutativ.Fur alle x, y ∈ N gilt

x · y = y · x.(AMd) Addition und Multiplikation erfullen das Distributivgesetz.

Fur alle x, y, z ∈ N gilt

x · (y + z) = x · y + x · z

3. ORDNUNG DER NATURLICHEN ZAHLEN 299

(y + z) · x = y · x+ z · x

Den Beweis kann man mit vollstandiger Induktion durchfuhren, die wir im nachsten Abschnittkennenlernen werden. Es ist eine gute Ubung, einmal die Kommutativitat der Addition durchvollstandige Induktion oder direkt aus den Peano-Axiomen herzuleiten. Dies ist etwas muhsam,aber prinzipiell moglich.

Offensichtlich ist 0 die einzige Zahl, die an Stelle von 0 die obige Eigenschaft erfullt. Wir nennen0 = 0 das neutrale Element der Addition. Analoges gilt fur 1 und 1, und man nennt 1 = 1 dasneutrale Element der Multiplikation.

LEMMA 2.6 (Kurzungsregel). Seien n,m, k ∈ N mit n+ k = m+ k. Dann gilt auch m = n.

In anderen Worten

∀n,m, k ∈ N : n+ k = m+ k =⇒ m = n.

Der Beweis folgt durch Induktion nach k (wird nicht im Detail ausgefuhrt).

LEMMA 2.7. Jede von 0 verschiedene naturliche Zahl ist Nachfolger einer naturlichen Zahl.

Beweis. Angenommen k ∈ N, k 6= 0 und k 6∈ s#(N). Definiere T := Nr {k}. Dann gilt 0 ∈ T unds#(T ) ⊂ T und somit erhalten wir den Widerspruch T = N.

LEMMA 2.8. Sind n,m ∈ N. Es gelte n+m = 0. Dann gilt n = m = 0.

Beweis. (Widerspruchsbeweis) Wir nehmen an, dass n 6= 0 oder m 6= 0. Da der Fall m 6= 0 ganzanalog zum Fall n 6= 0, genugt es den Fall n 6= 0 zu betrachten. 3 Dann gibt es eine Zahl k ∈ N mitn = s(k). Es folgt 0 = s(k) +m = s(k+m), was der Tatsache widerspricht, dass 0 kein Nachfolgereiner naturlichen Zahl ist.

Hier gabe es noch viel hinzuzufugen. Deswegen wird der Anhang evtl. hier noch erweitert.

3. Ordnung der naturlichen Zahlen

Wir definieren nun eine Relation:

≤:= {(n,m) ∈ N× N | ∃k ∈ N : m = n+ k}.

LEMMA 3.1. Diese Relation ≤ ist eine totale Ordnung auf N. Es gilt:

(1) Reflexivitat auf N: Fur alle m in N ist m ≤ m wahr.

3Da Satze in dieser Art oft vorkommen, sagt man”Ohne Beschrankung der Allgemeinheit (OBdA) gilt n 6= 0.“


(2) Antisymmetrie: Fur alle n und m in N gilt

n ≤ m ∧m ≤ n =⇒ n = m.

(3) Transitivitat: Fur alle n, m und k in N gilt:

n ≤ m ∧m ≤ k =⇒ n ≤ k.

(4) Totalitat: Fur alle n und m in N gilt

n ≤ m ∨m ≤ n

(5) Fur alle n ∈ N gilt n ≤ n+ 1.

Beweis. Aussagen (1), (3) und (5) sind offensichtlich.

Zu (2) (Antisymmetrie): Es gelte n ≤ m und m ≤ n. Dann gibt es k1, k2 ∈ N mit m = n+ k1 undn = m+ k2. Daraus folgt

n = m+ k2 = n+ k1 + k2.

Mit der Kurzungsregel (Lemma 2.6) folgt k1 + k2 = 0 und mit Lemma 2.8 ergibt sich k1 = k2 = 0.Also n = m.

Zu (4) (Totalitat): Zu n ∈ N definieren wir

Tn := {m ∈ N | m ≤ n ∨ n ≤ m}.

Man zeigt mit etwas Aufwand 0 ∈ Tn und s#(Tn) ⊂ Tn. Mit (P3) folgt Tn = N, also die Behaup-tung.

Definition 3.2. Sei R eine (partielle) Ordnungsrelation auf M . Ein Minimum (beziehungsweiseMaximum) ist ein Element m ∈M , so dass fur alle n ∈M gilt: mRn (bzw. nRm).

Bemerkung. Wegen der Antisymmetrie gibt es hochstens ein Minimum.

Beispiele: Das offene Intervall ]0, 1[ in R hat kein Minimum bezuglich ≤.

Die Menge M := {{a}, {b}, {a, b}} tragt die Ordnungsrelation ⊂. Es existiert kein Minimum in M .

PROPOSITION 3.3 (Wohlordnung von N). Sei A eine nichtleere Teilmenge von N, dann besitztA ein Minimum.

Beweis. Wir nehmen an, A besaße kein Minimum. Definiere

T := {n ∈ N | ∀k ∈ A : k > n}= {n ∈ N | ∀k ∈ N : (k ≤ n =⇒ k 6∈ A)}= {n ∈ N | ¬(∃k ∈ N : (k ≤ n ∧ k ∈ A))}.

Offensichtlich gilt 0 ∈ T : denn wenn 0 /∈ T ware, dann gabe es ein k ∈ N mit k ≤ 0 und k ∈ A,also 0 ∈ A; und dann ware 0 ein Minimum von A.

3. ORDNUNG DER NATURLICHEN ZAHLEN 301

Wir zeigen nun

(3.4) (n ∈ T ) =⇒ (n+ 1 ∈ T ).

Daraus folgt dann mit (P3) die Aussage T = N, also A = ∅.

Um (3.4) zu zeigen, nehmen wir an, es gebe ein n ∈ T mit n+ 1 6∈ T . Daraus folgt dann n+ 1 ∈ A,und aus n ∈ T folgt mit der Totalitat dann, dass n + 1 ein Minimum von A ist. Dies ist einWiderspruch zur obigen Annahme.

4

Bemerkung 3.5. Sei R eine totale Ordnung auf einer Menge M . Wir sagen, R ist eine Wohlord-nung oder (M,R) ist eine wohlgeordnete Menge, wenn jede nicht-leere Teilmenge A ein Minimumbesitzt. Die letzte Proposition besagt also, dass (N,≤) wohlgeordnet ist. Hingegen ist (R,≤) nichtwohlgeordnet. Man kann aber zeigen:

Zu jeder Menge M gibt es eine Wohlordnung auf M .

Diese Aussage ist zum Auswahlaxiom aquivalent, wenn wir die ubrigen Axiome der Mengenlehreannehmen.

4Alternativer Beweis: Wir nehmen an, A besitze kein Minimum. Zu zeigen ist, dass A die leere Menge ist. Wir

zeigen induktiv die AussageP (n) :⇐⇒ {0, 1, 2, . . . , n} ∩A = ∅,

woraus die Aussage folgt.

Induktionsanfang: Angenommen 0 ware in A. Dann ist 0 das Minimum. Da es aber kein Minimum in A gibt, folgt

0 6∈ A, also P (0).Induktionsschritt : Es gelte P (n). Falls n+ 1 ∈ A, so ist n+ 1 ein Minimum von A. Da es aber kein Minimum gibt,

gilt n+ 1 6∈ A, und somit P (n+ 1).

ANHANG C

Konstruktion von R mit Hilfe von Cauchy-Folgen

In diesem Anhang stellen wir eine alternative Moglichkeit dar, ein Modell fur die reellen Zahlen zukonstruieren, namlich mit Hilfe von Cauchy-Folgen. Wenn man die Einfuhrung von Cauchy-Folgenin diesem Anhang mit der Einfuhrung im Hauptteil in Abschnitt 1.6 vergleicht, so sieht man, dasswir in diesem Anhang einige Eingeschaften explizit prufen mussen, die im Hauptteil aus den imAbschnitt 6 behandelten Aussagen folgen. In Abschnitt 1.6 setzen wir voraus, dass wir bereitswissen, was R ist und dass jeder archimedisch geordnete Korper Teilkorper von R ist. Auch dieDefinition einer Cauchy-Folge muss leicht angepasst werden. 1

1. Mehr zu Aquivalenzrelationen

Wir besprechen hier Aquivalenzrelationen noch etwas detailierter als zuvor. Derartige Sachver-halte wurden bereits in der Linearen Algebra I im Detail behandelt. Wir wiederholen sie in derZentralubung am 26.11.2013, u.a. um sicherzustellen, dass auch diejenigen folgen konnen, die dieLineare Algebra I nicht horen.

UBUNG 1.1. Seit f : M −→ N eine Abbildung. Wir definieren

Rf := {(x, y) ∈M ×M | f(x) = f(y)}.Zeigen Sie, R ist eine Aquivalenzrelation.

Sei R eine Aquivalenzrelation auf M .

Fur x ∈M definieren wir die Aquivalenzklasse von x als

[x] := {y ∈M | xRy}.Man sagt auch x ist ein Reprasentant von [x] oder x reprasentiert [x].

UBUNG 1.2. Zeigen Sie, dass fur alle x, y ∈M gilt:

(a)y ∈ [x]⇐⇒ [x] = [y]

1Dieser Teil wurde von meinem fruheren Skript der Vorlesung im Wintersemester 2013/14 ubernommen. Leiderkonnen kleinere ubernahmebedingten Druckfehler nicht ganz ausgeschlossen werden. Auch werden manche Themender Hauptvorlesung hier potentiell verdoppelt.

303

304 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN

(b)

[x] = [y] Y [x] ∩ [y] = ∅.

UBUNG 1.3. Sei Rf wie oben definiert. Bestimmen Sie die Aquivalenzklassen.

Ist R eine Aquivalenzrelation auf M , so definieren wir den Quotient von M nach R als

M/R := {[x] | x ∈M}.

Die Abbildung [ · ] : M →M/R, x 7→ [x] nennt man die kanonische Projektion.

UBUNG 1.4. Sei eine Abbildung F : M −→ X gegeben und R eine Aquivalenzrelation auf M .

Zeigen Sie, es gibt genau dann eine Abbildung F : M/R −→ X, so dass F ◦ [ · ] = F , falls fur allex, y ∈M gilt

xRy =⇒ F (x) = F (y).

Die Abbildung F : M/R −→ X ist daraus eindeutig bestimmt.

M X

M/R

F

[ · ]F

Gilt sogar

xRy ⇐⇒ F (x) = F (y),

dann wissen wir noch zusatzlich, dass F injektiv ist.

Beispiel: Sei f : M −→ N , Rf wie oben. Dann gibt es eine eindeutige Abbildung f : M/Rf −→ N ,so dass

M N

M/Rf

f

[ · ]f

kommutiert. Außerdem ist f injektiv. Wir erhalten eine bijektive Abbildung f : M/Rf −→ B(f).

2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 305

2. Folgen, Konvergenz und Cauchy-Folgen

Wenn wir die reellen Zahl uber Cauchy-Folgen konstruieren wollen, so benotigen wir Begriffe wieKonvergenz, Cauchyfolgen und ahnliche fur beliebige archimedisch geordnete Korper. Wir durfenja insbesondere nicht nutzen, dass jeder solche Korper ein Unterkorper von R ist. Deswegen mussenwir in großen Teilen unsere Einfuhrung in Folgen und Reihen nochmals in etwas großerer Allge-meinheit wiederholen.

Wir schreiben im folgenden zumeist K fur einen geordneten Korper (K,+, ·,≤). Und |a| ∈ K≥0

sei (wie immer) der Betrag von a ∈ K.

Definition 2.1. Eine K-wertige Folge (ai)i∈N heißt beschrankt2 ,

:⇐⇒ {ai | i ∈ N} ist (nach oben und unten) beschrankt in K

⇐⇒ ∃r1, r2 ∈ K : ∀i ∈ N : r1 ≤ ai ≤ r2

⇐⇒ ∃r ∈ K : ∀i ∈ N : |ai| ≤ r⇐⇒ {|ai| | i ∈ N} ist beschrankt in K

Bemerkung 2.2. Falls K archimedisch ist, so gilt auch:

(ai)i∈N ist beschrankt in K ⇐⇒ ∃n ∈ N : ∀i ∈ N : |ai| ≤ n.

Die Implikation ⇐= ist klar, und =⇒ folgt direkt aus der archimedischen Eigenschaft

Definition 2.3 (Konvergenz von Folgen). Eine K-wertige Folge (ai)i∈N konvergiert 3 gegen a ∈ K,falls gilt

∀ε ∈ K>0 : ∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤ ε).Man nennt a den Grenzwert der Folge (ai)i∈N und schreibt a = limi→∞ ai oder ai → a fur i→∞.Wir sagen (ai)i∈N konvergiert, falls es ein derartiges a ∈ K gibt. Folgen, die gegen 0 konvergieren,

nennt man Nullfolgen. Falls eine Folge nicht konvergiert, so sagen wir dazu sie divergiert.

!ACHTUNG!. Wenn wir a = limi→∞ ai schreiben, so bedeutet dies immer:

• der Grenzwert existiert, und• der Grenzert ist a.

2Wenn man hier ganz exakt sein will, sollte man hier besser”beschrankt in K“ oder

”K-beschrankt“ sagen,

denn ob eine Folge beschrankt ist, hangt von K ab. Beispiel: Die Folge (i)i∈N ist unbeschrankt in Q, aber beschranktim Korper der rationalen Funktionen mit rationalen Koeffizienten. Sind aber K1 und K2 archimedische geordnete

Korper, so sieht man mit der unten stehenden Bemerkung, dass K1-Beschranktheit und K2-Beschranktheit die

gleiche Bedeutung haben.3Wenn man hier ganz exakt sein will, sollte man hier besser

”K-konvergiert“ sagen, denn ob eine Folge konver-

giert, hangt von K ab. Beispiel: Die Folge (1/i)i∈N Q-konvergiert in Q gegen 0, aber nicht im Korper der rationalenFunktionen mit rationalen Koeffizienten. Sind aber K1 und K2 archimedische geordnete Korper, so sieht man mit

einer der unten stehenden Bemerkungen, dass K1-Konvergenz und K2-Konvergenz die gleiche Bedeutung haben.


Bemerkungen 2.4.

(a) Falls eine Folge einen Grenzwert besitzt, so ist dieser eindeutig bestimmt. Seien a und a′ zweiGrenzwerte von (ai)i∈N. Zu einem gegebenen ε ∈ K>0 gilt also:

∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤ ε).∃i′0 ∈ N : ∀i ∈ N : (i ≥ i′0 =⇒ |ai − a′| ≤ ε).

Wahle nun so ein i0 und i′0. Dann gilt fur alle i ≥ max{i0, i′0}:|a− a′| ≤ |a− ai|+ |ai − a′| ≤ ε+ ε = 2ε.

Dies gilt fur alle ε ∈ K>0. Angenommen wir haben a 6= a′, so gilt dies insbesondere furε := |a − a′|/3 > 0. Also folgt 3ε ≤ 2ε und somit ergibt sich der Widerspruch ε ≤ 0. DieAnnahme a 6= a′ war also falsch, d.h. es gilt a = a′.

(b) Falls (ai)i∈N konvergiert, so ist (ai)i∈N beschrankt. Um dies zu zeigen, wahlen wir zu ε := 1ein passendes i0. Es gilt somit fur alle i ∈ N mit i ≥ i0:

|ai| ≤ |ai − a|+ |a| ≤ |a|+ 1.

Nun setzen wirr := max{|a1|, |a2|, . . . , |ai0−1|, |a|+ 1}.

Dann gilt fur alle i ∈ N: |ai| ≤ r. Somit ist (ai)i∈N beschrankt.(c) Ist K archimedisch, so gilt

a = limi→∞

ai ⇐⇒ ∀n ∈ N : ∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤1

n).

Die Implikation =⇒ ist klar, und ⇐= folgt aus Lemma 2.5.

LEMMA 2.5. Ist K archimedisch, dann gibt es fur alle ε ∈ K>0 ein n ∈ N mit ε ≥ (1/n).

Beweis. Zu 1/ε ∈ K gibt es ein n ∈ N mit 1/ε ≤ n, und dies ist aquivalent zu ε ≥ (1/n).

Beispiele 2.6. (a) Eine Folge (ai)i∈N heißt konstant, falls a1 = a2 = a3 = . . .. Konstante Folgensind beschrankt und konvergieren. a1 = limi→∞ ai.

(b) Sei K = Q. Dann ist ( 1i )i∈N eine Nullfolge. (Nutze z.B. Bem. 2.4 (c) und setze i0 := n).

(c) Die Folge((−1)i

)i∈N hat 1 als obere und −1 als untere Schranke und ist somit beschrankt.

Wir werden bald sehen, dass sie nicht konvergiert.

Definition 2.7. Sei (ai)i∈N eine Folge von Elementen ai ∈M . Sei f : N→ N eine Abbildung mitder Eigenschaft

∀i, j ∈ N : i < j =⇒ f(i) < f(j)

(Man sagt zu dieser Eigenschaft: f ist streng monoton wachsend .) Dann nennt man (af(k))k∈N eineTeilfolge von (ai)i∈N.

Beispiel 2.8. Die Folge (i)i∈N hat folgende Teilfolgen:4

4Diese Folge hat naturlich noch viel mehr Teilfolgen. U.a. gibt es sogar Teilfolgen, die man gar nicht beschreiben

kann. Wieso es nicht beschreibbare Teilfolgen gibt, kann erst spater erklart werden.


• sich selbst,• die Folge der ungeraden Zahlen (1, 3, 5, 7, . . .),• die Folge der Primzahlen (2, 3, 5, 7, . . .).

Konvergiert (ai)i∈N gegen a, so konvergiert jede Teilfolge ebenfalls gegen a.

LEMMA 2.9. Die Folge((−1)i

)i∈N aus Beispiele 2.6 (c) divergiert.

Beweis. Angenommen, die Folge((−1)i

)i∈N konvergiert gegen ein a ∈ K. Dann konvergieren auch

die Teilfolgen((−1)2k

)k∈N = (1)k∈N und

((−1)2k+1

)k∈N = (−1)k∈N gegen a. Da diese Teilfolgen

konstant sind, erhalten wir a = 1 und a = −1, was in K nicht moglich ist, denn es gilt ja−1 < 0 < 1.

UBUNG 2.10. Seien (ai)i∈N und (bi)i∈N konvergente Folgen. Dann gilt:

limi→∞

(ai + bi) = limi→∞

ai + limi→∞

bi

limi→∞

(ai − bi) = limi→∞

ai − limi→∞

bi

limi→∞

(ai · bi) = limi→∞

ai · limi→∞

bi

Gilt zusatzlich: ∀i ∈ N : bi 6= 0, und ist (bi)i∈N keine Nullfolge, so gilt auch

limi→∞

aibi

=limi→∞

ai

limi→∞

bi.

Die Beweise sind ahnlich wie in der folgenden Proposition.

Definition 2.11. Eine K-wertige Folge (ai)i∈N heißt Cauchy-Folge,5 falls

∀ε ∈ K>0 : ∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0) =⇒ |ai − aj | ≤ ε.PROPOSITION 2.12.

(1) Jede konvergente Folge ist eine Cauchy-Folge.(2) Jede Cauchy-Folge ist beschrankt.(3) Seien (ai)i∈N und (bi)i∈N Cauchy-Folgen. Dann sind (ai + bi)i∈N, (ai − bi)i∈N und (ai · bi)i∈N

ebenfalls Cauchy-Folgen.

(4) Zusatzlich zu den Voraussetzungen in (3) gelte ∀i ∈ N : bi 6= 0, und die Folge (bi)i∈N sei keine

Nullfolge. Dann ist auch(aibi

)i∈N

eine Cauchy-Folge.

Um die Proposition zu zeigen, nutzen wir ein Lemma.

5Genau genommen musste man hier wieder sagen: eine K-Cauchy-Folge, da die Definition zuachst von K

abhangt. Die Bedeutung ist dann aber fur alle archimedischen Korper dieselbe.


LEMMA 2.13. Sei A( · ) eine auf K>0 definierte Aussageform, und q ∈ K>0. Dann gilt

∀ε ∈ K>0 : A(ε) ⇐⇒ ∀ε ∈ K>0 : A(qε)

Das Lemma gibt es vielen Variationen. Wichtiger als die Aussage des Lemmas ist es, zu verstehen,wie man das Lemma (oder eine Variation davon!) kurz beweist.

Beweis des Lemmas.

”=⇒“: Es gelte

(2.14) ∀ε ∈ K>0 : A(ε).

Fur ein gegebenes ε > 0 wollen wir nun A(qε) zeigen. Wir wenden (2.14) fur ε := qε an, und habendann das gewunschte.

”⇐=“: Analog mit ε := q−1ε

Beweis der Proposition.(1): Es gelte limi→∞ ai = a. Das heißt: fur alle ε ∈ K>0 gibt es ein i0 ∈ N, so dass fur allenaturlichen Zahlen i ≥ i0 gilt: |ai − a| ≤ ε.

Fur solch ein ε und ein passendes i0 nehmen wir nun naturliche Zahlen i ≥ i0 und j ≥ i0 undrechnen nach:

|ai − aj | ≤ |ai − a|+ |a− aj | ≤ ε+ ε = 2ε.


∀ε ∈ K>0 : A(2ε),

wobei A(·) die folgende auf K>0 definierte Aussageform ist

A(ε) :⇐⇒ ∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0) =⇒ |ai − aj | ≤ ε

Nach dem obigen Lemma ist dies aquivalent zu

∀ε ∈ K>0 : A(ε)

und dies ist gerade die Definition einer Cauchy-Folge.

(2): Ahnlich wie Bemerkung 2.4 (b).

(3): Angenommen (ai)i∈N und (bi)i∈N seien Cauchy-Folgen. Dies bedeutet, dass wir fur jedes ε ∈K>0 die folgenden Aussagen haben:

∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0) =⇒ |ai − aj | ≤ ε∃j0 ∈ N : ∀i, j ∈ N : (i ≥ j0 ∧ j ≥ i0) =⇒ |bi − bj | ≤ ε

Wir wahlen nun solch ein i0 und solch ein j0. Wir setzen k0 := max{i0, j0}. Dann gilt fur diesesk0:

∀i, j ∈ N : (i ≥ k0 ∧ j ≥ k0) =⇒ |ai − aj | ≤ ε ∧ |bi − bj | ≤ ε.


Wir rechnen fur i, j ≥ k0:

|(ai + bi)− (aj + bj)| = |(ai − aj) + (bi − bj)| ≤ |ai − aj |+ |bi − bj | ≤ ε+ ε = 2ε.

Also ergibt sich insgesamt

∀ε ∈ K>0 : ∃k0 ∈ N : ∀i, j ∈ N : (i ≥ k0 ∧ j ≥ k0) =⇒ |(ai + bi)− (aj + bj)| ≤ 2ε.

Nach dem obigen Lemma konnen wir auch hier 2ε durch ε ersetzen. Dann steht hier gerade dieDefinition, dass (ai + bi)i∈N eine Cauchy-Folge ist.

Der Beweis fur (ai − bi)i∈N ist vollig analog.

Fur das Produkt (ai · bi)i∈N muss man etwas anders vorgehen. Zunachst nutzen wir die Tatsache,dass (ai)i∈N und (bi)i∈N beschrankt sind. Also gibt es ein r ∈ K mit

∀i ∈ N : |ai| ≤ r ∧ |bi| ≤ r

Dann argumentieren wir wie bei der Summe, rechnen dann aber:

|aibi − ajbj | = |ai(bi − bj) + (ai − aj)bj | ≤ |ai||bi − bj |+ |ai − aj ||bj | ≤ rε+ εr = 2rε.

Nun argumentiert man wie bei der Summe, wobei man das Lemma mit q := 2r nutzt.

(4): Es reicht zu zeigen: Sei (bi)i∈N eine Folge wie oben, dann ist ( 1bi

)i∈N ebenfalls eine Cauchy-

Folge. Die eigentliche Aussage folgt dann mit (3).

Wir zeigen zunachst durch Widerspruch, dass ( 1bi

)i∈N beschrankt ist. Angenommen ( 1bi

)i∈N seinicht beschrankt, dann gilt

∀r ∈ K : ∃n ∈ N :

∣∣∣∣ 1

bn

∣∣∣∣ > r.

Dies impliziert

∀r ∈ K>0 : ∃n ∈ N : |bn| <1

rund dies ergibt

(2.15) ∀δ ∈ K>0 : ∃n ∈ N : |bn| < δ,

wobei die folgende Variation des obigen Lemmas benutzt wurde

∀r ∈ K>0 : A(1/r) ⇐⇒ ∀δ ∈ K>0 : A(δ).

Die Folge (bi)i∈N ist eine Cauchy-Folge. Zu einem gegebenen ε ∈ K>0 gibt es also ein i0 ∈ N, sodass gilt

(2.16) ∀i, j ∈ N : i ≥ i0 ∧ j ≥ i0 =⇒ |bi − bj | ≤ ε

Wir wahlen nun zu diesem i0:

δ :=min{ε, |b1|, |b2|, . . . , |bi0 |}

2.


Mit (2.15) erhalten wir ein n ∈ N mit |bn| < δ. Auf Grund der Definition von δ gilt n > i0. Mit(2.16) folgt:

∀j ∈ N : j ≥ i0 =⇒ |bn − bj | ≤ εund mit der Rechnung

|bj | ≤ |bj − bn|+ |bn| ≤ ε+ε

2≤ 2ε

folgt

∀ε ∈ K>0 : ∃i0 ∈ N : ∀j ∈ N : j ≥ i0 =⇒ |bj − 0| ≤ 2ε.

Dies ergibt unter Nutzung des Lemmas fur q = 2, dass (bj)j∈N eine Nullfolge ist. Dies ist einWiderspruch zur Annahme. Also haben wir die Beschranktheit gezeigt, d.h.

∃r ∈ K : ∀n ∈ N :

∣∣∣∣ 1

bn

∣∣∣∣ ≤ r.Nun sei wiederum ε > 0 und i0 wie oben. Wir rechnen dann∣∣∣∣ 1

bi− 1

bj

∣∣∣∣ ≤ ∣∣∣∣bj − bibibj

∣∣∣∣ ≤ |bj − bi||bi||bj |≤ r2ε

Unter Nutzung des Lemmas fur q = r2 erhalten wir, dass ( 1bi

)i∈N eine Cauchy-Folge ist.

Definition 2.17. Wir sagen K ist vollstandig , falls jede K-wertige Cauchy-Folge in K konvergiert.

Definition 2.18. Sei A( · ) eine auf N definierte Aussageform.

Fur fast alle i ∈ N gilt A(i)

:⇐⇒ Es gibt ein i0 ∈ N, so dass fur alle i ∈ N: i ≥ i0 =⇒ A(i)

⇐⇒ Die Menge {i ∈ N | ¬A(i)} ist endlich

Beispiel: limi→∞ ai = a ⇐⇒ Fur alle ε ∈ K>0 gilt fur fast alle i ∈ N: |ai − a| ≤ ε 6⇐⇒ Fur fastalle i ∈ N gilt fur alle ε ∈ K>0: |ai − a| ≤ ε

Notation: Da wir immer wieder Ausdrucke der Art

∀i ∈ N : i ≥ i0 =⇒ A(i)

haben, schreiben wir hierfur kurz

∀i ∈ {i0, i0 + 1, . . .} : A(i).

LEMMA 2.19. Besitzt eine Cauchy-Folge eine konvergente Teilfolge, so ist die Cauchy-Folge be-reits konvergent.

Beweis. Sei nun (ai)i∈N eine Cauchy-Folge, sei f : N −→ N eine streng monotone wachsendeAbbildung, und sei (af(n))n∈N eine konvergente Teilfolge mit Grenzwert a.

Es gilt fur ein zunachst fixiertes ε ∈ K>0:

(2.20) ∃i0 ∈ N : ∀i, j ∈ {i0, i0 + 1, . . .} : |ai − aj | ≤ ε.


und

(2.21) ∃n0 ∈ N : ∀n ∈ {n0, n0 + 1, . . .} : |af(n) − a| ≤ ε.

Fur solche i0 und n0 setzen wir k0 := max{i0, f(n0)}. Da f streng monoton wachsend ist, konnenwir ein n ∈ {n0, n0 + 1, . . .} wahlen mit f(n) ≥ k0. 6 Wir wahlen dann j := f(n) und haben somitfur alle i ∈ {i0, i0 + 1, . . .} erhalten:

|ai − a| ≤ |ai − af(n)|+ |af(n) − a| ≤ ε+ ε ≤ 2ε.

Wir haben also insgesamt gezeigt:

∀ε ∈ K>0 : ∃i0 ∈ N : ∀i ∈ {i0, i0 + 1, . . .} : |ai − a| ≤ 2ε.

Und wenn wir Lemma 2.13 verwenden mit q = 2, erhalten wir limi→∞ ai = a.

SATZ 2.22. Sei K ein geordneter Korper. Dann sind aquivalent:

(1) K erfullt die Supremumseigenschaft(2) K ist archimedisch und vollstandig

Beweis.”(1) =⇒ (2)“: Angenommen K erfulle die Supremumseigenschaft. Wir haben bereits

gesehen, dass dann K archimedisch ist.

Sei nun (ai)i∈N eine Cauchy-Folge. Wir definieren

M := {x ∈ K | Fur fast alle i ∈ N gilt: x ≤ ai},= {x ∈ K | ∃i0 ∈ N : ∀i ∈ {i0, i0 + 1, . . .} : x ≤ ai}.

Jede Cauchy-Folge ist beschrankt. Es gibt also r1, r2 mit ∀i ∈ N : r1 ≤ ai ≤ r2. Dann gilt r1 ∈Mund r2 ist eine obere Schranke von M . Da M nicht-leer und nach oben beschrankt ist, existierta := supM ∈ K.

Wir wollen zeigen: limi→∞ ai = a.

Sei ε ∈ K>0. Dann ist a+ ε 6∈M , denn sonst ware a keine obere Schranke von M . Also

(2.23) ∀i0 ∈ N : ∃i ∈ {i0, i0 + 1, . . .} : a+ ε > ai.

Andererseits gilt: x′ ≤ x ∈M =⇒ x′ ∈M . Ware a− ε 6∈M wahr, dann ware auch a− ε eine obereSchranke, also a nicht das Supremum. Somit wissen wir a− ε ∈M . Wir erhalten

(2.24) ∃k0 ∈ N : ∀k ∈ {k0, k0 + 1, . . .} : a− ε ≤ ak.

Sei nun j0 ∈ N gegeben. Wir wahlen ein k0 wie in (2.24). Wende (2.23) mit i0 := max{k0, j0} an.Dann existiert ein i ∈ {i0, i0 + 1, . . .} mit a + ε > ai und a − ε ≤ ai, also mit |ai − a| ≤ ε. Wirhaben gezeigt

(2.25) ∀ε ∈ K>0 : ∀j0 ∈ N : ∃i ∈ {j0, j0 + 1, . . .} : |ai − a| ≤ ε.

6Man zeigt dazu zunachst f(a+ b) ≥ f(a) + b. Dann sieht man, dass es fur n := n0 + (k0 − f(n0)) erfullt ist.


Wir definieren nun f : N −→ N rekursiv. Wahle f(1) := 1. Ist f(n) gewahlt, so wenden wir (2.25)mit ε := 1/(n + 1) und j0 := f(n) + 1 an. Fur das so erhaltene i setzen wir f(n + 1) := i. Dannist (af(n))n∈N eine Teilfolge und |af(n)− a| ≤ 1/n. Daraus folgt a = limn→∞ af(n). Da (ai)i∈N eineCauchy-Folge mit einer konvergenten Teilfolge ist, folgt mit Lemma 2.19 dann limi→∞ ai = a.

”(2) =⇒ (1)“: Angenommen K ist archimedisch und vollstandig. Sei ∅ 6= M ⊂ K, r ∈ K, ∀x ∈M : x ≤ r. Fur jedes q ∈ N finden wir ein p ∈ N mit qr ≤ p. Die Menge

Aq := {p ∈ Z | pq

ist obere Schranke von M}

ist somit nicht-leer. Zu einem x ∈M bestimme nun s ∈ Z mit s ≤ qx < s+ 1 (analog zu Aufgabe4a) auf Ubungsblatt 6). Dieses s ist untere Schranke von Aq ⊂ Z. Jede nach unten beschranktenicht-leere Teilmenge von Z hat ein Minimum. 7 Somit existiert

pq := minAq ∈ Z.

Dann ist also aq :=pqq ∈ Q eine obere Schranke von M , wohingegen

pq−1q keine obere Schranke

von M ist, d.h. es gibt ein xq ∈ M mit aq − (1/q) < xq. Es folgt fur alle q, i ∈ N: aq − (1/q) ≤ aiund dies wiederum besagt |aq − ai| ≤ max{1/q, 1/i}. Deswegen ist (ai)i∈N eine Cauchy-Folge, dieauf Grund der Annahme gegen ein a ∈ K konvergiert. Man sieht leicht, dass der Grenzwert vonoberen Schranken wieder eine obere Schranke ist. Ebenso sind alle ai− (1/i) keine obere Schranke,und da K archimedisch ist, gibt es keine kleinere obere Schranke von M . Mit anderen Worten: aist die kleinste obere Schranke von M , also a = supM .

3. Existenz und Eindeutigkeit der reellen Zahlen

Wir wollen nun zeigen, dass es mindestens ein Modell der reellen Zahlen gibt (Existenzaussa-ge), und dass je zwei Modelle (kanonisch) isomorph sind (Eindeutigkeitsaussage). Im Gegensatzzu Abschnitt 6.4 in Kapitel 2 wollen wir dies nicht mit Dedekindschen Schnitten, sondern mitCauchy-Folgen durchfuhren. Wie so oft in der Mathematik ist es am besten mit der Eindeutig-keitsaussage anzufangen, denn der Beweis der Eindeutigkeit liefert entscheidende Ideen fur denBeweis der Existenz. Die verwendete Technik heißt Vervollstandigung und ist in leicht veranderterForm fur viele Anwendungen der Mathematik (partielle Differentialgleichungen, Quantenmechanik,Allgemeine Relativitatstheorie,. . . ) sehr wichtig.

Sei CF die Menge aller Q-wertigen Cauchy-Folgen.

Angenommen (K,+, ·,≤) sei ein Modell der reellen Zahlen, d.h. (K,+, ·,≤) ist ein geordneterKorper mit Supremumseigenschaft. Wir betrachten wieder die injektive Abbildung iQ : Q −→ K,die Addition, Multiplikation und die Ordnung erhalt, siehe Lemma 5.7 in Kapitel 2. Fur (ai)i∈N ∈CF ist dann (iQ(ai))i∈N eine Cauchy-Folge in K. Da K die Supremumseigenschaft hat, existiertf((ai)i∈N) := limi→∞ iQ(ai). Wir erhalten eine Abbildung f : CF −→ K.

7Denn ist A solche eine Teilmenge und s eine unter Schranke dann ist {p − s | p ∈ A} ⊂ N und hat deswegen

nach Proposition 3.3 in Anhang 3 ein Minimum. Dann aber auch A.

3. EXISTENZ UND EINDEUTIGKEIT DER REELLEN ZAHLEN 313

Nun definieren wir eine Addition und Multiplikation auf CF :

+ : CF × CF → CF (ai)i∈N + (bi)i∈N := (ai + bi)i∈N

· : CF × CF → CF (ai)i∈N · (bi)i∈N := (ai · bi)i∈NMan sieht leicht, dass (CF,+, ·) ein kommutativer Ring mit Eins ist. Hierbei ist (0)i∈N das neu-trale Element der Addition und (1)i∈N das neutrale Element der Multiplikation. Es ist aber keinKorper, denn die Cauchy-Folge (0, 1, 1, 1, . . .) besitzt kein multiplikatives Inverses. Außerdem be-sagt Ubung 2.10, dass f Addition und Multiplikation erhalt.

Die Abbildung f ist nicht injektiv. Es gilt:

f((ai)i∈N) = f((bi)i∈N) ⇐⇒ (ai − bi)i∈N ist eine Nullfolge.

Definition 3.1. Fur (ai)i∈N, (bi)i∈N ∈ CF definieren wir die Relation ∼⊂ CF × CF durch

(ai)i∈N ∼ (bi)i∈N ⇐⇒ (ai − bi)i∈N ist eine Nullfolge.

Auf R := CF/ ∼ definieren wir Addition und Multiplikation wie folgt:

+ : R× R→ R [(ai)i∈N] + [(bi)i∈N] := [(ai + bi)i∈N]

· : R× R→ R [(ai)i∈N] · [(bi)i∈N] := [(ai · bi)i∈N]

Die Ordnung definieren wir wie folgt:

[(ai)i∈N] > [(bi)i∈N] :⇐⇒ ∃ε ∈ Q>0 : fur fast alle i ∈ N gilt ai ≥ bi + ε.

Man kann sich uberlegen, dass hierdurch eine totale Ordnung auf R definiert wird.

PROPOSITION 3.2. Die Addition und Multiplikation auf R sind wohldefiniert 8 und (R,+, ·,≤)ist ein geordneter Korper. Die Abbildung [ · ] : CF −→ R, (aj)j∈N 7→ [(aj)j∈N] bewahrt die Addi-tion, die Multiplikation und sendet die Eins von CF auf die Eins von R. (Man nennt dies einenHomomorphismus von Ringen mit Eins.)

Beweisskizze. Der Beweis ist nun einfach, nur die Existenz eines multiplikativen Inversen ist etwastrickreich. Das Null-Element ist [(0)i∈N] =: 0.

Sei [(bi)i∈N] 6= 0. Dann ist (bi)i∈N keine Nullfolge. Das heißt:

∃ε ∈ Q>0 : ∀i0 ∈ N : ∃i ∈ {i0, i0 + 1, . . .} : |bi| ≥ εWir 9 zeigen zunachst, dass {i ∈ N | bi = 0} endlich ist. 10

Angenommen {i ∈ N | bi = 0} ware unendlich groß, dann gibt es eine injektive Funktion f : N −→N mit ∀n ∈ N : bf(n) = 0. Dies bedeutet, dass (bi)i∈N eine Cauchy-Folge mit einer konvergenten

8”Wohldefiniert“ bedeutet hier: die Definition hangt nur von der Aquivalenzklasse ab und nicht von der Wahl

des Reprasentanten. Da wir ja eine Abbildung definieren wollen, die einer Aquivalenzklasse etwas zurodnet, ist dieseEigenschaft das, was wir zeigen mussen, um zu sehen, dass diese Definitionen von + und · sinnvolle Definitionen

sind.9Beweis ab hier etwas anders als in der Vorlesung auf Grund einer Nachfrage10Die leere Menge ist auch endlich, ist also hier nicht ausgeschlossen.


Teilfolge ist. Wenn wir nun Lemma 2.19 anwenden, folgt daraus, dass (bi)i∈N eine Nullfolge ist. Dasheißt wir erhalten den Widerspruch [(bi)i∈N] = 0. Wir haben somit gesehen, dass {i ∈ N | bi = 0}endlich ist.

Nun definieren wir

bi :=

{bi falls bi 6= 0

1 falls bi = 0

Fur fast alle i ∈ N gilt bi = bi, und somit bekommen wir auch [(bi)i∈N] = [(bi)i∈N]. Auf die Folge

(bi)i∈N konnen wir nun Proposition 2.12 (4) anwenden. Wir sehen, dass

ci :=1

bi=

{(bi)−1 falls bi 6= 0

1 falls bi = 0

eine Cauchy-Folge ist.

Es gilt dann fur fast alle i ∈ N: ci · bi = 1, und deswegen gilt

[(ci)i∈N] · [(bi)i∈N] = [(ci)i∈N] · [(bi)i∈N] = [(1)i∈N].

Man beachte: die obige Definition, die obige Proposition und der Beweis benotigen die Existenzeines Modells nicht.

Beweis der Eindeutigkeit bis auf Isomorphie. Nehmen wir also wieder wie oben an, dass einModell (K,+, ·,≤) existiert. Dann gibt es genau eine Abbildung F : R −→ K, so dass das folgendeDiagramm kommutiert11

CF K

R

f

[ · ]F

Alle Abbildungen hier erhalten Addition und Multiplikation und bilden die Eins auf die Eins ab.Außerdem ist F injektiv und erhalt die Ordnung. Da R archimedisch geordnet ist, erhalten wir ausWS 2013/14 Aufgabe 4d) von Ubungsblatt 6, dass f : CF −→ K und somit F : R −→ K surjektivist. Also ist F : CF −→ K ein Isomorphismus von geordneten Korpern und Satz 6.8 aus Kapitel 2

folgt im Fall K = R. Wenn nun (K,+, · ≤) und (K, +, ·, ≤) zwei Modelle der reellen Zahlen sind,

so erhalten wir Isomorphismen F : R −→ K und F : R −→ K. Dann ist auch F ◦ F−1 : K −→ K

ein Isomorphismus und Satz 6.8 aus Kapitel 2 ist fur alle K gezeigt.

11”kommutiert“ bedeutet hier F ◦ [ · ] = f .

3. EXISTENZ UND EINDEUTIGKEIT DER REELLEN ZAHLEN 315

Wie bereits in Lemma 5.7 aus Kapitel 2 gesehen, gibt es nun eine injektive Abbildung iQ : Q −→R, die Addition, Multiplikation und die Ordnung erhalt. Es gilt hier iQ(a) = [(a)i∈N], d.h. dierationalen Zahlen werden von konstanten Cauchy-Folgen reprasentiert.

Beweis Existenz. Wir zeigen, dass (R,+, ·,≤) archimedisch und vollstandig ist. Dann haben wiralso ein Modell, d.h. Satz 6.7 aus Kapitel 2 ist gezeigt.

Zur archimedischen Eigenschaft: Sei ein Element x ∈ R gegeben. Zu zeigen ist: es gibt ein n ∈ Nmit x ≤ iN(n). Es gibt nun eine Q-wertige Cauchy-Folge (ai)i∈N mit x = [(ai)i∈N]. Die Cauchy-Folge ist beschrankt, d.h. es gibt ein r ∈ Q mit ∀i ∈ N : |ai| ≤ r. Da Q archimedisch ist, gibt esein n ∈ N mit r ≤ n. Man zeigt dann leicht, dass

x = [(ai)i∈N] ≤ [(n)i∈N] = iN(n).

Zur Vollstandigkeit: Sei (xi)i∈N eine R-wertige Cauchy-Folge. Falls es ai ∈ Q gibt mit xi = iQ(ai) =(ai)n∈N,12 dann (ai)i∈N ∈ CF und es gilt dann

limi∈N

xi = [(ai)i∈N].

Der allgemeine Fall ist ein bisschen aufwandiger und soll nur skizziert werden. Wir schreiben

xi = [(ai,n)n∈N].

Man nutzt nun die Tatsache, dass sowohl (xi)i∈N eine Cauchy-Folge in R ist als auch dass fur allei ∈ N die Folge (ai,n)n∈N eine Cauchy-Folge in Q ist, und konstruiert damit eine streng monotonwachsende Abbildung f : N −→ N,13 so dass wiederum (ai,f(i))i∈N eine Cauchy-Folge ist. Mannennt solch eine Folge eine Diagonalfolge. Außerdem kann man nun

limi∈N

xi = [(ai,f(i))i∈N]

zeigen.

Ab jetzt identifizieren wir Q mit seinem Bild in R vermoge iQ.

12Hier ist kein Druckfehler. Gemeint ist die konstante Folge, die konstant ai ist.13Hier steckt etwas Konstruktionsarbeit, die wir (momentan) uberspringen.

ANHANG Z

Uberblick uber algebraische Strukturen

(Aa) Addition ist assoziativ.Fur alle x, y, z ∈ X gilt

(x+ y) + z = x+ (y + z).

(An) Addition hat neutrales Element.Es gibt ein Element 0 ∈ X, so dass fur alle x ∈ X gilt

x+ 0 = 0 + x = x.

Man nennt 0 das neutrale Element der Addition.(Ai) Addition hat inverse Elemente.

Zu jedem x ∈ X gibt es ein y ∈ X, so dass

x+ y = y + x = 0.

Man nennt y das Inverse von x bezuglich der Addition und schreibt normalerweise −xanstelle von y.

(Ak) Addition ist kommutativ.Fur alle x, y ∈ X gilt

x+ y = y + x.

(Ma) Multiplikation ist assoziativ.Fur alle x, y, z ∈ X gilt


Es gibt ein Element 1 ∈ X, so dass fur alle x ∈ X gilt

x · 1 = 1 · x = x.

Man nennt 1 das neutrale Element der Multiplikation.(Mi) Multiplikation hat inverse Elemente.

Zu jedem x ∈ X r {0} gibt es ein y ∈ X, so dass

x · y = y · x = 1.

Man nennt y das Inverse von x bezuglich der Multiplikation und schreibt normalerweisex−1 anstelle von y.

317

318 Z. UBERBLICK UBER ALGEBRAISCHE STRUKTUREN

(Mk) Multiplikation ist kommutativ.Fur alle x, y ∈ X gilt

x · y = y · x.(AMd) Addition und Multiplikation erfullen das Distributionsgesetz.

Fur alle x, y, z ∈ X gilt

x · (y + z) = x · y + x · z(y + z) · x = y · x+ z · x

Literaturverzeichnis

[1] H. Amann, J. Escher, Analysis I, Birkhauser

[2] H. Amann, J. Escher, Analysis II, Birkhauser[3] H. Amann, J. Escher, Analysis III, Birkhauser

[4] H. Amann, Gewohnliche Differentialgleichungen, de Gruyter

[5] G. Aumann, O. Haupt, Einfuhrung in die reelle Analysis, de Gruyter[6] M. Barner, F. Flohr, Analysis I, de Gruyter

[7] M. Barner, F. Flohr, Analysis II, de Gruyter

[8] C. Blatter, Analysis 1, Springer[9] T. Brocker, Analysis I, Spektrum

[10] T. Brocker, Analysis II, BI Wissenschaftsverlag[11] E. A. Coddington, N. Levinson, Theory of ordinary differential equations, McGraw Hill

[12] O. Deiser, Einfuhrung in die Mengenlehre, Springer

[13] H.D. Ebbinghaus, Einfuhrung in die Mengenlehre, BI Wissenschaftsverlag[14] O. Forster, Analysis 1, Vieweg Studium

[15] O. Forster, Analysis 2, Vieweg Studium

[16] O. Forster, Analysis 3, Vieweg Studium[17] U. Friedrichsdorf, A. Prestel, Mengenlehre fur den Mathematiker, Vieweg Studium

[18] D. Grieser, Analysis I, Spriger Studium Mathematik

[19] D. Grieser, Vorlesungsskript Analysis I, Universitat Oldenburg[20] P. R. Halmos, Naive Mengenlehre, Vandenhoeck und Ruprecht

[21] S. Hildebrandt, Analysis I, Springer

[22] K. Konigsberger, Analysis 1, Springer[23] K. Konigsberger, Analysis 2, Springer

[24] S. Lang, Real and functional analysis, Springer[25] C. Loh, Vorlesungsskript Analysis I, Universitat Regensburg

[26] C. Loh, Vorlesungsskript Analysis II, Universitat Regensburg

[27] A. Peyerimhoff, Gewohnliche Differentialgleichungen I und II, Akademische Verlagsgesellschaft Wiesbaden[28] L. Perko, Differential equations and dynamical systems, Third edition, Springer

[29] B. v. Querenburg, Mengentheoretische Topologie, Springer

[30] W. Rudin, Analysis, Oldenbourg[31] W. Rudin, Reelle und komplexe Analysis, Oldenbourg

[32] L. A. Steen, J. A. Seebach, Counterexamples in Topology[33] W. Walter, Analysis 1, Springer[34] W. Walter, Analysis 2, Springer

[35] W. Walter, Gewohnliche Differentialgleichungen, Springer

319

Stichworte

C1-Diffeomorphismus, 232

C`-Diffeomorphismus, 232

C`-Immersion, 243

n-dimensionale Sphare, 235

p-Norm, 178

Aquivalenzklasse, 303

Aquivalenzrelation, 23

aquivalent, 6, 8

aquivalente Normen, 180

uberabzahlbar, 29

Abbildung, 26

abgeschlossen, 128

abgeschlossene Hulle, 187

Ableitung, 135, 203

der Umkehrfunktion, 139

Abschluss, 187

Absolutbetrag, 53

absolute Konvergenz, 100

abzahlbar, 29

Addition, 298

von Dedekindschen Schnitten, 62

Allquantor, 16

alternierende Reihe, 101

analytisch, 175

Anfangswert, 263

antisymmetrisch, 23

archimedisch geordneter Korper, 52

archimedisches Axiom, 52

Attraktor, 285

auf Y induzierte Topologie, 186

Aussage, 5

Aussageform, 7

aussagenlogische Formel, 7

aussagenlogische Verknupfung, 6

Aussonderungsmengenaxiom, 291

Auswahlaxiom, 291

autonom, 257

Axiom

archimedisches, 52

Axiome der Mengenlehre, 290

Axiome der reellen Zahlen, 4

Ball , 128

Banachraum, 182

beschrankt, 56, 77, 305

beschrankt im normierten Raum, 179

beschrankte Funktion, 178

Betragsfunktion, 53

der komplexen Zahlen, 73

bijektiv, 27

Bild, 30

Bild der Relation, 25

Binomialkoeffizient, 44

Bolzano-Weierstraß

Satz von, 89, 181

Cauchy-Folge, 89, 307

Cauchy-Produkt, 107

Dedekindscher Schnitt, 60

Definitheit der Norm, 177

Definitionsbereich, 25

Definitionsmenge, 12

Dezimal-Darstellung, 91

dicht, 188

Diffeomorphismus, 232

Differential, 203

Differentialgleichung

autonome, 257

explizite gewohnliche, 260

gewohnliche, 257

homogen, 273

inhomogen, 273

lineare, 273

partielle, 258

Differenz

321

322 STICHWORTE

symmetrische, 14

Differenzenquotient, 135

differenzierbar, 135, 203disjunkt, 15

diskrete Topologie, 186

Divergenzvon Folgen, 77, 305

Dreiecksungleichung der Norm, 177

Einbettung, 247

Einschrankung, 27

elliptisches Paraboloid, 224endlich, 29

endliche Teiluberdeckung, 196

Entwicklungspunkt, 144Erhaltungsgroße, 261

Ersetzungsaxiom., 291

erstes Integral, 261erweiterten reellen Zahlen, 84

euklidischen Abstand, 127Eulersche Zahl, 113

Existenzquantor, 16

explizite gewohnliche Differentialgleichung, 260explizite lineare gewohnliche Differentialgleichung,

273

Exponentialfunktion, 109Exponentialreihe, 108

Extensionalitat, 291

Extremumlokales, 140, 252

Fakultat, 298Familie, 31

fast alle, 95, 310

Flache, 237Fluss, 281

Flusslinie, 260

FolgeM -wertige, 31

in M , 31

von Funktionen, 167Folgen, 77

beschrankte, 77

monotone, 82folgenkompakt, 131, 193folgenstetig, 117, 190Formel

aussagenlogische, 7

Fundamentalsatz der Algebra, 74Fundierungsaxiom, 291

Funktion

beschrankte, 178

reell-wertige, 26

Funktionalgleichung

der Exponentialfunktion, 109

der Logarithmusfunktion, 124

Godelscher Unvollstandigkeitssatz, erster, 292

Godelscher Unvollstandigkeitssatz, zweiter, 292

ganze Zahlen, 47

Gaußschen Zahlenebene, 71

Gebiet, 213

geometrische Reihe, 94

geordneter Korper, 50

gewohnliche Differentialgleichung, 257

autonome, 257

explizite, 260

lineare, 273

gewohnliche Differentialgleichung mit getrennten

Variablen, 279

gleich machtig, 29

gleichmaßig stetig, 199

gleichmaßig stetig auf [a, b], 155

Grad, 74

Grad des Polynoms, 53

Graph, 26

Grenzwert, 77

Grenzwert der Folge, 305

Grenzwert von Funktionen, 133

Haufungspunkt der Folge, 84

Haufungspunkt einer Menge, 131

harmonische alternierende Reihe, 102

harmonische Reihe, 94

Hauptsatz der Differential- und Integralrechnung

Teil I, 156

Teil II, 158

Hausdorff-Eigenschaft, 188

Hausdorffraum, 188

Heine-Borel-Eigenschaft, 195

Hesse-Abbildung, 214

Hesse-Matrix, 214

Hilbertraum, 182

homoomorph, 199

Homoomorphismus, 198

homogen, 273

Homogenitat der Norm, 177

Homomorphismus von Ringen mit Eins, 313

hyperbolisches Paraboloid, 224

Hyperflache, 238

Identitat, 26

STICHWORTE 323

imaginar, 72

Imaginarteil, 72

Immersion, 243implizit definierte, 235

indefinit, 222

Induktionsanfang, 37, 296Induktionsaxiom, 35, 293

Induktionsschritt, 37, 296

Induktionsvoraussetzung, 37, 296induktiv, 291, 294

induzierte Metrik, 127, 179auf Teilmenge, 127, 166

von Norm, 179

induzierte Normauf Unterraum, 178

induzierte Topologie

von Teilmenge, 186Infimum, 56

inhomogen, 273

injektiv, 27Inklusion, 26

Innere, 187

inneren Kern, 187Integralkurve, 260

Integration

durch Substitution, 160partielle, 160

Intervalle, 84Isometrie, 127

isomorph (als Ring), 49

Isomorphismus von Ringen, 49

Jacobi-Matrix, 209

k-mal stetig differenzierbar, 142Korper, 50

archimedisch geordneter, 52

der komplexen Zahlen, 71der rationalen Zahlen, 49

der reellen Zahlen, 55

geordneter, 50Korper der rationalen Funktionen, 53

kanonische Projektion, 304

Klassen, 290Klumpentopologie, 186Koeffizienten, 74kommutativer Ring, 48kompakt, 196

Komplement, 14komplexe Exponentialfunktion, 109

komplexe Konjugation, 73

komplexe Zahlen, 71Komponente, 32

Komposition, 27

Komprehension, 291Kontraktion, 183

Konvergenzuneigentliche, 84

von Folgen, 77

Konvergenzradius, 99konvergiert, 130

absolut, 100, 162

gegen ∞, 84gegen unendlich, 84

gleichmaßig, 168

in R, 85

punktweise, 167

Kosinus, 111Kreiszahl π, 125

kritischen Punkt, 225

kritischer Punkt, 252, 285

Losung, 257

Losungsintervall, 257Lagrange-Multiplikatoren, 252

Lagrangesche Restglieddarstellung, 143

Lebesguesche Zahl, 200leere Menge, 12

Leibniz-Regel, 101

Leitkoeffizient, 74Limes, 77

Limes inferior, 87

Limes superior, 87Linearisierung, 286

linksseitige Grenzwert oder Limes, 133Lipschitz-Konstante, 262

Ljapunow-Funktion, 286

Logarithmus, 124lokal Orts-Lipschitz-stetig, 263

lokal umkehrbar, 228

lokale C`-Parametrisierung, 247lokales Extremum, 140, 225, 252

lokales Maximum, 140, 225, 252

lokales Maximum oder Minimum, 225lokales Minimum, 140, 225, 252lokales striktes Maximum, 225

lokales striktes Minimum, 225lokalkonstant, 213

machtiger, 29Majorante, 96

Majoranten-Kriterium, 96

324 STICHWORTE

maximale Losungs-Intervall, 269

Maximum, 40, 300

lokales, 225, 252lokales striktes, 225

Menge, 11

der ganzen Zahlen, 47der komplexen Zahlen, 71

der naturlichen Zahlen, 36, 298

der rationalen Zahlen, 49der reellen Zahlen, 55

leere, 12

Mengensystem, 19Metrik, 127

metrischer Raum, 127, 165, 183Minimum, 40, 300

lokales, 225, 252

lokales striktes, 225Minkowski-Ungleichung, 178

Mittel

arithmetisches, 54geometrisches, 54

Mittelwertsatz

erster, 141zweiter, 141

Modell der naturlichen Zahlen, 293

Multiplikation, 298von Dedekindschen Schnitten, 64

Multiplizitat der Nullstelle, 75

nach oben beschrankt, 56

nach unten beschrankt, 56

Nachfolger-Abbildung, 35, 293Naturliche Zahlen, 3

Negation, 6

negativ definit, 222negativ semi-definit, 222

nicht zusammenhangend, 191normierten Vektorraum, 177

Nullfolgen, 78, 305

Nullstelle, 74

obere Schranke, 56

Oberintegral, 149

Oberklasse, 61offen, 128offene Uberdeckung, 195offene Menge in (X,O), 186Ordnung, 23

partielle, 23totale, 24

Ordnungsrelation, 23

Orts-Lipschitz-stetig, 262

Paar, (geordnetes), 20

Paarmengenaxiom, 291

Paraboloid

elliptisches, 224

hyperbolisches, 224

Parametrisierung

lokale ∼ einer Untermannigfaltigkeit, 247

Partialsumme, 93

partiell differenzierbar, 205

partielle Ableitung, 205

partielle Differentialgleichung, 258

Partielle Integration, 160

partielle Ordnung, 23

Partition, 147

Peano-Axiome, 35, 293

Permutation, 43

polynomiale Funktion, 74

positiv definit, 222

positiv semi-definit, 222

Potenzieren, 298

Potenzmenge, 19

Potenzmengenaxiom, 291

Potenzreihe, 98

Produkt


Produkt, (kartesisches), 20

Produkt, (kartesisches,) von Mengenfamilien, 32

Produktregel, 137

Produktreihe, 106

Produktreihensatz, 106

Produkttopologie, 186

Produktzeichen, 36

Punkt

kritischer, 252

stationarer, 252

Quadrupel, 22

Quintupel, 22

Quotienten-Kriterium, 97

Quotientenregel, 137

Rand, 187

rationale Zahlen, 49

Realteil, 72

rechtsseitige Grenzwert oder Limes, 133

reell-analytisch, 175

reelle Exponentialfunktion, 109

Reelle Zahlen, 55

reflexiv, 23

STICHWORTE 325

Regel

von Leibniz, 101

regularer Wert, 240

Reihe, 93

alternierende, 101

rein imaginar, 72

rekursive Definition, 297

Relation, 22

Relation, funktionale, 24

Reprasentant, 303

reprasentiert, 303

Restglied, 143

Restriktion, 27

Richtungsableitung, 205

Riemann-Integral, 149

Riemann-integrierbar, 149

Riemannscher Umordnungssatz, 103

Riemannsches Kriterium, 149

Ring, 48

der ganzen Zahlen, 47

kommutativer, 48

Ring mit Eins, 48

Russellsche Paradoxon, 289

Satz

uber 1. Ableitung in Extrema, 140

uber 2. Ableitung in Extrema, 142

vom Cauchy-Produkt, 107

von Blozano-

Weierstraß, 89

von Bolzano-

Weierstraß fur endl.-dim. Vektorraume, 181

von Dedekind, 68

von Rolle, 140

von Schroder-Bernstein, 29

von Taylor, 143

Satz von Taylor, 220

Schnitt, 13, 14

Schnittmenge, 14

singularen Wert, 240

Sinus, 111

Spurtopologie, 186

stabil, 285

Stammfunktion, 157

stationaren Punkt, 225

stationarer Punkt, 252

sternformig bezuglich x0 ∈ A, 192

stetig, 118, 128, 188

stetig differenzierbar, 142, 207

stetig in x0, 188

streng monoton wachsend, 306

Substitution, 160

Summe


Summenzeichen, 36

Supremum, 56

Supremums-Distanz, 168

Supremumseigenschaft, 57

Supremumsnorm, 178

surjektiv, 27

symmetrisch, 23

Tangentialraum, 250

Taylor-Polynom, 144

Taylorreihe, 144

Teiluberdeckung

endliche, 196

Teilfolge, 83, 306

Teilmenge, 12

echte, 12

Teilsumme, 93

tertium non datur, 5

Topologie, 185

topologischer Raum, 186

total differenzierbar, 203

totale Ordnung, 24

transitiv, 23

Trennungszahl, 68

Treppenfunktion, 147

Tripel, 22

Umgebung, 128

Umkehrabbildung, 28

Umkehrung, 28

Umordnung, 103

uneigentliche Konvergenz, 84

Uneigentliches Riemann-Integral, 161

unendlich, 29

Unendlichkeitsaxiom, 291

untere Schranke, 56

Unterintegral, 149

Unterklassen, 61

Untermannigfaltigkeit, 237

Untermannigfaltigkeitskarte, 237

Urbild, 30

Vektorfeld, 260

Vereinigung, 14

Vereinigungsaxiom, 291

Verkettung, 27

Verknupfung

326 STICHWORTE

aussagenlogische, 6

Vervollstandigung, 312

vollstandig, 90, 166, 310Vollstandige Induktion, 37, 296

vollstandiges Vektorfeld, 283

Wahrheitstafel, 6

wegzusammenhangend, 192

wohldefiniert, 52wohlgeordnete Menge, 301

Wohlordnung, 301

Wohlordnung von N, 40Wronski-Determinante, 276

Wurzel-Kriterium, 97

Zerlegung, 147

Zielbereich, 26

Symbole

(e1, . . . , en), Standardbasis von Rn, 180

:=, 2

B(D,K), beschrankte Funktionen, 178

C0((a, b)), 142

C∞((a, b)), 142

Ck((a, b)), 142

Lσ , 240

Sk, 240

∩, ∪, r, ∆, 14

◦, 27

deg(P ), 74

dglm, 168

dsup, 168

∅, 12

∃,∀, 16

exp, 109

⇐⇒, =⇒, 9

inf, Infimum, 56

limi→∞ ai, 305

limj→∞ aj , 77

limx→x0 , Grenzwert von Funktionen, 133

lim inf, Limes inferior, 87

lim sup, Limes superior, 87

N, 3

N>0, 3

Q, 49

R, 12, 55

R>0, 12

Z, 47

P(M), 19

max, Maximum, 40

min, Minimum, 40

¬, 6∏nj=1, 36

dre, 82

brc, 82

⊂, (, 12∑nj=1, 36

sup, Supremum, 56

×, 20∧, ∨, Y, →, ←, ↔, 6

{}, 12

ai → a, 305aj → a, 77

f ′, Ableitung von f , 135

f#(N), Urbild von N unter f , 30

f (k), k-te Ableitung, 142

f#(M), Bild von M unter f , 30

p-Norm, 178

327

Date post:	17-Aug-2019
Category:	Documents
Upload:	doankiet
View:	234 times
Download:	0 times

Vorlesungsskript Analysis I und II · Vorlesungsskript Analysis I und II Prof. Bernd Ammann...

Documents