Vorlesungsskript Analysis I und II
Prof. Bernd Ammann
Wintersemester 2018/19Sommersemester 2019
Universitat Regensburg
Datum der aktuellen Version: 26. Juli 2019
Offentliche Version
Inhaltsverzeichnis
Vorwort vLogischer Aufbau des ersten Kapitels viiWarnungen vii
Kapitel 1. Elementare Logik und Grundlagen der Mathematik 11. Die Struktur des mathematischen Denkens 12. Aussagenlogik 53. Mengen 114. Quantoren 165. Potenzmenge und Mengensysteme 196. Paare und kartesische Produkte 207. Relationen, funktionale Relationen, Abbildungen 228. Familien 31Literatur fur das bisherige Kapitel 33
Kapitel 2. Zahlen 351. Die naturlichen Zahlen 352. Etwas Kombinatorik 413. Die ganzen Zahlen 474. Die rationalen Zahlen 495. Geordnete Korper 506. Die reellen Zahlen 556.1. Unzulanglichkeit von Q 556.2. Die Supremumseigenschaft 566.3. Axiome der reellen Zahlen 586.4. Dedekindsche Schnitte 607. Die komplexen Zahlen 71
Kapitel 3. Folgen und Reihen 771. Folgen 771.1. Konvergenz von Folgen 771.2. Monotone Folgen 821.3. Teilfolgen 83
i
ii INHALTSVERZEICHNIS
1.4. Erweiterte reelle Zahlen und uneigentliche Konvergenz 841.5. Limes inferior und superior 861.6. Cauchy-Folgen 892. Reihen 912.1. Motivation von Reihen: Dezimal-Darstellung reeller Zahlen 912.2. Definition und elementare Eigenschaften 932.3. Konvergenzkriterien 952.4. Absolute Konvergenz 1002.5. Alternierende Reihen 1012.6. Umordnung von Reihen 1033. Einige durch Reihen definierte Funktionen 1083.1. Exponentialfunktion 1083.2. Sinus- und Kosinus-Funktion 1113.3. Eulersche Zahl 1133.4. Exponentialfunktion (Fortsetzung) 114
Kapitel 4. Stetigkeit und Grenzwerte von Funktionen 1171. Stetigkeit 1172. Zwischenwertsatz 1203. Stetigkeit von exp, cos und sin und Definition von log 1224. Die Kreizahl π und Periodizitat von cos und sin. 1255. Metrische Raume und Grundbegriffe der Topologie 1266. Grenzwerte von Funktionen 132
Kapitel 5. Differential-Rechnung fur Funktionen einer Veranderlichen 1351. Definition und elementare Eigenschaften 1352. Lokale Extrema 1403. Mittelwertsatze 1404. Hohere Ableitungen und Taylorscher Satz 142
Kapitel 6. Integral-Rechnung fur Funktionen einer Veranderlichen 1471. Partitionen und Treppenfunktionen 1472. Das Riemann-Integral 1483. Monotone Funktionen sind Riemann-integrierbar 1544. Stetige Funktionen sind Riemann-integrierbar 1555. Hauptsatz der Differential- und Integralrechnung 1566. Uneigentliche Riemann-Integrale 161
Kapitel 7. Stetigkeit und Differenzierbarkeit von Grenzwerten und Reihen 1651. Metrische Raume: Wiederholung und Cauchy-Folgen 1652. Punktweise und gleichmaßige Konvergenz 1663. Differentiation von Folgen und Reihen 1714. Potenzreihen und analytische Funktionen 174
INHALTSVERZEICHNIS iii
Kapitel 8. Topologie 1771. Normierte Vektorraume 1772. Kontraktionen und Banachscher Fixpunktsatz 1833. Topologische Raume 1853.1. Wiederholung: Eigenschaften eines metrischen Raums 1853.2. Definition topologischer Raume 1853.3. Konvergenz in topologischen Raumen 1884. Zusammenhang und Wegzusammenhang 1915. Folgenkompaktheit 1936. Kompaktheit 195
Kapitel 9. Differential-Rechnung fur Funktionen in mehreren Veranderlichen 2011. Vorbemerkungen 2012. Differenzierbarkeit in mehreren Variablen 2023. Hohere Ableitungen 2143.1. Satz von Schwarz 2143.2. Hohere Ableitungen als multi-lineare Abbildungen 2183.3. Satz von Taylor 2203.4. Einschub: Quadratische Formen 2223.5. Lokale Extrema 2254. Lokale Umkehrung differenzierbarer Abbildungen 2265. Der Satz uber implizit definierte Funktionen 2326. Untermannigfaltigkeiten 2376.1. Definition und erste Beispiele 2376.2. Der Satz vom regularen Wert 2396.3. Der Immersionssatz 2436.4. Einbettungen von Untermannigfaltigkeiten 2456.5. Lokale Parametrisierungen von Untermannigfaltigkeiten 2476.6. Der Tangentialraum 2507. Extrema mit Nebenbedingungen 251
Kapitel 10. Gewohnliche Differentialgleichungen 2551. Motivation 2552. Definition und Reduktion auf autonome Gleichungen erster Ordnung 2573. Flusslinien und Erhaltungsgroßen 2604. Der Satz von Picard-Lindelof 2625. Picard-Lindelof fur gewohnliche Differentialgleichungen hoherer Ordnung 2736. Lineare gewohnliche Differentialgleichungen 2737. Lineare gewohnliche Differentialgleichungen mit konstanten Koeffizienten 2788. Differentialgleichungen mit getrennten Variablen 2799. Mehr zum Fluss eines zeitabhangigen Vektorfelds 28110. Einige Kommentare zum Langzeitverhalten von gew. Diffifferentialgleichungen 283
iv INHALTSVERZEICHNIS
11. Stabilitat und Verhalten in der Nahe von kritischen Punkten 285
Anhang A. Mehr Details zu den Grundlagen der Logik 2891. Das Russellsche Paradoxon 2892. Axiomatische Mengenlehre 290
Anhang B. Die Peano-Axiome 2931. Die Axiome und erste Konsequenzen 2932. Vollstandige Induktion und rekursive Definition 2963. Ordnung der naturlichen Zahlen 299
Anhang C. Konstruktion von R mit Hilfe von Cauchy-Folgen 3031. Mehr zu Aquivalenzrelationen 3032. Folgen, Konvergenz und Cauchy-Folgen 3053. Existenz und Eindeutigkeit der reellen Zahlen 312
Anhang Z. Uberblick uber algebraische Strukturen 317
Anhang. Literaturverzeichnis 319
Anhang. Stichworte 321
Anhang. Symbole 327
VORWORT v
Vorwort
Dies ist das Skript zu den Vorlesungen”Analysis I“ und
”Analysis II“, die ich im Wintersemester
2018/19 und Sommersemester 2019 an der Universitat Regensburg halte. Das Skript sollte un-gefahr das enthalten, was an der Tafel stand, und zusatzlich einige dazu gegebene Erklarungenwiderspiegeln. Anhange erganzen die Themen, sie wurden nicht in der Vorlesung behandelt. EinigeBeispiele und Erweiterungen, die aus Zeitgrunden nicht in der Vorlesung behandelt wurden, sindso gedruckt, und sind naturlich gut fur die Nachbereitung beziehungsweise Vertiefung geeignet.Falls Sie einen Tippfehler finden oder sonstige Verbesserungsvorschlage haben, so senden Sie bitteeine Email an mich. Leider enthalt das Skript bisher nur wenige Bilder und Zeichnungen.
Die aktuelle Version ist unter dem Link
http://www.mathematik.ur.de/ammann/lehre/2019s_analysis2/analysisi+II.pdf
verfugbar.
Die Homepage der Vorlesung ist
http://www.mathematik.ur.de/ammann/lehre/2010s_analysis2.
Regensburg, April 2019,
Bernd Ammann
WARNUNGEN vii
Logischer Aufbau des ersten Kapitels
Die Abschnitte des ersten Kapitels sind – aus Sichtweise des logischen Aufbaus – nicht optimalangeordnet. Unter anderem werden Begriffe wie Mengen, Funktionen, kartesische Produkte undahnliches teilweise benutzt, bevor sie eingefuhrt werden. Dies erscheint vertretbar, da ich davonausgehe, dass jede(r) Horer(in) bereits eine gewisse Vorstellung von manchen der Begriffen hat,und wenn nicht, dann wird es sich in einem zweiten Durchgang klaren, was gemeint ist. Die inder Vorlesung und im Skript gewahlte Reihenfolge hat den Vorteil, dass man bereits fruh in denUbungen auf die wichtigen Punkte eingehen kann, wie zum Beispiel die Themen Aussagenlogikund Quantoren.
Ich empfehle, mit einem gewissen zeitlichen Abstand dieses Kapitel noch einmal durchzuschauen,dann wird wahrscheinlich manches bisher unklare sich klaren.
Warnungen
Legen Sie das Skript nicht in eine Ecke mit dem ruhigen Gewissen, es ja spater lesen und durch-arbeiten zu konnen. Beginnen Sie sobald wie moglich, die Lucken zu schließen. Schwierige Beweisedurchschauen Sie am besten, wenn Sie sich uberlegen, was der Beweis in konkreten Beispielenmacht.
Bilder, Skizzen und Abschnitte die mit USW angedeutet werden, in der Vorlesung behandelt wur-den, aber aus Zeitgrunden noch nicht getext wurden, sind selbstverstandlich auch relevant furmundliche und schriftliche Prufungen.
KAPITEL 1
Elementare Logik und Grundlagen der Mathematik
1. Die Struktur des mathematischen Denkens17.10.
Die naturlichen Zahlen werden seit Jahrtausenden intuitiv benutzt und untersucht. Sie sind unsvertraut, ohne dass wir aber zunachst wissen, was sie charakterisiert. So ahnlich war es mit vielenmathematischen Konzepten, zum Beispiel dem mathematischen Konzept der unendlichen Summe.Man nutzte viele Konzepte lange in einer vagen Bedeutung, ohne sich zu uberlegen, wie man siedefiniert. Alle Personen stimmen wohl uberein, dass der Wert der unendlichen Summe
1 +1
2+
1
4+
1
8+ · · ·
die Zahl 2 sein sollte. Und derartige unendliche Summen sind oft wichtig, zum Beispiel in derZinseszinsrechnung, bei physikalischen Problemen und vielem mehr. Deswegen wurden Sie bereitsim Mittelalter diskutiert. Leider fuhrte eine genauere Betrachtung zu wachsenden Problemen. Esgab unter anderem viele Diskussionen, was denn der Wert der unendlichen Summe
1 + (−1) + 1 + (−1) + . . .
sei, manche Gelehrte vertraten die Ansicht es sei 0: mit der Begundung
(1 + (−1)) + (1 + (−1)) + (1 + (−1)) + . . . = 0 + 0 + 0 + . . . = 0.
Dies erscheint uberzeugend. Mit derselben Logik kann man aber auch begrunden, dass man denWert 1 erhalt:
1 + ((−1) + 1) + ((−1) + 1) + . . . = 1 + 0 + 0 + . . . = 1.
Derartige Probleme motivierten die Mathematiker, die Mathematik auf solide Grundlagen zu stel-len. Diese Bewegungen, die man Axiomatik nennen kann, begann im Bereich der Geometrie bereitsmit Euklid von Alexandria (ca. 300 v. Chr.) und Aristoteles (384–322 v. Chr.). Wichtige Fort-schritte in der Axiomatik der Geometrie und insgesamt der Axiomatik wurden im 19. Jahrhundertvollbracht.
Das Ziel der Axiomatik ist es, die gesamte Mathematik aus wenigen Grundaussagen, sogenanntenAxiomen, herzuleiten.
Nehmen wir mal an, ich uberlege mir, ob ich uberhaupt existiere oder nicht. Mein Leben undmeine Person konnte ja auch nur das Ergebnis einer Simulation eines gigantischen Großrechnerssein. Was konnte ich tun, um diese Frage zu losen? Ich kann mir selbst wehtun, ich empfinde
1
2 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Schmerz, also sollte ich existieren! Falsch, das konnte Teil der gigantischen Simulation sein. Ichkonnte einen Studenten in der hinteren Reihe fragen, ob ich existiere, er sagt ja. Ist dadurchmeine Existenz bewiesen? Nein, denn er konnte Teil derselben Simulation sein. Sie sehen, ich kannmeine eigene Existenz nicht zeigen, ohne andere Grundannahmen zu machen. Dennoch ist es sehrsinnvoll anzunehmen, dass ich existiere. Solche Probleme beschaftigen die Philosophen schon seitJahrhunderten oder besser Jahrtausenden.
Genauso wie aber unser elementares Denken Grundannahmen braucht, benotigt auch die Mathe-matik bestimmte Grundannahmen, und diese Grundannahmen nennt man Axiome. Im Prinzipsollte in der heutigen Mathematik alles auf den Axiomen der Mengenlehre aufbauen. Daraus kon-struiert man sich dann alle Objekte des mathematischen Denkens: Zahlen, Vektorraume, Matrizen,und vieles mehr. Oft versieht man Teilgebiete mit eigenen Axiomen, wie zum Beispiel die Axiomeder klassischen Geometrie.
Axiome sind nicht mehr weiter beweisbar, sie werden einfach als gegeben hingenommen, als Grund-annahmen unseres Denkens. Die Axiome erscheinen sinnvoll, entweder weil man sie als evident, alsooffensichtlich ansieht, oder weil man sie als Kennzeichen der Theorie ansieht. Aus diesen Axiomenwerden dann Schlussfolgerungen gezogen, die ebenfalls durch weitere Axiome geregelt sind. Durcherlaubte Kombinationen von bereits bekannten wahren Aussagen erhalt man neue wahre Aussagen.Eine Sammlung von so aufeinander aufbauenden wahren Aussagen, nennt man Beweis. Falls eineso erhaltene Aussage interessant erscheint, nennt man sie Theorem, Lemma, Korollar, Proposition,Satz, Hilfssatz, Folgerung oder ahnlich. Hierbei ist im allgemeinen ein Satz oder ein Theorem einewichtige Aussage, ein Lemma oder ein Hilfssatz eine Aussage, die nur als Zwischenschritt dient,und eine Proposition hat eine Mittelstellung. Erhalt man eine Aussage nahezu unmittelbar auseinem Theorem oder Satz, so nennt man dies eine Folgerung oder ein Korollar.
Damit die Aussagen nicht immer langer und langer werden, macht man Definitionen. Hierbei gibtman mathematischen Objekten oder mathematischen Sachverhalten einen Namen.
Die Mathematiker sind im Prinzip recht frei in der Wahl ihrer Definitionen. So konnte man diefolgende Definition machen: Ein Auto ist eine Menge, in der die Elemente 1, 2 und 3 enthalten sind.Ein Hund ist eine Menge, in der die Elemente 1 und 2 enthalten sind. Man schließt daraus, dassjedes Auto einen Hund enthalt. Diese Definitionen sind naturlich sehr irrefuhrend, aber prinzipiellerlaubt. Wir Mathematiker bemuhen uns die Dinge so zu benennen, dass sie moglichst etwas mitder
”wirklichen Welt“ zu tun haben. Um Koordinaten auf einer Kugel anzugeben, definiert man
den Begriff einer”Karte“, und ein
”Atlas“ ist dann definiert als Menge von Karten, so dass alles
uberdeckt wird. Diese Begriffe sind dann zwar nicht genau das, was man damit umgangssprachlichmeint, aber auch nicht vollig ohne Zusammenhang. Die mathematischen Begriffe
”Halm“ oder
”Garbe“ der Mathematik haben aber keinerlei Anwendungen in der Landwirtschaft. Die
”Knoten“
der Mathematik sind aber wiederum nahe an dem, was man alltagssprachlich als Knoten bezeichnet.
Um den Unterschied zwischen Definitionen und Aussagen klar zu unterscheiden, nutzen wir diefolgende Notation: a = 1, 234 ist die Aussage
”a ist gleich 1, 234“. Hingegen ist a := 1, 234 eine
Definition, a ist ab sofort eine kurze Schreibweise fur 1, 234.
1. DIE STRUKTUR DES MATHEMATISCHEN DENKENS 3
Viele Definitionen werden von allen Mathematikern gleich gemacht, es herrscht Konsens. Man istsich aber nicht einig, ob die Definition der naturlichen Zahlen die Null einschließen soll oder nicht.Fur unsere Vorlesung gilt: die naturlichen Zahlen sind
N = {0, 1, 2, . . .}.Die Menge N>0 := {1, 2, 3, . . .} bezeichnen wir als naturliche Zahlen ohne Null. Dies ist eine derublichen Definitionen. Viele Mathematiker definieren hingegen die Menge der naturlichen Zahlenals {1, 2 . . .}. Dass verschiedene Mathematiker die Definition verschieden wahlen, ist nicht weiterschlimm. Ob Null eine naturliche Zahl ist oder nicht, ist eben Definitionssache. Man schaut sichdie Definition des Autors an und weiß, was er meint.
In zentralistischen Landern wie Frankreich ist klar geregelt: Null ist eine naturliche Zahl. InDeutschland besagt DIN 5473 ebenfalls, dass Null eine naturliche Zahl ist. Lehrer in der Schu-le sollten sich an diese DIN-Norm halten. Außer man wohnt in Bayern. An bayerischen Schulen istNull keine naturliche Zahl, und daran sollte man sich als Lehrer auch halten, um die Schuler nichtzu verwirren.
Da die meisten Horer dieser Vorlesung ja gleichzeitig Lineare Algebra bei Denis-Charles Cisinskihoren, und er Franzose ist, ist bei uns Null eine naturliche Zahl. Die zukunftigen bayerischen Lehrermogen dies bitte verzeihen und freuen sich vielleicht uber diese
”Zusatzqualifikation“ fur andere
Bundeslander.
Anders ist es bei der Zahl π. Dass der Wert dieser Zahl zwischen 3,1415 und 3,1416 liegt ist eineAussage und keine Definition. Deswegen ist es lacherlich, dass der US-Bundesstaat Indiana 1897den Wert von π auf 3, 2 gesetzlich festlegen wollte, um Berechnungen zu vereinfachen und um esden Schulern einfacher zu machen.
Wenn wir nun aber hier in der Vorlesung alles rigoros mit der eigentlich notwendigen mathe-matischen Strenge einfuhren wurden, so mussten wir dem Aufbau der Mathematik folgen. DieGrundlagen hierbei bilden die Axiome der Logik und der Mengenlehre. Aus ihnen werden vieleAussagen gezeigt, und man kann dann irgendwann die naturlichen Zahlen, die ganzen Zahlen, dierationalen Zahlen und die reellen Zahlen einfuhren1 und deren Eigenschaften studieren. Die reellenZahlen erfullen auch wieder einige wichtige Aussagen, die wir vorlaufig die Grundeigenschaften derreellen Zahlen nennen wollen. Aus diesen Grundeigenschaften der reellen Zahlen kann man nunalle wichtigen Aussagen der Analysis herleiten. Nahezu alles, was wir zusammen in den nachstenSemestern behandeln werden, ergibt sich aus diesen Grundeigenschaften.
Nun gibt es aber ganz verschiedene Moglichkeiten, die reellen Zahlen zu definieren: in der Schulehabe ich die Moglichkeit mit Intervall-Schachtelung kennengelernt, in der Vorlesung hier wollenwir Dedekindsche Schnitte behandeln, vor 5 Jahren in meiner Analysis I habe ich sie mit Hilfevon Cauchy-Folgen definiert. Jeder Zugang hat seine Vorteile und Nachteile in Bezug auf Anschau-lichkeit und Verallgemeinerbarkeit. Wichtig ist hierbei: egal, wie man es macht, es ergeben sichimmer die selben Grundeigenschaften. Deswegen ist es sinnvoll, die Grundeigenschaften der reellen
1mathematisch genauer gesagt: definieren
4 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Zahlen als die Axiome der reellen Zahlen zu bezeichnen und dann alles aus diesen Axiomen derreellen Zahlen herzuleiten. Genauso haben auch die naturliche Zahlen ihre Axiome, die sogenann-ten Peano-Axiome2. Alle von Ihnen, die gleichzeitig die Lineare Algebra I besuchen, lernen dortdie Axiome eines Vektorraums kennen und leiten daraus dann alle Eigenschaften ab, die Sie uberVektorraume wissen sollten.3
In der Vorlesung konnen wir nun aber leider nicht alles streng axiomatisch einfuhren, da dies vielzu lange dauern wurde und die meisten von Ihnen auch nicht die notige Geduld dafur aufbringenwurden – vielleicht nicht einmal ich. Wir mussen also zu Anfang einen Kompromiss zwischen dernotigen Strenge und der angemessenen Kurze finden.
Der Plan ist deswegen, zunachst Begriffe wie Mengen, Abbildungen, logische Operationen und vieleahnliche Begriffe nur intuitiv einzufuhren, also ohne die richtige mathematische Strenge.
Im Anhang A im Skript gebe ich einen kleinen Einblick, wie man die Mengenlehre mathematischstringenter einfuhren kann. Die zugehorigen Abschnitte A.1 und A.2 werde ich in der Vorlesungnicht behandeln, aber ich empfehle ihn allen interessierten Studierenden zur Lekture. Wenn Sie dieMengenlehre noch besser axiomatisch verstehen wollen, so ist es am besten, wenn Sie begleitendsich etwas selbst durcharbeiten, z.B. das Buch [17], aber auch da werden letztendlich Fragenzuruckbleiben. Wenn Sie die Mengenlehre
”richtig“ verstehen wollen, sollten Sie spater mit einer
gewissen mathematischen Reife, also in zwei oder drei Semester, die Logik nochmals systematischstudieren, z.B. an Hand der Bucher [13] oder [20].
Nachdem das einfuhrende Kapitel beendet ist, wenden wir uns den Zahlen zu. Wir beschreibengrundlegende Eigenschaften der naturlichen, ganzen, rationalen, reellen und komplexen Zahlen.Auch da werden wir in Teilen nicht streng mathematisch vorgehen. Ich gehe zum Beispiel davon aus,dass Sie intuitiv wissen, was die naturlichen, ganzen und rationalen Zahlen sind. Eigentlich warees aber auch wichtig, zum Beispiel die naturlichen Zahlen axiomatisch durch die Peano-Axiome(Anhang B) zu beschreiben. Es ist namlich zunachst nicht so recht klar, was denn die Punkte in derDefinition N = {0, 1, 2, . . .} bedeuten soll. Dies soll in der Linearen Algebra I genauer behandeltwerden.
Wir werden dann zu den reellen Zahlen kommen. Da diese fur die Analysis ganz zentral sind,werden wir die Axiome diskutieren und von da an alles grundlich auf den Axiomen der reellenZahlen aufbauen: Folgen, Reihen, Differentiation, Integration und vieles mehr.
Wichtig ist auch, dass Sie sich bewusst werden, was Sie in den nachsten Wochen alles lernen sollten.Den mathematischen Inhalt der Vorlesung sollten Sie durchdringen, damit umgehen lernen unddanach nie wieder vergessen. Viel wichtiger aber noch ist, dass die meisten von Ihnen Ihre gewohnteArbeitsweise umstellen mussen. Es geht dabei beim weitem nicht nur darum, dass Sie von nun an
2siehe Anhang B3Das Wort
”Sie“ ist bewusst groß geschrieben, da ich der Meinung bin, dass alle hier im Publikum dies beherr-
schen sollten.
2. AUSSAGENLOGIK 5
in vieler Hinsicht fur Ihr Lernen und Ihre Lernmethoden selbst verantwortlich sind, sondern vorallem darum, dass Sie das oben diskutierte rigorose Argumentieren lernen.
Sie mussen klar unterscheiden konnen zwischen Axiomen, Definitionen und Aussagen (Satzen,Theoremen, Lemmata, Propositionen,...). Sie mussen lernen, Beweise zu verifizieren. Und Siemussen lernen, Ideen zu bekommen, wie Sie selbst Beweise fuhren, und auch lernen, wie Sie danndiesen Beweis gut aufschreiben. Dies zu lernen, ist nur durch eine intensive Ruckmeldung moglich,und das geht naturlich nicht in der großen Vorlesung hier. Deswegen sind die Ubungen fur Sie ganzwichtig.
2. Aussagenlogik
Was ist eine Aussage?
Beispiele 2.1. Die folgenden Ausdrucke sind Aussagen
A1: 2 ∗ 3 = 6
A2: 2 + 2 = 1 + 3
A3: Die Zahl 27 hat 4 Teiler.
A4: Alle naturliche Zahlen haben eine Primfaktor-Zerlegung
A5: Am 13.9.2018 hatte die Donau in Regensburg Hochwasser
A6: Christian Lindner wurde im September 2018 zum Bundeskanzler gewahlt
Wir gehen davon aus, dass wir eine Sprache haben, die aus Zeichenketten besteht. Manche Zei-chenketten ergeben keinen Sinn, zum Beispiel
”hejekl“ oder
”Hund Maus Loch“, wir nennen sie
syntaktisch nicht sinnvoll. Wenn die Zeichenkette etwas aussagt, so nennen wir sie syntaktischsinnvoll. 4
Definition 2.2. Eine Aussage ist eine syntaktisch sinnvolle Zeichenkette, die entweder wahr (w)oder falsch (f) ist.
Eine dritte Moglichkeit gibt es nicht (lateinisch:”tertium non datur“).
A1 bis A6 sind Aussagen, A1 bis A4 sind wahr, A5 und A6 sind falsch. Wenn eine Aussage wahrist, so sagen wir auch:
”Die Aussage gilt.“
Bemerkung 2.3. Es gibt Wissenschaftsbereiche, in den das”tertium non datur“ nicht gilt, in
denen also neben”wahr“ und
”falsch“ weitere Moglichkeiten zugelassen werden. Z.B. in der Quan-
tenmechanik (Schrodingers Katze ist weder tot noch lebendig), Aussagen in der Wahrscheinlich-keitstheorie (Es regnet morgen mit Wahrscheinlichkeit 0,3), Philosophie, Teilgebiete der Logik. In
4Dies soll hier nicht genauer definiert und spezifiziert werden, da es fur unsere Zwecke unwichtig ist.
6 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
unserer Vorlesung sind aber gemaß obiger Definition nur Aussagen zulassig, die entweder wahroder falsch sind.
Man kann Aussagen durch elementare logische Operationen verknupfen. Man kann diese Opera-tionen zum Beispiel durch Wahrheitstafeln definieren.
Definition 2.4 (Negation). Die Negation ¬ wird durch die folgende Wahrheitstafel definiert
A ¬Aw ff w
LEMMA 2.5. Fur alle Aussagen A gilt ¬(¬A) = A
Beweis. Wir unterscheiden zwei Falle.
1. Fall: A ist wahrA ist wahr =⇒ ¬A ist falsch =⇒ ¬(¬A) ist wahr
2. Fall: A = fA ist falsch =⇒ ¬A ist wahr =⇒ ¬(¬A) ist falsch
Definition 2.6 (Aussagenlogische Verknupfungen). Die Und-Verknupfung ∧, die Oder-Verknu-pfung ∨, die Entweder-Oder-Verknupfung Y, die Implikation (Wenn-Dann-Beziehung)→, die umge-kehrte Implikation (Dann-Wenn-Beziehung5)← und die Aquivalenz (Genau-Dann-Wenn-Beziehung)↔ sind durch die folgende Wahrheitstafel definiert
A B A ∧B A ∨B A YB → ← ↔w w w w f w w ww f f w w f w ff w f w w w f ff f f f f w w w
Ist die Aussage A↔ B wahr, so sagen wir auch A und B sind aquivalent .
In zusammengesetzen Ausdrucken sind Negationen zuerst auszufuhren, ansonsten muss man durchKlammern die Reihenfolge klaren sofern notig. Zum Beispiel gilt
¬A ∧B = (¬A) ∧Bund dies ist im allgemeinen nicht dasselbe wie ¬(A∧B). Man darf aber die Klammern weglassen,wenn das Resultat nicht von der Reihenfolge abhangt, Beispiele spater.19.10.
Bisher haben wir nun angenommen A, B seien feste Aussagen. Oft steht der Wahrheitswert voneinem Ausdruck noch gar nicht fest, z.B.
5Beispiel: (Die Straße wird nass.) ← (Es regnet.). In Worten: Die Straße wird (dann) nass, wenn es regnet.
Man kann logisch aquivalent auch sagen: Es regnet nur dann, wenn die Straße nass wird.
2. AUSSAGENLOGIK 7
A: Am 1.2.2024 wird es ein Erbeben in Japan geben
Um auch solche Ausdrucke behandeln zu konnen, deren Wahrheitswert noch nicht festgelegt ist,fuhren wir nun Aussageformen ein.
Definition 2.7 (Ausageform). Eine Aussageform ist eine eine syntaktisch sinnvolle Zeichenkette,die
• entweder eine Aussage ist, oder• die von einer oder mehreren Variablen abhangt und die erst nach Einsetzen von Werten
in diese Variablen zu einer Aussage wird.
Hierbei muss man angeben, welche Werte fur die Variablen uberhaupt zugelassen sind.
Eine Aussageform A(x) in einer Variablen x besteht also aus der Angabe der zulassigen Wertevon x, die wir zu einer MengeM zusammenfassen, und einer AbbildungA : M−→{w, f}, x 7→ A(x).Letztere Schreibweise bedeutet, dass jedem zulassigen Wert von x ein Wert A(x) zugeordnet ist, derentweder wahr (w) oder falsch (f) ist.6 Hangt A(x1, x2, . . .) von mehreren Variablen hat, so sollteeine Wertemenge M1 fur x1, eine Wertemenge M2 fur x2 etc. vorgeben werden. Aussageformen in2 Variablen sind also Abbildungen:
A : M1 ×M2−→{w, f}, (x1, x2) 7→ A(x1, x2).
Beispiele 2.8.
A1(x) : x > 0 Zulassig: x ∈ RA2(X) : Das Auto X ist rot Zulassig: Alle Autos X der Welt
A3(B,C) : B ∨ C Zulassig: B und C sind Aussagen.
A4(B,C,D,E) : (B ∨ C)→ (¬D ∧ E) Zulassig: B, C, D und E sind Aussagen.
Sind wahr und falsch die zulassigen Werte der Variablen x, so nennt man x eine aussagenlogi-sche Variable. Verknupft man ausagelogische Variablen durch die Negation ¬ oder die logischenVerknupfungen ∧, ∨, Y, →, ← und ↔, so nennt man die somit erhaltene Aussageform eine aus-sagenlogische Formel . Es ist hierbei erlaubt, mehrere logische Verknupfungen oder Negationenanzuwenden. Insbesondere sind dann alle Variablen aussagenlogische Variablen. In den obigen Bei-spielen sind A3 und A4 aussagenlogische Formeln, die anderen keine.
Fur aussagenlogische Formeln kann man viele Beziehungen herleiten, zum Beispiel folgende:
PROPOSITION 2.9. Fur alle Belegungen von A, B und C mit Wahrheitswerten w und f sind diefolgenden Aussagen wahr:
6Der Pfeil −→ in der Abbildungsbeschreibung ist nicht zu verwechseln mit der Implikation→, deswegen wollen
wir den ersteren zunachst langer und in roter Farbe schreiben. Spater wird immer klar sein, welche Bedeutung der
Pfeil nun hat und wir schreiben dann immer →. Wir setzen hier voraus, dass die Begriffe”Menge“,
”Produkte
von Mengen“ und”Abbildung“ Ihnen bereits intuitiv vertraut sind, wenn nicht dann sind die Erklarungen dieses
Abschnitts erst in ungefahr zwei Wochen verstandlich.
8 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
(a) A ∨ ¬A (Tertium non datur)(b) ¬(A ∧ ¬A) (Widerspruchsfreiheit)(c) A ∨ w(d) ¬(A ∧ f)(e) (A ∧ f) ↔ f(f) (A ∨ f) ↔ A(g) (A ∧ w) ↔ A(h) (A ∨ w) ↔ w(i) (A ∨B) ↔ (B ∨A) (Kommutativitat von ∨)(j) (A ∧B) ↔ (B ∧A) (Kommutativitat von ∧)(k) (A ∨ (B ∨ C)) ↔ ((A ∨B) ∨ C) (Assoziativitat von ∨)(l) (A ∧ (B ∧ C)) ↔ ((A ∧B) ∧ C) (Assoziativitat von ∧)
(m) (A ∨B) ↔ ¬(¬A ∧ ¬B) (de Morgansche Regeln)(n) (A ∧B) ↔ ¬(¬A ∨ ¬B) (de Morgansche Regeln)(o) (A ∧ (B ∨ C)) ↔ ((A ∧B) ∨ (A ∧ C)) (Distributivgesetze)(p) (A ∨ (B ∧ C)) ↔ ((A ∨B) ∧ (A ∨ C)) (Distributivgesetze)(q) (A↔ w) ↔ A(r) (A↔ f) ↔ ¬A(s) (A→ B) ↔ (B ← A)(t) (A→ B) ↔ (¬A ∨B) (Kontraposition)(u) (A← B) ↔ (A ∨ ¬B)(v) (A→ B) ↔ (¬B → ¬A)(w) (A↔ B) ↔ ((¬A ∨B) ∧ (A ∨ ¬B))(x) (A↔ B) ↔ ¬(A YB)(y) (A ∧B) → A
Diese Proposition wird teilweise in den Ubungsgruppen bewiesen, die verbleibenden konnen Sieselbst mit ahnlichen Methoden leicht beweisen. Die obigen Aquivalenzen, d.h. die obigen Aussagenin der Form D ↔ E, beweist man oft am besten, in dem man mit Hilfe einer Wahrheitstabelle Dund E fur alle Belegungen von A, B und C berechnet und dann vergleicht. Nachdem man einigeAussagen gezeigt hat, kann man durch deren Kombination weitere erhalten.
Aus (l) folgt zum Beispiel, dass A∧B ∧C ein syntaktisch sinnvoller Ausdruck ist, da das Ergebnisnicht von der Klammerung abhangt, und analog dazu ist naturlich auch A ∨ B ∨ C ein sinnvollerAusdruck.
Definition 2.10. Wir nennen zwei Aussageformen aquivalent , wenn sie von denselben Variablenabhangen, die Variablen dieselbe zulassigen Werte haben und wenn beide Aussageformen fur alleBelegungen der Variablen mit Werten aquivalente Aussagen ergeben.
Somit sind also die Aussageformen D und E aquivalent genau dann, wenn D ↔ E fur alle Bele-gungen der Variablen wahr ist.
2. AUSSAGENLOGIK 9
Beispiel 2.11. Proposition 2.9 (i) besagt, dass A ∨B aquivalent zu B ∨A ist.Proposition 2.9 (x) besagt, dass A↔ B aquivalent zu ¬(A YB) ist.
LEMMA 2.12. Die aussagenlogischen Formeln E1(A,B,C) := A→ (B → C) und E2(A,B,C) :=(A → B) → C sind nicht aquivalent. (Praziser gesagt: Es ist nicht richtig, dass fur alle Wahlenvon A, B und C die aus E1 und E2 erhaltenen Aussagen aquivalent sind).
Deshalb ist also A → B → C kein syntaktisch sinnvoller Ausdruck, man muss hier Klammernsetzen.
Beweis. Angenommen, die aussagenlogischen Formeln E1 und E2 waren fur alle A, B und Caquivalent. Dann waren sie insbesondere aquivalent im Fall, dass A, B und C falsch sind. Indiesem Fall sind A → B und B → C wahr und somit ist E1 wahr und E2 falsch. Somit habenwir einen Widerspruch zur obigen Annahme erhalten. Die Annahme war also falsch. Also ist dasLemma bewiesen.
Der obige Beweis ist ein Widerspruchsbeweis. Um eine Aussage F zu zeigen, nimmt man zunachst¬F an und leitet daraus einen Widerspruch her.
Hierbei ist
F : Fur alle Wahlen von A, B und C sind die Aussagen E1(A,B,C) und E2(A,B,C) aquivalent.
Ein anderer Typ von Widerspruchsbeweis ist noch haufiger. Man mochte eigentlich die AussageE → F zeigen. Man nimmt nun ¬F an und leitet daraus ¬E her. Man hat somit ¬F → ¬E gezeigt.Dies ist aber mit Proposition 2.9 (v) aquivalent zu E → F .
Bemerkung 2.13. Die Symbole ⇐⇒ und =⇒ nutzen wir ahnlich wie die Symbole ↔ und →,jedoch mit kleinen Unterschieden:
• Wenn wir aussagenlogische Variablen in einer aussagenlogischen Formel zusammenfugen,so wenden wir zuerst ↔, →, ←, ∧,. . . und dann erst ⇐⇒ und =⇒ an.Beispiel: Die Aussageform
3 + 4 = 7⇐⇒ A ∨ ¬A
ist als (3 + 4 = 7)⇐⇒ (A ∨ ¬A) zu lesen.• Wir lesen Implikationsketten wie zum Beispiel A =⇒ B =⇒ C als
”(A impliziert B) und
(B impliziert C)“. Als Beispiel betrachte man den Beweis von Lemma 2.5. Der AusdruckA→ B → C ist hingegen syntaktisch gar nicht sinnvoll, da Klammern benotigt werden.
10 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Analog sind Aquivalenzketten zugelassen und zu interpretieren, zum Beispiel:
¬(A ∨ ¬B) ∧A ”(n)“⇐⇒ (¬A ∧B) ∧A(l)⇐⇒ ¬A ∧ (B ∧A)
(j)⇐⇒ ¬A ∧ (A ∧B)
(l)⇐⇒ (¬A ∧A) ∧B
”(b)“⇐⇒ f ∧B
”(e)“⇐⇒ f
Bei jedem ⇐⇒ findet eine Aquivalenzumformung statt, die direkt aus bereits bekanntenAussagen folgt. Der jeweilige Buchstabe uber einem der ⇐⇒-Pfeile gibt an, welche Ei-genschaft in Proposition 2.9 verwendet wurde. Die Anfuhrungszeichen in der ersten undden beiden letzten Zeilen deuten an, dass man leicht modifizierte Versionen der zitiertenPunkte hernehmen muss. Die Verwendung des Zeichens ⇐⇒ ware naturlich auch ohnedie Erklarungen daruber gestattet. Die obige Umformungskette ist somit ein Beweis7 derTatsache, dass die Aussageform ¬(A ∨ ¬B) ∧ A fur alle Belegungen von A und B mitWahrheitswerten falsch ist.
Eine ahnliche Verwendung wird im folgenden Beispiel verdeutlicht:
¬(A↔ B)⇐⇒ ¬A↔ B
⇐⇒ A↔ ¬B⇐⇒ A YB
⇐⇒ ¬A Y ¬B
Die obigen Zeilen sind eine recht effektive Art und Weise auszudrucken, dass alle obigenAusdrucke paarweise aquivalent sind. Allerdings muss man hier
”etwas arbeiten“ um
jeweils von der linken Seite von⇐⇒ zur rechten zu kommen. Dies geht in diesem Beispielmit einer Wahrheitstafel sehr gut.• Um Missverstandnisse zu vermeiden, verbieten wir es, Ausdrucke, die⇐⇒ und =⇒ enthal-
ten, durch weitere aussagenlogische Verknupfungen zu verbinden. Das heißt beispielswei-se, dass wir A⇐⇒ (B =⇒ C) als syntaktisch nicht sinnvoll betrachten, also vergleichbarzu
”jjkwdh“.
Beispiel: Proposition 2.9 (w) und (x) ergeben dann zusammen
A↔ B ⇐⇒ (¬A ∨B) ∧ (A ∨ ¬B)⇐⇒ ¬(A YB).
7Die Worte”beweisen“ und
”zeigen“ haben in der Mathematik nahezu dieselbe Bedeutung.
3. MENGEN 11
Bemerkung 2.14. Man konnte zunachst auch nur ¬ und ∧ durch eine Wahrheitstafel wie obendefinieren und alle danach anderen aussagenlogischen Verknufungen durch Formeln aus Propositi-on 2.9, z.B. A ∨B := ¬(¬A ∧ ¬B) durch die de Morgansche Regel.
3. Mengen
Beschreibung 3.1 (Georg Cantor, 1845–1918). Unter einer Menge verstehen wir jede Zusam-menfassung M von bestimmten wohlunterschiedenen Objekten unserer Anschauung oder unseresDenkens (welche Elemente von M genannt werden) zu einem Ganzen.
Hier wird erklart, was eine Menge ist. Auch eine Definition erklart, was ein neuer Begriff bedeutet.Dennoch ist die obige Erklarung keine mathematische Definition, sondern eine intuitive Erklarung.Wenn man in der Mathematik sauber definieren will, was eine Menge ist, darf man nur Worteund Strukturen benutzen, die zuvor schon ein klare Bedeutung haben. Es ist nun aber doch etwasunklar, was die Worte
”Zusammenfassung“, “bestimmten“, “wohlunterschieden“ bedeuten.
Die obige”Beschreibung“ sagt uns also lediglich, was wir uns unter einer Menge vorstellen sollen.
Das reicht uns aber fur das folgende, und eine genaue Definition ware zu aufwandig.
Eine Menge enthalt Elemente. Zwei Mengen sind genau dann gleich, wenn sie die gleichen Elementeenthalten.
Schreibweisen:M = {x, y, z} = {x, x, y, z} = {y, x, z} ist die Menge, deren Elemente x, y und z sind.
Man darf Elemente in den Klammern { } mehrfach aufzahlen, sie sind dann aber nur einmalin der Menge. Ein Element kann in einer Menge sein, oder nicht darin sein, es kann aber nichtmehrfach in M enthalten sein.
x ∈M ist die Kurzschreibweise fur”x ist ein Element von M“
x 6∈M ist die Kurzschreibweise fur”x ist kein Element von M“
x 6∈M ⇐⇒ ¬(x ∈M)
Beispiele 3.2.
(1) Vorstellung von M = {x, y, z}
xy
z
(2) Die Menge aller naturlichen Zahlen: N = {0, 1, 2, 3, . . . , }.Ubliche Formulierung: Die Menge N der naturlichen Zahlen.
12 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
(3) Die Menge R der reellen Zahlen 8
(4) Die Menge R>0 der positiven reellen Zahlen. (Die Null ist weder positiv noch negativ).9
(5) Ist A(x) eine Aussageform in einer Variablen x, so bilden die zulassigen Werte von x eineMenge, die Definitionsmenge der Aussageform. In Beispiele 2.8 ist die Definitionsmenge vonA2 die Menge aller Autos. Die Definitionsmenge von A1 ist R.
Definition 3.3. Die Menge, die keine Elemente hat, heißt die leere Menge, und wird notiert als ∅oder {}.!ACHTUNG!. ∅ 6= {∅} und 1 6= {1} 6= {{1}}.
Bei Aussagen und aussagenlogischen Formeln schreiben wir ab sofort :⇐⇒ fur”ist definiert als“.
Definition 3.4 (Teilmenge).
(1) Die Menge N ist eine Teilmenge von M , genau dann wenn jedes Element von N auch einElement von M ist. Als Formel schreiben wir N ⊂M .
(2) Die Menge N ist eine echte Teilmenge von M , genau dann wenn N eine Teilmenge M ist undvon M verschieden ist. Wir schreiben hierfur N (M .
Beispiele 3.5.
(1) {1, 2} ⊂ {1, 2, 3} und {1, 2} ( {1, 2, 3}.(2) Fur alle Mengen M gilt: ∅ ⊂M(3) Fur alle Mengen M gilt: M ⊂M
24.10.
Definition 3.6. Ist A eine auf M definierte Aussageform, so definieren wir
{x ∈M | A(x)}als die Teilmenge aller Elemente x von M , fur die A(x) wahr ist.
Es gilt somit fur alle y ∈M :
y ∈ {x ∈M | A(x)} ⇐⇒ A(y)
Umgekehrt: Ist N eine Teilmenge von M , so ist
A(x) :=
{w falls x ∈ Nf falls (x ∈M) ∧ (x 6∈ N)
8Achtung: Was eine reelle Zahl ist, mussen wir eigentlich noch zuerst lernen!9Sehr verbreitet ist auch die Schreibweise R∗+ fur die positiven reellen Zahlen, und dann schreibt man R+ :=
R∗+ ∪ {0} fur alle reellen Zahlen, die nicht negativ sind. In dieser Schreibweise soll + naturlich positiv bedeuten.Deswegen ist auch die Schreibweise R+ verwirrend, denn wir haben 0 ∈ R+, obwohl 0 nicht positiv ist. Ein dritte
Moglichkeit, die man gelegentlich sieht, ist R+ fur die positiven reellen Zahlen zu benutzen, und dann definiert manR+0 := R+ ∪ {0}. Um Verwirrung zu vermeiden, nutzen wir nur R>0 fur die Menge der positiven reellen Zahlen und
R≥0, wenn die Null noch dazugenommen wird.
3. MENGEN 13
eine auf M definierte Aussageform und es gilt dann
N = {x ∈M | A(x)}.
Beispiele 3.7.
(1) Seien A1 und A2 definiert wie in Beispiele 2.8, M2 sei die Menge aller Autos. Dann gilt
{x ∈ R | A1(x)} = {x ∈ R | x > 0} = R>0
und
{x ∈M2 | A2(x)}ist die Menge aller roten Autos.
(2) Die Menge der geraden naturlichen Zahlen ist
2N :={n ∈ N
∣∣ n2∈ N
}.
Sei k ∈ N>0. Die Menge der durch k teilbaren ganzen Zahlen ist
kZ :={n ∈ Z
∣∣ nk∈ Z
}.
Analog kN.
(3) Die Menge der Primzahlen ist
{n ∈ N | n besitzt genau zwei Teiler (in N)}.
Wir fuhren somit noch eine weitere Art und Weise ein, Mengen zu beschreiben.
Definition 3.8. Sei M eine Menge und f(x) ein von x abhangiger Ausdruck10. Dann bezeichne
{f(x) ‖x ∈M}
die Menge aller Objekte, die sich in der Form f(x) fur ein x ∈M schreiben lassen.11 Analoges giltauch wenn f mehrere Variablen besitzt, zum Beispiel
{f(x, y) ‖x ∈M, y ∈ N},
wenn f von den Variablen x ∈M und y ∈ N abhangt.
Wir konnen dann kZ auch einfuhren als
kZ := {kz ‖ z ∈ Z}.
Definition 3.9. Seien M und N Mengen. Wir definieren hieraus neue Mengen
10Die mathematisch prazisere Voraussetzung ware: f ist eine Funktion in einer Variablen x.11In einigen Wochen vereinfachen wir diese Schreibweise zu {f(x) | x ∈M}.
14 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
(a) den Schnitt (oder die Schnittmenge) von M und N als
M ∩N := {x ∈M | x ∈ N} = {x ∈ N | x ∈M}.
Man kann auch sagen, M ∩N ist die Menge, so dass gilt:
x ∈M ∩N ⇐⇒ (x ∈M) ∧ (x ∈ N).
(b) die Vereinigung(smenge) von M und N als die Menge M ∪N , so dass
x ∈M ∪N :⇐⇒ (x ∈M) ∨ (x ∈ N).
(c) das Komplement von N in M als
M rN := {x ∈M | x 6∈ N}
oder dazu aquivalent
x ∈M rN ⇐⇒ (x ∈M) ∧ (x 6∈ N)
(d) die symmetrische Differenz von N in M als
M∆N := (M ∪N) r (M ∩N) = (M rN) ∪ (N rM)
oder dazu aquivalent
x ∈M∆N ⇐⇒ (x ∈M) Y (x ∈ N)
3. MENGEN 15
Beispiel 3.10. Sei A := {1, 2, 3} und B := {3, 4, 5}. Dann ist A∩B = {3}, A∪B = {1, 2, 3, 4, 5},ArB = {1, 2} und , A∆B = {1, 2, 4, 5}
1
2
3
4
5
Abbildung 1: Zwei Mengen A := {1, 2, 3} und B := {3, 4, 5} zur Veranschaulichung von A ∩B,A ∪B und A∆B.
Definition 3.11. Zwei Mengen M und N heißen disjunkt, falls M ∩N = ∅.
Es gelten viele zu Proposition 2.9 analoge Aussagen.
PROPOSITION 3.12. Seien P , Q und R Teilmengen von M . Dann gilt
(a) P ∪ (M r P ) = M(b) P ∩ (M r P ) = ∅(c) P ∪M = M(d) P ∩ ∅ = ∅(e) P ∩ ∅ = ∅(f) P ∪ ∅ = P(g) P ∩M = P(h) P ∪M = M(i) P ∪Q = Q ∪ P (Kommutativitat von ∪)(j) P ∩Q = Q ∩ P (Kommutativitat von ∩)(k) (P ∪ (Q ∪R)) = ((P ∪Q) ∪R) (Assoziativitat von ∪)
. . .
Jede Teilaussage dieser Proposition entspricht einer Teilaussage in Proposition 2.9 mit demselbenkleinen Buchstaben. Zum Beispiel ist Proposition 3.12 (a) eine direkte Folgerung aus Propositi-on 2.9 (a), Proposition 3.12 (b) eine Folgerung aus Proposition 2.9 (b), etc.. Man beachte, dassdie Bedeutungen von (d) und (e) in Proposition 2.9 fast diesseblen sind und deswegen dieselben
”Ubersetzungen“ in Proposition 3.12 haben. Analoges gilt fur (c) und (h).
UBUNG 3.13. Ubersetzen Sie die restlichen Aussagen aus Proposition 2.9 (j) bis (p) in Aussagenuber Mengen. Beweisen Sie all diese Aussagen.
16 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
4. Quantoren
Aussagen12 in der Art”Fur alle Elemente x ∈ M ist die Aussage A(x) wahr.“ und
”Es gibt
(mindestens) ein Element x ∈M , fur das A(x) wahr ist.“ sind in der Mathematik sehr haufig. Manschreibt kurz hierfur ∀x ∈M : A(x) und ∃x ∈M : A(x). Man nennt ∀ den Allquantor und ∃ denExistenzquantor. Als Beispiel betrachten wir die Definition von Stetigkeit, ein zentraler Begriff derAnalysis.
Definition 4.1. Eine Abbildung f : R−→R ist stetig in x0 ∈ R, genau dann wenn
∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈ R : (|x− x0| < δ)→ (|f(x)− f(x0)| < ε)︸ ︷︷ ︸A(x,x0,f,δ,ε)
A(x, x0, f, δ, ε) ist eine Aussageform, die von funf Variablen abhangt. Wir geben die moglichenWerte durch Mengen an: x ∈ R, x0 ∈ R, f ∈ Abb(R,R) (die Menge aller Abbildungen R−→R),δ ∈ R>0 und ε ∈ R>0. Sobald wir am Ende des Abschnitts Abbildungen und Produkte von Mengeneingefuhrt haben, kann man diese Aussageform auch als Abbildung
A : R× R×Abb(R,R)× R>0 × R>0−→{w, f}
betrachten.
Das folgende Regel ist intuitiv klar:
REGEL 4.2 (Negation von Quantoren). Fur jede auf M definierte Aussageform gilt:
¬∀x ∈M : A(x) ⇐⇒ ∃x ∈M : ¬A(x)(4.3)
Indem man A(x) durch ¬A(x) ersetzt und dann die gesamte Aquivalenz auf beiden Seiten negiert,erhalt man
(4.4) ¬∃x ∈M : A(x) ⇐⇒ ∀x ∈M : ¬A(x)
Klammerregel.Sei A(x, y) eine Aussage die von den Parametern x ∈ X und y ∈ Y , dann ist
∀/∃x ∈ X : ∀/∃y ∈ Y : A(x, y)
zu lesen als
∀/∃x ∈ X :(∀/∃y ∈ Y : A(x, y)
).
Es gilt offensichtlich
∀x ∈ X : ∀y ∈ Y : A(x, y) ⇐⇒ ∀y ∈ Y : ∀x ∈ X : A(x, y)
∃x ∈ X : ∃y ∈ Y : A(x, y) ⇐⇒ ∃y ∈ Y : ∃x ∈ X : A(x, y)
12Naturlich erlauben wir hier auch aussagenlogische Formeln und Aussageformen
4. QUANTOREN 17
Man sagt kurz:”zwei af. (aufeinanderfolgende) Allquantoren vertauschen miteinander“, oder man
sagt”zwei af. Allquantoren kommutieren“. Analog kommutieren zwei af. Existenzquantoren.
!ACHTUNG!. Allquantoren kommutieren nicht mit Existenzquantoren!
Die eine Richtung ist immer wahr:
∀x ∈ X : ∃y ∈ Y : A(x, y) ⇐= ∃y ∈ Y : ∀x ∈ X : A(x, y)
Aus der rechten Seite ∃y ∈ Y : ∀x ∈ X : A(x, y) folgt die linke ∀x ∈ X : ∃y ∈ Y : A(x, y). DieAussagen unterscheiden sich aber sehr. Links darf die Wahl von y von x abhangen, rechts darf siees nicht. Man hat hier also weniger Flexibilitat in der Wahl von y, da man eines finden muss, sodass A(x, y) fur alle x ∈ X richtig ist.
Die Umkehrung (d.h. die Richtung von links nach rechts) ist falsch, wie das folgende Beispiel zeigt.
Beispiel 4.5. Die Aussage
(4.6) ∀x ∈ R : ∃y ∈ R : x > y
ist wahr. Denn fur ein gegebenes x ∈ R konnen wir die Zahl y := x−1 hernehmen und diese erfullty < x. Deswegen ist fur alle x ∈ R die Aussage ∃y ∈ R x > y wahr, also auch (4.6).
Die Aussage
(4.7) ∃y ∈ R : ∀x ∈ R : x > y
ist falsch. Denn fur ein gegebenes y ∈ R gilt nicht fur alle x ∈ R die Ungleichung x > y. DieUngleichung gilt zum Beispiel nicht fur x := y. Also gibt es kein y ∈ R, so dass ∀x ∈ R : x > ywahr ist. Also ist (4.7) falsch.
SCHREIBWEISE 4.8. Quantoren fur eine Variable mussen stehen, bevor diese Variable gebrauchtwerden darf. (Sonst gelten sie als nicht syntaktisch sinnvoll.) 13
Beispiel 4.9. Ausdrucke in der Art”Es gilt 2x = x + x fur alle x ∈ R“ erklaren wir ab sofort
und bis auf weiteres als syntaktisch nicht sinnvoll. Erlaubt sind nur Satze wie”Fur alle x ∈ R gilt
2x = x+ x.“
Die Regel ist deswegen wichtig, damit nicht unklar bleibt, wie die folgende Aussage verstandenwerden soll:
Fur alle x ∈ R gilt x > y fur ein y ∈ R.
Diesen Ausdruck konnte man als die wahre Aussage (4.6) oder als die falsche Aussage (4.7) verste-hen. Deswegen legen wir durch die obige Regel fest, dass Ausdrucke wie das obige A syntaktischnicht sinnvoll sind.
13In spateren Semestern wird diese Regel nicht mehr immer befolgt, falls keine Missverstandnisse zu erwarten
sind.
18 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Frage 4.10. Ist die folgende Aussage A wahr?
A :⇐⇒ ∀x ∈ ∅ : x = x+ 1.
Das didaktische Problem hier ist: obwohl uns bisher intuitiv klar war, was ∀x ∈M : A(x) bedeutet,ist ∀x ∈ ∅ : A(x) nicht intuitiv klar. In studentischen Losungen der Aufgabenblatter steht oft inso einem Fall:
”Da die Aussage x = x+ 1 fur kein einziges Element in ∅ gilt, gilt sie naturlich auch
nicht fur alle Elemente in ∅.“ Das ist ein weit verbreiteter Fehler.
REGEL 4.11. In der Mathematik ist die Aussage
∀x ∈ ∅ : A(x)
fur alle Aussageformen A(x) immer wahr und die Aussage
∃x ∈ ∅ : A(x)
fur alle Aussageformen A(x) immer falsch.
Diese Regel ist letztendlich eine Definition, man konnte auch sagen eine Konvention. Es erscheintauch intuitiv klar, dass ∃x ∈ M : A(x) nur dann wahr sein kann, wenn in M uberhaupt irgend-welche Elemente existieren. Bei der anderen Regel konnte man Zweifel haben. Aber: wenn wir hieraber eine andere Konvention wahlen wurden, hatten wir viele Ausnahmen zu berucksichtigen. ZumBeispiel erscheint uns die folgende Aquivalenz fur alle Mengen M intuitiv klar:
∀x ∈M : A(x) ⇐⇒ {x ∈M | ¬A(x)} = ∅.
Die rechte Seite ist fur M = ∅ offensichtlich wahr.
Außerdem, ergibt sich die erste Teil in Regel 4.11 auch aus dem zweiten Grund: ∃x ∈ ∅ : ¬A(x)ist falsch, also auch ¬∀x ∈ ∅ : A(x) falsch, also ∀x ∈ ∅ : A(x) wahr.
Notation 4.12. In vielen Buchern schreibt man auch oft ∃x : A(x). Dies bedeutet, es existierteine Menge, in der ein Element existiert, fur das A(x) wahr ist. Beispiel: die Aussage ∃x : x ∈Mist aquivalent zu M 6= ∅. Analog heißt ∀x : A(x), dass fur alle Mengen und alle Elemente darindie Aussage A(x) wahr ist.14 Analog hierzu: ist A(x) eine auf allen Elementen von allen Mengendefinierte Aussageform, so bezeichnet {x | A(x)} die Menge aller Elemente, fur die A(x) wahr ist.Diese Bezeichnungen sind vor allem in axiomatischen aufgebauten Logik-Buchern wie [13] ublich,sind im Zugang unserer Vorlesung eine gefahrliche Fehlerquelle: zum Beispiel ist {x | A(x)} oft garkeine Menge, siehe Anhang A Abschnitt 1. Wir wollen sie deswegen nicht verwenden.
14Bei dieser”Notation“ handelt es sich eigentlich auch um eine Definition; es ist die Definition einer Schreibwei-
se. Wir verwenden hier den Begriff Notation, um anzudeuten, dass hier kein neuer Begriff eingefuhrt wird, sonderneine neue Schreibweise.
5. POTENZMENGE UND MENGENSYSTEME 19
5. Potenzmenge und Mengensysteme
Definition 5.1. Ist X eine Menge, so ist P(X) definiert als die Menge aller Teilmengen von M .Man nennt P(X) die Potenzmenge von X.
x ∈ P(X) ⇐⇒ x ⊂ X
Beispiele 5.2.
(1) P({1, 2}) = {∅, {1}, {2}, {1, 2}}(2) P(∅) = {∅} 6= ∅
Definition 5.3. Ein Mengensystem (uber einer Grundmenge X) ist eine Teilmenge von P(X).Dies bedeutet, dass M genau dann ein Mengensystem ist, wenn alle Elemente vonM eine Teilmengevon X sind.
Wir definieren dann ⋃M := {x ∈ X | ∃m ∈M : x ∈ m}
und falls zusatzlich M 6= ∅ definieren wir⋂M := {x ∈ X | ∀m ∈M : x ∈ m}.
Offensichtlich gilt⋃M ⊂ X und
⋂M ⊂ X.
Beispiele 5.4. Beliebige Grundmenge X, A ⊂ X, B ⊂ X
(1) Fur M := {A} gilt⋃M =
⋂M = A.
(2) Fur M := {A,B} gilt⋃M = A ∪B und
⋂M = A ∩B.
Mengensysteme uber der Grundmenge Z
(3) Fur M := {{1, 2, 3}, {3, 5, 7}, {1, 3, 5}} gilt⋃M = {1, 2, 3, 5, 7} und
⋂M = {3}.
(4) Sei
M := {kZ ‖ k ∈ Nr {0, 1}} = {2Z, 3Z, 4Z, . . .}.Dann gilt
⋃M = Z r {−1,+1} und
⋂M = {0}.
Falls X ⊂ Y , so ist jedes Mengensystem uber X auch ein Mengensystem uber Y und die obigenDefinitionen von
⋃M und
⋂M hangen nicht von der verwendeten Grundmenge ab. Wir lassen
deswegen die Angabe der Grundmenge in Zukunft weg.⋂∅ ist nicht definiert worden, denn mit obiger Definition ware dann
⋂∅ = X, also von der Wahl
der Grundmenge abhangig. 26.10.
20 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
6. Paare und kartesische Produkte
Es gilt {1, 2} = {2, 1}. Eine Menge mit genau zwei Elementen heißt ungeordnetes Paar. In derMathematik brauchen aber auch (geordnete) Paare15. Wir wollen an einem Beispiel erklaren, wiesosie gebraucht werden, und uns dann um eine saubere Defintion kummern.
Rene Descartes (1596–1650):Nach Wahl eines Ursprungs und einer Basis beschreibt man Punkte auf einer Geraden durch einereelle Zahl, Punkte in einer Ebene durch zwei reelle Zahlen und Punkte im Raum durch drei reelleZahlen.
x
y
−4
−4
−3
−3
−2
−2
−1
−1
1
1
2
2
3
3
4
4
0
(3, 4)
{ Punkte in der Ebene } ∼= { geordnete Paare (x, y) von zwei reellen Zahlen x und y}∼= R× R ∼= R2
Paar := geordnetes Paar
”Definition“ 6.1. Sind M und N Mengen, so definieren wir
M ×N := {(m,n) ‖m ∈M, n ∈ N}
wobei (m,n) ein Paar aus m und n ist. Man nennt M×N das (kartesische) Produkt von M und N .
Fur Paare gilt z.B. (3, 4) 6= (4, 3).
Das Wort”kartesisch“ kommt vom Namen
”Cartesius“ und dies ist die lateinische Version von
Descartes.
15Ein Paar ist immer ein geordnetes Paar, es sei denn wir sagen explizit ‘”ungeordnet“ dazu.
6. PAARE UND KARTESISCHE PRODUKTE 21
Das problematische an obiger”Definition“ ist, dass wir den Begriff
”Paar“ noch gar nicht definiert
haben.
Eine Moglichkeit, ware ein Axiom einzufuhren, das uns die Existenz von Paaren liefert.
AXIOM 6.2. Zu jedem m ∈ M und n ∈ N gibt es ein (m,n), genannt Paar, mit der folgendenEigenschaft: fur alle m, m ∈M und alle n, n ∈ N gilt
(m,n) = (m, n)⇐⇒ m = m und n = n.
Ein ahnliches Axiom wurde in der Linearen Algebra so ahnlich eingefuhrt (Axiom 1.1.6), es erganztdie dort prasentierten anderen Axiome. Wenn man aber naiv argumentiert, wie bei uns der Fall,oder die zumeist verwendeten Axiomen-Systeme ZFC oder NBG (siehe Anhang A) nutzt, kannman eine Konstruktion machen, die genau solch eine Paarbildung liefert. Sie macht aus dem obigenDefinitions-Versuch (
”Definition“ 6.1) eine richtige Definition.16 Das heißt, man kann Axiom 6.2
weglassen und durch diese Definition ersetzen.
Definition 6.3 (Konstruktion von Paaren nach Kuratowski). Wir definieren das Paar von m undn als
(m,n) := {{m}, {m,n}}.
Diese Definition ist unanschaulicher als sie zunachst aussieht, wie das folgende Beispiel zeigt:
Beispiel 6.4. Fur M = N = N und m = n = 1 gilt (m,n) = {{1}}.
Aus diesem Grund wahlen manche Bucher andere Definitionen, die aber wieder andere Problemehaben. Wichtig ist fur uns aber letztendlich gar nicht, was Produkte
”wirklich sind“, sondern dass
die Eigenschaft in Axiom 6.2 erfullt ist.
LEMMA 6.5. Fur das von Kuratowski definierte Paar gilt:
(m,n) = (m, n) ⇐⇒ m = m und n = n.
Beweis. Die Richtung”⇐=“ ist offensichtlich.
Zu”=⇒“: Sei (m,n) = (m, n). Also gilt nach Definition
(6.6) {{m}, {m,n}} = {{m}, {m, n}}.Wir wissen bereits, dass {{m}, {m,n}} ein oder zwei Elemente besitzt. Wir mussen zwei Falleunterscheiden.
1. Fall: Die Menge {{m}, {m,n}} besitzt ein Element.In diesem Fall ist dann {m} das einzige Element und somit {m} = {m,n} und deswegen m = n.Wegen (6.6) hat auch {{m}, {m, n}} nur ein Element, also ergibt sich analog m = n. Es gilt nun
{m} = {{m}, {m,n}} = {{m}, {m, n}} = {m}.
16Wir konnen dann also die Anfuhrungsstriche weglassen.
22 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Es folgt m = n = m = n.
2. Fall: Die Menge {{m}, {m,n}} besitzt zwei Elemente.Es gilt also {m} 6= {m,n} und somit m 6= n. Analog enthalt {{m}, {m, n}} die verschiedenenElemente {m} und {m, n}, und daraus folgt m 6= n. Da {m} und {m} genau ein Element enthalten,und da {m,n} und {m, n} genau zwei Elemente enthalten, folgt aus (6.6), dass {m} = {m} undsomit m = m. Außerdem gilt dann {m,n} = {m, n}. Da diese Menge außer m = m noch genauein weiteres Element enthalt, gilt auch n = n.
Definition 6.7. Falls M1, M2, . . . , Mk Mengen sind, so definieren das k-fache kartesische Produkthiervon als
M1 ×M2 × · · · ×Mk := M1 × (M2 × (· · ·Mk−1 ×Mk)) · · · ).
Elemente hiervon nennen wir k-Tupel. Wir schreiben sie in der Form (x1, x2, . . . , xk), wobei xi ∈Mi. Ein Paar ist also ein 2-Tupel. Ein 3-Tupel nennt man auch Tripel . 4-Tupel sind Quadrupel ,5-Tupel sind Quintupel . Wir nutzen auch die Schreibweise
Mk = M ×M × · · · ×M︸ ︷︷ ︸k-mal
.
Beispiel: R3 = R× (R× R)
7. Relationen, funktionale Relationen, Abbildungen
Definition 7.1. Eine Relation R auf der Grundmenge M ist eine Teilmenge von M ×M . Wirschreiben dann xRy fur die Aussage(form) (x, y) ∈ R.
Falls M ⊂ N , so ist jede Relation auf M auch eine Relation auf N . Oft ist die Grundmenge ohneBedeutung. Wichtig ist vor allem, dass ein solches Resservoir an moglichen Werten uberhauptexistiert.
Beispiele 7.2.
(1) ∅ ist eine Relation auf jeder Menge.(2) {∅, (1, 2)} ist keine Relation, da ∅ kein Paar ist.(3) Ist M eine Menge, so ist δM := {(x, x) ‖x ∈ M} eine Relation auf M . Man nennt sie die
Diagonale von M .
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 23
x
y
−4
−4
−3
−3
−2
−2
−1
−1
1
1
2
2
3
3
4
4
0
Abbildung 2: Die Diagonale der Menge M = {−3,−2,−1, 0, 1, 2, 3}.(4) ≤R:= {(x, y) ∈ R2 | x ≤ y} ist eine Relation auf R.(5) Q := {(x, y) ∈ R2 | y = 3x2 + 2} ist eine Relation auf R.(6) M = {1, 2, 3}. Wir definieren die Relationen R1 ⊂ M × M und R2 ⊂ M × M durch das
folgende Bild oder sagen R1 := {(1, 2), (1, 3), (2, 1), (3, 1)} und R2 := {(1, 2), (3, 2)}
•1
•2
•3
R1
•1
•2
•3
R2
Definition 7.3. Sei R eine Relation auf M . Die Relation heißt
(1) reflexiv auf M :⇐⇒ ∀x ∈M : xRx,(2) symmetrisch :⇐⇒ ∀x ∈M : ∀y ∈M :︸ ︷︷ ︸
∀x,y∈M :
(xRy → yRx),
(3) antisymmetrisch :⇐⇒ ∀x, y ∈M :((xRy ∧ yRx)→ x = y
),
(4) transitiv :⇐⇒ ∀x, y, z ∈M :((xRy ∧ yRz)→ xRz
),
(5) Aquivalenzrelation auf M , falls R reflexiv auf M , symmetrisch und transitiv ist.(6) Ordnung(srelation) auf M oder partielle Ordnung(srelation) auf M , falls R reflexiv, antisym-
metrisch und transitiv ist.
24 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
(7) Erfullt eine Ordnungsrelation R auf M zusatzlich die Eigenschaft
∀x, y ∈M :(xRy ∨ yRx
)dann nennt man R eine totale Ordnung(srelation).17
Beispiele 7.4. Zu den Beispielen 7.2 (3), (4) und (6):
(3) δM ist reflexiv auf M , symmetrisch, und transitiv, also eine Aquivalenzrelation auf M .Es gilt
xδMy ⇐⇒ x = y ∧ x ∈M
(4) ≤R ist reflexiv auf R, antisymmetrisch und transitiv, also eine Ordnungsrelation auf M . DieseOrdnung ist total.
(6) R1 ist nicht transitiv, denn 3R11 und 1R12 sind wahr, aber 3R12 ist falsch. R1 ist auch nichtreflexiv. Also ist R1 auch weder Ordnungsrelation noch Aquivalenzrelation. R1 ist symmetrischund nicht antisymmetrisch.
R2 ist transitiv, antisymmetrisch, nicht reflexiv, nicht symmetrisch.
Beispiele 7.5. Ist X eine Menge, so definieren wir
⊂X := {(A,B) ∈ P(X)2 | A ⊂ B}.
⊂X ist eine Ordnungsrelation auf P(X). Sie ist keine totale Ordnung, wenn X mindestens 2Elemente besitzt. 18
Definition 7.6. Eine Relation F auf M nennen wir eine funktionale Relation, falls gilt:
∀x ∈M : ∀y ∈M : ∀z ∈M :(
(x, y) ∈ F ∧ (x, z) ∈ F)→ y = z.
Zu jedem x ∈M gibt es also hochstens ein y ∈M mit xFy. Wir sagen dann: x wird durch F auf yabgebildet und schreiben x 7→ y oder y = F (x).
Beispiele 7.2 (1), (3) und (5) sind funktionale Relationen. Beispiel (4) ist keine funktionale Relation.In Beispiel 7.2 (6) ist R2 funktional, aber R1 ist nicht funktional.
Beispiel 7.7. Es gelte nun xRy, falls im folgenden Bild ein Pfeil von x nach y fuhrt.
17Manche Quellen nennen solche eine Relation eine lineare Ordnungsrelation. Andere Quellen wiederum be-zeichnen unsere
”Ordnungsrelationen“ als
”Halbordnungen“ und unsere
”totalen Ordnungen“ als
”Ordnungen“.
18Bei Ordnungsrelation werden immer zwei Objekte verglichen: Ist eine Zahl großer als eine andere? Ist eine
Menge in der anderen enthalten? Etc. Insofern sind≤R und⊂X ganz wichtige Beispiele. δM ist auch antisymmetrisch,also auch eine Ordnungsrelation. Sobald M mindestens 2 Elemente besitzt, ist es keine totale Ordnungsrelation.
Dennoch ist δM ein atypisches Beispiel, denn δM ist die einzige symmetrische Ordnungsrelation auf M .
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 25
•1
•2
•3
•4
• 5
• 6
• 7• 8
• 9
Dann ist R eine funktionale Relation auf der Grundmenge {1, 2, 3, 4, 5, 6, 7, 8, 9}.
Definition 7.8. Ist R eine Relation auf der Grundmenge M , so definieren wir19:
D(R) := {x ∈M | ∃y ∈M : xRy},Definitionsbereich von R;
B(R) := {y ∈M | ∃x ∈M : xRy},Bild der Relation R;
Beispiel 7.7. (fortgesetzt) Wir zeichnen links die Definitionsmenge D(R), rechts die GrundmengeM . Die bisherigen Pfeile zeichnen wir so ein, dass sie in D(R) beginnen und in M enden. Wirwahlen einen
”Zielbereich“ Y aus mit B(R) ⊂ Y ⊂M .
D(R) M
Zielbereich•1
•2
•3
•4
• 5
• 6
• 7
• 1
• 2
• 8
• 9
• 3
• 4
19Viele Bucher, z.B. [17] bezeichnen B(R) als Wertebereich oder Wertemenge. Es gibt aber auch Bucher, dieden Begriff Wertebereich im Sinne des unten definierten Zielbereichs definieren. Wir werden aus diesem Grund dieBegriffe
”Wertebereich“ und
”Wertemenge“ vermeiden.
26 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Abbildung 3: Eine funktionale Relation R mit D(R) = {1, 2, 3, 4}, B(R) = {1, 5, 7}, Zielbereich{1, 2, 5, 6, 7} und Grundmenge M = {1, 2, 3, 4, 5, 6, 7, 8, 9}.
Definition 7.9. Eine Abbildung ist ein Tripel (f,X, Y ), bestehend aus Mengen X und Y und einerfunktionalen Relation f auf der Grundmenge X ∪ Y , wobei D(f) = X und B(f) ⊂ Y . Zumeist
schreibt man Abbildungen als f : X−→Y oder Xf−→ Y . Man nennt X den Definitionsbereich der
Abbildung f : X−→Y , man nennt Y den Zielbereich der Abbildung und man nennt f den Graphender Abbildung. Eine Abbildung von X nach Y ist eine Abbildung mit Definitionsbereich X undZielbereich Y . Die Menge aller Abbildungen von X nach Y notieren wir als Abb(X,Y ) oder alsY X . Die Notation x 7→ y bedeutet, dass x auf y abgebildet wird, d.h. (x, y) ist ein Element derfunktionalen Relation.Der Begriff
”Funktion“ ist gleichbedeutend zum Begriff
”Abbildung“. Es gibt Situationen, in denen
man haufiger den Begriff”Abbildung“ nutzt, in anderen ist der Begriff
”Funktion“ gebrauchlicher.
Zum Beispiel, wenn der Zielbereich die reellen Zahlen sind, so redet man von (reell-wertigen)Funktionen.
31.10.
Beispiele 7.10.
(a) f := {(x, x2) ‖x ∈ [0, 5]} ⊂ [0, 5]×R ist eine funktionale Relation mit D(f) = [0, 5] und B(f) =[0, 25]. Dann ist f : [0, 5]−→[−4, 40] eine Abbildung. Wir schreiben derartige Abbildungen als
f : [0, 5] −→ [−4, 40]
x 7→ x2
Alternativ kann man die zweite Zeile auch durch f(x) = x2 oder f(x) := x2 ersetzen.(b) Sei f wie oben. Die Abbildungen F1 := (f, [0, 5], [0, 25]) und F2 := (f, [0, 5], [−4, 40]) sind
verschieden, obwohl dieselbe funktionale Relation f zu Grunde liegt.(c) Die Identitat idM von M ist die Abbildung (δM ,M,M), die wir (dem obigen Beispiel folgend)
auch als M−→M , x 7→ x schreiben konnen.(d) Ist M eine Teilmenge von N , so nennen wir die Abbildung (δM ,M,N) die Inklusion von M
in N oder genauer Inklusion der Menge M in die Menge N . 20
Bemerkung 7.11. Aus Ihrer jetzigen Sicht ist der essentielle Unterschied zwischen einer funktiona-len Relation und einer Abbildung, dass im Begriff der Abbildung auch der Zielbereich festgelegt ist,wahrend eine funktionale Relation keinen Zielbereich hat. 21 Spater werden der Definitionsbereichund der Zielbereich zusatzliche Struktur tragen: z.B. eine Vektorraumstruktur, eine Gruppenstruk-tur oder eine Abstandsfunktion. Da wichtige Eigenschaften von Abbildungen wie z.B. Linearitat
20wichtig ist hier die Konjugation von”die Menge“: Genitiv (bzw. von-Konstruktion), dann Akkusativ
21Vergleich zu anderen Lehrbuchern: Es herrscht Uneinigekeit in der Literatur, ob eine Abbildung Informa-
tion uber den Zielbereich tragt oder nicht. Das Lehrbuch [12] unterscheidet in diesem Zusammenhang zwischen
”Funktionen“, die wie unsere
”funktionale Relationen“ definiert sind, und
”Funktionen von X nach Y “, die im
wesentlichen unseren”Abbildungen“ entsprechen. In [17] bedeuten die Begriffe
”funktionale Relation“,
”Funktion“
und”Abbildung“ dasselbe, es bleibt aber dort unklar, ob die oben definierten Abbildungen F1 und F2 in diesem
Buch gleich oder verschieden sind. Wir werden in der Vorlesung die obigen Definitionen nutzen und zulassen, uminnerhalb unserer Analysis I Klarheit zu schaffen.
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 27
und Stetigkeit von solcher Zusatzstruktur abhangt, wird es dann hilfreich sein, dass auch derDefinitionsbereich im Tripel einer Abbildung enthalten ist.
Es gibt auch einige Teilbereiche der Mathematik und ihren Anwendungen, in denen man D(f) =X durch D(f) ⊂ X ersetzt. Dies ist zum Beispiel bei den
”dicht definierten Operatoren
”der
Funktionalanalysis und der Quantenmechanik der Fall, zum Beispiel der Orts- und der Impuls-Operator der Quantenmechanik.
Bemerkung 7.12. Zur Interpretation: Aquivalenz- und Ordnungs-Relationen auf der einen Seiteund funktionale Relationen sind zwar ahnlich definiert (als Relationen und somit als Mengen, derenElemente Paare sind). Dennoch interpretiert man sie anders: Aquivalenz- und Ordnungsrelationenvergleichen zwei Objekte. Beispiel: die Relation ≤R, gibt an, ob die links stehende Zahl kleiner odergleich der rechts stehenden ist. Die Interpretation von funktionalen Relationen ist dynamischer,x 7→ x2 ordnet x den Wert x2 zu, so wie ein(e) Platzanweiser(in) im Theater jedem Zuschauer sagt,in welchem Stockwerk er den Theatersaal betreten darf: im Parkett (0. Stockwerk) oder im k-tenRang (k-tes Stockwerk): jedem Zuschauer wird ein Stockwerk zugeordnet. Aus diesem Grund istdie Schreibweise xRy fur Ordnungs- und Aquivalenzrelationen ublich, wohingegen die Schreibweisey = R(x) fur funktionale Relationen ublich ist. Beides ist defniert als (x, y) ∈ R.
Bemerkung 7.13. Sei A eine auf M definierte Aussageform und sei f : M−→N eine Abbildung.Dann gilt
{f(x) ‖x ∈M} = {y ∈ N | ∃x ∈M : f(x) = y} = B(f).
Definition 7.14. Sei f : X−→Y eine Abbildung.
(1) Fur M ⊂ X definieren wir die Einschrankung oder Restriktion von f : X−→Y auf M alsdie Abbildung (f |M ,M, Y ), wobei
f |M := {(x, y) ∈ X × Y | x ∈M ∧ y = f(x)} = {(x, f(x)) ‖x ∈M},
(2) Ist g : Y−→Z eine weitere Abbildung, so definieren wir die Verkettung oder die Kompo-sition von g : Y−→Z mit f : X−→Y als die Abbildung (g ◦ f,X,Z), wobei
g ◦ f(x) := g(f(x)).
Man liest g ◦ f als”g nach f“.
Definition 7.15.
(1) Eine funktionale Relation f bzw. eine Abbildung f : X−→Y heißt injektiv , falls gilt
∀x1, x2 ∈ X : (f(x1) = f(x2)→ x1 = x2).
Dies bedeutet, dass jedes Element in X unter f auf ein anderes Element in Y abgebildet wird.(2) Eine Abbildung f : X−→Y heißt surjektiv , falls B(f) = Y .(3) Eine Abbildung f : X−→Y heißt bijektiv , falls sie injektiv und surjektiv ist.
28 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
X = D(f)
Y••••
•••••
injektiv
X = D(f)
Y•••••
••••
surjektiv
X = D(f)
Y••••
••••
bijektiv
Abbildung 4: Schemtische Darstellungen von injektiv, surjektiv und bijektiv.
Wenn f eine funktionale Relation ist, so ist f : D(f)−→B(f) eine surjektive Abbildung.
Beispiele 7.16. (in der Vorlesung ubersprungen = grau)
(a) Die Abbildung R−→R, x 7→ x2 ist weder injektiv noch surjektiv.(b) Die Abbildung R>0−→R, x 7→ x2 ist injektiv, aber nicht surjektiv.(c) Die Abbildung R>0−→R>0, x 7→ x2 ist bijektiv.
Um das obige Beispiel der/s Platzanweisers/in nochmals weiter zu entwickeln: Wenn der Platzan-weiser nicht nur das Stockwerk zuordnet, sondern auch den konkreten Sitzplatz, so ist zu hoffen,dass diese Abbildung injektiv ist, da sonst zwei Leute auf dem selben Platz sitzen mussen. DerKassenwart des Theaters hingegen hofft, dass die Abbildung von der Menge der Zuschauer auf dieMenge der Sitzplatze auch surjektiv ist, da dann das Theater voll besetzt ist.
Definition 7.17. Ist R eine Relation und R ⊂M ×M , dann definieren wir
R−1 := {(y, x) ∈M ×M | xRy},Man nennt R−1 die Umkehrung von R.
UBUNG 7.18.
(a) Sei f eine funktionale Relation. Dann ist f−1 genau dann eine funktionale Relation, wenn finjektiv ist.
(b) Ist f : X−→Y eine Abbildung, so ist f−1 : Y−→X genau dann eine Abbildung, wenn f :X−→Y bijektiv ist.
(c) Ist f : X−→Y eine bijektive Abbildung, so gilt f−1 ◦ f = δX und f ◦ f−1 = δY .
Man nennt dann f−1 : Y−→X die Umkehrabbildung von f : X−→Y .
UBUNG 7.19. Seien f : X−→Y und g : Y−→Z Abbildungen. Zeigen Sie:
(1) Ist g ◦ f : X−→Z surjektiv, dann ist auch g surjektiv.
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 29
(2) Ist g ◦ f : X−→Z injektiv, dann ist auch f injektiv.(3) Geben Sie ein Beispiel an, das zeigt, dass die Umkehrung der Aussage (1) nicht gilt. Das heißt:
finden Sie Abbildungen f : X−→Y und g : Y−→Z, so dass g : Y−→Z surjektiv ist, aber nichtg ◦ f : X−→Z.
(4) Geben Sie ein Beispiel an, das zeigt, dass die Umkehrung der Aussage (2) nicht gilt.
UBUNG 7.20. Seien X und Y Mengen, X 6= ∅. Es gibt eine injektive Abbildung f : X−→Y genaudann, wenn es eine surjektive Abbildung g : Y−→X gibt.22
Siehe: Aufgabe 3 auf Ubungsblatt 3
SATZ 7.21 (Schroder, Bernstein). Seien X und Y Mengen. Angenommen, es gibt eine injektiveAbbildung f : X−→Y und eine injektive Abbildung g : Y−→X, dann gibt es auch eine bijektiveAbbildung g : X−→Y .
Beweis: 2. Ubungsblatt der Linearen Algebra I
Definition 7.22. Seien X und Y Mengen. Wir sagen:
• X und Y sind gleich machtig , falls es eine bijektive Abbildung f : X−→Y gibt.• Y ist machtiger als X, falls es eine injektive Abbildung f : X−→Y und es keine bijektive
Abbildung b : X−→Y gibt.• X ist endlich, falls es eine naturliche Zahl n ∈ N gibt, so dass X und {m ∈ N | 0 < m ≤ n}
gleich machtig sind. Wir schreiben dann #X = n und sagen X hat n Elemente.• X ist unendlich, falls X nicht endlich ist. Wir schreiben dann #X =∞.• X ist abzahlbar , falls es eine injektive Abbildung X → N gibt.• X ist uberabzahlbar , wenn X nicht abzahlbar ist. Dann ist X machtiger als N.
UBUNG 7.23. Sei M ein Mengensystem. Fur A,B ∈M definieren wir
A ∼ B :⇐⇒ A und B sind gleichmachtig.
Zeigen Sie, dass ∼ eine Aquivalenzrelation auf M ist.
Beispiele 7.24.(1) #X = 0 ⇐⇒ X = ∅.(2) Endliche Mengen sind abzahlbar (Offensichtlich).(3) X ist abzahlbar unendlich⇐⇒ X und N sind gleich machtig. (Ein Beweis benotigt vollstandige
Induktion, oder die Peano-Axiome oder irgend etwas, was die naturlichen Zahlen charakteri-siert.)
(4) Z und N sind gleich machtig, Q und N sind gleich machtig (Ubung: Beweisen Sie dies!). Alsosind Z und Q abzahlbar unendlich.
(5) R is machtiger als N (wird spater bewiesen!)
!ACHTUNG!. Gilt #X =∞ und #Y =∞, so folgt daraus nicht, dass X und Y gleich machtigsind.
22Leider habe ich in der Vorlesung die Bedingung X 6= ∅ vergessen!
30 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Ist f : X−→Y eine Abbildung und M ⊂ X, so definieren wir
f#(M) := {y ∈ Y | ∃x ∈M : y = f(x)} = {f(x) ‖x ∈M}.
Man nennt f#(M) das Bild von M unter f . Wir erhalten eine Abbildung
P(X) −→ P(Y )(7.25)
M 7→ f#(M)
Analog definiert man fur N ⊂ Y :
f#(N) := {x ∈ X | f(x) ∈ N}.
Man nennt f#(N) das Urbild von N unter f . Wir erhalten eine Abbildung
P(Y ) −→ P(X)(7.26)
N 7→ f#(N)
Die funktionalen Relationen f# bzw. f# werden in der Literatur (und auch in der Linearen Al-gebra I) oft mit f bzw. f−1 bezeichnet. Dies kann zu Missverstandnisse fuhren, da f und f#
verschiedene funktionale Relationen sind und da f−1 nur dann eine funktionale Relation ist, wennf injektiv ist. Wir nutzen deswegen in den nachsten Wochen die Bezeichnungen f# und f# wieoben, um Missverstandnisse zu vermeiden. Spater (ab Analysis II) schreiben wir auch einfach fund f−1.
UBUNG 7.27. Sei f : X−→Y eine Abbildung, A,B ⊂ X und M,N ⊂ Y . Zeigen Sie
(1) f#(A ∩ B) ⊂ f#(A) ∩ f#(B). Geben Sie ein Beispiel an, das zeigt, dass diese Teilmengemanchmal eine echte Teilmenge ist.
(2) f#(A ∪B) = f#(A) ∪ f#(B).(3) A ⊂ B → f#(A) ⊂ f#(B).(4) f#(M ∩N) = f#(M) ∩ f#(N).(5) f#(M ∪N) = f#(M) ∪ f#(N).(6) M ⊂ N → f#(M) ⊂ f#(N).(7) A ⊂ f#(f#(A)). Geben Sie ein Beispiel an, das zeigt, dass diese Teilmenge manchmal
eine echte Teilmenge ist.(8) f#(f#(M)) ⊂ M . Geben Sie ein Beispiel an, das zeigt, dass diese Teilmenge manchmal
eine echte Teilmenge ist.(9) f#(M rN) = f#(M) r f#(N)
Die Aussagen (1) und (2) werden auf dem 3. Ubungsblatt dieser Vorlesung bewiesen. Die Aussagen(7), (8) und (9) wurden auf dem 2. Ubungsblatt der Linearen Algebra gezeigt.
8. FAMILIEN 31
8. Familien
Definition 8.1. Seien I und M Mengen. Eine (I-indizierte) Familie von Elementen von M istdasselbe wie eine Abbildung von I nach M . Wenn man eine Abbildung f : I−→M als Familieinterpretiert, so schreiben wir sie als (f(i))i∈I oder als (f(i) | i ∈M). Die Menge aller I-indiziertenFamilien von Elementen von M ist also M I = Abb(I,M). Eine Familie (f(i))i∈I heißt nicht-leer,falls I nicht die leere Menge ist. Die Menge I heißt Indexmenge. Ist die Indexmenge I := N oderI := N>0, so nennt man die Elemente in M I = Abb(I,M) oft auch M -wertige Folgen oder Folgenin M .
Beispiele 8.2. (a) Eine (reell-wertige) Folge ist definiert als N-indizierte Familie von reellen Zah-len. Eine solche Folge ist also eine Abbildung N−→R, die wir als (ai)i∈N schreiben. Alternativdarf man diese Folge auch in der Form (a0, a1, a2, a3, . . .) schreiben.
(b) Sei M eine Menge. Ein k-Tupel (a1, a2, . . . , ak) ∈Mk definiert dann die Familie (aj)j∈{1,2,...,k}.
Wir erhalten eine bijektive Abbildung F : Mk−→M{1,...,k}, (a1, a2, . . . , ak) 7→ (aj)j∈{1,2,...,k}.
Die Elemente von Mk wurden ganz anders”definiert“ als die Elemente von M{1,...,k}. Den-
noch haben die Elemente von Mk und die von M{1,...,k} nahezu identische Eigenschaften: beidesind durch eine geordnete Liste mit k Elementen von M beschreibbar. Damit uns die Forma-lien nun nicht erdrucken, ist es nun sinnvoll so zu tun, als ware (a1, a2, . . . , ak) dasselbe wie(aj)j∈{1,2,...,k}. Man sagt dazu (a1, a2, . . . , ak) wird mit (aj)j∈{1,2,...,k} identifiziert. Dadurch
identifizieren wir auch automatisch Mk mit M{1,...,k}. Um zu unterstreichen, dass dieses Iden-tifizieren von obigem F abhangt sagen wir: wir identifizieren Mk mit M{1,...,k} vermoge F .Wer das Wort
”vermoge“ nicht mag, kann auch
”mit Hilfe von“ sagen. 23
(c) Die Basis eines Vektorraums ist eine Familie von Vektoren, die linear unabhangig sind und denVektorraum erzeugen.
Bemerkung 8.3. Wenn Sie eine ahnliche Aussage oder Definition wie das obige (b) in der Schu-le gesehen haben, so stand dort wahrscheinlich nicht eine
”Familie von Vektoren“, sondern eine
”Menge von Vektoren“. Dies ist aber aus mehreren Grunden problematisch, z.B. erhalten wir mit
dieser Mengendefinition, dass
B :=
{(10
),
(01
),
(10
)}eine Basis von R2 ist. Man beachte, dass B genau zwei Elemente enthalt, da zwischen obigenMengenklammern zweimal derselbe Vektor steht.Die Aussage
”Seien v1 und v2 Vektoren in R2. Dann ist {v1, v2} eine Basis von R2 genau dann wenn {v1, v2}
linear unabhangig sind.“
23Es stellt sich hier unweigerlich die Frage, wieso wir nicht gleich Elemente in M ×M als Abbildungen von{1, 2}−→M definiert haben. Dies geht aber leider nicht, da wir zur Einfuhrung von Abbildungen bereits wissenmussten, was ein Paar und was ein kartesisches Produkt ist.
32 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
ist falsch, denn im Fall v1 = v2 6= 0 ist {v1, v2} = {v1} und somit linear unabhangig. Aber {v1} istkeine Basis von R2. Korrekt ist hingegen die Aussage:
”Seien v1 und v2 Vektoren in R2. Dann ist (vi)i∈{1,2} eine Basis von R2 genau dann wenn
(vi)i∈{1,2} linear unabhangig ist.“
Anschaulich gilt: Familien registrieren Mehrfachnennungen. Uber {1, 2 . . . , k} oder uber N indizier-te Mengen registrieren auch die Ordnung der Elemente.
Definition 8.4. Ist (Mi)i∈I eine Familie von Mengen, (d.h. jedes Mi ist eine Menge), so definierenwir ⋃
(Mi | i ∈ I) :=⋃{Mi | i ∈ I} = {x | ∃i ∈ I : x ∈Mi}
und falls (Mi)i∈I nicht-leer ist⋂(Mi | i ∈ I) :=
⋂{Mi | i ∈ I} = {x | ∀i ∈ I : x ∈Mi}.
Wir schreiben auch⋃i∈IMi fur
⋃(Mi | i ∈ I) und
⋂i∈IMi fur
⋂(Mi | i ∈ I).
Kartesische Produkte von Mengenfamilien.Wir haben bereits Mk mit M{1,...,k} identifiziert. Die Elemente von MN sind also eine Art
”un-
endliches kartesisches Produkt“. Solche Produkte sind seit Ende des 19. Jahrhunderts in vielenBereichen der Mathematik ganz wichtig. Dieser Begriff soll deswegen prazisiert werden. Wir wollenauch gleich Produkte in der Form M1 ×M2 × . . . zulassen, d.h. die Mi (genannt Faktoren) durfenverschieden sein.
Definition 8.5 (Kartesische Produkte von Mengenfamilien). Gegeben sei eine Familie (Mi)i∈Ivon Mengen, d.h. gegeben sei eine Indexmenge I und fur jedes i ∈ I eine Menge Mi. Wir definierenzunachst M :=
⋃i∈IMi. Das kartesische Produkt der Familie (Mi)i∈I ist definiert als∏
i∈IMi :=
{(mi)i∈I ∈M I | ∀i ∈ I : mi ∈Mi
}Beispiele 8.6.
∏i∈IM = M I
Analog zu Beispiele 8.2 (b) kann man∏i∈{1,...,k}Mi mit M1 × · · · ×Mk identifizieren.
Ein Mi in der obigen Definition nennt man den i-ten Faktor oder die i-te Komponente. Fur einfixiertes i0 ∈ I nennt man die Abbildung∏
i∈IMi −→ Mi0
(mi)i∈I 7→ mi0
die i0-te kanonische Projektion.
LITERATUR FUR DAS BISHERIGE KAPITEL 33
Literatur fur das bisherige Kapitel
Das Buch [12] ist eine recht ausfuhrliche und leicht lesbare Einfuhrung in die mengentheoretischenGrundlagen der Mathematik. Das Buch [17] ist deutlich kurzer und beschrankt sich mehr auf daswesentliche, aber fur manche Anfanger vielleicht etwas zu dicht geschrieben. Es fokussiert sichauch mehr auf besonders interssante Aspekte. Die wichtigsten Begriffe in Kurze finden sich auchim Buch von D. Grieser [18], das auf dem Skript seiner Analysis-Vorlesung [19] aufbaut. WeitereLiteratur ist das Buch von Halmos in einer deutschen und englischen Fassung [20]. Einen deutlichtiefer gehenden Einstieg in die Mengenlehre findet man in [13].
KAPITEL 2
Zahlen
2.11.
Ab jetzt schreiben wir → oder −→ fur Abbildungen, statt wie bisher das rote Symbol −→ zuverwenden. Wir schreiben {f(x) | x ∈M} statt {f(x) ‖x ∈M}. Die exakte Bedeutung kann manaus dem Kontext heraus ablesen.
Der einleitende Teil der Vorlesung ist nun beendet und wir – Professoren, Mitarbeiter, Tutorenund die Horer der Vorlesung – sollten uns bemuhen, ab jetzt deutlich rigorosere Begrundungenzu geben. Wenn aus Zeitgrunden nicht alles bewiesen werden kann, so mussen wir klar darstellen,wo genau wir kleinere Lucken lassen, und andeuten, wie diese geschlossen werden konnen (EigenesNachdenken, Anhang, Literatur, Zentralubung, Ubungsblatter, etc.).
1. Die naturlichen Zahlen
Die Axiome fur die naturlichen Zahlen bilden die Peano-Axiome, benannt nach dem italienischenMathematiker Guiseppe Peano (1858–1932).
AXIOME 1.1 (”Axiome“ der naturlichen Zahlen (Peano-Axiome)). Die naturlichen Zahlen beste-
hen aus
• einer Menge N,• einem (ausgewahlten) Element in N, das wir 0 nennen,• und einer Abbildung s : N −→ N, x 7→ s(x), genannt die Nachfolger-Abbildung.
Wir fordern, dass hierfur folgenden Eigenschaften, genannt die Peano-Axiome, erfullt sind:
(P1) 0 6∈ B(s) (das heißt: 0 ist nicht im Bild von s)(P2) Die Abbildung s : N −→ N ist injektiv.(P3) (Induktionsaxiom) Erfullt T ⊂ N die Bedingungen 0 ∈ T und s#(T ) ⊂ T , dann gilt bereits
T = N.
Alles, was Sie uber die naturlichen Zahlen kennen, kann man darauf aufbauen, zum Beispiel Addi-tion, Multiplikation und Exponieren von naturlichen Zahlen, die bekannten Gesetze (zum Beispiel:Kommutativitat von Addition und Multiplikation, Assoziativitat von Addition und Multiplikati-on, Distributivgesetz, Potenzgesetz) kann man daraus herleiten. Da dies in der Linearen Algebra
35
36 2. ZAHLEN
I detailiert besprochen werden soll, werden wir dies in der Analysis I nur erwahnen. Fur Detailsverweisen wir auch auf Anhang B, der manche dieser Aspekte ausfuhrt.
Auf den naturlichen Zahlen N definiert man eine Relation ≤ auf N wie folgt: Fur alle n,m ∈ Ngelte:
n ≤ m⇐⇒ ∃k ∈ N : n+ k = m.
Dies ist eine totale Ordnungsrelation auf N, was auch ein paar hier nicht ausgefuhrte Beweiseerfordert, wenn man alles von Grund auf beweist. Ferner definiert man
n ≥ m :⇐⇒ m ≤ nn < m :⇐⇒ n ≤ m ∧ ¬n = m
n > m :⇐⇒ m < n
Aus den Peano-Axiomen leitet man zwei wichtige Satze her: den Satz uber vollstandige Induktionund den Dedekindschen Rekursionssatz, beide werden in Anhang B bewiesen.
SATZ 1.2 (Dedekindscher Rekursionssatz). Sei M eine Menge, a ∈M und g : M ×N −→M eineAbbildung.1 Dann gibt es genau eine Abbildung f : N −→M so dass f(0) = a und
∀n ∈ N : f(n+ 1) = g(f(n), n).
Wenn man alles sauber aufbauen will, so sind zunachst die Summe +, das Produkt · und dasExponieren durch den Rekursionssatz zu definieren, siehe Anhang B. Wir wollen diese Operationenaber als gegeben voraussetzen.
Beispiel 1.3 (Definition der Fakultat). Wir setzen M := N, a = 1 und g(m,n) := (n + 1) · m.Dann nennt man die Abbildung f , die uns Satz 1.2 liefert, die Fakultat. Wir schreiben n! stattf(n). Klammerkonvention: ! wird vor + und · ausgefuhrt. Somit ist ! : N→ N die einzige Funktion,die die Eigenschaften
0! = 1
∀n ∈ Nr {0} : n! = n · (n− 1)!
erfullt. Es gilt somit 1! = 1, 2! = 1 · 2, 3! = 1 · 2 · 3, . . . , n! = 1 · 2 · · · · · n.
Beispiel 1.4 (Summen- und Produktsymbole). Oft ist es wichtig, Ausdrucke der Form
a1 + . . .+ an
exakt zu beschreiben. Hierzu fuhren wir ein Symbol∑nj=1 ein. Man definiert rekursiv
0∑j=1
aj := 0
1Man schreibt hier und immer in vergleichbaren Situationen dann g(m,n) statt g((m,n)).
1. DIE NATURLICHEN ZAHLEN 37
und fur alle n ∈ Nn+1∑j=1
aj :=
n∑j=1
aj
+ an+1.
Dann ist2
n∑j=1
aj = a1 + . . .+ an.
Analog hierzu0∏j=1
aj := 1
und fur alle n ∈ Nn+1∏j=1
aj :=
n∏j=1
aj
· an+1.
Insbesondere gilt also n! =∏nj=1 j.
Wir nutzen3 auch folgende Verallgemeinerung: Es seien k, n ∈ Z und es gelte k ≤ n + 1. Danndefiniert mann∑j=k
aj :=
n−k+1∑j=1
aj+k−1 = ak + ak+1 + . . .+ an,
n∏j=k
aj :=
n−k+1∏j=1
aj+k−1 = ak · ak+1 · · · · · an.
SATZ 1.5 (Vollstandige Induktion). Sei A( · ) eine auf N definierte Aussageform. Wir setzenvoraus, dass Induktionsanfang und Induktionsschritt erfullt sind:Induktionsanfang: A(0) ist wahr.Induktionsschritt: Fur alle n ∈ N gilt: (A(n) =⇒ A(n+ 1))).Dann gilt fur alle n ∈ N die Aussage A(n).
Im Induktionsschritt nennt man A(n) die Induktionsvoraussetzung .
Beispiel 1.6. Wir wollen zeigen, dass fur alle n ∈ N die folgende Aussage wahr ist
A(n) :
n∑j=1
j =1
2n (n+ 1).
Induktionsanfang n = 0
Fur n = 0 steht auf der linken Seite (l.S.) nach Definition∑nj=1 j = 0.
Auf der rechten Seite (r.S.) haben wir 120 (0 + 1) = 0. Somit l.S. = r.S..
2Dies ist genau genommen keine Aussage, sondern die Definition des Ausdrucks a1 + . . .+ an, der bisher nichtso klar definiert war, da die Bedeutung der Punkte unklar blieb.
3Solange wir Z noch nicht eingefuhrt haben, sollte man k, n ∈ N annehmen.
38 2. ZAHLEN
Deswegen ist A(0) wahr.
Induktionsschritt von n auf n+ 1
Nach Induktionsvorraussetzung gilt bereits die Aussage A(n), also
n∑j=1
j =1
2n (n+ 1).
Zu zeigen ist A(n+ 1), also die Aussage
n+1∑j=1
j =1
2(n+ 1)
((n+ 1) + 1
).
Wir berechnen die linke Seite:n+1∑j=1
j =( n∑j=1
j)
+ (n+ 1) =1
2n (n+ 1) + (n+ 1) =
n (n+ 1) + 2 (n+ 1)
2) =
1
2(n+ 2) (n+ 1).
Wir berechnen die rechte Seite:
1
2(n+ 1)
((n+ 1) + 1
)=
1
2(n+ 1) (n+ 2).
Also wieder l.S. = r.S..
Damit haben wir gezeigt, dass A(n+ 1) aus A(n) folgt.
Schlussfolgerung (wird normalerweise nicht mehr aufgeschrieben, da es bei jeder vollstandigenInduktion immer dasselbe Argument ist)
Die Voraussetzungen von Satz 1.5 sind also erfullt, deswegen gilt fur alle n ∈ N die AussageA(n).
Beispiel 1.7 (Geometrische Summe). Sei q ∈ Nr {1} (oder q ∈ Rr {1} oder q ∈ Cr {1} oder inirgendeinem unitaren Ring R, so dass (1− q)−1 existiert).
Wir wollen zeigen, dass fur alle n ∈ N die folgende Aussage wahr ist
A(n) :
n∑j=0
qj =1− qn+1
1− q.
Wir multiplizieren auf beiden Seiten mit 1 − q und erhalten daraus die zu A(n) aquivalente Aus-sageform
A(n) : (1− q)n∑j=0
qj = 1− qn+1,
die wir durch Induktion uber n zeigen wollen.
Induktionsanfang n = 0
1. DIE NATURLICHEN ZAHLEN 39
Fur n = 0 rechnen wir
(1− q)0∑j=0
qj = (1− q)q0 = (1− q) 1 = 1− q1 = 1− q0+1.
Deswegen ist A(0) wahr.
Induktionsschritt von n auf n+ 1
Nach Induktionsvorraussetzung gilt bereits die Aussage A(n), also
(1− q)n∑j=0
qj = 1− qn+1.
Zu zeigen ist A(n+ 1), also die Aussage
(1− q)n+1∑j=0
qj = 1− q(n+1)+1.
Wir berechnen:
(1− q)n+1∑j=0
qj = (1− q)(( n∑
j=0
qj)
+ qn+1
)= (1− q)
( n∑j=0
qj)
︸ ︷︷ ︸=1−qn+1
+(1− q) qn+1
= 1− qn+1 + qn+1 − qn+2 = 1− qn+2.
Also haben wir A(n+ 1) gezeigt.
Auch die folgenden elementaren Gesetze der naturlichen Zahlen mussen bei einem logisch vollstandi-gen Aufbau durch vollstandige Induktion gezeigt werden. Genau genommen, lange bevor wir obigeBeispiele diskutieren konnen. Aus Zeitgrunden werden wir dies nicht ausfuhren, sondern ebenfallswieder auf Anhang B des Skripts verweisen.
SATZ 1.8. (N,+, ·) erfullt die folgenden Eigenschaften:
(Aa) Addition ist assoziativ.Fur alle x, y, z ∈ N gilt
(x+ y) + z = x+ (y + z).
(An) Addition hat neutrales Element.Es gibt ein Element 0 ∈ N, so dass fur alle x ∈ N gilt
x+ 0 = 0 + x = x.
(Diese Null ist unsere bisherige!)
40 2. ZAHLEN
(Ak) Addition ist kommutativ.Fur alle x, y ∈ N gilt
x+ y = y + x.
(Ma) Multiplikation ist assoziativ.Fur alle x, y, z ∈ N gilt
(x · y) · z = x · (y · z).(Mn) Multiplikation hat neutrales Element.
Es gibt ein Element 1 ∈ N, so dass fur alle x ∈ N gilt
x · 1 = 1 · x = x.
(Diese Eins ist unsere bisherige!)(Mk) Multiplikation ist kommutativ.
Fur alle x, y ∈ N gilt
x · y = y · x.(AMd) Addition und Multiplikation erfullen das Distributivgesetz.
Fur alle x, y, z ∈ N gilt
x · (y + z) = x · y + x · z
(y + z) · x = y · x+ z · x
Eine weitere elementare Eigenschaft von N, die in der Linearen Algebra gezeigt wurde, ist die Wohl-ordnung von N. Einen Beweis findet man in Anhang B, wo der Satz nochmals als Proposition 3.3wiederholt ist.
SATZ 1.9 (Wohlordnung von N). Jede nicht-leere Teilmenge T von N besitzt ein Minimum.
Hierbei nennen wir y ein Minimum von T , falls y ∈ T und ∀x ∈ T : y ≤ x. Wenn eine Mengemit Ordungsrelation ein Minimum besitzt, so ist dieses eindeutig; diese Eindeutigkeit folgt direktaus der Antisymmetrie. Falls ein Minimum y in M existiert, so schreiben wir y = minM . Wirerhalten analog die Definition eines Maximums, wenn y ≤ x durch y ≥ x ersetzen, und schreibendann y = maxM .
SATZ 1.10. Ist M eine abzahlbar unendliche Menge, dann sind M und N gleich machtig.
Beweis. Da M abzahlbar ist, gibt es eine injektive Abbildung f : M → N. Wir definieren Q :=f#(M). Da f injektiv ist, ist die Abbildung
M −→ Q
x 7→ f(x)
bijektiv. Also sind M und Q gleich machtig. Zu zeigen bleibt, dass Q und N gleich machtig sind.
Zeichnung mit Q in N und der Abbildung g, die das nachsthohere Element sucht.
2. ETWAS KOMBINATORIK 41
Wir definieren fur k ∈ N:Q>k := {x ∈ Q | x > k}.
Behauptung: ∀k ∈ N : Q>k 6= ∅.
Begrundung: Angenommen Q>k = ∅, dann ware Q ⊂ {1, 2, . . . , k}, also ware Q und somit Nendlich. Widerspruch.
Wir definieren g : Q −→ Q als
g(k) := das Minimum von Qk.
Die Funktion ist wohldefiniert wegen Satz 1.9. Aus der Definition von g ergibt sich insbesondereg(k) > k.
Definiere rekursiv mit Hilfe des Dedekindschen Rekursionssatzes die Funktion h : N→ Q durch
h(0) := das Minimum von Q,
∀n ∈ N : h(n+ 1) := g(h(n)).
Somit gilt h(n+ 1) > h(n), und deswegen zeigt man leicht (durch eine weitere vollstandige Induk-tion), dass h : N → Q injektiv ist.4 Da die Inklusion Q → N injektiv ist, folgt aus dem Satz 7.21von Schroder-Bernstein, dass Q und N gleich machtig sind.
2. Etwas Kombinatorik
Um den Umgang mit naturlichen Zahlen zu uben, zeigen wir einige Aussagen, die in der Kombi-natorik wichtig sind.
SATZ 2.1. Fur endliche Mengen N und Q gilt (#N) · (#Q) = #(N ×Q).
Beweis.
Sei also s := #N und t := #Q. Es gibt also bijektive Abbildung ϕ : N → {1, 2, . . . , s} 5 undψ : N → {1, 2, . . . , t}. Dann ist die Abbildung
ϕ× ψ : N ×Q −→ {1, 2, . . . , s} × {1, 2, . . . , t}(n, q) 7→ (ϕ(n), ψ(q))
bijektiv und man zeigt auch sofort, dass
p : {1, 2, . . . , s} × {1, 2, . . . , t} −→ {1, 2, . . . , ts}(a, b) 7→ a+ s(b− 1)
bijektiv ist. Also
#(N ×Q) = #({1, 2, . . . , s} × {1, 2, . . . , t}) = #({1, 2, . . . , ts}) = ts.
7.11.
4Die Abbildung h : N→ Q ist sogar bijektiv, aber wir benotigen dies im folgenden nicht.5Hier gilt immer: {1, 2, . . . , s} := {r ∈ N | 0 < r ≤ s}, insbesondere ist es die leere Menge, falls s = 0.
42 2. ZAHLEN
SATZ 2.2. Sei n ∈ Nr{0}. Angenommen M hat k Elemente. Dann ist kn die Anzahl der Elementevon Mn = M × · · · ×M︸ ︷︷ ︸
n−mal
.
Der Beweis ist eine einfach Induktion, die nun jeder selbst durchfuhren konnen sollte.
Beweis. Wir zeigen den Satz durch vollstandige Induktion uber n ∈ Nr {0}:
A(n) : #(Mn) = (#M)n.
2. ETWAS KOMBINATORIK 43
Induktionsanfang n = 1Offensichtlich wegen M1 = M und k1 = k.
Induktionsschritt von n auf n+ 1
#(Mn+1) = #(M ×Mn) = (#M) · (#(Mn)) = (#M) · (#M)n = (#M)n+1
Hierbei folgt das erste Gleichheitsszeichen direkt aus der Definition von Mn+1, das zweite aus demvorangehenden Satz, das dritte nach Induktionsvoraussetzung und das letzte aus der Definitionvon Potenzen in N.
SATZ 2.3. Angenommen, eine Menge M hat n ∈ N Elemente, dann gibt es 2n Elemente in P(M).
Auch dies beweist man durch Induktion uber n.
Beweis. Induktionsanfang n = 0
Die leere Menge ∅ ist die einzige Menge mit 0 Elementen. Sie hat einzige Teilmenge, namlich ∅.
Induktionsschritt von n auf n+ 1
Nun sei #M = n+ 1 und sei x ∈M . Definiere M ′ := M r {x}.
Wir definieren F : P(M ′)× {0, 1} −→ P(M) durch (A, 0) 7→ A und (A, 1) 7→M rA.
Die Umkehr-Abbildung ist
G : P(M) −→ P(M ′)× {0, 1}
B 7→
{(B, 0) falls x /∈ A(M rB, 1) falls x ∈ A
Man uberpruft leicht, dass G die Umkehrfunktion von F ist. Also ist F bijektiv. Wir erhalten nachInduktionsvoraussetzung
#P(M) = #(M ′ × {0, 1}) Satz 2.1= (#M ′)(#{0, 1}) = 2n · 2 = 2n+1.
Ahnlich zeigt man auch: sind M und N endliche Mengen, dann gilt
#(Abb(M,N)) = (#N)(#M),
oder in der anderen Schreibweise
#(NM ) = (#N)(#M).
Definition 2.4. Eine Permutation einer Menge M ist eine bijektive Abbildung von M nach M .
SATZ 2.5. Angenommen M hat n Elemente. Dann ist n! die Anzahl der Permutationen von M .
44 2. ZAHLEN
Interpretation: n! ist die Anzahl der Moglichkeiten, n unterscheidbare Objekte anzuordnen.
Satz 2.5 ist ein Spezialfall von Satz 2.6, folgt also bereits aus Satz 2.6.
SATZ 2.6. Seien M und N endliche Mengen mit #M ≥ #N . Dann ist die Anzahl der injektivenAbbildungen von N nach M gleich
(#M)!
(#M −#N)!.
Interpretation: m!/(m− n)! = m · (m− 1) · . . . · (m− n+ 1) ist die Anzahl der Moglichkeiten, auseiner Menge von m unterscheidbaren Objekten n Objekte herauszunehmen und anzuordnen.
Beweis. Wir zeigen durch Induktion uber n ∈ N fur festes k ∈ N .
A(n, k) :
{Gilt #M = n+ k und #N = n, dann gibt es(n+ k)!/k! viele injektive Abbildungen N −→M .
Induktionsanfang n = 0.
Also N = ∅. Dann ist ∅ : ∅ →M die einzige Abbildung von N nach M . Sie ist injektiv. Andererseitsgilt dann (n+ k)!/k! = k!/k! = 1.
Induktionsschritt von n auf n+ 1.
Sei #N = n+ 1 und #M = n+ 1 +k. Wir wahlen ein a ∈ N . Es gibt n+k+ 1 Moglichkeiten, demElement a ein Element von M zuzuweisen. Sobald festgelegt ist, dass a auf ein b ∈ M abgebildetwird, kann noch eine injektive Abbildung von N r {a} auf M r {b} gewahlt werden. Hierfur gibtes nach Induktionsvoraussetzung (n + k)!/k! Moglichkeiten. Somit ist die Anzahl der injektivenAbbildungen von N nach M durch
(n+ k + 1) · (n+ k)!
k!=
(n+ k + 1) (n+ k)!
k!=
(n+ k + 1)!
k!
gegeben.
SATZ 2.7. Seien m, k ∈ N. Die Anzahl der k-elementigen Teilmengen von einer Menge mit mElementen, m ≥ k ist: (
mk
):=
m!
k! (m− k)!.
Die oben definierte Zahl
(mk
)heißt Binomialkoeffizient .
Beweis. Sei N eine Teilmenge mit k Elementen von M , m = #M . Die Anzahl der bijektivenAbbildungen {1, 2, . . . , k} −→ N ist k!. Jede solche bijektive Abbildung {1, 2, . . . , k} −→ N ergibteine injektive Abbildung {1, 2, . . . , k} −→ M , und umgekehrt ergibt jede injektive Abbildung
2. ETWAS KOMBINATORIK 45
f : {1, 2, . . . , k} −→ M , x 7→ f(x) eine bijektive Abbildung f : {1, 2, . . . , k} −→ B(f), x 7→ f(x).Ist deswegen r die Anzahl der k-elementigen Teilmengen von M , dann ist r · k! die Anzahl derinjektive Abbildungen f : {1, 2, . . . , k} −→ M . Nach vorigem Satz also r · k! = m!/(m − k)! unddaraus ergibt sich
r =
(mk
).
Offensichtlich gilt
(mk
)=
(m
m− k
).
Wir setzen zudem
(mk
):= 0 fur m, k ∈ Z, falls k < 0 oder k > m.
Sei M = {1, 2, . . . ,m}. Dann hat M wegen Satz 2.3 2m Teilmengen. Da es
(mk
)Teilmengen mit
k Elementen gibt, folgt:
FOLGERUNG 2.8. Fur m ∈ N gilt
2m =
m∑k=0
(mk
).
SATZ 2.9. Es gelte m, k ∈ Z und m > 0. Dann gilt:
(m− 1k − 1
)+
(m− 1k
)=
(mk
).
Beweis. In den Fallen m = k ∈ Nr {0} und den Fallen k = 0, m ∈ Nr {0} haben wir
(mk
)= 1,
ein Summand ist 0 und der andere 1. Die Behauptung ist trivialerweise richtig, falls k < 0 oderk > m.
46 2. ZAHLEN
In den ubrigen Fallen rechnen wir
(m− 1k − 1
)+
(m− 1k
)=
(m− 1)!
(k − 1)! (m− 1− k + 1)!+
(m− 1)!
k! (m− 1− k)!
=k (m− 1)!
k (k − 1)! (m− k)!+
(m− k)(m− 1)!
k! (m− k) (m− 1− k)!
=(k +m− k) (m− 1)!
k! (m− k)!
=m!
k! (m− k)!
Pascalsches Dreieck
Bild eines Pascalschen Dreiecks
Alternativ auch hier zu sehen.
SATZ 2.10 (Binomische Formel). Seien x, y ∈ R oder in einem beliebigen kommutativen Ring6
mit 1. Sei n ∈ N.
Dann gilt
(x+ y)n =
n∑k=0
(nk
)xkyn−k.
Hierbei nutzen wir die Definition: x0 = y0 = (x+ y)0 = 1.
Beweis. Induktionsanfang n = 0
Auf beiden Seiten steht dann 1.
6Wenn Sie diesen Begriff des nachsten Abschnitts noch nicht kennen, ignorieren Sie bitte diesen Fall und
betrachten Sie zunachst den Fall x, y ∈ N oder x, y ∈ R.
3. DIE GANZEN ZAHLEN 47
Induktionsschritt von n− 1 auf n fur n ∈ N>0
(x+ y)n = (x+ y) (x+ y)n−1
= (x+ y)
(n−1∑k=0
(n− 1k
)xkyn−k−1
)
=
n−1∑k=0
(n− 1k
)xk+1yn−k−1 +
n−1∑k=0
(n− 1k
)xkyn−k
=
n∑k=1
(n− 1k − 1
)xkyn−k +
n−1∑k=0
(n− 1k
)xkyn−k
=n∑k=0
(n− 1k − 1
)xkyn−k +
n∑k=0
(n− 1k
)xkyn−k
=
n∑k=0
((n− 1k − 1
)+
(n− 1k
))xkyn−k
=
n∑k=0
(nk
)xkyn−k.
Hierbei nutzen wir die Induktionsvoraussetzung in der zweiten Zeile, das Distributivgesetz in derdritten, in der vierten Zeile wird im ersten Summand k durch k + 1 ersetzt. Danach nutzen wir(
n− 1−1
)=
(n− 1n
)= 0,
dann wieder das Distributivgesetz und letztendlich Satz 2.9.
3. Die ganzen Zahlen
Der nachste Schritt ist nun, die Menge der uns bekannten Zahlen Schritt fur Schritt zu erweitern:
N ⊂ Z ⊂ Q ⊂ R ⊂ C
Wir wollen diese Erweiterungen durch Eigenschaften charakterisieren.
Wir schreibenZ := {. . . ,−2,−1, 0, 1, 2, . . .} ⊃ N
fur die ganzen Zahlen.7
7Wir wollen wiederum Z nur durch charakterisierende Eigenschaften beschreiben, aber kein Modell konstruie-
ren, das diese Eigenschaften erfullt. Ein derartige Modell kann man zum Beispiel konstruieren in dem man auf N×N
48 2. ZAHLEN
Die Addition und die Multiplikation kann man zu Abbildungen
+ : Z× Z −→ Z, (a, b) 7→ a+ b· : Z× Z −→ Z, (a, b) 7→ a · b
erweitern, so dass die Eigenschaften (Aa), (Ak), (An), (Ma), (Mk), (Mn) und (AMd) weiterhingelten, wenn man dort N durch Z ersetzt. Außerdem gilt
(Ai) Addition hat inverse Elemente.Zu jedem x ∈ Z gibt es ein y ∈ Z, so dass
x+ y = y + x = 0.
Man nennt y das Inverse von x bezuglich der Addition und schreibt normalerweise −xanstelle von y.
Schreibweisex− y := x+ (−y).
Hinzu kommt eine Eigenschaft, die anschaulich besagt, dass die ganzen Zahlen”die kleinste Er-
weiterung“ der naturlichen Zahlen sind, die diese Eigenschaften erfullt. Prazise ausgedruckt:
(MEZ) Minimale Erweiterung.Ist T eine Teilmenge von Z mit N ⊂ T und gilt
∀x, y ∈ T : x+ y ∈ Tund
∀x ∈ T : −x ∈ T,dann gilt bereits T = Z.
Auch die Ordnung ≤ setzt sich auf Z fort und die Eigenschaften (1)–(5) in Lemma 3.1in Anhang B.3gelten weiter.
Eine mit Addition und Mulitplikation versehene Menge, die die Eigenschaften (Aa), (Ak), (An),(Ai), (Ma), und (AMd) erfullt, nennt man Ring . Gilt zusatzlich (Mn), so spricht man von einemRing mit Eins. Ein Ring, der zusatzlich (Mk) erfullt, nennt man einen kommutativen Ring.
Somit ist (Z,+, ·) ein kommutativer Ring mit Eins. Ein Ring (R, +, ·), der die naturlichen Zahlenenthalt 8 und (MEZ) erfullt, stimmt
”im wesentlichen“ mit den ganzen Zahlen uberein. Praziser:
es gibt eine bijektive Abbildung b : Z −→ R mit
∀x, y ∈ Z : b(x+ y) = b(x)+b(y) und b(x · y) = b(x)·b(y).
die Aquivalenzrelation (m,n) ∼ (a, b) ⇐⇒ m + b = n + a einfuhrt; dann sind die Element von Z die Aquivalenz-
klassen dieser Relation. Mit einer ahnlichen Konstruktion kann man aus den ganzen Zahlen die rationalen Zahlen
Q konstruieren. Diese beiden Konstruktion sollen in der Linearen Algebra erklart werden.8Gemeint ist hier: als Unterring enthalt, das heißt es wird gefordert, dass sich die bereits auf Z×Z definiterten
Operatoren + und · sich zu + und · fortsetzen.
4. DIE RATIONALEN ZAHLEN 49
Solche eine bijektive Abbildung, die Addition und Multiplikation erhalt, nennt man einen (Ring)-Isomorphismus oder Isomorphismus von Ringen. Wir sagen: (R, +, ·) ist isomorph (als Ring) zu(Z,+, ·) und schreiben (R, +, ·) ∼= (Z,+, ·).
Notation. Den Ring der ganzen Zahlen schreiben wir zumeist als Z an Stelle von (Z,+, ·), da dieAddition und die Multiplikation aus dem Kontext heraus klar sind.
4. Die rationalen Zahlen
Die rationalen Zahlen sind9
Q :={ zn
∣∣∣ z ∈ Z, n ∈ N>0
}.
Hierbei giltz
n=
y
m⇐⇒ zm = yn.
Die Addition und die Multiplikation setzen sich zu Abbildungen
+ : Q×Q −→ Q, (a, b) 7→ a+ b· : Q×Q −→ Q, (a, b) 7→ a · b
fort, und die Eigenschaften (Aa), (Ak), (An), (Ai), (Ma), (Mk), (Mn) und (AMd) gelten weiterhinfur (Q,+, ·). Außerdem gilt
(Mi) Multiplikation hat inverse Elemente.Zu jedem x ∈ Qr {0} gibt es ein y ∈ Q, so dass
x · y = y · x = 1.
Man nennt y das Inverse von x bezuglich der Multiplikation und schreibt normalerweisex−1 anstelle von y.
9.11.
Anschaulich: Q ist die kleinste Erweiterung von N, die diese Eigenschaften hat.Prazise Bedeutung:
(MEQ) Minimale Erweiterung.Ist T eine Teilmenge von Q mit N ⊂ T und gilt
∀x, y ∈ T : x− y ∈ T∀x ∈ T : ∀x ∈ T r {0} : x · y−1 ∈ T,
dann gilt bereits T = Q.
9An dieser Stelle musste eigentlich gesagt werden, wie zn
definiert ist. Dies wurde in der Linearen Algebra
diskutiert und wird deswegen hier nicht erklart.
50 2. ZAHLEN
Auch die Ordnung setzt sich fort. Die Ordnung auf Q ist total.
Mit Addition und Multiplikation versehene Mengen mit mindestens 2 Elementen nennt manKorper , falls die Eigenschaften (Aa), (Ak), (An), (Ai), (Ma), (Mk), (Mn), (Mi) und (AMd) erfulltsind.
Also ist (Q,+, ·) ein Korper. Wie bei den ganzen Zahlen schreiben wir oft Q fur (Q,+, ·). Je-der Korper, der die naturlichen Zahlen enthalt und (MEQ) erfullt, ist isomorph zum Korper derrationalen Zahlen.
In jedem Korper K gilt 0 6= 1. Denn angenommen, wir hatten 0 = 1, so folgt fur alle x ∈ K:x = 1 · x = 0 · x = 0. Also K = {0}. Dies widerspricht der Forderung, dass K mindestens zweiElemente hat.
UBUNG 4.1. Versehe F2 := {0, 1} mit der folgenden Addition und Multiplikation:
+ 0 1
0 0 11 1 0
· 0 1
0 0 01 0 1
Zeigen Sie, dass (F2,+, ·) ein Korper ist. Man nennt ihn den Korper mit 2 Elementen. Ist (K, +, ·)ein Korper, und hat K genau zwei Elemente, dann ist (K, +, ·) isomorph zu (F2,+, ·).
Die Ordnung auf Z setzt sich zu einer Ordnung auf Q wie folgt fort:
Wir definieren zunachst, wann eine Zahl großer oder gleich Null ist. Fur alle m ∈ Z und allen ∈ N>0 definiere
0 ≤ m
n:⇐⇒ 0 ≤ m · n
Dann definieren wir die Relation ≤ fur beliebige Zahlen a, b ∈ Q:
a ≤ b :⇐⇒ 0 ≤ b− a .
5. Geordnete Korper
Definition 5.1. Ein geordneter Korper ist ein Quadrupel (K,+, ·,≤), so dass die folgenden Ei-genschaften erfullt sind:
(a) (K,+, ·) ist ein Korper,(b) ≤ ist eine totale Ordnung auf K,(c) ∀x, y, z ∈ K : (x ≤ y → x+ z ≤ y + z),(d) ∀x, y, z ∈ K : ((x ≤ y ∧ 0 ≤ z)→ x · z ≤ y · z).
Beispiel 5.2. (Q,+, ·,≤) ist ein geordneter Korper.
5. GEORDNETE KORPER 51
Nicht-Beispiel: Sei (F2,+, ·) der Korper mit zwei Elementen aus Ubung 4.1. Dann gibt es keinetotale Ordnung ≤ auf F2, so dass (F2,+, ·,≤) ein geordneter Korper ist. Vergleiche Ubungsblatt4, Aufgabe 3.
Im Rest dieses Abschnitts sei (K,+, ·,≤) ein geordneter Korper.
Notation 5.3.
x < y :⇐⇒ x ≤ y ∧ x 6= y ⇐⇒ ¬(y ≤ x)
x ≥ y :⇐⇒ y ≤ xx > y :⇐⇒ y < x
x ist positiv :⇐⇒ x > 0
x ist negativ :⇐⇒ x < 0
K≤a := {x ∈ K | x ≤ a}K≥a, K<a, K>a analog.
UBUNG 5.4. Seien a, x, y, z ∈ K. Zeigen Sie, dass aus den Eigenschaften (a)–(d) der obigenDefinition folgt:
(a) a ist genau dann positiv, wenn −a negativ ist.(b) 1 > 0(c) Ist z > 0, dann auch z−1 > 0.(d) Ist z < 0, dann gilt auch z−1 < 0 und dann gilt fur alle x, y ∈ K:
x ≤ y ↔ x · z ≥ y · z.
Beweis: Teile (a) und (b) sind Teil von Ubungsblatt 4, Aufgabe 2. Teile (c) und (d) sind ahnlichzu zeigen.
Zu (c): Sei nun z > 0. Wir zeigen durch Widerspruch z−1 > 0. Wir nehmen hierzu an, dass z−1 ≤ 0.Dann folgt mit Lemma 5.1 (d)
1 = z−1z ≤ 0,
was offensichtlich 1 > 0 widerspricht.
Zu (d): z < 0 ⇐⇒ z−1 < 0 ist nun offensichtlich und man zeigt (d) durch Multiplikation mit −zbzw. −z−1 unter Verwendung von Lemma 5.1 (d).
Wir definieren rekursiv eine Abbildung iN : N −→ K, 0N 7→ 0K , iN(n+ 1) = iN(n) + 1.
LEMMA 5.5.
(a) iN erhalt Addition und Multiplikation, d.h. fur alle n,m ∈ N gilt:
iN(n+m) = iN(n) + iN(m) iN(n ·m) = iN(n) · iN(m)(5.6)
(b) ∀n ∈ N>0 : iN(n) > 0,(c) iN : N −→ K ist injektiv,
52 2. ZAHLEN
Beweis.
(a) durch Induktion uber m ∈ N.(b) und (c) sind Teil von Ubungsblatt 4, Aufgabe 2.
Sprechweise Wenn die Gleichungen (5.6) gelten, sagen wir: iN erhalt Addition und Multiplikation.
LEMMA 5.7. Sei (K,+, ·,≤) ein geordneter Korper. Dann gibt es eine injektive Abbildung iQ :Q −→ K, die iN fortsetzt (das heißt: iQ|N = iN) und so dass iQ Addition und Multiplikation erhalt.Außerdem erhalt iQ die Ordnung, das heißt es gilt fur a, b ∈ Q
a ≤ b⇐⇒ iQ(a) ≤ iQ(b).
Beweisskizze: Fur m ∈ N, n ∈ N>0 definieren wir
iQ
(mn
):=
iN(m)
iN(n)
iQ
(−mn
):= − iN(m)
iN(n)
iQ
(0
n
):= 0
Man muss nun zeigen, dass diese Definition Sinn ergibt. Wir durfen einer rationalen Zahl nichtzwei verschiedene Werte zuweisen. Zu uberprufen ist hierzu
m
n=p
q=⇒ iN(m)
iN(n)=iN(p)
iN(q)
fur alle m,n, p, q ∈ N>0. Die entsprechenden Aussagen sind fur m ≤ 0, p ≤ 0 zu uberprufen. Mansagt dann, die Abbildung iQ ist wohldefiniert . Danach kann man die anderen Eigenschaften leichtbeweisen.
Wir identifizieren nun Q mit B(iQ) vermoge iQ, das heißt wir machen keinen Unterschied mehrzwischen r ∈ Q und iQ(r) ∈ K.
Definition 5.8. Ein geordneter Korper (K,+, ·,≤) heißt archimedisch geordneter Korper , 10 falls
∀a ∈ K : ∃n ∈ N : a ≤ n.
Beispiele 5.9. (a) Q ist archimedisch: Man zeigt leicht fur m,n ∈ N>0: mn ≤ m und −mn ≤ m
und 0n ≤ 1.
(b) In Satz 6.6 werden wir zeigen, dass jeder geordnete Korper, der die Supremumseigenschafterfullt, archimedisch ist. Insbesondere: Sobald wir wissen,
”was R ist“, wissen wir auch, dass
R archimedisch geordnet ist.
10Man sagt manchmal auch: Der Korper erfullt das archimedische Axiom. Diese Sprechweise vermeiden wir
aber, da die archimedische Eigenschaft in dem von uns gewahlten Zugang kein Axiom ist.
5. GEORDNETE KORPER 53
(c) Sei dann K ein Korper mit Q ⊂ K ⊂ R mit der Addition, Multiplikation und Ordung von R.Dann ist auch K ein archimedisch geordneter Korper. Zum Beispiel fur q ∈ Q>0:
K := Q[√q] := {a+ b
√q | a, b ∈ Q} .
(d) Der Korper der rationalen Funktionen mit rationalen Koeffizienten 11
K :=
{x 7→ p(x)
q(x)
∣∣∣ p und q sind Polynome mit rationalen Koeffizienten, q 6= 0
}.
Wir definieren Addition und Multiplikation wie bei den rationalen Zahlen:
p(x)
q(x)+p(x)
q(x):=
p(x)q(x) + p(x)q(x)
q(x) · q(x)
p(x)
q(x)· p(x)
q(x):=
p(x) · p(x)
q(x) · q(x).
Dann ist (K,+, ·) ein Korper. Ein Polynom p wie oben schreiben wir im Fall p 6= 0 als p(x) =a0,p + a1,px+ a2,px
2 . . .+ ak,pxk, k ∈ N0, ak,p 6= 0. Dann heißt deg(p) := k ∈ N0 der Grad des
Polynoms. Wir definieren nun
P :=
{p(x)
q(x)∈ K
∣∣∣ adeg(p),p · adeg(q),q > 0
}Weiter definieren fur r, s ∈ K:
r < s :⇐⇒ s− r ∈ P.Zu zeigen, dass (K,+, ·,≤) ein geordneter Korper ist, ist einige Arbeit, aber nicht sehr schwie-rig.
Angenommen, der Korper ware archimedisch geordnet. Dann gibt es ein n ∈ N mit x ≤ n <n+1. Dann ware also x−(n+1) < 0. Dies ist aber ein Widerspruch zu x−(n+1) = x−(n+1)
1 ∈ P .Also ist dieser geordnete Korper nicht archimedisch.
Sei weiterhin (K,+, ·,≤) ein geordneter Korper.
Definition 5.10. Die Betragsfunktion | · | : K −→ K ist definiert durch
|a| := max{a,−a} =
a falls a > 0
−a falls a < 0
0 falls a = 0
Man nennt |a| auch den Absolutbetrag von a.
11Was wird hier eigentlich mit x 7→ p(x)q(x)
gemeint? Dies ist etwas subtil, es gibt verschiedene Moglichkeiten. 1.)
Man kann es als Abbildung von Qr q#({0}) nach Q auffassen, falls p und q keine gemeinsamen Nullstellen haben.Bei dieser Interpretation muss man den Definitionsbereich bei Addition und Multiplikation in naheliegnder Art und
Weise evtl. durch einzelne Punkte erganzen. 2.) Sobald wir die Korper R und C kennen, konnte man es in ahnlicher
Weise auch als Abbildung Rr q#({0}) −→ R oder als Abbildung Cr q#({0}) −→ C auffassen, auch Kombinationenwie Qr q#({0}) −→ R waren denkbar. 3.) Die mathematisch sinnvollste Interpretation des Ausdrucks ist aber eine
andere (die formale Interpretation), die ich leider derzeit noch nicht erklaren kann, und die Sie spater in der Linearen
Algebra kennen lernen werden. Da wir Koeffizienten in Q haben, ist es gar nicht so wichtig, wie wir den Ausdruckformal nun verstehen wollen. Wenn die Koeffizienten in Q durch Koeffizienten in einem endlichen Korper (wie zum
Beispiel F2) ersetzt werden, ist dieser Unterschied aber ganz erheblich.
54 2. ZAHLEN
LEMMA 5.11.
(a) |a| ≥ 0; |a| = 0⇐⇒ a = 0;(b) |−a| = |a|;(c) |a · b| = |a| · |b|;
∣∣ab
∣∣ = |a||b| falls b 6= 0;
(d) |a2| = |a|2 = a2 ≥ 0(e) |a+ b| ≤ |a|+ |b|;(f) |a1 + · · ·+ ak| ≤ |a1|+ · · ·+ |ak|;(g) |a− b| ≥
∣∣∣|a| − |b|∣∣∣Beweis. (a)-(d) folgen direkt aus den Definitionen 5.1 und 5.10.(e): ±a ≤ |a| und ±b ≤ |b| ergeben ±(a+ b) ≤ |a|+ |b|.(f): durch Induktion.(g): Wir setzen a := a− b. Dann gilt
| a+ b︸ ︷︷ ︸a
| ≤ |a|+ |b| = |a− b|+ |b|
Also
(5.12) |a− b| ≥ |a| − |b|
Durch Vertauschen von a und b erhalten wir
(5.13) |a− b| = |b− a| ≥ |b| − |a|.
Aus (5.12) und (5.13) erhalten wir das zu Beweisende.
SATZ 5.14. Seien n ∈ N>0; a1, . . . , an ∈ K≥0 gegeben. Dann gilt
a1 · a2 · . . . · an ≤(a1 + a2 + . . .+ an
n
)n.
Bemerkung 5.15. Wenn wir in K die n-te Wurzel ziehen konnen (in Q nicht erlaubt!), bedeutetdies
n√a1 · a2 . . . an︸ ︷︷ ︸
geometrisches Mittel
≤ a1 + a2 + . . .+ ann︸ ︷︷ ︸
arithmetisches Mittel
.
Beweis des Satzes. Wir beweisen den Satz durch Induktion nach n.
Induktionsanfang : n = 1 ist offensichtlich richtig.
Induktionsschritt von n− 1 nach n fur n ≥ 2:Seien a1, . . . , an ∈ K≥0 gegeben.O.B.d.A. a1 = min{a1, . . . , an}, a2 = max{a1, . . . , an}.
6. DIE REELLEN ZAHLEN 55
M := a1+...+ann . =⇒ a1 ≤M ≤ a2
Wir setzen d := a1 + a2 −M . Dann
Md− a1a2 = M ((a1 + a2)−M)− a1a2 = (a2 −M)(M − a1) ≥ 0
=⇒ a1 · a2 ≤Md(5.16)
Das arithmetische Mittel12 von d, a3, a4, . . . , an ist M , denn
d+ a3 + a4 + . . .+ an = a1 + a2 + . . .+ an −M = (n− 1)M.
Es folgt
a1a2 · · · an(5.16)
≤ M da3 · · · an︸ ︷︷ ︸≤Mn−1
nach Annahme
= Mn
6. Die reellen Zahlen
Da die reellen Zahlen R fur die Analysis eine zentrale Rolle spielen, wollen wir hier wieder formalvollstandiger vorgehen.
6.1. Unzulanglichkeit von Q. Wieso reichen uns die rationalen Zahlen nicht aus?
Problem 1 (Algebraisch):
Sei p eine Primzahl. Dann ist x2 = p in Q nicht losbar.
Angenommen es gabe eine Losung x = m/n, m ∈ Z, n ∈ N>0. O.B.d.A. m,n teilerfremd.
Wir erhalten m2
n2 = x2 = p, also m2 = pn2.
Es folgt p|m und daraus p2|m2 = pn2, was wiederum p|n impliziert. Also haben wir einen Wider-spruch zur Teilerfremdheit von m und n.
12Im Fall n = 2 bedeutet ist also das arithmetische Mittel von d, a3, . . . , an als das artithmetische Mittel von
d zu lesen, das heißt es ist d. Es git dann auch M = d.
56 2. ZAHLEN
Problem 2 (Geometrisch):
Bild von einem Kreis
π =Umfang
Durchmesser= 3, 14159265... 6∈ Q
Wichtige geometrische Funktionen konnen in Q nicht beschrieben werden, zum
Bild: Quadrat mit Diagonale runtergedreht
Problem 3 (Physikalisch):
Bild mit Pendel
Ein Pendel bewegt sich auf einem Kreis. Dazu muss es Punkte passieren, die keine rationalenKoordinaten haben, zum Beispiel den Punkt
(− cos(60◦)sin(60◦)
), sin(60◦) =
√3
26∈ Q .
14.11
6.2. Die Supremumseigenschaft. In diesem Abschnitt werden wir eine Eigenschaft ken-nenlernen, die im Korper der rationalen Zahlen Q nicht gilt, aber im Korper der reellen Zahlen R.Zunachst ein paar Vorbemerkungen.
Wiederholung: Sei ≤ eine partielle Ordnung auf einer Menge M . Sei x ∈ A ⊂M .
x = minA ⇐⇒ ∀y ∈ A : x ≤ y.
(Maximum analog mit ≥).
Gegeben sei eine totale Ordnung auf einer endlichen Menge A, dann besitzt A ein Maximum undein Minimum.
Definition 6.1. Sei ≤ eine (partielle) Ordnung auf einer Menge M . Eine Teilmenge A ⊂M heißtnach oben beschrankt in M (bzw. nach unten beschrankt in M), falls es ein r ∈ M gibt, so dassfur alle a ∈ A die Aussage a ≤ r (bzw. a ≥ r) gilt. Ein solches r heißt obere Schranke (bzw. untereSchranke) von A. Wir sagen A ist beschrankt in M , wenn A nach oben und unten beschrankt ist.
Besitzt die Menge
S(A,M) := {r ∈M | r ist obere Schranke von A}ein Minimum, so nennen wir minS(A,M) das Supremum von A in M .
Besitzt die Menge
S(A,M) := {r ∈M | r ist untere Schranke von A}ein Maximum, so nennen wir maxS(A,M) das Infimum von A in M .
Kurzschreibweise: supA und inf A
6. DIE REELLEN ZAHLEN 57
Beispiele 6.2. (a) M = Q, A = {2, 4, 8}. Dann ist r obere Schranke, gdw r ≥ 8. Und r ist untereSchranke, gdw r ≤ 2. Wir haben maxA = supA = 8 und minA = inf A = 2.
(b) Falls A ein Maximum besitzt, so ist dieses Maximum auch das Supremum. Denn sei a = maxA,dann folgt
S(A,M) = {r ∈M | r ≥ a} =: M≥a.
Also a = minS(A,M) = supA.(c) M = Q, A = {x ∈ Q | 0 < x < 1} besitzt kein Minimum. Denn fur alle x ∈ A gilt: x
2 ∈ A undx2 < x. Ahnlich zeigt man, dass A kein Maximum besitzt.
S(A,M) = Q≥1 S(A,M) = Q≤0
supA = 1 und inf A = 0.
Bemerkungen 6.3.
(1) A ⊂ S(S(A,M),M) und A ⊂ S(S(A,M),M)(2) Gilt x ∈ A ∩ S(A,M), dann gilt ∀a ∈ A : a ≤ x, somit x = maxA und wegen (1) auch
x = minS(A,M).(3) Hat A ein Maximum x, dann ist x ∈ S(A,M).(4) A hat ein Maximum ⇐⇒ A∩ S(A,M) 6= ∅ ⇐⇒ #(A∩ S(A,M)) = 1 ⇐⇒ supA existiert und
supA ∈ A.
Definition 6.4. Sei ≤ eine partielle Ordnung auf M . Wir sagen (M,≤) erfullt die Supremumsei-genschaft (S) falls gilt
(S) SupremumseigenschaftSei A ⊂ M nicht-leer und nach oben beschrankt in M . Dann besitzt A ein Supremumin M .
Beispiel 6.5. (Q,≤) erfullt die Supremumseigenschaft nicht: Die Menge
A := {x ∈ Q |x2 ≤ 2}ist nach oben beschrankt.
S(A,Q) := {x ∈ Q |x > 0 und x2 ≥ 2}.Da es keine rationale Zahl x mit x2 = 2 gibt, folgt
S(A,Q) := {x ∈ Q |x > 0 und x2 > 2}.
Zu gegebenem x ∈ S(A,Q) definieren wir nun
y := x− x2 − 2
2x,
und man zeigt leicht 0 < y < x. Weiter gilt
y2 = x2 − 2xx2 − 2
2x+
(x2 − 2
2x
)2
> x2 − (x2 − 2) = 2,
58 2. ZAHLEN
also auch y ∈ S(A,Q). Da es zu jedem Element in S(A,Q) ein kleineres in S(A,Q) gibt, kann esin S(A,Q) kein Minimum geben. Also besitzt A kein Supremum in Q. Wir werden spater sehen,dass es in R eine positive Losung von x2 = 2 gibt, aufgrund der Supremumseigenschaft.
SATZ 6.6. Ist (K,+, ·,≤) ein geordneter Korper, der die Supremumseigenschaft erfullt, dann ister archimedisch.
Die Umkehrung gilt nicht: Beispiel K = Q.
Beweis. Angenommen (K,+, ·,≤) sei nicht archimedisch. Dann gibt es ein a ∈ K mit
∀n ∈ N : a > n.
Das heißt, N ist in K nach oben beschrankt. Wenn die Supremumseigenschaft erfullt ist, gibt esalso ein Supremum s von N in K. Fur ein beliebiges n gilt also s ≥ n+ 1 also s− 1 ≥ n. Also istauch s− 1 ein obere Schranke von N. Dann ist aber s nicht das Minimum aller oberen Schranken,was ein Widerspruch zur Wahl von s ist. Da wir einen Widerspruch erhalten haben, muss die obigeAnnahme falsch gewesen sein. Wir haben dadurch gezeigt, dass (K,+, ·,≤) archimedisch ist.
6.3. Axiome der reellen Zahlen. Im nachsten Abschnitt werden wir zwei Satze zeigen:
SATZ 6.7 (”Existenz der reellen Zahlen“). Es gibt einen geordneten Korper, der die Supremums-
eigenschaft erfullt.
SATZ 6.8 (”Eindeutigkeit der reellen Zahlen“). Seien (K,+, ·,≤) und (K, +, ·, ≤) zwei geordnete
Korper, die die Supremumseigenschaft erfullen, dann gibt es eine eindeutige bijektive Abbildung
F : K −→ K, die Addition, Multiplikation und Ordnung erhalt.F erhalt die Addition: ∀x, y ∈ K : F (x+ y) = F (x)+F (y)F erhalt die Multiplikation: ∀x, y ∈ K : F (x · y) = F (x)·F (y)
F erhalt die Ordnung: ∀x, y ∈ K : x ≤ y =⇒ F (x)≤F (y)
Man sagt dann oft: (K,+, ·,≤) und (K, +, ·, ≤) sind kanonisch isomorph und F nennt man einenIsomorphismus (von geordneten Korpern). 13.
Die Eigenschaften”geordneter Korper“ und “Supremumseigenschaft“ sind Eigenschaften, die wir
von den reellen Zahlen erwarten. Da sie nun also die reellen Zahlen bis auf Isomorphie festlegenist es sinnvoll, diese beiden Eigenschaft als die
”Axiome der reellen Zahlen “ zu betrachten. Dies
verpflichtet uns dazu, alles was wir fur die reellen Zahlen zeigen wollen, aus diesen Axiomen heraus
13Isomorph hat hier eine andere Bedeutung als bei den naturlichen Zahlen.”Isomorph“ kommt aus dem Grie-
chischen und heißt”von gleicher Gestalt“. Es gibt in der Mathematik viele Strukturen und zu jeder eine eigene
Definition von”isomorph“. Bei der Abbildung F oben im Text handelt es sich um einen Isomorphismus von ge-
ordneten Korpern: dies ist eine bijektive Abbildung, die Addition, Multiplikation und die Ordnung erhalt. Sobald
es einen Isomorphismus von A nach B gibt, nennt man A und B isomorph. Das Wort kanonisch ist nicht ganz so
leicht zu erklaren. Es bedeutet hier, dass es einen Isomorphismus gibt, der sich aus der Struktur bereits ergibt undnicht von zusatzlichen Wahlen abhangt. In der obigen Proposition gilt F (0) = 0 und F (1) = 1 und hierdurch ist der
Isomorphismus F bereits festgelegt. Er ist also bereits durch die Struktur festgelegt und deswegen kanonisch.
6. DIE REELLEN ZAHLEN 59
zu begrunden. Der große Vorteil dieses axiomatischen Zugangs ist es, dass alle danach hergeleitetenAussagen davon unabhangig sind, wie wir ein Modell der reellen Zahlen im Beweis von Satz 6.7konstruieren.
AXIOME 6.9 (Axiome der reellen Zahlen). Die reellen Zahlen bilden einen geordneten Korper(R,+, ·,≤), der die Supremumseigenschaft erfullt.
Um beispielhaft zu zeigen, wie wir die Supremumseigenschaft nutzen konnen, betrachten wir dasfolgende Lemma.
LEMMA 6.10. Sei a ∈ R, a ≥ 0, n ∈ N>0, so gibt es genau ein r ∈ R mit rn = a und r ≥ 0.
Beweis. Die Aussage ist klar fur n = 1 und klar fur a = 0. Sei nun n ≥ 2 und a > 0.
Eindeutigkeit. Hierzu genugt es zu zeigen:
∀x, y ∈ R : 0 < x < y =⇒ xn < yn
Dies folgt aus der folgenden Umformung
yn − xn = (y − x)
n−1∑i=0
yixn−i−1 > 0,
da∑n−1i=0 y
ixn−i−1 als Summe positiver Zahlen positiv ist.
Existenz. Wir betrachten die Menge A := {x ∈ R | xn ≤ a}. Die Menge A ist nach obenbeschrankt: max{1, a} ist eine obere Schranke von A. Man zeigt leicht, dass
S(A,R) = {x ∈ R | 0 < x ∧ xn ≥ a}.
Da A nicht-leer ist, existiert s := supA = minS(A,R). Offensichtlich gilt s ≥ 0 und sn ≥ a.
Wir nehmen nun an sn > a.
Behauptung: Es gibt ein δ ∈ R, 0 < δ < 1 mit
sn(1− nδ) ≥ a.(6.11)
Mit der Behauptung argumentieren wir wie folgt:
Die Bernoulli-Ungleichung liefert (s(1− δ))n ≥ sn(1− nδ), siehe Ubungsblatt 4, Aufgabe 1 c) mitx := −δ
Es gilt also s > s(1− δ) ∈ S(A,R). Somit ist dann s kein Minimum von S(A,R). Wir haben danneinen Widerspruch zur Annahme sn > a gefunden, und haben deswegen sn = a, was die Existenzliefert.
Begrundung der Behauptung:
60 2. ZAHLEN
Man zeigt mit Standard-Umformungen, dass (6.11) aquivalent zu
δ ≤ 1
n
(1− a
sn
)ist. Die rechte Seite ist zwischen 0 und 1. Wenn wir als δ := 1
n
(1− a
sn
)wahlen, so gilt die
Behauptung.
Bemerkung. Fur b ∈ R, b > 0, dann konnen wir jetzt alle Potenzen der Form bt, mit t ∈ Qbilden. Wir schreiben hierzu t = p/q mit p ∈ Z, q ∈ N. Wenn wir das vorangehende Lemma fura := bp und n := q anwenden, dann besagt dieses Lemma, dass es genau eine Zahl r ∈ R>0 gibt,so dass rq = bp. Wir wurden nun gerne definieren at := r fur dieses r. Damit dies eine sinnvolleDefinition ist, muss man uberprufen, dass r unahangig davon ist, wie wir t als Bruch schreiben.Dazu muss man die folgende Aussage uberprufen:14 Es gelte t = p/q = p/q, p, p ∈ Z, q, q ∈ N. Wirwahlen r, r ∈ R>0 mit rq = bp und rq = bp. Dann gilt r = r.
Man beachte, dass wir den Ausdruck bt fur eine positive reelle Zahl b und eine reelle, nicht-rationaleZahl t noch nicht definieren konnen.
Man kann aus dem bisher Bekannten nun auch leicht zeigen, dass fur b, b ∈ R>0, t, t ∈ Q gilt:
(bb)t = btbt bt+t = btbt
Fr 16.11.
Zur Konstruktion eines Modells der reellen Zahlen, das heißt zum Beweis von Satz 6.7, gibt esverschiedene Methoden, zum Beispiel:
• Die Konstruktion als Dezimalzahlen. Hier muss man zum Beispiel darauf achten, dass1, 49 = 1, 5. Geht genauso im Binarsystem oder bezuglich anderer Basen.• Die Konstruktion durch Intervallschachtelungen. Recht beliebt in Schulen, da anschaulich
und unabhangig davon, ob man in der Basis 10 (=Dezimaldarstellung), in der Basis2 (=Binardarstellung) oder noch einer anderen Basis arbeitet. Siehe zum Beispiel [22,Abschnitt 2.3].• Cauchy-Folgen. Dies fuhrt unter anderem zum Begriff der Vollstandigkeit, der nicht nur in
diesem Kontext wichtig ist, sondern auch zum Beispiel bei Hilbert- und Banach-Raumen.Solche Raume sind z.B. wichtig, um partielle Differentialgleichungen zu losen und umQuantenmechanik zu beschrieben.• Dedekindsche Schnitte. Mathematisch elegant und intuitivere Definition als beim Zugang
uber Intervallschachtelung und Cauchy-Folgen. Wir werden diesem Zugang folgen.
6.4. Dedekindsche Schnitte. Ideen von Richard Dedekind, 1872, Link zur Orginalarbeit
Definition 6.12. Sei K ein archimedisch geordneter Korper. Ein Dedekindscher Schnitt in K isteine Teilmenge α ⊂ K mit den folgenden Eigenschaften
(1) α 6= ∅, α 6= K,
14Diese Uberprufung sollten Sie inzwischen selbst tun konnen.
6. DIE REELLEN ZAHLEN 61
(2) fur a ∈ α und x ∈ K<a gilt x ∈ α,(3) α besitzt kein Maximum.
Man nennt Dedekindsche Schnitte auch Unterklassen. Das Komplement von α schreiben wir alsα′ := K r α und wird die zugehorige Oberklasse genannt.
Wir definieren
K := {α ∈ P(K) | α ist ein Dedekindscher Schnitt}.
Beispiel 6.13. Sei q ∈ K. Dann ist K<q eine Unterklasse.
(1) q − 1 ∈ K<q, also K<q 6= ∅. Und q + 1 6∈ K<q, also K<q 6= K.(2) Sei a ∈ K<q und x ∈ K<a. Dann haben wir x < a und a < q, also auch x < q und somit
x ∈ K<q.(3) Zu jedem a ∈ K<q ist a′ := (a+ q)/2 ein Element a′ ∈ K<q mit a′ > a.
Die Abbildung iK : K −→ K, q 7→ K<q ist injektiv. Denn ist p < q so ist p ∈ K<q und p /∈ K<p.
Anschauliche Motivation fur diese Konstruktion. Wir nehmen mal an, dass wir bereitsQ ⊂ R mit den gewunschten Eigenschaften hatten, K = Q. Definiere Q wie oben. Zu r ∈ Rdefinieren wir die Unterklasse in Q
U(r) := {q ∈ Q | q < r}.
Bild mit einem Zahlenstrahl mit Ober- und Unterklasse
Wir erhalten eine Abbildung U : R −→ Q, r 7→ U(r). Man uberlegt sich leicht, dass sup |Q : Q −→R, α 7→ supα die Umkehrabbildung von U : R −→ Q ist. Somit ist U bijektiv. Wir definierennun Addition +, Multiplikation · und Ordnung ≤ auf Q so, dass U diese Strukturen erhalt; undzwar so, dass wir die Existenz von R gar nicht nutzen. Zu zeigen ist dann, dass (Q,+, ·,≤) eingeordneter Korper ist, der die Supremumseigenschaft erfullt. Wir identifizieren wiederum Q mitB(iQ) ⊂ Q vermoge iQ.
Es stellen sich dann unter anderem die Fragen:
• Was passiert, wenn man die Konstruktion wiederholt zu Q , also K := Q?• Was wissen wir uber K, fur andere archimedisch geordnete Korper K, zum BeispielK := Q[
√2]?
Es ist deswegen sinnvoll, im folgenden immer fur (K,+, ·,≤) einen beliebigen archimedisch geord-neten Korper zuzulassen, aber sich immer den Spezialfall K = Q vorzustellen.
Sei also von nun an (K,+, ·,≤) ein beliebiger archimedisch angeordneter Korper.
LEMMA 6.14. Fur jede Oberklasse α′ gilt:
(a) α′ = {x ∈ K | ∀a ∈ α : a < x}
62 2. ZAHLEN
(b) fur a′ ∈ α′ und x′ ∈ K>a′ gilt x′ ∈ α′.
Beweis. Zu (a): Sei x ∈ α′. Wenn fur (mindestens) ein a ∈ α die Ungleichung a < x nicht gilt,dann haben wir den Widerspruch x ∈ α. Somit α′ ⊂ {x ∈ K | ∀a ∈ α : a < x}.
Sei x ∈ K mit ∀a ∈ α : a < x. Da x < x falsch ist, gilt x 6∈ α. Also α′ ⊃ {x ∈ K | ∀a ∈ α : a < x}.
Zu (b): Dies folgt nun aus der Transitivitat von <.
LEMMA 6.15. Erfullt (K,+, ·,≤) die Supremumseigenschaft, dann ist iK : K −→ K, q 7→ K<q
bijektiv.
Beweis. Ist α eine Unterklasse, dann ist jedes a′ ∈ α′ eine obere Schranke von α. Ist b ∈ S(α,K),dann ist b nicht in α, denn sonst ware ja b ein Maximum von α, welches nicht existiert. Somitb ∈ α′. Deswegen haben wir
α′ = S(α,K).
Erfullt (K,+, ·,≤) die Supremumseigenschaft, dann hat also jede Oberklasse ein Minimum. Wennwir q := supα = minα′ setzen, so ist dann α = K<q.
Beispiel 6.16. In einem geordneten Korper K ist
α := K<0 ∪ {x ∈ K | x2 < 2}.eine Unterklasse. Wenn diese Menge ein Supremum s besitzt, so gilt s2 = 2.
Im Fall K = Q gibt es kein solches s, das heißt α hat kein Supremum. Dann ist iK : K → K nichtsurjektiv.
Im Fall K = R hat α ein Supremum in R, das wir√
2 nennen.
Definition 6.17 (Addition). Zu Dedekindschen Schnitten α und β definieren wir ihre Summe als
α+ β := {a+ b | a ∈ α, b ∈ β}.
Dies ist wiederum ein Dedekindscher Schnitt, denn:
(1) Sei a ∈ α und b ∈ β, dann gilt a+ b ∈ α+ β, also α+ β 6= ∅.Sei a′ ∈ α′ und b′ ∈ β′, dann gilt fur alle a ∈ α und b ∈ β zunachst a < a′ und b < b′ unddeswegen auch a+ b < a′ + b′. Somit a′ + b′ /∈ α+ β, und dies ergibt α+ β 6= K.
(2) Sei x < a+b, a ∈ α, b ∈ β. Setze a0 := x−b < a, somit a0 ∈ α. Deswegen gilt x = a0+b ∈ α+β.(3) Angenommen, es gabe ein Maximum in α + β, dann konnten wir es als a + b mit a ∈ α und
b ∈ β schreiben. Da a kein Maximum von α ist, gibt es ein a1 ∈ α mit a1 > a. Wir erhaltenden Widerspruch
a+ b < a1 + b ∈ α+ β.
Wir erhalten also eine Abbildung + : K ×K → K.
PROPOSITION 6.18. (K,+) ist eine kommutative Gruppe, das heißt es gelten (Aa), (Ak), (An),(Ai).
6. DIE REELLEN ZAHLEN 63
Beweis. Die Kommutativitat (Ak) ist offensichtlich.
Zu (Aa):
α+ (β + γ) = α+ {b+ c | b ∈ β, c ∈ γ} = {a+ b+ c | a ∈ α, b ∈ β, c ∈ γ}und man erhalt ahnlich denselben Ausdruck fur (α+ β) + γ.
Zu (An): Das neutrale Element ist K<0. Zu zeigen: α = α + K<0. Aus Definition 6.12 (2) folgtdirekt α + K<0 ⊂ α. Um α ⊂ α + K<0 zu zeigen, wahlen wir ein a ∈ α. Da a kein Maximumvon α ist, gibt es ein a1 ∈ α mit a1 > a. Dann ist b := a − a1 < 0 ein Element von K<0. Somita = a1 + b ∈ α+K<0.
Zu (Ai): Sei α ∈ K. Die zugehorige Oberklasse α′ kann ein Minimum besitzen oder nicht. Falls α′
ein Minimum besitzt, dann definiere
β := {−a′ | a′ ∈ α′ r {minα′}},falls α′ kein Minimum besitzt, so definiere
β := {−a′ | a′ ∈ α′}.Da wir in dieser Definition das Minimum von α′ weggenommen haben, falls es existiert, hat β keinMaximum, also (3). Aus Lemma 6.14 ergibt sich (2). Außerdem (1) β 6= ∅ und β 6= K. Wir habenalso β ∈ K.
Nun zeigen wir α+ β = K<0, das heißt β ist das additive Inverse zu α.
Sei a ∈ α und b ∈ β, dann folgt −b ∈ α′ und deswegen −b > a. Dies ergibt a + b < 0, in anderenWorten a+ b ∈ K<0. Also α+ β ⊂ K<0.
Sei nun x ∈ K<0. Wir suchen a ∈ α und b ∈ β mit x = a+ b.
Ansatz: Zu einem festen a0 ∈ α wahle
a := a0 + (n− 1)|x|︸ ︷︷ ︸∈α
und b := −(a0 + n|x|︸ ︷︷ ︸∈α′
kein Min
)
fur n ∈ N>0. Damit dieser Ansatz erfolgreich ist, muss n das Minimum der Menge
M := {m ∈ N>0 | a0 +m|x| ∈ α′}sein.
Durchfuhrung: Definiere also M wie oben. Als ersten Schritt zeigen wir M 6= ∅.
Wahle ein a′ ∈ α′.a0 +m|x| ≥ a′ ↔ m ≥ a′ − a0
|x|Da K archimedisch ist, gibt es ein m ∈ N>0, das die rechte Ungleichung und damit auch die linkeUngleichung erfullt. Es folgt m ∈ M , also M 6= ∅. Auf Grund der Wohlordnung der naturlichenZahlen (Satz 1.9) besitzt M ein Minimum. Sei n := minM . Definieren wir a und b wie oben, folgt
64 2. ZAHLEN
a ∈ α, −b ∈ α′, a + b = x. Wenn −b nicht ein/das Minimum von α′ ist, so gilt b ∈ β, und wirhaben das zu Zeigende gezeigt.
Wenn α′ ein Minimum besitzt und wenn −b = minα′, dann setze
a := a0 +(n− 1
2
)|x| = −b− 1
2|x| < −b = minα′ ,
und damit a ∈ α, und
b := −(a0 +
(n+
1
2
)|x|︸ ︷︷ ︸
∈α′kein Min
)= b− 1
2|x| ∈ β.
Dann gilt a+ b = −|x| = x.Mi 21.11.
Definition 6.19 (Ordnung). Wir definieren auf K eine Relation
α ≤ β :⇐⇒ α ⊂ β.
Da ⊂ eine Ordnungsrelation auf P(M) ist, ist die so definierte Relation ≤ eine Ordnungsrelationauf K.
LEMMA 6.20. Die Ordnung ≤ auf K ist total.
Beweis. Zu zeigen ist: fur alle α, β ∈ K gilt α ⊂ β oder β ⊂ α.
Wenn α keine Teilmenge von β ist, dann konnen wir ein a ∈ α r β wahlen. Fur jedes b ∈ β giltdann b < a, denn sonst ware a ∈ β. Somit ist b ∈ α. Es folgt β ⊂ α.
Schreibe nun 0K := 0K . Wir schreiben |α| = α fur α ≥ 0K und |α| = −α fur α < 0K .
Zeichnung und Beispiel zur Motivation der Multiplikation
Definition 6.21 (Multiplikation). Seien α, β ∈ K.
(a) Falls α ≥ 0K und β ≥ 0K so definieren wir das Produkt von α und β als
α · β := {c ∈ K | c < 0 ∨ ∃a ∈ α : ∃b ∈ β : (a ≥ 0 ∧ b ≥ 0 ∧ c = a · b)}= {a · b | a ∈ α≥0 ∧ b ∈ β≥0} ∪K<0 .
(b) In den anderen Fallen definieren wir
α · β := ±|α| · |β|,
wobei das Vorzeichnen genau dann + ist, wenn α < 0K und β < 0K .
LEMMA 6.22. α · β ∈ K.
Beweis. Die folgenden Argumente werden aus Zeitgrunden in der Vorlesung nicht ausgefuhrt.
6. DIE REELLEN ZAHLEN 65
(1) −1 ∈ α · β, also α · β 6= ∅.Wahle a′ ∈ α′ und b′ ∈ β′. Fur alle a ∈ α und b ∈ β gilt a < a′ und b < b′, somit ab < a′b′.Somit ist a′b′ /∈ α · β. Also α · β 6= K.
(2) Sei c = a · b mit a ∈ α und b ∈ β. Wir mussen zeigen, dass jedes d ∈ K<c in α · β liegt. dies istklar, falls d < 0. Im Fall 0 ≤ d < c gilt
d = a︸︷︷︸∈α
· d
a︸︷︷︸∈β
,
da da <
ca ∈ β. Somit d ∈ α · β.
(3) Sei a, b, c wie oben. Da α kein Maximum besitzt, gibt es ein a0 ∈ α, a0 > a. Dann ist c0 :=a0 · b ∈ α · β, c0 > c. Somit hat auch α · β kein Maximum.
PROPOSITION 6.23. (K,+, ·) ist ein Korper.
Beweisskizze. Leicht zu prufen sind (Ma), (Mk), (AMd) und die Tatsache, dass es mindestenszwei Elemente gibt (iQ : Q −→ K ist injektiv).
Zu (Mn): Es ist einfach zu zeigen, dass 1K := K<1 ein neutrales Element fur die Multiplikationist. (Beweis ahnlich wie fur das additive Inverse.)
Wir wollen zeigen, dass 1K := K<1 ein neutrales Element fur die Multiplikation ist, das heißt furalle Unterklassen α gilt α ·K<1 = α.
Fall 1: α > 0.
Es gilt dann:
α·K<1def={a·b | a ∈ α≥0∧b ∈ {x ∈ K | 0 ≤ x < 1}
}∪K<0 ⊂ {c ∈ K | ∃a ∈ α : 0 ≤ c < a}∪K<0 ⊂ α.
Um α ⊂ K<1 · α zu zeigen, nehmen wir ein a ∈ α≥0. Da a kein Maximum von α ist, gibt es eina1 ∈ α mit a1 > a. Setze b := a/a1, dann 0 ≤ b < 1. Somit gilt a = a1 · b ∈ α ·K<1. Hieraus folgtα ⊂ K<1 · α aus der Definition der Multiplikation.
Fall 2: α = 0K . Fur alle β ∈ K
0K · β = (0K − 0K) · β = 0K · β − 0K · β = 0K .
Dies gilt insbesondere fur β = 1K .
Fall 3: α < 0.
α ·K<1def= −|α| ·K<1
Fall 1= −|α| = α.
Zu (Mi): Sei α ∈ K, α 6= 0K .Fall 1: α > 0K .
66 2. ZAHLEN
Wenn minα′ nicht existiert, so definieren wir
β := K≤0 ∪ {b ∈ K>0 | b−1 ∈ α′} ,und wenn es existiert, dann
β := K≤0 ∪ {b ∈ K>0 | b−1 ∈ α′ ∧ b 6= minα′} .
Es ist nicht schwer zu zeigen, dass β ∈ K. Mit ahnlichen Argumenten wie im Beweis von (Ai) zeigtman α · β = 1K (etwas Arbeit!). Diese Argumente werden aus Zeitgrunden in der Vorlesung nichtausgefuhrt.
Zu β ∈ K:
(1) 0 ∈ β, also β 6= ∅.Wahle a ∈ α, a > 0. Dann gilt a−1 /∈ β, denn fur alle a′ ∈ α′ gilt (a′)−1 < a−1.
(2) Ist b ∈ β und c ∈ K<b. Im Fall c ≤ 0 gilt c ∈ β. Im Fall 0 < c < b gilt c−1 > b−1 ∈ α′, somitc ∈ β.
(3) Angenommen b ware ein Maximum von β. Im Fall b = 0 bekommt man leicht einen Wider-spruch, da β positive Elemente hat. Im Fall b > 0 ist dann b−1 ein Minumum von α′. dies istaber ausgeschlossen in der Definition von β.
Zu α · β = 1K :
Wir nehmen ein c ∈ α · β. O.B.d.A. c ≥ 0. Wir konnen also schreiben c = a · (a′)−1 mit a ∈ α,a′ ∈ α′, a ≥ 0. Aus a′ > a folgt c < 1. Somit α · β ≤ 1K .
Sei nun c ∈ 1K , also c < 1. Wir wollen c ∈ α · β zeigen. Dies ist trivial, falls c ≤ 0. Deswegen seinun c > 0. Wahle ein festes a0 ∈ α mit a0 > 0. Wir zeigen, die Menge
M := {m ∈ N | a0 · c−m ∈ α}ist endlich. Hierzu wahlen wir ein a′ ∈ α′ und rechnen mit der Bernoulli-Ungleichung
a0 · c−m = a0 ·(
1 +1− cc
)m≥ a0 ·
(1 +m · 1− c
c
)> a′
fur alle ausreichend großen m, da K archimedisch ist. Somit gibt es ein m0 ∈ N, so dass fur allem ≥ m0 gilt: a0 · c−m 6∈ α. Also hat M hochstens m0 Elemente und somit ein Maximum.
Sei nun n := maxM . Setze a := a0 · c−n ∈ α und a′ := a0 · c−n−1 ∈ α′. Den Spezialfall, dass(a′)−1 das Minimum von α′ ist, betrachten wir in einer Fussnote.15 Wir setzen b := (a′)−1 ∈ β,und erhalten c = a · b.
Fall 2: α < 0K
Bestimme ein β ∈ K mit |α| · β = 1. Ein multiplikatives Inverse von α ist dann −β.
15Man kann dann a0 ”etwas“ zu a1 vergroßern, so dass a := a1 · c−n ∈ α immer noch in α liegt, und dann ist
a′ := (a1 · c−n−1)−1 ist dann ein nicht-minimales Element von α′.
6. DIE REELLEN ZAHLEN 67
SATZ 6.24. (K,+, ·,≤) ist ein archimedischer geordneter Korper. Die Abbildung
iK : K → K
a 7→ K<a
ist eine injektive Abbildung, die Addition, Multiplikation und Ordnung erhalt.
Beweis.
1.) Um zu zeigen, dass (K,+, ·,≤) ein geordneter Korper ist, gehen wir (a)–(d) in der Definition 5.1von geordneten Korpern durch.
Zu (a): (K,+, ·) ist ein Korper (Proposition 6.23).Zu (b): ≤ ist totale Ordnung auf K (Lemma 6.20).Zu (c): Gilt α ⊂ β, dann haben wir
α+ γ = {a+ c | a ∈ α, c ∈ γ} ⊂ {b+ c | b ∈ β, c ∈ γ} = β + γ.
Zu (d): Wir wollen zeigen
(α ≤ β ∧ 0K ≤ γ)→ α · γ ≤ β · γ .
Fall 1: γ ≥ 0K und 0K ≤ α ≤ β
α · γ = {a · c | a ∈ α≥0 ∧ c ∈ γ≥0} ∪K<0
⊂ {b · c | b ∈ β≥0 ∧ c ∈ γ≥0} ∪K<0
= β · γ
Fall 2: γ ≥ 0K und α < 0K ≤ βDann ist α · γ ≤ 0K ≤ β · γ.Fall 3: γ ≥ 0K und α ≤ β < 0KDann gilt −β ≤ −α =⇒ −β · γ ≤ −α · γ =⇒ α · γ ≤ β · γ.
Somit ist (K,+, ·) ein geordneter Korper.2.) Wir wissen bereits, dass iK : K −→ K injektiv ist, und es ist leicht zu prufen, dass diese
Abbildung Addition, Multiplikation und Ordnung erhalt.3.) Nun zeigen wir, dass K archimedisch ist, das heißt: Fur jedes α ∈ K ist ein n · 1K ∈ N zu
finden mit α ≤ n.Wahle ein a′ ∈ α′. Da K archimedisch ist, gibt es ein m ∈ N mit m ≥ a′. Wahle nun
12 ∈ 1K . Dann gilt fur alle a ∈ α
2m · 1
2≥ a′ ≥ a.
Es folgt
2m · 1K ≥ α.
LEMMA 6.25. x ∈ α⇐⇒ iK(x) < α
68 2. ZAHLEN
Beweis.
iK(x) < α ⇐⇒ iK(x) ( α
⇐⇒ Es existiert ein y in αr iK(x)
⇐⇒ ∃y ∈ α : y ≥ x⇐⇒ x ∈ α .
In der letzten Aquivalenz ist”⇒“ eine Konsequenz von Definition 6.12 (2) und
”⇐“ ergibt sich
mit y := x.
PROPOSITION 6.26. Sei (K0,+, ·,≤) ein archimedisch angeordneter Korper. Wir identifizierenQ mit seinem Bild in K0 vermoge der in Lemma 5.7 definierten Abbildung iQ : Q −→ K0. Seiena, b ∈ K0, a < b. Dann gibt es ein q ∈ Q mit a < q < b.
Interpretation fur K0 := R: zwischen zwei verschiedenen reellen Zahlen liegt eine rationale Zahl.
Beweis. Da K0 archimedisch ist, existieren n,m ∈ N mit n > 1b−a und m > −b. Setze b :=
b+m+ 1 > 1 und a := a+m+ 1.
p := max {r ∈ N>0 | r < nb}︸ ︷︷ ︸endlich, 6=∅
.
Wegen b− a > 0 erhalten wir n(b− a) = n(b− a) > 1, also na < nb− 1. Also na < p < nb. Somit
a <p
n−m− 1︸ ︷︷ ︸∈Q
< b.
SATZ 6.27 (Satz von Dedekind). Sei K = A ∪A′, A 6= ∅, A′ 6= ∅. Es gelte
∀a ∈ A : ∀a′ ∈ A′ : a < a′.
Dann existiert ein eindeutiges β ∈ K mit
∀a ∈ A : ∀a′ ∈ A′ : a ≤ β ≤ a′ .
Man nennt β die Trennungszahl .16
Vorstellung: Im obigen Satz ist A so etwas ahnliches wie eine Unterklasse. Wenn man in Definiti-on 6.12 K durch K ersetzen wurde, dann waren (1) und (2) erfullt, aber es verbleibt unbestimmt,ob A ein Maximum hat. Man stellt sich somit am besten auch dies als die Aufteilung von K ineinem linken Teil A und einen rechten Teil A′ vor.
16Im Satz von Dedekind kann man sich nun uber die gewahlte Bezeichnung wundern: Wieso schreibe ich hier
a ∈ A? Denn dieses a ist ja ein Element von K und damit eine Unterklasse, die bisher typischerweise mit dem
Buchstaben α bezeichnet wurden. Wenn wir aber letzterer Bezeichnungslogik folgen, dann mussen wir die Elementevon A′ mit α′ bezeichnen. In der bisherigen Notation ist α′ immer die Oberklasse zur Unterklasse α definiert. Um
diese Verwechslungsgefahr zu vermeiden, schreibe ich a und a′ in der Aussage des Satzes.
6. DIE REELLEN ZAHLEN 69
Zahlenstrahl, der K symbolisiert. In der Mitte β, links davon A, rechts davon A′.
Beweis. Existenz:Fall 1: A besitzt ein Maximum.Dann ist maxA eine Trennungszahl.
Fall 2: A besitzt kein Maximum.Setze
β := {b ∈ K | iK(b) ∈ A} .
β ist Dedekindscher Schnitt in K.
Denn
(1) Wahle17 ein α ∈ A und dann ein b ∈ α. Mit Lemma 6.25 folgt iK(b) < α. =⇒ iK(b) ∈ A =⇒b ∈ β =⇒ β 6= ∅.Wahle ein α ∈ A′ und dann ein b′ /∈ α. Mit Lemma 6.25 folgt iK(b′) ≥ α. =⇒ iK(b′) ∈ A′ =⇒b′ /∈ β =⇒ β 6= K.
(2) Sei b ∈ β und x ∈ K<b =⇒ iK(x) = K<x < K<b = iK(b) ∈ A =⇒ iK(x) ∈ A =⇒ x ∈ β.(3) Sei b ∈ β. Somit iK(b) ∈ A. Da A kein Maximum hat, existiert ein α ∈ A mit iK(b) < α. Nach
Proposition 6.26 mit K0 := K gibt es ein a ∈ Q ⊂ K mit iK(b) < iK(a) < α und somit b < a.Aus iK(a) < α ∈ A folgt iK(a) ∈ A, also a ∈ β. Somit war das beliebig vorgegebene b ∈ β keinMaximum.
Somit β ∈ K. Zu zeigen bleibt, dass β eine Trennungszahl ist.
Zu jedem α ∈ A gibt es ein α1 ∈ A mit α < α1. Proposition 6.26 liefert ein b ∈ Q ⊂ K mitα < iK(b) < α1. =⇒ iK(b) ∈ A =⇒ b ∈ β. Mit Lemma 6.25 sehen wir iK(b) < β und somit α < β.
Angenommen es gabe ein α ∈ A′ mit α < β. Proposition 6.26 liefert ein p ∈ Q ⊂ K mit α <iK(p) < β. Wegen Lemma 6.25 haben wir p ∈ β, also iK(p) ∈ A. Gleichzeitig erhalten wir ausα < iK(p) auch iK(p) ∈ A′, also einen Widerspruch.
Eindeutigkeit:Angenommen es gabe zwei Trennungszahlen β1, β2 mit β1 < β2. Setze βm := (β1 + β2)/2 ∈ K.Wir haben β1 < βm und somit βm /∈ A. Wegen βm < β2 folgt βm /∈ A′. Dies widersprichtA ∪A′ = K. Fr 23.11.
SATZ 6.28. Ist K ein archimedisch geordneter Korper, dann ist K ein archimedisch geordneter
Korper, der die Supremumseigenschaft erfullt. Die Abbildung iK : K −→ K ist ein Isomorphismus.
Daraus folgt dann direkt Satz 6.7.
17Im Beweis benotige ich nun Elemente von Elementen von A, deswegen wechsle ich zur alten Notation a ∈α ∈ A. Wir schreiben α fur Elemente von A′, um Verwechslungen zur Oberklasse α′ von α zu vermeiden.
70 2. ZAHLEN
Beweis. Sei B eine nicht-leere nach oben beschrankte Teilmene von K. Wenn B ein Maximumbesitzt, so ist dieses auch das Supremum und wir sind fertig. Andernfalls definieren wir A′ :=S(B,K) und A := K r A′. Die Voraussetzungen in Satz 6.27 sind erfullt. Deswegen gibt es eineTrennungszahl β zur Zerlegung K = A ∪A′.
Dann haben wir β ∈ S(A,K) und damit18 auch β ∈ S(B,K) = A′. Wegen der Folgerung inSatz 6.27 ist dann β das Minimum von A′ = S(B,K) und damit das Supremum von B. Insbeson-dere: das Supremum existiert.
Also erfullt K die Supremumseigenschaft. Deswegen ist iK : K −→ K nach Lemma 6.15 einIsomorphismus.
Wir wenden uns nun dem Beweis von Satz 6.8 zu.
Sei (K,+, ·,≤) ein geordneter Korper, der die Supremumseigenschaft erfullt. Nach Lemma 5.7 gibtes eine injektive Abbildung iKQ : Q −→ K, die Addition, Multiplikation und Ordnung erhalt. Wir
identifizieren im folgenden Q mit dem Bild von iKQ vermoge iKQ . Also Q ⊂ K und Q ⊂ Q.
Sei α ∈ Q, also α sei eine Unterklasse in Q. Dann liefert jedes a′ ∈ α′ eine obere Schranke vonα in K. Somit ist α eine nicht-leere, nach oben beschrankte Teilmenge von K. Somit existiertsupK α ∈ K, wobei supK das Supremum in K bezeichnet. Wir definieren eine Abbildung
s : Q −→ K, α 7→ supK α .
LEMMA 6.29. Zu jedem x ∈ K ist U(x) := {a ∈ Q | a < x} eine Unterklasse in Q.
Beweis. Der geordnete Korper K ist insbesondere archimedisch (Satz 6.6).
K archimedischdef⇐⇒ ∀a ∈ K : ∃n ∈ N : a ≤ n⇐⇒ ∀a ∈ K : ∃n ∈ N : a < n
⇐⇒ ¬ (∃a ∈ K : ∀n ∈ N : n ≤ a)
⇐⇒ N unbeschrankt
Somit ist Z und damit auch Q nach oben und unten unbeschrankt.
Nun zeigen wir, dass U(x) eine Unterklasse in Q ist:
(1) Nutze die Unbeschranktheit von Q:U(x) 6= ∅, da Q nach unten unbeschrankt in K.U(x) 6= Q, da Q nach oben unbeschrankt in K.
(2) a ∈ U(x) und y < a dann haben wir y < a < x.(3) Angenommen a ware ein Maximum von U(x). Also a < x. Nach Proposition 6.26 mit K0 := K
existiert ein q ∈ Q mit a < q < x. Also q ∈ U(x). Widerspruch!
18Es gilt hier sogar S(A,K) = S(B,K): wir haben diese Tatsache aber weder gezeigt noch benutzt. Wir nutzen
hier lediglich C ⊂ D → S(D,K) ⊂ S(C,K).
7. DIE KOMPLEXEN ZAHLEN 71
LEMMA 6.30. Die Abbildung
U : K −→ Q, x 7→ U(x)
ist die Umkehrabbildung von s : Q −→ K.
Beweis. ∀a ∈ α : a < s(α) =⇒ α ⊂ U(s(α))∀a′ ∈ α′ : a′ ∈ S(α,Q) ⊂ S(α,Q) =⇒ a′ ≥ s(α) =⇒ a′ /∈ U(s(α)).Somit α = U(s(α)).
Sei x ∈ K, y := s(U(x)) = supK{q ∈ Q | q < x}. Es folgt y ≤ x. Angenommen y < x, dann existiertnach Proposition 6.26 mit K0 := K ein q ∈ Q mit y < q < x, also q ∈ U(x). Widerspruch!
Man kann zeigen, dass s Addition, Multiplikation und Ordnung bewahrt.19 Nach all diesen Vorar-beiten ist der Beweis von Satz 6.8 ganz kurz.
Beweis von Satz 6.8. Sei nun (K, +, ·, ≤) ein weiterer geordneter Korper ist, der die Supremums-
eigenschaft erfullt. Wir erhalten analog s : Q → K. Dann erfullt F := s ◦ s−1 : K −→ K die inSatz 6.8 geforderten Eigenschaften.
FOLGERUNG 6.31. Ist (K,+, ·,≤) ein archimedisch geordneter Korper, dann gibt es eine injek-tive Abbildung f : K −→ R, die Addition, Multiplikation und Ordnung erhalt.
Interpretation: Jeder archimedisch geordnete Korper ist im wesentlich gleich (mathematisch prazi-ser: als geordneter Korper isomorph) zu einem Unterkorper von R. Ein Unterkorper ist eine Teil-menge von R, die selber ein Korper ist; auf der Teilmenge sollen Addition, Multiplikation undOrdnung wie in R defniert sein.
Beweis. Schranke die bijektive Abbildung K −→ R auf K ein.
7. Die komplexen Zahlen
Motivation. x2 = −1 besitzt keine reelle Losung.
Idee: Erweitere die reelle Zahlengerade zu einer Ebene, der Gaußschen Zahlenebene. Die Elementedieser Ebene sind komplexe Zahlen.
Ein Modell fur die komplexen Zahlen.
19Der Beweis ist wiederum nicht schwer, aber besteht aus einigen Teilbehauptungen, die sich direkt aus der
Definition von +, · und ≤ ergeben.
72 2. ZAHLEN
Definition 7.1. Auf C := R2 definieren wir die folgenden Verknupfungen:
Addition: + : C× C −→ C((x1, y1), (x2, y2)) 7→ (x1, y1) + (x2, y2) := (x1 + x2, y1 + y2)
Multiplikation: · : C× C −→ C((x1, y1), (x2, y2)) 7→ (x1, y1) · (x2, y2) := (x1x2 − y1y2, x1y2 + x2y1)
Gaußsche Zahlenebene und Addition
Die Abbildung iR : R ↪→ C, a 7→ (a, 0) ist injektiv und erhalt Addition und Multiplikation. Wiridentifizieren a mit (a, 0). Wir schreiben i := (0, 1). Dann gilt fur x, y ∈ R:
x+ yi = (x, 0) + (y, 0) · (0, 1) = (x, 0) + (0, y) = (x, y).
Man nennt dann x den Realteil von z = x+ yi und y den Imaginarteil , geschrieben x = Re z undy = Im z.
C = {x+ yi | x, y ∈ R}.
Wir haben i2 = (0− 1) + (0 + 0)i = −1.
Komplexe Zahlen z = x+ yi, x, y ∈ R heißen
• imaginar , falls y = Im z 6= 0,• rein imaginar , falls x = Re z = 0 und y = Im z 6= 0.
LEMMA 7.2. (C,+, ·) ist ein Korper.
Beweis. Assoziativitat und Kommutativitat von Addition und Multiplikation ist einfach nachzu-rechnen: (Aa), (Ak), (Ma), (Mk). Ebenso das Distributivgesetz (AMd). Das neutrale Element derAddition (bzw. Multiplikation) ist 0 = 0 + 0i, (bzw. 1 = 1 + 0i), (An) bzw. (Mn). Das additiveInverse von x+ yi ist (−x) + (−y)i, (Ai).
(Mi): Gegeben sei z := x+ yi ∈ Cr {0}. Es folgt dann x 6= 0 ∨ y 6= 0 und somit x2 + y2 ∈ R>0.
Wir benotigen ein multiplikatives Inverses von z, also ein w ∈ C mit wz = 1. Wir zeigen: Es gibtgenau ein solches w ∈ C.20
Zur Eindeutigkeit:
Angenommen wz = 1 mit z = x+ yi und w = a+ bi. Multipliziere beide Seiten mit x− iy:
(x− yi) = (a+ bi)(x+ yi)(x− yi) = (a+ bi)(x2 + y2) = a(x2 + y2) + b(x2 + y2)i .
20man muss eigentlich hier gar nicht die Eindeutigkeit zeigen, die Existenz reicht aus. Wenn man sich aber die
Eindeutigkeit anschaut, bekommt man eine Idee, wie man die Existenz zeigen kann.
7. DIE KOMPLEXEN ZAHLEN 73
Hieraus folgt x = a(x2 + y2) und −y = b(x2 + y2), also
a =x
x2 + y2,(7.3)
b = − y
x2 + y2.(7.4)
Zur Existenz:
Wir definieren a und b wie in (7.3) und (7.4). Die Definition ergibt Sinn, da x2 + y2 > 0. Manrechnet nach
(x+ yi) · (a+ bi) = 1 .
Fur x, y ∈ R definieren wirx+ yi := x− yi.
Wir erhalten eine R-lineare bijektive Abbildung C −→ C, z 7→ z, die komplexe Konjugation genanntwird.
Die Abbildung
C −→ R, x+ yi 7→ |x+ yi| :=√x2 + y2 =
√(x+ yi)(x+ yi)
heißt die Betragsfunktion der komplexen Zahlen.
Eigenschaften: Seien z, z1, z2 ∈ C.z1 ± z2 = z1 ± z2
z1 · z2 = z1 · z2
z1/z2 = z1/z2
|z1 + z2| ≤ |z1|+ |z2||z1z2| = |z1| · |z2|
Es gelten auch die anderen in Lemma 5.11 aufgezahlten Eigenschaften mit Ausnahme von (d), denman wie folgt abandern muss
|a2| = |a|2 = aa ≥ 0.
Polarkoordinaten und Veranschaulichung der Multiplikation in C.21
21Ein Kommentar, um die logische Stellung dieser Veranschaulichung zu klaren: um eine geometrische Vorstel-lung zu entwickeln, wie man komplexe Zahlen multipliziert, wurde hier die Polar-Darstellung eingefuhrt, obwohl wireigentlich zum jetzigen Zeitpunkt noch gar nicht wissen, was sin und cos bedeuten. Die Ubungsaufgabe (Ubungsblatt
6 Aufgabe 4), die mit dieser Veranschaulichung verbunden ist, nutzt die Additionstheoreme fur Sinus und Cosinus,die wir ebenfalls noch nicht bewiesen haben, die aber wahrscheinlich jeder schon in der Schule gesehen hat. Fur
einen exakten und streng logischen Aufbau ware diese Veranschaulichung und die oben genannte Aufgabe besser
erst dann zu behandeln, wer wir all dies eingefuhrt haben. Da es aber mindestens genauso wichtig ist, dass Siemoglichst bald eine gute Vorstellung von den komplexen Zahlen entwickeln, ist es dennoch richtig hier und nichtspater diese Veranschaulichung zu behandeln.
74 2. ZAHLEN
Bilder zur Polar-Darstellung
Schreibe z1, z2, z3 in Polar-Darstellung
zn = rn(cosϕn + (sinϕn)i), rn ∈ R>0, ϕn ∈ R.rn := |zn|; ϕn = arg(zn), falls ϕn ∈ [0; 2π).
UBUNG 7.5 (Ubungsblatt 6 Aufgabe 4). z3 = z1 · z2 ist aquivalent zu
r3 = r1 · r2 undϕ3 − (ϕ2 + ϕ1)
2π∈ Z
Mi 28.11.
Definition 7.6. Sei d ∈ N und seien a0, a1, . . . , ad ∈ C. Eine Funktion der Form
C −→ C
z 7→ P (z) :=d∑k=0
akzk = a0 + a1z
1 + a2z2 + · · ·+ adz
d
nennt man eine polynomiale Funktion22 uber C. Die Zahlen a0, . . . , ad nennt man die Koeffizienten.Gilt ad 6= 0, so sagen wir P hat Grad d, deg(P ) = d. Die polynomiale Funtion mit C −→ C, z 7→ 0hat Grad −∞, deg(0) = −∞. Hierbei ist −∞ ein Symbol23 mit den Eigenschaften ∀n ∈ N : −∞ <n und ∀n ∈ N : −∞+ n := −∞. Gilt deg(P ) = d ∈ N, so nennt ad den Leitkoeffizient .
Jede polynomiale Funktion P hat einen Grad deg(P ) ∈ {−∞, 0, 1, . . .}.(P +Q)(z) := P (z) +Q(z), (P ·Q)(z) := P (z) ·Q(z), deg(P ·Q) = deg(P ) + deg(Q).
THEOREM 7.7 (Fundamentalsatz der Algebra). Sei P : C −→ C ein Polynom von Grad d ≥ 1.Dann gibt es ein z ∈ C mit P (z) = 0.
Ein solches z nennt man eine Nullstelle von P .
Mindestens einen Beweis dieses Theorems lernen wir in der Analyis III kennen.
KOROLLAR 7.8. Zu jeder polynomialen Funktion P uber C von Grad d ≥ 1 gibt es komplexeZahlen b1, . . . , bd mit
∀z ∈ C : P (z) = ad(z − b1)(z − b2) · · · (z − bd).Die Losungsmenge der komplexen Zahlen z, die P (z) = 0 erfullen, ist somit
{bj | j ∈ {1, . . . , d}}und hat deswegen hochstens d Elemente und mindestens 1 Element.
22Sie haben im Rahmen der Schulmathematik hierfur vielleicht das Wort”Polynom“ statt
”polynomialer Fun-
tion“ benutzt, dies ist nun aber nicht mehr erlaubt, denn das Wort”Polynom“ hat in der Mathematik eine etwas
andere Bedeutung, siehe Lineare Algebra.23Man sollte sich nicht fragen, was −∞ ist. Es ist nur ein Symbol, das N erweitert zu {−∞} ∪ N, und die
Definition der Ordnung ≤ und der Addition + erweitern sich wie in diesen Eigenschaften beschrieben.
7. DIE KOMPLEXEN ZAHLEN 75
Beweis. Man zeigt zuerst die Zerlegung P (z) = an(z − b1)(z − b2) · · · (z − bd) durch Induktionuber d.
Induktionsanfang.Ist P eine polynomiale Funktion von Grad 1, dann gilt P (z) = a1z+ a0 mit a1 6= 0. Daraus ergibtsich
P (z) = a1
(z +
a0
a1
),
also die Aussage mit b1 = −a0/a1.
Induktionsschritt.Sei d ≥ 2 gegeben, und eine polynomiale Funktion P von Grad d. Das Korollar gelte fur d − 1.Nach dem Fundamentalsatz der Algebra gibt es eine Nullstelle bd von P . Wir dividieren P (z) durch(z − bd):
P (z) = Q(z)(z − bd) +R(z),
wobei Q eine polynomiale Funktion von Grad d − 1 ist und R eine polynomiale Funktion ist, dieden Divisionsrest angibt. Nun gilt24 deg(R) < deg(z − bd) = 1, also deg(R) = 0 oder R = 0. Daoffensichtlich R(bd) = 0, folgt R = 0. Die polynomialen Funktionen Q und P haben denselbenLeitkoeffizient, den wir a nennen. Wir wenden nun die Induktionsvoraussetzung auf Q an undschreiben:
Q(z) = a(z − b1) · · · (z − bn−1),
woraus wir
P (z) = a(z − b1) · · · (z − bn)
erhalten.
Nun rechnet man leicht P (bj) fur alle j ∈ {1, . . . , n} nach. Umgekehrt, sieht man fur z 6∈ {bj | j ∈{1, . . . , n}} leicht, dass P (z) als Produkt von nicht-verschwindenden25 Faktoren ebenfalls nicht-verschwindet.
Ist w eine Nullstelle von P , dann nennt man
#{j ={
1, 2, . . . , d} | w = bj
}∈ N
die Multiplizitat der Nullstelle.
Bemerkung 7.9. Die Berechnung der Nullstellen ist im allgemeinen sehr schwierig. Fur polyno-miale Funktionen von Grad d ≤ 4 gibt es eine Losungsformel. In der Schule lernt man die furd = 2, die Formel fur d = 3 und d = 4 sind zunehmend komplizierter. Fur Grad d ≥ 5 gibt eskeine Losungsformel, genauer man kann aus den Koeffizienten ai, den Grundrechenarten +,+, ·, /und Wurzelziehen keinen Ausdruck herleiten, der die Nullstellen angibt. Und man kann zeigen,dass es solche einen Ausdruck gar nicht gibt. Diese Aussagen werden in der Vorlesung
”Algebra“
24Beweis: Lineare Algebra oder Mathematische-Methoden-Vorlesung25
”nicht-verschwindend“ ist eine noblere Form fur
”ungleich 0“
76 2. ZAHLEN
im Rahmen der Galois-Theorie behandelt. Die Galois-Theorie ist nach Evariste Galois benannt,dessen Leben und fruher Tod eine sehr erstaunlich ist, siehe Wikipedia.
KAPITEL 3
Folgen und Reihen
1. Folgen
1.1. Konvergenz von Folgen. Im folgenden sei K = Q, K = R oder K = C. 1 Es gibt danneine Betragsfunktion K → R, x 7→ |x|.
|x+ y| ≤ |x|+ |y|, |xy| ≤ |x| |y|Definition 1.1. Eine (K-wertige) Folge ist eine Abbildung von N nach K.
Oft bezeichnet man auch auf N>k definierte Abbildungen als Folgen, z.B. N>0 → K.
Definition 1.2. Eine K-wertige Folge (aj)j∈N heißt beschrankt , wenn es ein s ∈ R gibt, so dass
∀j ∈ N : |aj | ≤ s.Ist K ⊂ R, dann ist (aj)j∈N beschrankt genau dann, wenn die Menge {aj | j ∈ N} nach obenund unten beschrankt ist. Fur K ⊂ R nennen wir (aj)j∈N nach oben bzw.2 nach unten beschranktgenau dann, wenn {aj | j ∈ N} nach oben bzw. nach unten beschrankt ist. Die Begriffe obereSchranke, untere Schranke, Minimum, Maximum, Supremum, Infimum definiert man fur Folgenanalog, also z.B. a ∈ R ist obere Schranke von (aj)j∈N genau dann, wenn es obere Schranke von{aj | j ∈ N} ist.
Beispiele 1.3.
(a) (2j)j∈N ist nach unten, aber nicht nach oben beschrankt.(b) (3 + 4/j)j∈N>0
ist nach unten beschrankt durch 3 und nach oben beschrankt durch 7.
Definition 1.4 (Konvergenz von Folgen). Eine K-wertige Folge (aj)j∈N konvergiert gegen a ∈ K,falls gilt
∀ε ∈ R>0 : ∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤ ε).Man nennt a den Grenzwert oder Limes der Folge (aj)j∈N und schreibt a = limj→∞ aj oder aj → afur j → ∞. Wir sagen (aj)j∈N konvergiert (in K), falls es ein derartiges a ∈ K gibt. Folgen, die
1Alles, was wir im folgenden zeigen werden, gilt auch fur jeden archimedisch geordneten Korper. Da aber alle
diese Korper zu einem Unterkorper von R isomorph sind, ist dies keine wirkliche Verallgemeinerung.2Die Abkurzung
”bzw.“ steht fur
”beziehungsweise“ und dieses Wort besagt, dass diese Definition nun in zwei
Version gelesen werden kann. Zunachst mit den Worten”nach oben“ an beiden Stellen, aber auch mit den Worten
”nach unten“. Hierbei ist wichtig, dass im Haupt- und im Nebensatz denselben Begriff nutzt.
77
78 3. FOLGEN UND REIHEN
gegen 0 konvergieren, nennt man Nullfolgen. Falls eine Folge nicht konvergiert, so sagen wir dazusie divergiert.
!ACHTUNG!. Wenn wir a = limj→∞ aj schreiben, so bedeutet dies immer:
• der Grenzwert existiert, und• der Grenzert ist a.
Bemerkungen 1.5.
(a) Falls eine Folge einen Grenzwert besitzt, so ist dieser eindeutig bestimmt. Seien a und a′ zweiGrenzwerte von (aj)j∈N. Zu einem gegebenen ε ∈ R>0 gilt also:
∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤ ε).∃j′0 ∈ N : ∀j ∈ N : (j ≥ j′0 =⇒ |aj − a′| ≤ ε).
Wahle nun so ein j0 und j′0. Dann gilt fur alle j ≥ max{j0, j′0}:
|a− a′| ≤ |a− aj |+ |aj − a′| ≤ ε+ ε = 2ε.
Dies gilt fur alle ε ∈ R>0. Angenommen wir haben a 6= a′, so gilt dies insbesondere furε := |a − a′|/3 > 0. Also folgt 3ε ≤ 2ε und somit ergibt sich der Widerspruch ε ≤ 0. DieAnnahme a 6= a′ war also falsch, d.h. es gilt a = a′.
(b) Falls (aj)j∈N konvergiert, so ist (aj)j∈N beschrankt. Begrundung: sei a := limj→∞aj . Wirwahlen zu ε := 1 ein passendes j0. Es gilt somit fur alle j ∈ N mit j ≥ j0:
|aj | ≤ |aj − a|+ |a| ≤ |a|+ 1.
Nun setzen wir
r := max{|a0|, |a1|, . . . , |aj0−1|, |a|+ 1}.Dann gilt fur alle j ∈ N: |aj | ≤ r. Somit ist (aj)j∈N beschrankt.
(c) Zu jedem ε ∈ R>0 existiert ein n ∈ N>0 mit ε ≥ 1/n (siehe Ubungsblatt 5 Aufgabe 3).Deswegen gilt3
a = limj→∞
aj gdw ∀n ∈ N>0 : ∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤1
n).
Beispiele 1.6.
(a) Eine Folge (aj)j∈N heißt konstant, falls a0 = a1 = a2 = . . .. Konstante Folgen sind beschranktund konvergieren. a0 = limj→∞ ai.
(b) ( 1j )j∈N>0
ist eine Nullfolge. (Nutze z.B. Bem. 1.5 (c) und setze j0 := n).
(c) Die Folge((−1)j
)j∈N hat 1 als obere und −1 als untere Schranke und ist somit beschrankt.
Wir werden bald sehen, dass sie nicht konvergiert.
3Um die Gefahr von Verwechslungen zwischen dem Grenzwert-Pfeil (z.B. j → ∞) und dem Pfeil fur logischeImplikation (z.B. (a∧ b)→ (c∨ d) klein z halten, benutzen wir ab nun oft =⇒ an Stellen, wo wir bisher → benutzthatten, z.B. in der folgenden Formel
1. FOLGEN 79
(d) Gilt |q| < 1, dann ist (qj)j∈N eine Nullfolge. (Hierbei ist q0 := 1.)Um dies zu zeigen, bestimme mit dem folgenden Lemma zu gegebenem ε ∈ R>0 ein n ∈ N mit|q|n < ε. Dann gilt fur alle j ∈ N, j ≥ n:
|qj | = |q|j = |q|j−n︸ ︷︷ ︸≤1
|q|j ≤ ε.
Wir haben also gezeigt:
∀ε ∈ R>0 : ∃n ∈ N : ∀j ∈ N :(j ≥ n =⇒ |qj − 0| ≤ ε
).
LEMMA 1.7. Sei r ∈ R>0 mit r < 1 und ε ∈ R>0. Dann gibt es ein n ∈ N mit rn < ε.
Beweis. Offensichtlich gilt
rn < ε⇐⇒(1
r
)n>
1
ε(1.8)
Auf Ubungsblatt 4 Aufgabe 1 c) haben wir fur x ∈ R≥−1 die Bernoulli-Ungleichung gezeigt:
(1 + x)n ≥ 1 + nx .
Wende die Bernoulli fur x := (1/r)− 1 > 0 an und erhalte
(1.9)
(1
r
)n≥ 1 + nx .
Aufgrund der archimedischen Eigenschaft existiert ein n ∈ N mit
n >1
x
(1
ε− 1
).
und dies ist aquivalent zu
1 + nx >1
ε,
und mit (1.9) impliziert dies (1.8) und somit rn < ε. Fr 30.11.
PROPOSITION 1.10. Seien (aj)j∈N und (bj)j∈N konvergente Folgen. Dann gilt:
limj→∞
(aj + bj) = limj→∞
aj + limi→∞
bj(1)
limj→∞
(aj − bj) = limj→∞
aj − limi→∞
bj(2)
limj→∞
(aj · bj) = limj→∞
aj · limi→∞
bj(3)
Gilt zusatzlich: ∀i ∈ N : bj 6= 0, und ist (bj)i∈N keine Nullfolge, so gilt auch
(4) limj→∞
ajbj
=
limj→∞
aj
limi→∞
bj.
80 3. FOLGEN UND REIHEN
Beweis von Proposition 1.10 (1).
(1): Angenommen a = limj∈N aj und b = limj∈N bj . Dies bedeutet, dass wir fur jedes ε ∈ R>0 diefolgenden Aussagen haben:
∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤ ε)∃k0 ∈ N : ∀j ∈ N : (j ≥ k0 =⇒ |bj − b| ≤ ε)
Wir wahlen nun solch ein j0 und solch ein k0. Dann gilt fur `0 := max{j0, k0}.∀j ∈ N : (j ≥ `0 =⇒ |aj − a| ≤ ε ∧ |bj − b| ≤ ε).
Wir rechnen fur j ≥ `0:
|(aj + bj)− (a+ b)| = |(aj − a) + (bj − b)| ≤ |aj − a|+ |bj − b| ≤ ε+ ε = 2ε.
Also ergibt sich insgesamt
∀ε ∈ R>0 : ∃`0 ∈ N : ∀j ∈ N :(j ≥ `0 =⇒ |(aj + bj)− (a+ b)| ≤ 2ε.
)︸ ︷︷ ︸
A(2ε):=
Nach dem folgenden Lemma konnen wir in dieser Aussage 2ε durch ε zu ersetzen. Somit ist
a+ b = limj→∞
(aj + bj)
und damit auch (1) gezeigt.
LEMMA 1.11. Sei A( · ) eine auf R>0 definierte Aussageform, und q ∈ R>0. Dann gilt
∀ε ∈ R>0 : A(ε) ⇐⇒ ∀ε ∈ R>0 : A(qε)
Das Lemma gibt es vielen Variationen. Wichtiger als die Aussage des Lemmas ist es, zu verstehen,wie man das Lemma (oder eine Variation davon!) kurz beweist.
Beweis des Lemmas.
”=⇒“: Es gelte
(1.12) ∀ε ∈ R>0 : A(ε).
Fur ein gegebenes ε > 0 wollen wir nun A(qε) zeigen. Wir wenden (1.12) fur ε := qε an, und habendann das gewunschte.
”⇐=“: Analog mit ε := q−1ε
Beweis von Proposition 1.10 (Fortsetzung).(2): Der Beweis fur (aj − bj)j∈N ist vollig analog zur Summe.
(3): Sei wieder a := limj→∞ aj und b := limj→∞ bj . Fur das Produkt (aj · bj)j∈N muss man etwasanders vorgehen. Zunachst nutzen wir die Tatsache, dass (aj)j∈N beschrankt ist. Also gibt es einr ∈ R mit
∀j ∈ N : |aj | ≤ r
1. FOLGEN 81
Dann argumentieren wir wie bei der Summe, rechnen aber wie folgt:
|ajbj − ab| = |aj(bj − b) + (aj − a)b| ≤ |aj ||bj − b|+ |aj − a||b| ≤ rε+ ε|b| = (r + |b|)ε.
Nun argumentiert man wie bei der Summe, wobei man das Lemma mit q := r + |b| nutzt.
(4): Sei b := limj→∞ bj 6= 0. Wir zeigen, dass 1/bj gegen 1/b konvergiert. Die Aussage (4) folgtdann mit (3).
Fur ε1 := |b|/2 gibt es ein j0 ∈ N, so dass fur alle j ∈ N≥j0 gilt |bj − b| ≤ ε1 = |b|/2. NachLemma 5.11 (g) haben wir dann
|bj | ≥ |b| − |b− bj | ≥ |b| −|b|2
=|b|2.
Wir nutzen nun wieder die Definition des Grenzwerts: fur jedes ε ∈ R>0 haben wir
∃k0 ∈ N : ∀j ∈ N : (j ≥ k0 =⇒ |bj − b| ≤ ε)
Fur j ≥ `0 := max{j0, k0} rechnen wir
∣∣∣∣ 1
bj− 1
b
∣∣∣∣ =
∣∣∣∣b− bjbbj
∣∣∣∣ =|b− bj ||b| |bj |
≤ ε
(|b|/2) |b|=
2
|b|2ε .
Wir haben also gezeigt
∀ε > 0 : ∃`0 ∈ N : ∀j ∈ N :(j ≥ `0 =⇒
∣∣∣∣ 1
bj− 1
b
∣∣∣∣ ≤ 2
|b|2ε).
Aus dem Lemma mit q := 2|b|2 folgt dann
1
b= limj→∞
1
bj.
82 3. FOLGEN UND REIHEN
1.2. Monotone Folgen.
Definition 1.13. Seien (M,≤) und (N,≤) geordnete Mengen, f : M → N . Wir sagen f ist
monoton wachsend :⇐⇒ ∀i, j ∈M :(i ≤ j =⇒ f(i) ≤f (j))
)⇐⇒ f erhalt die Ordnung
monoton fallend :⇐⇒ ∀i, j ∈M :(i ≤ j =⇒ f(i) ≥ f(j)
)⇐⇒ f ist ordnungsumkehrend
streng monoton wachsend :⇐⇒ ∀i, j ∈M :(i < j =⇒ f(i) < f(j)
)streng monoton fallend :⇐⇒ ∀i, j ∈M :
(i < j =⇒ f(i) > f(j)
)monoton:⇐⇒ f ist monoton wachsend oder monoton fallend
streng monoton:⇐⇒ f ist streng monoton wachsend oder streng monoton fallend
⇐⇒ f ist monoton und injektiv
Beispiele 1.14.
(1) R −→ R, x 7→ x3 ist streng monoton wachsend,(2) (n)n∈N und (1− 1
n )n∈N>0 sind streng monoton wachsende Folgen.(3) Fur r ∈ R ist
brc := max(S({r},R) ∩ Z
),
also die großte ganze Zahl ≤ r. Analog ist dre als die kleinste ganze Zahl ≥ r definiert.Dann ist (bn2 c)n∈N = (0, 0, 1, 1, 2, 2, 3, 3, . . .) monoton wachsend, aber nicht streng monoton.Gleiches gilt fur (dn2 e)n∈N = (0, 1, 1, 2, 2, 3, 3, . . .).
(4) Injektive monotone Funktionen sind streng monoton.(5) Ist (M,≤) total geordnet, (N,≤) partiell geordnet und ist f : M −→ N streng monoton, dann
ist f : M −→ N injektiv. Denn seien x, y ∈M . Es gilt x < y, x = y oder x > y. Falls f strengmonoton wachsend ist und falls x < y, dann folgt f(x) < f(y), also f(x) 6= f(y). Die anderenFalle sind analog.
Nun betrachten wir reell-wertige Folgen, also M = N, N = R.
Monoton wachsende (bzw. fallende) Folgen (ai)i∈N haben a0 als Minimum (bzw. Maximum), sindalso immer nach unten (bzw. oben) beschrankt.
PROPOSITION 1.15. Alle beschrankten monotonen R-wertige Folgen konvergieren (in R).
Beweis. Sei (aj)j∈N eine beschrankte monotone Folge, o.B.d.A. monoton wachsend, aj ∈ R. Defi-nieren A := {aj | j ∈ N}, a := supA. Zu jedem ε ∈ R>0 gibt es ein j0 ∈ N mit aj0 > a − ε, dennsonst ware a− ε eine obere Schranke von A.
1. FOLGEN 83
Also gilt fur alle j ∈ {j0, j0 + 1, . . .}: a − ε < aj0 ≤ aj ≤ a. Daraus ergibt sich |a − aj | ≤ ε. Wirerhalten a = limj→∞ aj .
Beispiel 1.16. Sei
aj :=
j∑k=1
1
k2 + k5.
Die Folge (aj)j∈N ist streng monoton. Spater werden wir sehen: (aj)j∈N ist beschrankt. Somitkonvergiert (aj)j∈N.
In Abschnitt 2 uber Reihen im aktuellen Kapitel werden wir viele ahnliche Beispiele sehen.
Beispiel 1.17. Wallissches Produkt und ein Algorithmus zur Wurzelberechnung, siehe Zentralubungoder [22, Abschnitt 5.3 und 5.4].
1.3. Teilfolgen. Von nun an wieder K = Q, R oder C.
Definition 1.18. Ist f : N −→ N eine streng monotone wachsende Abbildung, dann nennt man(af(k))k∈N eine Teilfolge von (aj)i∈N.
Beispiel 1.19. Die Folge (j)j∈N = (0, 1, 2, 3, . . .) hat unter anderem folgende Teilfolgen: 4
• sich selbst, das heißt (j)j∈N = (k)k∈N, also f(k) = k• die Folge der ungeraden Zahlen (1, 3, 5, 7, . . .), also f(k) = 2k + 1• die Folge der Primzahlen (2, 3, 5, 7, . . .).
LEMMA 1.20. Konvergiert (aj)j∈N gegen a, so konvergiert jede Teilfolge ebenfalls gegen a.
Beweis. Sei (af(k))k∈N eine Teilfolge von (aj)j∈N, also f : N −→ N streng monoton.
Sei ε ∈ R>0 gegeben. Wir haben
∃j0 ∈ N : ∀j ∈ N≥j0 : |aj − a| ≤ ε.Wahle zu solch einem j0 ein k0 ∈ N mit f(k0) ≥ j0, zum Beispiel k0 := j0. Dann gilt fur dieses k0
∀k ∈ N≥k0 : |af(k) − a| ≤ ε.Insgesamt also
∀ε ∈ R>0 : ∃k0 ∈ N : ∀k ∈ N : (k ≥ k0 =⇒ |ak − a| ≤ ε).Ingesamt also a = limk→∞ af(k).
Anwendung 1.21. Die Folge((−1)j
)j∈N aus Beispiele 1.6 (c) divergiert.
Beweis. Angenommen, die Folge((−1)j
)j∈N konvergiert gegen ein a ∈ K. Dann konvergieren auch
die Teilfolgen((−1)2k
)k∈N = (1)k∈N und
((−1)2k+1
)k∈N = (−1)k∈N gegen a. Da diese Teilfolgen
konstant sind, erhalten wir den Widerspruch a = 1 und a = −1. Mi 5.12.
4Diese Folge hat naturlich noch viel mehr Teilfolgen!
84 3. FOLGEN UND REIHEN
Sei K = Q, R oder C.
Definition 1.22. Sei (ai)i∈N eine K-wertige Folge, a ∈ K. Wir sagen a ist ein Haufungspunkt derFolge (ai)i∈N, falls eine Teilfolge existiert, die gegen a konvergiert.
Beispiele 1.23. Die Haufungspunkte der Folge((−1)n
)n∈N sind −1 und +1.
K = C. Die Haufungspunkte der Folge(in)n∈N = (1, i,−1,−i, . . .) sind −1, +1, −i und +i.
1.4. Erweiterte reelle Zahlen und uneigentliche Konvergenz. In diesem Unterab-schnitt ist immer K = R.
Nach unseren bisherigen Definition besitzen zum Beispiel die folgenden Teilmenge von R wederSupremum noch Infimum: ∅, Z, Q, R, . . ..
Notation 1.24. Wir definieren sup ∅ := −∞, inf ∅ := ∞. Und supM := ∞, falls M nicht nachoben beschrankt. Und inf M := −∞, falls M nicht nach unten beschrankt.
Fortsetzung der Ordnung auf R := R ∪ {−∞,+∞}. ∞ = +∞.
∀x ∈ R : −∞ ≤ x ≤ ∞.Man nennt R die erweiterten reellen Zahlen. Addition und Multiplikation sind hierauf nicht defi-niert.
Intervalle5: Seien a, b ∈ R, a ≤ b(a, b) := {x ∈ R | a < x < b} offenes Intervall[a, b) := {x ∈ R | a ≤ x < b} halboffenes Intervall(a, b] := {x ∈ R | a < x ≤ b} halboffenes Intervall[a, b] := {x ∈ R | a ≤ x ≤ b} abgeschlossenes Intervall
Definition 1.25. Sei (an)n∈N eine reell-wertige Folge. Wir sagen
(an)n∈N konvergiert gegen unendlich
⇐⇒ ∀x ∈ R : ∃n0 ∈ N : ∀n ∈ N≥n0: an ≥ x
Alternative Ausdrucksweisen:an →∞ fur n→∞(an)n∈N konvergiert gegen ±∞.limj→∞ aj =∞
Wir sagen (an)n∈N konvergiert gegen −∞, wenn (−an)n∈N gegen +∞ konvergiert. Konvergenzgegen ∞ oder −∞ nennt man uneigentliche Konvergenz .6 Wir sagen, dass ∞ (bzw. −∞) einHaufungspunkt von (an)n∈N ist, falls eine Teilfolge gegen ∞ (bzw. −∞) konvergiert.
5An Stelle von (0, 1] schreibt man in Schulen oft ]0, 1]. Dies ist in der Mathematik in den Universitaten weniger
ublich, da eine Klammer ] am Ende eines einzuklammernden Ausdrucks stehen sollte. In den meisten Buchern
schreibt man deswegen (0, 1].6In manchen Buchern, z.B. [14] wird der Begriff
”uneigentliche Konvergenz“ durch
”bestimmte Divergenz“
ersetzt.
1. FOLGEN 85
Wir nutzen den Begriff”eigentlich konvergent“ inhaltlich aquivalent zu
”konvergiert“, das Wort
”eigentlich“ wird benutzt, wenn man nochmals unterstreichen will, dass es sich nicht um
”unei-
gentliche Konvergenz“ handelt.
Wir sagen eine Folge konvergiert in R, falls sie eigentlich oder uneigentlich konvergiert.
Beispiel 1.26. Sei k ∈ N>0. Dann gilt:
limn→N
nk =∞.
Wenn wir a = limn→∞ an schreiben, so bedeutet dies ab jetzt (fur K = R):
• der Grenzwert existiert im eigentlichen oder uneigentlichen Sinn,• der Grenzwert ist a ∈ R.
!ACHTUNG!. Wenn wir ohne weitere Zusatze sagen:”die reell-wertige Folge konvergiert“, dann
ist hier immer die Konvergenz im eigentlichen Sinne gemeint, d.h. gegen eine reelle Zahl. Uneigent-lich konvergente Folgen sind somit immer divergent. 7
!ACHTUNG!. In der gesamten Analysis I und II gilt: Im Fall K = C gibt es keine uneigentlicheKonvergenz von Folgen. Wer diesen Begriff in der Klausur oder auf dem Ubungsblatt fur K = Cnutzt, macht einen Fehler.
LEMMA 1.27. Eine Folge ist genau dann nach oben (bzw. nach unten) beschrankt, wenn ∞ (bzw.−∞) kein Haufungspunkt ist.
Beweis. Sei (aj)j∈N eine Folge.
Angenommen ∞ ist ein Haufungspunkt. Sei f : N → N ist streng monoton wachsend undlimn→∞ af(n) =∞. Fur x ∈ R gilt dann
∃n0 ∈ N : ∀n ∈ N≥n0: af(n) ≥ x.
Also ist x− 1 keine obere Schranke. Also (aj)j∈N unbeschrankt.
Sei (aj)j∈N nach oben unbeschrankt.
(1.28) ∀x ∈ R : ∃k ∈ N : ak > x
Definiere induktiv f : N→ N. Wahle f(0) := 0. Seien nun f(0), f(1), . . . , f(n) fur n ∈ N definiert.Wende (1.28) fur x := max{af(0), af(1) . . . , af(n), n} an und erhalte ein k. Setze f(n + 1) := k.Dann konvergiert die Teilfolge (af(n))n∈∞ gegen ∞.
Also ist die Folge nach oben unbeschrankt genau dann, wenn ∞ Haufungspunkt ist.
7Aber wir haben schon gesehen, dass es divergente Folgen gibt, die nicht uneigentlich konvergieren, z.B.
((−1)n)n∈N.
86 3. FOLGEN UND REIHEN
(aj)j∈N nach unten beschrankt
⇐⇒(−aj)j∈N nach oben beschrankt
⇐⇒∞ kein Haufungspunkt von (−aj)j∈N⇐⇒−∞ kein Haufungspunkt von (aj)j∈N
PROPOSITION 1.29. Jede monotone R-wertige Folge konvergiert eigentlich oder uneigentlich (inR).
Beweis. Ist die Folge beschrankt, so wissen wir bereits, dass sie eigentlich konvergiert.
Sei (aj)j∈N unbeschrankt und o.B.d.A. monoton wachsend. Dann ist die Folge also nach obenunbeschrankt. Dies impliziert insbesondere
∀x ∈ R : ∃j0 ∈ N : aj0 > x.
Wegen der Monotonie gilt dann auch aj > x fur alle j ≥ j0. Wir erhalten also limj→∞ aj =∞.
Wir definieren nun die Abbildung ϕ : [−1, 1] −→ R,
ϕ(x) =
1
1−x −1
1+x fur x ∈ (−1, 1)
∞ fur x = 1
−∞ fur x = −1
Diese Abbildung ist streng monoton und bijektiv. Sei ψ := ϕ−1 : R −→ [−1, 1].
PROPOSITION 1.30. Sei (an)n∈N eine R-wertige Folge. Es gilt fur alle a ∈ R:
a = limn→∞
an ⇐⇒ ψ(a) = limn→∞
ψ(an)
a Haufungspunkt von (an)n∈N ⇐⇒ ψ(a) Haufungspunkt von (ψ(an))n∈N
Graphen der Funktion x 7→ ϕ(x) und ihrer Umkehrfunktion
In wenigen Wochen (Bemerkung 5.14 in Kapitel 4) werden wir starke Hilfsmittel haben, um dieseProposition ganz einfach zu zeigen. Der Beweis wird deswegen hier ausgelassen.
1.5. Limes inferior und superior. In diesem Unterabschnitt ist wiederum immer K = R.
Sei (aj)j∈N eine R-wertige Folge. Definiere fur k ∈ N
bk := inf{aj | j ∈ N≥k} ∈ [−∞,∞).
Es gilt bk ≤ bk+1, denn fur A ⊂ B ⊂ R gilt inf B ≤ inf A.
1. FOLGEN 87
Somit ist (bk)k∈N eine monoton wachsende R-wertige Folge und limk→∞ bk existiert in R. Im Fall∀k ∈ N : bk = −∞ definiert man hierfur limk→∞ bk = −∞.
Definition 1.31. Sei (ai)i∈N eine R-wertige Folge.
(1) Wir definieren den Limes inferior als
lim infj→∞
aj := limk→∞
inf{aj | j ∈ N≥k} ∈ R.
(2) Der Limes superior ist
lim supj→∞
aj := − lim infj→∞
(−aj) = limk→∞
sup{aj | j ∈ N≥k} ∈ R.
Beispiel 1.32. lim infj→∞(−1)j = −1, lim supj→∞(−1)j = 1
lim infj→∞
aj ≤ lim supj→∞
aj
SATZ 1.33. Sei (ai)i∈N eine R-wertige Folge.
(1) lim infj→∞
aj ∈ R ist ein Haufungspunkt von (aj)j∈N.
(2) lim supj→∞
aj ∈ R ist ein Haufungspunkt von (aj)j∈N.
(3) Konvergiert (aj)j∈N in R, dann haben wir
lim infj→∞
aj = limj→∞
aj = lim supj→∞
aj
(4) Gilt b := lim infj→∞
aj = lim supj→∞
aj ∈ R, dann konvergiert (aj)j∈N gegen b.
(5) Ist (af(`))`∈N eine Teilfolge von (aj)j∈N, dann gilt
lim infj→∞
aj ≤ lim inf`→∞
af(`)
lim sup`→∞
af(`) ≤ lim supj→∞
aj
(6) Ist b ein Haufungspunkt der Folge (aj)i∈N gilt
lim infj→∞
aj ≤ b ≤ lim supj→∞
aj .
Beweis.Zu (1): Wir definieren wieder bk := inf{aj | j ∈ N≥k}. Sei b := lim infj→∞ aj = limk→∞ bk. Wirhaben dann bk ≤ b.
Wir betrachten zunachst den Fall b ∈ R. Wir geben eine rekursive Definition von f : N → N an.Wir wahlen f(0) := 0. Zu gegebenem n ∈ N>0 nehmen wir nun an, dass f(n− 1) definiert ist undwir wollen nun f(n) definieren. Wegen b = limk→∞ bk und bk ≤ b gibt es ein k0 ∈ N, so dass furalle k ∈ N≥k0 die Ungleichung b− 1
n ≤ bk ≤ b gilt. Wahle k := max{k0, f(n− 1) + 1} nun fest.
88 3. FOLGEN UND REIHEN
Auf Grund der Definition von bk0 als Infimum gibt es ein ` ∈ N≥k mit bk ≤ a` ≤ bk + 1n . Wir
setzen f(n) := ` und erhalten somit
b− 1
n≤ bk ≤ af(n) ≤ bk +
1
n≤ b+
1
n.
Das heißt, das Kriterium in Bemerkung 1.5 (c) fur die Konvergenz b = limn→∞ af(n) ist erfullt.
Die Falle lim infj→∞
aj = ∞ und/oder lim infj→∞
aj = −∞ gehen ahnlich und werden auf dem Ubungs-
blatt 8 behandelt.
Zu (2): Wende (1) auf die Folge (−aj)j∈N an. Wir erhalten eine Teilfolge (−af(n))n∈N mit
limn→∞
(−af(n)) = lim infj→∞
(−aj) ∈ R.
Somitlimn→∞
af(n) = − lim infj→∞
(−aj) = lim supj→∞
aj ∈ R.
Zu (3): Wahle eine Teilfolge gemaß (1) die gegen lim infj→∞
aj konvergiert. Wegen Lemma 1.20 konver-
giert sie auch gegen limj→∞
aj . Also lim infj→∞
aj = limj→∞
aj . Genauso zeigt man die die andere Gleichung
mit (2).Fr 7.12.
Zu (4): Wir haben
bj := inf{ak | k ≥ j} ≤ aj ≤ bj := sup{ak | k ≥ j}(bj) ist monoton wachsend, (bj) monoton fallend, also beide konvergent in R.
b = limj→∞ bj = limj→∞ bj , also konvergiert nach Ubungsblatt 7, Aufgabe 3 b) (Sandwich-Lemma)auch (aj) gegen diesen Grenzwert.
Zu (5): Wir haben{aj | j ∈ N≥f(`)} ⊃ {af(m) | m ∈ N≥`}
und somitbf(`) = inf{aj | j ∈ N≥f(`)} ≤ inf{af(m) | m ∈ N≥`} =: b`
Also
lim infj→∞
aj = limj→∞
bjTF= lim
`→∞bf(`)
(∗)≤ lim
`→∞b` = lim inf
`→∞af(`)
(bj) und (b`) sind monoton wachsende Folgen, also konvergieren sie in RZu TF: Ubergang zu Teilfolge, siehe Lemma 1.20(∗): siehe Ubungsblatt 7, Aufgabe 3, a)
Zu (6): Folgt nun aus (3) und (5)
Aus Satz 1.33 folgt:
1. FOLGEN 89
KOROLLAR 1.34. Jede reell-wertige Folge besitzt eine in R konvergente Teilfolge.
In anderen Worten: Jede reell-wertige Folge besitzt einen Haufungspunkt in R.
KOROLLAR 1.35 (Satz von Bolzano-Weierstraß). Jede beschrankte reell-wertige Folge besitzt eine(in R) konvergente Teilfolge.
In anderen Worten: Jede beschrankte reell-wertige Folge besitzt einen Haufungspunkt in R.
Beweis. Auf Grund des Korollars 1.34 besitzt jede reell-werte Folge mindestens einen Haufungs-punkt in R. Wegen Lemma 1.27 sind −∞ und∞ keine Haufungspunkte, wenn die Folge beschranktist. Wir haben also einen Haufungspunkt in R.
SATZ 1.36 (Satz von Bolzano-Weierstraß in C). Jede beschrankte C-wertige Folge besitzt eine(in C) konvergente Teilfolge.
Beweis. Sei (an)n∈N eine beschrankte Folge, an ∈ C. Dann sind auch (Re an)n∈N und (Im an)n∈Nbeschrankt. Es gibt somit eine streng monotone Abbildung f1 : N −→ N, so dass (Re af1(n))n∈Nkonvergiert. Da auch (Im af1(n))n∈N beschrankt ist, gibt es eine streng monotone Abbildungf2 : N −→ N, so dass auch (Im af1◦f2(n))n∈N konvergiert. Wir folgern, dass (af1◦f2(n))n∈N inC konvergiert.
1.6. Cauchy-Folgen. In diesem Unterabschnitt sei K = C oder sei K ein archimedischgeordneter Korper (z.B. K = R oder K = Q).
Betragsfunktion | · | : K → R, x 7→ |x|.
Definition 1.37. Eine K-wertige Folge (aj)i∈N heißt K-wertige Cauchy-Folge, falls
∀ε ∈ R>0 : ∃j0 ∈ N : ∀j, k ∈ N≥j0 : |aj − ak| ≤ ε.
SATZ 1.38. Jede konvergente Folge ist eine Cauchy-Folge.
Beweis. Es gelte limj→∞ aj = a. Das heißt: fur alle ε ∈ R>0 gibt es ein j0 ∈ N, so dass fur allenaturlichen Zahlen j ≥ j0 gilt: |aj − a| ≤ ε.
Fur solch ein ε und ein passendes j0 nehmen wir nun naturliche Zahlen j ≥ j0 und k ≥ j0 undrechnen nach:
|aj − ak| ≤ |aj − a|+ |a− ak| ≤ ε+ ε = 2ε.
Wir haben nun also gezeigt:
∀ε ∈ R>0 : ∃j0 ∈ N : ∀j, k ∈ N≥j0 : |aj − ak| ≤ 2ε.
Wegen Lemma 1.11 ist dies aquivalent zur definierenden Eigenschaft einer Cauchy-Folge.
LEMMA 1.39. Jede Cauchy-Folge ist beschrankt.
90 3. FOLGEN UND REIHEN
Beweis. Sei (aj)j∈N eine Cauchy-Folge. Wir wahlen zu ε := 1 ein passendes j0 wie in Definiti-on 1.37. Es gilt somit fur alle j ∈ N mit j ≥ j0:
|aj | ≤ |aj − aj0 |+ |aj0 | ≤ |aj0 |+ 1.
Nun setzen wirr := max{|a0|, |a1|, . . . , |aj0−1|, |aj0 |+ 1}.
Dann gilt fur alle j ∈ N: |aj | ≤ r. Somit ist (aj)j∈N beschrankt.
Definition 1.40. Sei K = C oder ein archimedisch geordneter Korper. Wir nennen K vollstandig ,wenn jede K-wertige Cauchy-Folge in K konvergiert.
SATZ 1.41. Sei K = C oder sei K ein archimedisch geordneter Korper, in dem jede beschrankteFolge einen Haufungspunkt besitzt. Dann ist K vollstandig. Insbesondere sind R und C vollstandig.
Beweis. Sei (aj)j∈N eine K-wertige Cauchy-Folge. Nach Lemma 1.39 ist die Folge beschrankt undbesitzt deswegen aufgrund der Annahmen im Satz eine konvergente Teilfolge (af(n))n∈N, der Limesdieser Teilfolge sei a ∈ K. Zu gegebenem ε ∈ R>0 bestimmen wir nun ein n0 ∈ N, so dass
∀n ∈ N≥n0 : |af(n) − a| ≤ ε .Wir bestimmen zudem ein j0 ∈ N, so dass
∀j, k ∈ N≥j0 : |aj − ak| ≤ ε.Wir wahlen nun ein n ∈ N≥n0
mit f(n) ≥ j0. (Eine mogliche Wahl ist n := max{j0, n0}, denndann gilt f(n) ≥ n ≥ j0.) Fur j ≥ j0 erhalten wir
|aj − a| ≤ |aj − af(n)|+ |af(n) − a| ≤ 2ε .
Mit Lemma 1.11 folgt a = limj→∞ aj .
Bemerkung 1.42. Man kann zeigen: Ist K ein vollstandiger archimedisch geordneter Korper, soerfullt er die Supremums-Eigenschaft. Somit sind fur einen archimedisch geordneten Korper diefolgenden Eigenschaften aquivalent:
(1) K erfullt die Supremums-Eigenschaft(2) Jede beschrankte Folge besitzt einen Haufungspunkt (Bolzano-Weierstraß-Eigenschaft)(3) K ist vollstandig(4) K ist isomorph zu R
Beispiel 1.43. Wir konstruieren rekursiv eine Q-wertige Folge (vergleiche Zentralubung)
a0 := 2, an+1 =1
2
(an +
2
an
).
In R – das heißt, wenn wir sie als R-wertige Folge interpretieren – konvergiert diese Folge gegen√2 6∈ Q. Deswegen ist sie eine Cauchy-Folge in R und in Q.
Andererseits konvergiert sie nicht in Q, denn wenn sie in Q gegen a ∈ Q konvergieren wurde,so hatte sie in R auch a 6=
√2 als Grenzwert, was nicht moglich ist. Deswegen konvergiert diese
Cauchy-Folge nicht in Q.
2. REIHEN 91
Cauchy-Folgen sind wichtig, denn man kann hiermit die Konvergenz von Folgen zeigen, ohne denGrenzwert im voraus angeben zu mussen.
2. Reihen
2.1. Motivation von Reihen: Dezimal-Darstellung reeller Zahlen. Notationen.
Eine Dezimal-Darstellung einer positiven reellen Zahl x ist gegeben durch eine Zahl ` ∈ Z undeiner Abbildung
Z≥` → {0, 1, 2 . . . , 9}, n 7→ an.
Wir erhalten hieraus die reelle Zahl
x =
∞∑n=`
10−n · an.
Nun sind mehrere Punkte ungeklart:
• Was ist solch eine unendliche Summe? (Siehe Abschnitt 2.2)• Hat jede positive reelle Zahl eine Dezimal-Darstellung?• Wenn ja, ist sie eindeutig?
Sobald dies geklart ist, kann man”schreiben“, falls ` ≤ 0:
x = a`a`+1 . . . a0, a1a2 . . .
bzw. falls ` > 0:x = 0, 0 . . . , 0︸ ︷︷ ︸
`−1 mal
a`a`+1 . . . . . .
Wir sagen:(an)n∈Z≥` ist eine Dezimal-Darstellung von x .
Beispiele 2.1.
(1)1
7= 0, 142857142857 . . . = 0, 142857
1
13= 0, 076923
1
17= 0, 0588235294117647
1
28= 0, 03571428
3, 14159265 . . .
(2) Die Dezimal-Darstellung ist periodisch, genau dann wenn die dadurch beschriebene zu-gehorige reelle Zahl eine rationale Zahl ist.
92 3. FOLGEN UND REIHEN
Problem: Man kann im allgemeinen nicht alle Ziffern hinschreiben, da es ja unendlich viele sind.
UBUNG 2.2. Gegeben sei die Dezimal-Darstellung (an)n∈Z einer positiven rationalen Zahl pq ,
p, q ∈ N teilerfremd. Wir zerlegen
q = 2a5bqc11 · · · qcrrwobei 2, 5q1, . . . , qr verschiedene Primzahlen sind, a, b, c1, . . . , cr ∈ N. Dann teilt die Periodenlange
die Zahl∏rj=1(qj−1)q
cj−1j . Die Zahl der Ziffern zwischen dem Komma und dem Beginn der Periode
ist max{a, b}.
Im Fall r = 1 kann man dies mit Schulwissens beweisen. Einen Beweis erhalt man (im Fall r = 1)eigentlich schon, wenn man sich genau anschaut, wie man in der 4. Klasse das Dividieren lernt. Fureinen systematischeren Beweis, der auch r > 1 abdeckt, sind Kongruenzen hilfreich. Ein Web-Linkhierzu ist auch
http://m.schuelerlexikon.de/mobile mathematik/Endliche und periodische Dezimalbrueche.htm
Im aktuellen Abschnitt wollen wir nun solche unendlichen Summen einfuhren. Man benutzt aberdas Wort
”Reihe“ an Stelle des Wortes
”Unendliche Summe“.
Bemerkung 2.3. (a) Jede Dezimal-Darstellung”beschreibt“ eine reelle Zahl.
(b) Jede positive reelle Zahl besitzt eine Dezimal-Darstellung.(c) Die Dezimal-Darstellung ist nicht eindeutig. Sind (an)n∈Z≥` , a` 6= 0, und (bn)n∈Z≥k , bk 6=
0, verschiedene Dezimal-Darstellungen derselben positiven Zahl, so hat mindestens eine derbeiden Darstellungen eine Periode 9.
Zu (a): Im nachsten Abschnitt wird klar werden, was hier mit”beschreibt“ gemeint ist, namlich
der Grenzwert einer konvergenten Reihe. Die Aussage wird auch im nachsten Abschnitt gezeigt.
Zu (b) und (c): Dies sollte nach dem nachsten Abschnitt jeder als Ubungsaufgabe beweisen konnen.Tipp zu (b): Zunachst mal uberlegt man sich zu einer gegebenen reellen Zahl x, wie eine Dezimal-darstellung aussehen muss, wenn sie existiert. Danach uberlegt man sich, dass diese Darstellungtatsachlich die gegebene Zahl x beschreibt. Man muss hier u.a. die Supremums-Eigenschaft von Rnutzen.
Beispiele 2.4.
(1) 0, 9 und 1, 0 sind Dezimal-Darstellungen von 1(2) Jede positive reelle Zahle hat also eine eindeutige Periode-9-freie Dezimal-Darstellung.
In der Zentralubung wurde bereits das folgende gezeigt:
PROPOSITION 2.5. Es gibt keine surjektive Abbildung von N nach R.
Beweis. Angenommen es gibt eine surjektive Abbildung f : N −→ R.
2. REIHEN 93
Fur k ∈ N schreiben f(k) als Dezimalzahl
f(k) = ±ak`k . . . ak0 , a
k1ak2 . . .
O.B.d.A. konnen wir annehmen, dass j(k) keine Periode 9 hat. Wir definieren h : {0, 1, . . . , 9} −→{0, 1, . . . , 9} durch
h(m) :=
{1 fur m = 2
2 fur m 6= 2
Also h(m) 6∈ {m, 9, 0}. Fur k ∈ N setze nun bk := h(akk), und dann
x := 0, b1b2b3 . . .
Nun ist x 6= f(k), den die beiden reellen Zahlen haben in ihrer Periode-9-freien Darstellung eineverschiedene Ziffer an der k-ten Stelle. Also gilt x 6∈ B(f) = f#(N). Somit ist f gar nicht surjektiv,entgegen der Annahme. Mi 12.12.
2.2. Definition und elementare Eigenschaften. Ziel: Definiere∑∞j=0 aj
Alle Folgen in diesem Abschnitt sind Folgen in K = R oder K = C. In anderen Worten es sindR-wertige oder C-wertige Folgen. Der Fall Q-wertiger Folgen ist naturlich damit auch abgedeckt,da Q ⊂ R, wir diskutieren aber nicht die Konvergenz in Q, sondern nur die Konvergenz in R.
Beachte im folgenden: eine Folge (an)n∈N ist genau dann eine Nullfolge, wenn (|an|)n∈N eine Null-folge ist.
Definition 2.6. Sei (aj)j∈N eine Folge in K. Wir definieren die n-te Teilsumme oder Partialsummeals
sn :=
n∑j=0
aj .
Die Folge (sn)n∈N nennt man dann (unendliche) Reihe mit den Summanden aj . Man schreibt eineReihe in der Form
∞∑j=0
aj .
Falls die Folge der Partialsummen (sn)n∈N konvergiert, so sagen wir die Reihe konvergiert undman definiert
∞∑j=0
aj := limn→∞
sn.
Die Reihe divergiert, wenn die Folge der Partialsummen divergiert. Bei Folgen in R definiert mananalog die uneigentliche Konvergenz.
Wir erlauben auch, dass Reihen nicht bei 0, sondern bei einer beliebigen anderen ganzen Zahl k0
beginnen und schreiben dann eben∑∞j=k0
aj .
94 3. FOLGEN UND REIHEN
!ACHTUNG!.∑∞j=1 aj hat zwei Bedeutungen:
1.) die Folge der Partialsummen. Dann ist∑∞j=0 aj ∈ Abb(N,K)
2.) der Limes dieser Folge (falls er existiert). Dann ist∑∞j=0 aj ∈ K
Welche Bedeutung gemeint ist, wird immer aus dem Kontext heraus deutlich. Wenn man sagt”die
Reihe∑∞j=1 aj konvergiert oder divergiert in K“, dann ist immer die Folge der Partialsummen
gemeint. Wenn man 5 =∑∞j=1 aj schreibt, dann ist der Limes der Folge der Partialsummen gemeint
(und es ist dann implizit klar, dass wir fordern, dass dieser dann existieren muss). Um diesenUnterschied deutlicher zu machen, schreiben wir in den nachsten Zeilen aus didaktischen Grunden1.) die Folge der Partialsummen immer in dieser Farbe2.) den Limes dieser Folge immer in dieser Farbe
∞∑j=1
aj konvergent
⇐⇒ ∃s ∈ K : ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0:∣∣∣( n∑j=1
aj)− s∣∣∣ ≤ ε
⇐⇒ ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0: ∀m ∈ N≥n :
∣∣∣ m∑j=n+1
aj
∣∣∣ ≤ ε (Cauchy-Kriterium)
8
Jede Folge kann realisiert werden als Folge von Partialsummen. Denn sei (sn)n∈N gegeben. Definieredann a0 := s0 und fur n ≥ 1: an = sn − sn−1. Dann ist sn die n-te Partialsumme von (an)n∈N.
Beispiele 2.7.
(a) Konvergente geometrische Reihe:∑∞r=0 z
r = 11−z fur |z| < 1.
Denn wir rechnen:
(z0 + z1 + z2 + · · ·+ zn︸ ︷︷ ︸sn=
)(1− z) = 1− zn+1,
Nun ist (zn+1)n∈N eine Nullfolge, da (|z|n+1)n∈N ebenfalls eine Nullfolge ist.(b) Divergente geometrische Reihe:
∑∞r=0 z
r divergiert fur |z| ≥ 1: siehe unten (Prop. 2.8) undbeachte, dass (zr)r∈N keine Nullfolge ist.
(c) Die harmonische Reihe∑∞r=1
1r divergiert:
Dieser Teil ist noch nicht gesetzt.
(d)∑∞r=1
1r2 konvergiert:
Dieser Teil ist noch nicht gesetzt.
PROPOSITION 2.8. Wenn∑∞j=0 aj konvergiert, dann ist (aj)j∈N eine Nullfolge.
8Hier gilt die Konvention∑nj=n+1 aj = 0
2. REIHEN 95
Beweis. Sei s =∑∞j=0 aj . Dann gilt
an =
n∑j=0
aj −n−1∑j=0
aj → s− s = 0 fur n→∞.
Die Umkehrung dieser Aussage ist falsch: Die Reihe∑∞r=1
1r divergiert, aber ( 1
r )r∈Nr{0} ist Null-folge.
EIGENSCHAFTEN 2.9.
(a) Wenn∑∞j=0 aj und
∑∞j=0 bj konvergieren, dann gilt
∞∑j=0
(aj ± bj) =
∞∑j=0
aj ±∞∑j=0
bj .
(b) In einer konvergenten Reihe durfen Klammern gesetzt werden (Ubergang zu einer Teilfolge derPartialsummen). Man darf im allgemeinen Klammern nicht weglassen:1 − 1 + 1 − 1 + 1 · · · divergiert, aber (1 − 1) + (1 − 1) + (1 − 1) · · · konvergiert gegen 0 und1 + (−1 + 1) + (−1 + 1) · · · konvergiert gegen 1.
(c) Es gelte fur alle r ∈ N: ar ∈ R≥0. Dann ist (sn)n∈N monoton wachsend. Also ist nach Propo-sition 1.15
∑∞r=0 ar genau dann konvergent in K, wenn (sn)n∈N beschrankt ist.
2.3. Konvergenzkriterien.
Einige vereinfachende Notationen
Um in Zukunft uber Folgen und Reihen effizienter sprechen zu konnen, fuhren wir noch einigeNotationen ein.
Definition 2.10. Sei A( · ) eine auf N definierte Aussageform.
Fur fast alle j ∈ N gilt A(j)
:⇐⇒ Es gibt ein j0 ∈ N, so dass fur alle j ∈ N≥j0 : A(j)
⇐⇒ Die Menge {j ∈ N | ¬A(j)} ist endlich
Beispiel:
limj→∞
aj = a
⇐⇒ Fur alle ε ∈ R>0 gilt fur fast alle j ∈ N: |aj − a| ≤ ε6⇐⇒ Fur fast alle j ∈ N gilt fur alle ε ∈ R>0: |aj − a| ≤ ε
Die Bedingung der letzten Zeile ist genau dann erfullt, wenn die Folge (aj)j∈N nach endlich vielenpotentiellen Ausnahmen konstant gleich a ist. Solche Folgen konvergieren zwar gegen a, aber esgibt viel mehr Folgen, die gegen a konvergieren.
96 3. FOLGEN UND REIHEN
Notation:Da wir immer wieder Ausdrucke der Art
∀j ∈ N≥j0 : A(j)
haben, schreiben wir hierfur kurz
∀j ∈ {j0, j0 + 1, . . .} : A(j).
PROPOSITION 2.11 (Majoranten-Kriterium). Sei (ar)r∈N eine Folge in R oder C und (br)r∈Neine Folge in R≥0, so dass fur fast alle r ∈ N: |ar| ≤ br. Konvergiert
∑∞r=0 br, dann auch
∑∞r=0 ar.
Man nennt in diesem Fall∑∞r=0 br eine konvergente Majorante.
Beweis. Fur alle ε ∈ R>0 existiert n0 ∈ N so dass fur alle n ∈ {n0, n0 + 1, . . .}:
|an+1 + · · ·+ am| ≤ |an+1|+ · · ·+ |am| ≤ bn+1 + · · ·+ bm ≤ ε.
Das Majoranten-Kriterium liefert sofort: Divergiert∑∞r=0 ar, so divergiert auch
∑∞r=0 br. In die-
sem Fall gilt dann:∑∞r=0 br = ∞ (uneigentliche Konvergenz), da die Folge der Partialsummen
(∑nr=0 br)n∈N monoton wachsend ist.
Beispiele 2.12. (a)∑∞r=1
1rk
konvergiert fur k ≥ 2, denn∑∞r=1
1r2 ist eine konvergente Majorante.
(b)∑∞r=1
1√r
divergiert, denn es ist eine Majorante von∑∞r=1
1r .
(c)∑∞r=1
1r! konvergiert, weil
∑∞r=2
1(r−1)2 =
∑∞k=1
1k2 eine konvergente Majorante von
∑∞r=2
1r!
ist.
LEMMA 2.13. Sei (bj)j∈N eine Folge in R.
(i) lim infj→∞ bj > 1 genau dann, wenn es ein q ∈ R , q > 1, gibt, so dass fur fast alle j ∈ N:bj ≥ q.
(ii) lim supj→∞ bj < 1 genau dann, wenn es ein q ∈ R, q < 1 gibt, so dass fur fast alle j ∈ N:bj ≤ q.
Beweis. Zu (i) =⇒:
cn := inf{bj | j ≥ n}.cn monoton wachsend, c := limn→∞ cn = lim infj→∞ bj > 1.
q :=c+ 1
2.
Somit gilt fur fast alle n ∈ N: cn > q. Also fur fast alle j ∈ N: bj > q.
Hieraus folgt die Aussage”=⇒“ fur den Limes inferior.Fr 14.12.
Zu (i) ⇐=: Sei wieder
cn := inf{bj | j ≥ n}.
2. REIHEN 97
Gegeben sei q ∈ R>1, so dass fur fast alle j ∈ N gilt: bj ≥ q. In anderen Worten: es gibt ein j0 ∈ N,so dass fur j ∈ N≥j0 : bj ≥ q. Somit
q ≤ cj0 ≤ lim infj→∞
bj .
Zu (ii): Die Aussagen fur den Limes superior zeigt man ganz analog.
Die Ausdrucke limn→∞ an, lim infn→∞ an und lim supn→∞ an ergeben immer noch Sinn, wenn angar nicht mehr fur alle n ∈ N, sondern nur noch fur fast alle n ∈ N definiert ist.
PROPOSITION 2.14 (Quotienten-Kriterium). Sei∑∞j=0 aj eine Reihe in R oder in C, so dass
fur fast alle j ∈ N: aj 6= 0.
(a) Gilt lim supj→∞
∣∣∣aj+1
aj
∣∣∣ < 1 dann konvergiert∑∞j=0 aj.
(b) Gilt lim infj→∞
∣∣∣aj+1
aj
∣∣∣ > 1, dann divergiert∑∞j=0 aj.
Beweis. Zu (a): Lemma 2.13 liefert uns ein j0 ∈ N und q < 1, so dass gilt:
∀j ∈ N≥j0 : aj 6= 0 und ∀j ∈ N≥j0 :
∣∣∣∣aj+1
aj
∣∣∣∣ ≤ q.Dann zeigt man durch Induktion fur n ∈ N≥j0 : |an| ≤ qn−j0 |aj0 |. Somit ist
∑∞n=0 q
n−j0 |aj0 | einekonvergente Majorante von
∑∞j=0 aj und deswegen ist
∑∞j=0 aj konvergent.
Zu (b): Man geht ahnlich vor wie oben und erhalt |an| ≥ qn−j0 |aj0 | fur q > 1. Daraus folgt, dass(|an|)n∈N keine Nullfolge ist, damit auch nicht (an)n∈N und somit divergiert die Reihe
∑∞n=0 an.
Beispiel 2.15. Sei t = pq ∈ Q, p ∈ Z, q ∈ Nr {0}. Definiere fur r ∈ R≥0:
rt := ( q√r)p
Sei x ∈ C. 9 Betrachte die Reihe∑∞n=0 an fur an = ntxn. Fur n ≥ 1:
an+1
an=
(n+ 1
n
)t· x
1 ≤(n+ 1
n
)t=
(q
√1 +
1
n
)p(∗)≤(
1 +1
n
)p→ 1
fur n→∞, wobei wir in (∗) genutzt haben, dass fur s ≥ 1 gilt: 1 ≤ q√s ≤ s und somit q
√sp ≤ sp.
Wir erhalten dann
limn→∞
∣∣∣∣an+1
an
∣∣∣∣ = |x| limn→∞
(n+ 1
n
)t= |x|
Also ist∑∞n=0 n
txn konvergent fur |x| < 1; und∑∞n=0 n
txn ist divergent fur |x| > 1.
9Wir beschranken uns hier auf rationale t, da wir rt noch nicht fur beliebige reelle t definiert haben.
98 3. FOLGEN UND REIHEN
PROPOSITION 2.16 (Wurzel-Kriterium). Sei (ar)r∈N eine Folge. 10
(a) Wenn lim supr→∞r√|ar| < 1, dann konvergiert
∑∞r=0 ar.
(b) Gilt fur unendlich viele r ∈ N: r√|ar| ≥ 1, dann ist
∑∞r=0 ar divergent.
(c) Wenn lim supr→∞r√|ar| > 1, dann ist
∑∞r=0 ar divergent.
Beweis. Zu (a): Unter Benutzung des Lemmas 2.13 gilt fur ein geeignetes q und fast alle r ∈ Nr√|ar| ≤ q < 1.
Also |ar| ≤ qr. Also ist∑∞r=0 q
r eine konvergente Majorante von∑∞r=0 ar.
Zu (b): r√|ar| ≥ 1 ⇐⇒ |ar| ≥ 1. Gilt dies fur unendlich viele r, dann ist (ar)r∈N keine
Nullfolge, also kann∑∞r=0 ar nicht konvergent sein.
Zu (c): Im Fall lim supr→∞r√|ar| > 1 gibt es eine Teilfolge (af(n))n∈N so dass limn→∞ n
√|af(n)| =
lim supr→∞r√|ar| > 1. Es gilt dann n
√|af(n)| > 1 fur fast alle n ∈ N. Also gibt es unendlich viele
r ∈ N mit |ar| > 1.
Beispiele 2.17. Eine Reihe der Form∑∞r=0 arx
r nennt man eine Potenzreihe in x.
(a) Sei x ∈ R≥0 und ar ≥ 0 11
∞∑r=0
arxr
lim supr→∞
r√arxr = x lim sup
r→∞r√ar, falls x 6= 0
lim supr→∞
r√arxr =∞ =⇒ ∀x ∈ R>0 :
∞∑r=0
arxr divergiert
0 < lim supr→∞
r√arxr <∞ =⇒ ∀x ∈
0,1
lim supr→∞
r√ar
:
∞∑r=0
arxr konvergiert
∀x ∈
1
lim supr→∞
r√ar,∞
:
∞∑r=0
arxr divergiert
lim supr→∞
r√arxr = 0 =⇒ ∀x ∈ R≥0 :
∞∑r=0
arxr konvergiert
10In der folgenden Formel ist r√|ar| < 1 fur r = 0 nicht definiert. Dies stort uns nicht, da die Folge nur fur fast
alle r ∈ N definiert zu sein braucht, damit wir den Limes superior definieren konnen.11Wdh: Fur x ∈ C definieren wir x ≥ 0 als: x ∈ R und x ≥ 0. Es ist hier im Text also implizit die Information
enthalten, dass x ∈ R und ar ∈ R.
2. REIHEN 99
Wir definieren
ρ :=
1
lim supr→∞
r√ar
falls lim supr→∞
r√ar ∈ R>0
0 falls lim supr→∞
r√ar =∞
∞ falls lim supr→∞
r√ar = 0∑∞
r=0 arxr konvergiert fur x < ρ und divergiert fur x > ρ.
ρ heißt Konvergenzradius der Potenzreihe.
x
0 ρ
Konvergenz Divergenz
Abbildung 5:
(b) Sei nun x ∈ C und ai ∈ C. Wir definieren dann
ρ :=
1
lim supr→∞
r√|ar|
falls lim supr→∞
r√|ar| ∈ R>0
0 falls lim supr→∞
r√|ar| =∞
∞ falls lim supr→∞
r√|ar| = 0
Dann konvergiert∑∞r=0 arx
r im Fall |x| < ρ und divergiert im Fall |x| > ρ.Die Begrundung kann man vollig analog zu Beispiel (a) fuhren, wenn man |x| an Stelle
von x und |ar| an Stelle von ar schreibt. Alternativ kann die Konvergenz auch aus (a) mitdem Majoranten-Kriterium gezeigt werden.
(c) Fur |x| = ρ kann keine Aussage getroffen werden. Die Potenzreihen∑∞r=0 rx
r und∑∞r=1
1r2x
r
besitzen beide Konvergenzradius 1, denn limr→∞
r√r = 1 und lim
r→∞r√r−2 = ( lim
r→∞r√r)−2 = 1.
(Details hier12) Nun ist die Reihe∑∞r=0 rx
r fur x ∈ C, |x| = 1 offensichtlich divergent. Wirhaben gesehen, dass fur x = 1 die Reihe
∑∞r=1
1r2x
r konvergiert (Beispiel 2.7 (d)), und aufGrund des Majoranten-Kriteriums konvergiert diese Reihe dann fur alle x ∈ C mit |x| = 1.
LEMMA 2.18. Sei ar ∈ Cr {0}. Dann gilt
lim supn→∞
n√|an| ≤ lim sup
n→∞
|an+1||an|
.
12Wir wollen zeigen, dass limr→∞
r√r = 1. Hierzu ist zu zeigen, dass xr := r
√r− 1 eine Nullfolge ist. Man rechnet
nun mit der binomischen Formel nach, dass (xr + 1)r︸ ︷︷ ︸r=
≥ r(r−1)2
x2r. Also 0 ≤ x2r ≤ 2/(r − 1).
100 3. FOLGEN UND REIHEN
Beweis. Sei α := lim supn→∞|an+1||an| . Fixiere ein β > α. Es gilt also13 fur fast alle n ∈ N:
(2.19)|an+1||an|
≤ β.
Bestimme also ein n0 ∈ N, so dass fur alle n ∈ N≥n0die Ungleichung (2.19) gilt.
|an| ≤ βn−n0 |an0|
n√|an| ≤ n
√βn︸ ︷︷ ︸
β=
n√β−n0 |an0
|︸ ︷︷ ︸→1
Wr haben genutzt, dass fur jedes s ∈ R>0 die Aussage limn→∞n√s = 1 gilt. 14 Daraus folgt also
lim supn→∞
n√|an| ≤ β.
Da dies fur alle β > α gilt, folgt die Aussage.
Bemerkung 2.20. Die Konvergenzaussage im Wurzel-Kriterium (Prop. 2.16 (a)) ist also starkerals die Konvergenzaussage im Quotienten-Kriterium (Prop. 2.3 (a)), denn es zeigt dieselbe Aussagemit einer schwacheren Voraussetzung.
Mi 19.12.
2.4. Absolute Konvergenz.
Definition 2.21 (Absolute Konvergenz). Seien ar ∈ C. Wir sagen die Reihe∑∞r=0 ar konvergiert
absolut , falls∑∞r=0 |ar| konvergiert.
Das Majoranten-Kriterium fur br := |ar| impliziert also: Jede absolut konvergente Reihe ist kon-vergent.
Majoranten-Kriterium, Quotienten-Kriterium und Wurzel-Kriterium liefern nicht nur die Konver-genz einer Reihe, sondern sogar ihre absolute Konvergenz, siehe unten.15 Insbesondere ist einePotenzreihe
∑∞n=0 anx
n absolut konvergent, wenn |x| kleiner als der Konvergenzradius ist.
PROPOSITION 2.22 (Majoranten-Kriterium mit absoluter Konvergenz). Sei (ar)r∈N eine Folge16
und (br)r∈N eine Folge in R≥0, so dass fur fast alle r ∈ N: |ar| ≤ br. Konvergiert∑∞r=0 br, dann
ist∑∞r=0 ar absolut konvergent.
PROPOSITION 2.23 (Quotienten-Kriterium mit absoluter Konvergenz). Sei∑∞j=0 aj eine Reihe,
so dass fur fast alle j ∈ N: aj 6= 0.
13eine Moglichkeit, dies zu sehen, ist Lemma 2.13 (ii) fur bj =|aj+1|α|aj |
anzuwenden.
14Beweis fur s > 1: s = ( n√s)n = ( n
√s− 1 + 1)n =
∑nj=0
(n
j
)( n√s− 1)j1n−j ≥ n( n
√s− 1). Somit 1 ≤ n
√s ≤
1 + 1n
. Im Fall s < 1 wissen wir deswegen n√
1/s→ 1 und somit konvergiert n√s = 1
n√
1/sauch gegen 1.
15Die Beweise sind wortwortlich gleich16Wenn wir nichts anderes hinschreiben, ist unter einer Folge immer eine Folge in C gemeint, und eine Folge
in R ist auch eine Folge in C.
2. REIHEN 101
(a) Gilt lim supj→∞
∣∣∣aj+1
aj
∣∣∣ < 1, dann konvergiert∑∞j=0 aj absolut.
(b) wie zuvor.
PROPOSITION 2.24 (Wurzel-Kriterium mit absoluter Konvergenz). Sei (ar)r∈N eine Folge.
(a) Wenn lim supr→∞r√|ar| < 1, dann konvergiert
∑∞r=0 ar absolut.
(b) und (c) wie zuvor.
2.5. Alternierende Reihen.
Definition 2.25. Eine alternierende Reihe ist eine Reihe in der Form∞∑n=0
(−1)nan
oder17
∞∑n=0
(−1)n+1an,
wobei ∀n ∈ N : an ∈ R≥0.
PROPOSITION 2.26 (Regel von Leibniz). Sei (an)n∈N eine monoton fallende Nullfolge, an ≥ 0.Dann konvergiert die Reihe
∞∑n=0
(−1)nan.
Beweis. Gegeben seien naturliche Zahlen m,n, n0 mit m ≥ n ≥ n0.
Idee (noch nicht prazise):Um das Cauchy-Kriterium anzuwenden, wollen wir
(−1)n+1an+1 + (−1)n+2an+2 + · · ·+ (−1)mam
kontrollieren.
Prazise Ausfuhrung der Idee:
an+1 + (−1)an+2 + · · ·+ (−1)m−n+1am
=
(an+1 − an+2)︸ ︷︷ ︸
≥0
+ · · ·+ (am−1 − am)︸ ︷︷ ︸≥0
≥ 0 falls m− n gerade
(an+1 − an+2)︸ ︷︷ ︸≥0
+ · · ·+ am︸︷︷︸≥0
≥ 0 falls m− n ungerade
17Wir betrachten ab jetzt immer nur den ersten Fall, um die Notation einfach zu halten
102 3. FOLGEN UND REIHEN
an+1 + (−1)an+2 + · · ·+ (−1)m−n+1am
=
an+1 +
≤0︷ ︸︸ ︷((−1)an+2 + an+3) + · · ·+
≤0︷ ︸︸ ︷(−1)am
≤ an+1 falls m− n gerade
an+1 +
≤0︷ ︸︸ ︷((−1)an+2) + an+3) + · · ·+
≤0︷ ︸︸ ︷((−1)am−1 + am)
≤ an+1 falls m− n ungerade
Also
|m∑
k=n+1
(−1)kak| = |(−1)n+1an+1 + (−1)n+2an+2 + · · ·+ (−1)mam| ≤ |an+1|.
Da (an) eine Nullfolge ist, haben wir gezeigt:
∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0: ∀m ∈ N≥n : |
m∑k=n+1
(−1)kak| ≤ ε.
Beispiele 2.27.
(a) Die harmonische alternierende Reihe
∞∑n=1
(−1)n+1 1
n
konvergiert.(b) Die Reihe
∑∞n=1(−1)nan mit
an :=
{1n fur n gerade1n2 fur n ungerade
divergiert. Denn sei
α :=
∞∑k=0
1
(2k + 1)2.
(Anschaulich ist α die unendliche Summe der an uber alle ungeraden n.)Dann gilt
2r∑n=1
an ≥ (
r∑k=1
1
2r)− α
und dies konvergiert uneigentlich gegen ∞ fur r →∞, da die harmonische Reihe konvergiert.
2. REIHEN 103
2.6. Umordnung von Reihen.
Definition 2.28. Sei∑∞n=0 an eine Reihe. Ein Umordnung dieser Reihe ist eine Reihe der Form∑∞
n=0 af(n), wobei f : N −→ N eine Bijektion ist.
SATZ 2.29 (Umordnungssatz). Ist∑∞n=0 an eine absolut konvergente Reihe in R oder C, so ist
jede Umordnung∑∞n=0 af(n) dieser Reihe ebenfalls absolut konvergent und es gilt
∞∑n=0
an =
∞∑n=0
af(n).
Beweis spater.
SATZ 2.30 (Riemannsche Umordnungssatz). Ist∑∞n=0 an eine konvergente Reihe in R, die nicht
absolut konvergiert.
(1) Sei α ∈ R gegeben. Dann gibt es eine Umordnung dieser Reihe, die gegen α eigentlich oderuneigentlich konvergiert.
(2) Es gibt eine Umordnung, die beschrankt und divergent ist.
Beispiel 2.31. Die Folge∑∞n=1(−1)n 1
n ist konvergent, aber nicht absolut konvergent. Zu jedem
α ∈ R gibt es eine Umordnung von∑∞n=1(−1)n 1
n , die gegen α konvergiert.
Beweis von Satz 2.29. Sei∑∞n=0 an absolut konvergent. Dies bedeutet nach dem Cauchy-Kriterium:
Zu jedem ε ∈ R>0 gibt es ein n0 ∈ N, so dass fur alle n, n ∈ N mit n0 ≤ n ≤ n gilt18 :∑nj=n+1 |aj | ≤ ε.
Wir fixieren nun ε und ein passendes n0. Sei nun∑∞n=0 af(n) eine Umordnung dieser Reihe. Ins-
besondere sei f : N→ N als bijektiv vorausgesetzt. Wir setzen nun
m0 := max f#({0, 1, . . . , n0}) := max{f−1(0), f−1(1), . . . , f−1(n0)}.
Hier steht eine Zeichnung, die noch nicht gesetzt ist.
Dies bedeutet, fur alle ` > m0 gilt f(`) > n0. Somit gilt fur m, m ∈ N mit m0 ≤ m < m:
m∑`=m+1
|af(`)| ≤N∑
j=n0+1
|aj | ≤ ε
wobei N ∈ N eine “genugend große” naturliche Zahl ist, zum Beispiel
(2.32) N := max f#({m+ 1,m+ 2, . . . , m}) = max{f(m+ 1), f(m+ 2), . . . , f(m)} > n0
oder jede Zahl die mindestens so groß wie dieses Maximum ist. Dann ist also das Cauchy-Kriteriumfur die Reihe
∑∞n=0 |af(n)| erfullt, in anderen Worten
∑∞n=0 af(n) ist absolut konvergent.
18Ja, die Betragsstriche sind hier um den richtigen Ausdruck, denn es handelt sich um absolute Konvergenz!
104 3. FOLGEN UND REIHEN
Wir wissen nun also, dass die Reihen (absolut) konvergieren, und wir studieren nun deren Grenz-werte
∑∞n=0 an und
∑∞n=0 af(n). Wir wahlen zu ε ∈ R>0 passende Zahlen n0 und m0 wie oben.
Außerdem definieren wir
N0 := max{f(0), f(1), . . . , f(m0)} = max f#({0, 1, . . . ,m0}) ≥ n0.
Fur alle n, n ∈ N mit n0 ≤ n ≤ n gilt
(2.33) |n∑j=0
aj −n∑j=0
aj | = |n∑
j=n+1
aj | ≤n∑
j=n+1
|aj | ≤ ε
und dies impliziert im Limes n→∞ fur n := N0(≥ n0)
|∞∑j=0
aj −N0∑j=0
aj | ≤ ε.
Wenn wir N wie in (2.32) definieren ergibt sich analog:
|m∑`=0
af(`) −m0∑`=0
af(`)| = |m∑
`=m0+1
af(`)| ≤N∑
j=n0+1
|aj | ≤ ε
und somit im Limes m→∞
|∞∑`=0
af(`) −m0∑`=0
af(`)| ≤ ε.
AußerdemN∑j=0
aj −m0∑`=0
af(`) =∑j∈I
aj
wobei I := {0, 1, . . . , N}rf#({0, 1, . . . ,m0}).19 Nach Konstruktion vonm0 sind I und {0, 1, . . . , n0}disjunkt20. Es folgt mit (2.33)
|∑j∈I
aj | ≤∑j∈I|aj | ≤
N∑j=n0+1
|aj | ≤ ε.
Dies ergibt∣∣∣∣∣∣∞∑j=0
aj −∞∑`=0
af(`)
∣∣∣∣∣∣ ≤∣∣∣∣∣∣∞∑j=0
aj −N∑j=0
aj
∣∣∣∣∣∣︸ ︷︷ ︸≤ε
+
∣∣∣∣∣∣N∑j=0
aj −m0∑`=0
af(`)
∣∣∣∣∣∣︸ ︷︷ ︸≤ε
+
∣∣∣∣∣m0∑`=0
af(`) −∞∑`=0
af(`)
∣∣∣∣∣︸ ︷︷ ︸≤ε
≤ 3ε
19An dieser Stelle gab es in der Vorlesung gegen Vorlesungsende eine Frage: es stimmt so wie es an der Tafelstand und so wie hier im Skript.
20Denn sei j ∈ I. Dann folgt j /∈ f#({0, 1, . . . ,m0}) und somit f−1(j) > m0 und mit der Definition von m0
erhalten wir dann, j /∈ {0, 1, . . . , n0}.
2. REIHEN 105
Da diese Aussage fur alle ε ∈ R>0 gilt, sind die Grenzwerte gleich. Fr 21.12.
Beweis von Satz 2.30. Wir beweisen (1) im Fall α ∈ R. Die anderen Falle und Ausage (2) beweistman ahnlich, wir geben hierfur aus Zeitgrunden aber keine Details.
Zu (1) fur α ∈ R: Sei∑∞n=0 an eine konvergente Reihe, die nicht absolut konvergiert. Wir definieren
I+ := {n ∈ N | an ≥ 0} und I− := {n ∈ N | an < 0}.Die Mengen I+ oder I− sind unendlich. (Denn: Wenn eine endlich ware, dann ware die Reiheabsolut konvergent; Widerspruch.)
Somit existieren streng monoton wachsende Abbildungen f± : N → N, mit B(f±) = I±. Wdh:B(f+) ist das Bild von f+.
Wir setzen nun bn := af+(n), cn := af−(n).∑∞n=0 bn ist die Teilreihe der nicht-negativen Glieder, und
∑∞n=0 cn die Teilreihe der negativen
Glieder. Fur jede dieser Teilreihen gilt
beschrankt⇐⇒ konvergent⇐⇒ absolut konvergent.
Wenn genau eine dieser beiden Teilreihen nicht beschrankt ist, dann ist∑∞n=0 an nicht beschrankt,
also nicht konvergent. Widerspruch.
Wenn beide Teilreihen beschrankt sind, dann ist∑∞n=0 an absolut konvergent. Widerspruch.
Also sind beide Teilreihen unbeschrankt.
lim`→∞
∑n=0
bn =∞ lim`→∞
∑n=0
cn = −∞.
Nach Proposition 2.8 ist (an)n∈N eine Nullfolge, deswegen auch (bn)n∈N und (cn)n∈N, somit auchderen Teilfolgen (brj )j∈N und (csj )j∈N. Ohne Beschrankung der Allgemeinheit konnen wir anneh-men, dass (cn)n∈N monoton wachsend ist. (Wenn nicht, dann konnen wir dies durch Umordnenerreichen; jede R<0-wertige Nullfolge kann in eine monoton wachsende umgeordnet werden.) Ana-log konnen wir annehmen, dass die Teilfolge der positiven Summanden in (bn)n∈N monoton fallendist.21
Bestimme nun zuerst das kleinste r1 ∈ N mit
b0 + b1 + b2 + · · ·+ br1 ≥ α.
21Subtilitat: Wir konnen dies nicht fur die gesamte Folge erreichen: denn die Nullen machen Probleme. Da
(bn)n∈N unbeschrankt ist, muss es unendlich viele positive bn geben. Jede monoton fallende Nullfolge, die eineNull als Folgenglied hat, hat aber nur endlich viele positive Folgenglieder. Man lasst also die Folgenglieder, die
Null sind einfach an ihrer Position stehen. Diese Folgenglieder haben sowieso auf die Partialsumme keine Wirkung.
Didaktische Anmerkung: die Nullen sind also zum einen ziemlich unerheblich fur das Verstandnis des Beweises, aberein bisschen lastig fur die Ausformulierung, da sie Spezialfalle erzeugen; deswegen habe ich die Diskussion in der
Vorlesung nicht im Detail diskutiert.
106 3. FOLGEN UND REIHEN
Bestimme dann das kleinste s1 ∈ N mit
b0 + b1 + · · ·+ br1 + c0 + c1 + c2 · · ·+ cs1 < α.
Dann gilt b0+b1+· · ·+br1 +c0+c1+c2 · · ·+cs1−1 ≥ α. 22 Hieraus folgt |α−(b0+b1+· · ·+cs1)| ≤ |cs1 |
Bestimme nun das kleinste r2 ∈ N>r1 mit
b0 + b1 + · · ·+ br1 + c0 + c1 · · ·+ cs1 + br1+1 + br1+2 + · · ·+ br2 ≥ α.
Wir erhalten |α − (b0 + b1 + · · ·+ br2)| ≤ br2 .23 Wir machen so weiter24 und erhalten letztendlicheine Reihe
∞∑n=0
dn := b0 + b1 + · · ·+ br1 + c0 · · ·+ cs1 + br1+1 + · · ·+ br2 + cs1+1 + · · ·+ cs2 + · · · .
Fur j ∈ N und ` ≥ rj + sj + 1 gilt also
α+ csj ≤∑n=0
dn ≤ α+ bsj .
Deswegen gilt
α = limj→∞
(α+ csj ) = lim`→∞
∑n=0
dn︸ ︷︷ ︸∞∑n=0
dn
= limj→∞
(α+ bsj ).
Es gibt nun viele Variationen des Umordnungssatzes. Eine davon liegt der nun folgenden Multipli-kation von Reihen zu Grunde. Wenn man diese (verallgemeinerten) Umordnungen systematischerverstehen will, sollte man sich mit summierbaren Familien und dem Großen Umordnungssatz (z. B.[22, Abschnitt 6.3]) beschaftigen. Wir uberspringen aber aus Zeitgrunden diesen Aspekt und kon-zentrieren uns auf die fur uns wichtige Multiplikation.
Multiplikation von Reihen.
Definition 2.34. Seien∑∞n=0 an und
∑∞n=0 bn Reihen in R oder in C. Wenn N → N × N, n 7→
(kn, `n) bijektiv ist, so nennen wir die Reihe∑∞n=0 aknb`n eine Produktreihe von
∑∞n=0 an und∑∞
n=0 bn.
Beispiele 2.35.
(a) Eine Anordnung nach Quadraten(b) Eine Anordnung nach Diagonalen
22Im Fall s1 = 0 ist dies zu lesen als b0 + b1 + b2 + · · ·+ br1 ≥ α.23Insbesondere gilt dann br2 > 0.24Genau genommen werden nun alle rj und sj rekursiv definiert und alle Aussagen dann rekursiv gezeigt
2. REIHEN 107
SATZ 2.36 (Produktreihen). Sind∑∞n=0 an und
∑∞n=0 bn absolut konvergent, so ist jede Produkt-
reihe von∑∞n=0 an und
∑∞n=0 bn absolut konvergent und hat den Grenzwert( ∞∑
n=0
an
) ( ∞∑n=0
bn
).
Beweis.1.) pn := aknb`n , rn := max{k0, k1, . . . , kn}, tn := max{`0, `1, . . . , `n} Dann gilt fur alle n ∈ N
|p0|+ |p1|+ · · ·+ |pn| ≤
rn∑j=0
|aj |
tn∑j=0
|bj |
≤
∞∑j=0
|aj |
∞∑j=0
|bj |
Somit sind die Partialsummen der Reihe
∑∞n=0 |pn| beschrankt, sie bilden also eine beschrankte
monoton wachsende Folge, die somit konvergiert.
Wir haben somit gesehen, dass alle Produktreihen absolut konvergieren.
2.) Wir betrachten nun zunachst den Spezialfall, dass die Produktreihe nach Quadraten geordnetist.
Dann erhalten wir
p0 + p1 + · · ·+ pn2−1 =
n−1∑j=0
aj
︸ ︷︷ ︸→
∑∞j=0 aj
n−1∑j=0
bj
︸ ︷︷ ︸→
∑∞j=0 bj
.
Wir haben somit eine Teilfolge der Partialsummen, die gegen( ∞∑n=0
an
) ( ∞∑n=0
bn
)konvergiert. Da die Folge der Partialsummen konvergiert, konvergiert sie ebenfalls gegen diese Zahl.Die Aussage fur diese spezielle Anordnung ist somit gezeigt.
3.) Durch eine Umordnung im Sinne von Definition 2.28 kann man jede Produktreihe in einenach Quadraten angeordnete Produktreihe umformen. Deswegen ist jede Produktreihe absolutkonvergent.
Aus der Anordnung nach Diagonalen ergibt sich durch Klammersetzen25 das folgende:
25dies ist erlaubt, vergleiche Eigenschaften 2.9 (b)
108 3. FOLGEN UND REIHEN
KOROLLAR 2.37 (Satz vom Cauchy-Produkt). Sind∑∞n=0 an und
∑∞n=0 bn absolut konvergent,
und setzen wir
cn :=
n∑k=0
akbn−k,
dann ist auch∑∞n=0 cn absolut konvergent und
∞∑n=0
cn =
( ∞∑n=0
an
) ( ∞∑n=0
bn
).
Anwendung auf Potenzreihen:
Seien∑∞n=0 anz
n und∑∞n=0 bnz
n, Potenzreihen an, bn ∈ C mit Konvergenzradien ρa und ρb. Seiz ∈ C gegeben mit |z| < min{ρa, ρb}. Wieder cn :=
∑nk=0 akbn−k. Dann ist |z| auch kleiner als der
Konvergenzradius von∑∞n=0 cnx
n, denn wenn∑∞n=0 an|z|n und
∑∞n=0 bn|z|n konvergieren, dann
konvergiert nach dem Satz vom Cauchy-Produkt (Korollar 2.37) auch∑∞n=0 cn|z|n.
(a0 + a1z + a2z2 + · · · )(b0 + b1z + b2z
2 + · · · )= (a0b0)︸ ︷︷ ︸
c0
+ (a0b1 + a1b0)︸ ︷︷ ︸c1
z + (a0b2 + a1b1 + a2b0)︸ ︷︷ ︸c2
z2 + · · ·
Anschaulich: Man darf hier nach Potenzen in z ordnen. Alle Grenzwerte existieren und es giltGleichheit.
3. Einige durch Reihen definierte Funktionen
Sei z ∈ C. Potenzreihen definieren mehrere wichtige Funktionen:
3.1. Exponentialfunktion.
exp z :=
∞∑n=0
1
n!zn.
Diese Reihe nennt man die Exponentialreihe.
Wir bestimmen den Konvergenzradius: Wir wenden hierzu das Quotienten-Kriterium an
∣∣∣∣an+1zn+1
anzn
∣∣∣∣ =|z|n+ 1
lim supn→∞
∣∣∣∣an+1
an
∣∣∣∣ = limn→∞
|z|n+ 1
= 0 < 1
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 109
Die Exponentialreihe konvergiert also absolut fur alle z ∈ C. Wir sagen sie konvergiert (absolut)auf C. 26 Der Konvergenzradius muss dann ρ = ∞ sein, denn angenommen wir hatten ρ < ∞,dann wurde die Reihe fur z := ρ+ 1 divergieren, was einen Widerspruch ergibt.
Wir erhalten eine Funktion27 exp : C −→ C, z 7→ exp(z), die komplexe Exponentialfunktion.
Ist z ∈ R, so ist auch exp(z) ∈ R. Wir erhalten somit eine Funktion exp : R −→ R, x 7→ expx, diereelle Exponentialfunktion. 28
PROPOSITION 3.1 (Funktionalgleichung der Exponentialfunktion). Fur alle x,w ∈ C gilt
exp(z + w) = exp z · expw
Beweis. Wir rechnen:
1
n!(z + w)n =
1
n!
n∑k=0
(nk
)zkwn−k =
n∑k=0
1
k! (n− k)!zkwn−k =
n∑k=0
1
k!zk
1
(n− k)!wn−k
Wende den Satz vom Cauchy-Produkt an fur
an :=1
n!zn und bn :=
1
n!wn und cn :=
1
n!(z + w)n.
Mi 9.1.
Spezialfall: exp(0) :=∑∞n=0 = 00 + 01 + 02 + . . . = 1
Man definiert immer 00 := 1.
Also exp 0 = 1.
Es folgt dann auch1 = exp 0 = exp(z − z) = (exp z)(exp(−z)).
Also
exp(−z) =1
exp z.
Es gilt (Ubung) limn→∞(1 + z
n
)n= ez.
Klammer-”Regel“ fur exp und die demnachst definierten Funktionen sin und cos.
26Das Wort absolut wird hier normalerweise weggelassen, denn fur jede Potenzreihe gilt: wenn sie in allen
Punkten z ∈ C konvergiert, so ist der Konvergenzradius ∞ und deswegen konvergiert sie in allen z ∈ C sogarabsolut.
27Wie gesagt: wir nutzen den Begriff”Funktion“ gleichbedeutend zum Begriff
”Abbildung“, allerdings ist es
ublich, dass Funktionen den Zielbereich R oder C haben.28Die Relation, die der reellen Exponentialfunktion unterliegt, erhalt man durch Restriktion der Relation,
die der komplexen Exponentialfunktion unterliegt. Es handelt sich also um zwei verschiedene Relationen, die gemaßunseren Definitionen im ersten Kapitel auch verschiedene Symbole haben sollte. Wir benutzen aber dennoch dasselbeSymbol exp, da dies so ublich ist und in der Praxis nur selten zu Missverstandnissen fuhrt.
110 3. FOLGEN UND REIHEN
Man lasst bei exp und anderen wichtigen Funktionen die sonst bei Funktionen ublichen Klammernweg. Man schreibt also exp z und nicht exp(z). Nun stellt sich die Frage, ob bei Ausdrucken in derArt exp ab und exp a+ b zuerst exp ausgefuhrt wird oder zuerst verknupft wird.
Ein Blick in die Literatur ergibt leider: das ist nicht ganz so klar geregelt, man nutzt hier eine bunteMischung spezieller Konventionen. Im allgemeinen reiht man – wenn keine Klammern stehen – aberwie folgt, wobei die oben stehenden Operationen zuerst ausgefuhrt werden:
(1) Potenzen,(2) Produkte, Vorzeichen, Quotienten29
(3) exp, sin, cos,(4) Addition und Subtraktion
Oft wird jedoch (3) vor (2) oder hinter (4) ausgefuhrt. Also lieber großzugig Klammern setzen!
exp it = exp(it)
cos 2a = cos(2a)
cos−α/2 = cos(−α/2)
exp a+ b = (exp a) + b meistens! Besser also Klammern setzen.
sin a sin b =? Nach den obigen Regeln hatten wir dann sin(a(sin b)). Das interpretiert aber niemandso. Solch ein Ausdruck wird immer als (sin a)(sin b) interpretiert.
Besser treffend ware also
(1) Potenzen,(2) Produkte mit kurzen Faktoren, Vorzeichen, Quotienten(3) exp, sin, cos,(4) Produkte mit langen Faktoren(5) Addition
Nur: was ist lang und was ist kurz? Ab wann wird exp abcdefghijklm · · · lang?
Die Verwirrung wird noch schlimmer: Da man ja fur Funktionen f : M −→M immer definiert
f2(x) := f(f(x))
wurde dann sin2 a als sin(sin(a)) zu lesen sein. Das macht aber auch niemand. Solch ein Ausdruckwird immer als (sin a)2 interpretiert.
Um das Durcheinander zu beseitigen, wurde nur eine von der Kultusminister-Konferenz eingesetzteExperten-Kommission helfen, die sich zuerst mit europaischen Instanzen zusammenschließt undnach reiflicher, mehrjahriger Diskussion eine DIN-Norm erlasst.30 Das ware Burokratismus pur.
29Quotienten werden oft als Bruch geschrieben, dann ist die Reihenfolge zumeist klar30Gibt es vielleicht sogar?
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 111
Und selbst, wenn die DIN erlassen ware, ginge es dieser Reform vielleicht nicht anders als mitder letzten Rechtschreibreform: manche Bundeslander wurden sie einfuhren, andere ablehnen. Etc.Oder es gibt sie und niemand kennt sie. 31
Und den meisten Mathematiker sind solche Diskussionen sowieso lastig.
Also: da leben wir lieber mit weniger Ordnungen und setzen ein paar Klammern mehr.
3.2. Sinus- und Kosinus-Funktion. Sei wieder i die komplexe Zahl mit i2 = −1.
Betrachte nun
exp iz =
∞∑n=0
1
n!(iz)n =
∞∑n=0
n gerade
1
n!(iz)n +
∞∑n=0
n ungerade
1
n!(iz)n
32
Wir definieren den Kosinus
cos z :=
∞∑n=0
n gerade
1
n!(iz)n =
∞∑k=0
1
(2k)!(iz)2k =
∞∑k=0
1
(2k)!(−1)kz2k = 1− 1
2z2 +
1
24z4 − · · ·
Was ist der Konvergenzradius dieser Reihe?
n gerade: | 1n! (iz)
n| ≤ 1n! |z|
n
n ungerade: 0 ≤ 1n! |z|
n
Nach dem Majoranten-Kriterium und der Konvergenz der Exponentialfunktion, konvergiert dieKosinusreihe auf ganz C. Der Konvergenzradius ist also ∞.
Wir definieren den Sinus
sin z :=1
i
∞∑n=0
n ungerade
1
n!(iz)n =
1
i
∞∑k=0
1
(2k + 1)!(iz)2k+1
=
∞∑k=0
1
(2k + 1)!(−1)kz2k+1 = z − 1
6z3 +
1
120z5 − · · ·
Der Konvergenzradius ist ebenfalls ∞.
31Vielleicht ist es sogar so?32Hier handelt es sich rechts um zwei Reihen, wo eigentlich an den ungeraden bzw. geraden Stellen n eine Null
steht. Nullen in einer Reihen haben keinen Einfluss auf den Grenzwert einer Reihe, sie konnen beliebig hinzugefugt
oder gestrichen werden. Mit dieser Interpretation ist die letzte Gleichung eine Folge von∑n=0(an+bn) =
∑n=0 an+∑
n=0 bn
112 3. FOLGEN UND REIHEN
exp iz = cos z + i sin z
cos(−z) = cos z
sin(−z) = − sin z
exp iz + exp(−iz)2
=cos z + i sin z + cos z − i sin z
2= cos z
exp iz − exp(−iz)2i
= sin z
Ist x reell, dann sind auch cosx und sinx reell. Dann gilt also
cosx = Re exp ix sinx = Im exp ix.
Man uberlegt sich auch leicht, dass fur jede Reihe in C gilt
∞∑n=0
an =
∞∑n=0
an, Re
∞∑n=0
an =
∞∑n=0
Re an, Im
∞∑n=0
an =
∞∑n=0
Im an .
Somit gilt fur x ∈ R:
| exp(ix)|2 = exp ix exp ix = exp ix exp(−ix) = (exp ix) (exp ix)−1 = 1
exp ix exp(−ix) = (cosx+ i sinx) · (cosx− i sinx) = (cosx)2 + (sinx)2
Also | exp(ix)|2 = cos2 x+ sin2 x = 1.
Hier nutzen wir die Schreibwweisen sin2 x := (sinx)2 und cos2 := (cosx)2.
PROPOSITION 3.2 (Additionstheoreme). Fur alle a, b ∈ C gilt
cos(a+ b) = cos a cos b− sin a sin b,
sin(a+ b) = sin a cos b+ cos a sin b.
Wir geben zunachst einen Beweis fur a, b ∈ R und dann einen fur a, b ∈ C. Der erste Beweis ist alsoaus Sichtweise des logischen Aufbaus der Vorlesung unnotig. Allerdings ist der erste Beweis vielbesser zu merken und die Additionstheoreme sind vor allem fur reelle a und b wichtig. Deswegenist der erste fur unser Verstandnis der wichtigere.
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 113
Beweis fur reelle a und b.
cos(a+ b) = Re exp i(a+ b) = Re ((exp ia)(exp ib))
= Re((cos a+ i sin a)(cos b+ i sin b)
)= cos a cos b− sin a sin b
sin(a+ b) = Im exp i(a+ b) = Im ((exp ia)(exp ib))
= Im((cos a+ i sin a)(cos b+ i sin b)
)= cos a sin b+ sin a cos b
Beweis fur alle a und b.
cos(a+ b) =exp i(a+ b) + exp(−i(a+ b))
2=
exp ia exp ib+ exp(−ia) exp(−ib)2
cos a cos b =exp ia exp ib+ exp ia exp(−ib) + exp(−ia) exp ib+ exp(−ia) exp(−ib)
4
sin a sin b =exp ia exp ib− exp ia exp(−ib)− exp(−ia) exp ib+ exp(−ia) exp(−ib)
−4
Dies ergibt die Formel fur cos(a+ b). Der Beweis der Formel fur sin(a+ b) geht vollig analog.
33
3.3. Eulersche Zahl. Die Eulersche Zahl ist
e := exp(1) =
∞∑n=0
1
n!> 1 + 1 +
1
2+
1
6= 2, 6666 . . .
Numerisch34: e = 2, 718 281 828 459 045 235 360 287 471 352 662 497 757 247 . . .
Wdh: Fur t ∈ R>0, n ∈ N, m ∈ Nr {0} ist definiert:
tn: rekursivm√t: durch Lemma 6.10 in Kapitel 2.
tn/m := m√tn.
t−n/m := 1tn/m
:
33Wir hatten gerne naturlich noch ganz andere Eigenschaften: zum Beispiel, dass sin und cos die ublichengeometrischen Eigenschaften haben, und dass sie periodisch sind, genauer dass cos(z+2π) = cos z und sin(z+2π) =sin z. Das konnen wir aber noch nicht sagen, denn wir mussen ja erst mal π definieren. Man definiert π/2 als dieerste positive Nullstelle von sin, aber wir konnen leider noch gar nicht zeigen, dass die oben definierte Funktion
uberhaupt eine positive Nullstelle beseitzt.34Dieser Wert ist hier nicht vollstandig angegeben, kann auch nicht vollstandig als Dezimalzahl angegeben
werden. Wir wollen hier nicht begrunden, wieso dies die ersten Stellen der Eulerschen Zahl sind. Wir werden diesen
Naherungswert im folgenden nie benotigen. Der Naherungswert dient allein der Anschauung und dem Vergleich zuanderer Literatur und anderen Konstanten!
114 3. FOLGEN UND REIHEN
LEMMA 3.3. Fur alle q ∈ Q gilteq = exp(q)
Beweis. Durch Induktion zeigt man zunachst fur alle n ∈ N und alle z ∈ C: exp(nz) = (exp z)n.Angewendet auf z := 1 ergibt dies exp(n) = exp(n · 1) = en > 0. Fur m ∈ Nr {0} gilt dann
exp(n/m) :=
∞∑j=0
1
j!
( nm
)j> 0.
Nun setzen wir z := n/m in exp(nz) = exp(z)n und erhalten
(expn/m)m = exp(mn/m) = en.
Somit ist x := exp(n/m) eine positive reelle Zahl, die xm = en erfullt. Also x = en/m. Wir habensomit die Aussage fur alle q ∈ Q>0 gezeigt. Die Aussage ist trivial fur q = 0 und folgt direkt ausder Funktionalgleichung der Exponentialfunktion (Proposition 3.1) fur q ∈ Q<0.
Definition 3.4. Fur z ∈ C definieren wir ez := exp(z).
Funktionalgleichung: ez+w = ez · ew
Bemerkung 3.5. Die Eulersche Zahl ist irrational. Sie ist sogar transzendent, d.h. ist p(x) =adx
d + · · · + a0x0, p 6≡ 0, 35 eine polynomiale Funktion mit rationalen Koeffizienten, dann gilt
p(e) 6= 0. (Ohne Beweis)
3.4. Exponentialfunktion (Fortsetzung). In diesem Abschnitt studieren wir die reelleExponentialfunktion exp : R −→ R.
SATZ 3.6.
(a) ∀r ∈ R : exp r > 0, also exp#(R) ⊂ R>0.(b) Die reelle Exponentialfunktion exp : R −→ R ist streng monoton wachsend.(c) Sie wachst schneller als jede polynomiale Funktion im folgenden Sinn: Fur jede polynomiale
Funktion p(x) = adxd + · · ·+ a0x
0, gilt:
∀ε ∈ R>0 : ∃x0 ∈ R : ∀x ∈ R≥x0 :
∣∣∣∣ p(x)
exp(x)
∣∣∣∣ ≤ εInsbesondere: ist (ak)k∈N eine Folge, die uneigentlich gegen ∞ konvergiert, dann ist(
p(ak)
exp(ak)
)k∈N
eine Nullfolge.
35Fur eine Funktion f : M → R bedeutet f ≡ 0, dass fur alle x ∈M gilt f(x) = 0. Oben gilt dann also
p 6≡ 0 ⇐⇒ ¬(p ≡ 0) ⇐⇒ ¬(ad = ad−1 = · · · = a0 = 0)
.
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 115
Beweis.Zu (a): bereits gezeigt.Zu (b): Es gelte x, y ∈ R, x < y.
exp y
expx= exp(y − x) = 1 +
∞∑n=1
1
n!(y − x)n︸ ︷︷ ︸
>0
> 1.
Zu (c): Sei ε ∈ R>0 gegeben. Wir setzen
x0 :=max{1! |a0|, 2! |a1|, . . . , (d+ 1)! |ad|}
ε> 0.
Somit haben wir fur ∀x ∈ R≥x0∣∣a`x`∣∣ ≤ ε
(`+ 1)!|x0| · |x`| ≤
ε
(`+ 1)!x`+1,
|p(x)| = |adxd + · · ·+ a0x0| ≤ ε
d+1∑n=1
1
n!xn < ε exp(x).
KOROLLAR 3.7. Konvergiert (ak)k∈N uneigentlich gegen∞, dann konvergiert exp(−ak)→ 0 undexp(ak)→∞.
Frage 3.8. Ist exp(R) = R>0?
Es erscheint uns, dass die Antwort ja sein sollte, obwohl wir es noch nicht zeigen konnen. Die Frageist auch wichtig, weil wir gerne den (naturlichen) Logarithmus als Umkehrfunktion der reellenExponentialfunktion definieren wollen, und der Logarithmus sollte auf allen positiven reellen Zahlendefiniert sein.
Beispiel 3.9. Betrachte die Funktion f : R −→ R
f(x) :=
{expx x ≤ 0
1 + expx x > 0
Die Funktion f : R→ R aus Beispiel 3.9
Diese Funktion erfullt alle Eigenschaften in Satz 3.6 und Korollar 3.7. Aber f#(R) = (0; 1]∪(2;∞) 6=R>0.
Anschaulich: Da exp : R −→ R keine”Sprunge macht“, sollte jeder Wert zwischen 0 und ∞ von
der Funktion einmal angenommen werden.
Uns fehlt also ein wichtiges Hilfsmittel. Wir wollen deswegen im folgenden Kapitel klaren, was esbedeutet, dass eine Funktion
”keine Sprunge macht“. Dies fuhrt zum Begriff
”Stetigkeit“.
KAPITEL 4
Stetigkeit und Grenzwerte von Funktionen
Fr 11.1.
1. Stetigkeit
Notationswiederholung f#(D) = {f(x) | x ∈ D}, siehe (7.25).
Im folgenden sei: D ⊂ C, x0 ∈ D, f : D −→ C.
Stellen Sie sich am besten zunachst den SpeziallfallD ⊂ R vor und nehmen Sie zunachst f#(D) ⊂ Ran. Wenn Sie diesen Fall richtig verstanden haben, betrachten Sie den Fall D ⊂ C. In spaterenSemestern werden wir aber noch wesentlich allgemeinere Definitionsbereiche D benotigen, zumBeispiel 4-dimensionale gekrummte Raumzeiten, unendlich-dimensionale Vektorraume oder
”topo-
logische Raume“ und wir wollen die jetzt gemachten Definitionen moglichst so wahlen, dass sichalles auf diesen allgemeineren Kontext verallgemeinert.
Frage 1.1. Sind Funktionen mit dem Grenzwert von Folgen vertraglich?Es gelte an → x0. Folgt dann f(an)→ f(x0)?
Definition 1.2. Eine Funktion f : D −→ C heißt folgenstetig in x0, falls gilt: 1
(1.3) Ist (an)n∈N eine beliebige Folge in D mit limn→∞
an = x0, dann folgt limn→∞
f(an) = f(x0).
Eine Funktion f : D −→ C heißt folgenstetig , falls sie in allen x0 ∈ D folgenstetig ist.
Beispiele 1.4.
(a) Konstante Funktionen folgenstetig. Die Identitaten idR : R → R und idC : C → C sindfolgenstetig.
(b) Ist f : D → C folgenstetig in x0 und x0 ∈ D ⊂ D, dann ist auch f |D : D −→ C in x0
folgenstetig. 2
1Damit es keine Missverstandnisse gibt, wie (1.3) zu verstehen ist, wollen wir noch eine logisch prazisereFormulierung von (1.3) geben, in der der Allquantor deutlich wird. Es ist: Fur allle Folgen (an)n∈N in D gilt:
limn→∞
an = x0 =⇒ limn→∞
f(an) = f(x0).
2Denn: Wenn man D verkleinert, muss man weniger Folgen uberprufen.
117
118 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
(c) Die Heaviside-Funktion Θ1 : R→ R
Θ1(x) :=
{0 x ≤ 0
1 x > 0
ist nicht folgenstetig in 0. Denn die Folge (1/n)n∈Nr{0} konvergiert gegen 0, aber Θ1(1/n) = 1konvergiert nicht gegen Θ1(0) = 0.
Funktionsgraph der Heaviside-Funktion Θ1
Anderseits ist Θ1 in allen anderen x0 folgenstetig. Denn ist zum Beispiel x0 > 0, und gilt an →x0, dann folgt fur fast alle n ∈ N: an > 0, also Θ1(an) = 1, und somit Θ1(an) → Θ1(x0) = 1.Der Fall x0 < 0 ist analog.
(d) Ist p : C −→ C, x 7→∑dk=0 bkx
k eine polynomiale Funktion, so ist p in jedem x0 ∈ Rfolgenstetig. Es gelte limn→∞ an = x0. Dann
limn→∞
p(an) =
d∑k=0
limn→∞
bk(an)k =
d∑k=0
bk( limn→∞
an)k = p(x0).
Dies folgt direkt aus Proposition 1.10 in Kapitel 3.(e) Realteil Re : C → C, Imaginarteil Im : C → C und Konjugation C → C, z 7→ z sind
folgenstetig.(f) Die Funktion f aus Beispiel 3.9 in Kapitel 3 ist in 0 nicht folgenstetig. Denn fur an := 1
n gilt:
f(an) > 2, f(0) = f(lim an) = 1; deswegen kann f(an) nicht gegen f(lim an) konvergieren. 3
Definition 1.5.
(a) Eine Funktion f : D −→ C heißt stetig in x0, falls gilt:
(1.6) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈ D : (|x− x0| < δ =⇒ |f(x)− f(x0)| < ε).
(b) f : D −→ C heißt stetig , wenn f in jedem x0 ∈ D stetig ist.
Bild zur Veranschaulichung der Stetigkeit
LEMMA 1.7. x0 ∈ D ⊂ C, f : D −→ C
f ist folgenstetig in x0 ⇐⇒ f ist stetig in x0.
In anderen Worten: (1.3) ⇐⇒ (1.6).
Beweis.
Zu”=⇒“: Sei f nicht stetig in x0. Dann gilt
∃ε ∈ R>0 : ∀δ ∈ R>0 : ∃x ∈ D : (|x− x0| < δ ∧ |f(x)− f(x0)| ≥ ε).
3Achtung: Diese Aussage ist – so wie sie steht – korrekt. Wir haben noch nicht gezeigt, dass f(an) konvergiert,denn wir wissen noch nicht, ob die Exponentialfunktion stetig in 0 ist. Wir haben aber im obigen Satz auch nichtbehauptet, dass diese Folge konvergiert!
1. STETIGKEIT 119
Wir fixieren solch ein ε ∈ R>0. Fur ein n ∈ N r {0} setzen wir δ := 1/n, und wahlen ein an ∈ Dmit
|an − x0| < 1/n und |f(an)− f(x0)| ≥ ε.Dann konvergiert (an)n∈Nr{0} gegen x0, aber (f(an))n∈Nr{0} konvergiert nicht gegen f(x0).
Zu”⇐=“: Sei f stetig in x0, und (an) sei eine Folge in D, die gegen x0 konvergiert.
Zu zeigen ist: f(an)→ f(x0), d.h.: 4
(1.8) ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0: |f(an)− f(x0)| < ε
Wir fixieren also ein ε ∈ R>0. Wir wahlen ein dazu passendes δ ∈ R>0 wie in (1.6), d.h. es gilt:
(1.9) ∀x ∈ D : (|x− x0| < δ =⇒ |f(x)− f(x0)| < ε).
Wegen an → x0 gibt es ein n0 ∈ N mit
(1.10) ∀n ∈ N≥n0 : |an − x0| < δ
Die Aussagen (1.9) und (1.10) zusammen ergeben
(1.11) ∀n ∈ N≥n0 : |f(an)− f(x0)| < ε
Insgesamt haben wir nun (1.8) verifiziert.
Sprachgebrauch: Wir nennen (1.3) das Folgen-Kriterium fur Stetigkeit und (1.6) das ε-δ-Kriteriumfur Stetigkeit.
LEMMA 1.12. Seien f, g : D −→ C in x0 stetige Funktionen, a, b ∈ C. Dann sind auch diefolgenden Funktionen D −→ C stetig in x0:
(a · f + b · g)(x) := a · f(x) + b · g(x)
(f · g)(x) := f(x) · g(x)
Gilt außerdem 0 6∈ g#(D), dann ist auch(f
g
)(x) :=
f(x)
g(x)
stetig in x0.
Aus Proposition 1.10 in Kapitel 3 folgt obiges Lemma mit dem Folgenkriterium fur Stetigkeit.
LEMMA 1.13. Sei f : D −→ C stetig in x0 ∈ D und sei g : D −→ C stetig in y0 ∈ D. Es gelte
f(x0) = y0 und B(f) = f#(D) ⊂ D. Dann ist g ◦ f : D −→ C ebenfalls stetig in x0.
Beweis. Wir uberprufen das Folgenkriterium. Es gelte fur n → ∞: an → x0. Aus den Vor-aussetzungen folgt zunachst f(an) → f(x0) = y0 und daraus dann g(f(an)) → g(y0), also(g ◦ f)(an)→ (g ◦ f)(x0). Somit ist g ◦ f folgenstetig in x0.
4Bisher hatten wir in der Definition von Konvergenz von Folgen ≤ ε. Es ist aber klar, dass man hier auch < ε
schreiben kann.
120 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Beispiel 1.14. Sei K = C oder K = R. Dann ist die Betragsfunktion
| · | : K → R, z 7→ |z|stetig.
Begrundung: Wir zeigen die Stetigkeit in x0 ∈ K. Fur ε ∈ R>0 wahle δ := ε. Zu zeigen ist
|x− x0| < ε =⇒∣∣|x| − |x0|
∣∣ < ε.
Dies folgt direkt aus Lemma 5.11 (g) in Kapitel 2.
UBUNG 1.15 (Ubungsblatt 11, 2. Aufgabe). Sei D ⊂ C, x0 ∈ D und f : D → C eine Funktion,und sei r ∈ R>0 fixiert. Wir definieren Br(x0) := {z ∈ C | |z − x0| < r}. Zeigen Sie: f ist stetig inx0 genau dann, wenn f |D∩Br(x0) stetig in x0 ist.
Wir sagen hierzu: Stetigkeit ist eine lokale Eigenschaft.
2. Zwischenwertsatz
In diesem Abschnitt ist der Definitionsbereich D von f eine Teilmenge von R, f : D −→ R.
SATZ 2.1 (Zwischenwertsatz). Sei f : [a, b] −→ R eine stetige Funktion, und sei f(a) ≤ y ≤ f(b)oder f(a) ≥ y ≥ f(b). Dann gibt es ein c ∈ [a, b] mit f(c) = y.
Wir haben dann also
[f(a), f(b)] ⊂ f#([a, b]) oder [f(b), f(a)] ⊂ f#([a, b])
Bild mit der obigen Funktion f
Beweis. O.B.d.A. f(a) ≤ y ≤ f(b).
Wir definieren rekursiv die Folgen (an) und (bn).
a0 := a, b0 := b.
Seien an−1 und bn−1 definiert. Setze
zn−1 :=an−1 + bn−1
2Wir definieren dann an und bn wie folgt:
• Im Fall f(zn−1) ≤ y setzen wir an := zn−1 und bn := bn−1.• Im Fall f(zn−1) > y setzen wir an := an−1 und bn := zn−1.
Die Folge (an) ist monoton wachsend und beschrankt. Also existiert c := limn→∞ an. Da bn−an =(b− a)/2n → 0 haben wir auch c = limn→∞ bn. Mit der Folgenstetigkeit von f in c sehen wir:
f(c) = limn→∞
f(an) ≤ y und f(c) = limn→∞
f(bn) ≥ y.Mi 16.1.
2. ZWISCHENWERTSATZ 121
Beispiel 2.2. Die Funktion f : [−1, 2]→ R, f(x) = x2 ist stetig. Es gilt
[f(−1), f(2)] = [1, 4] ( [0, 4] = f#([−1, 2]).
Beispiel 2.3. Sei a ∈ R>0 und n ∈ N≥2. Betrachte die stetige Funktion f : R −→ R, x 7→ xn − a.Es gilt f(0) = −a < 0 und
f(a+ 1) =
n∑j=0
(nj
)aj
− a ≥ (n− 1)a+ 1 > 0.
Also besitzt f eine Nullstelle im Intervall [0, a + 1]. Dies ist ein alternativer Beweis der Existenzvon n
√a.
KOROLLAR 2.4. Sei I ⊂ R ein Intervall und f : I −→ R stetig. Dann ist f#(I) ebenfalls einIntervall.
Beachte: Intervalle konnen hier offen, halboffen oder abgeschlossen sein! Sie konnen beschranktoder unbeschrankt sein!
Voruberlegung: Eine Teilmenge J von R ist genau dann ein Intervall, wenn gilt:
∀u, v ∈ J : u ≤ v =⇒ [u, v] ⊂ J
Beweis. Seien u, v ∈ f#(I). Wir schreiben u = f(a), v = f(b), a, b ∈ I. O.B.d.A. a ≤ b. Nach demZwischenwertsatz gilt
[u, v] = [f(a), f(b)] ⊂ f#([a, b]) ⊂ f#(I).
Also ist f#(I) ein Intervall.
Beispiel 2.5. Die Funktion f : (−1, 2] → R, f(x) = x2 ist stetig. f#((−1, 2]) = [0, 4]. Die Bilderhalboffener Intervalle konnen also abgeschlossen sein.
Beispiel 2.6. f : (−1, 1) −→ R x 7→ x2. Dann ist f#((−1, 1)) = B(f) = [0, 1). Wir haben hier ein
Intervall erhalten. Das Bild-Intervall ist nicht mehr offen, sondern nur noch halb-offen. AhnlicheBeispiele zeigen: die Bilder offener Intervalle konnen abgeschlossen sein.
SATZ 2.7. Sei I ⊂ R ein Intervall, und f : I −→ R eine streng monotone, stetige Funktion,J := f#(I). Dann ist f−1 : J −→ I wohldefiniert und stetig.
Beweis. Da f : I −→ J eine bijektive Funktion ist, ist die Umkehrfunktion f−1 : J −→ Iwohldefiniert.
Graph einer stetigen streng monotonen Funktion f : I → J
Wir zeigen nun die Stetigkeit von f−1 in einem beliebigen y0 ∈ J . O.B.d.A. sei f streng monotonwachsend.5 Zu zeigen ist:
∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀y ∈ J : (|y − y0| < δ =⇒ |f−1(y)− f−1(y0)| < ε).
5Dies bedeutet: Wir betrachten nur den Fall, dass f streng monoton wachsend ist. Der Fall, dass f strengmonoton fallend ist, folgt dann durch Vorzeichenwechsel.
122 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Setze x0 := f−1(y0).
1. Fall: inf J < y0 < sup J . Dies ist aquivalent zu inf I < x0 < sup I. In Worten anschaulich: y0
liegt nicht am Rand des Intervalls J .
Sei ε ∈ R>0 gegeben. Setze
ε := min{ε, (x0 − inf I)/2, (sup I − x0)/2} > 0
Dann inf I < x0− ε < x0 < x0 + ε < sup I. Setze y± := f(x0± ε) und δ := min{(y+−y0), (y0−y−)}.Also
y− ≤ y0 − δ < y0 < y0 + δ ≤ y+.
Da f−1 ebenfalls streng monoton wachsend ist, gilt fur alle y ∈ (y0 − δ, y0 + δ):6
x0 − ε ≤ x0 − ε = f−1(y−) ≤ f−1(y0 − δ)
≤ f−1(y) ≤ f−1(y0 + δ) ≤ f−1(y+) = x0 + ε ≤ x0 + ε .
Also
|f−1(y)− f−1(y0)| = |f−1(y)− x0| ≤ ε.
2. Fall: inf J = y0 oder sup J = y0. Anschaulich: y0 ist am Rand des Intervalls J .
Geht ganz ahnlich. Man muss dabei nur eine der Seiten weglassen.
Beispiele 2.8. Die folgenden Funktionen sind streng monoton, stetig und surjektiv und habendeswegen eine stetige Umkehrabbildung:
f : R −→ R, f(x) := x3 + x
f : R −→ R, f(x) = x2n+1, n ∈ N
f : R≥0 −→ R≥0, f(x) = xn, n ∈ Nr {0}
Also sind die Wurzelfunktionen n√
: R≥0 −→ R≥0 und 2n+1√
: R −→ R stetig.
3. Stetigkeit von exp, cos und sin und Definition von log
LEMMA 3.1. Sei∑∞j=1 aj eine absolut konvergierende Reihe, aj ∈ C. Dann gilt∣∣∣ ∞∑
j=1
aj
∣∣∣ ≤ ∞∑j=1
|aj |.
6Das heißt: fur alle y ∈ J mit y0 − δ < y < y0 + δ
3. STETIGKEIT VON exp, cos UND sin UND DEFINITION VON log 123
Beweis. ∣∣∣ ∞∑j=1
aj
∣∣∣ Bsp. 1.14= lim
n→∞
∣∣∣ n∑j=1
aj
∣∣∣Dreiecks-
Ungl.
≤ limn→∞
n∑j=1
∣∣aj∣∣ def=
∞∑j=1
∣∣aj∣∣SATZ 3.2. Die komplexe Exponentialfunktion exp : C→ C ist stetig.
Beweis. Wir zeigen zunachst die Stetigkeit in 0. Dazu rechnen wir fur x ∈ C mit |z| ≤ 12 :
| exp z − exp 0| = | exp z − 1| =∣∣∣ ∞∑j=1
1
j!zj∣∣∣
Lem. 3.1≤
∞∑j=1
∣∣∣ 1
j!zj∣∣∣ ≤ ∞∑
j=1
∣∣∣zj∣∣∣ =
∞∑j=1
|z| |z|j−1
≤ |z|∞∑k=0
|z|k ≤ |z|∞∑k=0
∣∣∣∣12∣∣∣∣k︸ ︷︷ ︸
=2
= 2 |z|.
Fur gegebenes ε ∈ R>0 setze nun δ := min{ 12 ,
ε2}. Dann gilt
|z − 0| < δ =⇒ | exp z − exp 0| < ε.
Also ist exp : C→ C in 0 stetig.
Ist f : C → C in 0 stetig, dann auch af : z 7→ a · f(z) fur a ∈ C. Wir setzen f := exp unda := exp z0. Somit ist
g : C→ C, z 7→ g(z) := (exp z0) · (exp z) = exp(z + z0)
stetig in 0. Da h : C→ C, h(z) := z − z0 stetig ist, folgt mit Lemma 1.13 die Stetigkeit von g ◦ hin z0. Offensichtlich exp = g ◦ h.
Es folgt daraus, dass auch die folgenden Funktionen C→ C stetig sind:
z 7→ exp(iz), z 7→ exp(−iz)
z 7→ cos z =exp iz + exp(−iz)
2
z 7→ sin z =exp iz − exp(−iz)
2i
Durch Einschrankung auf R folgt auch, dass exp : R → R, cos : R → R und sin : R → R stetigsind. Aufgrund des Zwischenwertsatzes ist exp(R) ein Intervall. Wegen limn→∞ expn = ∞ undlimn→∞ exp(−n) = 0 folgt exp#(R) = R>0.
124 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
KOROLLAR 3.3. Die reelle Exponentialfunktion exp : R −→ R>0 ist streng monoton, stetig undbijektiv.
Definition 3.4. Die Umkehrfunktion von exp : R −→ R>0 nennt man den (naturlichen)7 Loga-rithmus log : R>0 −→ R.
Wegen Satz 2.7 des aktuellen Kapitels 4 ist der Logarithmus stetig. Die Funktionalgleichung derExponentialfunktion, siehe Satz 3.1 in Kapitel 3 ubersetzt sich nun in die Funktionalgleichung derLogarithmusfunktion:
∀r, s ∈ R>0 : log(rs) = log r + log s.
log 1 = 0, log e = 1
LEMMA 3.5. Sei r ∈ R>0 und z ∈ C. Es gilt
rz = exp(z log r)
in den folgenden Fallen.
(1) r = e und z ∈ C(2) r ∈ R>0 und z ∈ Q
Fur alle anderen Kombination von r ∈ R>0 und z ∈ C wurde rz noch gar nicht definiert.8
Beweis.(1) folgt direkt aus Definition 3.4 in Kapitel 3.(2) Die Aussage ist klar fur z = 1. Dann folgt (2) ganz analog wie Lemma 3.3 in Kapitel 3.
Definition 3.6. Fur r ∈ R>0 und z ∈ C definiert man nun
rz := exp(z log r)
Auf Grund des obigen Lemmas verallgemeinert dies also bisherige Definitionen von rz in den beidenobigen Fallen.
rz+w = rzrw (rs)z = rzsz
log rs = log exp(s log r) = s log r
fur r, s ∈ R>0, z, w ∈ C. Es gilt auch(rs)t = rst
fur r ∈ R>0 und s, t ∈ R.
7In der Mathematik wird der naturliche Logarithmus fast immer mit log bezeichnet. In technischen und vielenalltaglichen Bereichen wird der naturliche Logarithhmus mit dem Symbol ln bezeichnet und das Symbol log wird
dann – anders als in unserer Vorlesung – fur den Zehner-Logarithmus, also den Logarithmus zur Basis 10 genutzt.
Im Mathematik-Studium wird aber nur der naturliche Logarithmus eine Rolle spielen. Deswegen wird der Zehner-Logarithmus hier weder definiert, noch mit einem Symbol versehen.
8Wir haben auch schon (−1)3 und (1 + i)−2 definiert, aber es interessieren uns derzeit nur r ∈ R>0.
4. DIE KREIZAHL π UND PERIODIZITAT VON cos UND sin. 125
4. Die Kreizahl π und Periodizitat von cos und sin.
cosx =
∞∑n=0
(−1)n1
(2n)!x2n︸ ︷︷ ︸
an
Fur x ∈ (0, 2] und n ≥ 1 gilt an > 0 und
an+1
an=
x2
(2n+ 1)(2n+ 2)≤ 1.
Also
cosx = a0 − a1 + (a2 − a3)︸ ︷︷ ︸≥0
+ (a4 − a5)︸ ︷︷ ︸≥0
. . . ≥ a0 − a1 = 1− x2
2
cosx = a0 − a1 + a2 + (−a3 + a4)︸ ︷︷ ︸≤0
+ (−a5 + a6)︸ ︷︷ ︸≤0
. . . ≤ a0 − a1 + a2 = 1− x2
2+x4
24
Also fur x ∈ [0, 2]
1− x2
2 ≤ cosx ≤ 1− x2
2 + x4
24
Ganz ahnlich fur 0 ≤ x ≤ 4
x− x3
6 ≤ sinx ≤ x.
cos 0 = 1, cos 2 ≤ 1− 2 +2
3= −1
3< 0.
Aus dem Zwischenwertsatz folgt:
A := {x ∈ [0, 2] | cosx = 0} 6= ∅.
Setze α := inf A. Zu jedem n ∈ N wahle ein xn ∈ A mit xn ≤ α+ 1n . Dann gilt xn → α fur n→∞
und
cosα = cos( limn→∞
xn) = limn→∞
cosxn︸ ︷︷ ︸0
= 0.
π := 2α ∈ [0, 4].
Definition 4.1. Die Kreiszahl π ist definiert als das Doppelte der ersten positiven Nullstelle derreellen Kosinusfunktion.
126 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
π = 3, 14159265...
Es folgt aus den bisher bewiesenen Eigenschaften in Abschnitt 3.2 in Kapitel 3 nun durch einfacheRechnung:
• sinπ/2 = 1, da sinπ/2 ≥ π2
(1−
(π2
)2/6)> 0 und sin2 α+ cos2 α = 1,
• sin(x+ (π/2)) = cosx, cos(x+ (π/2)) = − sinx, (Additionstheoreme)• cos(2π + x) = − cos(π + x) = cosx, sin(2π + x) = − sin(π + x) = sinx,• e2πi = cos 2π + i sin 2π = 1
Aus
cosx− cos y = cos
(x− y
2+x+ y
2
)− cos
(y − x
2+x+ y
2
)= cos
x− y2
cosx+ y
2− sin
x− y2
sinx+ y
2− cos
y − x2
cosx+ y
2+ sin
y − x2
sinx+ y
2
= 2 siny − x
2sin
x+ y
2
folgt cosx > cos y fur 0 ≤ x < y ≤ 2.
−2 −1 1 2 3 4 5 6 7
−1
1
x
cos(x) und sin(x)
Abbildung 6: Die Graphen von cos und sinFr 18.1.
5. Metrische Raume und Grundbegriffe der Topologie
Der Begriff der”Stetigkeit“ gehort zum mathematischen Teilgebiet mit dem Namen
”Topologie“,
so wie der Begriff”lineare Abbildungen“ zum Teilgebiet
”Lineare Algebra“ gehort. Im Laufe Ihres
Studiums werden Sie immer wieder von stetigen Abbildungen horen, und die topologischen Begriffewerden dann immer wichtiger.
Dies betrifft zum einen die Mathematiker unter Ihnen, und zwar sowohl diejenigen die sich an ReinerMathematik orientieren (Topologische Raume sind da fast schon omniprasent), als auch diejenigen,die sich an Angewandter Mathematik orientieren (Beschreibung von Flachen im Raum, Mannigfal-tigkeiten, partielle Differentialgleichung, Modellierung von physikalischen Systemen). Und es trifftauch auf Physiker zu. Zum Beispiel benotigt eine prazise Formulierung selbst einfacher quanten-mechanischer Systeme wie dem Wasserstoff-Atom solche topologischen Grundbegriffe (Energie-,
5. METRISCHE RAUME UND GRUNDBEGRIFFE DER TOPOLOGIE 127
Orts-, Impulsoperatoren sind”dicht definierte“
”unstetige“
”abgeschlossene“ Operatoren)9 und die
zugrundeliegenden Raume der klassischen Mechanik, der Allgemeinen Relativitatstheorie und derElektrodynamik sind Mannigfaltigkeiten und damit mit einer Topologie versehen. Naturlich trifftvieles davon auch auf Computational Science und Nanoscience zu.
In diesem Abschnitt lernen wir nun einige Grundbegriffe der Topologie kennen: Stetigkeit in einemetwas allgemeineren Sinn, offene Mengen, abgeschlossene Mengen, Haufungspunkte und Umge-bungen. Diese Begriffe werden (in noch allgemeinerer Form) Ihnen haufig im Studium begegnen.Wir wollen aber noch nicht das zentrale Objekt der Topologie, namlich
”topologische Raume“
einfuhren, sondern uns zunachst auf metrische Raume spezialisieren.
Definition 5.1. Ein metrischer Raum ist ein Paar (M,d), wobei M eine Menge ist und d :M ×M −→ R≥0 eine Abbildung ist mit folgenden Eigenschaften, die fur alle x, y, z ∈ M geltensollen:
(a) d(x, y) = 0 ⇐⇒ x = y (Definitheit)(b) d(x, y) = d(y, x) (Symmetrie)(c) d(x, y) ≤ d(x, z) + d(z, y) (Dreiecks-Ungleichung)
Man nennt d eine Metrik auf M .
Beispiele 5.2.
(1) Sei M ⊂ R oder M ⊂ C. Fur z, w ∈M definieren wir
d(z, w) := |z − w| =√
(Re (z − w))2 + (Im (z − w))2.
(2) Sei M ⊂ Rn. Zu x = (x1, x2, . . . , xn) ∈ M ⊂ Rn und y = (y1, y2, . . . , yn) ∈ M ⊂ Rndefinieren wir den euklidischen Abstand als
deukl(x, y) := ‖x− y‖ =√
(x1 − y1)2 + (x2 − y2)2 + · · ·+ (xn − yn)2.
In beiden Beispielen sind (a) und (b) klar. Fur (1) wurde (c) schon diskutiert. Die Ungleichung (c)fur (2) wird in der Linearen Algebra I (und dem Kurs
”Mathematische Methoden“ fur Physiker)
gezeigt.
Beispiel 5.3. Ist (M,d) ein metrischer Raum und N ⊂ M . Dann ist (N, d|N×N ) ebenfalls einmetrischer Raum. Wir nennen dN×N die von (M,d) auf N induzierte Metrik .
Schreibweise: Sei f : M −→ M eine Abbildung und sind (M,d) und (M, d) metrische Raume, dann
schreiben wir hierfur oft f : (M,d) −→ (M, d).
Ist eine Abbildung f : (M,d) −→ (M, d) bijektiv und gilt fur alle x, y ∈M : d(x, y) = d(f(x), f(y)),dann nennt man die Abbildung eine Isometrie. Man sieht sofort, dass (x, y) 7→ x+iy eine Isometrievon (R2, deukl) nach (C, d) ist, wobei d die Metrik im obigen Beispiel ist. Da wir oft R2 mitCidentifizieren, schreiben wir ebenfalls deukl fur diese Metrik auf C.
9Es ist derzeit nicht wichtig, dass Sie diese Begriffe kennen, wichtig ist: es sind Begriffe der Topologie.
128 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Definition 5.4 (ε-δ-Kriterium fur Stetigkeit fur Abbildungen zwischen metrischen Raumen). f :
(M,d) −→ (M, d) ist stetig in x0 ∈M , falls gilt:
(5.5) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈M : (d(x, x0) < δ =⇒ d(f(x), f(x0)) < ε).
f stetig ⇐⇒ f stetig in allen x0 ∈M .
Im Fall M ⊂ C, d(z, w) = |z−w| stimmt diese Definition offensichtlich mit Definition 1.5 uberein.
Definition 5.6. Sei (M,d) ein metrischer Raum, x ∈M , r ∈ R>0. Der (offene) Ball von Radius rum x in (M,d) ist die Menge
Br(x) := {y ∈M | d(y, x) < r}.Eine Teilmenge U ⊂ M heißt Umgebung von x in (M,d), falls es ein r ∈ R>0 gibt, so dassBr(x) ⊂ U .
Definition 5.7. Eine Teilmenge O von M heißt offen in (M,d), wenn fur jeden Punkt x ∈ Ogilt, dass O eine Umgebung von x in (M,d) ist. Eine Teilmenge A von M heißt abgeschlossen in(M,d), falls M rA offen ist.
Beispiele 5.8.
(a) Die leere Menge und M sind offen in (M,d). Diese beiden Mengen sind auch abgeschlossen.(b) O ⊂ R2 ∼= C
Bild einer offenen Menge O in R2, darin ein x und ein geeigneter Ball Br(x).
(c) Alle offenen Intervalle in R sind offen in (R, deukl). Alle abgeschlossenen Intervalle in R sindabgeschlossen in (R, deukl).
(d) Die Menge (0, 1)× (0, 1) ist offen in (R2, deukl)(e) Fur alle r ∈ R>0 und alle x ∈M ist Br(x) eine offene Teilmenge von (M,d). Begrundung: Sei
y ∈ Br(x), ρ := d(x, y). Dann gilt Br−ρ(y) ⊂ Br(x) (Dreiecks-Ungleichung).
Zeichnung von Br−ρ(y) ⊂ Br(x) in R2.
(f) Ist U Umgebung von x und U ⊂ V ⊂M , dann ist V ebenfalls Umgebung von x.
LEMMA 5.9. Sei x ∈ M und U ⊂ M . Dann ist U eine Umgebung von x, genau dann wenn esein O ⊂M gibt, das
• in (M,d) offen ist, und• so dass x ∈ O ⊂ U .
Solch ein O ist also eine offene Umgebung von x.
Beweis.
”=⇒“: klar, da offene Balle offen sind.
”⇐=“: Wenn O offen ist und x ∈ O, dann ist O eine Umgebung von x. Aus O ⊂ U ergibt sich,
dass U Umgebung von x ist.
5. METRISCHE RAUME UND GRUNDBEGRIFFE DER TOPOLOGIE 129
PROPOSITION 5.10.
(a) Sei x ∈ M und seien U1 und U2 Umgebungen von x in (M,d). Dann ist auch U1 ∩ U2 eineUmgebung von x.
(b) Sind O1 und O2 offene Teilmengen von (M,d), so ist O1 ∩O2 offen.(c) Sei (Oj)j∈I eine Familie offener Teilmengen von (M,d), dann ist auch⋃
j∈IOj
eine offene Teilmenge.
Beweis.Zu (a): Da U1 und U2 Umgebungen von x sind, gibt es r1, r2 ∈ R>0 mit Br1(x) ⊂ U1 undBr2(x) ⊂ U2. Fur r := min{r1, r2} gilt Br(x) ⊂ U1 ∩ U2.
Zu (b): Gegeben sei ein x ∈ O1 ∩ O2 ist. Da O1 und O2 offen sind, sind sie Umgebungen von x.Aus (a) folgt, dass O1 ∩ O2 ebenfalls Umgebung von x ist. Da dies fur jedes x ∈ O1 ∩ O2 gilt, istO1 ∩O2 offen.
Zu (c): Sei x ∈⋃j∈I Oj . Fixiere ein k ∈ I mit x ∈ Ok. Da Ok offen ist, ist Ok eine Umgebung von x
in (M,d), und damit auch⋃j∈I Oj ⊃ Ok. Also ist
⋃j∈I Oj eine Umgebung von jedem x ∈
⋃j∈I Oj ,
also offen.
!ACHTUNG!.
• Fur n ∈ Nr {0} ist (−1/n, 1/n) offen in R, aber nicht offen in C.• Proposition 5.10 besagt: endliche Durchschnitte offener Mengen sind offen und beliebi-
ge (also auch unendliche!) Vereiningung offener Mengen sind auch wieder offen. Aller-dings ist ein unendlicher Durchschnitt offener Mengen im allgemeinen nicht mehr offen:⋂n∈N(−1/n, 1/n) = {0} ist nicht offen!
•”Abgeschlossen“ ist nicht das Gegenteil zu
”offen“.
PROPOSITION 5.11 (Umgebungskriterium fur Stetigkeit). Gegeben sei eine Abbildung f : (M,d) −→(M, d) und ein x0 ∈M . Diese Abbildung ist stetig in x0 genau dann, wenn gilt:
fur alle Umgebungen U von f(x0) in (M, d) gilt: f#(U) ist eine Umgebung von x0 in (M,d).
Beweis. Die umrahmte Aussage ist eine Umformulierung des ε-δ-Kriteriums unter Nutzung desoben definierten Begriffs
”Umgebung“.
Kurz kann man hierfur sagen: Urbilder von Umgebungen sind Umgebungen.
PROPOSITION 5.12. Eine Funktion f : (M,d) −→ (M, d) ist genau dann stetig, wenn fur alle
offenen Teilmengen O von (M, d) gilt: f#(O) ist offen in (M,d).
Kurz kann man hierfur sagen: Urbilder offener Mengen sind offen.
130 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Beweis. Folgt direkt aus dem Umgebungskriterium fur Stetigkeit (Proposition 5.11).
Definition 5.13. Eine Folge (an)n∈N konvergiert in (M,d) gegen x0 ∈ M , falls fur jede Umge-bung U von x0 gilt:
∃n0 ∈ N : ∀n ∈ N≥n0: an ∈ U.
Die ist aquivalent zu
∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N :(n ≥ n0 =⇒ d(an, x0) < ε
),
und dies stimmt mit Definition 1.4 uberein, falls d(an, x0) = |an − x0|. Die Folge konvergiertin (M,d), wenn es in M solch ein x0 gibt.
Diese Definition verallgemeinert die Konvergenz von Folgen in R und C. Man definiert limn→∞und die Folgenstetigkeit gleich wie zuvor. Folgenstetigkeit und Stetigkeit sind wieder aquivalenteEigenschaften. Um dies zu beweisen, ersetze man im Beweis von Lemma 1.7 |x − x0| < δ durchd(x, x0) < δ und so weiter.Mi 23.1.
Bemerkung 5.14. R := R∪{−∞,∞}. In der Diskussion vor Proposition 1.30 in Kapitel 3 habenwir eine bijektive Abbildung ϕ : [−1, 1] −→ R definiert,
ϕ(x) =
1
1−x −1
1+x fur x ∈ (−1, 1)
∞ fur x = 1
−∞ fur x = −1
Graph der Funktion ϕ.
Wir versehen nun R mit der Metrik
dR(x, y) :=∣∣ϕ−1(x)− ϕ−1(y)
∣∣ .Dann ist (R, dR) ein metrischer Raum. Fur eine reell-wertige Folge (an)n∈N und ein a ∈ R gilt
Fur im klassischen Sinn im Sinn metrischer Raume
a ∈ R limn→∞ an = aim eigentlichen Sinn
⇐⇒ limn→∞ an = aim metrischen Raum (R, dR)
a = ±∞ limn→∞ an = aim uneigentlichen Sinn
⇐⇒ limn→∞ an = aim metrischen Raum (R, dR)
Proposition 1.30 aus Kapitel 3, folgt nun unmittelbar.
!ACHTUNG!. Wir wiederholen nochmals erlaubte und unerlaubte Sprechweisen klaren an Handdes Beispiels an := n2.Erlaubt: (an)n∈N konvergiert uneigentlich gegen ∞.
(an)n∈N konvergiert in (R, dR) gegen ∞.Nicht erlaubt: (an)n∈N konvergiert.
5. METRISCHE RAUME UND GRUNDBEGRIFFE DER TOPOLOGIE 131
Schreibweise: Wenn aus dem Kontext heraus klar ist, welche Metrik gemeint ist, dann schreibt manoft einfach M statt (M,d). Teilmengen X ⊂ M tragen die induzierte Metrik d|X×X , wenn nichtsanderes angegeben.
Definition 5.15. Sei X Teilmenge eines metrischen Raums (M,d). Wir nennen x0 ∈ M einenHaufungspunkt von X in (M,d), falls jede Umgebung von x0 unendlich viele Punkte von X enthalt.
Beispiele 5.16.
(a) Endliche Mengen haben keine Haufungspunkte.(b) Die Mengen N und Z haben keine Haufungspunkte in R und C.(c) Die Menge aller Haufungspunkte von Q in C ist R.(d) Seien a, b ∈ R, a < b. Die Menge aller Haufungspunkte von (a, b) in R (oder in C) ist die Menge
[a, b].
LEMMA 5.17. Sei X Teilmenge eines metrischen Raums (M,d), und sei y ∈M . Aquivalent sinddann die folgenden Aussagen:
(1) y ist Haufungspunkt von X
(2) Fur jede Umgebung U von y gilt U ∩X r {y} 6= ∅(3) Es gibt eine Folge (an) in X r {y} mit limn→∞ an = y
(4) Es gibt eine Folge in X r {y}, so dass y Haufungspunkt dieser Folge ist.
Beweis.
”(1)=⇒(2)“: klar.
”(2)=⇒(3)“: B1/n(y) ∩X besitzt ein Element an 6= y. Dann d(an, y) ≤ 1/n→ 0.
”(3)=⇒(1)“: Sei (an)n∈N eine Folge wie in (2), und U eine Umgebung von y. Es gibt ein n0 ∈ N,
so dass ∀n ∈ N≥n0: an ∈ U . Wenn P := {d(an, y) | n ∈ N≥n0
} nur endlich viele Elementeenthalt, dann ist inf{d(an, y) | n ∈ N} > 0. Widerspruch. Somit hat P unendlich viele Elementeund deswegen auch U ∩X.
”(3)⇐⇒(4)“: siehe Definition 1.22 in Kapitel 3.
!ACHTUNG!. Die Definitionen von”Haufungspunkt einer Menge“ (siehe oben) und
”Haufungs-
punkt einer Folge“ (Definition 1.22 in Kapitel 3) sind zwar verwandt, aber doch verschieden, wiedas folgende Beispiel zeigt. Die reell-wertige Folge (an)n∈N mit an := 1 hat den Haufungspunkt 1,aber die Menge {an | n ∈ N} hat keine Haufungspunkte.
Bemerkung 5.18 (Aufgabe 4 auf Blatt 12). Eine Teilmenge eines metrischen Raumes (M,d) istabgeschlossen, genau dann wenn sie alle ihre Haufungspunkte enthalt.
Definition 5.19. Wir nennen einen metrischen Raum (M,d) folgenkompakt , wenn jede Folge inM eine in (M,d) konvergente Teilfolge besitzt. Eine Teilmenge X ⊂M nennt man folgenkompakt,wenn (X, d|X×X) folgenkompakt ist.10.
10Achtung: Der Grenzwert muss dann in X liegen!
132 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
LEMMA 5.20. Folgenkompakte Teilmengen eines metrischen Raumes sind abgeschlossen.
Beweis. Sei X eine folgenkompakte Teilmenge von (M,d) und y ein Haufungspunkt von X. Danngibt es eine Folge (an)n∈N in X mit limn→∞ an = y. Da X folgenkompakt ist, gibt es eine Teilfolge(af(k))k∈N in X, f : N→ N streng monoton wachsend, mit z := limk→∞ af(k) ∈ X. Diese Teilfolgekonvergiert auch in M , also haben wir y = z. Somit enthalt X jeden Haufungspunkt und ist somitabgeschlossen (Bemerkung 5.18).
Beispiel 5.21. Sei I ein Interval mit der von deukl induzierten Metrik. Dann ist I folgenkompaktgenau dann, wenn I abgeschlossen und beschrankt ist. Denn:
• Ist I folgenkompakt, dann ist I abgeschlossen in (R, deukl) aufgrund des obigen Lemmas.• Ist I folgenkompakt, dann ist I beschrankt. Denn wenn I nicht nach oben (bzw. unten)
beschrankt ist, dann gibt es eine Folge, die uneigentlich gegen +∞ (bzw. −∞) konvergiert.Diese Folge hat keine konvergente Teilfolge. 11
• Ist I beschrankt, dann besitzt jede Folge in I aufgrund des Satzes von Bolzano-Weierstraß(Satz 1.35 in Kapitel 3) einen Haufungspunkt, also eine in R konvergente Teilfolge. Ist Izusatzlich abgeschlossen, dann ist der Grenzwert in I. Somit ist I folgenkompakt.
SATZ 5.22. Seien (M,d) und (M, d) metrische Raume. Ist (M,d) folgenkompakt und f : (M,d)→(M, d) stetig, dann ist B := f#(M) mit der Metrik d|B×B ebenfalls folgenkompakt.
Beweis. Sei (yn)n∈N eine Folge in f#(M). Wahle xn ∈ M mit f(xn) = yn und danach einekonvergente Teilfolge (xh(k))k∈N, h : N→ N streng monoton wachsend. Dann gilt
limk→∞
yh(k) = limk→∞
f(xh(k)) = f(
limk→∞
xh(k)︸ ︷︷ ︸∈M
)∈ f#(M).
Also ist f#(M) folgenkompakt.
FOLGERUNG 5.23. Seien a, b ∈ R, a ≤ b und f : [a, b] → R stetig. Dann ist f#([a, b]) einabgeschlossenes beschranktes Intervall. Es existieren also x1, x2 ∈ [a, b] mit
∀x ∈ [a, b] : f(x1) ≤ f(x) ≤ f(x2).
Die Folgerung folgt direkt aus dem obigen Beispiel und dem obigen Satz.
6. Grenzwerte von Funktionen
LEMMA 6.1. Seien (M,d) und (N, d) metrische Raume, D ⊂M , und x0 ∈M ein Haufungspunktvon D. Zu jeder Abbildung f : D → N gibt es hochstens eine Abbildung F : D∪{x0} → N , so dass
11Alternative Beweise: a) Ubungsblatt 13, Aufgabe 4. Zweiter Beweis: Ist (I, deukl) folgenkompakt,d ann ist
auch (I, dR|I×I) folgenkompakt. Also ist I abgeschlossen in R. Somit sind −∞ und +∞ keine Haufungspunkte von
I in (R, dR), was bedeutet, dass I beschrankt ist.
6. GRENZWERTE VON FUNKTIONEN 133
• F |Dr{x0} = f |Dr{x0}• und so dass F stetig in x0 ist.
Definition 6.2. Wenn solch ein F existiert, so sagen wir der Grenzwert oder Limes
limx→x0
f(s)
existiert. Wir nennen F (x0) den Grenzwert oder Limes von f in x0 und schreiben
limx→x0
f(x) := F (x0).
Bemerkung 6.3. Es sind die Falle x0 ∈ D und x0 6∈ D zugelassen. Im Fall x0 ∈ D muss nichtf(x0) = F (x0) gelten.
Beweis des Lemmas. Wahle eine Folge (an)n∈N in D r {x0} mit an → x0. Wenn ein F wie obenexistiert, dann gilt
F (x0) = F ( limn→∞
an) = limn→∞
F (an) = limn→∞
f(an).
Es gibt also hochstens einen passenden Wert fur F (x0). Auf Dr{x0} ist F sowieso schon bestimmt.Also kann es hochstens eine solche Abbldung F geben.
Definition 6.4. Sei D ⊂ R, und sei x0 ∈ R ein Haufungspunkt von D ∩ [x0,∞). Dann definiertman den rechtsseitigen Grenzwert/Limes als
limx↘x0
f(x) := limx→x0
(f |D∩[x0,∞)).
Wenn wir [x0,∞) durch (−∞, x0] ersetzen, erhalten wir die Definition des linksseitigen Grenz-werts/Limes
limx↗x0
f(x).
Fur x0 ∈ D ⊂ R, x0 Haufungspunkt von D ∩ [x0,∞) und D ∩ (−∞, x0]:
f : D → R ist stetig in x0
⇐⇒ limx→x0
f(x) existiert und limx→x0
f(x) = f(x0)
⇐⇒ limx↘x0
f(x) und limx↗x0
f(x) existieren und limx↘x0
f(x) = limx↗x0
f(x) = f(x0)
Beispiel 6.5. Definiere f : R −→ R.
f(x) :=
1 fur x > 0
0 fur x = 0
−1 fur x < 0
limx→0 f(x) existiert nicht. Hingegen existieren limx↘0 f(x) = 1 und limx↗0 f(x) = −1.
134 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Bemerkung 6.6. Wir versehen N ∪ {∞} mit der Metrik12
dinv(x, y) =
∣∣∣∣ 1
x+ 1− 1
y + 1
∣∣∣∣ ,wobei wir in diesem13 Zusammenhang 1
∞ := 0 setzen. Dieses dinv ist eine Metrik auf N∪ {∞}. Sei(an) eine Folge in (M,d), und sei f : N −→M die Abbildung mit f(n) = an. Dann gilt
limn→∞
an = a im Sinne von Kap. 2 ⇐⇒ limn→∞
f(n) = a im Sinne des aktuellen Abschnitts
12Die folgende Metrik ist nur ein Beispiel einer Metrik, die verwendet werden kann. Die Einchranung von dRauf (N ∪ {∞})× (N ∪ {∞}) ist zum Beispiel ebenfalls eine Metrik, fur die die folgenden Aussagen richtig sind.
13Wenn wir es brauchen, wird 1∞ jedesmal neu definiert, denn man kann diese Definition nicht so machen,
dass alle ulichen Rechenregeln gelten. Man kommt dann immer wieder zu Fragen wie: 10
= ∞ oder 10
= −∞. Ist∞−∞ = 0 oder ∞−∞ = 17?
”Beweis“ der letzten Aussage: ∞+ 17 =∞. Lose diese Gleichung nach 17 auf. Beim
Rechnen mit ∞ funktioniert eben alles mogliche nicht mehr richtig.
KAPITEL 5
Differential-Rechnung fur Funktionen einer Veranderlichen
1. Definition und elementare Eigenschaften
Ab sofort nutzen wir ε > 0 oft im Sinne von ε ∈ R>0, falls aus dem Kontext heraus klar ist,dass ε eine reelle Zahl ist. Wir betrachten in den folgenden Abschnitten nur Funktionen der Formf : D −→ R, D ⊂ R.
Definition 1.1. Sei D ⊂ R offen, x0 ∈ D.1 Eine Funktion f : D −→ R nennt man differenzierbarin x0, wenn der Grenzwert
limx→x0
f(x)− f(x0)
x− x0
existiert. Wenn er existiert, so nennt man
f ′(x0) := limx→x0
f(x)− f(x0)
x− x0
die Ableitung von f an der Stelle x0. Die Funktion f ist differenzierbar, wenn sie in jedem x0 ∈ Ddifferenzierbar ist. Den Quotient
f(x)− f(x0)
x− x0
nennt man den Differenzenquotient .
Graph einer Funktion f mit einem Dreieck, das den Differenzenquotient andeutet.
Interpretation: Die Zahl f ′(x0) gibt an, wie stark der Graph der Funktion an der Stelle (x0, f(x0))ansteigt.
Alternative Bezeichnungen:
f ′(x0) =df
dx(x0) =
∂f
∂x(x0) = Df(x0)
f differenzierbar in x0 ⇐⇒ Die Ableitung von f existiert in x0
⇐⇒ f ′(x0) existiert
1Damit diese Definition sinnvoll ist, reicht hier eigentlich bereits, dass D eine Umgebung von x0, oder sogar
nur, dass x0 ein Haufungspunkt von D ist.
135
136 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Beispiele 1.2.
(1) Konstante Funktionen R→ R, x 7→ a sind differenzierbar und f ′(x0) = 0 fur alle x0 ∈ R.(2) Die Identitat idR : R −→ R, x 7→ x ist differenzierbar und f ′(x0) = 1 fur alle x0 ∈ R.(3) Differenzierbarkeit ist eine lokale Eigenschaft: Ist U eine Umgebung von x0, enthalten in
den Definitionsbereichen von f und f , und gilt f |U = f |U , dann ist f differenzierbar in
x0 genau dann, wenn f in x0 differenzierbar ist. Dann gilt f ′(x0) = f ′(x0).(4) Die Funktion f : Rr {0} → Rr {0}, x 7→ x−1 ist differenzierbar und es gilt
f ′(x0) = − 1
x20
.
Denn:
1x −
1x0
x− x0=
x0 − xxx0(x− x0)
=−1
xx0→ − 1
x20
fur x→ x0
Fr 25.1.
Umformungen:
f ′(x0) existiert
⇐⇒ ∀ε > 0 : ∃δ > 0 : ∀x ∈ D r {x0} :
(|x− x0| < δ =⇒
∣∣∣∣f(x)− f(x0)
x− x0− f ′(x0)
∣∣∣∣ < ε
)⇐⇒ ∀ε > 0 : ∃δ > 0 : ∀x ∈ D :(
|x− x0| < δ =⇒ |f(x)− f(x0)− f ′(x0)(x− x0)| ≤ ε |x− x0|)
Interpretation:Differenzierbarkeit =
”gute“ Approximierbarkeit durch eine lineare Funktion
SATZ 1.3. Seien D und f wie oben. Ist f differenzierbar in x0, so ist f stetig in x0.
Die Umkehrung gilt nicht, siehe Ubungen.
Beweis. Definiere
g(x) :=f(x)− f(x0)
x− x0fur x 6= x0
limx→x0
((x− x0)g(x)) = ( limx→x0
(x− x0))( limx→x0
g(x)) = 0 · f ′(x0) = 0
1. DEFINITION UND ELEMENTARE EIGENSCHAFTEN 137
2
f(x) = f(x0) + (x− x0)g(x) fur x 6= x0
Alsolimx→x0
f(x) = f(x0) + 0 · f ′(x0) = f(x0).
Somit ist f stetig in x0.
REGELN 1.4. Im folgenden sei D offen in R, f, fj , g : D −→ R.
(1) Sind fj differenzierbar in x0, aj ∈ R fur j ∈ {1, 2, . . . , r}, dann gilt r∑j=1
ajfj
′ (x0) =
r∑j=1
ajf′j(x0).
Solche Aussagen sind immer so zu verstehen, dass alle angegebenen Ableitungen in x0
existieren und die obige Gleichung fur die so erhaltenen Zahlen gilt.(2) Produktregel.
Sind f und g differenzierbar in x0, dann gilt
(f · g)′(x0) = f ′(x0)g(x0) + f(x0)g′(x0).
Die Existenz der Ableitung (f · g)′(x0) ist wieder eine implizite Teilaussage der obigenFormelzeile.Begrundung:
(f · g)(x)− (f · g)(x0)
x− x0=f(x)(g(x)− g(x0))
x− x0+
(f(x)− f(x0))g(x0)
x− x0
→ f(x0)g′(x0) + f ′(x0)g(x0)
fur x→ x0.(3) Quotientenregel.
Sind f und g differenzierbar in x0, g(x0) 6= 0, dann gilt(f
g
)′(x0) =
f ′(x0)g(x0)− f(x0)g′(x0)
g(x0)2.
Die Existenz der Ableitung auf der linken Seite ist wieder eine implizite Teilaussage derobigen Formelzeile.Begrundung 1: Ahnlich wie oben, siehe [22].Begrundung 2: Folgt unten aus Kettenregel
2Hier haben wir benutzt: sind g : D −→ R und h : D −→ R Funktionen, x0 ein Haufungspunkt von D und
existieren limx→x0 g(x) und limx→x0 h(x), dann existiert auch limx→x0 (g(x)h(x)) und es gilt
limx→x0
(g(x)h(x)) =
(limx→x0
g(x)
)(limx→x0
h(x)
).
Dies ist eine leichte Ubungsaufgabe. Analoges gilt fur Summen, Differenzen und, falls limx→x0 h(x) 6= 0, auch fur die
Quotientenfuntion x 7→ g(x)/h(x) nach Einschrankung des Definitionsbereichs auf D∩h#(Rr {0}) = Drh#({0}).
138 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
(4) Kettenregel.Sei f : D −→ R, g : E −→ R mit f#(D) ⊂ E. Sei f in x0 ∈ D differenzierbar und sei gin f(x0) differenzierbar. Dann gilt
(g ◦ f)′(x0) = g′(f(x0))f ′(x0).
Die Existenz der Ableitung auf der linken Seite ist wieder eine implizite Teilaussage derobigen Formelzeile.Begrundung: fur y0 := f(x0) Wir rechnen
(g ◦ f)(x)− (g ◦ f)(x0)
x− x0=g(f(x))− g(y0)
f(x)− y0· f(x)− f(x0)
x− x0
Aus
limy→y0
g(y)− g(y0)
y − y0= g′(y0)
und Lemma 1.13 in Kapitel 4 folgt
limx→x0
g(f(x))− g(y0)
f(x)− y0= g′(y0)
Wir erhalten
limx→x0
(g ◦ f)(x)− (g ◦ f)(x0)
x− x0= g′(y0)f ′(x0)
Begrundung der Quotientenregel: Sei h(x) := 1/x. Dann(1
g
)′(x0) = (h ◦ g)′(x0) = − 1
g(x0)2g′(x0)
(f
g
)′(x0) = f ′(x0)
1
g(x0)+ f(x0)
(− 1
g(x0)2g′(x0)
)=f ′(x0)g(x0)− f(x0)g′(x0)
g(x0)2
Bemerkung 1.5. Sei D ⊂ R, f : D −→ R injektiv und stetig.
(1) Ist D ein Intervall, dann ist f streng monoton. Denn angenommen f ist nicht streng monoton,dann gibt es a, b, c ∈ D mit a < b < c und (f(a) < f(b) > f(c) oder f(a) > f(b) < f(c)). Diesergibt mit dem Zwischenwertsatz einen Widerspruch zur Injektivitat.
(2) Ist D offen, dann auch f#(D). Denn sei y ∈ f#(D), dann schreibe y = f(x). Wahle a, b ∈ Dso dass x ∈ (a, b) ⊂ [a, b] ⊂ D. Wegen (1) ist f |[a,b] streng monoton. O.B.d.A. streng monotonwachsend (sonst ersetze x 7→ f(x) durch x 7→ f(−x)). Somit gilt y ∈ (f(a), f(b)) ⊂ f#(D).
(3) Ist D offen und f differenzierbar in x0 ∈ D und f−1 differenzierbar in f(x0), dann gilt
1 = id′D(x0) = (f−1)′(f(x0)) (f ′(x0)).
Also f ′(x0) 6= 0.
1. DEFINITION UND ELEMENTARE EIGENSCHAFTEN 139
PROPOSITION 1.6 (Ableitung der Umkehrfunktion.). Sei D offen, f : D −→ R injektiv undstetig, und sei f differenzierbar in x0 ∈ D, f ′(x0) 6= 0. Dann ist f−1 differenzierbar in y0 := f(x0)und
(f−1)′(y0) =1
f ′(x0).
Beweis. Wahle a, b ∈ D, so dass x0 ∈ (a, b) ⊂ D. Dann ist f |(a,b) streng monoton. y = f(x),y0 = f(x0).
f−1(y)− f−1(y0)
y − y0=
x− x0
f(x)− f(x0)
y→y0−→ 1
f ′(x0),
denn mit y → y0 geht auch x→ x0, da f−1 stetig ist (Satz 2.7 und Lemma 1.13 in Kapitel 4).
Beispiel 1.7.
(1) Wir betrachten exp : R→ R.
exp′(x) = limh→0
exp(x+ h)− exp(x)
(x+ h)− x= limh→0
((expx)
exp(h)− exp(0)
h
)= (expx) lim
h→0
(exph)− 1
h= (expx) lim
h→0
( ∞∑n=1
1
n!hn−1
)(∗)= expx.
Bei (∗) haben wir genutzt, dass wir wegen Lemma 3.1 in Kapitel 4 wissen, dass∣∣∣ ∞∑n=2
1
n!hn−1
∣∣∣ ≤ ∞∑n=2
∣∣ 1
n!hn−1
∣∣ ≤ ∞∑n=2
∣∣hn−1∣∣ =
|h|1− |h|
,
falls |h| < 1 und dies konvergiert gegen 0 fur h→ 0.(2) Aus log = (exp)−1 folgt dann mit Proposition 1.6 fur x ∈ R>0
log′(x) =1
exp(log x)=
1
x.
Beispiel 1.8. Sei f : R>0 −→ R, f(x) = xa, a ∈ Q. Dann gilt
(1.9) f ′(x0) = axa−10 .
Dies zeigt man
• fur a ∈ N mit id′R(x0) = 1 und der Produktregel.• fur a = 1/n, n ∈ N r {0} mit Umkehrfunktion. Sei f(x) = xa = n
√x. Dann f = g−1 mit
g(x) = xn.
f ′(x0) =1
g′(f(x0))=
1
n( n√x0)n−1
= ax(1−n)/n0 = axa−1
0 .
• Dann fur a ∈ Q≥0 mit der Kettenregel xp/q = q√xp.
140 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
• Dann fur a ∈ Q<0 mit der Quotientenregel
Ein anderer Beweis gilt sogar fur alle a ∈ R:3
f(x) = xa = exp(a log x)
f ′(x) = exp′(a log x) · (a log′ x) = exp(a log x) · ax
= xa · ax
= axa−1 ,
und somit (1.9) fur alle a ∈ R.30.1.
2. Lokale Extrema
Definition 2.1. Sei (M,d) ein metrischer Raum, f : M −→ R, x0 ∈ M . Wir sagen f hat einlokales Maximum (bzw. lokales Minimum) in x0, falls es eine Umgebung U von x0 gibt, so dass
∀x ∈ U : f(x) ≤ f(x0) (bzw. f(x) ≥ f(x0)).
lokales Extremum in x0 :⇐⇒ lokales Maximum oder Minimum in x0
SATZ 2.2. Sei D ⊂ R offen, f : D −→ R, f differenzierbar in x0 ∈ D. Wenn f ein lokalesExtremum in x0 besitzt, so gilt f ′(x0) = 0.
Beweis. O.B.d.A. lokales Maximum in x0.
f(x)− f(x0)
x− x0≤ 0 fur x > x0, x ∈ U
Somit f ′(x0) ≤ 0.
f(x)− f(x0)
x− x0≥ 0 fur x < x0, x ∈ U
Somit f ′(x0) ≥ 0.
3. Mittelwertsatze
Wiederholung: (Folgerung 5.23 aus Kapitel 4)
Seien a, b ∈ R, a ≤ b, f : [a, b]→ R stetig. Dann nimmt f ein Maximum und ein Minimum an, d.h.es gibt x1, x2 ∈ [a, b], so dass fur alle x ∈ [a, b]:
f(x1) ≤ f(x) ≤ f(x2).
SATZ 3.1 (Satz von Rolle, benannt nach Michel Rolle, 1652–1719). Sei a < b. Sei f : [a, b] −→ Rdifferenzierbar4 auf (a, b) und stetig auf [a, b] und f(a) = f(b). Dann existiert ein c ∈ (a, b) mitf ′(c) = 0.
3Er gilt sogar fur alle a ∈ C, wenn man obige Definitionen sinngemaß auf Funktionen f : D → C mit D ⊂ Rverallgemeinert.
4Differenzierbar auf A (bzw. stetig auf A) bedeutet differenzierbar (bzw. stetig) in allen x ∈ A.
3. MITTELWERTSATZE 141
Zeichnung zu Satz von Rolle
Beweis. A := [a, b], wahle x1 und x2 wie oben.1. Fall: x1 ∈ {a, b} und x2 ∈ {a, b}. Dann gilt
f(a) = f(b) = max f#([a, b]) = min f#([a, b])
Also f konstant, also f ′(x0) = 0 fur alle x0 ∈ (a, b).2. Fall: x1 ∈ (a, b) oder x2 ∈ (a, b), o.B.d.A. x1 ∈ (a, b). Dann gilt f ′(x1) = 0 wegen Satz 2.2.
SATZ 3.2 (1. Mittelwertsatz). Sei a < b. Sei f : [a, b] −→ R differenzierbar auf (a, b) und stetigauf [a, b]. Dann existiert ein c ∈ (a, b) mit
f(b)− f(a) = (b− a)f ′(c).
Zeichnung zu 1. Mittelwertsatz
Beweis.
F (x) := f(x)− f(b)− f(a)
b− a(x− a)
F (a) = f(a) = F (b). Wende den Satz von Rolle an.
0 = F ′(c) = f ′(c)− f(b)− f(a)
b− a
SATZ 3.3 (2. Mittelwertsatz). Sei a < b. Seien f, g : [a, b] −→ R differenzierbar auf (a, b) undstetig auf [a, b]. Ferner gelte fur alle x ∈ (a, b): g′(x) 6= 0. Dann existiert ein c ∈ (a, b) mit
f(b)− f(a)
g(b)− g(a)=f ′(c)
g′(c).
Beweis. Der Satz von Rolle liefert: g(b) 6= g(a). Definiere
F (x) := f(x)− f(a)− f(b)− f(a)
g(b)− g(a)(g(x)− g(a)).
Also F (a) = F (b) = 0. Nach dem Satz von Rolle gibt es ein c ∈ (a, b) mit
0 = F ′(c) = f ′(c)− f(b)− f(a)
g(b)− g(a)g′(c).
142 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
KOROLLAR 3.4. Sei f : (a, b) −→ R differenzierbar, so gilt:
f ′(x) > 0 fur alle x ∈ (a, b) =⇒ f ist streng monoton wachsend
f ′(x) < 0 fur alle x ∈ (a, b) =⇒ f ist streng monoton fallend
f ′(x) ≥ 0 fur alle x ∈ (a, b)⇐⇒ f ist monoton wachsend
f ′(x) ≤ 0 fur alle x ∈ (a, b)⇐⇒ f ist monoton fallend
f ′(x) = 0 fur alle x ∈ (a, b)⇐⇒ f ist konstant
Beweis. Die =⇒-Pfeile folgen direkt aus dem 1. Mittelwertsatz. Sei nun f monoton wachsend, dann
gilt f ′(x0) = limx→x0
f(x)−f(x0)x−x0
≥ 0. Und analog folgt aus”monoton fallend“ dann f ′(x0) ≤ 0.
Der dritte ⇐⇒-Pfeil folgt aus den beiden ersten.
4. Hohere Ableitungen und Taylorscher Satz
Sei I ⊂ R ein offenes Intervall.
C0(I) := {f : I −→ R | f stetig}Ist f auf I differenzierbar, so erhalten wir f ′ : I −→ R, x 7→ f ′(x).
Falls zusatzlich f ′ stetig ist, so nennen wir f stetig differenzierbar .
Ist f ′ differenzierbar, so nennt man f zweimal differenzierbar.. . . . Ist f ′ k-mal differenzierbar, sosagen wir: f ist (k + 1)-mal differenzierbar.
f (0) := f , f (1) := f ′, f (k+1) := (f ′)(k).
f nennt man (k+1)-mal differenzierbar in x0 ∈ I, wenn f k-mal differenzierbar auf einer Umgebungvon x0 ist und f (k) in x0 differenzierbar ist.
Fur k ∈ N nennt man
Ck(I) := {f : I −→ R | f ist k-mal differenzierbar und f (k) ∈ C0(I)}
die Menge der k-mal stetig differenzierbaren Funktionen.
C∞(I) :=⋂k∈N C
k(I), die Menge der unendlich oft differenzierbaren Funktionen, glatt = unendlichoft differenzierbar.
SATZ 4.1. Sei f : (a, b) −→ R differenzierbar auf (a, b) und 2-mal differenzierbar in x0 ∈ (a, b).
(1) Es gelte f ′(x0) = 0 und f ′′(x0) < 0. Dann besitzt f in x0 ein lokales Maximum.(2) Es gelte f ′(x0) = 0 und f ′′(x0) > 0. Dann besitzt f in x0 ein lokales Minimum.(3) Besitzt f in x0 ein lokales Maximum, so gilt f ′(x0) = 0 und f ′′(x0) ≤ 0.(4) Besitzt f in x0 ein lokales Minimum, so gilt f ′(x0) = 0 und f ′′(x0) ≥ 0.
4. HOHERE ABLEITUNGEN UND TAYLORSCHER SATZ 143
Beweis.Zu (1): Die Funktion
g(x) :=
{f ′(x)−f ′(x0)
x−x0fur x 6= x0
f ′′(x0) fur x = x0
ist stetig in x0. Aus f ′′(x0) < 0 folgt dann mit dem ε-δ-Kriterium: Zu ε := |f ′′(x0)|/2 gibt es dannein δ > 0, so dass fur alle x ∈ (x0 − δ, x0 + δ) gilt:
x ∈ (a, b) und
∣∣∣∣f ′(x)− f ′(x0)
x− x0− f ′′(x0)
∣∣∣∣ < ε.
Daraus folgt
f ′(x)−
=0︷ ︸︸ ︷f ′(x0)
x− x0< f ′′(x0) + ε =
1
2f ′′(x0) < 0.
Also gilt f ′(x) < 0 fur x ∈ (x0, x0 +δ) und f ′(x) > 0 fur x ∈ (x0−δ, x0). Dies impliziert, zusammenmit Korollar 3.4 und der Stetigkeit von f in x0, dass f(x0) = max f#((x0 − δ, x0 + δ)).
Zu (2): Analog.
Zu (3): Es folgt zunachst f ′(x0) = 0. Wenn f ′′(x0) > 0 ware, so hatte f in x0 ein lokales Maximumund Minimum, ware also konstant auf einer Umgebung von x0. Somit f ′′(x0) = 0. Widerspruch.
Zu (4): Analog.
SATZ 4.2 (Satz von Taylor). Sei f : (a, b) −→ R (n + 1)-mal differenzierbar, x, x0 ∈ (a, b).Definiere das Restglied Rx0
n (x) durch
f(x) = f(x0) + (x− x0)f ′(x0) +(x− x0)2
2!f (2)(x0) + · · ·+ (x− x0)n
n!f (n)(x0) +Rx0
n (x)
=
n∑j=0
(x− x0)j
j!f (j)(x0) +R x0
n (x)
Dann gilt:
(1) limx→x0
Rx0n (x)
(x− x0)n+1existiert und ist gleich
f (n+1)(x0)
(n+ 1)!.
(2)Rx0n (x)
(x− x0)n+1=f (n+1)(x0 + ϑ(x− x0))
(n+ 1)!fur ein ϑ ∈ (0, 1).
Lagrangesche Restglieddarstellung
Bemerkung: Der Fall n = 0 ist der 1. Mittelwertsatz.
144 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Beweis. Wir fixieren ein x0. Setze g(x) := Rx0n (x), x 6= x0. Man rechnet nach 0 = g(x0) = g′(x0) =
g(2)(x0) = · · · = g(n)(x0) und g(n+1)(x0) = f (n+1)(x0).
Rx0n (x)
(x− x0)n+1=
g(x)− g(x0)
(x− x0)n+1 − (x0 − x0)n+1
2.MWS=
g′(ξ1)
(n+ 1)(ξ1 − x0)n
=g′(ξ1)− g′(x0)
(n+ 1)(ξ1 − x0)n − (n+ 1)(x0 − x0)n
2.MWS=
g(2)(ξ2)
n(n+ 1) (ξ2 − x0)n−1
...
=g(n)(ξn)− g(n)(x0)
(n+ 1)! (ξn − x0)
2.MWS=
g(n+1)(ξn+1)
(n+ 1)!=f (n+1)(ξn+1)
(n+ 1)!
fur geeigenete ξj , mit x0 < ξn+1 < ξn < · · · < ξ1 < x oder x0 > ξn+1 > ξn > · · · > ξ1 > x. Hierausfolgt Teil (2) des Satzes.
In der zweitletzten Zeile der Umformung steht (bis auf den Faktor (n+1)!) der Differenzenquotientvon g(n), der fur ξn → x0 gegen
1
(n+ 1)!g(n+1)(x0) =
1
(n+ 1)!f (n+1)(x0)
konvergiert.
Wegen |ξn − x0| ≤ |x− x0| haben wir dieselbe Aussage auch im Limes x→ x0. Somit
limx→x0
Rx0n (x)
(x− x0)n+1=
1
(n+ 1)!f (n+1)(x0)
Somit gilt auch (1).
Definition 4.3. Sei f : (a, b) −→ R n-mal differenzierbar, x0 ∈ (a, b). Dann nennt man
T x0n f (x) :=
n∑j=0
f (j)(x0)
j!(x− x0)j
das Taylor-Polynom n-ten Grades von f mit Entwicklungspunkt x0. Ist f ∈ C∞((a, b)), dann nenntman
T x0f (x) =
∞∑j=0
f (j)(x0)
j!(x− x0)j
die Taylorreihe von f mit Entwicklungspunkt x0.
4. HOHERE ABLEITUNGEN UND TAYLORSCHER SATZ 145
!ACHTUNG!. Die Konvergenz der Taylor-Reihe ist zunachst unklar. Und selbst wenn sie kon-vergiert, ist unklar, ob sie mit der ursprunglichen Funktion ubereinstimmt. Man kann zeigen: jedePotenzreihe (also auch jede Potenzreihe mit Konvergenzradius 0) ist die Taylor-Reihe einer glattenFunktion, siehe https://www.semanticscholar.org/paper/Peano’s-Unnoticed-Proof-of-Borel’s-Theorem-Besenyei/3f06a77700dfdfb470d1786fc9348b1865b286ca fur einen Beweis.
In Analysis II und III werden wir sehen: Ist f durch eine konvergente Potenzreihe gegeben, dannstimmt die Taylorreige T 0f mit Entwicklungspunkt 0 mit dieser Potenzreiheuberein. 1.2.
Anwendung: Potenzreihendarstellung der Logarithmus-Funktion.
Entwicklungspunkt: x0 = 1
log′(x) = 1x , log(j)(x) = (−1)j−1 (j−1)!
xj
log(1) = 0, log(j)(1) = (−1)j−1(j − 1)!
T 1n log(x) =
log(1)
0!(x− 1)0︸ ︷︷ ︸0
+∑nj=1
(−1)j−1(j−1)!j! (x− 1)j =
∑nj=1
(−1)j−1
j (x− 1)j
Fragen 4.4.
• Konvergiert die Potenzreihe T 1log (x) fur manche x 6= 1? In anderen Worten: ist derKonvergenzradius der Reihe positiv?• Falls ja: gilt im Konvergenzbereich log(x) = T 1log (x)?
Antwort: Ja fur x ∈ (0, 2).
Wir wollen die Aussage fur x ∈ [1, 2) zeigen. Fur x ∈ (0, 1) kann man die Ausage mit einer anderenVersion des Satzes von Taylor zeigen, der Cauchyschen Restglieddarstellung, siehe [1, Kap. IV,Korollar 3.8 und Anwendungen].
Nach dem Satz von Taylor existiert ein ϑ ∈ (0, 1) mit
log x− T 1n log (x) = R1
n(x) =(x− 1)n+1
(n+ 1)!log(n+1)(1 + ϑ(x− 1))
= (−1)n(x− 1)n+1
(n+ 1)!
n!
(1 + ϑ(x− 1))n+1
Also
| log x− T 1n log (x)| =
∣∣∣∣ (x− 1)n+1
(n+ 1)!
n!
(1 + ϑ(x− 1))n+1
∣∣∣∣ ≤ 1
n+ 1
Somit T 1n log (x)
n→∞−→ log(x) fur x ∈ [1, 2).
146 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
PROPOSITION 4.5. Die Taylorreihe von log : R>0 → R mit Entwicklungspunkt 1 ist
T 1log (x) =
∞∑j=1
(−1)j−1
j(x− 1)j .
Die Reihe konvergiert fur |x − 1| < 1, also fur insbesondere fur x ∈ (0, 2). Außerdem gilt fur allex ∈ (0, 2):
log x = T 1log (x).
Beweis. Dass die Reihe fur x ∈ [1, 2) gegen log x konvergiert, wurde oben gezeigt. Dass die Reihefur |x − 1| < 1 konvergiert, folgt (z.B.) aus dem Quotientenkriterium. Die Aussage T 1log (x) =log(x) fur x ∈ (0, 1) zeigen wir aus Zeitgrunden nicht mehr, einen Beweis findet man wieder in [1,Kap. IV, Korollar 3.8 und Anwendungen].
Ubrigens: In der Analysis III werden Sie Satze kennenlernen, die besagen: wenn log x = T 1log (x)fur alle x ∈ [1, 2) gilt, dann auch fur alle x ∈ (0, 1).
KAPITEL 6
Integral-Rechnung fur Funktionen einer Veranderlichen
Ziel: Integration von Funktionen. Flacheninhalt unter dem Graphen einer Funktion.
Graph einer Funktion. Flacheninhalt darunter im Intervall [a, b] markiert.
1. Partitionen und Treppenfunktionen
Sei I eine Menge. (Partielle) Ordnung auf Abb(I,R) = RI 3 f, g:
f ≤ g :⇐⇒ ∀x ∈ I : f(x) ≤ g(x).
Definition 1.1. Eine Zerlegung oder Partition von I = [a, b], a, b ∈ R ist ein Tupel (t0, t1, . . . , tk) ∈Rk+1 mit a = t0 < t1 < · · · < tk = b. Wir schreiben Z = {t0 < t1 < · · · < tk}. Man nenntZ1 = {s0 < s1 < · · · < s`} eine Verfeinerung von Z2 = {t0 < t1 < · · · < tk}, wenn Z1 durchHinzufugen von Punkten aus Z2 entsteht, in anderen Worten falls
{ti | i = 0, 1, . . . , k} ⊂ {si | i = 0, 1, . . . , `}.
Zu zwei Zerlegungen Z1 und Z2 von [a, b] gibt es Zerlegung Z3 die feiner als Z1 und feiner als Z2
ist: vereinige hierzu die Mengen der Zerlegungspunkte und ordne sie.
Definition 1.2. Eine Funktion f : [a, b] → R heißt Treppenfunktion, falls es eine ZerlegungZ = {t0 < t1 < · · · < tk} gibt, so dass f |(tj−1,tj) konstant ist fur alle j ∈ {1, 2, . . . , k}. Wir nennendieses Z eine Zerlegung, die zu der Treppenfunktion passt. Jede Verfeinerung einer passendenZerlegung passt ebenfalls. Die Menge der Treppenfunktionen [a, b]→ R nennen wir T [a, b].
Treppenfunktionen sind beschrankt, da sie nur endlich viele Werte annehmen.
LEMMA 1.3. Sind f, f1, f2 ∈ T [a, b], λ1, λ2 ∈ R, dann folgt auch
(a) λ1f1 + λ2f2 ∈ T [a, b], d.h. T [a, b] ist ein Vektorraum.1
(b) f1f2 ∈ T [a, b], d.h. T [a, b] ist ein Ring bzw. eine Algebra.2
1Hier wird wieder wie immer definiert (λ1f1 + λ2f2)(x) := λ1f1(x) + λ2f2(x).2Hier wird wieder wie immer definiert (f1f2)(x) := f1(x)f2(x).
147
148 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
(c) max{f1, f2} ∈ T [a, b] und min{f1, f2} ∈ T [a, b] 3
(d) |f | = max{f,−f} ∈ T [a, b]
Beweis klar.
Definition 1.4. Fur eine Treppenfunktion f ∈ T [a, b] mit passender Zerlegung Z = {t0 < t1 <· · · < tk} definieren wir das Integral∫ b
a
(Z) f(x) dx :=
k∑j=1
(tj − tj−1) f
(tj−1 + tj
2
)∈ R.
Positive Treppenfunktion. Die Flache darunter ist bunt und ergibt das Integral
Wenn Z1 und Z2 zu einer Treppenfunktion f passen, so gilt∫ b
a
(Z1) f(x) dx =
∫ b
a
(Z2) f(x) dx.
Wir schreiben hierfur deswegen ab sofort einfach∫ b
a
f(x) dx.
PROPOSITION 1.5. Die Abbildung∫ ba
: T [a, b]→ R ist
(1) linear, d.h.
∀f1, f2 ∈ T [a, b] : ∀λ1, λ2 ∈ R :
∫ b
a
(λ1f1(x) + λ2f2(x)) dx = λ1
∫ b
a
f1(x) dx+ λ2
∫ b
a
f2(x) dx
(2) monoton, d.h.
∀f1, f2 ∈ T [a, b] :(f1 ≤ f2 =⇒
∫ b
a
f1(x) dx ≤∫ b
a
f2(x) dx)
Beweis klar aus der Konstruktion des Integrals.
2. Das Riemann-Integral
f ∈ R[a,b] ist nach oben beschrankt ⇐⇒ ∃g ∈ T [a, b] : g ≥ f ⇐⇒ (T [a, b])≥f 6= ∅
f ∈ R[a,b] ist nach unten beschrankt ⇐⇒ ∃g ∈ T [a, b] : g ≤ f ⇐⇒ (T [a, b])≤f 6= ∅
3Hier wird wieder wie immer definiert max{f1, f2}(x) := max{f1(x), f2(x)} und min{f1, f2}(x) :=
min{f1(x), f2(x)}
2. DAS RIEMANN-INTEGRAL 149
Definition 2.1. Sei f : [a, b] → R eine beschrankte Funktion. Wir definieren das riemannscheOberintegral als ∫ b
a
f(x) dx := inf
{∫ b
a
g(x) dx∣∣∣ g ∈ (T [a, b])≥f
}und das riemannsche Unterintegral als∫ b
a
f(x) dx := sup
{∫ b
a
g(x) dx∣∣∣ g ∈ (T [a, b])≤f
}
Fur die beschrankte Funktion f gilt
−∞ <
∫ b
a
f(x) dx ≤∫ b
a
f(x) dx < ∞
Ist f ∈ T [a, b], so gilt ∫ b
a
f(x) dx =
∫ b
a
f(x) dx =
∫ b
a
f(x).
Definition 2.2. Man nennt f ∈ R[a,b] Riemann-integrierbar , falls f beschrankt ist und falls∫ b
a
f(x) dx =
∫ b
a
f(x) dx.
In diesem Fall nennt man ∫ b
a
f(x) dx :=
∫ b
a
f(x) dx
das Riemann-Integral von f .
R[a, b] := {f ∈ R[a,b] | f ist Riemann-integrierbar}
LEMMA 2.3 (Riemannsches Kriterium). Sei f ∈ R[a,b]. Dann gilt
f ∈ R[a, b] ⇐⇒ ∀ε ∈ R>0 : ∃gu, go ∈ T [a, b] : ( gu ≤ f ≤ go)∧
(∫ b
a
go(x) dx−∫ b
a
gu(x) dx ≤ ε
).
Fur gu und go wie oben gilt dann wegen der Monotonie∫ b
a
gu(x) dx ≤∫ b
a
f(x) dx ≤∫ b
a
go(x) dx.
Eine stetige Funktion mit Treppenfunktionen gu darunter und go daruber.
150 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Beweis.
”=⇒“: Auf Grund der Definition des Oberintegrals gibt es eine Treppenfunktion go ≥ f mit∫ bago(x) dx ≤
∫ baf(x) dx+ ε/2. Auf Grund der Definition des Unterintegrals gibt es eine Treppen-
funktion gu ≤ f mit∫ bagu(x) dx ≥
∫ baf(x) dx−ε/2. Da da Oberintegral von f mit dem Unterintegral
ubereinstimmt, gilt ∫ b
a
go(x) dx−∫ b
a
gu(x) dx ≤ ε
”⇐=“: Gilt die rechte Seite, so haben wir fur jedes ε > 0:
0 ≤∫ b
a
f(x) dx−∫ b
a
f(x) dx ≤∫ b
a
go(x) dx−∫ b
a
gu(x) dx ≤ ε.
Daraus folgt die Riemann-Integrierbarkeit.Mi 6.2.
LEMMA 2.4. Sei a ≤ b. Sind f, f1, f2 ∈ R[a, b], λ1, λ2 ∈ R dann gilt:
(a) −f ∈ R[a, b] und ∫ b
a
(−f)(x) dx = −∫ b
a
f(x) dx .
(b) λ1f1 + λ2f2 ∈ R[a, b], d.h. R[a, b] ist ein Vektorraum. Die Abbildung∫ b
a
: R[a, b]→ R, f 7→∫ b
a
f(x) dx
ist linear.(c) f1f2 ∈ R[a, b], d.h. R[a, b] ist ein Ring bzw. eine Algebra.(d) max{f1, f2} ∈ R[a, b] und min{f1, f2} ∈ R[a, b](e) |f | = max{f,−f} ∈ R[a, b]
Beweis.(a): Aus
g ∈ (T [a, b])≤−f ⇐⇒ −g ∈ (T [a, b])≥f
folgt ∫ b
a
(−f)(x) dx = −∫ b
a
f(x) dx
und genauso ∫ b
a
(−f)(x) dx = −∫ b
a
f(x) dx .
2. DAS RIEMANN-INTEGRAL 151
(b):Fall λ1 ≥ 0 und λ2 ≥ 0: Sei f1,u ∈ (T [a, b])≤f1 und f2,u ∈ (T [a, b])≤f2 , dann gilt wegen Lem-ma 1.3 (a) λ1f1,u + λ2f2,u ∈ (T [a, b])≤λ1f1+λ2f2 . Es folgt∫ b
a
(λ1f1(x) + λ2f2)(x) dx ≥∫ b
a
(λ1f1,u + λ2f2,u)(x) dx
Prop. 1.5(1)= λ1
∫ b
a
f1,u(x) dx+ λ2
∫ b
a
f2,u(x) dx
und somit durch Bildung der Suprema∫ b
a
(λ1f1(x) + λ2f2)(x) dx ≥ λ1
∫ b
a
f1(x) dx+ λ2
∫ b
a
f2(x) dx.
Analog mit oberen Schranken:∫ b
a
(λ1f1(x) + λ2f2)(x) dx ≤ λ1
∫ b
a
f1(x) dx+ λ2
∫ b
a
f2(x) dx.
Der allgemeine Fall: folgt dann mit (a).
(d): Wir zeigen zunachst: Ist f ∈ R[a, b], dann auch f+ := max{f, 0}.
Sei also f ∈ R[a, b] und ε > 0 gegeben. Wir nehmen g, h ∈ T [a, b] mit g ≤ f ≤ h und∫ bah(x) dx−∫ b
ag(x) dx ≤ ε. Wir setzen g+ := max{g, 0} ∈ T [a, b] und h+ := max{h, 0} ∈ T [a, b]. Dann gilt
g+ ≤ f+ ≤ h+ und
h+(x)− g+(x) =
{h(x)− g+(x) falls h(x) ≥ 0
0 falls h(x) < 0
}≤ h(x)− g(x)
Also ∫ b
a
h+(x) dx−∫ b
a
g+(x) dx ≤∫ b
a
h(x) dx−∫ b
a
g(x) dx ≤ ε.
Also ist dann f+ ∈ R[a, b].
Wegen max{f1, f2} = f2 + max{f1− f2, 0} und min{f1, f2} = f2−max{f2− f1, 0} folgt dann (d).
(c):Der Fall f1 ≥ 0 und f2 ≥ 0: Bestimme zu j ∈ {1, 2}: fj,u, fj,o ∈ T [a, b] mit
0 ≤ fj,u ≤ fj ≤ fj,o ≤ Cj := sup{fj(x) | x ∈ [a, b]}
und ∫ b
a
fj,o(x) dx−∫ b
a
fj,u(x) dx ≤ ε.
152 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Aus Lemma 1.3 (b) folgt f1,uf2,u ∈ T [a, b] und f1,of2,o ∈ T [a, b]. Ferner gilt∫ b
a
f1,o(x)f2,o(x) dx−∫ b
a
f1,u(x)f2,u(x) dx
≤∫ b
a
f1,o(x)(f2,o(x)− f2,u(x)
)dx+
∫ b
a
(f1,o(x)− f1,u(x)
)f2,u(x) dx
≤ C2ε+ C1ε .
Der allgemeine Fall folgt dann aus der Gleichung
f1f2 = max{f1, 0}max{f2, 0} −max{−f1, 0}max{f2, 0}−max{f1, 0}max{−f2, 0}+ max{−f1, 0}max{−f2, 0}.
(e): folgt direkt aus (d).
LEMMA 2.5 (Monotonie). Seien, f1, f2 ∈ R[a, b]. Ist f1 ≤ f2, so haben wir∫ b
a
f1(x) dx ≤∫ b
a
f2(x) dx.
Beweis. 0 ∈ T [a, b], 0 ≤ f2 − f1. Es folgt
0 =
∫ b
a
0 dx(∗)≤∫ b
a
(f2 − f1)(x) dxLemma 2.4(b)
=
∫ b
a
f2(x) dx−∫ b
a
f1(x) dx .
Die Ungleichung (∗) gilt nach Definition des Unterintegrals: 4 es ist definiert als das Supremumder Menge
A :={∫ b
a
g(x) dx∣∣ g ∈ (T [a, b])≤f
}3∫ b
a
0 dx = 0.
Notation: Fur f : D → R definiere ‖f‖∞ := sup{|f(x)|
∣∣x ∈ D} ∈ [0,∞].
PROPOSITION 2.6. Fur f ∈ R[a, b] gilt:∣∣∣∫ b
a
f(x) dx∣∣∣ ≤ ∫ b
a
|f(x)| dx ≤ ‖f‖∞(b− a)
4 An der Stelle (∗) kann man nicht mit der Monotonie des Integrals argumentieren. Denn die Monotonie fur
Treppenfunktion (Proposition 1.5 (2)) ist nicht anwendbar, da f im allgemeinen keine Treppenfunktion ist. Und die
Monotonie fur Riemann-integrierbare Funktionen wollen wir ja hier erst zeigen. Wenn wir sie verwenden wurden, soware dies ein Zirkelschluss: Ein Beweis, in dem man die zu beweisende Aussage bereits verwendet und der deswegen
nicht zulassig ist.
2. DAS RIEMANN-INTEGRAL 153
Beweis. Wegen f = max{f, 0} −max{−f, 0} und |f | = max{f, 0}+ max{−f, 0} folgt∣∣∣∫ b
a
f(x) dx∣∣∣ ≤
∣∣∣∫ b
a
max{f(x), 0} dx︸ ︷︷ ︸≥0
−∫ b
a
max{−f(x), 0} dx︸ ︷︷ ︸≥0
∣∣∣(∗)≤
∫ b
a
max{f(x), 0} dx+
∫ b
a
max{−f(x), 0} dx
=
∫ b
a
|f(x)| dx,
wobei wir an der Stelle (∗) die Dreiecks-Ungleichung |a− b| ≤ |a|+ |b| benutzt haben.
Wegen |f(x)| ≤ ‖f‖∞ folgt mit der Monotonie∫ b
a
|f(x)| dx ≤∫ b
a
‖f‖∞ dx ≤ ‖f‖∞(b− a).
LEMMA 2.7. Seien a, b, c ∈ R mit a < b < c, und f : [a, c]→ R. Dann gilt
f ∈ R[a, c] ⇐⇒ f |[a,b] ∈ R[a, b] und f |[b,c] ∈ R[b, c]
und wenn f Riemann-integrierbar ist, so gilt∫ c
a
f(x) dx =
∫ b
a
f |[a,b](x) dx+
∫ c
b
f |[b,c](x) dx.
Beweis. Man wahlt wieder geeignete Treppenfunktionen oberhalb und unterhalb von f und setztdiese zusammen oder durchtrennt sie an der Stelle b.
Notation 2.8. Die Integrationsvariable (bis jetzt immer x) kann durch jede andere noch nichtvergebene Variable ersetzt werden:∫ b
a
f(x) dx =
∫ b
a
f(y) dy = · · · =∫ b
a
f(t) dt .
Aber bereits vergebene Variablen durfen nicht als Integrationsvariable benutzt werden, zum Bei-spiel ist ∫ b
a
f(a) da
ist nicht erlaubt.
Gilt [a, b] ⊂ [c, d] und f ∈ R[c, d], dann schreiben wir∫ b
a
f(x) dx :=
∫ b
a
f |[a,b](x) dx.
154 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Gilt a > b, und f ∈ R[b, a], so definieren wir∫ b
a
f(x) dx := −∫ a
b
f(x) dx.
Insbesondere gilt fur alle reelle Zahlen a, b, c ∈ [d, e] ⊂ R und fur alle f ∈ R[d, e]:∫ c
a
f(x) dx =
∫ b
a
f(x) dx+
∫ c
b
f(x) dx.
3. Monotone Funktionen sind Riemann-integrierbar
SATZ 3.1. Sei a, b ∈ R, a < b, und f : [a, b]→ R eine monotone Funktion. Dann ist f ∈ R[a, b].
Beweis. O.B.d.A. sei f monoton wachsend. Sei ε ∈ R>0 gegeben. Zu einer Zahl k ∈ N, die wirnoch geeignet wahlen werden, definieren wir:
tj := a+ jb− ak
.
Insbesondere ist {t0 < t1 < · · · < tk} eine Zerlegung von [a, b]. Wir definieren die Treppenfunktio-nen go, gu ∈ T [a, b], so dass fur alle j ∈ {1, 2, . . . k} und alle x ∈ [tj−1, tj) gilt
go(x) = f(tj), gu(x) = f(tj−1);
und go(b) = gu(b) = f(b).
Bild einer monoton wachsenden Funktion f und von Treppenfunktionen gu, go wie oben.
Da f monoton wachsend ist gilt gu ≤ f ≤ go. Außerdem∫ b
a
go(x) dx =
k∑j=1
(tj − tj−1) go
(tj−1 + tj
2
)=
k∑j=1
b− ak
f(tj),
∫ b
a
gu(x) dx =
k∑j=1
(tj − tj−1) gu
(tj−1 + tj
2
)=
k∑j=1
b− ak
f(tj−1).
Somit ∫ b
a
go(x) dx−∫ b
a
gu(x) dx =b− ak
k∑j=1
f(tj)−k−1∑`=0
f(t`)
=b− ak
(f(b)− f(a))
Wenn wir also bei der obigen Konstruktion der tj , die Zahl k ∈ N so groß wahlen, dass
k ≥ b− aε
(f(b)− f(a)),
dann gilt∫ bago(x) dx −
∫ bagu(x) dx ≤ ε. Mit dem riemannschen Kriterium Lemma 2.3 folgt die
Riemann-Integrierbarkeit.
4. STETIGE FUNKTIONEN SIND RIEMANN-INTEGRIERBAR 155
4. Stetige Funktionen sind Riemann-integrierbar
LEMMA 4.1. Sei f : [a, b]→ R stetig. Dann ist f auch gleichmaßig stetig, d.h.
(4.2) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x, y ∈ [a, b] :(|x− y| < δ =⇒ |f(x)− f(y)| < ε
).
Beweis. Angenommen f ist nicht gleichmaßig stetig. Es gibt dann ein ε > 0, so dass
(4.3) ∀δ ∈ R>0 : ∃x, y ∈ [a, b] :(|x− y| < δ
)∧(|f(x)− f(y)| ≥ ε
).
Zu jedem n ∈ N, und δ := δn := 1/n wahlen wir xn, yn ∈ [a, b] wie in (6.15). Auf Grund des Satzesvon Bolzano-Weierstraß (Korollar 1.35 in Kapitel 2) gibt es eine Teilfolge (xnk)k∈N, so dass
limk→∞
xnk
existiert. Sei x := limk→∞ xnk ∈ [a, b]. Wegen |xnk − ynk | < 1/nk gilt auch x = limk→∞ ynk . Da fstetig ist gilt dann auch
f(x) = limk→∞
f(xnk) = limk→∞
f(ynk),
alsolimk→∞
(f(xnk)− f(ynk)) = 0.
Dies widerspricht jedoch der obigen Wahl von xnk und ynk , denn diese haben wir so gewahlt, dassfur alle k ∈ N die Ungleichung |f(xnk)− f(ynk)| ≥ ε gilt.5
Wir haben gezeigt, dass die Annahme, f sei nicht gleichmaßig stetig, einen Widerspruch impliziert.Also muss f gleichmaßig stetig sein.
SATZ 4.4. Sei f : [a, b]→ R stetig. Dann ist f Riemann-integrierbar. In anderen Worten:
C0([a, b]) ⊂ R[a, b].
Beweis. Zu einem gegebenen ε > 0 wahle δ > 0 wie in (4.2). Dann wahlen wir kε ∈ N r {0} sogroß, dass (b− a)/kε < δ. Definiere ahnlich wie oben
tj := a+ jb− akε
.
Wir definieren die Treppenfunktionen go, gu ∈ T [a, b], so dass fur alle j ∈ {1, 2, . . . k} und allex ∈ [tj−1, tj) gilt
go(x) = sup{f(x) | x ∈ [tj−1, tj)}, gu(x) = inf{f(x) | x ∈ [tj−1, tj)}und go(b) = gu(b) = f(b). Dann gilt 0 ≤ go(x)− gu(x) ≤ ε, und deswegen∫ b
a
go(x) dx−∫ b
a
gu(x) dx ≤ ε(b− a),
und offensichtlich gu ≤ f ≤ go. Mit Lemma 2.3 folgt die Riemann-Integrierbarkeit.
5Und naturlich fur das feste oben gewahlte ε > 0!
156 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
!ACHTUNG!. Wenn eine Funktion f : (a, b)→ R stetig ist, so kann man daraus nicht schließen,dass f Riemann-integrierbar ist. Beispiel: Die Funktion f : (0, 1) → R, x 7→ 1/x, ist stetig, abernicht beschrankt und somit auch nicht Riemann-intergierbar.
5. Hauptsatz der Differential- und Integralrechnung
SATZ 5.1 (Hauptsatz der Differential- und Integralrechnung, Teil I). Sei f ∈ R[a, b], γ ∈ [a, b].Definiere
F : [a, b] → R, F (x) :=
∫ x
γ
f(t) dt.
Dann gilt
(1) F ist stetig auf [a, b].(2) Ist f stetig in x0 ∈ (a, b), so ist F differenzierbar in x0, und F ′(x0) = f(x0).
Fr 8.2.
Beweis.
(1) f ∈ R[a, b], also f beschrankt, somit
‖f‖∞(def)= sup
{|f(x)|
∣∣x ∈ [a, b]}<∞.
Sei x, x0 ∈ [a, b].∣∣∣F (x)− F (x0)∣∣∣ =
∣∣∣∣∫ x
x0
f(t) dt
∣∣∣∣ ≤ ∣∣∣∣∫ x
x0
|f(t)| dt∣∣∣∣ ≤ |x− x0| ‖f‖∞
Zu gegebenem ε > 0 wahlen wir nun δ := ε/‖f‖∞ > 0 und dann ist das ε-δ-Kriterium furStetigkeit in x0 erfullt.
(2) ∣∣∣∣F (x)− F (x0)
x− x0− f(x0)
∣∣∣∣ =
∣∣∣∣ 1
x− x0
∣∣∣∣ ∣∣∣∣∫ x
x0
(f(t)− f(x0)) dt
∣∣∣∣≤
∣∣∣∣ 1
x− x0
∣∣∣∣ ∣∣∣∣∫ x
x0
|(f(t)− f(x0))| dt∣∣∣∣
≤ sup{|f(t)− f(x0)|
∣∣∣ t ∈ [x, x0] bzw. t ∈ [x0, x]}
Wir fixieren nun ein ε > 0. Da f in x0 stetig gibt es zu diesem ε > 0 ein δ > 0, so dass fur allet ∈ [a, b] mit |t− x0| ≤ δ gilt:
|f(t)− f(x0)| ≤ ε,insbesondere gilt fur x ∈ [a, b] ∩ [x0 − δ, x0 + δ]:∣∣∣∣F (x)− F (x0)
x− x0− f(x0)
∣∣∣∣ ≤ sup{|f(t)− f(x0)|
∣∣∣ t ∈ [x, x0] bzw. t ∈ [x0, x]}≤ ε.
5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 157
Daraus ergibt sich
limx→x0
(F (x)− F (x0)
x− x0− f(x0)
)= 0
und somit die Behauptung im zweiten Teil.
Ist I 6= ∅ ein Intervall, so sei◦I := (inf I, sup I) das offene Intervall mit denselben Grenzen wie I.
Bsp: I := [a, b],◦I = (a, b). Ist J ein offenes Intervall in R, dann
◦J = J .
Fur offene Teilmengen U definieren wir◦U := U .
Definition 5.2. Sei I ein Intervall oder eine offene Teilmenge von R, und f : I → R. Wir sagenF : I → R ist eine Stammfunktion von f , wenn F stetig ist, F |◦
Idifferenzierbar ist und F ′(x) = f(x)
fur alle x ∈◦I.
Beispiele 5.3.
(1) Der Hauptsatz der Diff.- und Int.-Rechnung I besagt, dass stetige Funktionen f : [a, b]→R immer eine Stammfunktion haben.
(2) Auch stetige Funktionen f : (c, d) → R besitzen immer eine Stammfunktion: wahleγ ∈ (c, d), dann ist F (x) =
∫ xγf(t) dt eine Stammfunktion.
(3) Ist U ⊂ R offen und f : U → R stetig, dann besitzt f ebenfalls eine Stammfunktion.Denn ist U ⊂ R offen, dann gibt es eine Familie offener Intervalle (Uα)α∈A, so dass U =⋃α∈A Uα, Uα∩Uβ = ∅ fur α 6= β6. Man konstruiert nun auf jedem Uα die Stammfunktion
wie in (2).(4) Es gibt Riemann-integrierbare Funktionen ohne Stammfunktion. Beispiel
f : [−1, 1]→ R, f(x) :=
{−1 , falls x ≤ 0
1 , falls x > 0
f ∈ R[−1, 1], da f eine Treppenfunktion ist. Angenommen f hatte eine StammfunktionF : [−1, 1]→ R. Dann gilt F ′(x) = 1 fur x > 0, somit gibt es eine c ∈ R, so dass fur allex ∈ (0, 1) gilt: F (x) = c + x. Es gilt F ′(x) = −1 fur x ≤ 0, somit gibt es ein d ∈ R mirF (x) = d−x fur d ≤ 0. Da F stetig ist, gilt c = d, also F (x) = c+ |x| fur alle x ∈ [−1, 1].Diese Funktion ist nicht in 0 differenzierbar, also ist F keine Stammfunktion.
(5) Es gibt nicht-Riemann-integrierbare Funktionen mit Stammfunktion. Wir definieren:
F : R→ R, F (x) :=
x2 sin
(1
x2
), falls x > 0
0, falls x ≤ 0.
6Man sagt zu letzterer Eigenschaft: (Uα)α∈A ist eine Familie von paarweise disjunkten offenen Intervallen
158 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Dann ist F differenzierbar auf ganz R und somit ist F |[−1,1] eine Stammfunktion vonf := F ′|[−1,1] : [−1, 1]→ R. Man rechnet nach fur j →∞:
xj := (2πj + π)−1/2 → 0
f(xj) = 21√
2πj + πsin (2πj + π)︸ ︷︷ ︸
=0
− 2√
2πj + π cos (2πj + π)︸ ︷︷ ︸=−1
→ ∞
Deswegen ist f nicht beschrankt und deswegen auch nicht Riemann-integrierbar.
SATZ 5.4 (Hauptsatz der Differential- und Integralrechnung, Teil II). Sei f : [a, b]→ R Riemann-integierbar, und F sei eine Stammfunktion von f . Dann gilt fur x, y ∈ [a, b]:
(5.5)
∫ x
y
f(t) dt = F (x)− F (y).
Beweis.
1. Fall: f ist stetig.F0(x) :=
∫ xyf(t) dt ist eine Stammfunktion von f , und deswegen F (x) = F0(x) + F (y). Daraus
folgt die Aussage.
2. Fall: allgemeinO.B.d.A. y < x. Sei go ∈ T [y, x], go ≥ f , und sei Z = {t0 < t1 < . . . < tk} eine zu go passendeZerlegung von [y, x].
F (x)− F (y) =
k∑j=1
(F (tj−1)− F (tj))
1.MWS=
k∑j=1
(tj − tj−1)F ′(ξj)
fur geeignete ξj ∈ (tj−1, tj). Wir rechnen weiter
F (x)− F (y) =
k∑j=1
(tj − tj−1)f(ξj)
≤k∑j=1
(tj − tj−1)go(ξj)
=
∫ x
y
go(t) dt
5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 159
Da dies fur alle Treppenfunktionen oberhalb von f gilt, folgt durch Infimumsbildung:
F (x)− F (y) ≤∫ x
y
f(t) dt
Die Gleichung
F (x)− F (y) ≥∫ x
y
f(t) dt
zeigt man ganz analog. Da f Riemann-integrierbar ist, folgt die Aussage.
Beispiele 5.6.
(1) Eine Stammfunktion der Funktion f : R → R, x 7→∑nk=0 akx
k ist F : R 7→ R, x 7→∑nk=0
akk+1x
k+1.
(2) Die Stammfunktion der Funktion
f : R→ R, x 7→ 1
x2 + 1
ist F = arctan : R→ (−π/2;π/2) ⊂ R, die Umkehr-Funktion des Tangens. Denn mit
tan′(y) =1
cos2 y=
sin2 y + cos2 y
cos2 y= tan2 y + 1
und mit Proposition 1.6 in Kapitel 5 sieht man
arctan′(x) =1
tan2(arctan(x)) + 1=
1
x2 + 1.
(3) Es gibt viele Tabellen mit vielen Stammfunktionen, siehe zum Beispiel:
http://de.wikipedia.org/wiki/Tabelle_von_Ableitungs-_und_Stammfunktionen
Notation 5.7.
F (x)∣∣∣bx=a
:= F (b)− F (a)
Dann schreibt sich (5.5) als ∫ b
a
f(x) dx = F (x)∣∣∣bx=a
.
C0([a, b]) :={f : [a, b]→ R | f stetig
}f ∈ C1([a, b]) ⇐⇒ f ∈ C0([a, b]), f |(a,b) differenzierbar und f ′ kann man zu einer stetigen Funk-
tionen f ′ : [a, b]→ R fortsetzen.7
7Wir bezeichnen diese Fortsetzung auch einfach mit f ′ und es gilt dann auch
f ′(a) = limx↘a
f(x)− f(a)
x− a, f ′(b) = lim
x↗b
f(x)− f(b)
x− b.
160 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
SATZ 5.8 (Partielle Integration). Seien a, b ∈ R, a < b und f, g ∈ C1([a, b]). Dann∫ b
a
f ′(x)g(x) dx = f(x)g(x)∣∣∣bx=a−∫ b
a
f(x)g′(x) dx
Beweis. x 7→ f(x)g(x) ist Stammfunktion von x 7→ f ′(x)g(x) + f(x)g′(x).
Beispiel 5.9. Zu berechnen ist A :=∫ ba
cos3 x dx. Setze f(x) = sinx und g(x) = cos2 x. Es folgtmit partieller Integration:
A =
∫ b
a
f ′(x)g(x) dx = sinx cos2 x∣∣∣bx=a−∫ b
a
(sinx)(−2) sinx cosx dx
Wenn wir nun sin2 x = 1− cos2 x nutzen, so ergibt sich
A = sinx cos2 x∣∣∣bx=a
+ 2
∫ b
a
cosx dx− 2A.
Also
A =1
3(sin b cos2 b− sin a cos2 a)− 2
3(sin b− sin a).
SATZ 5.10 (Integration durch Substitution). Seien a, b, c, d ∈ R, a < b und c < d. Gegeben sei
• f ∈ C0([a, b]),• ϕ ∈ C1([c, d]) mit ϕ#([c, d]) ⊂ [a, b]
Dann gilt ∫ ϕ(d)
ϕ(c)
f(s) ds =
∫ d
c
f(ϕ(t))ϕ′(t) dt.
Beweis. Die Integranden, d.h. die Funktionen f und t 7→ f(ϕ(t))ϕ′(t) =: f(t) sind stetig, alsoRiemann-integrierbar und besitzen Stammfunktionen. Sei F : [a, b] → R eine Stammfunktion
von f , dann ist nach Kettenregel F ◦ ϕ : [c, d]→ R eine Stammfunktion von f .∫ ϕ(d)
ϕ(c)
f(s) ds = F (ϕ(d))− F (ϕ(c)) =
∫ d
c
f(ϕ(t))ϕ′(t) dt.
Merkregel: Die Leibnizsche Differentialschreibweise (= Verwendung von den”unendlich kleinen“
Zahlen ds, dt) liefert eine gute Merkregel. 8
s = ϕ(t),
8Sie ist nicht mathematisch prazise, denn es bleibt ja unklar, was eine unendlich kleine Zahl denn sein soll. Sie
ist aber sehr effizient als Merkregel.
6. UNEIGENTLICHE RIEMANN-INTEGRALE 161
also auch f(ϕ(t)) = f(s). Schreibe
ϕ′(t) = limt→t
ϕ(t)− ϕ(t)
t− t= limt→t
s− st− t
=ds
dt
Man lost aufds = ϕ′(t) dt
und ersetzt die t-Integrationsgrenzen c und d durch die s-Integrationsgrenzen ϕ(c) und ϕ(d). Undman hat die Subsitutionsformel.
Typische Anwendungen.1.) ∫ b
a
tet2
dt =1
2
∫ b2
a2es ds =
1
2eb
2
− 1
2ea
2
Hier wurde f(s) = es und ϕ(t) = t2 genutzt.
2.) Sei 0 < a < b.∫ b
a
1
(et − 1)(et + 1)dt =
∫ b
a
1
et(et − 1)(et + 1)et dt =
∫ eb
ea
1
s(s− 1)(s+ 1)ds = siehe Zentralubung
Hier wurde f(s) = 1s(s−1)(s+1) und ϕ(t) = et genutzt.
Wir machen einen Partialsummenansatz1
s(s− 1)(s+ 1)=a
s+
b
s− 1+
c
s+ 1
und rechnen aus, dass dieser Ansatz fur a = 1 und b = c = −1/2 funktioniert. somit hat f : Rrdie Stammfunktion
log(s)− 1
2log(s− 1)− 1
2log(s+ 1)
und damit kann dieses Integral explizit berechnet werden.
6. Uneigentliche Riemann-Integrale
Wdh.: F : R −→ R, a ∈ Ra = lim
x→∞F (x) ⇐⇒ ∀ε ∈ R>0 : ∃x0 ∈ R : ∀x ∈ R≥x0 : |F (x)− a| < ε
Analog fur F : [a,∞) −→ R und andere Definitionsbereiche.
Definition 6.1 (Uneigentliches Riemann-Integral, oberes Ende). Sei a ∈ R, b ∈ R ∪ {∞}, a < b,f : [a, b) −→ R.Wir sagen f ist (am oberen Ende) uneigentlich Riemann-integrierbar falls f |[a,β] ∈ R[a, β] fur alleβ ∈ (a, b) und falls
(6.2)
∫ b
a
f(x) dx := limβ↗b
∫ β
a
f(x) dx
162 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
existiert. Wir sagen dazu auch∫ baf(x) dx konvergiert. Wir sagen: das Integral konvergiert absolut ,
falls∫ ba|f(x)| dx konvergiert.
Man beachte: die linke Seite von (6.2) ist eine Definition!
Spezialfall: Wenn b <∞ und falls f = f[a,b) fur ein f ∈ R[a, b] ist, dann gilt wegen dem Hauptsatz
der Differential- und Integralrechnung9:∫ b
a
f(x) dx = limβ→b
∫ β
a
f(x) dx
In diesem Fall gilt also ∫ b
a
f(x) dx =
∫ b
a
f(x) dx.
Definition 6.3 (Uneigentliches Riemann-Integral, unteres Ende und an beiden Enden). Sei a ∈R ∪ {−∞}, b ∈ R, a < b, f : (a, b] −→ R.Wir sagen f ist (am unteren Ende) uneigentlich Riemann-integrierbar falls f |(α,b] ∈ R[α, b] fur alleα ∈ (a, b) und falls
(6.4)
∫ b
a
f(x) dx := limα↘a
∫ b
α
f(x) dx
existiert.
Sei a ∈ R ∪ {−∞}, b ∈ R ∪ {∞}, a < b, f : (a, b) −→ R. Wir sagen f ist (an beiden Enden)uneigentlich Riemann-integrierbar, falls fur ein γ ∈ (a, b) die Summe
(6.5)
∫ b
a
f(x) dx :=
∫ γ
a
f(x) dx+
∫ b
γ
f(x) dx
existiert.10
Beispiele 6.6.
(1)∫∞
1xa dx konvergiert genau dann, wenn a < −1. Denn
F (r) :=
∫ r
1
xa dx =
{1a+1 (ra+1 − 1) fur a 6= −1
log r fur a = −1
Im Limes r →∞ gilt
F (r)→
{∞ fur a ≥ −1
− 1a+1 fur a < −1
9Die folgende Zeile ist keine Definition, sondern eine Aussage!10Hierzu mussen beide Integrale der rechten Seite von (6.5) konvergieren. Die Existenz und der Wert von∫ b
a f(x) dx ist dann unabhangig von γ.
6. UNEIGENTLICHE RIEMANN-INTEGRALE 163
(2)∫ 1
0xa dx konvergiert genau dann, wenn a > −1.
ENDE DER VORLESUNG ANALYSIS I
KAPITEL 7
Stetigkeit und Differenzierbarkeit von Grenzwerten undReihen
24.4.
Vereinfachte Notationen ab jetzt:
• Quantoren hinter Aussagen sind erlaubt, falls keine Missverstandnisse zu erwarten sind.• Wir schreiben im(f) fur B(f),• f(A) fur f#(A),• und f−1(A) fur f#(A).• Wir schreiben oft ∀ε > 0 statt ∀ε ∈ R>0, analog ∃δ > 0, . . .
1. Metrische Raume: Wiederholung und Cauchy-Folgen
Ein metrischer Raum ist ein Paar (M,d), wobei die Metrik d : M ×M −→ R≥0 die folgendenEigenschaften fur alle x, y, z ∈M erfullen moge
(a) d(x, y) = 0 ⇐⇒ x = y (Definitheit)(b) d(x, y) = d(y, x) (Symmetrie)(c) d(x, y) ≤ d(x, z) + d(z, y) (Dreiecks-Ungleichung)
r ∈ R≥0, x ∈Moffener Ball Br(x) := {y ∈M | d(x, y) < r}abgeschlossener Ball Br(x) := {y ∈M | d(x, y) ≤ r}
Sei (xn)n∈N eine M -wertige Folge, a ∈M .Konvergenz.
(xn)n∈N konvergiert gegen a
:⇐⇒ limn→∞
xn = a
:⇐⇒ limn→∞
d(xn, a) = 0
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀n ∈ N≥N : d(xn, a) < ε
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀n ∈ N≥N : xn ∈ Bε(a)
165
166 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
Cauchy-Folge.
(xn)n∈N ist eine Cauchy-Folge
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀n,m ∈ N≥N : d(xn, xm) < ε
SATZ 1.1. Jede konvergente Folge ist eine Cauchy-Folge.
Den Beweis erhalt man aus dem Beweis von Satz 1.38 aus Kapitel 3, indem man |x − y| durchd(x, y) ersetzt.
Beweis. Es gelte limj→∞ aj = a. Das heißt: fur alle ε ∈ R>0 gibt es ein j0 ∈ N, so dass fur allenaturlichen Zahlen j ≥ j0 gilt: d(aj , a) ≤ ε.
Fur solch ein ε und ein passendes j0 nehmen wir nun naturliche Zahlen j ≥ j0 und k ≥ j0 undrechnen nach:
d(aj , ak) ≤ d(aj , a) + d(a, ak) ≤ ε+ ε = 2ε.
Wir haben nun also gezeigt:
∀ε ∈ R>0 : ∃j0 ∈ N : ∀j, k ∈ N≥j0 : d(aj , ak) ≤ 2ε.
Wegen Lemma 1.11 aus Kapitel 3 ist dies aquivalent zur definierenden Eigenschaft einer Cauchy-Folge.
Definition 1.2. Ein metrischer Raum (M,d) heißt vollstandig , wenn jedeM -wertige Cauchy-Folgein (M,d) konvergiert.
Ist (M,d) ein metrischer Raum und N eine Teilmenge. Dann ist d|N×N eine Metrik auf N , die von(M,d) auf N induzierte Metrik, siehe Beispiel 5.3 in Kapitel 4.
UBUNG 1.3. Sei (M,d) ein metrischer Raum. Dann ist N ⊂M abgeschlossen genau dann, wennfur alle N -wertigen Folgen, die in (M,d) konvergieren, der Grenzwert in N liegt.
UBUNG 1.4. Sei N eine Teilmenge eines metrischen Raumes (M,d) und sei d die induzierteMetrik auf N .
(a) Ist (N, d) vollstandig, so ist N abgeschlossen in M .(b) Ist (M,d) vollstandig, so gilt
(N, d) vollstandig ⇐⇒ N abgeschlossen in M.
2. Punktweise und gleichmaßige Konvergenz
Im folgenden sei (Y, d) ein metrischer Raum
Die wichtigsten Beispiele, an die Sie im folgenden denken sollten, sind Y = R und Y = C mitd(x, y) := |x− y|. Spater werden wir zum Beispiel fur Y auch Vektorraume (mit einer Norm) odernoch andere Raume betrachten. Wir betrachten nun Funktionen D −→ Y .
2. PUNKTWEISE UND GLEICHMASSIGE KONVERGENZ 167
Definition 2.1. Eine Folge von Funktionen besteht aus einer Menge D, einem metrischen Raum(Y, d), und einer Folge (fn)n∈N, wobei wir fur jedes n ∈ N eine Funktion fn : D −→ Y haben.Sei f : D −→ Y eine weitere Funktion. Wir sagen dann: (fn) konvergiert punktweise gegen f :D −→ Y , falls fur alle x ∈ D gilt:
limn→∞
fn(x) = f(x).
Der Begriff der punktweisen Konvergenz erscheint ein naheliegender Begriff fur die Konvergenzvon solchen Funktionen.
Beispiel 2.2. Y := C. Gegeben sei eine Potenzreihe p(x) :=∑∞j=0 ajx
j mit Konvergenzradius ρ.
fn(x) :=
n∑j=0
ajxj .
Dann konvergiert (fn : Bρ(0) −→ C)n∈N punktweise gegen p : Bρ(0) −→ C.
Da nun alle fn stetig sind, kann man hoffen, dass wir dadurch zeigen konnen, dass p : Bρ(0) −→ Cstetig ist. Hierbei tritt aber ein Problem auf, das am folgenden Beispiel deutlich wird.
Beispiel 2.3. D = [0, 1], Y := R, fn(x) := xn.
0.2 0.4 0.6 0.8 1
0.2
0.4
0.6
0.8
1f0
f1
f2
f3 f4
x
fn(x)
Abbildung 7: Die Graphen der Funktionen fn
168 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
fn(x)→ f(x) :=
{0 fur x < 1
1 fur x = 1
(fn) konvergiert punktweise gegen f : [0, 1] −→ R. Alle Funktionen fn : [0, 1] −→ R sind stetig.Dennoch ist die Grenzfunktion f nicht stetig.
Losung des Problems: Gleichmaßige Konvergenz.
Wir machen aus Abb(D,Y ) = Y D einen metrischen Raum. Fur f, g ∈ Abb(D,Y ) definieren wirdie Supremums-Distanz
dsup(f, g) := supx∈D
{d(f(x), g(x)
)}∈ [0,∞].
(Abb(D,Y ), dsup) erfullt (a) Definitheit, (b) Symmetrie, (c) Dreiecks-Ungleichung; aber es istkeine Norm, da dsup(f, g) =∞ moglich ist. Wir setzen deswegen
dglm(f, g) := min{dsup(f, g), 289}.
Dann ist (Abb(D,Y ), dglm) ein metrischer Raum1.
Definition 2.4. Sei (fn : D −→ Y )n∈N eine Folge von Funktionen. Wir definieren
(fn) konvergiert gleichmaßig gegen f : D −→ Y
:⇐⇒ (fn) konvergiert gegen f im metrischen Raum (Abb(D,Y ), dglm)
⇐⇒ dglm(fn, f)→ 0 fur n→∞
⇐⇒ supx∈D
{d(f(x), g(x)
)}→ 0 fur n→∞
⇐⇒ ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀x ∈ D : d(fn(x), f(x)) ≤ εY⊂C⇐⇒ ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀x ∈ D : |fn(x)− f(x)| ≤ ε
Logische Verknupfung
∃x ∈M : ∀y ∈ N : A(x, y) =⇒ ∀y ∈ N : ∃x ∈M : A(x, y)
Somit:
∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0: ∀x ∈ D : d(fn(x), f(x)) ≤ ε
=⇒ ∀x ∈ D : ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : d(fn(x), f(x)) ≤ ε
Also:
Gleichmaßige Konvergenz =⇒ Punktweise Konvergenz
1Man kann in dieser Konstruktion naturlich 289 durch jede andere positive reelle Zahl ersetzen.
2. PUNKTWEISE UND GLEICHMASSIGE KONVERGENZ 169
!ACHTUNG!. Die Umkehrung ist falsch. Punktweise Konvergenz impliziert nicht gleichmaßige.In Beispiel 2.3 konvergiert (fn) punktweise gegen f , aber nicht gleichmaßig.
Von nun an sei D ein metrischer Raum mit Metrik dD, zum Beispiel ein Intervall, eine Teilmengevon Rn oder eine Teilmenge von Cn mit der induzierten Metrik.
SATZ 2.5. Sei (fn : D −→ Y )n∈N eine Folge von stetigen Funktionen, die gleichmaßig gegenf : D −→ Y konvergiert. Dann ist auch f : D −→ Y stetig.
Beispiel 2.6 (Fortsetzung Beispiel 2.2). Sei wieder ρ der Konvergenzradius von p(x) =∑∞j=0 ajx
j ,0 < R < ρ. Definiere die Partialsummen
fn(x) :=
n∑j=0
ajxj .
Dann gilt fur x ∈ BR(0):
|fn(x)− p(x)| =∣∣∣ ∞∑j=n+1
ajxj∣∣∣ ≤ ∞∑
j=n+1
|aj ||x|j ≤∞∑
j=n+1
|aj |Rj → 0.
Wir haben Konvergenz gegen 0, da∑∞j=0 ajR
j absolut konvergiert. Also konvergiert (fn : BR(0) −→C)n∈N gleichmaßig gegen p : BR(0) −→ C. 2 Wir sehen also somit, dass p|BR(0) : BR(0) −→ Cstetig ist. Da dies fur alle R ∈ (0, ρ) gilt, sehen wir, dass p|Bρ(0) : Bρ(0) −→ C ebenfalls stetig ist.
26.4.
Beweis des Satzes. Damit unsere Notation einfach ist, beschranken wir uns auf den Fall D ⊂ C,Y ⊂ C, dD(x, y) = |x− y|, d(x, y) = |x− y|. Den allgemeinen Fall beweist man vollig analog.
Wir zeigen die Stetigkeit von f in x0. Sei ε ∈ R>0 gegeben. Wir wahlen hierzu ein N ∈ N, so dassfur alle naturlichen Zahlen n ≥ N gilt:
dglm(f, fn) < ε :=ε
3
Da fN stetig in x0 stetig ist, gibt es ein δ ∈ R>0, so dass
|x− x0| < δ =⇒ |fN (x)− fN (x0)| < ε.
Wir schließen, dass fur x ∈ D mit |x− x0| < δ gilt:
|f(x)− f(x0)| ≤ |f(x)− fN (x)|+ |fN (x)− fN (x0)|+ |fN (x0)− f(x0)| < 3ε = ε.
Wir haben also die Stetigkeit von f in x0 gepruft. Da x0 ein beliebiges Element von D ist, ist fstetig (auf ganz D).
2Achtung: Fur viele Potenzreihen konvergiert f ′n : Bρ(0)→ C nicht gleichmaßig. Erst nach Einschrankung auf
einen etwas kleineren Ball BR(0) erhalten wir gleichmaßige Konvergenz.
170 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
Beweis des Satzes (volle Allgemeinheit). Wir zeigen die Stetigkeit von f in x0. Sei ε ∈ R>0
gegeben. Wir wahlen hierzu ein N ∈ N, so dass fur alle naturlichen Zahlen n ≥ N gilt:
dglm(f, fn) < ε :=ε
3Da fN stetig in x0 stetig ist, gibt es ein δ ∈ R>0, so dass
dD(x, x0) < δ =⇒ d(fN (x), fN (x0)) < ε.
Wir schließen, dass fur x ∈ D mit d(x, x0) < δ gilt:
d(f(x), f(x0)) ≤ d(f(x), fN (x)) + d(fN (x), fN (x0)) + d(fN (x0), f(x0)) < 3ε = ε.
Wir haben also die Stetigkeit von f in x0 gepruft. Da x0 ein beliebiges Element von D ist, ist fstetig (auf ganz D).
LEMMA 2.7. Sei D eine Menge und (Y, d) ein vollstandiger metrischer Raum.3 Sei (fn : D →Y )n∈N eine Folge von Funktionen. Dann sind die folgenden Aussagen aquivalent:
(1) (fn)n∈N konvergiert gleichmaßig (gegen eine Funktion D → R)(2)
∀ε ∈ R>0 : ∃n0 ∈ N : ∀j, k ∈ N≥n0: dglm(fj , fk) < ε
(3)∀ε ∈ R>0 : ∃n0 ∈ N : ∀j, k ∈ N≥n0 : ∀x ∈ D : d(fj(x), fk(x)) < ε
Im Fall D = {x0} steht hier: (fn(x0)) konvergiert genau dann, wenn (fn(x0)) eine Cauchy-Folgeist.
Offensichtlich ist:(1) ⇐⇒ (fn)n∈N konvergiert in (Abb(D,Y ), dglm).(2) ⇐⇒ (fn)n∈N ist Cauchy-Folge in (Abb(D,Y ), dglm).
Beweis.”(2)⇐⇒(3)“ folgt direkt aus der Definition von dglm.
”(1)=⇒(2)“: jede konvergente Folge ist eine Cauchy-Folge (Satz 1.1).
”(3)=⇒(1)“: Wegen (3) ist (fn(x)) eine Cauchy-Folge, sei f(x) := limn→∞ fn(x), f : D → R. Zu
gegebenem ε > 0 wahle man ein n0 wie in (3). Fur j, k ∈ N≥n0:
d(f(x), fj(x)) ≤ d(f(x), fk(x)) + d(fk(x), fj(x)) < d(f(x), fk(x))︸ ︷︷ ︸→0
+ε
fur k →∞. Somit d(f(x), fj(x)) ≤ ε.
Da dies fur alle x ∈ D gilt, haben wir
dglm(f, fj) ≤ ε.
3Wichtig sind hier vor allem die Falle Y = R, X = C und Y = Rk mit der Standardmetrik.
3. DIFFERENTIATION VON FOLGEN UND REIHEN 171
Wir haben also gezeigt:
∀ε > 0 : ∃n0 ∈ N : ∀j ∈ N≥n0: dglm(fj , f) ≤ ε
und dies ist (1).
KOROLLAR 2.8. Sei D eine nicht-leere Menge und (Y, d) ein metrischer Raum. Dann ist (Abb(D,Y ), dglm)genau dann vollstandig, wenn (Y, d) vollstandig ist.
Beweis. Wegen Lemma 2.7 (2)=⇒(1) folgt aus der Vollstandigkeit von (Y, d) die Vollstandigkeitvon (Abb(D,Y ), dglm).
Umgekehrt kann jedes y ∈ Y als konstante Funktion y : D → Y , x 7→ y betrachtet werden, diewir mit y bezeichnen. Wegen dglm(x, y) = d(x, y) bildet D → Abb(D,Y ), y 7→ y Cauchy-Folgenauf Cauchy-Folgen ab. Grenzwerte konstanter Funktionen in (Abb(D,Y ), dglm) sind wiederumkonstant. Aus der Vollstandigkeit von (Abb(D,Y ), dglm) folgt dann auch die Vollstandigkeit von(Y, d).
3. Differentiation von Folgen und Reihen
Sei fn : (a, b) −→ R eine Folge differenzierbarer Funktionen, die gleichmaßig gegen f : (a, b) −→ Rkonvergiert.
Frage 3.1. Ist dann f ebenfalls differenzierbar?
Beispiele 3.2.
(1) fn(x) :=√x2 + 1
n konvergiert gleichmaßig gegen f(x) = |x|.Denn fur reelle Zahlen a, b ∈ R gilt
a2 + b2 ≤ |a|2 + |b|2 + 2|a| |b| = (|a|+ |b|)2
und somit √a2 + b2 ≤ |a|+ |b|.
Wenden wir dies auf a := x und b := 1/√n an, so erhalten wir
|x| ≤ fn(x) ≤ |x|+ 1√n.
Also |fn(x)−f(x)| ≤ 1√n
, d.h. dglm(fn, f) ≤ n−1/2. Nun sind alle Funktionen fn differenzierbar
(auf R), aber f ist in 0 nicht differenzierbar. Siehe auch [22, Abschnitt 9.5].(2) Wir betrachten die Reihe
fn : R→ R, fn(x) :=
n∑`=1
1
`2sin(`2x)
172 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
(fn : R→ R)n∈N konvergiert gleichmaßig, denn
|fj(x)− fk(x)| = |j∑
`=k+1
1
`2sin(`2x)| ≤
j∑`=k+1
1
`2≤
∞∑`=k+1
1
`2→ 0 fur j ≥ k, k →∞
Gliedweises Differenzieren liefert:
f ′n(x) =
n∑`=1
cos(`2x)
Diese Reihe ist divergent, u.a. da fur viele x ∈ R, z.B. fur x = 1 die Folge (cos(`2x))` keineNullfolge ist.
THEOREM 3.3. Seien a, b, x0 ∈ R mit a < x0 < b. Sei fn : (a, b) −→ R eine Folge von differen-zierbaren Funktionen, so dass
(1) (fn(x0))n∈N konvergiert (Konvergenz in einem Punkt)(2) (f ′n)n∈N konvergiert gleichmaßig
Dann gilt:
(i) fn : (a, b) −→ R konvergiert gleichmaßig gegen eine Funktion, die wir f : (a, b) −→ R nennen.(ii) f ist differenzierbar auf (a, b)
(iii) f ′n konvergiert gegen f ′
Beweis. Sei x1 ∈ (a, b) und j, k ∈ N.
I :=
{[x0, x1] falls x1 ≥ x0,
[x1, x0] falls x1 < x0.
Wir wenden den 1. Mittelwertsatz auf die Funktion I → R, x 7→ fj(x)− fk(x) an: Es existiert einξ ∈ I ⊂ (a, b), so dass
(fj(x0)− fk(x0))− (fj(x1)− fk(x1)) = (x0 − x1)(f ′j(ξ)− f ′k(ξ)).
Dies ergibt
|fj(x1)− fk(x1)| ≤ |x0 − x1| |f ′j(ξ)− f ′k(ξ)|+ |fj(x0)− fk(x0)|
Wir wahlen fur ein gegebenes ε > 0 die Zahl n0 so groß, dass fur alle j, k ∈ N≥n0gilt: |fj(x0) −
fk(x0)| ≤ ε/2. Dies ist moglich, da (fn(x0))n∈N eine Cauchy-Folge ist, siehe (1).
Wir wahlen nun eine Zahl n1, so dass fur alle j, k ∈ N≥n1und fur alle x ∈ (a, b) gilt:
|f ′j(x)− f ′k(x)| < ε
2(b− a).
Dies ist moglich, da f ′j gleichmaßig konvergiert, siehe (2).
3. DIFFERENTIATION VON FOLGEN UND REIHEN 173
Somit gilt fur n2 := max{n0, n1} fur alle j, k ∈ N≥n2und alle x1 ∈ (a, b) die Ungleichung
|fj(x1)− fk(x1)| ≤ |x0 − x1| |f ′j(ξ)− f ′k(ξ)|︸ ︷︷ ︸< ε
2(b−a)
+ |fj(x0)− fk(x0)|︸ ︷︷ ︸<ε/2
<ε|b− a|2(b− a)
+ε
2= ε
Also dglm(fj , fk) ≤ ε, das heißt (fn)n∈N ist eine Cauchy-Folge in (Abb((a, b),R), dglm).
Da R vollstandig ist, ist nach Korollar 2.8 auch (Abb((a, b),R), dglm) vollstandig; es existiert alsoeine Funktion f : (a, b)→ R, so dass (fn) gegen f gleichmaßig konvergiert. Es folgt Aussage (i). Fr. 3.5.
Sei nun g(x) := limn→∞ f ′n(x). Dieser Limes ist gleichmaßig nach Voraussetzung. Wahle zu gege-benem ε > 0 ein n3 ∈ N, so dass fur j, k ∈ N≥n3
gilt: dglm(f ′j , f′k) < ε und dglm(f ′j , g) < ε.
Fur solche j und k wenden wir ahnlich wie oben wieder den 1. Mittelwertsatz auf die Funktionx 7→ fj(x)− fk(x) an.∣∣∣∣ (fj(x)− fk(x))− (fj(x2)− fk(x2))
x− x2
∣∣∣∣ 1. MWS= |f ′j(ξ)− f ′k(ξ)| < ε
fur ein ξ zwischen x und 2. Im Grenzwert k →∞ erhalten wir
(3.4)
∣∣∣∣ (fj(x)− f(x))− (fj(x2)− f(x2))
x− x2
∣∣∣∣ ≤ ε.Diese Abschatzung gilt fur alle x ∈ (a, b), x 6= x2, j ≥ n3; und n3 hangt nicht von x ab, sondernnur von ε. Manchmal schreibt man hierfur kurz n3 = n3(ε), um auszudrucken, dass n3 nur von εabhangt, auch wenn diese Formulierung leicht falsch verstanden werden kann.
Da die Funktion fj in x2 differenzierbar ist, gibt es 4 zu oben gegebenem ε > 0 und j ≥ n3(ε) einδj > 0, so dass fur alle x ∈ (x2 − δj , x2 + δj) gilt:
(3.5)
∣∣∣∣fj(x)− fj(x2)
x− x2− f ′j(x2)
∣∣∣∣ ≤ ε.Aus (3.4), (3.5) und dglm(f ′j , g) ≤ ε folgt fur j ≥ n3(ε)
(3.6) ∀x ∈ (x2 − δj , x2 + δj) :
∣∣∣∣f(x)− f(x2)
x− x2− g(x2)
∣∣∣∣ ≤ 3ε.
Wir haben gezeigt: Fur jedes ε > 0 haben wir ein j gefunden, und dann dazu ein δj > 0, so dass(3.6) gilt. Dies ergibt
limx→x2
f(x)− f(x2)
x− x2= g(x2)
und somit die Aussagen (ii) und (iii).
4Achtung: wir behaupten hier: fur jedes j gibt es solch ein δj . Man muss hier aber davon ausgehen, dass dieses
δj von j abhangen kann.
174 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
4. Potenzreihen und analytische Funktionen
SATZ 4.1.∑∞j=0 ajx
j, aj ∈ R eine Potenzreihe mit Konvergenzradius ρ > 0. Dann ist die Funktion
f : (−ρ, ρ)→ R, x 7→∞∑j=0
ajxj
differenzierbar und
f ′(x) =
∞∑j=1
jajxj−1.
Man kann also in dieser Situation die Ableitung in die unendliche Summe”hineinziehen“. Obige
Beispiele zeigen aber, dass dies eben nicht fur alle gleichmaßig konvergenten Reihen von Funktionengilt.
Beweis. Wahle ein R ∈ (0, ρ). Wir wollen Theorem 3.3 anwenden fur: fn : (−R,R)→ R, fn(x) =∑nj=0 ajx
j , x0 = 0. Die Konvergenz in x0 = 0 ist klar. Hierzu uberprufen wir, dass f ′n : (−R,R)→R gleichmaßig konvergiert. 5
Wir rechnen
f ′n(x) =
n∑j=0
jajxj−1
Fur festes x 6= 0 konvergiert f ′n(x) fur n→∞ genau dann, wenn hn(x) :=∑nj=0 jajx
j konvergiert.
Wir berechnen den Konvergenzradius ρ′ der Potenzreihe∑∞j=0 jajx
j .
lim supj→∞
j
√j|aj | =
(limj→∞
j√j
)︸ ︷︷ ︸
=1
(lim supj→∞
j
√|aj |)
Also ρ′ = ρ, das heißt der Konvergenzradius von∑∞j=0 jajx
j−1 ist ρ.
Wegen Beispiel 2.6 konvergiert die Potenzreihe∑∞j=0 jajx
j−1 auf (−R,R) gleichmaßig, das heißtdie Folge von Funktionen
gn : (−R,R)→ R, x 7→n∑j=0
jajxj−1.
konvergiert gleichmaßig gegen eine Funktion g : (−R,R)→ R.
Beispiele 4.2.
5Achtung: Fur viele Potenzreihen konvergiert f ′n : (−ρ, ρ)→ R nicht gleichmaßig. Erst nach Einschrankung aufein etwas kleineres Intervall (−R,R) erhalten wir gleichmaßige Konvergenz. Siehe die analoge Fussnote in Kapitel 4,
Abschnitt 2.
4. POTENZREIHEN UND ANALYTISCHE FUNKTIONEN 175
(1) exp : R→ R, x 7→∑∞j=0
1j!x
j ist differenzierbar und
exp′(x) =
∞∑j=1
j
j!xj−1 =
∞∑j=1
(j − 1)!
x
j−1
= exp(x).
(2) sin : R→ R, x 7→∑∞j=0(−1)j 1
(2j+1)!x2j+1 ist differenzierbar und
sin′(x) =
∞∑j=0
1
(2j)!x2j = cos(x).
Analog
cos′(x) = − sin(x).
FOLGERUNG 4.3. Potenzreihen mit Konvergenzradius ρ > 0 sind auf dem Intervall (−ρ, ρ) glatt,d.h. unendlich oft differenzierbar. Die Taylorreihe mit Entwicklungspunkt 0 von einer Potenzreiheist wieder genau diese Potenzreihe.
T 0(
∞∑j=0
ajxj)(x) =
∞∑j=0
ajxj .
FOLGERUNG 4.4. Seien f(x) =∑∞n=0 anx
n und g(x) =∑∞n=0 bnx
n Potenzreihen mit Konver-genzradien ρa > 0 und ρb > 0. Gibt es ein ε ∈ (0,min{ρa, ρb}] so dass
f(x) = g(x) fur alle x mit |x| < ε,
dann gilt an = bn fur alle n ∈ N.
Definition 4.5. Sei I ein offenes Intervall. Eine Funktion f : I → R heißt analytisch oder reell-analytisch, falls es zu jedem x0 ∈ I ein ε > 0 und eine Potenzreihe p(x) =
∑∞j=0 ajx
j gibt, so dassgilt
• der Konvergenzradius ρ der Potenzreihe ist in (0,∞],• f(x+ x0) = p(x) fur alle x ∈ R mit |x| < ρ und x+ x0 ∈ I.
Cω(I) := {f : I −→ R | f ist analytisch.}
Cω ⊂ C∞ ⊂ · · · ⊂ Ck+1 ⊂ Ck ⊂ · · · ⊂ C1 ⊂ C0.
LEMMA 4.6. Potenzreihen sind auf ihrem Konvergenzbereich analytisch.
176 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
Beweis. kommt noch (folgt aus dem Umordnungssatz)
SATZ 4.7 (Eindeutige Fortsetzbarkeit analytischer Funktionen). Sei I ein offenes Intervall undsind f, g : I −→ R analytische Funktionen. In x0 ∈ I gelte eine der folgenden Bedingungen:
(a) Fur alle n ∈ N gilt f (n)(x0) = g(n)(x0).(b) Es gibt ein ε > 0 mit f |(x0−ε,x0+ε) = g|(x0−ε,x0+ε)
Dann haben wir sogar f = g.
Die Beweise des Lemmas und des Satzes wurden in der Vorlesung ausgelassen, da wir in derAnalysis III analoge Aussagen fur komplex-analytische Funktionen beweisen werden.
Beweis. Mit Folgerung 4.3 sehen wir, dass aus (a) die Voraussetzung (b) folgt. Sei I = (a, b), a < b,a, b ∈ R. Wir definieren nun
t1 := sup{t ∈ [x0, b) | f = g auf [x0, t]}.Aus dieser Definition folgt f = g auf [x0, t1). Angenommen t1 < b. Da f − g stetig ist, gilt auchf(t1) = g(t1), also stimmen f und g auf [x0, t1] uberein. Hieraus ergibt sich fur alle n ∈ N:f (n)(t1) = g(n)(t1). Da f und g analytisch sind, gibt es ein ε > 0, so dass f = g auf [t1, t1 + ε).Dies ist ein Widerspruch zur Wahl von t1. Also t1 = b. Deswegen gilt f = g auf [x0, b). Auf demIntervall (a, x0] argumentiert man analog.
KAPITEL 8
Topologie
Als Literatur in diesem Kapitel emfehle ich das erste Kapitel von [34] (normierte Vektorraumeund metrische Raume) und Kapitel VI von [9] (inklusive topologische Raume).
1. Normierte Vektorraume
Vorbemerkung zur Vektorraumen: Im Gegensatz zur Linearen Algebra ist es in der Analysis nichtublich und zumeist auch nicht hilfreich, streng zwischen Zeilen- und Spaltenvektoren zu unterschei-den.1
K = R oder K = C.
Definition 1.1. Sei V ein K-Vektorraum. Eine Norm auf V ist eine Abbildung ‖ · ‖ : V → R, sodass fur alle x, y ∈ V , λ ∈ K gilt:
(a) Definitheit der Norm: ‖0‖ = 0 und fur x 6= 0 gilt ‖x‖ > 0,(b) Homogenitat der Norm: ‖λx‖ = |λ| ‖x‖(c) Dreiecksungleichung der Norm: ‖x+ y‖ ≤ ‖x‖+ ‖y‖
Man nennt dann (V, ‖ · ‖) einen normierten Vektorraum.
Beispiele 1.2.
(1) Sei 〈 · , · 〉 ein Skalarprodukt auf dem K-Vektorraum V , wie in der Linearen Algebra IIbehandelt. Dann ist
x 7→ ‖x‖ :=√〈x, x〉
eine Norm auf V .Ist 〈 · , · 〉 das Standardskalarprodukt auf Kn, so nennt man die zugehorige Norm die
Standardnorm auf Kn.
1Sobald man anfangt, Matrizen mit Vektoren zu multiplizieren, mussen wir naturlich sorgfaltiger werden. Dies
ist allerdings aus Sicht der Analysis nur ein kurzer Zwischenschritt auf dem Weg zu”Tensoren“. Vektoren haben
einen Index, Matrizen zwei und Tensoren beliebig viele. Die in der Linearen Algebra erfolgreiche Notation mit Zeilen
und Spalten versagt, sobald wir mindestens drei Indizes haben. Tensoren werden in der Analysis benotigt, um den
mehrdimensionalen Satz von Taylor zu erhalten. Spater sind Tensorfelder ein wichtiges Hilfsmittel in der Analysis IV.Tensoren sind omniprasent in der Physik (Allgemeine Relativitatstheorie, Materialwissenschaft, Elektrodynamik)
und vielen anderen Anwendungen in Chemie und Technik.
177
178 8. TOPOLOGIE
(2) Sei D eine Menge. Eine Funktion f : D −→ K heißt beschrankt , wenn
‖f‖∞ := supx∈D{|f(x)|}
endlich ist. Die Menge B(D,K) der beschrankten Funktionen von D nach K bildet mitder ublichen punktweisen Addition und Multiplikation mit Skalaren einen K-Vektorraum.Dann ist ‖ · ‖∞ eine Norm auf B(D,K). Definitheit, Homogenitat und Dreiecksunglei-chung sind leicht zu prufen. Man nennt diese Norm die Supremumsnorm.Wir erhalteninsbesondere eine weitere Norm auf Kn = Abb({1, 2, . . . , n},K) = B({1, 2, . . . , n},K).
(3) Sei p ∈ [1,∞), n ∈ N. Fur z = (z1, . . . , zn) ∈ Kn definieren wir die p-Norm
‖z‖p :=
n∑j=1
|zj |p1/p
∈ R≥0.
Dann ist ‖ · ‖2 die Standardnorm auf Kn aus Beispiel (1).Es ist eine Norm fur alle p ∈ [1,∞): Definitheit und Homogenitat von ‖ · ‖p werden
in Ubungsblatt 3, Aufgabe 3 gezeigt.
Bild aller Punkte x ∈ R2 mit ‖x‖p = 1 fur p = 1, 54 , 2, 5,∞.
Die Dreiecksungleichung ist klar fur p = 1.Sei nun p > 1. Bestimme q ∈ (1,∞) mit 1
p + 1q = 1. Also q = p/(p−1). Nach Ubungs-
blatt 3, Aufgabe 3 gilt fur alle a = (a1, . . . , an), b = (b1, . . . , bn) ∈ Rn die HolderscheUngleichung
n∑j=1
|ajbj | ≤ ‖a‖p · ‖b‖q.
Wir setzen sj := |xj+yj |p−1 und s = (s1, . . . , sn). Wir wenden die Holdersche Ungleichungzunachst auf a = x und b = s an und dann nochmals auf a = y und b = s, und erhalten.
‖x+ y‖pp =
n∑j=1
|xj + yj |p ≤n∑j=1
|xj | |sj |+n∑j=1
|yj | |sj | ≤ ‖x‖p‖s‖q + ‖y‖p‖s‖q
Man rechnet nun
‖s‖q =( n∑j=1
|sj |q)1/q
=( n∑j=1
|xj + yj |p)(1/p)·(p−1)
= ‖x+ y‖p−1p .
Insgesamt folgt
‖x+ y‖p ≤ ‖x‖p + ‖y‖p.Diese Ungleichung nennt man die Minkowski-Ungleichung .Mi 8.5.
(4) Ist (V, ‖ · ‖) ein normierter Vektorraum und W ein Untervektorraum von V . Dann ist‖ · ‖∣∣
W: W → R ein Norm auf W , die wir die von ‖ · ‖ induzierte Norm auf W nennen.
(5) Ist ‖ · ‖ eine Norm auf einem C-Vektorraum V . Dann ist V auch ein R-Vektorraum, und‖ · ‖ ist dann auch eine Norm auf V im Sinn von R-Vektorraumen.
1. NORMIERTE VEKTORRAUME 179
Definition 1.3. Ist (V, ‖ · ‖) ein normierter Raum, so definiert
d(x, y) := ‖x− y‖
eine Metrik auf V . Man nennt sie die von ‖ · ‖ induzierte Metrik auf V . Dadurch sind dietopologischen Begriffe, also Begriffe wie
”offen“,
”abgeschlossen“, konvergent“,
”Cauchy-Folge“,
”Haufungspunkte“ etc. definiert. Insbesondere: Eine V -wertige Folge (x(k))k∈N konvergiert gegena in (V, ‖ · ‖), falls ‖x(k) − a‖ → 0 fur k → ∞. Aus der Dreiecksungleichung sieht man leicht:Konvergiert x(k) gegen a, so konvergiert ‖x(k)‖ gegen ‖a‖.2 Die Norm-Funktion
‖ · ‖ : V → R, x 7→ ‖x‖
ist also (folgen-)stetig.
Beispiel 1.4. Die von der Supremumsnorm ‖ · ‖∞ induzierte Metrik aufB(D,K) ist die Supremums-Distanz dsup aus Kapitel 7.
Eine Folge (x(k))k∈N heißt beschrankt im normierten Raum (V, ‖ · ‖), falls es ein C ∈ R>0 gibt,so dass fur alle k ∈ N gilt: ‖x(k)‖ ≤ C.
LEMMA 1.5. Sei xj(k) ∈ K bzw. aj ∈ K die j-te Komponente von x(k) ∈ Kn bzw. a ∈ Knbezuglich der Standard-Basis. Dann gilt fur jede Norm auf V :
limk→∞
x(k) = a in (Kn, ‖ · ‖∞) ⇐⇒ ∀j ∈ {1, 2, . . . , n} : limk→∞
xj(k) = aj .
Beweis.
limk→∞
x(k) = a in (Kn, ‖ · ‖∞
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀k ∈ N≥N : ‖x(k)− a‖∞ < ε
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀k ∈ N≥N : ∀j ∈ {1, . . . , n} : |xj(k)− a| < ε
(∗)⇐⇒ ∀j ∈ {1, . . . , n} : ∀ε > 0 : ∃N ∈ N : ∀k ∈ N≥N : |xj(k)− a| < ε
⇐⇒ ∀j ∈ {1, 2, . . . , n} : limk→∞
xj(k) = aj .
Fur die Umformung (∗) haben wir die Umformung
∃N ∈ N : A(j,N) : ∀j ∈ {1, . . . , n} : A(j,N) ⇐⇒ ∀j ∈ {1, . . . , n} : ∃N ∈ N : A(j,N)
benutzt, und wir mussen begrunden wieso wir die Quantoren vertauschen durfen. Die Richtung
”=⇒“ ist offensichtlich. Fur
”⇐=“ argumentieren wir wie folgt: auf der rechten Seite erhalten wir
fur jedes j ein potenziell j-abhangiges N = Nj . Da j aber nur endlich viele Werte durchlauft, ist
N := max{Nj | j ∈ {1, 2, . . . , n}} eine naturliche Zahl, so dass die linke Seite fur N = N gilt.
LEMMA 1.6 (Bolzano-Weierstraß auf (Rn, ‖ · ‖∞)). Ist (x(k))k∈N eine beschrankte Folge in(Rn, ‖ · ‖∞), dann besitzt diese Folge eine konvergente Teilfolge.
2Denn |‖x(k)‖ − ‖a‖| ≤ ‖x(k)− a‖ oder verwende Ubungsblatt 3 Aufgabe 4.
180 8. TOPOLOGIE
Der folgende Beweis wurde das Ergebnis auch fur alle anderen p-Normen liefern. Diese Verallge-meinerung folgt aber bald ganz einfach.
Beweis. Schreibe x(k) = (x1(k), . . . , xn(k)). Es gilt |xj(k)| ≤ ‖x(k)‖∞. Somit ist (xj(k))k∈Neine beschrankte R-wertige Folge. Nach dem Satz von Bolzano-Weierstraß (Korollar 1.35 in Kapi-tel 2) besitzt die Folge (x1(k))k∈N eine (in R) konvergente Teilfolge (x1(f1(k)))k∈N. Weiter besitzt(x2(f1(k)))k∈N eine konvergente Teilfolge (x2(f1 ◦ f2(k)))k∈N. Und so weiter. Nachdem wir n-malzu einer derartigen Teilfolge ubergegangen sind, konvergiert
(xj(f1 ◦ f2 ◦ · · · ◦ fn︸ ︷︷ ︸f :=
(k)))k∈N
fur alle j. Sei aj := limk→∞ xj(f(k)). Dann ‖a− x(f(k))‖∞ → 0 fur k →∞.
Definition 1.7. Zwei Normen ‖ · ‖ und ||| · ||| auf einem Vektorraum V nennt man aquivalent, fallses ein C ∈ R>0 gibt, so dass fur alle x ∈ V gilt:
‖x‖ ≤ C|||x||| und |||x||| ≤ C‖x‖.
SATZ 1.8. Alle Normen auf Rn sind aquivalent.
Beweis. Es reicht, den Satz zu zeigen fur ‖ · ‖ = ‖ · ‖∞ und eine weitere Norm ||| · |||. Sei (e1, . . . , en)die Standardbasis von R.
|||x||| =∣∣∣∣∣∣∣∣∣ n∑j=1
xjej
∣∣∣∣∣∣∣∣∣ ≤ n∑j=1
|xj ||||ej ||| ≤ ‖x‖∞ (|||e1|||+ . . .+ |||en|||)︸ ︷︷ ︸C1:=
.
Dies liefert nun die rechte der zu zeigenden Ungleichungen.
Angenommen, die Normen sind nicht aquivalent, d.h. es gibt kein C wie oben. Dann gibt es eineFolge (x(k))k∈N in Rn mit ‖x(k)‖∞ > k|||x(k)|||. O.B.d.A. ‖x(k)‖∞ = 1 (sonst ersetze x(k) durchx(k)/‖x(k)‖∞). Wir konnen auch annehmen, dass diese Folge konvergiert, da wir gegebenenfalls zueiner in (Rn, ‖ · ‖∞) konvergenten Teilfolge ubergehen konnen (siehe Lemma 1.6). Sei a der Grenz-wert. Wegen |||x(k)− a||| ≤ C1‖x(k)−a‖∞ → 0 ist a auch der Grenzwert bezuglich der ||| · |||-Norm.Es folgt ‖a‖∞ = limk→∞ ‖x(k)‖∞ = 1 und wegen |||x(k)||| < 1
k auch |||a||| = limk→∞ |||x(k)||| = 0.Also a = 0, was ‖a‖∞ = 1 widerspricht.
Der obige Satz gilt wegen Beispiele 1.2 (5) auch, wenn wir Rn durch Cn ersetzen.
Sind zwei Normen ‖ · ‖ und ||| · ||| aquivalent, so gilt
limk→∞
‖x(k)− a‖ = 0 ⇐⇒ limk→∞
|||x(k)− a||| = 0.
(x(k))k∈N beschrankt in (V, ‖ · ‖) ⇐⇒ (x(k))k∈N beschrankt in (V, ||| · |||).
Da jeder endlich-dimensionale K-Vektorraum (als Vektorraum) isomorph zu Kn fur ein geeignetesn ∈ N ∪ {0} ist, folgt hieraus unmittelbar das folgende Korollar.
KOROLLAR 1.9. Fur einen endlich-dimensionalen K-Vektorraum V gilt:
1. NORMIERTE VEKTORRAUME 181
(a) Alle Normen auf V sind zueinander aquivalent.(b) Bezuglich einer beliebigen Basis sei xj(k) bzw. aj die j-te Komponente von x(k) bzw. von a
gilt:
limk→∞
x(k) = a ⇐⇒ ∀j ∈ {1, 2, . . . ,dimV } : limk→∞
xj(k) = aj .
(c) Jede beschrankte V -wertige Folge besitzt eine konvergente Teilfolge. (Satz von Bolzano-Weierstraßfur endlich-dimensionale Vektorraume).
Wir betrachten nun einige unendlich-dimensionale normierte Raume.
Beispiel 1.10. Fur p ∈ [1,∞) und x = (xj) ∈ Abb(N,K) definieren wir
‖x‖p :=( ∞∑j=0
|xj |p)1/p
.
Hierbei weisen wir der Reihe genau dann den Wert ∞ zu, wenn sie divergiert, das heißt wenn sieunbestimmt gegen ∞ konvergiert. Wir setzen ∞1/p := ∞. Fur p = ∞ definieren wir ‖x‖∞ wie inBeispiele 1.2 (2). Man definiert nun
`p(K) := {x ∈ Abb(N,K) | ‖x‖p <∞}.
Dann ist ‖ · ‖p eine Norm auf `p(K): Die Homogenitat und Definitheit ist klar. Die Dreiecks-Ungleichung ist klar fur p =∞. Um die Dreiecks-Ungleichung fur p <∞ zu zeigen, definieren wirzu x ∈ Abb(N,K) den Vektor x(n) ∈ Abb(N,K), n ∈ N durch
x(n)j :=
{xj fur j ≤ n,0 fur j > n.
Fur x ∈ `p(K) gilt
‖x− x(n)‖pp =
∞∑j=n+1
|xj |p → 0 fur n→∞,
und somit gilt x(n) → x. Wir konnen x(n) als Vektor (x0, . . . , xn) ∈ K(n+1) betrachten und danndie Dreiecks-Ungleichung von Beispiele 1.2 (3) anwenden:
‖x(n) + y(n)‖p ≤ ‖x(n)‖p + ‖y(n)‖p.
Im Limes n→∞ ergibt sich dann
‖x+ y‖p ≤ ‖x‖p + ‖y‖p.Fr 10.5.
UBUNG 1.11. Zeigen Sie, dass `p(R) fur alle p ∈ [1,∞] vollstandig ist.
Bemerkung 1.12. Auf unendlich-dimensionalen Vektorraumen gibt es nicht-aquivalente Normen.Sei
Abbc(N,K) :={
(xj) ∈ Abb(N,K)∣∣∣#{j ∈ N | xj 6= 0} <∞
}.
182 8. TOPOLOGIE
Dieser Vektorraum besitzt eine Basis (χj)j∈N, wobei
χj(k) =
{1 falls j = k ,
0 falls j 6= k .
Dann gilt Abbc(N,K) ⊂ `p(K) fur alle p ∈ [1,∞], und wir erhalten eine induzierte p-Norm aufAbbc(N,K) ⊂ `p(K). Fur p 6= p sind die Normen ‖ · ‖p und ‖ · ‖p nicht aquivalent. Betrachten wir
zum Beispiel die Folge(
1n
∑nj=0 χj
)n∈N
. Dann gilt
∥∥∥ 1
n
n−1∑j=0
χj
∥∥∥1
= 1,∥∥∥ 1
n
n−1∑j=0
χj
∥∥∥∞
=1
n.
Somit ist diese Folge eine Nullfolge in der Norm ‖ · ‖∞, aber keine Nullfolge in der Norm ‖ · ‖1.
Beispiel 1.13. Betrachte den Vektorraum V = C0([a, b],K), b > a, K = R oder K = C. Wirdefinieren: f ∈ C0([a, b],K)
‖f‖1 :=
∫ b
a
|f(x)| dx, ‖f‖∞ := sup{|f(x)| | x ∈ [a, b]}.
Die Normen ‖ · ‖1 und ‖ · ‖∞ sind nicht aquivalent. Es gilt zwar ‖f‖1 ≤ (b − a)‖f‖∞. Es gibtaber keine Konstante C ∈ R>0 mit
‖f‖∞ ≤ C‖f‖1.Um dies zu zeigen, betrachte man fur n ≥ 1/(b− a) die Funktion
fn : [a, b]→ R, f(x) :=
{1− n(x− a) falls a ≤ x ≤ a+ 1
n
0 falls a+ 1n < x ≤ b
Es gilt ‖fn‖∞ = 1 und ‖fn‖1 = 1/(2n) → 0. Die Folge (fn)n∈N ist also eine Nullfolge in(C0([a, b],K), ‖ · ‖1), aber nicht in (C0([a, b],K), ‖ · ‖∞). Die Folge (fn)n∈N besitzt keine kon-vergente Teilfolge in ((C0([a, b],K), ‖ · ‖∞).
Definition 1.14. Einen normierten Vektorraum (V, ‖ · ‖) nennt man einen Banachraum odereinen vollstandigen normierten Vektorraum, falls die induzierte Metrik auf V vollstandig ist. Eineneuklidischen oder unitaren Vektorraum (V, 〈 · , · 〉) nennt man einen Hilbertraum, wenn (V, x 7→‖x‖ :=
√〈x, x〉) ein Banachraum ist.
Aus dem Satz von Bolzano-Weierstraß erhalten wir das folgende Korollar.
KOROLLAR 1.15. Alle endlich-dimensionalen normierten Vektorraume sind Banachraume. Alleendlich-dimensionalen euklidischen oder unitaren Vektorraume sind Hilbertraume.
Hilbertraume und Banachraume (beliebiger Dimension) sind unter anderem von zentraler Bedeu-tung
2. KONTRAKTIONEN UND BANACHSCHER FIXPUNKTSATZ 183
• in der Quantenmechanik. Hier ist insbesondere der Hilbertraum `2(C) mit dem Skalar-produkt
〈(xj), (yj)〉 :=
∞∑j=0
xjyj
ganz wichtig.3
• in der konkreten Berechung von aufwandigen mathematischen Probleme mit Hilfe desComputers (Numerik von partiellen Differentialgleichungen)
2. Kontraktionen und Banachscher Fixpunktsatz
Wiederholung:
Ein metrischer Raum ist ein Paar (X, d), wobei die Metrik d : X × X −→ R≥0 die folgendenEigenschaften fur alle x, y, z ∈ X erfullen moge
(a) d(x, y) = 0 ⇐⇒ x = y (Definitheit)(b) d(x, y) = d(y, x) (Symmetrie)(c) d(x, y) ≤ d(x, z) + d(z, y) (Dreiecks-Ungleichung)
limn→∞
xn = a ⇐⇒ limn→∞
d(xn, a) = 0
Beispiel 2.1. Ist (V, ‖ · ‖) ein normierter Vektorraum, so definiert d(x, y) := ‖x− y‖ eine Metrikauf V , die von ‖ · ‖ auf V induzierte Metrik.
Sei (X, d) ein metrischer Raum, Y ⊂ X, f : Y → X.
Definition 2.2. Man nennt x ∈ Y einen Fixpunkt von f , falls f(x) = x. Die Abbildung f : Y → Xwird Kontraktion genannt, falls es ein L ∈ [0, 1) gibt, so dass fur alle y, z ∈ Y gilt:
d(f(y), f(z)) ≤ Ld(y, z).
Beispiel 2.3. a ∈ (−1, 1), b ∈ R, X = Y = R. Dann ist f(x) = ax + b eine Kontraktion mitL = |a|.
Kontraktionen sind immer stetig.
Kontraktionen besitzen hochstens einen Fixpunkt. Denn sind x1 und x2 Fixpunkte, so gilt d(x1, x2) ≤Ld(x1, x2), also d(x1, x2) = 0.
3Beispiel: Angenommen ein quantenmechanisches Teilchen kann abzahlbar viele reine Zustande annehmen,die wir mit den naturlichen Zahlen N. Zum Beispiel die moglichen Anregungszustande eines Elektrons um einen
Atomkern mit verschiedener Energie. Das Teilchen wird dann durch einen Vektor ψ ∈ `2(C) mit ‖ψ‖2 = 1 beschrie-
ben, und |ψk|2 ist die Wahrscheinlichkeit, dass eine Messung den k-ten reinen Zustand ergibt. Der Raum `2(C)beschreibt aber auch noch viel kompliziertere Systeme. Solange man noch keine Quantenfeldtheorie betreibt sindalle Hilbert-Raume entweder isomorph zu Ck, k ∈ N mit dem Standard-Skalarprodukt oder zu `2(C).
184 8. TOPOLOGIE
Beispiel 2.4. X = Y = Rr {0}. Dann ist f(x) = x/2 eine Kontraktion ohne Fixpunkte.
SATZ 2.5 (Banachscher Fixpunktsatz). Sei X ein vollstandiger metrischer Raum, A ⊂ X eineabgeschlossene Teilmenge, und Y ⊂ X eine beliebige nicht-leere Teilmenge. Sei f : Y → X eineKontraktion mit f(Y ) ⊂ A ⊂ Y . Dann besitzt f genau einen Fixpunkt.
Beweis. Wahle ein x0 ∈ Y und definiere dann rekursiv
xn+1 = f(xn)
d(xn+1, xn) = d(f(xn), f(xn−1)) ≤ Ld(xn, xn−1)
Fur k ∈ N:
d(xn+k, xn) ≤k∑j=1
d(xn+j , xn+j−1) ≤ (L+ L2 · · ·+ Lk) d(xn, xn−1) ≤ Ld(xn, xn−1)
1− L≤ Ln d(x1, x0)
1− L.
Hieraus sieht man sofort, dass (xn)n∈N eine Cauchy-Folge ist. Da X vollstandig ist, ist sie konver-gent in X.
x := limn→∞
xn = limn→∞
f(xn−1)
Somit ist x Haufungspunkt der Menge f(Y ) und deswegen (nach Aufgabe 4 Ubungsblatt 12 derAnalysis I) in A.
f(x) = f( limn→∞
xn) = limn→∞
f(xn) = limn→∞
xn+1 = x
Also ist x ein Fixpunkt, und nach obiger Bemerkung der einzige.
Beispiel 2.6. Betrachte die Funktion f : [1, 2] → R, f(x) = x + 12 cosx. Dann gilt f ′(x) =
1− 12 sinx ≥ 1/2, also ist f streng monoton wachsend. Auf Grund der Ergebnisse in Abschnitt 4 in
Kapitel 4 gilt cos 1 ≥ 1/2, also f(1) ≥ 5/4, und cos 2 < 0, also f(2) < 2. Es folgt f([1, 2]) ⊂ [5/4, 2].Wegen sinx ≥ x− x3/6 gilt fur alle x ∈ [1, 2] die Ungleichung sinx ≥ 2/3 und somit
f ′(x) ≤ 1− 1
2
2
3=
2
3.
Mit dem Mittelwertsatz ergibt sich daraus |f(x) − f(y)| ≤ (2/3)|x − y| fur x, y ∈ [1, 2], d.h. f isteine Kontraktion. Da [1, 2] vollstandig ist, konvergiert nach dem Banachschen Fixpunktsatz (unddesen Beweis) die rekursiv definierte Folge
x0 := 1, xn+1 := f(xn)
gegen den eindeutigen Fixpunkt a von f . Wegen π/2 ∈ [1, 2] folgt a = π/2 und wir bekommen
|π/2− xn| ≤(
2
3
)n.
Hiermit konnte man ein Computer-Programm zur Berechnung von π schreiben. Es gibt aber deut-lich effizientere Verfahren zur Berechnung von π.
Mi 15.5.
3. TOPOLOGISCHE RAUME 185
3. Topologische Raume
3.1. Wiederholung: Eigenschaften eines metrischen Raums. Wir definieren in einemmetrischen Raum (M,d) fur O,U ⊂M , x ∈M , r > 0:
B(M,d)r (x) := Br(x) := {y ∈M | d(x, y) < r}
U ist Umgebung von x in (M,d) ⇐⇒ ∃r > 0 : Br(x) ⊂ U.
U ist offen in (M,d) ⇐⇒ U ist Umgebung von allen y ∈ U.
Wir haben gesehen (Proposition 5.10 in Kapitel 4):
(1) ∅ und M offen in (M,d).(2) Sind U1 und U2 offene Teilmengen, dann ist auch U1 ∩ U2 offen.(3) Sei (Uj)j∈I eine Familie offener Teilmengen von (M,d), dann ist auch⋃
j∈IUj
eine offene Teilmenge.
In (c) ist wichtig, dass beliebige Indexmengen I erlaubt sind: auch abzahlbar unendliche unduberabzahlbare.
Wir definieren
OM,d := {U ⊂M | U offen in (M,d)}
Wir nennen A ⊂M abgeschlossen, falls M rA offen ist.
Auf Grund der Dreicksungleichung ist Br(x) offen.
Beispiel 3.1. Die diskrete Metrik auf M :
ddisc(x, y) =
{1 falls x 6= y
0 falls x = y.
Fur r = 1/2 und alle x ∈M gilt Br(x) = {x}. Daraus folgt, dass jede Teilmenge von M offen undabgeschlossen ist. Also OM,ddisc
= P(M).
3.2. Definition topologischer Raume.
Definition 3.2. Sei X eine Menge und O ⊂ P(X). Man nennt O eine Topologie auf X, falls gilt:
(1) ∅ ∈ O, X ∈ O,(2) Aus U1 ∈ O und U2 ∈ O folgt U1 ∩ U2 ∈ O,(3) Ist (Ui)i∈I eine Familie, Ui ∈ O, dann gilt auch
⋃i∈I Ui ∈ O.
186 8. TOPOLOGIE
Ein topologischer Raum ist ein Paar (X,O), wobei O eine Topologie auf X ist. Man sagt: U ist eineoffene Menge in (X,O) genau dann, wenn U ∈ O. Wenn die Topologie auf X aus dem Kontextheraus klar ist, schreibt man oft auch X fur (X,O).
Beispiele 3.3. (a) Ist (X, d) ein metrischer Raum, so ist OX,d eine Topologie auf X. Man nenntsie die von d induzierte Topologie.
(b) O := P(X) ist eine Topologie auf X, die sogenannte diskrete Topologie. Sie wird von derdiskreten Metrik ddisc induziert.
(c) Die Klumpentopologie auf X ist definiert als OKlump := {∅, X}.(d) Ist OX eine Topologie auf X. Sei Y ⊂ X. Dann ist
OY := {U ∩ Y | U ∈ OX}eine Topologie auf Y , genannt die Spurtopologie auf Y oder einfach die auf Y induzierteTopologie.
Bild von einer kompakten Teilmenge Y mit glattem Rand in R2, die mit einem offenen Ballin R2 geschnitten wird und so eine offene Teilmenge von Y definiert.
Die Elemente von OY nennt oft auch in Y offene Mengen.(e) Sind ‖ · ‖ und ||| · ||| aquivalente Normen auf dem Vektorraum V , so induzieren sie dieselbe
Topologie auf V . Denn angenommen es gilt fur alle x ∈ V‖x‖ ≤ C|||x||| und |||x||| ≤ C‖x‖.
Dann folgt fur x ∈ V , r > 0:
B(V,‖ · ‖)r (x) ⊂ B(V,||| · |||)
Cr (x), B(V,||| · |||)r (x) ⊂ B(V,‖ · ‖)
Cr (x).
Also fur U ⊂ V :
U offen in (V, ‖ · ‖) ⇐⇒ U offen in (V, ||| · |||).Umgekehrt gilt: Nicht-aquivalente Normen induzieren verschiedene Topologien.
(f) Die Metrik dglm definiert eine Topologie Oglm auf Abb(D,R)(g) Auf dem Raum Abb(D,R) definieren wir die Produkttopologie wie folgt: Fur a, b ∈ R und
x ∈ D definiere
Uxa,b := {f ∈ Abb(D,R) | a < f(x) < b} ⊂ Abb(D,R).
Dann definiere
S := {Uxa,b | a < b und x ∈ D} ⊂ P(Abb(D,R)).
B := {U1 ∩ . . . ∩ Uk | k ∈ N>0 und U1, . . . , Uk ∈ S} ∪ {Abb(D,R)} ⊂ P(Abb(D,R)).
U ∈ Oprod :⇐⇒ ∀x ∈ U : ∃B ∈ B : x ∈ B ⊂ UOprod ist eine Topologie auf Abb(D,R): Die Eigenschaften (1)–(3) in Definition 3.2 sind leichtzu prufen. 4 Man kann mit etwas mehr Aufwand auch zeigen:
4Diese Produkttopologie ist ein Spezialfall einer allgemeineren Konstruktion, siehe [17, Kap. 10].
3. TOPOLOGISCHE RAUME 187
• Oprod ⊂ Oglm und falls D unendlich: Oprod ( Oglm
• Ist D uberabzahlbar unendlich, z.B. D = [0, 1], dann gibt es keine Metrik auf Abb(D,R),die die Topologie Oprod induziert.
• Oprod ”beschreibt“ punktweise Konvergenz, wie wir bald sehen werden.
Bemerkung 3.4. Wieso sind topologische Raume wichtig?
• Es gibt wichtige topologische Raume, die nicht von irgendeiner Metrik induziert werden.Ein Beispiel dafur ist (Abb([0, 1],R),Oprod). Es gibt keine Metrik, die diese Topologieinduziert, siehe hierzu auch Beispiel 3.17.• Oft besitzt ein Raum M verschiedene Metriken, die dieselbe Topologie O induzieren. Zum
Beispiel fuhren alle Normen zur selben Topologie auf Rn. Wenn man nun Definition undSatze erstellt, die nur die Topologie O nutzen, aber nicht die Metrik, dann ist klar, dassdie definierten Begriffe und Satze nicht von der Wahl der passenden Metrik abhangen.• Manche topologische Raume besitzen zwar eine Metrik, diese sieht aber ziemlich un-
handlich aussieht. Auf dem Vektorraum C∞(R,R) der glatten Funktionen wird oft eine
”naturliche“ Topologie definiert5. Die Topologie wird zwar von einer geeigneten Metrik d
induziert. Diese ist aber fur praktische Zwecke unhandlich. Inbesondere gibt es keineNorm auf C∞(R,R), die diese Topologie induziert.
Es ist wichtig, dass Sie moglichst fruh mit topologischen Raumen umgehen, damit Ihnen automa-tisch bewusst ist, welche Definitionen topologischer Natur sind, und welche Definitionen zusatzlicheStruktur (Metriken, Normen, Vektorraume) benotigen.
Definition 3.5. U Umgebung von x :⇐⇒ Es existiert eine offene Menge W mit x ∈W ⊂ U .
A ⊂ X heißt abgeschlossen in (X,O) :⇐⇒ X rA offen in (X,O).
Definition 3.6. Ist N eine Teilmenge eines topologischen Raumes (X,O), dann definieren wir:
den Abschluss oder die abgeschlossene Hulle von N als
N :=⋂{A ⊂ X | N ⊂ A und A abgeschlossen in X} ,
das Innere von N oder den inneren Kern von N als
◦N :=
⋃{U ⊂ N | U offen in X} ,
den Rand von N als
∂N := N r◦N.
LEMMA 3.7.5Wir wollen dies hier nicht tun, sondern nur anmerken, dass sie zum Beispiel wichtig ist, wenn man die in der
Physik oft benutzte”δ-Funktion“ mathematisch sauber verstehen will.
188 8. TOPOLOGIE
(a)◦N = X r (X rN), N = X r
◦︷ ︸︸ ︷(X rN)
(b) x ∈◦N ⇐⇒ N Umgebung von x
(c) x ∈ N ⇐⇒ fur alle Umgebungen U von x gilt: U ∩N 6= ∅(d) x ∈ ∂N ⇐⇒ fur alle Umgebungen U von x gilt: U ∩N 6= ∅ und U ∩ (X rN) 6= ∅.
Beweis. Ubung.
Beispiel 3.8. N = [0, 1]× (0, 1) ⊂ R2, Standard-Norm.◦N = (0, 1)× (0, 1)
N = [0, 1]× [0, 1]
∂N = ([0, 1]× {0, 1}) ∪ ({0, 1} × [0, 1])
Zeichnung von diesen Mengen
Definition 3.9. Eine Teilmenge N ⊂ X heißt dicht , falls N = X.
Beispiel 3.10. Q ist dicht in R (versehen mit Standard-Norm und der induzierten Topologie).
Definition 3.11. Seien (X,OX) und (Y,OY ) topologische Raume, und f : X → Y eine Abbildung,x0 ∈ X. Man nennt f stetig in x0, falls gilt:
Fur jede Umgebung U von f(x0) in Y ist f−1(U) eine Umgebung von x0.
(Kurz: Urbilder von Umgebungen sind Umgebungen.)Man nennt f stetig , falls gilt:
Fur alle U ∈ OY gilt f−1(U) ∈ OX .
(Kurz: Urbilder offener Mengen sind offen.)
Man sieht leicht: f ist genau dann stetig, wenn es in allen x0 ∈ X stetig ist.
Diese Definition verallgemeinert alle bisherigen Definitionen von Stetigkeit.
3.3. Konvergenz in topologischen Raumen.
Definition 3.12. Ein topologischer Raum (X,O) wird Hausdorffraum genannt, falls die Hausdorff-Eigenschaft gilt:
fur alle x, y ∈ X mit x 6= y gibt es offene Mengen Ux und Uy, so dass x ∈ Ux, y ∈ Uy undUx ∩ Uy = ∅.
3. TOPOLOGISCHE RAUME 189
•x
•y
Ux Uy
Abbildung 8: Hausdorff-Eigenschaft
6
LEMMA 3.13. Jeder metrische Raum ist ein Hausdorffraum.
Beweis. Seien x, y ∈ X, x 6= y. Zu r := d(x, y)/3 definiere die offenen Mengen
Ux := Br(x) Uy := Br(y).
Wegen der Dreiecksungleichung gilt Ux ∩ Uy = ∅.
Wiederholung (Definition 2.10 in Kapitel 3):Sei A( · ) eine auf N definierte Aussageform.
Fur fast alle j ∈ N gilt A(j)
:⇐⇒ Es gibt ein j0 ∈ N, so dass fur alle j ∈ N≥j0 : A(j)
⇐⇒ Die Menge {j ∈ N | ¬A(j)} ist endlich
Definition 3.14. Sei (X,O) ein Hausdorffraum, (xi)i∈N eine Folge in X, a ∈ X.
a = limi→∞
xi ⇐⇒ Fur jede Umgebung U von a gilt xi ∈ U fur fast alle i ∈ N
⇐⇒ Zu jeder Umgebung U von a gibt es ein i0 ∈ N, so dass fur alle i ≥ i0: xi ∈ U .
Grenzwerte in Hausdorffraumen sind eindeutig, falls sie existieren. Denn angenommen a und bwaren Grenzwert der Folge (xi)i∈N, a 6= b. Da X ein Hausdorffraum ist, gibt es offene Mengen Uaund Ub mit a ∈ Ua, b ∈ Ub und Ua ∩Ub = ∅. Da Ua eine Umgebung von a ist, gibt es ein i0 ∈ N, sodass fur i ≥ i0 gilt: xi ∈ Ua. Analog dazu gibt es ein j0 ∈ N, so dass fur i ≥ j0 gilt: xi ∈ Ub. Danngilt fur k ≥ max{i0, j0} sogar xk ∈ Ua ∩ Ub = ∅, was offensichtlich nicht moglich ist. Also war dieAnnahme falsch, dass es zwei verschiedene Grenzwerte gibt. 7
Bemerkung 3.15. Nicht jede Topologie wird von einer Metrik induziert.
6Der Hausdorffraum ist nach Felix Hausdorff bennannt, ein Blick in die Biographie wird empfohlen, http:
//de.wikipedia.org/wiki/Felix_Hausdorff.7Man kann Konvergenz auch in topologischen Raumen betrachten, die nicht mehr hausdorffsch sind. Dazu
benotigt man die Theorie der”Filter“, das ist aber in Ihrer Situation doch recht aufwandig im Vergleich zum
Nutzen.
190 8. TOPOLOGIE
Beispiel 3.16. SeiOKlump := {∅, X} die Klumpentopologie auf X. Im Fall #X ≥ 2 ist (X,OKlump)kein Hausdorffraum, also nicht von einer Metrik induziert. 8
Beispiel 3.17. Auf der Menge Abb([0, 1],R) gibt es eine Topologie (die sogenannte Produktto-pologie, siehe z. B. [17, Kap. 10] oder siehe Beispiele 3.3 (g)). Die Produkt-Topologie erfullt dieHausdorff-Eigenschaft. Außerdem gilt: eine Folge genau dann konvergiert, wenn sie punktweisekonvergiert. Es gibt aber keine Metrik auf Abb([0, 1],R), fur die eine Folge von Funktionen ge-nau dann konvergiert, wenn sie punktweise konvergiert. Man kann sogar die starkere Aussage9
zeigen: Es gibt auf C0([0, 1],R) keine Metrik d, so dass eine Folge von stetigen Funktionen genaudann punktweise konververgiert, wenn sie in (C0([0, 1],R), d) konvergiert: M. K. Fort, A note onpointwise convergence, Proc. AMS 2 (1951), 34–35.
Bemerkung 3.18. Ist X ein Hausdorffraum, x ∈ X. Dann ist {x} abgeschlossen. (Begrundung:Ist y ∈ Xr{x}, so liefert die Hausdorff-Eigenschaft eine offene Umgebung Uy von y, die in Xr{x}enthalten ist. Also ist X r {x} offen.)
Definition 3.19. Seien (X,OX) und (Y,OY ) Hausdorffraume. Eine Abbildung ist folgenstetig ,wenn fur alle Folgen (xj)j∈N in X und a ∈ X gilt:
Wenn a = limj→∞
xj , dann f(a) = limj→∞
f(xj)
LEMMA 3.20. Seien X und Y topologische Raume, f : X → Y .
(1) Ist f stetig, dann ist f auch folgenstetig.(2) Ist dX bzw. dY eine Metrik auf X bzw. auf Y , die die Topologie auf X bzw. Y induziert. Dann
ist f genau dann stetig, wenn f folgenstetig ist.
Beweis.Zu (1): Es gelte a = limj→∞ xj in X. sei U eine Umgebung von f(a) in Y . Da f stetig in a ist, istf−1(U) eine Umgebung von a. Somit gilt xj ∈ f−1(U) fur fast alle j ∈ N. Daraus folgt fur diese jauch f(xj) ∈ U . Es folgt f(a) = limj→∞ f(xj).
Zu (2):”=⇒“ ist nun gezeigt. Den Beweis von
”⇐=“ erhalten wir aus dem Beweis von Lemma 1.7
”=⇒“ aus Kapitel 4, indem wir |x− x0| durch dX(x, x0) und |f(x)− f(x0)| durch dY (f(x), f(x0))
ersetzen.10
8Man kann genau sagen, welche topologischen Raume von einer Metrik induziert werden und welche nicht. Der
Metrisierungssatz von Bing, Nagata und Smirnow gibt hierfur Kriterien, die hinreichend und notwendig sind, siehe
[29, Satz 10.14]. Die Formulierung und der Beweis dieses Satzes ist eine wichtige kulturelle Leistung der Mathematik,aber gebraucht habe ich bisher den Satz leider noch nie. Wenn man sich jedoch zu dem Satz durcharbeitet, lerntmal sehr viele nutzliche Hilfsmittel kennen.
9Begrunden Sie als Ubung, wieso diese Aussage starker ist!10Solche Beweise, in denen Teile in alten Beweisen ersetzt werden, mag ich eigentlich nicht. Denn man macht
da ganz schnell Fehler. Um solche Verallgemeinerungen zu vermeiden, hatten wir aber noch fruher metrische Raumeeinfuhren mussen. Und dies ist auch der Grund, wieso wir jetzt topologische Raume behandeln: damit wir spaterdie kommenden Aussagen nicht noch einmal so ahnlich zeigen mussen.
4. ZUSAMMENHANG UND WEGZUSAMMENHANG 191
!ACHTUNG!. Es gibt eine Abbildung f : X → Y , X und Y topologische Raume11, mit denfolgenden Eigenschaften
• f ist folgenstetig, d.h. fur xi, x ∈ X folgt aus x = limi→∞ xi auch f(x) = limi→∞ f(xi).• f ist nicht stetig
Da solche”exotischen“ Beispiele in der Vorlesung keine Rolle spielen werden, wird diese Tatsache
nur im Skript kurz erwahnt.
4. Zusammenhang und WegzusammenhangFr 17.5.
Schreibweise: X fur (X,OX), wenn klar ist, welche Topologie auf X zu wahlen ist. Beispiel: Rntragt (fast immer) die von der Standard-Norm induzierte Topologie.
Schreibweise: Disjunkte Vereinigung U•∪ V = X bedeutet U ∪ V = X und U ∩ V = ∅.
Definition 4.1. Ein topologischer Raum X heißt nicht zusammenhangend , wenn es nicht-leere of-
fene Mengen U, V ⊂ X mit U•∪ V = X gibt. Zusammenhangend := nicht nicht zusammenhangend.
Ist A ⊂ X und ist OX eine Topologie auf X, dann definiert man auch :
A ist zusammenhangend :⇐⇒ (A,OA) ist zusammenhangend
Hierbei ist OA die auf A induzierte Topologie (Spurtopologie).
Beispiele 4.2.
(a) Die Menge {0, 1} ⊂ R ist nicht zusammenhangend.12 Denn {0} = B1/2(0) ∩ {0, 1} ist offen in{0, 1}. Analog ist {1} offen in {0, 1}. Und
{0, 1} = {0}•∪ {1}.
(b) Mehrere Bilder, u.a. eines mit zwei disjunkten Ballen in R2.Nicht zusammenhangend.
(c) Sei Q mit der Standardtopologie (d.h. mit der von d(x, y) = |x−y| induzierte Topologie) verse-
hen. Dann ist Q nicht zusammenhangend. Definiere U := (−∞,√
2)∩Q und V := (√
2,∞)∩Q.
Die Mengen U und V sind offen in Q. 13 U•∪ V = X.
(d) eine Teilmenge A von R ist zusammenhangend, gdw A ein Intervall ist. (Ubungsblatt 5 Aufgabe1)
11Dies geht naturlich nicht mit metrischen Raumen, wie oben gezeigt!12Wenn nichts anderes angegeben ist, hat R immer die Standard-Topologie und eine Teilmenge von R die
induzierte Topologie. In diesem Spezialfall ist die diskrete Topologie auf {0, 1}.13Sie sind nicht offen in R, aber offen in Q. Wer dies nicht versteht, muss nochmals genau die Definition der
Spurtopologie lesen.
192 8. TOPOLOGIE
PROPOSITION 4.3. Seien X und Y topologische Raume, f : X → Y stetig und X zusam-menhangend. Dann ist f(X) (mit der Spurtopologie von Y versehen) ebenfalls zusammenhangend.
Beweis. Angenommen f(X) ist nicht zusammenhangend. Dann gibt es Mengen U und V mit denfolgenden Eigenschaften:
• U•∪ V = f(X),
• U offen in f(X), d.h. es gibt eine offene Teilmenge U von Y mit U = Y ∩ U (sieheDefinition der Spurtopologie),
• V offen in f(X), d.h. es gibt eine offene Teilmenge V von Y mit V = Y ∩ V (sieheDefinition der Spurtopologie).• U 6= ∅ und V 6= ∅
Da f stetig ist, ist auch f−1(U) = f−1(U) offen, und offensichtlich gilt f−1(U) 6= ∅. Analog fur
f−1(V ). Außerdem haben wir X = f−1(U)•∪ f−1(V ).
Beispiel 4.4. Ist f : X → R stetig und X zusammenhangend. Dann ist f(X) ein Intervall.
Wenn wir den Spezialfall betrachten, dass X = I ein Intervall ist, und Y = R, so erhalten wirwieder die folgende Aussage, die wir als Korollar 2.4 in Kapitel 4 bereits bewiesen haben
KOROLLAR 2.4 in Kap. 4. Sei I ⊂ R ein Intervall und f : I −→ R stetig. Dann ist f(I) ebenfallsein Intervall.
Aus diesem Korollar erhalt man auch den Zwischenwertsatz. Proposition 4.3 verallgemeinert alsoden Zwischenwertsatz.
Definition 4.5. Sei X ein topologischer Raum, x, y ∈ X. Ein Weg von x nach y in X ist einestetige Abbildung s : [0, 1]→ X mit s(0) = x und s(1) = y.
Ein topologischer Raum X ist wegzusammenhangend , wenn es zu allen Punkten x, y ∈ X einenWeg von x nach y gibt.
PROPOSITION 4.6. Ist X wegzusammenhangend, so ist X auch zusammenhangend.
Beweis: Ubungsblatt 5.
Beispiel 4.7. Eine Menge A ⊂ Rn heißt sternformig bezuglich x0 ∈ A, falls gilt: ist x ∈ A undt ∈ [0, 1], dann haben wir auch (1− t)x0 + tx ∈ A.
Bild einer sternformigen Menge mit Zentrum x0 und einem Punkt x, sowie derVerbindungsstrecke dieser Punkte
Sternformige Mengen sind wegzusammenhangend, also auch zusammenhangend.
5. FOLGENKOMPAKTHEIT 193
Bemerkung 4.8. Wir betrachten die folgende Teilmenge von R2
M :=({0} × [−1, 1]
)∪ {(x, sin(π/x)) | x ∈ R>0}
und versehen M mit der von der Standardtopologie auf R2 induzierten Topologie.
Bild dieser Menge
Die Menge M ist zusammenhangend, aber nicht wegzusammenhangend.
UBUNG 4.9. Ist X wegzusammenhangend und f : X → Y stetig. Dann ist auch f(X) wegzu-sammenhangend.
5. Folgenkompaktheit
Definition 5.1. Sei (X,OX) ein Hausdorffraum. Wir sagen, (X,OX) ist folgenkompakt , wennjede Folge in X eine (in (X,OX)) konvergente Teilfolge besitzt. Eine Teilmenge A ⊂ X nennt manfolgenkompakt, wenn (A,OA) folgenkompakt ist, wobei OA die Spurtopologie auf A ist.
Diese Definition verallgemeinert die analoge Definition fur metrische Raume, siehe Definition 5.19in Kapitel 4.
SATZ 5.2. Sei (V, ‖ · ‖) ein endlich-dimensionaler reeller oder komplexer Vektorraum. Wir ver-sehen V mit der von ‖ · ‖ induzierten Topologie. Eine Teilmenge A von V ist genau dann folgen-kompakt, wenn sie abgeschlossen und beschrankt ist.
Wdh: A beschrankt ⇐⇒ ∃C ∈ R≥0 : ∀x ∈ A : ‖x‖ ≤ C
Beispiele 5.3. Ein Intervall I ist genau dann folgenkompakt, wenn es abgeschlossen und be-schrankt ist, d.h. wenn es a, b ∈ R, a ≤ b gibt mit I = [a, b].
Die folgenden Teilmengen von V = Rn sind folgenkompakt:Abgeschlossene Balle Br(x0) := {x ∈ V | ‖x− x0‖ ≤ r} bezuglich beliebiger Normen.Quader [a1, b1]× [a2, b2]× · · · × [an, bn].
Ist (V, ‖ · ‖) ein normierter Vektorraum. Aus der Dreiecks-Ungleichung folgt∣∣∣‖x‖ − ‖y‖∣∣∣ ≤ ‖x− y‖und hieraus folgt die Stetigkeit der Norm V → R, x 7→ ‖x‖.
Beweis von Satz 5.2. O.B.d.A. V = Rn.
”=⇒“: Sei A folgenkompakt.
Dann ist A abgeschlossen nach Lemma 5.20 aus Kapitel 4 (Es besagt: Folgen-kompakte TeilmengenA in einem metrischen Raum X sind in X abgeschlossen.)
194 8. TOPOLOGIE
Angenommen A ist nicht beschrankt. Dann gibt es eine Folge (ai) mit ‖ai‖ → ∞. Eine Teilfolge(af(i)) konvergiert dann gegen y ∈ A. Es folgt
‖y‖ = limi→∞
‖af(i)‖ =∞.
Widerspruch.
”⇐=“: Ist A beschrankt, so ist jede A-wertige Folge (ai)i∈N beschrankt. Nach dem Satz von
Bolzano-Weierstraß (Lemma 1.6 bzw. Korollar 1.9) besitzt die Folge eine konvergente Teilfolge(af(i))i∈N mit Grenzwert a. Wenn A zusatzlich abgeschlossen ist, so konvergiert die Teilfolge in Agegen a. Somit ist A folgenkompakt.
SATZ 5.4 (Verallgemeinert Satz 5.22 in Kapitel 4). Seien X,Y Hausdorffraume und sei f : X → Yfolgenstetig14. Ist X folgenkompakt, dann ist auch B := im(f) (versehen mit der Spurtopologie)folgenkompakt.
Der Beweis geht vollig gleich wie der Beweis von Satz 5.22 in Kapitel 4.
Beweis. Sei (an)n∈N eine Folge in B. Wahle bn ∈ X mit f(bn) = an. Wahle eine konvergenteTeilfolge (bj(n)), b := limn→∞ bj(n). Da f stetig ist, haben wir
f(b) := limn→∞
f(bj(n))︸ ︷︷ ︸=aj(n)
.
Somit ist eine konvergente Teilfolge von (an)n∈N gefunden. Wir haben die Folgenkompaktheit von Buberpruft.
Beispiel 5.5. Ist f : [a, b] → R stetig, dann ist f([a, b]) ein folgenkompaktes Intervall, d.h.f([a, b]) = [c, d] fur geeignete c, d ∈ R.
KOROLLAR 5.6. Ist X ein folgenkompakter Hausdorffraum und f : X −→ R (folgen-)stetig.Dann nimmt f ein Maximum und ein Minimum an, d.h. es gibt x1, x2 ∈ X, so dass fur allex ∈ X:
f(x1) ≤ f(x) ≤ f(x2).
Schreibweise: max f := max f(X) = max{f(x) | x ∈ X}. min f analog.
Beweis. Schreibe das folgenkompakte Intervall im(f) als [a1, a2]. Wahle xi mit f(xi) = ai.
Bemerkung 5.7. Folgenkompakte metrische Raume sind vollstandig. Denn besitzt eine Cauchy-Folge eine Teilfolge, die gegen x0 konvergiert, so konvergiert die gesamte Cauchy-Folge gegen x0.
Den Rest des Abschnitts wollen wir zunachst in der Vorlesung aus Zeitgrunden uberspringen. DieResultate werden spater im Beweis von
”folgenkompakt =⇒ kompakt“ in Theorem 6.7 nutzen.
14Die Proposition ist naturlich auch richtig, wenn wir”folgenstetig“ durch
”stetig“ ersetzen, denn jede stetige
Funktion ist folgenstetig.
6. KOMPAKTHEIT 195
LEMMA 5.8. Sei (X, d) ein folgenkompakter metrischer Raum, und ε > 0. Dann gibt es k ∈ Nund {x1, x2, . . . xk} ⊂ X, so dass
X = Bε(x1) ∪Bε(x2) ∪ · · · ∪Bε(xk).
Beweis. O.B.d.A. X 6= ∅. Wahle ein x1 ∈ X. Wahle nun weitere xi rekursiv: Falls x1, x2,. . .xjgewahlt sind, so setze
Aj := X r (Bε(x1) ∪Bε(x2) ∪ · · · ∪Bε(xj)).Im Fall Aj = ∅ ist die Behauptung gezeigt. Andernfalls wahle ein xj+1 ∈ Uj .
Wenn die Aussage des Lemmas nicht gilt, so erhalten wir eine Folge (xi)i∈N mit d(xi, xj) ≥ ε furalle i 6= j. Solch eine Folge besitzt keine konvergente Teilfolge. Also ist X nicht folgenkompakt.
FOLGERUNG 5.9. Ist X ein folgenkompakter metrischer Raum, so existiert eine Folge (xj)j∈N,so dass {xj | j ∈ N} dicht ist. In anderen Worten: X besitzt eine abzahlbare dichte Teilmenge.
Beweis. Zu n ∈ Nr {0} wahle kn ∈ N und xnj ∈ X, so dass
X =
kn⋃j=1
B1/n(xnj ).
Wir nehmen nun die Folge
(xj)j∈N = (x11, . . . x
1k1 , x
21, . . . , x
2k2 , x
31, . . .)
Sei nun ein beliebiges y ∈ X gegeben. Zu zeigen ist, dass y im Abschluss von A := {xj | j ∈ N}liegt. Zu jedem n ∈ N wahle ein jn, so dass y ∈ B1/n(xnjn), also d(y, xjn) < 1/n. Also ist (xjn)n∈Neine Folge in A, die gegen y konvergiert. Somit y ∈ A.
6. Kompaktheit
Wir fuhren nun eine andere Eigenschaft ein, die sich”Kompaktheit“ nennt, und werden dann die
erstaunliche und weitreichende Tatsache beweisen, dass metrische Raume genau dann kompaktsind, wenn sie folgenkompakt sind.
Definition 6.1. Sei X ein topologischer Raum.
(1) Eine offene Uberdeckung von X ist eine Familie (Ui)i∈I von offenen Mengen15 mit X =⋃i∈I Ui.
(2) Wir sagen X erfullt die Heine-Borel-Eigenschaft , falls gilt:Zu jeder offenen Uberdeckung (Ui)i∈I von X gibt es ein k ∈ N und i1, i2, . . . , ik ∈ I mit
X = Ui1 ∪ Ui2 ∪ · · · ∪ Uik .
15Gemeint ist damit naturlich: alle Ui sind offen in X.
196 8. TOPOLOGIE
16 Man nennt eine solche Uberdeckung eine endliche Teiluberdeckung .17
(3) Man nennt X kompakt , falls X ein Hausdorffraum ist und die Heine-Borel-Eigenschaft erfullt.18
LEMMA 6.2. Wir versehen X mit der diskreten Topologie. Dann ist X kompakt, genau dannwenn X endlich ist.
Beweis. Offensichtlich ist jede endliche Menge kompakt.
Angenommen X ist kompakt und diskret (d.h. mit der diskreten Topologie versehen). Fur x ∈ Xist Ux := {x} offen. Also ist (Ux)x∈X eine offene Uberdeckung von X. Da X kompakt ist, gibt eseine endliche Menge J ⊂ X, so dass X =
⋃x∈J Ux = J . Also ist bereits X endlich.
PROPOSITION 6.3. Sei X ein kompakter topologischer Raum und sei A eine abgeschlosseneTeilmenge. Dann ist A ebenfalls kompakt.
Beweis. Sei (Ui)i∈I eine offene Uberdeckung von A. Da A die Spurtopologie von X tragt, gibt es
Mengen Ui, offen in X mit Ui = A ∩ Ui. Sei i0 6∈ I, J := I ∪ {i0}, Ui0 := X rA. Dann ist (Ui)i∈Jeine offene Uberdeckung von X. Da X kompakt ist, gibt es eine endliche Menge K ⊂ J , so dass
(Ui)i∈K bereits X uberdeckt. Dann uberdeckt (Ui)i∈Kr{i0} bereits A.
UBUNG 6.4. () Zeigen Sie, dass Lemma 6.2 und Proposition 6.3 auch dann gelten, wenn man
”kompakt“ durch
”folgenkompakt“ ersetzt.
PROPOSITION 6.5. Sei X ein Hausdorffraum und A eine kompakte Teilmenge 19. Dann ist Aabgeschlossen.
Beweis. Wir zeigen, dass X r A offen ist. Sei y ∈ X r A. Zu jedem x ∈ A gibt es auf Grundder Hausdorff-Eigenschaft disjunkte offene Mengen Ux und Uxy , so dass x ∈ Ux und y ∈ Uxy .Achtung: Wie die Notation ja bereits andeutet, hangt Uxy von x ab! Nun ist (A ∩ Ux)x∈A eine
offene Uberdeckung von A. Auf Grund der Kompaktheit von A gibt es x1, . . . , xk ∈ A mit
A = (A ∩ Ux1) ∪ . . . ∪ (A ∩ Uxk)
Wir setzen
Vy :=
k⋂i=1
Uxiy offen in X.
16Man wundert sich vielleicht, wieso wir nicht k ∈ N r {0} genommen haben. Dies liegt am Spezialfall X = ∅,der (Ui)i∈∅ als offene Uberdeckung hat. Fur ihn wahlt man k = 0. Die leere Menge erfullt also die Heine-Borel-
Eigenschaft und ist kompakt.17Teiluberdeckung bedeutet hier nicht, dass der Raum nur zum Teil uberdeckt wird. Er wird ganz uberdeckt. Die
Aussage ist vielmehr: Man kann alle bis auf endlich viele der Ui’s weglassen und hat immer noch eine Uberdeckung.
Man uberdeckt mit einem endlichen Teil der offenen Mengen.18Achtung: Manche Mathematiker nennen einen topologischen Raum kompakt, sobald er die Heine-Borel-
Eigenschaft erfullt, ohne die Hausdorff-Eigenschaft einzuschließen. Wenn Sie ein Buch oder Skript zu diesem Themain die Hand nehmen, mussen Sie immer uberprufen, welche Definition nun benutzt wird. Ahnlich wie in der Frage,ob 0 eine naturliche Zahl ist oder nicht, gibt es hier eben verschiedene ubliche Konventionen.
19wie immer: bezuglich der Spur-Topologie
6. KOMPAKTHEIT 197
Also ist X rA =⋃y∈XrA Vy ebenfalls offen.
PROPOSITION 6.6. Seien X,Y Hausdorffraume und sei f : X → Y stetig. Ist X kompakt, dannist auch das Bild im(f) = f(X) (versehen mit der Spurtopologie) kompakt.
Beweis. Sei (Ui)i∈I eine offene Uberdeckung von f(X), Ui offen in f(X). Dann ist(f−1(Ui)
)i∈I
eine offene Uberdeckung von X. Wegen der Kompaktheit von X gibt es eine endliche Menge J ,so dass bereits
(f−1(Ui)
)i∈J die Menge X uberdeckt. Wegen f(f−1(Ui)) = Ui ∩ f(X) = Ui folgt,
dass (Ui)i∈J bereits f(X) uberdeckt.
THEOREM 6.7. Sei X ein metrischer Raum. Dann ist X genau dann folgenkompakt, wenn Xkompakt ist.
Beweis des Theorems.
”kompakt =⇒ folgenkompakt“: Sei X kompakt. Sei (an)n∈N eine Folge in X.
1. Fall: A := {an | n ∈ N} besitzt keinen Haufungspunkt in XAlso ist A abgeschlossen, und somit kompakt. Außerdem ist die Topologie auf A diskret. WegenLemma 6.2 ist dann A endlich. Nach dem Schubfach-Prinzip 20 gibt es also ein a ∈ A, so dassI := {n ∈ N | an = a} unendlich ist. Dann ist (an)n∈I eine Teilfolge21 von (an)n∈N, die konstantgleich a ist und somit gegen a konvergiert.
2. Fall: {an | n ∈ N} besitzt einen Haufungspunkt x0 in XEs folgt mit Lemma 5.17 aus Kapitel 4 die Existenz einer konvergenten Teilfolge.
”folgenkompakt =⇒ kompakt“:
Sei X folgenkompakt. Gegeben sei eine offene Uberdeckung (Ui)i∈I von X.
Wir zeigen in einem ersten Schritt, dass es eine abzahlbare Menge J ⊂ I gibt, so dass (Ui)i∈J eine(offene) Uberdeckung ist. 22. In einem zweiten Schritt zeigen wir dann, dass es eine endliche MengeK ⊂ J gibt, so dass (Ui)i∈K eine (offene) Uberdeckung ist.
1. Schritt:Sei D eine abzahlbare dichte Teilmenge von X, die es auf Grund von Folgerung 5.9 in X gibt.Dann ist
B := {B1/n(p) | n ∈ N, p ∈ D}
20Das sogenannte Schubfach-Prinzip besagt anschaulich: wenn ich unendlich viele Kugeln in endlich viele Schub-laden einsortieren, dann habe ich einer Schublade (= Schubfach) unendlich viele Kugeln. Mathematisch praziser:
Ist eine Funktion g : N → A, gegeben mit A endlich, so gibt es ein a ∈ A mit unendlichem g−1(a). Es sollte Ihneninzwischen klar sein, wie man des Schubfach-Prinzips beweist.
21Wir schreiben hier Teilfolgen zum ersten Mal auf eine andere Art und Weise. Wenn man die eindeutige streng
monoton wachsende Bijektion f : N→ I wahlt, so ist mit (an)n∈I die Teilfolge (af(n))n∈N gemeint.22Der erste Schritt wird in der Vorlesung ubersprungen
198 8. TOPOLOGIE
eine abzahlbare Menge offener Mengen. Man sieht schnell, dass jede offene Menge in X eine Ver-einigung geeigneter Elemente von B ist. Sei nun
B′ := {U ∈ B | ∃i ∈ I : U ⊂ Ui}und zu jedem U ∈ B′ wahlen wir solch ein i = f(U), also U ⊂ Ui(U), f : B′ → I. Sei J := f(B′).Da B abzahlbar ist, ist es auch B′ und somit J .
Wir mussen fur diesen Schritt noch zeigen, dass (Ui)i∈J uberdeckt. Sei also x ∈ X. Dann gibt esi ∈ I mit x ∈ Ui. Wahle n ∈ N, so dass B2/n(x) ⊂ Ui. Wahle ein p ∈ D mit d(p, x) < 1/(2n).Dann gilt x ∈ B1/n(p) ⊂ B2/n(x) ⊂ Ui und B1/n(p) ∈ B′. Also auch x ∈ Uf(B1/n(p)).
2. Schritt:Sei nun also (Ui)i∈J eine offene Uberdeckung mit J abzahlbar. O.B.d.A. J = N. Wir nehmenan, dass Vn :=
⋃ni=1 Ui eine echte Teilmenge von X ist23 fur alle n ∈ N. Wahle xn ∈ X r Vn.
Wahle eine konvergente Teilfolge (xf(n))n∈N der Folge (xn)n∈N. Es gibt nun ein j ∈ N, so dasslimn→∞ xf(n) ∈ Uj . Da Uj offen ist, liegt fur fast alle n ∈ N dann xf(n) ∈ Uj . Unter anderem gibtes ein n ∈ N, f(n) ≥ j, mit xf(n) ∈ Uj , was offensichtlich ein Widerspruch zur Konstruktion derxj ist.
Also gibt es ein Vn mit Vn = X.
Bemerkung 6.8. Es gibt Hausdorffraume, die kompakt, aber nicht folgenkompakt sind. Es gibtauch Hausdorffraume, die folgenkompakt, aber nicht kompakt sind. Siehe im Buch [32].
Mehr zum Thema folgenkompakte/kompakt inklusive schoner Bilder findet man hier: http://
simomaths.wordpress.com/2013/02/24/topology-sequentially-compact-spaces-and-compact-spaces
Beispiel 6.9. Fur eine Teilmenge A eines endlich-dimensionalen normierten Vektorraums sindaquivalent:
(1) A ist beschrankt und abgeschlossen(2) A ist kompakt(3) A ist folgenkompakt
Mi 22.5.
Definition 6.10. Seien X und Y topologische Raume. Eine Abbildung f : X → Y nennt manHomoomorphismus, falls gilt:
• f ist stetig• f ist bijektiv• f−1 : Y → X ist stetig
In anderen Worten: f ist eine Bijektion mit der Eigenschaft
U offen in X ⇐⇒ f(U) offen in Y.
23Erinnerung:”A echte Teilmenge von X“ bedeutet: A ⊂ X und A 6= X.
6. KOMPAKTHEIT 199
Existiert ein Homoomorphismus von X nach Y , so nennt man X und Y homoomorph. Homoomor-phie ist eine Aquivalenzrelation auf der Klasse 24 aller topologischer Raume.
SATZ 6.11. Ist X ein kompakter topologischer Raum, Y ein Hausdorffraum und f : X → Ybijektiv und stetig, dann ist f ein Homoomorphismus.
Beweis. Aufgabe 1 auf Ubungsblatt 6.
Definition 6.12. Sind (M,dM ) und (N, dN ) metrische Raume. Eine Abbildung f : M → N heißtgleichmaßig stetig , falls
(6.13) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x, y ∈M :(dM (x, y) < δ =⇒ dN (f(x), f(y)) < ε
).
LEMMA 6.14. Sind (M,dM ) und (N, dN ) metrische Raume, und f : M → N stetig. Ist Mkompakt, so ist f gleichmaßig stetig.
Insbesondere folgt hieraus das noch nicht bewiesene Lemma 4.1 in Kapitel 6.
Beweis. Angenommen f ist nicht gleichmaßig stetig. Es gibt dann ein ε > 0, so dass
(6.15) ∀δ ∈ R>0 : ∃x, y ∈M : dM (x, y) < δ ∧ dN (f(x), f(y)) ≥ ε.
Zu jedem n ∈ N r {0} und δ := δn := 1/n wahlen wir xn, yn ∈ M wie in (6.15). Da M kompaktund somit folgenkompakt ist, gibt es eine Teilfolge (xnk)k∈N, so dass
x := limk→∞
xnk
in M existiert. Wegen d(xnk , ynk) < 1/nk gilt auch x = limk→∞ ynk . Da f (folgen-)stetig ist giltdann auch
f(x) = limk→∞
f(xnk) = limk→∞
f(ynk),
also
limk→∞
dN(f(xnk), f(ynk)
)= 0.
Dies widerspricht jedoch der obigen Wahl von xnk und ynk , denn diese haben wir so gewahlt, dassfur alle k ∈ N die Ungleichung dN
(f(xnk), f(ynk)
)≥ ε gilt.25
Wir haben gezeigt, dass die Annahme, f sei nicht gleichmaßig stetig, einen Widerspruch impliziert.Also muss f gleichmaßig stetig sein.
Sei (X, d) ein metrischer Raum und ∅ 6= Y ⊂ X. Definiere fur x ∈ X
d(x, Y ) := inf{d(x, y) | y ∈ Y }
24Die Gesamtheit aller topologischer Raume ist so groß, dass es keine Menge mehr ist, sondern eine Klasse.Siehe den Anfang der Analysis I.
25Und naturlich fur das feste oben gewahlte ε > 0!
200 8. TOPOLOGIE
Dann gilt
d(x, Y ) = 0 ⇐⇒ x ∈ Y ,d(x,X r U) ≥ r ⇐⇒ Br(x) ⊂ U.
UBUNG 6.16 (Aufgabe 4 (ii) (a) auf Ubungsblatt 3). Die Funktion X → R, x 7→ d(x, Y ) iststetig.
Beweis. (Losung der Aufgabe)
d(x1, y) ≤ d(x1, x2) + d(x2, y)
Nehme das Infimum uber y ∈ Y :
d(x1, Y ) ≤ d(x1, x2) + d(x2, Y )
und analoges gilt, wenn wir x1 und x2 vertauschen. Es folgt
|d(x1, Y )− d(x2, Y )| ≤ d(x1, x2).
Daraus folgt, dass x 7→ d(x, Y ), X → R stetig ist.
PROPOSITION 6.17. Sei (X, d) ein kompakter metrischer Raum und (Ui)i∈I eine offene Uber-deckung. Dann gibt es ein ε > 0 mit der folgenden Eigenschaft: Zu jedem x ∈ X gibt es ein i ∈ Imit Bε(x) ⊂ Ui.
Solch ein ε nennt man eine Lebesguesche Zahl .Fr 24.5.
Eine kompakte Teilmenge in R2 mit Uberdeckung und darin ε-Balle.
Beweis. Da X kompakt ist, gibt es eine endliche Teiluberdeckung (Ui)i∈J , also J ⊂ I endlich.O.B.d.A. J = {1, 2, . . . , k}. Die Funktion
f : X → R, x 7→ 1
k
k∑i=1
d(x,X r Ui)
ist stetig. Gilt x ∈ Ui, so ist d(x,X r Ui) > 0. Da jedes x ∈ X in U1 ∪ . . . ∪ Uk enthalten ist, giltf(x) > 0. Da X kompakt ist, nimmt f sein Minimum in einem Punkt x0 ∈ X an.
Setzeε := min f = f(x0) > 0.
Aus f(x) ≥ ε folgt, dass es mindestens ein i ∈ {1, 2, . . . , k} gibt mit d(x,X r Ui) ≥ ε, alsoBε(x) ⊂ Ui.
KAPITEL 9
Differential-Rechnung fur Funktionen in mehrerenVeranderlichen
1. Vorbemerkungen
Die Worte”Veranderliche“ und
”Variable“ haben im folgenden dieselbe Bedeutung.
In diesem Kapitel versehen wir Rn mit irgendeiner Norm ‖ · ‖. Die davon induzierte Topologie istdie Standard-Topologie, denn alle Normen auf Rn sind aquivalent.
Standard-Basis von Rn: (e1, e2, . . . , en).
L(Rn,Rk) :={
Lineare Abbildungen von Rn nach Rk} ∼= {k × n-Matrizen} =: Rk×n
Bei Prof. Cisinski wurde Mk×n(K) an Stelle von Kk×n verwendet.
Abweichend von unserer bisherigen Schreibweise, ubernehmen wir von nun an die in der LinearenAlgebra ubliche Konvention, dass Elemente von Rn als Spaltenvektoren geschrieben werden. Wirschreiben auch
x = (x1, x2, . . . , xn)T =
x1
x2
...xn
∈ Rn
LEMMA 1.1. Ist A : Rn → Rk eine lineare Abbildung, dann ist A stetig.
Beweis. Schreibe x = (x1, . . . , xn)T =∑nj=1 xjej ∈ Rn und
Ax =
k∑i=1
n∑j=1
aijxjei.
201
202 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Da alle Normen auf Rn und Rk aquivalent sind, reicht es, die Behauptung fur die Supremumsnormzu zeigen.
‖Ax‖∞ ≤
maxi∈{1,2...,k}
n∑j=1
|aij |
︸ ︷︷ ︸
C:=
‖x‖∞ ≤ C‖x‖∞.
Zu gegebenem ε > 0 setze δ := ε/C. Dann gilt
d∞(x, y) = ‖x− y‖∞ < δ =⇒ d∞(Ax,Ay) = ‖Ax−Ay‖∞ = ‖A(x− y)‖∞ < ε.
KOROLLAR 1.2. Sind V und W endlich-dimensionale normierte Vektorraume, und A : V →Wlinear, dann ist A stetig.
Bemerkung 1.3. Sei V ein Vektorraum mit Basis (bn | n ∈ N), den wir mit der zugehorigenSupremumsnorm
‖∑n=0
xnbn‖∞ := maxn∈{0,...,`}
|xn|
versehen. Dann gibt es genau eine lineare Abbildung A : V → R mit A(bn) = n. Diese Abbildungist nicht stetig. Denn setzen wir an := 1√
nbn ∈ V , dann ist (an)n∈Nr{0} eine Nullfolge in (V, ‖ · ‖∞),
aber f(an) =√n→∞ fur n→∞.
Bemerkung 1.4. Das meiste, was wir in diesem Kapitel machen, gilt ebenso (zumeist mit densel-ben Beweisen), wenn man
• Rn, Rk und ahnliche Raume durch beliebige (auch unendlich-dimensionale) Banachraume1
ersetzt und• lineare Abbildungen (und endliche Matrizen) durch stetige lineare Abbildungen ersetzt.
Fur Details verweisen wir auf das Buch [2]. Der mathematische Mehraufwand ist gering. In derVorlesung schranken wir uns auf Raume Rn, Rk,. . . ein, damit klar ist, dass dies zunachst diewichtigen Beispiele sind, die Sie moglichst grundlich verstehen mussen. Es folgt dann auch unmit-telbar2, dass alle von uns bewiesenen Aussagen dann auch in endlich-dimensionalen normiertenVektorraumen V gelten, indem wir eine Basis von V wahlen und dann mit Rn identifizieren.
2. Differenzierbarkeit in mehreren Variablen
1also vollstandige normierte Vektorraume2Das heißt hier: ohne nochmals in die Beweise schauen zu mussen.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 203
Definition 2.1. Sei U ⊂ Rn offen, p ∈ U . Wir sagen, f : U → Rk ist total differenzierbar in poder differenzierbar in p, falls es eine lineare Abbildung A : Rn → Rk gibt mit
(2.2) limh→0
f(p+ h)− f(p)−Ah‖h‖
= 0.
Wir sagen, f ist differenzierbar auf W ⊂ U , wenn f in allen p ∈ W differenzierbar ist. Und f istdifferenzierbar, wenn f auf U differenzierbar ist.
3
PROPOSITION 2.3. Sei f , U , p wie oben. Dann gibt es hochstens ein A ∈ Rk×n, fur das (2.2)gilt.
Falls f differenzierbar in p ist, dann nennt man das obige (eindeutig bestimmte) A die (totale)Ableitung oder das (totale) Differential von f in p und schreibt sie als Dpf := A und f ′(p) := A.
PROPOSITION 2.4. Ist f differenzierbar in p, dann ist f stetig in p.
Beweis der beiden vorangehenden Propositionen. (2.2) ist aquivalent zu der Aussage: Es gibt einein p stetige Funktion r : U → Rk mit r(p) = 0 und
f(p+ h) = f(p) +Ah+ r(p+ h)‖h‖ fur alle h ∈ Rn mit p+ h ∈ U.
Wir schreiben x fur p+h. Die Funktionen U 3 x 7→ f(p) ∈ Rk, x 7→ A(x−p) und x 7→ r(x)‖x−p‖sind stetig in p und somit auch x 7→ f(x). Also ist Proposition 2.4 gezeigt.
Wir zeigen nun Proposition 2.3. Angenommen (2.2) gilt fur A := A1 ∈ Rk×n und A := A2 ∈ Rk×n.O.B.d.A. sei U ⊃ Bε(p0). Bestimme4 nun zugehorige ri zu Ai. Es gilt fur x = p+ h ∈ U :
A1h+ r1(p+ h)‖h‖ = A2h+ r2(p+ h)‖h‖
Wenn wir nun fur t ∈ [0, 1] die Variable h durch th ersetzen, ergibt sich
t(A1 −A2)(h) = (A1 −A2)(th) = (r2(p+ th)− r1(p+ th)) ‖th‖ = (r2(p+ th)− r1(p+ th)) t‖h‖.
Wir dividieren durch t und bekommen:
(A1 −A2)h = (r2(p+ th)− r1(p+ th))︸ ︷︷ ︸→0
‖h‖ → 0
fur t→ 0. Da dies fur alle h ∈ Bε(0) gilt, gilt es insbesondere fur h := ε2e`, also (A1−A2)(e`) = 0.
Es folgt A1 = A2.
3So wie die Definitionen bisher gewahlt sind, ist das Wortchen”total“ ein erlaubtes Vorwortchen, hat aber keine
inhaltliche Bedeutung. Spater werden wir auch den Begriff”partiell differenzierbar“ kennen lernen. Man benutzt
dann das Vorwortchen “total“ um nochmals zu betonen, dass hier nicht”partiell differenzierbar“ gemeint ist. Aber
selbst dann ist die Bedeutung von”differenzierbar“ und
”total differenzierbar“ die gleiche.
4Achtung: in der Vorlesung habe ich die Funktionen ri etwas anders definiert. Das andert aber wenig an der
Beweisstruktur.
204 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Beispiel 2.5. Die Funktion f : R2 → R, (x1, x2)T 7→ x1x2 ist differenzierbar in jedem Punktp = (p1, p2)T . Denn, wenn wir A := (p2, p1) setzen5, so gilt fur x = (x1, x2)T und h = (h1, h2)T
f(p+ h)− f(p)−Ah = (p1 + h1)(p2 + h2)− p1p2 − (p2h1 + p1h2) = h1h2 = r(p+ h)‖h‖,
wobei wir fur h ∈ R2 r {0} definieren
r(p+ h) :=h1h2
‖h‖und r(p) = 0. Es gilt im Fall ‖ · ‖ = ‖ · ‖∞:∣∣∣∣ h1h2
‖h‖∞
∣∣∣∣ ≤ ∣∣∣∣‖h‖∞‖h‖∞‖h‖∞
∣∣∣∣ ≤ ‖h‖∞,das heißt in diesem Fall haben wir limh→0 r(p + h) = 0 = r(p). Wegen der Aquivalenz allerNormen auf gilt diese Aussage auch fur beliebige Normen ‖ · ‖. Also ist f differenzierbar in p undf ′(p) = (p2, p1).
Bemerkung 2.6. Differenzierbarkeit ist eine lokale Eigenschaft. D.h. ist U offen in Rn, p ∈ U undstimmen die Funktionen g, f : U → Rk auf einer Umgebung von p uberein, dann gilt:
(a) f ist genau dann in p differenzierbar, wenn g in p differenzierbar ist.(b) Wenn f in p differenzierbar ist, dann gilt f ′(p) = g′(p).
Bemerkung 2.7. Schreibe f : U → Rk in Komponenten f(x) = (f1(x), f2(x), . . . , fk(x))T mitfi : U → R. Sei p ∈ U . Es gilt wegen Korollar 1.9 (b) in Kapitel 8
f ist stetig in p ⇐⇒ f1, f2,. . . und fk sind stetig in p
limh→0
f(p+ h) =
limh→0
f1(p+ h)
limh→0
f2(p+ h)
...limh→0
fk(p+ h)
Diese Zeile ist so zu lesen: wenn eine der beiden Seiten existiert, dann auch die andere und dannsind die Werte gleich.
f ist differenzierbar in p ⇐⇒ f1, f2,. . . und fk sind differenzierbar in p
f ′(p) =
f ′1(p)f ′2(p)
...f ′k(p)
∈ Rk×n
Also: f ′i(p) ∈ R1×n ist eine Zeile der Matrix f ′(p).
5kein Tippfehler bei A: es ist ein Zeilenvektor!
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 205
Bemerkung 2.8. Sind V und W Vektorraume, dimV = n, dimW = k, U offen in V , f : U →W .Die Wahl von Basen liefert Isomorphismen ϕ : Rn → V und ψ : Rk →W .
Wir sagen: f ist differenzierbar in p ∈ U gdw f := ψ−1 ◦ f ◦ ϕ ist differenzierbar in ϕ−1(p).
Diese Definition ist unabhangig von der Wahl der Basen. Man erhalt ein
f ′(p) ∈ L(V,W )
das ebenfalls unabhangig von der Basis definiert ist, und
ψ−1 ◦ f ′(p) ◦ ϕ = f ′(ϕ−1(p)).
Bemerkung 2.9. Ist f : U → Rk differenzierbar, so erhalten wir eine Abbildung f ′ : U →L(Rn,Rk) ∼= Rk×n ∼= Rkn. Ist f ′ wieder differenzierbar (also f zweimal differenzierbar), so erhaltenwir
f ′′ : U → L(Rn,L(Rn,Rk)) ∼= L(Rn,Rkn) ∼= Rn2k
Ist f r-mal differenzierbar, dann
f (r) : U → Rnrk
Wie berechnet man die Koeffizienten von f ′(p)?
Definition 2.10. Sei U offen in Rn, f : U → Rk, p ∈ U ,
(1) Zu v ∈ Rnr{0} wahle ε > 0 so klein, dass fp,v : (−ε, ε)→ Rk, fp,v(t) := f(p+tv) wohldefiniertist. Wir sagen: f ist differenzierbar in p in Richtung v, falls fp,v in 0 differenzierbar ist. Wirnennen dann
∂p,vf := f ′p,v(0)
die Richtungsableitung von f an der Stelle p in Richtung v.(2) Wir sagen f ist in p partiell differenzierbar falls f in Richtung ei differenzierbar ist fur alle
i ∈ {1, 2, . . . , n}. Schreibweise p = (p1, . . . , pn). Man nennt
∂f
∂xi(p) := f ′p,ei(0) =
d
dt|t=0
(t 7→ f(p1, p2, . . . , pi−1, pi + t, pi+1, . . . , pn)
)die i-te partielle Ableitung von f an der Stelle p.
Mi 29.5.
LEMMA 2.11. f , U , n, k, p wie oben. Ist f (total) differenzierbar in p, dann ist f in p in jedeRichtung differenzierbar. Fur alle v ∈ Rn gilt dann
∂p,v = f ′(p) · v.
Beweis. Gegeben sei ein v ∈ Rn r {0}. Wahle ε > 0 so klein, dass fur alle t ∈ (−ε, ε) gilt: tv ∈ U .Mit t→ 0 gilt dann auch tv → 0. Es gelte
limh→0
f(p+ h)− f(p)−Ah‖h‖
= 0
206 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
fur A = f ′(p) ∈ L(Rn,Rk). Dann gilt auch
0 = limt→0
f(p+ tv)− f(p)−A(tv)
‖tv‖=
1
‖v‖limt→0
f(p+ tv)− f(p)−A(tv)
|t|und somit
0 =
(limt→0
f(p+ tv)− f(p)
t−Av
).
Also existiert die Richtungsableitung und nimmt den folgenden Wert an:
∂p,vf = f ′p,v(0) = limt→0
f(p+ tv)− f(p)
t= Av
KOROLLAR 2.12. Ist f in p differenzierbar, dann ist die Ableitung in p:
f ′(p) =(∂f∂x1
(p) ∂f∂x2
(p) . . . ∂f∂xn
(p))∈ Rk×n
Also ist ∂f∂xi
(p) die i-te Spalte der Matrix f ′(p).
Bemerkung 2.13. Es gilt also fur U , p, n, k, f wie oben:
f diffbar in p =⇒ f diffbar in jede Richtung in p =⇒ f partiell diffbar in p.
Aber man kann durch Beispiele zeigen, dass die Umkehrungen nicht gelten:
f diffbar in p 6⇐= f diffbar in jede Richtung in p 6⇐= f partiell diffbar in p.
Beispiel 2.14 (Ausfuhrlich diskutiert in der Zentralubung am 28.5., in der Vorlesung nur kurz).
f : R2 → R, f(x, y) :=
{2xyx2+y2 falls (x, y) 6= 0
0 falls x = y = 0
f ist in 0 partiell differenzierbar und
∂f
∂x(0) = 0,
∂f
∂y(0) = 0.
Aber fur v := 1√2(1, 1)T ist t 7→ f(tv) nicht einmal stetig in 0. Denn f(tv) = 1 fur t 6= 0 und
f(0) = 0. Also ist f in 0 nicht in Richtung v differenzierbar. Dadurch ist f auch nicht totaldifferenzierbar in 0.
f ist also partiell differenzierbar in 0. Nach einem Basiswechsel ist f aber nicht mehr partielldifferenzierbar.
Achsenkreuz, beschriftet x und y mit Hohenlinien der Funktion f .
Es gibt Funktionen f : R2 → R, die in 0 in alle Richtungen differenzierbar sind mit ∀v ∈ R2 :∂p,vf = 0, die aber dennoch nicht in 0 stetig sind. Sie sind also auch in 0 nicht total differenzierbar.
PROPOSITION 2.15. f , U , n, k, p wie oben. Aquivalent sind:
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 207
(1) f auf U partiell differenzierbar und alle partiellen Ableitungen
∂f
∂xi: U → Rk, i ∈ {1, 2, . . . , n}
sind stetig.(2) f auf U total differenzierbar und
f ′ : U → L(Rn,Rk) ∼= Rk×n
ist stetig
Ist (1) bzw. (2) erfullt, so sagen wir f ist stetig differenzierbar .
Sei U offen in Rn.
C1(U,Rk) := {f : U → Rk | f ist stetig differenzierbar}.
Cr+1(U,Rk) := {f ∈ C1(U,Rk) | f ′ ∈ Cr(U,L(Rn,Rk)) = Cr(U,Rk×n)}Elemente in Cr(U,Rk) nennt man r-mal stetig differenzierbar.
Beweis der Proposition.”(2) =⇒ (1)“ folgt direkt aus dem oben gesagten.
”(1) =⇒ (2)“:
Zu zeigen ist die Differenzierbarkeit in einem beliebigen p ∈ U . Die Stetigkeit der Ableitungergibt sich dann direkt aus der Stetigkeit der partiellen Ableitungen. Sobald wir wissen, dass fdifferenzierbar ist, erhalten wir aus den partiellen Ableitungen die totale Ableitung
(2.16) A :=(∂f∂x1
(p) ∂f∂x2
(p) . . . ∂f∂xn
(p))∈ Rk×n .
Da man die Differenzierbarkeit komponentenweise uberprufen kann, konnen wir ohne Beschrankungder Allgemeinheit annehmen, dass k = 1.
Zu ε > 0 wahle ein δ > 0, so dass fur alle η ∈ Rn mit ‖η‖∞ < δ gilt:
p+ η ∈ U und fur i ∈ {1, 2, . . . , n} gilt
∣∣∣∣ ∂f∂xi (p+ η)− ∂f
∂xi(p)
∣∣∣∣ < ε
n.
Zu h = (h1, . . . , hn)T ∈ Rn mit ‖h‖∞ < δ setze
q(0) := p = (p1, . . . , pn)T
q(1) := (p1 + h1, p2, . . . , pn)T ,
......
q(`) := (p1 + h1, . . . , p` + h`, p`+1, . . . , pn)T
......
q(n) := p+ h = (p1 + h1, . . . , pn + hn)T
208 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Wir fixieren nun alle Variablen außer der i-ten Koordinate und wenden dann den 1. Mittelwertsatzder Analysis I auf die Funktion t 7→ f(q(i−1) + tei), definiert fur t ∈ [0, hi] bzw. t ∈ [hi, 0] an. Wirerhalten
f(q(i))− f(q(i−1))1. MWS
= hi∂f
∂xi(p1 + h1, . . . , pi−1 + hi−1, pi + ϑihi, pi+1, . . . , pn)︸ ︷︷ ︸
=:ξ(i)
fur ein geeignetes ϑi ∈ [0, 1]. Mit ‖ξ(i) − p‖∞ < δ, folgt∣∣∣∣f(q(i))− f(q(i−1))− hi∂f
∂xi(p)
∣∣∣∣ ≤ |hi| εnEs ergibt sich fur die in (2.16) definierte Matrix A
|f(p+ h)− f(p)−Ah| ≤n∑i=1
∣∣∣∣f(q(i))− f(q(i−1))− hi∂f
∂xi(p)
∣∣∣∣ ≤ ε ‖h‖∞.Wir haben das ε-δ-Kriterium fur den Grenzwert
limh→0
f(p+ h)− f(p)−Ah‖h‖∞
= 0
uberpruft, und dies besagt, dass f in p differenzierbar mit Ableitung A ist. 6
PROPOSITION 2.17 (Summenregel). Seien U , n, k, p, wie oben. Seien f, g : U → Rk, a, b ∈ R,v ∈ Rn r {0}. Sind f und g in p differenzierbar (bzw. in Richtung v differenzierbar, bzw. partielldifferenzierbar), dann ist af + bg : U → Rk ebenfalls in p differenzierbar (bzw. in Richtung vdifferenzierbar, bzw. partiell differenzierbar). Es gilt dann
(af + bg)′(p) = af ′(p) + bg′(p)
bzw.
∂p,v(af + g) = a∂p,vf + b∂p,vg
bzw.∂(af + bg)
∂xi(p) = a
∂f
∂xi(p) + b
∂g
∂xi(p).
Beweis. Offensichtlich.
Bemerkung 2.18. Sei f = (f1, . . . , fk)T : U → Rk in p ∈ U partiell differenzierbar. Wenn wirf ′(p) als Matrix in Rk×n (und nicht als lineare Abbildung in L(Rn,Rk)) ansehen, dann gilt
f ′(p) =
(∂fi∂xj
(p)
)i∈{1,2,...,k}j∈{1,2,...,n}
.
6Ist Ihnen klar, wieso es hilfreich war, uns auf den Fall k = 1 einzuschranken? Der Grund ist, dass wir den
1. Mittelwertsatz nutzen, den wir nur fur Funktionen I → R, I ein Intervall, bewiesen haben; also fur k = 1. Wirwerden eine Verallgemeinerung des Mittelwertsatz auf Funktionen f : U → R, U offen in Rn zwar bald kennenlernen,
eine Verallgemeinerung auf Funktionen nach Rk, k > 1 ist jedoch nicht moglich, siehe Beispiel 2.24.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 209
Man nennt diese Matrix oft auch die Jacobi-Matrix von f in p. Da wir auf Rn und Rk die Stan-dardbasen verwenden und lineare Abbildungen mit Matrizen identifizieren Rk×n = L(Rk,Rn), istdie Jacobi-Matrix dasselbe wie die Ableitung. Sobald man aber Rk und Rn durch beliebige Vek-torraume V und W ersetzt, so ist die Ableitung f ′(p) ∈ L(V,W ) unabhangig von der gewahltenBasis definiert. Die Jacobi-Matrix ist dann die Matrix-Darstellung von f ′(p) bezuglich zu wahlenderBasen.
SATZ 2.19 (Kettenregel). Sei U offen in Rn, V offen in Rm, f : U → Rm, g : V → Rr, f(U) ⊂ V .Ist f differenzierbar in p und g differenzierbar in q := f(p), dann ist g ◦ f differenzierbar in p und
(g ◦ f)′(p) = g′(q) · f ′(p).
Man kann g′(q) · f ′(p) als Verkettung der linearen Abbildungen f ′(p) ∈ L(Rn,Rm) und g′(q) ∈L(Rm,Rr) ansehen, 7 oder f ′(p) und g′(q) als Matrizen betrachten (also als Jacobi-Matrizen!) unddann gilt f ′(p) ∈ Rm×n, g′(q) ∈ Rr×m, g′(q) · f ′(p) ∈ Rr×n.
!ACHTUNG!. Es gilt nicht g′(q) · f ′(p) = f ′(p) · g′(q). Die rechte Seite ist fur r 6= n gar nichtdefiniert, und auch im Fall n = r gilt hier im allgemeinen keine Gleichheit.
Beweis der Kettenregel. (Bewiesen am Fr. 31.5.)
f(p+ h) = f(p) + f ′(p) · h+ ‖h‖ε(h), limh→0
ε(h) = 0
g(q + k) = g(q) + g′(q) · k + ‖k‖δ(k), limk→0
δ(k) = 0
Fur h→ 0 geht auch k := f(p+ h)− f(p) gegen Null.
g(f(p+ h)) = g(f(p)) + g′(f(p))( =k︷ ︸︸ ︷f ′(p) · h+ ‖h‖ε(h)
)+ ‖k‖δ(k)
= g(q) + g′(q) · f ′(p) · h+ ‖h‖(g′(q)ε(h) +
‖k‖δ(k)
‖h‖
)Die Funktion h 7→ γ(h) := g′(q) · ε(h) ist die Verkettung der in 0 stetigen Funktion ε mit derlinearen (und somit stetigen) Funktion k 7→ g′(q) · k. Also ist γ stetig in 0 und γ(0) = 0.
Mit h→ 0 gilt auch δ(k)→ 0. Wir zeigen, dass es eine Konstante C > 0 gibt, so dass ‖k‖/‖h‖ ≤ Cfur alle h in einer Umgebung von 0 gilt. Sobald dies gezeigt ist, folgt
limh→0
‖k‖δ(k)
‖h‖= 0,
wobei man k als Funktion in h betrachten sollte. Und hieraus ergibt sich dann die Aussage desSatzes (Kettenregel).
7Bei dieser Interpretation ware es eigentlich sauberer g′(q) ◦ f ′(p) an Stelle von g′(q) · f ′(p) zu schreiben.Da wir aber sowieso lineare Abbildungen mit Matrizen identifizieren, ist es auch sinnvoll die Verkettung linearerAbbildungen mit Matrizen-Multiplikation zu identifizieren.
210 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Es reicht,‖k‖/‖h‖ ≤ C fur die Supremums-Norm auf Rn, Rm und Rm×n zu zeigen, da auf jedemdieser Vektorraume alle Normen aquivalent sind.
Fur A ∈ Rm×n und h ∈ R gilt‖Ah‖∞ ≤ n‖A‖∞‖h‖∞
Also
‖k‖∞‖h‖∞
=‖f ′(p) · h+ ‖h‖∞ε(h)‖∞
‖h‖∞
≤ n‖f ′(p)‖∞ ‖h‖∞ + ‖h‖∞ ‖ε(h)‖∞‖h‖∞
≤ n‖f ′(p)‖∞ + ‖ε(h)‖∞Da ε(h)→ 0 fur h→ 0 gilt, ist ‖ε(h)‖∞ auf einer ausreichend kleinen Umgebung von 0 beschrankt.
KOROLLAR 2.20 (Produktregel). Sei U offen in Rn, f, g : U → R. Sind f und g differenzierbarin p ∈ U , dann auch f · g : U → R, x 7→ f(x) · g(x), und es gilt
(f · g)′(p) = g(p)f ′(p) + f(p)g′(p)
Beweis. Betrachte
F : U → R2, F (x) :=
(f(x)g(x)
).
Nach Voraussetzung ist F differenzierbar in p.
F ′(p) =
(f ′(p)g′(p)
)∈ R2×n.
Die Abbildung ϕ : R2 → R, (x1, x2)T 7→ ϕ(x) = x1x2 ist (uberall) differenzierbar und es giltϕ′(x1, x2) = (x2, x1) ∈ R1×2, siehe Beispiel 2.5 oder berechne es uber die partiellen Ableitungen.
f · g = ϕ ◦ FAlso ist nach Kettenregel f · g in p differenzierbar und es gilt
(f · g)′(p) = ϕ′(F (p)) · F ′(p) = (g(p), f(p)) ·(f ′(p)g′(p)
)= g(p)f ′(p) + f(p)g′(p).
Fr 31.5.
Ubersicht: Wichtige Beispiele und Methoden, um Differenzierbarkeit zu zeigen.
• Sei f : Rn → Rk von der Form f(x) = Ax + b, A ∈ Rk×n, b ∈ Rk. Dann ist f uberalldifferenzierbar und es gilt f ′(x) = A uberall, denn
f(x+ h)− f(x)−Ah‖h‖
=0
‖h‖.
Also ist f ′ : Rn → Rk×n konstant und deswegen f ′′(x) = 0 ∈ L(Rn,L(Rn,Rk)).
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 211
• Ist f : U → Rk (k-mal) differenzierbar und V ⊂ U offen, dann ist auch f |V (k-mal)differenzierbar. Dasselbe fur k-mal stetig differenzierbar.• Ist f : U → Rk ist auf U partiell differenzierbar und die partiellen Ableitungen sind
stetig, dann ist f : U → Rk stetig differenzierbar8 (Proposition 2.15).• Summen-, Produkt-, Quotienten-, Kettenregel.• Polynome in mehreren Variablen sind glatt (= beliebig oft differenzierbar), z.B.
R3 → R, (x, y, z)T 7→ x3 + x2y4 + 3xyz.
• Ebenso Funktionen wie
f : Rn → R, f(x) = ei〈ξ,x〉, ξ ∈ Rn;
f : Rn → R, f(x) = ‖x‖22 =
n∑j=1
x2j ;
f : Rn → R, f(x) = x1 · arctan(1 + ‖x‖22 − cos ‖x‖2
).
(Es wurde insbesondere verwendet, dass g : R → R, g(s) :=∑∞j=0
(−1)j
(2j)! sj glatt ist und
g(t2) = cos(t) fur t ∈ R erfullt. Obige Aussage sind richtig fur die Standard-Norm ‖ · ‖2,aber nicht fur alle Normen: die Funktionen Rn 3 x 7→ ‖x‖2∞ und Rn 3 x 7→ ‖x‖21 sindzum Beispiel nicht differenzierbar.)
ENDE DER UBERSICHT
KOROLLAR 2.21 (Quotientenregel). Sei U offen in Rn, f : U → R, g : U → R r {0}. Sind fund g differenzierbar in p ∈ U , dann auch f/g : U → R, x 7→ f(x)/g(x), und es gilt(
f
g
)′(p) =
g(p)f ′(p)− f(p)g′(p)
g(p)2.
Beweis. Ahnlich wie die Produktregel, aber mit ϕ : R× (Rr {0})→ R, (y, z) 7→ y/z.
ϕ′(y, z) = (1/z,−y/z2)(f
g
)′(p) = ϕ′(F (p)) · F ′(p) = (1/g(p),−f(p)/g(p)2)
(f ′(p)g′(p)
)=g(p)f ′(p)− f(p)g′(p)
g(p)2.
Bemerkungen 2.22.
(1) Produktregel, Quotientenregel, Summenregel richtig fur Richtungsableitungen, insbesonderefur partielle Ableitungen
8Also insbesondere differenzierbar!
212 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
(2) Die Kettenregel gilt nicht mehr fur alle partiell differenzierbare Funktionen. Ein Beispielwird in der Zentralubung diskutiert. Man9 betrachte die differenzierbare Funktion
h : R2 → R2, h(x, y) =
(x+ yx− y
)=
(1 11 −1
)·(xy
), h′(x, y) =
(1 11 −1
)und die Funktion f : R2 → R aus Beispiel 2.14. Dann ist f in 0 partiell differenzierbar und esgilt
∂f
∂x(0) =
∂f
∂y(0) = 0
Aber
(f ◦ h)(x, y) =2(x+ y)(x− y)
(x+ y)2 + (x− y)2=
(x2 − y2)
x2 + y2,
also∂(f ◦ h)
∂x(0) = 1,
∂(f ◦ h)
∂x(0) = −1.
(0, 0) ·(
1 11 −1
)= (0, 0) 6= (1,−1)
Wenn die Kettenregel gultig ware, so wurde sie besagen, dass die linke und die rechte Seitegleich sind. Also ist dies ein Gegenbeispiel.
Mittelwertsatz.
Der Mittelwertsatz fur Funktionen Rn ⊃ U → R ergibt sich direkt aus dem der Analysis I.
PROPOSITION 2.23 (Mittelwertsatz). Sei U offen in Rn, p, q ∈ U mit
[p, q] := {p+ t(q − p) | t ∈ [0, 1]} ⊂ U.Die Funktion f : U → R sei stetig auf [p, q] und differenzierbar auf
{p+ t(q − p) | t ∈ (0, 1)}.Dann gibt es ein ϑ ∈ (0, 1) mit
f(q) = f(p) + f ′(p+ ϑ(q − p)) · (q − p).
Beweis. ϕ : [0, 1]→ Rn, t 7→ p+ t(q − p).
f ◦ ϕ stetig auf [0, 1] und differenzierbar auf (0, 1). Aus dem ersten Mittelwertsatz (Satz 3.2 ausKapitel 5) folgt die Existenz eines ϑ ∈ (0, 1) mit
f(q)−f(p) = (f ◦ϕ)(1)− (f ◦ϕ)(0)1. MWS
= (f ◦ϕ)′(ϑ) = f ′(ϕ(ϑ)) ·ϕ′(ϑ) = f ′(p+ϑ(q−p)) · (q−p).
9In Beispielen wie diesem benutzen wir ab jetzt die Notation h(x, y) als alternative, kurzere Schreibweise fur
h
((x
y
))= h
((x y)T
)
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 213
!ACHTUNG!. Man kann hier nicht ohne weiteres die Zielmenge R durch Rk ersetzen. Wenn wirf = (f1, . . . , fk)T schreiben, kann man zwar den Mittelwert-Satz fur jedes fi anwenden, und wirerhalten jedesmal ein ϑi ∈ [0, 1] mit
fi(q) = fi(p) + f ′i(p+ ϑi(q − p)) · (q − p).
Man findet aber kein ϑ ∈ [0, 1] mit
f(q) = f(p) + f ′(p+ ϑ(q − p)) · (q − p).
Beispiel 2.24. f : R → R2, f(t) = (cos t, sin t)T , p = 0, q = 2π. Dann gilt f(p) = f(q), aberf ′(t) = (− sin t, cos t)T 6= 0 ∈ R2. Es kann also kein solches ϑ geben.
Definition 2.25. Sei X ein topologischer Raum und Y eine Menge. Eine Funktion f : X → Yheißt lokalkonstant , wenn jedes x ∈ X eine Umgebung U in X besitzt, so dass f |U konstant ist.
Konstante Funktionen sind lokal konstant. Ist X diskret (zum Beispiel X = {1, 2, 3} ⊂ R), dannist jede Funktion f : X → Y lokal konstant.
Ist f : X → Y lokal konstant und A ⊂ X, dann ist f |A lokal konstant.
LEMMA 2.26. Ist f : A→ Y lokal konstant und ist A zusammenhangend, dann ist f konstant.
Beweis. Sei a ∈ A gegeben. Dann folgt aus der lokalen Konstantheit, dass U1 := {x ∈ A | f(x) =
f(a)} offen in A ist und dass U2 := {x ∈ A | f(x) 6= f(a)} offen ist. Aus A = U1
•∪ U2, U1 6= ∅
und A zusammenhangend folgt U2 = ∅.
Aus dem Mittelwertsatz ergibt sich das folgende Korollar:
KOROLLAR 2.27. Sei f : U → R wie oben. Dann gilt
f ′(x) = 0 fur alle x ∈ U ⇐⇒ f ist lokal konstant.
Beweis.
”⇐=“ ist klar.
”=⇒“: Zu p ∈ U wahle ε > 0 mit Bε(p) ⊂ U . Fur jedes q ∈ Bε(p) gibt es ein ϑ ∈ [0, 1] mit
f(q) = f(p) + f ′(p+ ϑ(q − p)) · (q − p) = f(p) + 0.
Also ist f |Bε(p) konstant.
Definition 2.28. Eine Teilmenge G ⊂ Rn nennt man Gebiet , wenn G nicht-leer, offen und zu-sammenhangend ist.
KOROLLAR 2.29. Sei f : U → R wie oben, und U ein Gebiet.
f ′(x) = 0 fur alle x ∈ U ⇐⇒ f ist konstant.
214 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
3. Hohere Ableitungen
3.1. Satz von Schwarz. Sei U offen in Rn, f : U → Rk.
Die i-te partielle Ableitung ist
∂f
∂xi: U → Rk.
Man nennt es auch die partielle Ableitung nach xi.
Wenn wir diese Ableitung nun nach xj partiell ableiten, erhalten wir
∂2f
∂xj∂xi:=
∂
∂xj
(∂f
∂xi
): U → Rk
Beispiel: f(x1, x2) = x21x2, ∂f
∂x1(x1, x2) = 2x1x2, ∂2f
∂x2∂x1(x1, x2) = 2x1.
Zu i1, i2, . . . , i` ∈ {1, 2, . . . , n} definieren wir rekursiv:
∂`f
∂xi1∂xi2 · · · ∂xi`:=
∂
∂xi1
(∂`−1f
∂xi2 · · · ∂xi`
): U → Rk.
Die Anzahl der partiellen Ableitungen von der Ordnung ` ist n`. Sind alle diese Ableitungenverschieden?
Wir betrachten nun den Spezialfall k = 1 und ` = 2.
Definition 3.1. Wenn f : U → R auf U differenzierbar ist und (f ′)T : U → Rn = Rn×1 in p ∈ Udifferenzierbar ist, dann nennt (
∂2f
∂xj∂xi(p)
)i,j
=((f ′)T
)′(p)
die Hesse-Matrix von f in p.
Die zugehorige bilineare Abbildung ist die Hesse-Abbildung
Hesspf : Rn × Rn → R,
x1
...xn
,
y1
...yn
7→ n∑
i,j=1
xi∂2f
∂xj∂xi(p) yj
Die Hesse-Matrix ist die Matrix-Darstellung der Hesse-Abbildung.
Schreibweise fur Hesse-Matrix: f ′′(p) :=((f ′)T
)′(p) ∈ Rn×n.
Wir zeigen nun folgenden Satz:
3. HOHERE ABLEITUNGEN 215
SATZ 3.2 (Satz von Schwarz). Sei f : U → Rk, U offen in Rn, p ∈ U , ` ≥ 2. Ist f (` − 1)-mal differenzierbar auf U und `-mal differenzierbar im Punkt p, dann sind die `-ten partiellenAbleitungen in p unabhangig von der Reihenfolge der Ableitungen.
10
Zum Beispiel: Ist f zweimal differenzierbar auf U , dann gilt
∂2f
∂xj∂xi(x1, . . . , xn) =
∂2f
∂xi∂xj(x1, . . . , xn)
das heißt f ′′(p) ist eine symmetrische Matrix.
Dies bedeutet, wir brauchen danach gar nicht mehr darauf zu achten, welcher Index von ∂2f∂xi∂xj
die Zeile und welcher die Spalte angibt.
Im Beweis dieses Satzes von Schwarz ist es aber naturlich sehr wichtig, welche Rolle Zeilen undSpalten haben: f ′(p) ∈ R1×n ist ein Zeilen-Vektor, f ′(p)T ∈ Rn×1 ist ein Spalten-Vektor, und dieHesse-Matrix ist (
(f ′)T)′
(p) =
(∂2f
∂xj∂xi(p)
)i,j
.
Mi 5.6.
Beweis. O.B.d.A. ` = 2.11 O.B.d.A. k = 1 (komponentenweise Argumentation). O.B.d.A. ‖ · ‖ =‖ · ‖2. Sei ε > 0 gegeben und zunachst fixiert. Wahle ρ > 0 so, dass
B3ρ(p) = {x ∈ Rn | ‖x− p‖2 < 3ρ} ⊂ U.
Wahle u, v ∈ Rn mit 0 < ‖u‖2 = ‖v‖2 ≤ ρ. Definiere
g : [0, 1]→ R, g(t) := f(p+ tu+ v)− f(p+ tu).
Wir rechnen fur eine reelle Zahl ϑ ∈ (0, 1). Sie darf zunachst beliebig sein, und spater mit dem 1.Mittelwertsatz so gewahlt, dass g(1)− g(0) = g′(ϑ).
g′(ϑ) =(f ′(p+ ϑu+ v)− f ′(p+ ϑu)
)u
=(f ′(p+ ϑu+ v)− f ′(p)− (f ′(p+ ϑu)− f ′(p))
)u
Da f ′′(p) existiert, wissen wir, dass
‖(f ′)T
(p+ ϑu+ v)−(f ′)T
(p)− f ′′(p) · (ϑu+ v)︸ ︷︷ ︸a:=
‖ ≤ ε ‖ϑu+ v‖ ≤ ε (‖u‖+ ‖v‖),
10Nach Hermann Amandus Schwarz (1843-1921) siehe http://de.wikipedia.org/wiki/Hermann_Amandus_
Schwarz11Wenn wir zwei Ableitungen vertauschen konnen, dann konnen wir alle Ableitungen miteinander sukzessive
vertauschen.
216 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
gilt, falls ρ > 0 genugend klein gewahlt wurde. 12 Und analog erhalten wir fur genugend kleinesρ > 0:
‖(f ′)T
(p+ ϑu)−(f ′)T
(p)− f ′′(p) · (ϑu)︸ ︷︷ ︸b:=
‖ ≤ ε ‖ϑu‖ ≤ ε (‖u‖+ ‖v‖).
Dies ergibt13
g′(ϑ) =(g′(ϑ)
)T= uT
((f ′)T
(p+ ϑu+ v)−(f ′)T
(p)−((f ′)T (p+ ϑu)− (f ′)T (p)
))= uT
(a− b+ f ′′(p) · v
)Wir erhalten unter Benutzung der Cauchy-Schwarz-Ungleichung14
∀x, y ∈ Rn : xT y = 〈x, y〉 ≤ ‖x‖2‖y‖2
|g′(ϑ)− uT f ′′(p)v| = |uT (a− b)| ≤ ‖u‖ · 2ε (‖u‖+ ‖v‖) ≤ 2ε (‖u‖+ ‖v‖)2.
Mit dem 1. Mittelwertsatz konnen wir nun ϑ ∈ (0, 1) so wahlen, dass
g′(ϑ)1. MWS
= g(1)− g(0) = f(p+ u+ v)− f(p+ u)− f(p+ v) + f(p).
Somit
|f(p+ u+ v)− f(p+ u)− f(p+ v) + f(p)− uT f ′′(p)v| = |uT (a− b)| ≤ 2ε (‖u‖+ ‖v‖)2.
Der Ausdruck f(p + u + v) − f(p + u) − f(p + v) + f(p) andert sich nicht, wenn wir u und vvertauschen.
Also
|uT f ′′(p)v − vT f ′′(p)u| ≤ 4ε(‖u‖+ ‖v‖)2.
Wir setzen u := λei, v = λej , λ > 0 genugend klein.∣∣∣∣λ2 ∂2f
∂xj∂xi(p)− λ2 ∂2f
∂xi∂xj(p)
∣∣∣∣ ≤ 4ελ2(1 + 1)2.
∣∣∣∣ ∂2f
∂xj∂xi(p)− ∂2f
∂xi∂xj(p)
∣∣∣∣ ≤ 16ε.
12Genaue Logik: zu obigem ε > 0 gibt es ein ρ1 ∈ (0, ρ] , so dass die Aussage fur 0 < ‖u‖2 = ‖v‖2 ≤ ρ1 gilt.Im nachsten Schritt erhalten wir dann ein ρ2 ∈ (0, ρ1] mit analogen Eigenschaften.
13Identifiziere R ∼= R1 ∼= R1×1
14Dies ist wieder Hermann Amandus Schwarz, allerdings ist es fraglich, ob hier der Name Schwarz so angebracht
ist. Schwarz wurde 1843 geboren, obwohl der Satz von Cauchy-Schwarz in Rn bereits 1821 von Cauchy veroffentlicht
wurde. Die Integral-Version stammt von Buniakovsky (1859), siehe http://jeff560.tripod.com/c.html. Dennochsollte man die Ungleichung die Cauchy-Schwarz-Ungleichung nennen, denn nur mit diesem seit ca. 1930 ublichenNamen weiß man, welche Ungleichung gemeint ist.
3. HOHERE ABLEITUNGEN 217
Da wir ε > 0 zu Beginn des Beweises beliebig klein15 wahlen konnten16, ergibt sich
∂2f
∂xj∂xi(p) =
∂2f
∂xi∂xj(p).
17
Beispiel 3.3 (Zentralubung). Sei f : R2 → R,
(x, y) 7→
{xy x
2−y2x2+y2 falls (x, y) 6= (0, 0),
0 falls (x, y) = (0, 0).
Man rechnet nach, dass f zweimal partiell differenzierbar ist. Aber es gilt
∂2f
∂y ∂x(0, 0) = −1,
∂2f
∂x ∂y(0, 0) = 1
Schreibweise
Oft verwendet man x, y, z an Stelle von x1, x2, x3. Dann
∂f
∂x,∂f
∂y,∂f
∂z.
18
15Hier bedeutet”beliebig klein“
”beliebig nahe an 0“
16und dann eben auch ρ, λ etc klein, aber positiv wahlen17Kommentar zu den Quellen: verschiedene Beweise in der Literatur benutzen etwas andere Voraussetzungen.
Die obige Version kenne ich von einem Vorlesungsskript Prof. Helmut Klingen, Freiburg, WS 1988/89. In Konigs-berger [23] benotigt man andere Voraussetzungen an Stelle der `-fachen Differenzierbarkeit in p, namlich (im Fall
` = 2), dass eine der ∂2f∂xj∂xi
fur ein festes i und j stetig in p sein soll. Es folgt dann ebenfalls die obige Gleich-
heit. Die Konigsbergerschen Voraussetzungen sind weder schwacher noch starker als unsere. Viele Bucher nehmen2-mal stetig differenzierbar an, und erhalten dann eine Aussage, die echt schwacher als unsere obige und als die
Konigsbergersche ist.18Bei physikalischen Anwendungen ist oft die Reihenfolge der Variablen unklar, und bestimmte Buchstaben
bedeuten immer bestimmte Großen. Eine gewisse Menge Gas soll bei einer Temperatur T und einem Volumen V den
Druck p haben. Dann ist p eine Funktion in T und V , also p : R2>0 → R>0, (T, V ) 7→ p(T, V ) oder (V, T ) 7→ p(V, T ).
Welches von beiden, weiß man eben nicht so recht, und ist aber irrelevant. Jedenfalls ist in beiden Fallen klar, was
mit ∂p/∂V gemeint ist. Hier ist die eingefuhrte Notation sehr effektiv und ungefahrlich. Gefahrlich wird es aber inder Physik, wenn wir nun den Blickwinkel wechseln und sagen, der Druck des Gases hangt von dem Volumen V undder im Gas enthaltenen Enthalpie H ab, (V,H) 7→ p(V,H). Dann erhalt ∂p/∂V eine andere Bedeutung, denn nun ist
damit die infinitesimale Anderung des Drucks bei Volumenanderung und konstanter Enthalpie gemeint, wohingegenzuvor damit die infinitesimale Anderung des Drucks bei Volumenanderung und konstanter Temperatur gemeint war.
Dieser Sachverhalt hat mich in der Thermodynamik damals als Student etwas verwirrt.
218 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
3.2. Hohere Ableitungen als multi-lineare Abbildungen. In diesem Abschnitt sei wie-der U offen in Rn. Sei V ein reeller Vektorraum. Alles was wir bisher fur Funktionen g : U → Rkmit beliebigem k ∈ N definiert und gezeigt haben, konnen wir auch – mit leichten redaktionellenModifikationen – fur Funktionen g : U → V definieren und zeigen19. Ist g : U → V differenzierbar,so erhalten wir die Ableitung g′ : U → L(Rn, V ). Ein Vorteil dieser Sichtweise ist dann, dass dieDifferenzierbarkeit und die Ableitung von g unabhangig von der verwendeten Basis von V definiertsind.
Diese Sichtweise erlaubt uns auch, eine (mindestens) `-mal differenzierbare Funktion f : U → R `-mal zu differenzieren. Im Fall ` = 2 ist f ′ : U → L(Rn,R) ∼= Rn×1. Wir wenden dies auf g = f ′ undV = L(Rn,R) an und erhalten g′ = f ′′ : U → L(Rn,L(Rn,R)). Die Transposition oder aquivalentdazu die Matrix-Darstellung in der Standard-Basis liefert wie in der Linearen Algebra ublich einen
Isomorphismus L(Rn,R)∼=−→ Rn, v 7→ vT . Dies ergibt
L(Rn,L(Rn,R)) ∼= L(Rn,Rn) ∼= Rn×n ∼= Rn2
.
Wenn wir dies iterativ fur hohere Ableitungen durchfuhren, dann ist es ab der dritten Ableitungnicht mehr moglich und sinnvoll, den Formalismus der Linearen Algebra, der streng zwischen Zeilen-und Spaltenvektoren unterscheidet, einzuhalten. Die `-te Ableitung hat ` Indizes und fur das ublicheMatrizen-Kalkul brauchten wir dann ein `-dimensionales Blatt Papier um die Matrix zu notieren.Eine mathematisch konzeptionelle Sichtweise zur Beschreibung dieser multilinearen Abbildungenist mit Hilfe von Tensoren (Lineare Algebra II), ein Begriff, den wir hier nur andeuten wollen. Inkonkreten Berechnungen arbeitet man oft am einfachsten mit iterierten partiellen Ableitungen.
Sei p ∈ U .
f(p) ∈ R, (0, 0)-Tensor=Skalar
f ′(p) =
(∂f
∂xi(p)
)i=1,...,n
∈ L(Rn,R) ∼= R1×n ∼= Rn, (0, 1)-Tensor=(Zeilen-)Vektor
f ′ : U → Rn
f ′′(p) ∈ L(Rn,L(Rn,R))
L(Rn,L(Rn,R)) ∼= {bilineare Abb. Rn × Rn → R} ∼= Rn×n ∼= Rn2
, (0, 2)-Tensor=Matrix
f ′′ : U → Rn×n
f ′′(p) =
(∂2f
∂xi ∂xj(p)
)i,j∈{1,...,n}
19Eine Ausnahme ist hier naturlich der Mittelwertsatz, da das Ziel 1-dimensional sein muss.
3. HOHERE ABLEITUNGEN 219
f ′′′(p) ∈ L(Rn,L(Rn,L(Rn,R)))
L(Rn,L(Rn,L(Rn,R))) ∼= {trilineare Abb. Rn × Rn × Rn → R} ∼= Rn×n×n (0, 3)-Tensor
f ′′′ : U → Rn×n×n
f ′′′(p) =
(∂3f
∂xi ∂xj ∂xk(p)
)i,j,k∈{1,...,n}
...
f (`)(p) : Rn × · · · × Rn︸ ︷︷ ︸`-mal
→ R, `-linear, (0, `)-Tensor
f (`) :=(f (`−1)
)′`-linear
f (`) = f : U → {`-lineare Abb. Rn × · · · × Rn︸ ︷︷ ︸`-mal
→ R}
f (`)(p) =
(∂`f
∂xi1 ∂xi2 · · · ∂xi`
)i1,...,i`∈{1,...,n}
(p)
Der Satz von Schwarz besagt, dass all diese multi-linearen Abbildung in allen Eintragen symme-trisch sind.20 Wir haben dies bereits benutzt und die Reihenfolge der Indizes getauscht.
Beispiel 3.4. Sei U offen in Rn, seien p = (p1, . . . , pn)T ∈ U , q = (q1, . . . , qn)T ∈ Rn, f : U → Rsei `-mal differenzierbar. Es gilt c(p+tq) ∈ U fur t ∈ (−ε, ε) fur ein kleines ε > 0. Sei g(t) := f(c(t))fur t ∈ (−ε, ε), d.h. g = fp,q in der Notation von Definition 2.10.
c(0) = p, c′(t) = q, c(`)(t) = 0 fur ` ≥ 2.
20Das heißt, man darf die Eintrage in der Reihenfolge tauschen, also zum Beispiel f (k)(p)(h1, h2, . . . , hk) =
f (k)(p)f(h2, h1, h3, . . . , hk) = f (k)(p)f(hk, hk−1, . . . , h1)
220 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
g′(t) = f ′(c(t))c′(t) =
n∑i1=1
∂f
∂xi1(c(t)) qi1
g′′(t) = c′(t)T f ′′(c(t))c′(t) + f ′(c(t)) c′′(t)︸ ︷︷ ︸=0
= Hessc(t)f(c′(t), c′(t)
)=
n∑i1,i2=1
∂2f
∂xi1∂xi2(c(t)) qi1qi2
g′′′(t) =(
trilineare Abb. zu f ′′′(c(t)))(c′(t), c′(t), c′(t)
)=
n∑i1,i2,i3=1
∂3f
∂xi1∂xi2∂xi3(c(t)) qi1qi2qi3
...
g(`)(t) =(`-lineare Abb. zu f (`)(c(t))
)(c′(t), . . . , c′(t)︸ ︷︷ ︸
`-mal
)=
n∑i1,...,i`=1
∂`f
∂xi1∂xi2 · · · ∂xi`(c(t)) qi1 · · · qi`
3.3. Satz von Taylor.
SATZ 3.5 (Taylor). Sei U offen in Rn und f : U → R. Seien p = (p1, . . . , pn)T , x = (x1, . . . , xn)T ∈U mit [p, x] ⊂ U . Die Funktion f sei `-mal differenzierbar auf U und (` + 1)-mal differenzierbarauf
{p+ t(x− p) | t ∈ (0, 1)}.Wir definieren das Restglied Rp` (x) so, dass gilt:
f(x) = f(p) +
n∑i=1
∂f
∂xi(p) · (xi − pi) +
1
2!
n∑i1,i2=1
∂2f
∂xi1 ∂xi2(p) · (xi1 − pi1) · (xi2 − pi2)
+ · · ·+ 1
`!
n∑i1,i2,...,i`=1
∂`f
∂xi1 ∂xi2 · · · ∂xi`(p) · (xi1 − pi1) · (xi2 − pi2) · · · (xi` − pi`)
+Rp` (x)
Dann gibt es ein ϑ ∈ (0, 1) mit
Rp` (x)
=1
(`+ 1)!
n∑i1,i2,...,i`+1=1
(∂`+1f
∂xi1 ∂xi2 · · · ∂xi`+1
(p+ ϑ(x− p))
)· (xi1 − pi1) · · · (xi`+1
− pi`+1)
Die blauen Klammern geben exemplarisch an, wie man derartige Ausdrucke verstehen muss, dieseKlammern werden aber normalerweise nicht gesetzt.
Beweis. Anwendung des Satzes von Taylor aus Analysis I auf die Funktion
g(t) := f(p+ t(x− p))
ergibt:
3. HOHERE ABLEITUNGEN 221
(3.6) g(t) =∑j=0
tj
j!g(j)(0) + r0
` (t)
mit
r0` (t) =
t`+1
(`+ 1)!g(`+1)(ϑt)
fur ein ϑ ∈ (0, 1). Nun setzen wir t = 1 in (3.6), wenden Beispiel 3.4 fur obiges p und q = x− p anund erhalten mit Rp` (x) := r0
` (1) die Behauptung.
Notation 3.7 (Multi-Indizes). Sei α = (α1, . . . , αn) ∈ Nn, h = (h1, . . . , hn) ∈ Rn, p ∈ U ,f : U → R. Dann definieren wir
α! := α1!α2! · · ·αn!
|α| := α1 + · · ·+ αn
hα := hα11 · · ·hαnn
Dαf |p :=∂|α|f
∂xα(p) :=
∂α1+···+αnf
∂x1 · · · ∂x1︸ ︷︷ ︸α1-mal
· · · ∂xn · · · ∂xn︸ ︷︷ ︸αn-mal
(p)
Die Bezeichnung ∂|α|f∂xα (p) wird ofter verwendet, u.a. in der Physik. Die Bezeichnung Dαf |p erscheint
mir zweckmaßiger und effektiver.Fr. 7.6.
Wenn wir nun den Satz von Schwarz benutzen, gleiche Terme in der obigen Taylorschen Formelzusammenfassen, und elementare Formeln der Kombinatorik nutzen21 (siehe Zentralubung am18.6.), dann erhalten wir den folgenden Satz.
FOLGERUNG 3.8 (Satz von Taylor in Multi-Index-Notation). Sei U , p, x, f wie oben.
Wir definieren das Restglied Rp` (x) so, dass gilt:
f(x) =∑α∈Nn|α|≤`
1
α!Dαf |p(x− p)α +Rp` (x) .
Dann gibt es ein ϑ ∈ (0, 1) mit
Rp` (x) =∑α∈Nn|α|=`+1
1
α!Dαf |p+ϑ(x−p)(x− p)α .
21um abzuzahlen bzw. zu berechnen, wie oft jeder Term vorkommt
222 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
3.4. Einschub: Quadratische Formen. Um den Term 2. Ordnung in der Taylor-Entwicklunggenauer zu verstehen, betrachten wir quadratische Formen.
Definition 3.9. Sei K ein Korper mit 2 6= 0, z.B. K ∈ {Q,R,C}. Sei V ein K-Vektorraum. Einequadratische Form ist eine Abbildung Q : V → K in der Form
Q(x) = b(x, x)
fur eine K-bilineare Abbildung b : V × V → K.
Bemerkungen 3.10.
(1) Die Bilinearform b in obiger Definition kann symmetrisch gewahlt werden. Denn fur eine be-liebige bilineare Abbildung b : V × V → K schreiben wir
b±(x, y) :=b(x, y)± b(y, x)
2.
Also b(x, y) = b+(x, y) + b−(x, y). Nun ist b+ ist symmetrisch: b+(x, y) = b+(y, x). Und b− istantisymmetrisch b−(x, y) = −b−(y, x). Wegen b−(x, x) = −b−(x, x) = 0 gilt b(x, x) = b+(x, x).
(2) Fur Q(x) = b(x, x) gilt
Q(x+ y)−Q(x− y) = b(x+ y, x+ y)− b(x− y, x− y) = 2b(x, y) + 2b(y, x) = 4b+(x, y).
Der symmetrische Anteil von b ist also durch Q eindeutig festgelegt.
Definition 3.11. Sei K = R. Eine quadratische Form Q auf V heißt
positiv definit :⇐⇒ ∀x ∈ V r {0} : Q(x) > 0
negativ definit :⇐⇒ ∀x ∈ V r {0} : Q(x) < 0
positiv semi-definit :⇐⇒ ∀x ∈ V : Q(x) ≥ 0
negativ semi-definit :⇐⇒ ∀x ∈ V : Q(x) ≤ 0
indefinit :⇐⇒ Q ist weder positiv semi-definit noch negativ semi-definit
⇐⇒ Es existieren x+, x− ∈ V mit Q(x+) > 0 und Q(x−) < 0.
Nun22 sei V = Rn. Jede quadratische Matrix A ∈ Rn×n definiert eine quadratische Form
QA(x) = xTAx.
Umgekehrt kann man zu einer gegebenen quadratischen Abbildung Q : Rn → R definieren:
aij :=Q(ei + ej)−Q(ei − ej)
4, AQ := (aij)ij ∈ Rn×n
22Man kann ahnlich vorgehen fur beliebige endlich-dimensionale relle Vektorraume V , in dem man zuerst eine
basis von V wahlt, die uns dann erlaubt, V mit Rn zu identifizieren. Es stellt sich dann naturlich die Frage, wie sichdie definierten Objekte transformieren, wenn wir die Basis wechseln. Dies sollte im Rahmen der Linearen Algebra
diskutiert werden.
3. HOHERE ABLEITUNGEN 223
Wir erhalten eine Bijektion
{Quadratische Formen auf Rn} → {A ∈ Rn×n | AT = A}Q 7→ AQ
QA ← [ A
Wir nennen eine quadratische Matrix A positiv definit (bzw. positiv semi-definit, negativ (semi-)definit, indefinit), falls A symmetrisch ist und QA die gleichnamige Eigenschaft hat.
Alle symmetrische Matrizen sind diagonalisierbar (siehe Korollar 1.8.5 der Linearen Algebra II vonProf. Cisinski). Man sieht dann leicht, dass fur symmetrische Matrizen gilt:
A ist positiv (bzw. negativ) definit :⇐⇒ alle Eigenwerte von A sind positiv (bzw. negativ)
A ist positiv (bzw. negativ) semi-definit :⇐⇒ alle Eigenwerte sind nicht-negativ (bzw. nicht-positiv)
A ist indefinit :⇐⇒ A hat positive und negative Eigenwerte
Beispiele 3.12.
Elliptisches Paraboloid E Hyperbolisches Paraboloid H
Die Bilder sind von der Webseite http://de.wikipedia.org/wiki/Paraboloid gezichnet von Lars Rohwedder (RokerHRO) - german wi-
kipedia, Gemeinfrei, Paraboloid https://commons.wikimedia.org/w/index.php?curid=213587, Hyperbolid erzeugt mit Povray 3.6, https:
//commons.wikimedia.org/w/index.php?curid=23859326
Die Menge E der Punkte mit z = x2 + y2 ist der Graph der Funktion f1(x, y) = x2 + y2. DieFunktion f1 ist die quadratische Form zum euklidischen Skalarprodukt auf R2. Sie ist positivdefinit. Die zugehorige symmetrische Matrix ist die Matrix(
1 00 1
).
224 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Graphen von positiv definiten quadratischen Formen nennt elliptisches Paraboloid .
Die MengeH der Punkte mit z = x2−y2 ist der Graph der Funktion f2(x, y) = x2−y2. Die Funktionf2 ist die quadratische Form zur bilinearen Abbildung b : R2×R2 → R, b((x, y)T , (x, y)T ) = xx−yy.Sie ist indefinit. Die zugehorige symmetrische Matrix ist(
1 00 −1
).
Graphen von indefiniten quadratischen Formen nennt hyperbolisches Paraboloid .
Wir versehen nun Rn×n mit einer beliebigen Norm ‖ · ‖, und erhalten so eine Topologie auf Rn×n,die unabhangig von der Norm ist.
LEMMA 3.13. Sei A ∈ Rn×n eine quadratische Matrix, so dass QA positiv definit (bzw. negativdefinit, bzw. indefinit) ist. Dann gibt es eine Umgebung U von A in Rn×n, so dass fur alle B ∈ Uauch QB positiv definit (bzw. negativ definit, bzw. indefinit) ist.
Ersetzt man definit durch semi-definit, so ist das Lemma nicht mehr gultig!
Im indefiniten Fall zeigen wir sogar etwas mehr:
ZUSATZ 3.14. Gilt QA(x+) > 0 und QA(x−) < 0, dann gibt es eine Umgebung U von A in Rn×n,so dass fur alle B ∈ U gilt: QB(x+) > 0 und QB(x−) < 0.
23
Beweis. Angenommen es gebe ein x ∈ Rn r {0} mit xTAx > 0. Indem wir x durch x/‖x‖2ersetzen, konnen wir annehmen, dass
x ∈ Sn−1 := {x ∈ Rn | ‖x‖2 = 1}
Da die Abbildung F : Sn−1 × Rn×n → R, (y,B) 7→ yTBy stetig ist, gibt es zu jedem x wie obenein ε(x) > 0, so dass:
(3.15) ∀y ∈ Sn−1 : ∀B ∈ Rn×n : ‖x− y‖2 < ε(x) ∧ ‖B −A‖ < ε(x) =⇒ F (y,B) > 0.
Die Zahl ε(x) hangt naturlich von x ab!
Eine analoge Konstruktion geht auch im Fall QA(x, x) < 0.
1. Fall: Ist nun QA indefinit, dann existieren x+, x− ∈ Sn−1 mit QA(x+) > 0 und QA(x−) < 0.Dann gilt fur ‖B −A‖ < min{ε(x+), ε(x−)}: QB(x+) > 0 und QB(x−) < 0.
23Dagegen ist die folgende Aussage falsch: Ist QA indefinit, dann gibt es eine Umgebung U von A in Rn×n,
so dass gilt∀B ∈ U : ∀x ∈ Rn : (QA(x) > 0 =⇒ QB(x) > 0).
Wie so oft ist hier die Reihenfolge der Quantoren zu beachten! Wahr ist: fur alle x mit QA(x) > 0, gibt es eineUmgebung U so dass . . . . Falsch ist hingegen: Es gibt ein U so dass fur alle x mit QA(x) > 0 gilt, . . . . In anderenWorten: das U kann nicht unabhangig von x gewahlt werden.
3. HOHERE ABLEITUNGEN 225
2. Fall: Ist QA positiv definit, dann wahle zu jedem x ∈ Sn−1 ein ε(x) > 0 wie in (3.15). Dann ist(Bε(x)(x) ∩ Sn−1)x∈Sn−1 eine offene Uberdeckung von Sn−1. Da Sn−1 kompakt ist, kann man zu
dieser Uberdeckung eine Lebesguesche Zahl ε > 0 wahlen (die nun nicht mehr von x abhangt!).Dies bedeutet, dass es zu jedem y ∈ Sn−1 ein x ∈ Sn−1 gibt mit Bε(y) ∩ Sn−1 ⊂ Bε(x)(x) ∩ Sn−1.
Es gilt24 dann
∀B ∈ Rn×n : ∀y ∈ Sn−1 : ‖B −A‖ < ε =⇒ F (y,B) = QB(y) > 0.
Also ist fur solche B die quadratische Form QB positiv definit.
3. Fall: negativ analog. Folgt durch Vorzeichenwechel aus dem 2. Fall.
3.5. Lokale Extrema.Wiederholung.Sei (M,d) ein metrischer Raum, f : M → R, p ∈M . Wir sagen f hat ein lokales Maximum (bzw.lokales Minimum) in p, falls es eine Umgebung U von p gibt, so dass
∀x ∈ U : f(x) ≤ f(p) (bzw. f(x) ≥ f(p)).
lokales Extremum in p :⇐⇒ lokales Maximum oder Minimum in p
Wir sagen f hat ein lokales striktes Maximum (bzw. lokales striktes Minimum) in p, falls es eineUmgebung U von p gibt, so dass
∀x ∈ U r {p} : f(x) < f(p) (bzw. f(x) > f(p)).
LEMMA 3.16. Sei U ⊂ Rn offen, f : U → R. Die Funktion f habe ein lokales Minimum in p ∈ U .
(1) Wenn die Richtungsableitung ∂p,vf existiert, so gilt ∂p,vf = 0.(2) Wenn f in p differenzierbar ist, so gilt f ′(p) = 0.(3) Wenn f auf einer Umgebung von p differenzierbar ist und in p zweimal differenzierbar ist, so
ist f ′′(p) = Hesspf positiv semi-definit.
Bei lokalen Maxima in p gilt alles analog, wenn wir positiv semi-definit durch negativ semi-definitersetzen.
Beweis. Wenn f ein lokales Minimum in p hat, dann hat fp,v, fp,v(t) := f(p + tv) ein lokalesMinimum in 0. Es folgt ∂p,vf = f ′p,v(0) = 0, falls es existiert. Es folgt f ′(p) = 0 falls es existiert.Weiter gilt (falls f ′′(p) existiert):
vT f ′′(p)v = Hesspf(v, v) = f ′′p,v(0) ≥ 0.
Lokales Maximum analog.
Definition 3.17. Man nennt p einen kritischen Punkt oder einen stationaren Punkt von f , fallsf ′(p) = 0.
24Wir schließen auch hieraus, dass alle zu y so gewahlten x die Ungleichung ε ≤ ε(x) erfullen. Achtung: Wirhaben aber nicht behauptet ∀x ∈ Sn−1 : ε ≤ ε(x). Man konnte dies durch geschicktere Konstruktion von ε(x)erreichen, aber wir haben keine Kontrolle, ob es mit dme oben gewahlten funktioniert.
226 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Also
lokales Extremum in p =⇒ p kritischer Punkt
SATZ 3.18. Sei U offen in Rn, f ∈ C2(U,R) (d.h. f : U → R ist zweimal stetig differenzierbar).Sei p ein kritischer Punkt von f .
(1) Ist f ′′(p) positiv definit, dann hat f ein lokales striktes Minimum in p.(2) Ist f ′′(p) negativ definit, dann hat f ein lokales striktes Maximum in p.(3) Ist f ′′(p) indefinit, dann hat f weder ein lokales Maximum noch ein lokales Minimum in p.
!ACHTUNG!. Keine derartige Aussage moglich, falls f ′′(p) semi-definit ist.Mi 12.6.
Beweis. Ist f ′′(p) positiv definit (bzw. negativ definit), so gibt es wegen Lemma 3.13 und derStetigkeit von U → Rn×n, x 7→ f ′′(x) eine Umgebung V von p in U , so dass f ′′(q) ebenfalls positivdefinit (bzw. negativ definit) fur alle q ∈ V ist. Wir wenden die Taylorformel fur ` = 1 an:
f(p+ h) = f(p) +1
2
n∑i,j=1
∂2f
∂xi ∂xj(p+ ϑh)hihj = f(p) +
1
2hT f ′′(p+ ϑh)h,
falls [p, p+h] ⊂ V , h 6= 0. Also ist f(p+h) > f(p) (bzw. f(p+h) < f(p)) fur alle p+h ∈ V r {p}.
Der indefinite Fall ist ahnlich. Wir wahlen h+, h− ∈ Rn mit hT+f′′(p)h+ > 0 und hT−f
′′(p)h− < 0.
Nach Zusatz 3.14 gibt es eine Umgebung V um p in U , so dass hT+f′′(q)h+ > 0 und hT−f
′′(q)h− < 0fur alle q ∈ U . Es folgt dann fur genugend kleines λ > 0:
f(p+ λh+) > f(p) f(p+ λh−) < f(p).
Beispiel 3.19. f : R2 → R, f(x, y) = x3 − 4x− xy + 12y
2.
f ′(x, y) = (3x2−4−y,−x+y). Die kritische Punkte sind also p1 := (−1,−1) und p2 := (4/3, 4/3).
Wir rechnen weiter
f ′′(x, y) =
(6x −1−1 1
).
Es ist also f ′′(p1) indefinit: dies ist ein Sattelpunkt. Und f ′′(p2) ist positiv definit: dies ist einlokales striktes Minimum.
4. Lokale Umkehrung differenzierbarer Abbildungen
Frage:Sei ∅ 6= U ⊂ Rn offen, f : U → Rk stetig, sei V := f(U) offen in Rk. Wann besitzt f eine (stetige)Umkehrfunktion g : V → U?
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN 227
Teil-Antwort:Fall: n 6= k. Dann hat keine Funktion f wie oben eine Umkehrfuntion! Beweis nicht ganz einfach(In der Vorlesung Topologie I)25.
Ab jetzt n = k.
Wenn U = Rn und wenn f eine lineare Abbildung ist, sagen wir f(x) = Ax, A ∈ Rn×n, dannwurde diese Frage intensiv in der Linearen Algebra diskutiert:
f besitzt eine Umkehrfunktion
⇐⇒ f besitzt eine lineare Umkehrfunktion
⇐⇒ f ist injektiv
⇐⇒ f ist surjektiv
⇐⇒ detf 6= 0
⇐⇒ A ist eine invertierbare Matrix
Hierbei detf = detA.
Ahnlich gilt fur A ∈ Rn×n, p ∈ Rn und f : Rn → Rn, f(x) := Ax+ p:
f invertierbar⇐⇒ A invertierbar
und gegebenenfalls f−1(y) = A−1(y − p).
Notation fur die Einheitsmatrix:
11n =
1 0 0 . . . 00 1 0 . . . 00 0 1 0...
.... . .
...0 0 0 . . . 1
∈ Rn×n
GL(n,R) := {A ∈ Rn×n | detA 6= 0}.
Ab jetzt sei f differenzierbar (aber wir nehmen nicht mehr an, dass f linear sein muss).
LEMMA 4.1. Sei U offen in Rn und f : U → Rn differenzierbar in x ∈ U . Sei V := f(U) offenin Rn und g : V → Rn differenzierbar in f(x) mit g ◦ f = idU . Dann gilt:
g′(y) · f ′(x) = 11n, wobei y = f(x)
Insbesondere ist dann f ′(x) eine invertierbare Matrix.
25Und man muss hier sehr genau aufpassen, wie man argumentiert. Man konnte zum Beispiel vermuten, dassf nicht surjektiv ist, falls n > k. Dies ist aber nicht richtig. Es gibt zum Beispiel stetige surjektive AbbildungenR→ Rn fur alle n ∈ N>0. Diese Funktionen sind aber nicht injektiv.
228 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Beweis. Kettenregel.
Aus Kapitel 5 wissen wir (Proposition 1.6 und einige verbundene Aussagen):
PROPOSITION. Sei (a, b) ein Intervall, f : (a, b) → R differenzierbar, mit f ′(x) 6= 0 fur allex ∈ (a, b). Dann ist f injektiv und f((a, b)) ist auch ein offenes Intervall. Die Umkehrfunktion
g := f−1 : f((a, b))→ (a, b)
existiert, ist differenzierbar und es gilt fur alle x ∈ (a, b)
g′(y) =(f ′(x)
)−1
, wobei y = f(x)
Ein ahnlicher Satz ist nicht nur fur n = 1, sondern fur alle n ∈ N richtig, der lokale Umkehrsatz.
Definition 4.2. Sei U offen in Rn, p ∈ U und f : U → Rn. Wir sagen f ist bei p lokal umkehrbar ,falls es eine offene Umgebung V von p in U und eine offene Umgebung W von f(p) in Rn gibt, sodass f |V : V →W bijektiv ist.
SATZ 4.3 (Lokaler Umkehrsatz). Sei U offen in Rn, p ∈ U . Sei f ∈ C`(U,Rn), ` ≥ 1. Istdet(f ′(p)) 6= 0, dann gibt es offene Umgebung V von p in U und eine offene Umgebung W vonf(p) in Rn, so dass gilt
(1) f |V : V →W bijektiv. Somit ist f lokal umkehrbar bei p.
(2) (f |V )−1
: W → V ⊂ Rn ist `-mal stetig differenzierbar. 26
(3)[(f |V )
−1]′
(y) = (f ′(x))−1
, fur alle x ∈ V , wobei y = f(x)
Der Satz weicht an einigen wichtigen Stellen von der obigen Proposition ab. Zum einen muss mannaturlich
”f ′(x) 6= 0“ durch
”f ′(x) invertierbar“ ersetzen. Es gibt aber einige weitere wichtige
Unterschiede
• Keine globale Aussage fur Umkehrung, nur eine lokale Aussage.• Wir benotigen stetige Differenzierbarkeit.
Beispiele 4.4.
(1) Ist f affin-linear, sagen wir f(x) = Ax + p, mit A ∈ Rn×n, p ∈ Rn. Dann ist f ′(p) = A. FallsA ∈ GL(n,R), dann kann man V = W = Rn wahlen, f−1 siehe oben.
(2) Wir betrachten die komplexe Exponentialfunktion exp : C → C mit Hilfe von C ∼= R2 alsFunktion f : R2 → R2,
f(x, y) =
(Re exp(x+ iy)Im exp(x+ iy)
)=
(ex cos yex sin y
)f ′(x, y) =
(ex cos y −ex sin yex sin y ex cos y
)= ex
(cos y − sin ysin y cos y
)26In anderen Worten (f |V )−1 ∈ C`(W,Rn).
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN 229
detf ′(x, y) = e2x · 1 6= 0.
Der Definitionsbereich R2 von f ist zusammenhangend, f ′(p) ist invertierbar fur alle p ∈ D(f),aber dennoch ist f nicht injektiv. Deswegen: nur lokale Umkehrung moglich.
Beweis.
O.B.d.A. p = 0, f(p) = 0, f ′(p) = 11n.
Wenn f dies nicht erfullt, dann definiere
g(x) = f(x+ p)− f(p)
undf(x) = g′(0)−1g(x).
Dann haben wir f(0) = 0 und f ′(0) = 11n. Und wenn wir den lokalen Umkehrsatz fur f in 0 zeigen,dann folgt hieraus unmittelbar der lokale Umkehrsatz fur f in p.
Zu (1); Teil (i): Bestimmung von V und W .Im folgenden sei ‖ · ‖ immer die Supremumsnorm auf Rn und auf Rn×n, d.h.∥∥∥∥∥∥∥∥∥
a1
a2
...an
∥∥∥∥∥∥∥∥∥ = max{|a1|, . . . , |an|},
∥∥(aij)i,j∈{1,...,n}∥∥ = max{|a11|, |a12|, . . . , |a1n|, |a21|, . . . , |ann|}.
Also ‖Ax‖ ≤ n‖A‖ ‖x‖ fur x ∈ Rn, A ∈ Rn×n.
Definiere ϕ(x) = x− f(x), also ϕ′(0) = 0.
Bestimme r > 0 so, dass27
(a) B2r(0) = {x ∈ Rn | ‖x‖ < 2r} ⊂ U(b) ‖ϕ′(x)‖ < 1
2n fur alle x ∈ B2r(0)
(b) ist moglich, da ϕ stetig differenzierbar ist28.
Fur x, y ∈ Br(0) = {x ∈ Rn | ‖x‖ ≤ r}, wenden wir nun den Mittelwertsatz auf die j-te Kompo-nente ϕj von ϕ an29 und erhalten fur ein ϑ ∈ (0, 1):
|ϕj(y)− ϕj(x)| = |ϕ′j(x+ ϑ(y − x)︸ ︷︷ ︸z:=
) · (y − x)| ≤ ‖ϕ′(z) · (y − x)‖ ≤ n‖ϕ′(z)‖ ‖y − x‖ ≤ n
2n‖y − x‖.
27Eine kleine Bemerkung zu den hier verwendeten”Ballen“ Br(p). Es sind Balle nicht – wie zumeist ublich –
bezuglich der Standardnorm, sondern bezuglich der Supremumsnorm. Deswegen ist BR(p) eigentlich ein achsenpar-
alleler Wurfel mit Seitenlange 2R und mit Schwerpunkt p.28und da Urbilder offener Mengen unter stetigen Abbildungen wieder offen sind29Also ϕj : U → R, ϕ(x) = (ϕ1(x), . . . , ϕn(x))T
230 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Daraus ergibt sich dann
(4.5) ‖ϕ(y)− ϕ(x)‖ ≤ 1
2‖y − x‖.
Setze nun W := Br/2(0) und V := Br(0)∩f−1(W ). Letzteres ist eine offene Umgebung von 0. Wirhaben
f(V ) ⊂ f(f−1(W )) ⊂WFr 14.6.
Zu (1); Teil (ii): f |V : V →W ist bijektiv.
f |V injektiv: Seien x, y ∈ V mit f(x) = f(y). Dann gilt x− ϕ(x) = y − ϕ(y), also
‖y − x‖ = ‖ϕ(y)− ϕ(x)‖(4.5)
≤ 1
2‖y − x‖
Also y = x.
f |V surjektiv: Gegeben sei w ∈W . Wir definieren
ψw : Br(0)→ Rn, x 7→ w + ϕ(x).
Die Abbildung ist eine Kontraktion, denn
‖ψw(y)− ψw(x)‖ = ‖ϕ(y)− ϕ(x)‖(4.5)
≤ 1
2‖y − x‖.
Es gilt ψw(Br(0)) ⊂ Br(0), denn aus (4.5) folgt:
‖ψw(x)‖ ≤ ‖w‖︸︷︷︸<r/2
+ ‖ϕ(x)−=0︷︸︸︷ϕ(0) ‖︸ ︷︷ ︸
≤r/2
< r.
Da Br(0) vollstandig ist, gibt es nach dem Banachschen Fixpunktsatz30 ein z ∈ Br(0) mit ψw(z) =z und man sieht dann z ∈ Br(0).31 Es gilt also
z = ψw(z) = w + ϕ(z) = w + z − f(z),
also f(z) = w. Daraus folgt dann auch z ∈ f−1(W ), d.h. z ∈ V .
Zu (2); Teil (i): (f |V )−1
: W → V ⊂ Rn ist differenzierbar auf W .
Uberprufe Differenzierbarkeit in w ∈W , w = f(p). Zu h mit p+ h ∈ V wahle ein k mit
f(p+ h) = w + k.
Wir konnen hier aber auch h als Funktion in k betrachten, da f |V bijektiv.
k = f(p+ h)− f(p) = f ′(p) · h+ ε(h)‖h‖, limh→0
ε(h) = 0
30angewendet auf f := ψw und Y := X := Br(0)31Denn es ist ja im Bild von ψw.
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN 231
Wir multiplizieren diese vektorielle Gleichung mit (f ′(p))−1, falls es existiert.
(f ′(p))−1k = h+ ‖h‖(f ′(p))−1ε(h)
= (p+ h)− p+ ‖h‖(f ′(p))−1ε(h)
= f−1(w + k)− f−1(w)− ‖k‖δ(k)
wobei wir definieren
δ(k) = −‖h‖‖k‖
(f ′(p))−1ε(h) .
Die Behauptung folgt also, sobald wir limk→0 δ(k) = 0 gezeigt haben.
Wir rechnen:
ϕ(p+ h)− ϕ(p) = p+ h− f(p+ h)− p+ f(p) = h− kAlso
‖h‖ ≤ ‖ϕ(p+ h)− ϕ(p)‖+ ‖k‖(4.5)
≤ 1
2‖h‖+ ‖k‖.
Es folgt ‖h‖ ≤ 2‖k‖ und somit
limk→0
δ(k) = 0.
Wir haben gezeigt: ist f ′(p) invertierbar, dann ist (f |V )−1
differenzierbar in w = f(p) und es gilt
dann(
(f |V )−1)′
(w) =(f ′(p)
)−1.
Die Umgebung V wurde so gewahlt, dass ‖ϕ′(p)‖ < 12n fur alle p ∈ V . Aus ϕ(x) = x− f(x) folgt
ϕ′(p) = 11n − f ′(p), somit
‖f ′(p) · x‖ ≥ ‖x‖ − ‖ϕ′(p) · x‖ ≥ ‖x‖ − n‖ϕ′(p)‖ ‖x‖ ≥ ‖x‖ − n
2n‖x‖ ≥ 1
2‖x‖.
Also ist f ′(p) eine invertierbare Matrix. Somit ist (f |V )−1
differenzierbar auf W ; und es gilt (3).Zu (3).
Diese Formel folgt nun direkt aus den Uberlegungen unter (2), Teil (i).
Zu (2); Teil (ii): `-fache stetige Differenzierbarkeit.
Auf Grund von (3) bildet die Komposition
W(f |V )−1
−→ Vf ′−→ GL(n,R)
inv−→ GL(n,R)
w ∈W auf[(f |V )
−1]′
(w) ab. Da die Inversen-Abbildung
inv : GL(n,R)→ GL(n,R), A 7→ A−1
232 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
glatt ist,32 folgt durch Induktion aus der `-fachen stetigen Differenzierbarkeit von f auch die `-fachestetige Differenzierbarkeit von (f |V )
−1.
Beispiel 4.6. f : R2 → R2, f(x, y) :=(
12x
2 + y, xy)T
.
f ′(x, y) :=
(x 1y x
), detf ′(x, y) = x2 − y .
Also ist f bei allen Punkten (x, y) mit x2 6= y lokal umkehrbar. In den Punkten der Form (x, x2)macht der lokale Umkehrsatz keine Aussage, ob eine lokale Umkehrfunktion existiert. Wenn dortaber in (x, x2) eine lokale Umkehrfunktion existiert, so ist sie nach Lemma 4.1 in f(x, x2) nichtdifferenzierbar.
Es gibt also sehr oft lokale Umkehrfunktionen. In den meisten Fallen kann man diese lokale Um-kehrfunktion aber nicht explizit (d.h. als Formelausdruck) angeben. Man kennt dann die Existenzder Umkehrfunktion, ohne sie als Formelausdruck hinschreiben zu konnen.
Definition 4.7. Sind U und V offene Mengen in Rn, ` ∈ N≥1. Man nennt f : U → V einenC`-Diffeomorphismus (von U auf V ), falls f : U → V bijektiv ist und sowohl f als auch f−1 `-malstetig differenzierbar sind. In der Analysis II und III verwenden wir das Wort Diffeomorphismusim Sinne von C1-Diffeomorphismus.
Der lokale Umkehrsatz liefert:
LEMMA 4.8. Sei U offen in Rn und f : U → Rn eine Funktion, V := f(U). Dann ist f genaudann ein Diffeomorphismus von U auf V , wenn
• f ∈ C1(U,Rn),• detf ′(x) 6= 0 fur alle x ∈ U ,• f injektiv ist.
5. Der Satz uber implizit definierte Funktionen
Motivation: Gegeben sei eine Funktion F : R2 → R. Wir wollen alle Losungen von
F (x, y) = 0
bestimmen. Am liebsten ware es uns, wenn wir eine Losungsfunktion hatten, d.h. eine differenzier-bare Funktion f : (a, b)→ R, so dass F (x, f(x)) = 0 und so dass alle oder moglichst viele Losungenvon der Form (x, f(x)) sind.
32Die Formel fur A−1, die Sie aus der Linearen Algebra inzwischen kennen sollten, hat Eintrage, die rationaleFunktionen in den Koeffizienten von A sind. Die Nenner dieser rationalen Funktionen sind nicht Null, da die Matrixinvertierbar ist.
5. DER SATZ UBER IMPLIZIT DEFINIERTE FUNKTIONEN 233
Beispiele 5.1.
(1) F (x, y) := y − x3 + x2 − 1 = 0. Dann ist f(x) = x3 − x2 + 1 solch eine Losungsfunktion.
Bild der zugehorigen Losungsmenge
∂F
∂y= 1 6= 0 in allen Losungen (x, y)
(2) F (x, y) := y2 − x2 − 1 = 0. Dann benotigen wir zwei Funktionen, um die Losungen zubeschreiben
f+(x) =√x2 + 1, f−(x) = −
√x2 + 1, f± : R→ R.
Bild der Graphen von f+ und f−.
∂F
∂y= 2y 6= 0 in allen Losungen (x, y)
(3) F (x, y) = x− y2 = 0.
Bild der zugehorigen Losungsmenge
Eine Beschreibung der Losungen in der Form (x, f(x)) ist schwierig, da wir zum einenzwei Funktionen benotigen (x 7→
√x und x 7→ −
√x) und da die Wurzelfunktion in 0 nicht
differenzierbar ist. 33
∂F
∂y= 2y 6= 0 in allen Losungen außer in (0, 0)
Problemlos moglich, wenn wir x und y vertauschen. Sei g : R → R, g(y) = y2. DieLosungsmenge von x− y2 = 0 ist
{(g(y), y) | y ∈ R}.∂F
∂x= 1 6= 0 in allen Losungen
(4) F (x, y) = x− y3 = 0.
Bild der zugehorigen Losungsmenge
Eine Beschreibung der Losungen in der Form (x, f(x)) ist moglich durch die Kubik-wurzel x 7→ 3
√x, aber sie ist in 0 nicht differenzierbar.
∂F
∂y= 3y2 6= 0 in allen Losungen außer in (0, 0)
Die Differenzierbarkeit ist aber wiederum gegeben, wenn wir zunachst x und y ver-tauschen. Sei g : R→ R, g(y) = y3. Die Losungsmenge von x− y3 = 0 ist
{(g(y), y) | y ∈ R}.
33Da die Quadratwurzelfunktion auf [0,∞) definiert ist, haben wir streng genommen gar nicht definiert, was
”differenzierbar in 0“ bedeutet, denn wir benotigen eigentlich dazu, dass die Funktion auf einer Umgebung der
0 definiert ist. Definition 1.1 in Kapitel 5 ist aber auch sinnvoll, wenn wir nur fordern dass der Punkt x0 ein
Haufungspunkt der Definitionsmenge ist. Mit dieser Definition ist die Wurzelfunktion nicht differenzierbar in 0.
234 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
∂F
∂x= 1 6= 0 in allen Losungen
(5) F (x, y) = x2 − y2 = 0. Zwei Losungsfunktionen f±(x) = ±x, die sich schneiden
Bild der zugehorigen Losungsmenge
∂F
∂y= −2y 6= 0 in allen Losungen außer in (0, 0)
(6) F (x, y) = x3 − y2 = 0.
Bild der zugehorigen Losungsmenge {( 3√y2, y)T | y ∈ R}
∂F
∂y= −2y 6= 0 in allen Losungen außer in (0, 0)
(7) F (y, x) = x2 + y2 = 0. Losungsmenge {(0, 0)}. Nur ein Punkt!
∂F
∂y(0, 0) = 0
Vermutung: Es geht gut, wenn ∂F∂y (x, y) 6= 0 fur alle Losungen (x, y). Der Satz uber implizite
Funktionen macht genau solch eine Aussage.
Notation.34 Von nun an sei U 6= ∅ offen in Rn+m und F : U → Rm stetig differenzierbar. Punkte inRn+m schreiben wir zumeist als (x, y) mit x = (x1, . . . , xn)T ∈ Rn, y = (y1, . . . , ym)T ∈ Rm,F (x, y) = (F1(x, y), . . . , Fm(x, y)).
∂F
∂x(x, y) :=
(∂Fi∂xj
(x, y)
)i=1,...,mj=1,...,n
∈ Rm×n
∂F
∂y(x, y) :=
(∂Fi∂yj
(x, y)
)i=1,...,mj=1,...,m
∈ Rm×m
Ziel: Finde Funktionen
y1 = y1(x1, . . . , xn)
y2 = y2(x1, . . . , xn)
......
ym = ym(x1, . . . , xn)
so dass (x, y(x)) Losungen von F (x, y) = 0.
SATZ 5.2 (Satz uber implizite Funktionen). Sei ∅ 6= U ⊂ Rn+m offen, und F : U → Rm stetigdifferenzierbar. In einem Punkt (x, y) ∈ U soll F (x, y) = 0 und det∂F∂y (x, y) 6= 0 gelten. Dann gibtes
34Die Indizes k, n und M wechseln etwas ihre Rollen im Vergleich zu den vorherigen Kapiteln
5. DER SATZ UBER IMPLIZIT DEFINIERTE FUNKTIONEN 235
• eine offene Umgebung V von x in Rn,• eine offene Umgebung W von y in Rm,• eine Funktion f : V →W
mit den folgenden Eigenschaften
(a) V ×W ⊂ U(b) {(x, y) ∈ V ×W | F (x, y) = 0} = {(x, f(x)) | x ∈ V }(c) f ist stetig differenzierbar und es gilt
f ′(x) = −(∂F
∂y(x, f(x))
)−1∂F
∂x(x, f(x))
19.6.
Veranschaulichung des Satzes uber implizite Funktionen
Bemerkung 5.3. Zu gegebenem F , U , x und y liefert der Satz: f , V , W . Diese sind nicht eindeutig,z.B. kann man V verkleinern und dann f einschranken. Erfullen f , V , W ebenfalls den Satz undsetzen wir Z := V ∩ V ∩ f−1(W ∩ W ), dann gilt f |Z = f |Z .
Bemerkung 5.4. Sei U ⊂ Rm offen und f : U → Rm stetig differenzierbar. Wenn wir den Satzuber implizite Funktionen auf F : Rm × U → Rm, F (x, y) := x − f(y) anwenden (n = m), soerhalten wir den lokalen Umkehrsatz.
Bemerkung 5.5. Zu gegebenem F , U , x und y liefert der Satz: f , V , W . Diese sind nicht eindeutig,z.B. kann man V verkleinern und dann f einschranken. Erfullen f , V , W ebenfalls den Satz undsetzen wir Z := V ∩ V ∩ f−1(W ∩ W ), dann gilt f |Z = f |Z .
Bemerkung 5.6. Sei U ⊂ Rm offen und f : U → Rm stetig differenzierbar. Wenn wir den Satzuber implizite Funktionen auf F : Rm × U → Rm, F (x, y) := x − f(y) anwenden (n = m), soerhalten wir den lokalen Umkehrsatz.
Definition 5.7. Die Funktion f nennt man eine durch F (x, y) = 0 implizit definierte Funktion.
Bemerkung 5.8. Aussage (b) besteht eigentlich aus zwei Teilen. Zum einen besagt die Aussage,dass (x, f(x)) eine Losung ist, also F (x, f(x)) = 0 fur alle x ∈ V . Zum anderen sind lokal (d.h.heißt hier in V ×W ) alle Losungen von dieser Form.
Bemerkung 5.9. Oft kann man implizite Funktionen nicht explizit angeben.”Explizit angeben“
heißt hier durch einen Formelausdruck, der sich aus Standard-Operationen zusammensetzt.
ZUSATZ 5.10 (zum Satz5.2 uber implizite Funktionen). Sei ` ≥ 1. Ist F `-mal stetig differenzier-bar, so ist f ebenfalls `-mal stetig differenzierbar.
Beispiel 5.11. Wir betrachten die Funktion
F : Rn+1 → R, F (z) := 〈z, z〉 − 1.
F ∈ C∞(Rn+1,R). Dann ist die Losungsmenge die n-dimensionale Sphare
Sn := {z ∈ Rn+1 | F (z) = 0} = {z ∈ Rn+1 | ‖z‖2 = 1}.
236 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Wir schreiben z = (x, y) mit x ∈ Rn und y ∈ R. Nun ist (∂F/∂y)(x, y) = 2y und dies ist fury 6= 0 nicht Null. Zu jedem (x, y) ∈ Sn mit y 6= 0 kann man den Satz uber implizite Funktionenanwenden.
Wir beschranken uns auf den Fall y > 0. Dann sind mogliche Wahlen:
V := B1(0,Rn) := {x ∈ Rn | ‖x‖ < 1}, W := (0,∞), f(x) :=√
1− ‖x‖22Eine andere Wahl ware, falls ‖x‖ < 1− δ:
V := B1−δ(0,Rn), W := (0,∞), f(x) :=√
1− ‖x‖22
Eine weitere mogliche Wahl ist: V := B1(0,Rn), W :=(
0, 10011000
), f(x) :=
√1− ‖x‖22
Nicht erlaubt sind:
V := B1(0,Rn), W := (0, 1), (W zu klein)
V := B1(0,Rn), W := R, (W zu groß)
Zeichnung des Standardkreises mit den oben erklarten Mengen.
Beweis des Satzes5.2 uber implizite Funktionen und des Zusatzes. Sei F wie im Satz gegeben. Wir
definieren: G : U → Rn+m, G(x, y) :=
(x
F (x, y)
). Wir haben G ∈ C`(U,Rm+n) und
G′(x, y) =
(11n 0∗ ∂F
∂y (x, y)
)Also
det G′(x, y) = (det11n)︸ ︷︷ ︸=1
·(
det∂F
∂y(x, y)
)6= 0 .
Wende den lokalen Umkehrsatz auf G im Punkt p := (x, y) an. Es gibt dann eine offene Umgebung
V von p in U und eine offene Umgebung W von G(p) in Rn+m, so dass G|V : V → W bijektiv ist
und so dass (G|V )−1 ∈ C`(W,Rn+m). Offensichtlich hat (G|V )−1 die Form
(G|V )−1(x, y) :=
(x
ψ(x, y)
)fur ein ψ ∈ C`(W,Rm). Durch Differenzieren von idV = (G|V )−1 ◦GV erhalten wir
(5.12) 11n+m =[(G|V )−1
]′(x, F (x, y)) ◦G′(x, y) =
(11n 0
∗ ∂ψ∂y (x, F (x, y))
)(11n 0∗ ∂F
∂y (x, y)
).
Ausmultiplizieren und Vergleichen des rechten unteren Blocks auf beiden Seiten ergibt
11m =
(∂ψ
∂y(x, F (x, y))
)(∂F
∂y(x, y)
).
6. UNTERMANNIGFALTIGKEITEN 237
O.B.d.A. konnen wir annehmen,35 dass V die Gestalt V = V0 ×W hat mit V0 offen in Rn und Woffen in Rm. Die Abbildung ψ bildet W in W ab, und ψ(x, 0) = (x, y)T . Auf Grund der Stetigkeit
von ψ finden wir eine offene Umgebung V von x mit V ⊂ V0 und V ×{0} ⊂ W . Dann ist f : V →W ,f(x) := ψ(x, 0) eine wohldefinierte C`-Abbildung und F (x, f(x)) = 0. Wir haben somit (a),
”⊃“
in (b) und f ∈ C`.
Ist (x, y) ∈ V ×W mit F (x, y) = 0, dann ist G(x, y) = (x, 0)T , also (G|V )−1(x, 0) = (x, y)T . Diesimpliziert f(x) = y. Wir erhalten
”⊂“ in (b).
Wenn wir die Stern-Eintrage in (5.12) berucksichtigen, sieht man
0 =∂ψ
∂x(x, F (x, y)) +
∂ψ
∂y(x, F (x, y))
∂F
∂x(x, y),
also
f ′(x) =∂ψ
∂x(x, 0) = −∂ψ
∂y(x, 0)
∂F
∂x(x, f(x)) = −
(∂F
∂y(x, f(x))
)−1∂F
∂x(x, f(x)).
6. Untermannigfaltigkeiten
6.1. Definition und erste Beispiele.
Definition 6.1. Sei ` ≥ 1, k ≥ n. Sei M eine Teilmenge von Rk. Wir nennen M eine n-dimensionale Untermannigfaltigkeit von Rk mit Regularitat C`, falls es zu jedem p ∈ M offe-ne Mengen U, V ⊂ Rk und einen C`-Diffeomorphismus ϕ : U → V gibt, so dass p ∈ U undϕ(U ∩M) = V ∩ (Rn × {0}). Solch ein ϕ nennt man eine Untermannigfaltigkeitskarte von M .
Anschaulich: der Diffeomorphismus ϕ verbiegt U ∩M in eine offene Teilmenge von Rn×{0} ⊂ Rk.
Ein Bild, das eine Untermannigfaltigkeitskarte graphisch darstellt mitUntermannigfaltigkeitskarte
Untermannigfaltigkeit mit Regularitat C` := C`-Untermannigfaltigkeit
In der Analysis II und III nutzen wir den Begriff”Untermannigfaltigkeit“ (ohne weitere Angabe
der Regularitat) immer im Sinne von”C1-Untermannigfaltigkeit“.
Spezielle Dimensionen.In manchen Dimensionen haben Untermannigfaltigkeiten spezielle Namen:36
2-dimensionale Untermannigfaltigkeiten von Rk =: Flachen in Rk
35Wenn dies nicht der Fall ist, ersetzen wir einfach V durch eine kleinere offene Umgebung von p, die die
gewunschte Produktgestalt hat, und W ist dann entsprechend zu verkleinern.36Der Fall n = 1 is hier leider etwas kompliziert: zusammenhangende 1-dimensionale Untermannigfaltigkeit =:
regulare eingebettete Kurve
238 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
(k − 1)-dimensionale Untermannigfaltigkeiten von Rk =: Hyperflachen in Rk
Beispiele 6.2.
(1) Sei M ⊂ Rk ein n-dimensionaler Untervektorraum (mit n ≤ k). Wahle eine Basis (v1, . . . , vn)von M . Wie in der Linearen Algebra I gezeigt, existieren Vektoren vn+1, . . . , vk in Rk, so dass(v1, . . . , vn, vn+1, . . . , vk) eine Basis von Rk ist. Betrachte die lineare Abbildung ϕ : Rk → Rk,vi 7→ ei, wobei ei der i-te kanonische Basisvektor ist. Dann ist ϕ ein linearer Isomorphismus,insbesondere ein C∞-Diffeomorphismus mit
ϕ(M) = ϕ(Span{v1, . . . , vn})= Span{e1, . . . , en}= Rk ∩ (Rn × {0}).
Also ist M eine n-dimensionale Untermannigfaltigkeit der Regularitat C∞ von Rk.(2) Ist W offen in Rn, f ∈ C`(W,Rm). Dann ist der Graph von f
Graphf := {(x, f(x)) | x ∈W}
eine n-dimensionale Untermannigfaltigkeit von Rn+m mit Regularitat C`. Denn
ϕ : W × Rm︸ ︷︷ ︸U :=
→W × Rm︸ ︷︷ ︸V :=
, (x, y) 7→ (x, y − f(x))
ist eine `-mal stetig differenzierbare Abbildung mit `-mal stetig differenzierbarer Umkehrab-bildung
ϕ−1 : W × Rm →W × Rm, (x, y) 7→ (x, y + f(x)) .
U ∩Graphf = Graphf = {(x, f(x) | x ∈W} ϕ→ W × {0} = V ∩ (Rn × {0})(x, f(x)) 7→ (x, 0)
Ein Bild, das die Abbildung ϕ darstellt
(3) Ist W offen in Rn, f−, f+ ∈ C`(W,Rm) mit f− < f+. Dann ist Graphf− ∪ Graphf+ einen-dimensionale Untermannigfaltigkeit von Rn+m. Definiere zum Beispiel
ϕ− : {(x, y) | x ∈W ∧ y < f+(x)}︸ ︷︷ ︸U :=
→ {(x, y) | x ∈W ∧ y < f+(x)− f−(x)}︸ ︷︷ ︸V :=
, (x, y) 7→ (x, y−f−(x))
ϕ+ : {(x, y) | x ∈W ∧ f−(x) < y}︸ ︷︷ ︸U :=
→ {(x, y) | x ∈W ∧ −f+(x) + f−(x) < y}︸ ︷︷ ︸V :=
, (x, y) 7→ (x, y−f+(x))
Ein Bild, das die Abbildungen ϕ+ und ϕ− darstelltFr. 21.6.
(4) M ist 0-dimensionale Untermannigfaltigkeit von Rk ⇐⇒ M ist eine diskrete Teilmenge vonRk :⇐⇒ Die Spurtopologie auf M ist die diskrete TopologieZum Beispiel ist {1/n | n ∈ N>0} eine 0-dimensionale Untermannigfaltigkeit von R.
(5) M ist k-dimensionale Untermannigfaltigkeit von Rk ⇐⇒ M ist eine offene Teilmenge von Rk
6. UNTERMANNIGFALTIGKEITEN 239
(6) Ist M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit der Regularitat C`, so ist auch jedeoffene Teilmenge M ′ von M eine n-dimensionale C`-Untermannigfaltigkeit von Rk. Denn zugegebenem p ∈M ′ wahle eine Untermannigfaltigkeitskarte ϕ : U → V mit p ∈ U . Da M ′ offenin M ist, gibt es eine in Rk offene Teilmenge U ′ mit M ′ = M ∩U ′. Dann ist ϕ|U∩U ′ : U ∩U ′ →ϕ(U ∩ U ′) eine Untermannigfaltigkeitskarte von M ′ mit p ∈ U ∩ U ′.
(7) Es folgt hieraus, dass die Untermannigfaltigkeits-Eigenschaft lokal ist, das heißt: Eine Teil-menge M ⊂ Rk ist genau dann eine n-dimensionale C`-Untermannigfaltigkeit, wenn jederPunkt p ∈ M eine offene Umgebung U besitzt, so dass U ∩ M eine n-dimensionale C`-Untermannigfaltigkeit ist.
Untermannigfaltigkeiten sind insbesondere fur Anwendungen in der Physik und anderen Natur-wissenschaften, aber auch zum Beispiel fur (nicht-lineare) Optimierungsprobleme in der Betriebs-wirtschaftslehre sehr wichtig.
Untervektorraume von Rk kann man auf verschiedene Arten beschreiben, zum Beispiel
(1) durch Gleichungen, z.B. V := {(x1, . . . , xk) ∈ Rk | x1 + 2x2 = 0}(2) als Graph, das heißt V := Graphf einer linearen Funktion f : Rn → Rk−n(3) V := Bild(f) fur eine lineare Abbildung f : Rm → Rk(4) durch Parametrisierung, z.B. definiere zu v1, v2 ∈ Rk:
V := {tv1 + sv2 | t, s ∈ R}.
(5) Durch eine lineare Untermannigfaltigkeitskarte wie in Beispiel 6.2 (1).
Jede dieser Beschreibungen verallgemeinert sich zu einer Beschreibung von Untermannigfaltigkei-ten:
(1) Abschnitt 6.2: lokal als Urbild eines regularen Werts,(2) Abschnitt 6.2: lokal als Graph, das heißt lokal als Graphf einer C`-Funktion f : U → Rk−n,
U offen in R(3) Abschnitt 6.3: lokal als Bild einer Immersion,(4) Abschnitt 6.5: durch eine lokale Parametrisierung(5) durch eine Untermannigfaltigkeitskarte wie in Definition 6.1
Hierbei ist (5) fur theoretische Uberlegungen sehr hilfreich ist, aber oft wenig geschickt fur konkreteRechnungen. Moderne Programme, die gekrummte Flachen modellieren mussen, z.B. Raytracerwie povray nutzen verschiedene dieser Methoden, um Flachen zu beschreiben. Sie haben zumeistHilfsmittel, um von einer Form in die andere umrechnen zu konnen.
6.2. Der Satz vom regularen Wert. Ein wichtiges Kriterium, um zu zeigen, dass eineTeilmenge von Rk eine Untermannigfaltigkeit ist, ist der Satz vom regularen Wert.
240 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Definition 6.3. Sei U offen in Rk, F : U → Rm `-mal stetig differenzierbar, ` ≥ 1. Wir sagenz ∈ Rm ist ein regularer Wert von F , falls gilt
(6.4) ∀p ∈ F−1({z}) : F ′(p) hat Rang m.
Ist z kein regularer Wert, so nennt man z einen singularen Wert .
!ACHTUNG!. Im Fall z /∈ F (U) ist z ein regularer Wert! Denn der Allquantor geht uber die leereMenge, die Aussage (6.4) ist also wahr. Wenn z ein regularer Wert von F , so impliziert dies nicht,dass z ein Wert von F ist.
Beispiele 6.5. (1) Ist F : Rn → Rk eine lineare Funktion. Dann gilt:
F ist surjektiv
⇐⇒ 0 ist ein regularer Wert
⇐⇒ Alle z ∈ Rk sind regulare Werte
(2) Wir betrachten (ahnlich wie in Beispiel 5.11) die Funktion
F : Rn+1 → R, F (x) := 〈x, x〉.
F ′(x) = 2xT .
Dann ist 0 kein regularer Wert, aber jedes z ∈ R r {0} ist ein regularer Wert. Fur z < 0 istF−1({z}) = ∅ und dann ist z ein regularer Wert, siehe die obige Achtung-Bemerkung. Furz > 0 gilt ‖F ′(x)‖2 = 2
√z falls F (x) = z. In diesem Fall hat also F ′(x) Rang 1.
Sn := F−1({1}) = {x ∈ Rn+1 | ‖x‖2 = 1}.
Definition 6.6. Sei
Sk :={
Permutationen︸ ︷︷ ︸=Bijektionen
{1, 2, . . . , k} → {1, 2, . . . , k}}
Zu σ ∈ Sk sei Lσ die lineare Abbildung Rk → Rk mit ej 7→ eσ(j).
SATZ 6.7 (Satz vom regularen Wert). Sei M eine Teilmenge von Rk, ` ≥ 1. Aquivalent sind:
(1) M ist n-dimensionale Untermannigfaltigkeit von Rk mit Regularitat C`
(2) Zu jedem p ∈M existiert eine offene Umgebung U in Rk und eine Funktion F ∈ C`(U,Rk−n),so dass 0 regularer Wert von F ist und F−1({0}) = U ∩M .
(3) Zu jedem p ∈M existiert eine offene Umgebung U in Rk und eine Funktion F ∈ C`(U,Rk−n),ein z ∈ Rk−n, so dass z regularer Wert von F ist und F−1({z}) = U ∩M .
(4) Lokal ist M nach Permutation der Komponenten von Rk der Graph einer Funktion, genauer:zu jedem p ∈M existiert ein σ ∈ Sk, eine offene Teilmenge V von Rn, eine offene TeilmengeW von Rk−n und eine C`-Funktion f : V →W , so dass
(V ×W ) ∩ Lσ(M) = Graph(f).
Beispiele 6.8.
6. UNTERMANNIGFALTIGKEITEN 241
(1) Sn ist eine Untermannigfaltigkeit von Rn+1 mit Regularitat C∞, da 1 ein regularer Wert derFunktion F aus dem letzten Beispiel ist.
(2) Sei wieder W offen in Rn, f ∈ C`(W,Rm), Graphf := {(x, f(x)) | x ∈W}. Dann ist
F : W × Rm︸ ︷︷ ︸U :=
→ Rm, (x, y) 7→ y − f(x)
ist eine `-mal stetig differenzierbare Abbildung. Wir rechnen
F ′(x, y) = (−f ′(x) 11m)
und deswegen ist jedes z ∈ Rm ein regularer Wert von F , insbesondere ist 0 regularer Wert.Dies liefert einen neuen Beweis, dass Graphf eine C`-Untermannigfaltigkeit von Rn+m ist.
Bemerkung 6.9. In den obigen Beispielen ist die Untermannigfaltigkeit eine Teilmenge von U .Es gibt aber auch n-dimensionale C∞-Untermannigfaltigkeiten M ⊂ Rk, fur die es kein F ∈C1(U,Rk−n) wie oben mit M ⊂ U gibt. Ein Beispiel hierfur ist das Mobius-Band , das wir spaternaher betrachten wollen. Um solche Untermannigfaltigkeiten als Nullstellen regularer Werte dar-zustellen, benotigt man mehrere offene Mengen U ⊂ Rk und Abbildungen F : U → Rk−n wieoben.
Bemerkung 6.10. (Wiederholung aus der Linearen Algebra) Sei A ∈ Rm×k und m ≤ k, z.B.obiges F ′(x). Dann gilt
A hat Rang m
⇐⇒ A hat maximalen Rang
⇐⇒ Die Abbildung Rk → Rm, x 7→ Ax ist surjektiv
⇐⇒ Die Abbildung Rm → Rk, x 7→ ATx ist injektiv
⇐⇒ Nach Umordnen der Spalten von A, bilden die letzten m Spalten eine invertierbare Matrix
Beispiel 6.11.
A :=
(1 2 43 1 2
)Die letzten beiden Spalten sind linear abhangig. Nach Vertauschen der ersten und dritten Spaltehaben wir (
4 2 12 1 3
).
Wegen
det
(2 11 3
)= 5 6= 0
sehen wir, dass A Rang 2 besitzt.
Beweis von Satz 6.7.
”(1) =⇒ (2)“: Zu p ∈ M sei eine Untermannigfaltigkeitskarte ϕ gegeben. Sei π : Rk → Rk−n die
Projektion auf die letzten k−n Komponenten. Dann ist F := π◦ϕ : U → Rk−n eine C`-Abbildung.Weiter ist 0 ist ein regularer Wert, denn F ′(p) = π′(ϕ(p))ϕ′(p), der Rang von π′(ϕ(p)) ist k − n,
242 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
und da ϕ′(p) invertierbar ist, bleibt der Rang einer (k − n)× k-Matrix unverandert, wenn wir sievon rechts mit ϕ′(p) multiplizieren. Außerdem gilt F−1({0}) = ϕ−1(V ∩ (Rn × {0})) = U ∩M .
”(2) =⇒ (3)“: Offensichtlich.
”(3) =⇒ (4)“: Zu p ∈ M sei eine offene Umgebung U in Rk gegeben, eine Abbildung F ∈C`(U,Rk−n) und ein z ∈ Rk−n, so dass z regularer Wert ist und F−1({z}) = U ∩ M . Insbe-sondere F (p) = z, also hat F ′(p) Rang m := k − n. Nach Umordnen der Komponenten von Rk,konnen wir annehmen, dass die hintersten m Spaltenvektoren in F ′(p) ∈ Rm×k eine invertierbareMatrix bilden. Somit sind die Voraussetzung erfullt, um den Satz 5.2 uber implizite Funktionenim Punkt (x, y) := p und mit F (x, y) := F (x, y)− z statt F anzuwenden. Die damit erhaltenen V ,W und f erfullen (4).
”(4) =⇒ (1)“: Folgt direkt aus Beispiele 6.2 (2)
”Graphen sind Untermannigfaltigkeiten“ und (7)
”Die Untermannigfaltigkeits-Eigenschaft ist lokal“.
Beispiel 6.12 (Torus). Fur ein R ∈ (0, 1) betrachten wir
TR :=
{(x, y, z) ∈ R3 |
(√x2 + y2 − 1
)2
+ z2 = R2
}⊂ R3.
Abbildung 9: Eine Zentralprojektion von TR fur R ≈ 0, 2.Quelle: Wikipedia https: // commons. wikimedia. org/ wiki/ File: Torus. svg
GNU Free Documentation License, Version 1.2
UBUNG 6.13. Zeigen Sie, dass TR eine zwei-dimensionale Untermannigfaltigkeit von R3 ist.
Losung (von Nicolas Ginoux): Die Teilmenge TR ist ein sogenannter Drehtorus im R3: er entstehtdurch Drehung eines Kreises in der x-z-Ebene mit Mittelpunkt (x, z) = (1, 0) und mit Radius Rum die z-Achse.Sei
U :={
(x, y, z) ∈ R3 | (x, y) 6= (0, 0) und (‖(x, y)‖2 = 1 =⇒ z 6= 0)}
= R3 r{R · e3 ∪ (S1×{0})
}⊂ R3
6. UNTERMANNIGFALTIGKEITEN 243
und F : U → R, (x, y, z) 7→(√
x2 + y2 − 1)2
+ z2 − R2. Die Teilmenge U ist offen im R3 mit
TR ⊂ U : wegen 0 < R < 1 hat die Gleichung 1 + z2 = R2 keine (reelle) Losung und damit gilt(x, y) 6= (0, 0) fur alle (x, y) ∈ TR; außerdem gilt, im Fall (x, y, z) ∈ TR mit ‖(x, y)‖2 = 1, dieGleichung z2 = R2, insbesondere z 6= 0.Nun ist TR = F−1({0}). Um zu beweisen, dass TR eine zwei-dimensionale Untermannigfaltigkeitvon R3 ist, reicht es daher, zu beweisen, dass 0 ein regularer Wert der Funktion F ist.
Da (x, y) 7→√x2 + y2 auf R2r{(0, 0)} unendlich oft differenzierbar ist, ist die Funktion F : U → R
als Verknupfung unendlich oft differenzierbarer Abbildungen unendlich oft differenzierbar. Fur alle(x, y, z) ∈ U ist die Matrix von F ′(x, y, z) in den kanonischen Basen gegeben durch
2
(x(√x2+y2−1)√x2+y2
y(√x2+y2−1)√x2+y2
z
).
Gilt√x2 + y2 = 1, so verschwinden die beiden ersten Komponenten von F ′(x, y, z); ist nun
(x, y, z) ∈ U , so gilt dann z 6= 0 und damit ist F ′(x, y, z) 6= 0. Gilt√x2 + y2 6= 1, so konnen
wegen (x, y) 6= (0, 0) nicht beide erste und zweite Komponenten von F ′(x, y, z) verschwinden,d.h., es gilt auch in diesem Fall F ′(x, y, z) 6= 0. Insgesamt haben wir bewiesen, dass fur jedes(x, y, z) ∈ U die Abbildung F ′(x, y, z) nicht verschwindet und ist damit – weil F ′(x, y, z) seineWerte im 1-dimensionalen Vektorraum R hat – surjektiv. Daraus folgt, dass 0 ein regularer Wertder Funktion F ist. Dies liefert das Ergebnis.
Bemerkung 6.14. Man zeigt leicht, dass
TR := {TR(α, β) | α, β ∈ R} ,wobei TR : R× R→ R3,
TR(α, β) :=
(1 +R cosα) cosβ(1 +R cosα) sinβ
R sinα
.
Mi 26.6.
6.3. Der Immersionssatz.
Definition 6.15. Sei W eine offene Teilmenge von Rn und Ψ : W → Rk. Man nennt Ψ eineImmersion , wenn Ψ stetig differenzierbar ist und wenn fur alle p ∈ W die Matrix f ′(p) Rang nhat (d.h. die zu f ′(p) gehorende lineare Abbildung Rn → Rk, x 7→ f ′(p) ·x ist injektiv). Man nenntΨ eine C`-Immersion37, wenn zusatzlich f ∈ C`, ` ≥ 1.
Insbesondere ist dann k ≥ n, falls W 6= ∅. Die Eigenschaften”Ψ ist injektiv“ und
”Ψ ist eine
Immersion“ sind unabhangig voneinander.
Beispiele 6.16.
(1) Die Abbildung Ψ : R→ R2, Ψ(t) := (cos t, sin t)T erfullt Ψ′(t) := (− sin t, cos t)T 6= 0. Also istΨ eine Immersion, aber nicht injektiv.
37Also: C1-Immersion=Immersion
244 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
(2) Ψ : R → R, Ψ(t) := t3 ist ein Homoomorphismus, also insbesondere injektiv, aber keineImmersion, denn Ψ′(0) = 0.
(3) Die in Beispiel 6.14 definierte Funktion TR : R2 → R3 ist fur R ∈ (0, 1) eine C∞-Immersion(Beweis: kleinere Rechnung!).
SATZ 6.17 (Immersionssatz). Sei W eine offene Teilmenge von Rn und Ψ : W → Rk eineC`-Immersion, ` ≥ 1. Dann gibt es zu jedem p ∈ W eine offene Umgebung U ⊂ W , so dassΨ(U) eine n-dimensionale C`-Untermannigfaltigkeit von Rk ist und so dass Ψ|U : U → Ψ(U) einHomoomorphismus ist.
Beweis des Immersionssatzes. Sei Ψ: W −→ Rk eine Immersion und p ∈ W . Da Ψ′(x0) Rangn hat, sind die Vektoren ∂Ψ
∂x1(p), . . . , ∂Ψ
∂xn(p) linear unabhangig in Rk. Deswegen existieren k − n
Vektoren vn+1, . . . , vk in Rk so, dass(∂Ψ∂x1
(p), . . . , ∂Ψ∂xn
(p), vn+1, . . . , vk
)eine Basis von Rk ist.
Betrachte nun die Abbildung
Φ : W × Rk−n −→ Rk, (x, α) 7−→ Ψ(x) +
k∑j=n+1
αjvj ,
wobei x ∈W und α = (αn+1, . . . , αk) ∈ Rk−n. Offensichtlich ist Φ ∈ C`. Wir rechnen:
Φ′(p, 0) =
(∂Ψ
∂x1(p)
∂Ψ
∂x2(p) · · · ∂Ψ
∂xn(p) vn+1 · · · vk
).
Die Spalten bilden – wie oben konstruiert – eine Basis, d.h. Φ′(p, 0) ist eine invertierbare Matrix.
Nach dem lokalen Umkehrsatz existieren eine offene Umgebung V1 von (p, 0) in W ×Rk−n und eineoffene Umgebung V2 von Φ(p, 0) = Ψ(p) in Rk, so dass ΦV1 : V1 −→ V2 ein C`-Diffeomorphismusist.
Durch Verkleinern von V1 und V2 konnen wir erreichen, dass V1 von der Form V1 = U ×U ′ ist (mitp ∈ U ⊂W , 0 ∈ U ′).
Dann ist ϕ := (Φ|U×U ′)−1: V2 → U×U ′ eine Untermannigfaltigkeitskarte von Ψ(U) = Φ(U×{0}).
Da Φ|U×U ′ : U × U ′ → V2 ein Homoomorphismus ist, ist auch Ψ|U = (Φ|U×U ′)∣∣U×{0} : U × {0} ∼=
U → Ψ(U) ein Homoomorphismus.
Zeichnung von Ψ(W ) als Kurve in R2 und von Φ(U ×U ′) = V2 mit ϕ Abbildungspfeil auf U ×U ′.
ZUSATZ 6.18. Die Voraussetzungen seien wie im vorangehenden Satz. Außerdem nehmen wir an,Ψ : W → Ψ(W ) sei ein Homoomorphismus. Sei V ⊂ Rr eine offene Teilmenge und h : V → Rkeine C`-Abbildung mit h(V ) ⊂ Ψ(W ). Dann ist Ψ−1 ◦ h : V →W ebenfalls in C`.
Zeichnung zur Veranschaulichung des Zusatzes
6. UNTERMANNIGFALTIGKEITEN 245
Beweis. Wir zeigen die stetige Differenzierbarkeit auf einer Umgebung eines beliebigen Punktsx ∈ V . Wir definieren ϕ wieder wie im Beweis des Satzes auf einer kleinen offenen Umgebung V2
von h(x) = Ψ(p), U eine offene Umgebung von p wie oben. Wir setzen V0 := h−1(V2), dies ist eineoffene Umgebung von x. Es gilt fur y ∈ V0:
ϕ ◦ h(y) = Ψ−1 ◦ h .Die linke Seite ist `-mal stetig differenzierbar als Funktion in y also auch die rechte, was zu zeigenwar.
Beispiele 6.19. Es gibt injektive Immersionen Ψ : W → Rk, so dass Ψ : W → Ψ(W ) eine unstetigeUmkehrabbildung besitzt:
(1) Die Abbildung Ψ : (0, 2π)→ R2, Ψ(t) := (sin t, sin(2t))T erfullt Ψ′(t) := (cos t, 2 cos(2t))T .Aus cos t = 0 folgt t = π(k+ 1
2 ) fur k ∈ Z, also t ∈ {π/2, 3π/2}. Dann aber gilt cos(2t) 6= 0.Es folgt Ψ′(t) 6= 0 fur alle t ∈ (0, 2π), das heißt Ψ ist eine Immersion. Man sieht auch leicht,dass Ψ injektiv ist. Allerdings ist Ψ kein Homoomorphismus von (0, 2π) auf Ψ((0, 2π)).Denn fur eine Folge von ti ∈ (0, 2π) mit limi→∞ ti = 0 gilt pi := Ψ(ti) → 0 = (0, 0) =Ψ(π) ∈ R2. Somit gilt pi → 0 ∈ R2, aber Ψ−1(pi) = ti 6→ π = Ψ−1(0). Somit ist Ψ−1
nicht (folgen-)stetig.
Bild von Ψ((0, 2π))
(2) Sei wieder TR wie in Beispiel 6.14 definiert. Zu einer Zahl ρ ∈ R definieren wir
Ψρ : R→ R3, Ψρ(t) := TR(2πρt, 2πt).
Fall 1: ρ = p/q ∈ Q, seien p,q ∈ Z teilerfremd. Dann ist Ψρ periodisch: Ψρ(t+q) = Ψρ(t).Ψ(R) ist eine geschlossene Kurve38, die sich in einem Durchlauf p-mal um die
”Seele“ S1 × {0} ⊂ R3 des Torus windet und q-mal um die z-Achse. Man nennt
Ψ(R) einen (p, q)-Torus-Knoten. 39
Fall 2: ρ ∈ R r Q. Dann ist Ψρ eine injektive Immersion. Ihr Bild Ψρ(R) liegt dicht inTR, aber Ψρ ist kein Hooomorphismus auf sein Bild. Denn sind 1, ρ in τ rationallinear unabhangige reelle Zahlen, dann ist jedes x ∈ TR Haufungspunkt der Folgeak := ψ(kτ). Eine Teilfolge konvergiert dann gegen ein x ∈ Ψ(R). Deswegen istΨ−1 nicht folgenstetig.
6.4. Einbettungen von Untermannigfaltigkeiten. In diesem Abschnitt sei πx : Rk → Rndie Projektion auf die ersten n Komponenten und πy : Rk → Rk−n die Projektion auf die letztenk − n Komponenten.
LEMMA 6.20. Sei M eine n-dimensionale40 Untermannigfaltigkeit von Rk mit einer Unterman-nigfaltigkeitskarte ϕ : U → V , p ∈ U ∩M , und sei Ψ : W → Rk eine injektive Immersion mitΨ(W ) ⊂M und p ∈ Ψ(W ). Sei Tp ⊂ Rk das Bild von Ψ′(Ψ−1(p)). Dann gilt ϕ′(p) ·Tp = Rn×{0}.
38genauer: es ist eine zusammenhangende kompakte 1-dimensionale Untermannigfaltigkeit von R3
39Torusknoten sind derzeit ein beliebtes Kinderspielzeug und sind unter dem Namen”Flow ring“ im Handel
erhaltlich und auch auf Video-Plattformen findet man alles mogliche.40Das Wort
”n-dimensional“ habe ich wahrscheinlch in der Vorlesung leider vergessen, ist aber sehr wichtig.
246 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Das Lemma gilt in leicht veranderter Form, wenn Ψ nicht mehr injektiv ist, sondern nur nocheine Immersion. Wir wollen dies aber nicht naher betrachten, da man jede Immersion durch Ein-schrankung auf eine genugend kleine Umgebung eines gegebenen Punktes injektiv machen kann(Immersionsatz).
Zeichnung zu obigem Satz
Beweis. Setze W0 := Ψ−1(U) ⊂W und x0 := Ψ−1(p). Man pruft leicht, dass πy ◦ϕ◦Ψ|W0: W0 →
Rk−n alles auf 0 abbildet. Nach Kettenregel ist dann
0 = π′y(ϕ(p))︸ ︷︷ ︸= (0 11k−n)
· ϕ′(p) ·Ψ′(x0) ,
das heißt, das Bild der Matrix A := ϕ′(p) ·Ψ′(x0) liegt in Rn ×{0}, und da Ψ′(x0) Rang n besitztund ϕ′(p) invertierbar ist, wissen wir, dass das Bild von A gleich Rn × {0} ist. Da das Bild von Agleich ϕ′(p) · Tp ist, folgt die Behauptung.Fr 28.6.
SATZ 6.21. Sei Ψ : W → Rk eine injektive C`-Immersion, ` ≥ 1. Dann ist Ψ(W ) eine C`-Untermannigfaltigkeit von Rk genau dann, wenn Ψ : W → Ψ(W ) ein Homoomorphismus ist.
Zeichnung zu diesem Satz
Beweis. Setze M := Ψ(W ).
”⇐= “: Wir wollen zeigen, dass M eine C`-Untermannigfaltigkeit von Rk ist. Sei dazu p ∈ M
und p = Ψ(x0), x0 ∈ W . Nach dem Immersionssatz 6.17 gibt es eine offene Umgebung W ′ vonx0 in W , so dass M ′ := Ψ(W ′) eine C`-Untermannigfaltigkeit von Rk ist. Da Ψ : W → Ψ(W )ein Homoomorphismus ist und da W ′ offen in W ist, ist M ′ = Ψ(W ′) eine offene Teilmenge vonM = Ψ(W ), d.h. es existiert eine in Rn offene Menge U1 mit M ′ = U1 ∩M .
Sei ϕ2 : U2 → V2 eine Untermannigfaltigkeitskarte von M ′ mit p ∈ U2. Setze U := U1 ∩ U2 3 p,V := ϕ2(U) und ϕ := ϕ2
∣∣U
. Dann sind U und V offen in Rk, und ϕ : U → V ist ein C`-Diffeomorphismus, fur den gilt:
ϕ(U ∩M) = ϕ2(U ∩M ′) = V ∩ ϕ2(M ′) = V ∩ V2︸ ︷︷ ︸=V
∩(Rn × {0}).
Also ist ϕ : U → V eine Untermannigfaltigkeitskarte von M mit p ∈ U .
”=⇒ “: Wir zeigen, dass Ψ−1 : M →W folgenstetig ist. Sei hierzu eine Folge (pi)i∈N in M gegeben
mit limi→∞ pi = p ∈M . Da nach Voraussetzung M eine C`-Untermannigfaltigkeit ist, konnen wireine Untermannigfaltigkeitskarte ϕ : U → V mit p ∈ U wahlen. Es liegen fast alle pi in U ∩Mund deswegen sind fast alle qi := πx ◦ ϕ(pi) ∈ π(V ) ⊂ Rn wohldefiniert und konvergieren gegenq := πx ◦ ϕ(p) ∈ Rn. Insbesondere ϕ(pi) = (qi, 0).
Setze wieder W0 := Ψ−1(U) ⊂ W und x0 := Ψ−1(p). Wie im vorangehenden Lemma gezeigt, istdas Bild von ϕ′(p)Ψ′(x0) gleich Rn × {0}.
6. UNTERMANNIGFALTIGKEITEN 247
Somit ist
(πx ◦ ϕ ◦Ψ|W0)′(x0) = π′y(ϕ(p))︸ ︷︷ ︸
= (11n 0)
· ϕ′(p) ·Ψ′(x0)
eine invertierbare Matrix in Rn×n. Also ist nach dem lokalen Umkehrsatz ρ := πx◦ϕ◦Ψ|W0 lokal umx0 umkehrbar und xi := ρ−1(qi)→ x0 := ρ−1(q). Wegen Ψ(xi) ∈M haben wir ϕ ◦Ψ(xi) = (qi, 0)und aus der Injektivitat von ϕ folgt Ψ(xi) = pi, also Ψ−1(pi) = xi → x0 = Ψ−1(p). Wir habenalso die Folgenstetigkeit und somit die Stetigkeit von Ψ−1 : M →W gezeigt.
Beispiel 6.22 (Fortsetzung von Beispiel 6.19 (1)). Sei wieder Ψ : (0, 2π)→ R2, Ψ(t) := (sin t, sin(2t))T .Diese Abbildung ist eine injektive C∞-Immersion, aber kein Homoomorphismus von (0, 2π) aufΨ((0, 2π)
): das haben wir oben bereits alles gezeigt. Das Bild M := Ψ
((0, 2π)
)ist keine Unter-
mannigfaltigkeit, da es keine Untermannigfaltigkeitskarte von M gibt, die 0 = Ψ(π) ∈ R2 enthalt.Die Nicht-Existenz einer Untermannigfaltigkeitskarte kann man auch elementar beweisen, beque-mer geht es aber mit dem obigen Satz.
Nochmals dieselbe Zeichnung vom Bild von Ψ.
Definition 6.23. Eine injektive Immersion, die ein Homoomorxphismus auf ihr Bild ist, nenntman eine Einbettung einer Untermannigfaltigkeit.
6.5. Lokale Parametrisierungen von Untermannigfaltigkeiten.
Definition 6.24. Sei M ⊂ Rk eine Teilmenge. Eine n-dimensionale lokale C`-Parametrisierungvon M ist eine C`-Immersion Ψ : W → Rk mit den folgenden Eigenschaften:
(a) W ⊂ Rn ist offen,
(b) Ψ(W ) ist offen in M , das heißt Ψ(W ) = U ∩M fur eine offene Teilmenge U von Rk,
(c) Ψ : W → Ψ(W ) ist ein Homoomorphismus.
LEMMA 6.25. Ist Ψ : W → Rk eine lokale C`-Parametrisierung von M ⊂ Rk wie in obigerDefinition und W0 eine offene Teilmenge von W . Dann ist auch Ψ|W0
: W0 → Rk ebenfalls einelokale C`-Parametrisierung von M .
Beweis. Wahle zu Ψ ein U wie in (b).
Offensichtlich ist Ψ := Ψ|W0eine C`-Immersion, die (a) und (c) mit Ψ statt Ψ erfullt.
248 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Zu (b) fur Ψ: Da Ψ : W → Ψ(W ) ein Homoomorphismus ist, ist Ψ(W0) offen in Ψ(W ).41 Es gibt
also eine offene Teilmenge U von Rk mit Ψ(W0) = Ψ(W )∩ U . Es folgt Ψ(W0) = (U ∩ U)︸ ︷︷ ︸offen in Rk
∩M .
PROPOSITION 6.26. Sei M ⊂ Rk eine Teilmenge. Dann sind aquivalent:(a) M ist eine n-dimensionale C`-Untermannigfaltigkeit.(b) Fur alle p ∈ M existiert eine n-dimensionale lokale C`-Parametrisierung von M der Regula-ritat C`, deren Bild p enthalt.
Beweis.
”(a) =⇒ (b)“ Sei p ∈ M beliebig. Sei ϕ : U → V eine Untermannigfaltigkeitskarte von M mitp ∈ U . Definiere W := V ∩ (Rn × {0}) und Ψ := (ϕ−1)|W : W → Rk. Dann ist W offen in Rn,Ψ ist C` (da ϕ−1 ∈ C`) mit Ψ′(x) = (ϕ−1)′(x)|Rn×{0} injektiv ∀x ∈W , es gilt Ψ(W ) = ϕ−1(W ) =U ∩M und Ψ : W → Ψ(W ) ist die Einschrankung eines Homoomorphismus, ist also selbst einHomoomorphismus.
”(b) =⇒ (a)“ Sei p ∈ M beliebig. Sei Ψ: W → Rk eine lokale C`-Parametrisierung von M mitp = Ψ(x0) ∈ Ψ(W ). Nach dem Immersionssatz 6.17 gibt es eine offene Umgebung W0 von x0, sodass Ψ(W0) 3 p eine Untermannigfaltigkeit ist.
Da Ψ−1 : Ψ(M)→M stetig ist, ist Ψ(W0) offen in Ψ(W ) und damit wegen (b) von Definition 6.24offen in M . Es gibt also eine in Rk offene Menge U 3 p mit Ψ(W0) = U ∩M . Wir haben also zujedem p ∈M eine in Rk offene Umgebung U gefunden, so dass U ∩M eine Untermannigfaltigkeitvon Rk ist. Da die Untermannigfaltigkeitseigenschaft eine lokale Eigenschaft ist (Beispiele 6.2 (7)),folgt daraus, dass M eine C`-Untermannigfaltigkeit ist.
Beispiele 6.27.
(1) Sei U ⊂ Rn offen und f ∈ C`(U,Rm). Betrachte
Graphf := Mf := {(x, f(x)) |x ∈ U} ⊂ Rn × Rm = Rn+m.
Dann ist die Abbildung Ψ : U −→ Rn+m, x 7−→ (x, f(x))T eine n-dimensionale globale C`-
Parametrisierung von Mf : die Abbildung Ψ ist C`, es gilt Ψ′(x) =(
11nf ′(x)
), ∀x ∈ U , wobei 11n
die n×n Einheitsmatrix bezeichnet – insbesondere gilt rg(Ψ′(x)) = n – und Ψ(U) = Mf , wobeiΨ: U −→ Mf ein Homoomorphismus ist mit Umkehrabbildung Mf −→ U , (x, f(x)) 7−→ x(Projektion auf die n ersten Koordinaten).
(2) Sei M := Sn ⊂ Rn+1. Sei U := {x ∈ Rn : ‖x‖2 < 1} ⊂ Rn. Definiere Ψ+ : U −→ Rn+1,
x 7−→ (x,√
1− ‖x‖22)T sowie Ψ− : U −→ Rn+1, Ψ−(x) := (x,−√
1− ‖x‖22)T . Dann sind Ψ+
41In der Notation fur Bilder und Urbilder, die wir in der Analysis I benutzt haben, wird dies etwas klarer: esgilt Ψ#(W0) = (Ψ−1)#(W0) und diese Menge ist als Urbild der offenen Menge W0 bezuglich der stetigen Abbildung
Ψ−1 : Ψ(W )→W wieder offen.
6. UNTERMANNIGFALTIGKEITEN 249
und Ψ− n-dimensionale lokale C∞-Parametrisierungen von Sn. Es gilt
Ψ+(U) = Sn ∩(Rn × (0,∞)
)=
x1
x2
...xn+1
∈ Sn ∣∣∣ xn+1 > 0
.
Uberdeckung von S1 ⊂ R2 durch die Bilder von 4 Parametrisierungen
Wir vertauschen nun die Komponenten von Rn+1 so, dass die `-te Komponente zur letztenKomponente wird. Wir erhalten dann zu jedem ` = 1, . . . , n, zwei weitere lokale Parametrisie-rungen Ψ`
±, setze Ψn+1± := Ψ±. Es gilt
Ψ`±(U) =
x1
x2
...xn+1
∈ Sn ∣∣∣ ± x` > 0
,
und somit
Sn = Ψ1+(U) ∪Ψ2
+(U) ∪ · · · ∪Ψn+1+ (U) ∪Ψ1
−(U) ∪Ψ2−(U) ∪ · · · ∪Ψn+1
− (U).
Die Sphare wird also von den Bildern von 2(n+ 1) lokalen Parametrisierungen uberdeckt.(3) Seien a, b ∈ R und R ∈ (0, 1). Sei TR der Torus und TR definiert wie in Beispiel 6.14. Dann ist
die Abbildung(a, a+ 2π)× (b, b+ 2π)→ R3, (α, β) 7→ TR(α, β)
eine lokale C∞-Parametrisierung von TR.
Bemerkung 6.28. Sei i : Rn → Rk die Abbildung x 7→ (x, 0). Ist ϕ : U → V eine C`-Unterman-nigfaltigkeitskarte von M , so ist Ψ := ϕ−1 ◦ i : W → Rk, W := i−1(V ) ∼= V ∩ (Rn×{0}) eine lokaleC`-Parametrisierung: Die C`-Eigenschaft und die Offenheit von W ist klar, ebenso Ψ(W ) = V ∩Mund somit die Offenheit von Ψ(W ) in M . Da i eine Immersion ist und ϕ ein Diffeomorphismus ist,ist auch Ψ eine Immersion. Die Umkehrabbildung von Ψ : W → Ψ(W ) ist πx ◦ ϕ|V ∩M und dieseAbbildung ist offensichtlich stetig.
Umgekehrt kann man zu jeder lokalen Parametrisierung Ψ eine Untermannigfaltigkeitskarte ϕfinden, so dass man Ψ wie oben aus ϕ erhalt (ohne Beweis). Die lokale Existenz von solch einemϕ haben wir im Beweis des Immersionssatzes 6.17 gezeigt, dort haben wir Ψ zu einer Funktion Φfortgesetzt, die eine lokale Umkehrfunktion ϕ besitzt. Man kann mit großerem Aufwand solch einϕ : U → V konstruieren, so dass Ψ(M) ⊂ U .
Bild zu dieser Bemerkung
Bemerkung 6.29. Man kann sich nun naturlich fragen: sind die Eigenschaften (b) und (c) inDefinition 6.24 wirklich notwendig? Wir haben im letzten Abschnitt gesehen, dass wir (c) benotigen,damit das Bild eine Untermannigfaltigkeit ist. Wenn (c) nicht erfullt ist, haben wir Gegenbeispiele.Bedingung (b) ist ebenfalls notwendig. Die Menge M := [0, 1]×Rn ist keine Untermannigfaltigkeit
250 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
von Rn+1.42 Wir definieren nun zu jedem (x, y) ∈ [0, 1] × Rn ist Ψx : Rn → Rn+1, Ψx(t) = (x, t)eine injektive Immersion, die (a) und (c), aber nicht (b) erfullt. Offensichtlich ist (x, y) im Bildvon Ψx.
6.6. Der Tangentialraum.
Definition 6.30. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit und p ∈ M ein Punkt.Der Tangentialraum an M im Punkt p ist
TpM := {v ∈ Rk | ∃ ε > 0 und c : (−ε, ε) −→ Rk ist C1-Kurve mit c((−ε, ε)) ⊂M,c(0) = p und c′(0) = v} ⊂ Rk.
PROPOSITION 6.31. Sei M ⊂ Rk eine Untermannigfaltigkeit und p ∈M ein Punkt.
(a) Sei Ψ: W −→ Rk eine n-dimensionale lokale C1-Parametrisierung von M um p. Sei x0 :=Ψ−1(p) ∈W . Dann gilt
TpM = Bild(Ψ′(x0)
).
(b) Sei ϕ : U −→ V eine Untermannigfaltigkeitskarte von M um p. Dann gilt
TpM = ϕ′(p)−1 · (Rn × {0}) .
(c) Sei U ⊂ Rk offene Umgebung von p und F : U −→ Rk−n C` mit 0 als regularem Wert undF−1({0}) = U ∩M . Dann gilt
TpM = ker(F ′(p)).
Insbesondere ist TpM ein n-dimensionaler Untervektorraum von Rk.
Beweis. Zu (a): Sei v ∈ TpM . Dann existiert c : (−ε, ε) −→ Rk C1 (fur ein ε > 0) mitc((−ε, ε)) ⊂ M , c(0) = p und c′(0) = v. Nach moglicher Verkleinerung von ε konnen wir an-nehmen, dass c((−ε, ε)) ⊂ Ψ(W ) gilt. Dann ist c := Ψ−1 ◦ c : (−ε, ε) −→ Rn stetig differenzierbarwegen Zusatz 6.18.
v = c′(0) = (Ψ ◦ c)′(0) = Ψ′(c(0)︸︷︷︸x0
) · c′(0) ,
also v ∈ Bild(Ψ′(x0)
)und damit TpM ⊂ Bild
(Ψ′(x0)
).
Umgekehrt sei v ∈ Bild(Ψ′(x0)), sagen wir v = Ψ′(x0) ·w mit w ∈ Rn. Wir definieren dann c(t) :=x0 + tw. Fur ein kleines ε > 0 gilt c
((−ε, ε)
)⊂ W . Fur |t| < ε gilt c(t) := Ψ
(c(t))∈ Ψ(W ) ⊂ M .
42Begrundung: Es ist keine (n + 1)-dimensionale Untermannigfaltigkeit, da es nicht offen in Rn+1 ist. Es ist
keine 0-dimensionale Untermannigfaltigkeit, da es keine diskrete Teilmenge ist. Somit ist die Aussage im Fall n = 0gezeigt. Fur n > 0 kann man auch alle anderen Dimensionen ausschließen (etwas Arbeit!). Fur unser Beispiel reicht
es aber, den Fall n = 0 zu betrachten.
7. EXTREMA MIT NEBENBEDINGUNGEN 251
Die Kurve c ist in C1 und c(0) = p, c′(0) = Ψ′(x0
)· w = v. Somit ist v ∈ TpM . Insgesamt also
Bild(Ψ′(x0)
)⊂ TpM .
Zu (b): Sei wieder i : Rn → Rk die Inklusions-Abbildung x 7→ (x, 0). Nach Bemerkung 6.28 istΨ := ϕ−1 ◦ i eine lokale Parametrisierung. Sei ϕ(p) = (x0, 0), x0 ∈ Rn. Also haben wir
TpM(a)= Ψ′(x0) · Rn = (ϕ−1)′(i(x0)︸ ︷︷ ︸
=ϕ(p)
) · i′(x0) · Rn︸ ︷︷ ︸=Rn×{0}
=(ϕ′(p)
)−1
·(Rn × {0}
).
Ein alternativer Beweis von (b) wird durch Lemma 6.20 geliefert.
Zu (c): Sei Ψ : W → Rk eine lokale Parametrisierung mit p ∈ Ψ(W ), W0 := Ψ−1(U), p = Ψ(x0).Also ist F ◦ Ψ|W0
konstant 0, also 0 = F ′(p) · Ψ(x0). Somit haben wir TpM = Bild(Ψ′(x0)
)⊂
ker(F ′(p)). Da F ′(p) Rang k−n hat, besagt der Rangsatz, dass n = dim ker(F ′(p)) = dim Bild(Ψ′(x0)
).
Es folgt TpM = ker(F ′(p)).
Beispiele 6.32.
(1) Sei M eine nichtleere offene Teilmenge von Rk. Dann ist M eine k-dimensionale C∞-Untermannigfaltigkeit von Rk: wahle U = V = M und ϕ := IdM als Untermannigfaltig-keitskarte. Aus Proposition 6.31 folgt, ∀p ∈M :
TpM = Rk.
(2) Sei M := Mf wie in den Beispielen 6.5. Dann ist Ψ: U −→ Rk, x 7−→ (x, f(x))T eineglobale C1-Parametrisierung von Mf nach den Beispielen 6.27. Nach Proposition 6.31 giltdann, fur p = (p, f(p))T ∈Mf :
TpM = Ψ′(p)(Rn) = {(v, f ′(p) · v)T | v ∈ Rn}= Graph(f ′(p))(= Mf ′(p)).
(3) Sei M := Sn ⊂ Rn+1. Sei F : Rn+1 −→ R, x 7−→ ‖x‖22 − 1. Dann ist 0 ∈ R regularerWert von F mit F−1({0}) = Sn. Aus Proposition 6.31 folgt, fur jedes p ∈ Sn: TpM =ker(F ′(p)), mit F ′(p) = 2pT , d.h.,
TpM = {v ∈ Rn+1 | pT v = 0}= {v ∈ Rn+1 | 〈p, v〉 = 0}= p⊥ (= Orthogonales Komplement von p).
Mi 3.7.
7. Extrema mit Nebenbedingungen
Definition 7.1. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit von Rk und U ⊂ Rk eineoffene Teilmenge von Rk mit M ⊂ U . Sei f : U −→ R eine Funktion.
252 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
(a) Ist f differenzierbar in p ∈ M ⊂ U , so heißt p stationarer (oder kritischer) Punkt vonf|M : M −→ R, wenn f ′(p)|TpM = 0 gilt.43
(b) Ein Punkt p ∈ M heißt lokales Maximum (bzw. Minimum) von f |M : M −→ R, wenneine offene Umgebung V von p in M so existiert, dass f(p) ≥ f(q) (bzw. f(p) ≤ f(q)) furalle q ∈ V gilt.
(c) Ein Punkt p ∈M heißt lokales Extremum von f|M : M −→ R, wenn p ein lokales Minimumoder ein lokales Maximum von f |M ist.
Wie findet man lokale Extrema? Wir fuhren zwei Moglichkeiten auf:
• Wahle eine Parametrisierung Ψ : W → Rk der Untermannigfaltigkeit. Wir wissen bereits,wie man lokale Extrema von f ◦Ψ : W → R findet. Und x ist lokales Extremum von f ◦Ψgenau dann, wenn Ψ(x) lokales Extremum von f |M ist. Insbesondere folgt fur p = Ψ(x)aus der Kettenregel
x ist station. Punkt von f ◦Ψ ⇐⇒ f ′(p) ·Ψ′(x) = 0 ⇐⇒ f ′(p)|TpM = 0.
Diese Methode sollten Sie nun also durch Kombination bereits behandelter Technikenbeherrschen.
• Durch Lagrange-Multiplikatoren: siehe unten.
PROPOSITION 7.2. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit, U ⊂ Rk eine offeneUmgebung von M und f : U −→ R differenzierbar. Ist p ∈ M lokales Extremum von f|M , so ist pein stationarer Punkt von f|M .
Beweis. Sei v ∈ TpM . Dann existieren ε > 0 und eine C1-Abbildung c : (−ε, ε) −→ Rk mitc((−ε, ε)) ⊂ M , c(0) = p und c′(0) = v. Die Abbildung f ◦ c : (−ε, ε) −→ R ist dann C1 mitf ◦ c(0) = f(p). Da p ein lokales Extremum von f|M ist, ist 0 ∈ (−ε, ε) ebenfalls ein lokalesExtremum von f ◦ c. Daraus folgt (f ◦ c)′(0) = 0, d.h., mit der Kettenregel, f ′(p) · v = 0. Damitbekommen wir f ′(p)|TpM = 0, was zu beweisen war.
SATZ 7.3 (Satz uber Lagrange-Multiplikatoren). Sei M ⊂ Rk eine n-dimensionale Unterman-nigfaltigkeit, U ⊂ Rk eine offene Umgebung von M und f : U −→ R differenzierbar. Sei p ∈ Mein stationarer Punkt (z.B. ein lokales Extremum) von f|M und F : V −→ Rk−n eine in einer
offenen Umgebung V von p in Rk definierte C1-Abbildung mit 0 ∈ Rk−n als regularem Wert undF−1({0}) = V ∩M . Schreibe F (x) = (F1(x), . . . , Fk−n(x)) ∀x ∈ V . Dann gibt es eindeutige reelleZahlen λ1, . . . , λk−n mit
f ′(p) =
k−n∑j=1
λjF′j(p).
Diese Zahlen λ1, . . . , λk−n heißen Lagrange-Multiplikatoren von f unter den NebenbedingungenF1, . . . , Fk−n an der Stelle p.
43Mit f ′(p)|TpM ist hier die lineare Abildung Rk ⊂ TpM 3 x 7→ f ′(p) · x ∈ R gemeint.
7. EXTREMA MIT NEBENBEDINGUNGEN 253
ZUSATZ 7.4. Umgekehrt gilt: existieren solche Lagrange-Multiplikatoren, dann ist p ein stati-onarer Punkt von f |M .
Die Lagrange-Multiplikatoren sind nach dem Mathematiker und Physiker Joseph-Luis Lagrangebenannt, der insbesondere die Lagrangesche Formulierung der klassischen Mechanik in der Physkvorangetrieben hat. Es ist aber auch ein wichtiges Hifsmittel zum Beispiel in den Wirtschafts-wissenschaften, wenn man eine Optimierung unter gegebenen nicht-linearen Zwangsbedingungendurchfuhren will.
Beweis des Korollars. Nach Voraussetzung gilt f ′(p)|TpM = 0 (im Fall, wo p ∈ M ein lokales
Extremum von f|M ist, folgt dies aus Proposition 7.2). Nach Proposition 6.31 gilt aber
TpM = ker(F ′(p)) mitF ′(p) =
F ′1(p)...
F ′k−n(p)
=
k−n⋂j=1
ker(F ′j(p)).
Mitker(F ′j(p)) = {v ∈ Rk |F ′j(p) · v = 0} = {v ∈ Rk | 〈F ′j(p)T , v〉 = 0}
= (F ′j(p)T )⊥
folgt TpM =k−n⋂j=1
(F ′j(p)T )⊥ = Span{F ′1(p)T , . . . , F ′k−n(p)T }⊥ (siehe LA II). Die Bedingung f ′(p)|TpM =
0 ist zu 〈f ′(p)T , v〉 = 0 ∀v ∈ TpM aquivalent, d.h. zu f ′(p)T ∈ (TpM)⊥ ⊂ Rk. Insgesamt folgt
(7.5) f ′(p)T ∈ (Span{F ′1(p)T , . . . , F ′k−n(p)T }⊥)⊥ = Span{F ′1(p)T , . . . , F ′k−n(p)T },
d.h., ∃λ1, . . . , λk−n ∈ R mit f ′(p)T =k−n∑j=1
λjF′j(p)
T , d.h., f ′(p) =k−n∑j=1
λjF′j(p). Da F ′j(p), . . . , F
′k−n(p)
linear unabhangig sind, sind λ1, . . . , λk−n eindeutig mit dieser Eigenschaft.
Der Zusatz folgt, indem wir die obigen Argmente umkehren: Wenn Lagrange-Multiplikatoren exis-tieren, dann gilt (7.5) und somit f ′(p)T ∈ (TpM)⊥. Dann verschwindet v 7→ f ′(p) · v auf TpM .
KAPITEL 10
Gewohnliche Differentialgleichungen
Literatur zu diesem Kapitel.
• [15], Kapitel 2 (gut zu lesen)• [7], Kapitel 14 (Rolle des Banachschen Fixpunktsatzes klarer)• [11] (umfassender, tiefer gehend)• [23]Mehr zu Stabilitat• [35]noch mehr zu Stabilitat, deutlich ausfuhrlicher und umfassender als [23], sehr gut
lesbar.• [27]• [4]
1. Motivation
Wir motivieren an Hand eines ebenen Pendels aus der Physik. Es gibt auch viele Systeme in anderenWissenschaften (Chemie, Biologie, Medizin, Wirtschaftswissenschaften,...), die durch gewohnlicheDifferentialgleichungen modelliert werden.
Bild eines Pendels mit eingezeichneten Kraften, siehe Vorlesung.
ϕ : R→ R
(1.1) ϕ′′(t) = −g`
sin(ϕ(t))
wobei g = 9, 81N/kg die Gravitationskonstante, ` die Pendellange und ϕ der Auslenkungswinkelist.
Wichtige physikalische Fragen:
• Beschreibt dieses Modell die physikalische Situation? (Problematisch: Reibung, Drehener-gie des Korpers, Masse des Stabes, Storeinflusse, ...)• Wie genau sind die Ausgangswerte ϕ(0), ϕ′(0) und die Parameter g, `,...?
255
256 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Dies ist nicht das Thema der Vorlesung!
Wichtige mathematische Fragen:
• Gibt es Funktionen ϕ : R → R, die (1.1) losen? (Wenn nicht, dann ist dies sicher keingutes Modell!) Wir werden sehen: es gibt Losungen!• Wenn ja, wieviele Losungen gibt es? Wir werden sehen: zu gegebenem ϕ(0) und ϕ′(0)
gibt es genau eine Losungsfunktion. Die Gleichung (1.1) hat also einen zwei-dimensionalenLosungsraum.1
• Gibt es Losungen ϕ : (a, b)→ R, die sich nicht zu Losungen auf ganz R fortsetzen lassen?Wir werden sehen:
”Nein“ fur diese Gleichung, aber bei vielen physikalischen Systemen
”Ja“.
• Sind alle Losungen periodisch? Man kann zeigen: viele, aber nicht alle. 2
• Kann man die Losungen explizit angeben? Antwort: Es geht noch mit großem Aufwand.Man braucht
”elliptische Integrale“, siehe http://en.wikipedia.org/wiki/Pendulum_
(mathematics). Bei komplizierteren physikalischen Systemen nahezu unmoglich.• Wie lang ist die Periodenlange von periodischen Losungen? Antwort: Als Potenzreihe
angebbar. Bei komplizierteren Gleichungen nicht explizit berechenbar.• Hangt sie von der maximalen Auslenkung ab? Antwort: Die Periodenlange wird langer,
wenn die maximale Auslenkung langer wird.• Erhaltungsgroßen? Antwort: Energieerhaltung, Drehimpulserhaltung (beim raumlichen
Pendel),. . .
Ziel: Moglichst großes systematisches Verstandnis solcher Gleichungen. Beschreibung des qualita-tiven Verhaltens, falls die Losungen nicht explizit zu finden sind.
Oft hilfreich: Linearisierte Gleichung. Ersetze nicht-lineare Terme durch das Taylorpolynom erstenGrades. Im Pendel-Beispiel: ersetze
sinϕ =
∞∑j=0
(−1)j
(2j + 1)!ϕ2j+1 = 0 + ϕ+ 0 · ϕ2 − 1
6ϕ3 + · · ·
durch ϕ. Wir erhalten
ϕ′′(t) = −g`ϕ(t)
1Den Begriff”zwei-dimensional“ haben wir hier noch gar nicht sauber definiert. Der Losungsraum ist eine
zwei-dimensionale Untermannigfaltigkeit des unendlich-dimensionalen Vektorraums C∞(R,R). Die obige Aussage
interpretieren Sie am besten so, dass der Losungsraum durch die beiden Anfangswert ϕ(0) und ϕ′(0) parametrisiertwird.
2Alle Losungen, deren Gesamtenergie unterhalb von E0 := mg` liegt, konnen keine Uberschlage (=loopings)machen, sie sind periodisch. Losungen ϕ mit Gesamt-Energie großer als E0 sind im Sinne von Funktionen ϕ :R → R nicht periodisch. Die zugehorige raumliche Bewegungskurve R → R3, t 7→ (` sinϕ(t), 0,−` cosϕ(t))T ist
aber periodisch. Ist die Gesamtenergie gleich E0, dann ist weder ϕ noch die zugehorige raumliche Bewegungskurveperiodisch. Dann gilt limt→±∞ ϕ(t) = ±π und die raumliche Bewegungskurve konvergiert in beide Richtungen gegen
(0, 0,−`)T .
2. DEFINITION UND REDUKTION AUF AUTONOME GLEICHUNGEN ERSTER ORDNUNG 257
Viel leichter zu losen:
ϕ(t) = a cos
(√g
`t
)+ b sin
(√g
`t
)Beschreiben die Losungen der vereinfachten Gleichung auch hinreichend gut die Losungen derursprunglichen Gleichung?
2. Definition und Reduktion auf autonome Gleichungen erster Ordnung
Definition 2.1. Seien m,n, k ∈ N. Gegeben sei
U ⊂ R× (Rn)k+1 = R× Rn × · · · × Rn︸ ︷︷ ︸k+1-mal
und eine Funktion F : U → Rm. Wir sagen ϕ : (a, b) → Rn, a, b ∈ R, a < b eine Losung derdurch F gegebenen gewohnlichen Differentialgleichung, falls gilt:
(1) ϕ ist k-mal differenzierbar(2) (t, ϕ(t), ϕ′(t), . . . , ϕ(k)(t)) ∈ U fur alle t ∈ (a, b)(3) Fur alle t ∈ (a, b) gilt
(2.2) F (t, ϕ(t), ϕ′(t), . . . , ϕ(k)(t)) = 0.
Man nennt (a, b) das Losungsintervall der Losung. Eine Gleichung der Form (2.2) nennt man einegewohnliche Differentialgleichung von Ordnung ≤ k.3 Wir nennen F die definierende Funktion dergewohnlichen Differentialgleichung. Wir sagen, die gewohnliche Differentialgleichung ist autonom,falls die definierende Gleichung nicht von t abhangt. Wir schreiben dann oft
F (ϕ(t), ϕ′(t), . . . , ϕ(k)(t)) = 0,
d.h. F : U → Rm, U ⊂ (Rn)k+1.
Beispiele 2.3.
(1) Pendel: m = n = 1, k = 2, U = R4,
F (t, ϕ0, ϕ1, ϕ2) = ϕ2 +g
`sinϕ0
(2) Linearisiertes Pendel: wie oben aber
F (t, ϕ0, ϕ1, ϕ2) = ϕ2 +g
`ϕ0
(3) m = n = k = 1, U = R3. Sei a ∈ RF (t, ϕ0, ϕ1) = ϕ1 − aϕ0
Wir erhalten die Differentialgleichung
ϕ′(t) = aϕ(t).
3Man sagt, die Ordnung ist gleich k, falls F tatsachlich von ϕ(k) abhangt.
258 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Dann ist ϕ(t) = eat eine Losung.(4) Sei g : (a, b)→ R. Wir definieren
F (t, ϕ0, ϕ1) = ϕ1 − g(t).
Dann ist G eine Losung von
F (t, G(t), G′(t)) = 0,
genau dann, wenn G eine Stammfunktion zu g ist.(5) Sei f : R2 → R. Fur
F (t, ϕ0, ϕ1) = ϕ1 − f(t, ϕ0).
haben wir die Differentialgleichung
(2.4) ϕ′(t) = f(t, ϕ(t)).
Die ersten drei Beispiele sind autonom, die letzten beiden nicht.
Bemerkungen 2.5. Wichtig sind auch Differentialgleichungen, in denen Funktionen in mehrerenVeranderlichen gesucht werden, so dass die definierende Funktion von partiellen Ableitungen inmehreren Veranderlichen abhangt. Solche Differentialgleichungen nennt man partielle Differenti-algleichung. Genauer gesagt: eine partielle Differentialgleichung ist eine Differentialgleichung, diekeine gewohnliche Differentialgleichung ist.
Zum Beispiel sei V offen in R` und ϕ : V → Rn. Wir definieren den Laplace-Operator ∆ :C2(V,Rn)→ C0(V,Rn)
∆ϕ :=∑i=1
∂2
∂x2`
ϕ
Dann ist ∆ϕ = 0 eine partielle Differentialgleichung, die in vielen Bereichen der Anwendungen(Physik, Chemie, Biologie, Finanzmathematik,. . . ) sehr wichtig ist.
Wir behandeln in dieser Vorlesung nur gewohnliche Differentialgleichungen. Die Losungstheoriepartieller Differentialgleichungen wird in fortgeschritteneren Vorlesungen behandelt.
Bemerkung 2.6.
(1) Man kann jede gewohnliche Differentialgleichung von k-ter Ordnung in eine Differenti-algleichung erster Ordnung uberfuhren. Hierzu definieren wir fur ϕ : (a, b) → Rn dieFunktionen ψi(t) := ϕ(i)(t) und fassen diese Funktionen zu Ψ : (a, b) → (Rn)k alsΨ(t) := (ψ0(t), ψ1(t), . . . , ψk−1(t)) zusammen. Wir haben genau dann eine Losung vonGleichung (2.2), falls wir eine Losung von
0 = F (t, ψ0(t), ψ1(t), . . . , ψk−1(t), ψ′k−1(t))
0 = ψ′0(t)− ψ1(t)
... =...
0 = ψ′k−2(t)− ψk−1(t)
2. DEFINITION UND REDUKTION AUF AUTONOME GLEICHUNGEN ERSTER ORDNUNG 259
haben. Wir konnen nun die gesamte rechte Seite in der Form F (t,Ψ(t),Ψ′(t)) schreiben,
wobei F : U → Rm × (Rn)k−1 fur eine geeignete Teilmenge U von R× (Rn)k × (Rn)k.
F (t,Ψ(t),Ψ′(t)) =
F (t, ψ0(t), ψ1(t), . . . , ψk−1(t), ψ′k−1(t))ψ′0(t)− ψ1(t)
...ψ′k−2(t)− ψk−1(t)
∈ Rm+(k−1)n.
Wir haben eine gewohnliche Differentialgleichung von k-ter Ordnung fur ϕ : (a, b) →Rn durch eine gewohnliche Differentialgleichung erster Ordnung fur Ψ : (a, b) → Rnkausgedruckt.
Im Beispiel des Pendels fuhren wir also eine Funktion ρ : (a, b) → R ein,4 die ϕ′
reprasentieren soll, und losen das System
0 = ρ′(t) +g
`sinϕ(t)
0 = ϕ′(t)− ρ(t)
Wir definieren dann
F (t,
(ϕρ
),
(ϕρ
)) =
(ρ+ g
` sinϕϕ− ρ
)∈ R2.
Die dadurch definierte gewohnliche Differentialgleichung ist
0 = F (t,
(ϕ(t)ρ(t)
),
(ϕ(t)ρ′(t)
)) =
(ρ′(t) + g
` sinϕ(t)ϕ′(t)− ρ(t)
)∈ R2.
Dies ist eine autonome gewohnliche Differentialgleichung erster Ordnung.(2) Man kann jede gewohnliche Differentialgleichung in eine autonome Differentialgleichung
uberfuhren. Hierzu fuhren wir eine neue Funktion τ(t), die τ ′(t) = 1 und τ(t0) = t0erfullt. Es gilt dann also τ(t) = t. Wir setzen nun Ψ(t) := (τ(t), ϕ(t)), Ψ : (a, b)→ Rn+1
setzen und dann die definierenden Funktion F : U → Rm durch eine weitere Komponente
τ ′(t) = 1 zu einer Funktion F : U → Rm+1 erganzen.5
Wir betrachten dazu Beispiel 2.3 (5). Wir uberfuhren die bisherige gewohnliche Dif-ferentialgleichung fur ϕ(t) in eine fur Ψ(t) = (τ(t), ϕ(t)). Dazu definieren wir
F
((τ0u0
),
(τ1u1
))=
(τ1 − 1
u1 − f(τ0, u0).
)Diese Funktion definiert die autonome gewohnliche Differentialgleichung
(2.7)
{τ ′(t) = 1
u′(t) = f(τ(t), u(t))
4Also ψ0(t) = ϕ(t), ψ1(t) = ρ(t) in der Notation von oben.5Der Definitionsbereich von F andert sich nicht, aber die Interpretation der t-Variable.
260 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Ist u eine Losung von (2.4), dann istΨ(t) := (t, u(t)) eine Losung von (2.7). Ist umgekehrtΨ(t) = (τ(t), u(t)) eine Losung von (2.7). Dann folgt τ(t) = t + t0 fur eine Konstantet0 ∈ R. Wir setzen dann u(t) := u(t− t0). Dann gilt
u′(t) = u′(t− t0) = f(t, u(t− t0)) = f(t, u(t)).
Also ist u eine Losung von (2.4).Fr 5.7.
3. Flusslinien und Erhaltungsgroßen
Wir haben diskutiert:
• Jede gewohnliche Differentialgleichung kann auf eine Differentialgleichung erster Ordnungreduziert werden• Jede gewohnliche Differentialgleichung kann auf eine autonome Differentialgleichung (der
gleichen Ordnung) reduziert werden
Viele (gewohnliche)6 Differentialgleichungen haben keine Losung oder konnen nur schwer gelostwerden. Zum Beispiel hat
(ϕ(t)2 + (ϕ′(t)− 1)2 = 0
keine Losung ϕ : (a, b)→ R.
In guten Situationen hingegen kann man Differentialgleichungen erster Ordnung nach ϕ′(t) auflosen,und dann sind die Gleichungen besser zu behandeln:
ϕ′(t) = f(t, ϕ(t))
oderϕ′(t) = f(ϕ).
Man nennt dies eine explizite gewohnliche Differentialgleichung .
Definition 3.1. Sei U offen in Rn. Ein (glattes) Vektorfeld ist eine (glatte) Abbildung f : U → Rn.
Vorstellung: Im Punkt x beginnt der Pfeil, der durch f(x) beschrieben wird.
Bild eines Vektorfelds, symbolisiert duruch viele Pfeile in R2.
Definition 3.2. Eine Flusslinie oder Integralkurve des Vektorfeldes f : U → Rn ist eine Losungvon
ϕ′(t) = f(ϕ(t)).
autonome explizite gew. Diff’glng auf U = Vektorfeld auf U .
6Wir lassen das Wort”gewohnlich“ nun oft weg, da alle Differentialgleichungen in der Vorlesung gewohlich
sind.
3. FLUSSLINIEN UND ERHALTUNGSGROSSEN 261
Definition 3.3. Eine Erhaltungsgroße oder ein erstes Integral zum Vektorfeld f ist eine FunktionE : U → R, so dass t 7→ E(ϕ(t)) entlang jeder Flusslinie von f konstant ist.
Schreibweise: schreibe auch ddth fur die Ableitung von h nach t.
Beispiel 3.4 (Pendel). Wir betrachten die Gleichung
(3.5) ϕ′′(t) = − sinϕ(t).
Wir formen in eine Differentialgleichung erster Ordnung um, indem wir ρ(t) = ϕ′(t) setzen, Ψ(t) =(ϕ(t), ρ(t))T ∈ R2. (
ϕ(t)ρ(t)
)′=
((ρ(t)
− sinϕ(t)
))Losung sind Flusslinien von f(ϕ, ρ) = (ρ,− sinϕ)T . Ist Ψ(t) = (ϕ(t), ρ(t))T eine Flusslinie von f ,so ist ϕ(t) eine Losung von (3.5).
Multipliziere (3.5) mit ϕ′(t),
1
2
d
dt((ϕ′(t))2) = ϕ′(t)ϕ′′(t) = −ϕ′(t) sin(ϕ(t)) =
d
dt(cosϕ(t))
Wir definieren E : R2 → R, E(ϕ, ρ) = 12ρ
2 − cosϕ. Dann ist
d
dt(E((ϕ(t), ρ(t))T )) =
1
2
((ϕ′(t))2 − cosϕ(t)
)′= 0.
Also ist E eine Erhaltungsgroße.
Die Hohenlinien der Funktion (ϕ, ρ) 7→ E(ϕ, ρ). Zusammenhangskomponenten einer Hohenlinie(ohne stationare Punkte) bilden die Orbits, das heißt die Kurven, entlang derer sich die Losung
bewegt. Siehe”Phase diagram“ auf der Webseite
http://physique.unice.fr/sem6/2011-2012/PagesWeb/PT/Pendule/En/study1_simple.html
UBUNG 3.6 (Nutzt den Satz von Picard-Lindelof, siehe unten). Sei f : U → Rn ein stetig differen-zierbares Vektorfeld. Sei E : U → R differenzierbar. Dann ist E genau dann eine Erhaltungsgroßevon f , wenn 7
f(x) ∈ kerE′(x)
fur alle x ∈ U .
Losung: Zentralubung
Beweis. Es gelte f(x) ∈ kerE′(x) fur alle x ∈ U . Sei ϕ : (a, b) → U eine Flusslinie von f , danngilt
(E ◦ ϕ)′(t) = E′(ϕ(t)) · ϕ′(t) = E′(ϕ(t)) · f(ϕ(t)) = 0.
Also ist E eine Erhaltungsgroße.
7Hier wird E′(x) als lineare Abbildung Rn → R betrachtet. Wenn wir E′(x) als Zeilenvektor betrachten, heißt
die analoge Aussage (E′(x))T ⊥ f(x) oder aquivalent E′(x) · f(x) = 0.
262 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Umgekehrt sei E eine Erhaltungsgroße. Da f stetig differenzierbar ist, ist f Orts-Lipschitz-stetig.Zu jedem x0 ∈ U existiert also nach dem Satz von Picard-Lindelof ein ε > 0 und eine Flusslinieϕ : (−ε, ε)→ U von f mit ϕ(0) = x0. Da E ◦ ϕ konstant ist, rechnen wird
0 = (E ◦ ϕ)′(0) = E′(ϕ(0)) · ϕ′(0) = E′(x0) · f(x0).
Somit gilt f(x0) ∈ kerE′(x0) fur alle x0 ∈ U .
UBUNG 3.7 (Nutzt den Satz von Picard-Lindelof, siehe unten). Sei M eine Untermannigfaltigkeitvon Rn, M ⊂ U , U offen in Rn und sei M abgeschlossen in Rn. Sei f : U → Rn ein Lipschitz-stetigesVektorfeld. Ist f tangential an M (d.h. es gelte f(p) ∈ TpM fur alle p ∈M) und ist c : (a, b)→ Rneine Integralkurve von f mit a < t0 < b und c(t0) ∈M , so ist c(t) ∈M fur alle t ∈ (a, b).
Losung: Zentralubung
Bemerkung 3.8. Im allgemeinen ist es sehr schwer, eine oder mehrere Erhaltungsgroßen zu er-halten. In der Lagrange-Mechanik der klassischen Physik liefert das Noethersche Theorem zu jederSymmetrie eines mechanischen Systems eine Erhaltungsgroße. Typische Erhaltungsgroßen in derPhysik sind Energie, Komponenten des Impulsvektors, Komponenten des Drehimplusvektors, etc..
Wenn Erhaltungsgroßen E1, . . . , E` existieren, dann bilden diese eine erhaltene Abbildung E =(E1, . . . , E`) : U → R`. Jede Flussline ϕ : I → U mit E(ϕ(t0)) = E0, t0 ∈ I erfullt dann alsoϕ(I) ⊂ E−1({E0}). Ist E0 ein regularer Wert von E, dann bewegt sich die Flusslinie entlang der(n − `)-dimensionalen Untermannigfaltigkeit M := E−1({E0}). Durch Verwendung einer lokalenParametrisierung Ψ : W →M kann man die durch f gegebene gewohnliche Differentialgleichung ineine autonome gewohnliche Differentialgleichung erster Ordnung auf W umwandeln.8 Somit habenwir die Losung der Differentialgleichung lokal auf die Losung einer anderen Differentialgleichungreduziert, die oft einfacher zu losen ist, da die Dimension n− ` kleiner ist.
4. Der Satz von Picard-Lindelof
Im folgenden Abschnitt besteht die Gefahr, Intervalle (a, b) ⊂ R mit dem Paar (a; b) ∈ R2 zuverwechseln. Wir schreiben deswegen weiterhin (a, b) fur das Paar und (a; b) fur das Intervall.
Ab jetzt: Sei U offen in R× Rn, f : U → Rn.
Elemente in R× Rn 3 (t, x), t ∈ R Zeit, x ∈ Rn Ort.
Definition 4.1. Sei f wie oben. Wir sagen f ist Orts-Lipschitz-stetig , falls es ein L ∈ R gibt, sodass fur alle (t, x), (t, y) ∈ U gilt:
‖f(t, x)− f(t, y)‖ ≤ L‖x− y‖.
Wir sagen auch f ist Orts-Lipschitz-stetig mit Lipschitz-Konstante L.
8Genauer: Man definiert ein Vektorfeld f : W → Rn−` so, dass Ψ′(p)f(p) = f(Ψ(p)) fur alle p ∈ W . Dannist
ϕ : I →W eine Flusslinie von f , wenn ϕ := Ψ ◦ ϕ eine Flusslinie von f ist.
4. DER SATZ VON PICARD-LINDELOF 263
Wir sagen f ist lokal Orts-Lipschitz-stetig , falls jedes (t, x) ∈ U eine offene Umgebung V in Ubesitzt, so dass f |V Orts-Lipschitz-stetig ist.
9
Beispiele 4.2.
(1) Sei f : U → Rn Lipschitz-stetig, das heißt, es gebe ein L ∈ R, so dass fur alle (t, x), (s, y) ∈U :
‖f(t, x)− f(s, x)‖ ≤ L√|t− s|2 + ‖x− y‖2.
Dann ist f Orts-Lipschitz-stetig. Insbesondere ist jede lineare Funktion (Orts-)Lipschitz-stetig.
(2) f : R × R → R, f(t, x) = 3√t ist Orts-Lipschitz-stetig und stetig, aber nicht Lipschitz-
stetig.(3) Lipschitz-stetige Funktionen sind stetig, aber es gibt nicht-stetige Orts-Lipschitz-stetige
Funktionen(4) Schreibe (t, x) = (t, x1, . . . , xn). Angenommen die partiellen Ableitungen
∂
∂x1f, . . . ,
∂
∂xnf : U → Rn
existieren und sind stetig (als Funktionen U → Rn). Sei Bε(t0, x0) ∈ U . Wir definieren
C := maxi=1,...,n
max(s,y)∈Bε(t0,x0)
∥∥∥∥ ∂
∂xif(s, y)
∥∥∥∥∞<∞.
Das hintere Maximum wird angenommen (und ist deswegen endlich), da Bε(t0, x0) kom-pakt ist. Schreibe f(t, x) = (f1(t, x), . . . , fn(t, x)). Dann gilt nach dem Mittelwertsatz
fj(s, y)− fj(s, z) =
n∑i=1
(yi − zi)∂fj∂xi
(s, wj)
fur ein wj auf der Strecke von y nach z. Also
|fj(s, y)− fj(s, z)| ≤ ‖y − z‖∞nC,falls (s, y), (s, z) ∈ Bε(t0, x0). Bezuglich der Norm ‖ · ‖∞ ist f |Bε(t0,x0) also Orts-Lipschitz-stetig. Es folgt, dass f lokal Orts-Lipschitz-stetig ist.
SATZ 4.3 (Satz von Picard-Lindelof). Seien U ⊂ R×Rn offen, f : U → Rn lokal 10 Orts-Lipschitz-stetig und stetig. Sei (t0, x0) ∈ U . Dann gibt es ein ε0 ∈ R>0, so dass es fur jedes ε ∈ (0; ε0] genaueine stetig differenzierbare Abbildung ϕ : (t0 − ε; t0 + ε)→ Rn gibt mit:
• ϕ(t0) = x0 (Anfangswert)• fur alle t ∈ (t0 − ε; t0 + ε) gelte (t, ϕ(t)) ∈ U
9Die Eigenschaften Orts-Lipschitz-stetig und lokal Orts-Lipschitz-stetig sind unabhangig von der gewahltenNorm auf Rn. Die moglichen Konstanten L hangen aber von der Wahl der Norm ab.
10Die Aussage ist naturlich auch noch immer richtig, wenn wir das Wort”lokal“ weglassen.
264 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
• und fur alle t ∈ (t0 − ε; t0 + ε) gelte
(4.4) ϕ′(t) = f(t, ϕ(t)).
Beweis. Im folgenden sei
B∞δ (x0) := {x ∈ Rn | ‖x− x0‖∞ < δ}.
Wir wahlen δ > 0, so dass V := (t0 − δ; t0 + δ) × B∞δ (x0) ⊂ V := [t0 − δ; t + δ] × B∞δ (x0) ⊂ U .Wenn wir δ > 0 genugend klein wahlen, dann ist f |V Orts-Lipschitz-stetig, und sei L ∈ R hierzueine Lipschitz-Konstante. Da f stetig ist, ist f beschrankt auf der kompakten Menge V .
ε ∈ (0; δ) wird spater festgelegt.
Notation: I = (t0 − ε; t0 + ε),
Sei E := Cb(I,Rn) der Vektorraum der beschrankten stetigen Funktionen von I nach Rn. Furϕ ∈ E definiere11
|||ϕ|||∞ := supt∈I‖ϕ(t)‖∞
ϕi → ϕ in (E, ||| · |||∞)(def)⇐⇒ ϕi konvergiert gleichmaßig gegen ϕ
LEMMA 4.5. (E, ||| · |||∞) ist ein Banachraum, d.h. jede Cauchy-Folge in E konvergiert.
Beweis des Lemmas. Wir wenden Korollar 2.8 aus Kapitel 7 an, wobei (Y, d) der metrische Raumzum normierten Raum (Rn, ‖ · ‖∞) ist und D = I. Wir erhalten, dass (Abb(I,Rn), dglm) vollstandigist. Wir haben E = {ϕ ∈ Abb(I,Rn) | ϕ ist beschrankt und stetig}. Wegen Satz 2.5 aus Kapitel 7ist ein gleichmaßiger Grenzwert stetiger Funktionen wiederum stetig. Da auch Beschrankheit untergleichmaßigen Limites erhalten bleibt, ist E abgeschlossen in Abb(I,Rn). Somit ist E vollstandigbzgl. dglm. Hieraus folgt, dass (E, ||| · |||∞) vollstandig ist.
Sei ϕ0 konstant x0, d.h. ϕ0(t) = x0 ∀t ∈ I. Wir definieren die folgende Teilmenge von E:
Eδ,ε := {ϕ ∈ E | ∀t ∈ (t0 − ε; t0 + ε) : ‖ϕ(t)− x0‖∞ ≤ δ} = {ϕ ∈ E | |||ϕ− ϕ0|||∞ ≤ δ}.
Man sieht leicht, dass Eδ,ε eine abgeschlossene Teilmenge von (E, ||| · |||∞) ist. Insbesondere ist Eδ,εmit der von ||| · |||∞ induzierten Metrik ein vollstandiger metrischer Raum.
Wir definieren12
A : Eδ,ε → E, A(ϕ)(t) = x0 +
∫ t
t0
f(τ, ϕ(τ)) dτ.
Die Beschranktheit von A(ϕ) folgt aus der Beschranktheit von f |V .
11Um die Norm auf Rn und die auf E genauer zu unterscheiden, schreiben wir fur letztere im Skript ||| · |||∞.12Im folgenden ist immer A(ϕ)(t) als
(A(ϕ)
)(t) zu lesen
4. DER SATZ VON PICARD-LINDELOF 265
LEMMA 4.6 (Umformulierung der Gew. Dgl. in ein Fixpunktproblem eines Integraloperators). Esgilt A(ϕ) = ϕ genau dann, wenn ϕ eine stetig differenzierbare Losung von (4.4) ist mit ϕ(t0) = x0.
Beweis des Lemmas. Es gelte A(ϕ) = ϕ. Dann gilt (inklusive Existenz der Ableitung!)
ϕ′(t) =d
dt
∫ t
t0
f(τ, ϕ(τ)) dτ = f(t, ϕ(t)).
Aus dieser Formel folgt auch die stetige Differenzierbarkeit von ϕ.
Umgekehrt: ist ϕ eine stetig differenzierbare Losung von (4.4) mit ϕ(t0) = x0, dann ist
A(ϕ)(t) = x0 +
∫ t
t0
f(τ, ϕ(τ)) dτ = x0 +
∫ t
t0
ϕ′(τ) dτ = ϕ(t).
bis hier: Fr 5.7.
ab hier: Mi 17.7.
Im folgenden seien die Lipschitz-Konstanten immer bezuglich der Norm ‖ · ‖∞ definiert.
LEMMA 4.7. Sei f |V Orts-Lipschitz-stetig mit Lipschitz-Konstante L. Dann ist die AbbildungA : Eδ,ε → E Lipschitz-stetig mit Konstante εL.
Beweis des Lemmas. Seien ϕ, ψ ∈ Eδ,ε.
A(ϕ)(t)−A(ψ)(t) =
∫ t
t0
(f(τ, ϕ(τ)
)− f
(τ, ψ(τ)
))dτ
∥∥∥A(ϕ)(t)−A(ψ)(t)∥∥∥∞≤
∫ t
t0
∥∥f(τ, ϕ(τ))− f
(τ, ψ(τ)
)∥∥∞ dτ
≤∣∣∣∣∫ t
t0
L∥∥ϕ(τ)− ψ(τ)
∥∥∞ dτ
∣∣∣∣≤ εL sup
τ∈I‖ϕ(τ)− ψ(τ)‖∞
Also
|||A(ϕ)−A(ψ)|||∞ ≤ εL|||ϕ− ψ|||∞.
LEMMA 4.8. Sei C := max{‖f(t, x)‖∞ | (t, x) ∈ V }. Wenn wir
(4.9) ε ≤ ε0 := min{ δ
2(C + δL),δ
2
}wahlen, dann gilt A(Eδ,ε) ⊂ Eδ/2,ε.
266 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Beweis.
|||A(ϕ0)− ϕ0|||∞ ≤ supt∈I‖A(ϕ0)(t)− x0‖∞
= supt∈I
∥∥∥∥x0 +
∫ t
t0
f(τ, x0) dτ − x0
∥∥∥∥∞
= supt∈I
∣∣∣∣∫ t
t0
‖f(τ, x0)‖∞ dτ
∣∣∣∣≤ sup
t∈I|t− t0|C = εC.
Also gilt fur beliebiges ϕ ∈ Eδ,ε:|||A(ϕ)− ϕ0|||∞ ≤ |||A(ϕ)−A(ϕ0)|||∞ + |||A(ϕ0)− ϕ0|||∞
≤ εL|||ϕ− ϕ0|||∞ + εC
≤ εLδ + εC ≤ δ
2,
falls ε ≤ ε0 ≤ δ/2 wie oben gewahlt wird. Es folgt A(Eδ,ε) ⊂ Eδ/2,ε.
Aus (4.9) folgt auch εL < 1/2. Das heißt, dann ist A : Eδ,ε → Eδ,ε eine Kontraktion. Es giltϕ0 ∈ Eδ,ε 6= ∅. Nach dem Banachschen Fixpunktsatz (Satz 2.5 in Kapitel 8) besitzt also A eineneindeutigen Fixpunkt in Eδ,ε. Den Fixpunkt nennen13 wir ϕε. Insbesondere haben wir nun denExistenzteil des Theorems gezeigt.
Ist nun 0 < ε < ε, dann istϕ := (ϕε)|(t0−ε;t0+ε) ∈ Eδ,ε
eine Losung von (4.4) mit ϕ(t0) = x0 und deswegen gilt ϕε = ϕ.
Das Theorem (=der Satz von Picard-Lindelof) ist nun bewiesen, sobald wir das folgende Lemmahaben. Dann ist namlich auch die im Theorem behauptete Eindeutigkeit gezeigt.
LEMMA 4.10. Sei ρ ∈ (0; ε0] und ψ : (t0− ρ; t0 + ρ)→ Rn eine Losung von (4.4) mit ψ(t0) = x0,(t, ψ(t)) ∈ U ∀t. Dann gilt ψ ∈ Eδ,ρ.
Aus dem Lemma folgt namlich, dass ψ ein und damit der einzige Fixpunkt von A|Eδ,ρ ist.
Beweis. Wir zeigen, dass fur alle t ∈ (t0 − ρ; t0 + ρ) gilt:
‖ψ(t)− x0‖∞ < δ.
Angenommen diese Ungleichung gilt nicht fur alle solchen t. Dann ist
T :={s ∈ [0, ρ)
∣∣∣ ‖ψ(t0 + s)− x0‖∞ = δ oder ‖ψ(t0 − s)− x0‖∞ = δ}
13Wir schreiben ϕε um klar zu machen, dass wir noch nichts daruber wissen, ob es von ε abhangt. Achtung: wirhaben auch noch nicht geklart, ob die Losung von δ abhangt. Und selbst bei L konnen wir verschiedene Konstanten
wahlen, und die wahlbaren Konstanten hangen auch wieder von der Wahl von δ ab. Kurzum: ϕε konnte noch von
vielen Wahlen abhangen, und wir werden nun sehen, dass es dies eigentlich gar nicht tut.
4. DER SATZ VON PICARD-LINDELOF 267
eine nicht-leere abgeschlossene14 Teilmenge von [0, ρ).
Setze ρ := minT , und wir haben 0 < ρ < ρ ≤ ε0. Wir erhalten ‖ψ(t)−x0‖∞ < δ fur t ∈ (t0−ρ; t0+ρ)und somit ψ|(t0−ρ;t0+ρ) ∈ Eδ,ρ, also insbesondere
(4.11) ψ(t) = ϕε0(t) ∀t ∈ (t0 − ρ; t0 + ρ)
Auf Grund der Stetigkeit von ψ und ϕε0 folgt die Gultigkeit von (4.11) fur t ∈ [t0 − ρ; t0 + ρ]. Esfolgt der Widerspruch
δρ∈T= ‖ψ(t0 ± ρ)− x0‖∞ = ‖ϕε0(t0 ± ρ)− x0‖∞ ≤
δ
2.
Aus Lemma 4.10 folgt dann auch: Losungen von (4.4) mit dem selben Anfangswert stimmen aufdem Durchschnitt ihrer Definitionsbereiche uberein.15
Der Beweis des Theorems liefert noch mehr
• Ein numerisches16 Berechnungsverfahren fur die Losung. Definiere rekursiv: ϕ0(t) = x0,ϕk+1 := A(ϕk). Dann konvergiert ϕk gegen die Losung. (Ohne Beweis!)• Information daruber wie ϕ(t) vom Anfangswert x0 abhangt, siehe folgender Zusatz 4.13.
Beispiele 4.12.
(a) Ist f : U → Rn stetig differenzierbar, dann ergibt der Satz von Picard-Lindelof zu jedemAnfangswert ϕ(t0) = x0 eine Losung ϕ : I → Rn von ϕ′(t) = f(ϕ(t)). Wir werden sehen: esgibt ein maximales Intervall, auf dem die Funktion ϕ definiert werden kann.
(b) n = 1, f(t, x) = 3√t ist Orts-Lipschitz-stetig. Also erfullt ϕ′(t) = 3
√t, ϕ(t) ∈ R die Vorausset-
zungen des Satzes von Picard-Lindelof. Man kann explizit die Losung bestimmen:
ϕ(t) =3
4t4/3.
14Da s 7→ ‖ψ(t0 + s)− x0‖∞ stetig ist und {δ} abgeschlossen in R.15Die oben konstruierte Zahl ε0 hangt von der Wahl von δ ab. Die Losung ϕ ist aber im folgenden Sinn von
δ unabhangig: Sind Losungen zu zwei verschiedenen Wahlen von δ gegeben, so stimmen diese Losungen auf einer
Umgebung von t0 uberein.16
”Numerisch“ bedeutet: man bekommt keine explizite Formel fur die Losung heraus, dafur aber ein Verfahren,
das in ein Computer-Programm umsetzbar ist und das dann beliebig genaue Naherungslosungen liefert.
268 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
(c) n = 1, f(t, x) = 3√x ist nicht Orts-Lipschitz-stetig. Picard-Lindelof ist nicht anwendbar. Den-
noch gibt es Losungen. Falls ϕ(t) 6= 0:
ϕ′(t) = 3√ϕ(t)
⇐⇒ ϕ′(t)3√ϕ(t)
= 1
⇐⇒ d
dt
3
2(ϕ(t))2/3 = 1
⇐⇒ ∃c ∈ R :3
2(ϕ(t))2/3 = t+ c
⇐⇒ ∃c ∈ R : ϕ(t) = (2
3(t+ c))3/2.
Dies liefert Losungen auf (−c,∞). Nun ist
ϕ(t) =
{( 2
3 (t+ c))3/2 t > −c0 t ≤ −c
stetig differenzierbar. Zum Anfangswert ϕ(0) = 0 gibt es viele Losungen (zu jedem c ≥ 0 eine).Weitere Losungen
ϕ(t) =
{−( 2
3 (t+ c))3/2 t > −c0 t ≤ −c
.
Existenz, aber keine Eindeutigkeit!
In der Aussage des Satzes 4.3 von Picard-Lindelof lasst sich nicht ablesen, wie ε0 von x0 abhangt.Wenn man den Beweis des Satzes von Picard-Lindelof genau betrachtet, so erhalt man aber fol-gendes:
ZUSATZ 4.13 (zum Satz von Picard-Lindelof). Es sollen die Voraussetzungen von Satz 4.3 vonPicard-Lindelof gelten. Jeder Punkt (t0, x0) besitzt dann eine Umgebung W und ein ε0 > 0, so dassfur jedes (t1, x1) ∈W der Satz von Picard-Lindelof eine eindeutige Losung ϕ : (t1−ε0; t1+ε0)→ Rnmit Anfangswert ϕ(t1) = x1 liefert.
Beweis des Zusatzes (skizziert). Sei wieder f : U → Rn, (t0, y0) ∈ U wie oben. Hierzu sei δ,ε wie im Beweis des Satzes 4.3 von Picard-Lindelof konstruiert gewahlt. Sei (t1, x1) ∈ U mit‖(t1, x1) − (t0, x0)‖∞ ≤ δ/4. Wenn man den Beweis des Satzes 4.3 von Picard-Lindelof genauanschaut, so sieht man, dass die Differentialgleichung auch eine Losung ϕt1,y1 : (t1−ε0; t1+ε0)→ Rnmit ϕt1,x1
(t1) = x1 besitzt. Der Zusatz ist also richtig fur W := B∞δ/4((t0, x0)
)⊂ U .
Dasselbe ε0 kann also zu allen Startwerten in W gewahlt werden. Man beachte aber, dass wirweder hier noch im Satz von Picard-Lindelof gefordert haben, dass ε0 in irgendeinem Sinne ma-ximal gewahlt wird. Diese Abhangigkeit von den Anfangswerten wird spater in Satz 4.20) wiederaufgegriffen.Ende Mi 17.7.
Fr 19.7.
4. DER SATZ VON PICARD-LINDELOF 269
Wdh. Picard-Lindelof.
Sei U offen in R× Rn, f : U → Rn Orts-Lipschitz-stetig und stetig. Zu jedem (t0, x0) gibt es
• ε > 0 und• Eine eindeutige C1-Funktion ϕt0,x0 : (t0−ε; t0 +ε)→ Rn, so dass fur alle t ∈ (t0−ε; t0 +ε)
gilt:
(t, ϕt0,x0(t)) ∈ U und ϕ′t0,x0
(t) = f(t, ϕt0,x0(t))
Ab jetzt: Losung = Losung von ϕ′(t) = f(t, ϕ(t)).
SATZ 4.14 (Satz von Picard-Lindelof auf maximalen Intervallen). Seien U , f , t0 und x0 wie imSatz von Picard-Lindelof. Setze
tmax := sup{t > t0 | Es existiert ε > 0 und eine Losung ϕ : (t0 − ε; t)→ Rn
von (4.4) mit Anfangswert x0} ∈ (t0;∞]
tmin := inf{t < t0 | Es existiert ε > 0 und eine Losung ϕ : (t; t0 + ε)→ Rn
von (4.4) mit Anfangswert x0} ∈ [−∞; t0).
(1) Dann existiert auch eine Losung ϕmax : (tmin; tmax) → Rn mit Anfangswert ϕmax(t0) = x0.Man nennt (tmin; tmax) das maximale Losungs-Intervall.
(2) Jede Losung ϕ : I → Rn mit demselben Anfangswert erfullt I ⊂ (tmin; tmax) und ϕ = ϕmax|I .
Beweis. 1. Schritt: Sind ϕ : I → Rn und ϕ : I → Rn mit ϕ(t0) = ϕ(t0) = x0; I, I offene
Intervalle. Wir zeigen, dass ϕ und ϕ auf I ∩ I ubereinstimmen.
Wir definieren
T := {t ∈ I ∩ I | ϕ(t) = ϕ(t)}.Da h : t 7→ ϕ(t) − ϕ(t) stetig ist und da {0} abgeschlossen in R, ist T = h−1({0}) ebenfalls
abgeschlossen in I ∩ I. Wegen t0 ∈ T wissen wir T 6= ∅. Wir zeigen nun, dass T offen in I ∩ I ist.Da I ∩ I zusammenhangend ist, folgt dann T = I ∩ I und somit der erste Schritt.
Sei also t1 ∈ T . Wahle ε1 > 0 so, dass (t1 − ε1; t1 + ε1) ⊂ I ∩ I. Nach dem Satz 4.3 von Picard-Lindelof gibt es ein ε ∈ (0; ε1], so dass es genau eine Losung ϕ : J := (t1 − ε; t1 + ε) → Rn mitAnfangswert ϕ(t1) = ϕ(t1) gibt. Also
ϕ ≡ ϕ|J ≡ ϕ|J .
Somit J ⊂ T . Wir haben gesehen, dass T offen ist. Der erste Schritt ist somit beendet.
2. Schritt: Wir wollen nun die Losung ϕmax : (tmin; tmax) → Rn mit Anfangswert ϕmax(t0) = x0
definieren.
Zu t ∈ (tmin; tmax) wahlen wir eine Losung ϕ : I → Rn, I offenes Intervall, t0, t ∈ I mit ϕ(t0) = x0.Dann setzen wir ϕmax(t) = ϕ(t). Der erste Schritt garantiert, dass die Definition von ϕmax(t) nicht
270 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
davon abhangt, wie wir I und ϕ gewahlt haben. Und fur derartige ϕ gilt dann
ϕmax|I = ϕ.
Insbesondere ist nun ϕmax auf (tmin; tmax) wohldefiniert und eine stetig differenzierbare Losung.
PROPOSITION 4.15. Seien U , f , (t0, x0) wie im Satz von Picard-Lindelof. Sei ϕ eine Losungmit ϕ(t0) = x0 mit maximalem Losungs-Intervall (tmin; tmax).
Gilt tmax <∞, dann gibt es kein x∞ mit (tmax, x∞) ∈ U und
x∞ = limt→tmax
ϕ(t).
Analog fur tmin > −∞.
In anderen Worten: Wenn der Grenzwert existiert, dann ist er nicht in U .17
Beweis. Wir betrachten nur die Aussage um tmax.
Angenommen solch ein x∞ existiert. Es existiert nun ein ε > 0 und eine Umgebung V von(tmax, x∞) in R×Rn, so dass fur alle (s, y) ∈ V gilt: es gibt eine Losung ϕs,y : (s− ε; s+ ε)→ Rnmit ϕs,y(s) = y.
Es existiert nun ein δ > 0 so dass fur alle t ∈ (tmax − δ; tmax): (t, ϕ(t)) ∈ V . Wahle nun ein t1 mittmax − ε/2 < t1 < tmax, tmax − δ < t1.
Wir erhalten nun eine Losung
ϕ(t) :=
{ϕ(t) fur tmin < t ≤ t1ϕt1,ϕ(t1)(t) fur t ≥ t1
Ein passendes Bild
die auf dem Intervall [tmin; t1 + ε) definiert ist, aber t1 + ε > tmax. Dies ist ein Widerspruch.
Bemerkung. Unter den Voraussetzung von Proposition 4.15 erhalten wir mit genau den gleichenArgumenten wie im obigen Beweis sogar eine etwas starkere Aussage:
Gilt tmax <∞, dann gibt es keine Folge ti ↗ tmax, so dass
x∞ = limi→∞
ϕ(ti)
existiert und (tmax, x∞) ∈ U . Insbesondere folgt hieraus: Im Fall tmax <∞, gilt fur t0 ∈ (tmin; tmax)
U ∩ {(t, ϕ(t)) | t0 ≤ t < tmax}ist nicht kompakt.
17Es gibt ein Beispiele fur alle denkbaren Falle: tmax < ∞ und Grenzwert existiert außerhalb U . tmax < ∞und Grenzwert existiert nicht. Im Falle tmax = ∞ kann man keine Aussage machen. Ein uneigentlicher Grenzwertkann nicht existieren, außerhalb von U existieren oder in U existieren. Analog fur tmin.
4. DER SATZ VON PICARD-LINDELOF 271
Bemerkung 4.16 (Unter Nutzung des nachsten Abschnitts, der in der Vorlesung zeitlich zu vorbehandelt wurde.). Ist f stetig differenzierbar, und ϕ eine Losung von ϕ′(t) = f(t, ϕ(t)). Dannerhalten wir aus der Kettenregel ϕ ∈ C2 und
ϕ′′(t) =∂
∂tf(t, ϕ(t)) +
∂
∂xf(t, ϕ(t)) · ϕ′(t) .
Dies kann man bis zur k-ten Ableitung iterieren, falls f ∈ Ck. Wenn man nun die so erhaltenegewohnliche Differentialgleichung k-ter Ordnung studiert, erhalt man wichtige Aussagen uber dieAbleitungen von ϕ. Insbesondere: ist f ∈ Ck, dann ist ϕ ∈ Ck+1.
Frage 4.17. Hangt die Losung stetig von t0 und x0 ab?
LEMMA 4.18 (Gronwall). Sei I ein Intervall, C,L ∈ R≥0, g : I → R stetig, a ∈ I und es geltefur alle t ∈ I
g(t) ≤
{C + L
∫ tag(τ) dτ falls t ≥ a
C + L∫ atg(τ) dτ , falls t ≤ a .
Dann gilt fur alle t ∈ I:
g(t) ≤ eL |t−a| C .
Beweis. Wir betrachten zunachst t ≥ a. Sei ψ(t) := C + L∫ tag(τ) dτ , das heißt g(t) ≤ ψ(t) fur
t ∈ I mit t ≥ a. Nach dem Hauptsatz der Differenial- und Integralrechnung ist ψ diffbar mitψ′(t) = Lg(t) ≤ Lψ(t). Wir rechnen
d
dt
(ψ(t) e−L(t−a)
)= ψ′(t)︸ ︷︷ ︸
≤Lψ(t)
e−L(t−a) − Lψ(t)) e−L(t−a) ≤ 0 .
Durch Integration uber das Intervall [a, t] folgt
ψ(t) e−L(t−a) ≤ ψ(a) e−L(a−a) = C ,
und somit die Behauptung.
Der Fall t ≤ a folgt, in dem wir den bereits beweisenen Fall auf g(τ) := g(2a− τ) anwenden.
PROPOSITION 4.19 (Losungsabschatzung). Sei U ⊂ R × Rn offen und f : U → Rn Orts-Lipschitz-stetig mit Lipschitz-Konstante L und stetig. Sei I ein Intervall und a ∈ I. Seien ϕ1, ϕ2 :I → Rn Losungen von
ϕ′(t) = f(t, ϕ(t)) .
(Also insbesondere seien beide differenzierbar und fur alle t ∈ I gelte (t, ϕ1(t)) ∈ U und (t, ϕ2(t)) ∈U .) Dann gilt fur alle t ∈ I:
‖ϕ1(t)− ϕ2(t)‖∞ ≤ eL |t−a| ‖ϕ1(a)− ϕ2(a)‖∞ .
272 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Beweis. Mit Lemma 4.6 erhalten wir
ϕ1(t)− ϕ2(t) = ϕ1(a)− ϕ2(a) +
∫ t
a
(f(τ, ϕ1(τ))− f(τ, ϕ2(τ)))︸ ︷︷ ︸≤L‖ϕ1(τ)−ϕ2(τ)‖
dτ .
Hieraus erhalten wir daraus
‖ϕ1(t)− ϕ2(t)‖∞ ≤ ‖ϕ1(a)− ϕ2(a)‖∞ + L∣∣∣∫ t
a
‖ϕ1(τ)− ϕ2(τ)‖∞ dτ∣∣∣ .
Wir wenden das Lemma von Gronwall fur g(t) := ‖ϕ1(t) − ϕ2(t)‖∞ und C := ‖ϕ1(a) − ϕ2(a)‖∞an und erhalten die Aussage.
SATZ 4.20 (Stetige Abhangigkeit von den Anfangsbedinungen). Es sollen die Voraussetzungenund Definitionen aus dem Satz 4.3 von Picard-Lindelof und dem Zusatz 4.13 gelten. Das heißt:Seien U ⊂ R × Rn offen, f : U → Rn lokal Orts-Lipschitz-stetig und stetig. Sei (t0, x0) ∈ U .Es sei eine offene Umgebung W von (t0, x0) in U und ein ε0 > 0 gegeben, so dass es zu jedemAnfangswert (t1, x1) ∈W eine Losung ϕt1,x1 : (t0 − ε0; t0 + ε0)→ Rn von
ϕ′(t) = f(t, ϕ(t))
gibt.18 Dann hangt ϕt1,x1(t) auch stetig von t1 und x1 ab. Genauer: die Funktion
Φ : (t0 − ε0; t0 + ε0)×W → Rn, (t, t1, x1) 7→ ϕt1,x1(t) = ϕt0,x1(t− t1 + t0)
ist stetig.
Beweis. Man sieht die Folgenstetigkeit der Funktion Φ ganz einfach aus der vorangehenden Pro-position.
Skizze eines alternativen Beweises.19 (Details siehe z.B. [11, Chap. 1, Sec. 5])
Man nutzt Zusatz 4.13 um ein gemeinsames Definitionsintervall fur alle (t1, x1) nahe (t0, x0) zufinden. Man definiert iterativ fur |t − t1| < ε/2 (fur das ε aus Beweis des Satzes 4.3 von Picard-Lindelof):
Φ0(t, t1, x1) := x1, Φj+1(t, t1, x1) := x1 +
∫ t
t1
f(τ,Φj(τ, t1, x1)) dτ.
Man zeigt iterativ, dass Φj stetig ist fur alle j und zeigt dann, dass Φj lokal gleichmaßig gegen Φkonvergiert. Die Stetigkeit ist nun fur |t − t1| < ε/2 gezeigt. Um es fur alle t, t1 zu zeigen wahltman Zahlen t(0), . . . , t(L) mit t(0) = t1, t(L) = t und |t(i)− t(i− 1)| < ε/2. Die Stetigkeit von Φfolgt dann aus der Verkettung von stetigen Funktionen wie folgt
Φ(t, t1, y) = Φ(t(L), t(L− 1),Φ(t(L− 1), t(L− 2),Φ(. . . ,Φ(t(1), t(0), x1) . . .).
18Dieselbe Aussage gilt zunachst fur ϕt1,x1 : (t1 − ε0; t1 + ε0) → Rn und daraus folgt obige Aussage nach
Verkleinerung von ε0 und W .19Der alternative Beweis erfordert im Beweis des Satzes von Picard-Lindelof etwas hoheren Abstraktions-
aufwand (Gleichmaßigkeit in weiteren Variablen, ist aber letztendlich effektiver gefuhrt. Der oben aufgefuhrte istanschaulicher, sobald man Picard-Lindelof als bewiesen akzeptiert.
6. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN 273
5. Picard-Lindelof fur gewohnliche Differentialgleichungen hoherer Ordnung
Wir schreiben wieder (a, b) fur das Intervall.
Aus dem Satz von Picard-Lindelof ergibt sich unmittelbar durch Nutzen der Reduktion auf Systemeerster Ordnung (Bemerkung 2.6 (1)):
SATZ 5.1. Gegeben sei eine explizite Differentialgleichung k-ter Ordnung
ϕ(k)(t) = f(t, ϕ(t), . . . , ϕk−1(t))
f : U → Rn stetig und lokal Orts-Lipschitz-stetig20, U ⊂ R×(Rn)k offen. Sei (t0, ϕ0, ϕ1, . . . , ϕk−1) ∈U , dann gibt es ein ε0 ∈ R>0, so dass es fur jedes ε ∈ (0, ε0] genau eine genau eine Losungϕ : (t0 − ε, t0 + ε)→ Rn mit ϕ(t0) = ϕ0, ϕ′(t0) = ϕ1, . . . und ϕ(k−1)(t0) = ϕk−1.
Wenn wir mit maximalen Intervallen arbeiten und Satz 4.14 anwenden, dann erhalten wir dieseVersion:
SATZ 5.2. Gegeben sei eine explizite Differentialgleichung k-ter Ordnung
ϕ(k)(t) = f(t, ϕ(t), . . . , ϕk−1(t))
f : U → Rn stetig und lokal Orts-Lipschitz-stetig21, U ⊂ R×(Rn)k offen. Sei (t0, ϕ0, ϕ1, . . . , ϕk−1) ∈U , dann gibt es genau eine auf einem maximalen Intervall definiert Losung ϕ mit ϕ(t0) = ϕ0,ϕ′(t0) = ϕ1, . . . und ϕ(k−1)(t0) = ϕk−1. Jede auf einem beliebigen Intervall definierte Losungerhalt man Restriktion aus der obigen.
6. Lineare gewohnliche Differentialgleichungen
Definition 6.1. Sei I ein offenes Intervall, n ∈ N. Gegeben seien stetige Abbildungen
A0, A1, . . . , Ak−1 : I → Rn×n
und b : I → Rn. Eine Gleichung der Form
(6.2) ϕ(k)(t) = Ak−1(t)ϕ(k−1)(t) + . . . A1(t)ϕ′(t) +A0(t)ϕ(t) + b(t)
nennt man eine explizite lineare gewohnliche Differentialgleichung k-ter Ordnung; und eine Losungist ein ϕ ∈ Ck(J,Rn), J ein offenes Intervall in I, so dass (6.2) fur alle t ∈ J gilt. Man nennt (6.2)homogen, falls b ≡ 0, sonst ist es inhomogen.
20Das heißt: Lipschitz-stetig in allen Komponenten (außer der t-Komponente), und die Lipschitz-Konstante
kann stetig in t gewahlt werden.21Das heißt: Lipschitz-stetig in allen Komponenten (außer der t-Komponente), und die Lipschitz-Konstante
kann stetig in t gewahlt werden.
274 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Reduktion auf Ordnung 1 (Wiederholung/Spezialfall)
Schreiben wir Φ(t) =
ϕ(t)ϕ′(t)
...ϕ(k−1)(t))
∈ Rnk.
Ist ϕ eine Losung von (6.2), so erfullt das oben definierte Φ die Gleichung
(6.3) Φ′(t) =
0 11n 0 · · · 00 0 11n · · · 0...
......
0 0 0 · · · 11nA0(t) A1(t) A2(t) · · · Ak−1(t)
Φ(t) +
00...0b(t)
.
Umgekehrt: ist Φ eine Losung von (6.3), dann bilden die ersten n-Komponenten von Φ eine Losungvon (6.2). Es reicht also, sich auf Gleichungen erster Ordnung einzuschranken.
Ab jetzt k = 1, d.h.
(6.4) ϕ′(t) = A(t)ϕ(t) + b(t) kurz: ϕ′ = Aϕ+ b
Das Wort”Losung“ benutzen wir in diesem Abschnitt immer im Sinn
”stetig differenzierbare
Losung“.
Zusatzlich zu den obigen Voraussetzungen seien von nun an A und b stetig.
SATZ 6.5. Sei J 6= ∅ ein offenes Teil-Intervall von I. Eine Losung ϕ : J → Rn lasst sich zu einerauf I definierten Losung fortsetzen.
Beweis spater.
Eine Moglichkeit, diesen Satz zu zeigen, ist, geeignete Abschatzungen zu machen und dann Pro-position 4.15 zu verwenden. Siehe zum Beispiel [23], Abschnitt 4.3 und die Vorarbeiten zuvor.
Wir wollen einen anderen Weg beschreiten und werden sehen, dass wir bald den Satz ohne Rechen-aufwand zeigen konnen. Unser Weg hat auch den Vorteil, dass wir dann nicht Zusatz 4.13 nutzen,dessen Beweis nur skizziert wurde.
Da wir in den folgenden Zeilen den Satz noch nicht nutzen konnen, mussen wir alle nun folgendenAussagen so formulieren, dass wir keine Probleme erhalten, falls eine Losung nicht auf ganz Idefinierbar sein sollte. Sobald dann aber Satz 6.5 gezeigt ist, konnen wir davon ausgehen, dassdann alle Losungen zu Losungen I → Rn erweitert werden konnen.
Die zu (6.4) gehorende homogene Differentialgeleichung ist:
(6.6) ϕ′(t) = A(t)ϕ(t)
LEMMA 6.7. Sei J ein offenes Teil-Intervall von I.
6. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN 275
(1) Sei ϕ eine auf J definierte Losungen der inhomogenen Gleichung (6.4). Dann gilt
ϕ ist eine auf J definierte Losung der homogenen Gleichung (6.6)
⇐⇒ ϕ+ ϕ ist eine auf J definierte Losung der inhomogenen Gleichung (6.4)
(2) Die auf J definierten Losungen von (6.6) bilden einen Untervektorraum von C1(J,Rn). Wirnennen ihn LJ .
Beweis. Nachrechnen.
LEMMA 6.8. Zu jedem t0 ∈ I gibt es ein ε > 0, so dass gilt: zu jedem v ∈ Rn existiert genau eineauf (t0 − ε, t0 + ε) definierte Losung ϕ von (6.4) mit ϕ(t0) = v.
Beweis. Die Funktion f(t, y) := A(t)y + b(t) ist Orts-Lipschitz-stetig. Nach dem Satz 4.3 vonPicard-Lindelof gibt es Zahlen ε > 0, ε1 > 0,. . . , εn > 0 und folgende Losungen:
• Eine C1-Funktion ϕ : (t0 − ε, t0 + ε)→ Rn mit ϕ′ = Aϕ+ b, ϕ(t0) = 0.• Fur i ∈ {1, . . . , n}: C1-Funktionen ϕi : (t0 − εi, t0 + εi)→ Rn mit ϕ′i = Aϕi, ϕi(t0) = ei.
Setze nun ε := min{ε, ε1, . . . , εn} > 0.
Zu jedem v = (v1, . . . , vn)T ∈ Rn ist
ϕ := ϕ+
n∑i=1
viϕi
eine auf (t0 − ε, t0 + ε) definierte Losung von
ϕ′ = Aϕ+ b, ϕ(t0) = v.
nach der Eindeutigkeitsaussage im Satz 4.3 von Picard-Lindelof ist dies die einzige Losung.
Insbesondere ist die Auswertungsabbildung
ιt0 : L(t0−ε,t0+ε) → Rn, ϕ 7→ ϕ(t0)
ein Isomorphismus (von Vektorraumen) und
dimL(t0−ε,t0+ε) = n.
Sind J1, J2 Intervalle mit ∅ 6= J1 ⊂ J2 ⊂ I, dann ist wegen der Eindeutigkeitsaussage im Satz 4.3von Picard-Lindelof (bzw. der daraus gefolgerten Aussage Satz 4.14 (2)) die Restriktionsabbildung
LJ2 → LJ1 , ϕ 7→ ϕ|J1injektiv.22 Also
(6.9) dimLJ2 ≤ dimLJ1 ≤ n.
Beweis von Satz 6.5. Sei ϕ : (t1, t2)→ Rn eine Losung von (6.4), (t1, t2) ⊂ I.
22Sobald der Satz gezeigt ist, steht hier uberall”=“.
276 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Im Fall t2 ∈ I, werden wir zeigen, dass sich die Losung auf ein großeres offenes Intervall fortsetzt,das t2 enthalt. Analoges gilt fur t1 ∈ I. Wenn also (t1, t2) das maximale Losungs-Intervall ist, somuss (t1, t2) = I gelten.
Sei also t2 ∈ I. Bestimme ε > 0 und ϕ wie im Beweis des letzten Lemmas fur t0 := t2. Dann ist
ϕ|(t2−ε,t2) − ϕ|(t2−ε,t2) ∈ L(t2−ε,t2).
Wegen den obigen Uberlegungen (6.9) gilt
n = dimL(t2−ε,t2+ε) ≤ dimL(t2−ε,t2) ≤ n.Also gilt uberall
”=“ und die Restriktion L(t2−ε,t2+ε) → L(t2−ε,t2) ist surjektiv. Es gibt also ein
ψ ∈ L(t2−ε,t2+ε), mit
ψ|(t2−ε,t2) = ϕ|(t2−ε,t2) − ϕ|(t2−ε,t2).
Somit ist
ϕ(t) :=
{ϕ(t) t ∈ (t1, t2)
ϕ(t) + ψ(t) t ∈ [t2, t2 + ε)
eine stetig differenzierbare Losung von ϕ′ = Aϕ + b, die auf (t1, t2 + ε) definiert ist. Nach denAusfuhrungen zu Beginn des Beweises folgt daraus der Satz.
FOLGERUNG 6.10.
{Auf I definierte Losungen von ϕ′ = Aϕ+ b} → Rn, ϕ 7→ ϕ(t0)
ist bijektiv und dimLI = n.
FOLGERUNG 6.11. Gegeben seien ϕ1, . . . , ϕn ∈ LI , t0 ∈ I. Dann gilt
(ϕ1, . . . , ϕn) ist Basis von LI ⇐⇒ det(ϕ1(t0), . . . , ϕn(t0)) 6= 0.
Diese Determinante nennt man Wronski-Determinante. Sie ist hilfreich, um zu prufen, ob manschon alle Losungen der homogenen DGl gefunden hat.
Falls es eine Basis ist, so nennt man Φ = (ϕ1, . . . , ϕn) : I → Rn×n eine Fundamentallosung vonϕ′ = Aϕ.
Losungs-Strategie zur Losung von (6.4)1.) Bestimme die Menge aller Losungen der homogenen DGl.2.) Dann finde eine Losung der inhomogenen DGl.Mit Hilfe von Lemma 6.7 erhalten wir dann alle Losungen der inhomogenen DGl.
Wie erhalt man alle Losungen der homogenen DGl?n = 1: 23 Losungen von ϕ′ = Aϕ verschwinden entweder nie oder uberall (Eindeutigkeit in Picard-Fr 12.7.
Lindelof), o.B.d.A. sei ϕ(t) 6= 0 ∀t.
23Dies ist ein Spezialfall der Methode “getrennte Variable”, siehe Abschnitt 8.
6. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN 277
ϕ′ = Aϕ ⇐⇒ ϕ′
ϕ= A
⇐⇒ d
dtlog |ϕ(t)| = A(t)
ϕ(t) = C exp
(∫ t
t0
A(τ) dτ
).
Alle Losungen sind von dieser Form mit C ∈ R.
n > 1: im allgemeinen haufig schwer losbar.
Spezialfall: A konstant. O.B.d.A. I = R.
Dann ist die Menge der Losungen ϕ′ = Aϕ
{t 7→ ϕ(t) = exp(At)ϕ0 | ϕ0 ∈ Rn}
Hierbei ist
exp(At) :=
∞∑j=0
1
j!Ajtj ∈ Rn×n.
Diese Reihe konvergiert absolut: wir rechnen ‖AB‖∞ ≤ n‖A‖∞‖B‖∞, ‖Aj‖∞ ≤ nj−1‖A‖j∞∥∥∥∥ 1
j!Ajtj
∥∥∥∥∞≤ 1
j!nj−1‖A‖j∞|t|j := aj
ajaj−1
=n
j‖A‖∞|t| → 0.
d
dtexp(tA) = A exp(tA) = exp(tA)A .
exp(0 ·A) = exp(0n) = 11n .
Φ(t) := exp(At) ist eine Fundamentallosung.
Wir werden dies im nachsten Abschnitt nochmals betrachten.
Wie erhalt man eine Losung der inhomogenen DGl?
PROPOSITION 6.12 (Variation der Konstanten). A ∈ C0(I,Rn×n), b ∈ C0(I,Rn), t0 ∈ I. SeiΦ : I → Rn×n eine Fundamentallosung von ϕ′(t) = A(t)ϕ(t). Dann ist
t 7→ Φ(t)
∫ t
t0
Φ(τ)−1b(τ) dτ
eine Losung von ϕ′(t) = A(t)ϕ(t) + b(t).
278 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Beweis.
d
dt
(Φ(t)
∫ t
t0
Φ(τ)−1b(τ) dτ
)= Φ′(t)
∫ t
t0
Φ(τ)−1b(τ) dτ + Φ(t)Φ(t)−1b(t)
= A(t)Φ(t)
∫ t
t0
Φ(τ)−1b(τ) dτ + b(t)
= A(t)
(Φ(t)
∫ t
t0
Φ(τ)−1b(τ) dτ
)+ b(t)
7. Lineare gewohnliche Differentialgleichungen mit konstanten Koeffizienten
!ACHTUNG!. Dieser Abschnitt ist noch nicht in latex aufgeschrieben und es ist unklar, ob undgegebenenfalls wann dies getan wird. Bitte benutzen Sie Ihre Vorlesungsmitschrift der Vorlesungvom 12.7..
Beispiele 7.1.
(1) Phasenportrait von ϕ′(t) =
(−2 00 −1
)ϕ(t).
Losungen: ϕ(t) =
(e−2t 0
0 e−t
)ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
(2) Phasenportrait von ϕ′(t) =
(1 00 1
)ϕ(t).
Losungen: ϕ(t) =
(et 00 et
)ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
(3) Phasenportrait von ϕ′(t) =
(−2 00 1
)ϕ(t).
Losungen: ϕ(t) =
(e−2t 0
0 et
)ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
(4) Phasenportrait von ϕ′(t) =
(0 1−1 0
)ϕ(t).
Losungen: ϕ(t) =
(cos t sin t− sin t cos t
)ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
8. DIFFERENTIALGLEICHUNGEN MIT GETRENNTEN VARIABLEN 279
(5) Phasenportrait von ϕ′(t) =
(0 10 0
)ϕ(t).
Losungen: ϕ(t) =
(1 t0 1
)ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
8. Differentialgleichungen mit getrennten VariablenMi 24.7.
Definition 8.1. Gegeben seien offene Intervalle I und J , und g : I → R und h : J → R stetig.Eine Differentialgleichung der Form
ϕ′(t) = g(t)h(ϕ(t))
nennt man eine gewohnliche Differentialgleichung mit getrennten Variablen24. Kurzschreibweise
(8.2) ϕ′ = g(t)h(ϕ).
Der Satz 4.3 von Picard-Lindelof ist nicht anwendbar, da
f(t, x) = g(t)h(x)
im allgemeinen25 nicht Orts-Lipschitz-stetig ist.
Schmutzige Rechnung (streng mathematisch nicht gerechtfertigt, aber in der Praxis oft erfolgreich)
dϕ
dt= g(t)h(ϕ)
⇐⇒ dϕ
h(ϕ)= g(t) dt
⇐⇒∫
dϕ
h(ϕ)= c+
∫g(t) dt
Ist nun H eine Stammfunktion von 1/h und G eine Stammfunktion von g, dann sollte es eineKonstante c ∈ R geben mit
H(ϕ(t)) = c+G(t),
also ϕ(t) = H−1(c+G(t)).
Bestimme nun c so, dass Anfangsdaten erfullt sind.
Jetzt eine exakte Herleitung:
24oder auch”mit getrennten Veranderlichen“, da eine Variable dasselbe wie eine Veranderliche ist.
25”im allgemeinen“ heißt hier: es gibt Funktionen g und h, so dass dies nicht erfullt ist. Beispiel g(t) = 1,
h(x) = 3√x.
280 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
SATZ 8.3 (Trennung der Variablen). Gegeben sei eine gewohnliche Differentialgleichung mit ge-trennten Variablen wie in Definition 8.1, h(x) 6= 0 auf J . Sei t0 ∈ I, x0 ∈ J . Die Stammfunktionvon t 7→ g(t) sei G : I → R und die von x 7→ 1/h(x) sei H : J → R. Dann gibt es bis aufRestriktion genau eine stetig differenzierbare Losung von
ϕ′(t) = g(t)h(ϕ(t)
)ϕ(t0) = x0,
die auf einer offenen Umgebung von t0 definiert ist, namlich
(8.4) ϕ(t) = H−1(G(t) +H(x0)−G(t0)).
Beweis. Offensichtlich ist t 7→ 1/h(x) stetig. Also existiert H, ist stetig differenzierbar und mo-noton. Wir wenden Proposition 1.6 aus Kapitel 5 auf die Funktion H : J → R an und erhaltenwegen H ′(t) = 1/h(t) 6= 0:
• K := H(J) ist ein offenes Intervall,• H−1 : K → J existiert,
• H−1 ist differenzierbar mit(H−1
)′(s) = 1/(1/h(H−1(s))) = h(H−1(s)).
Also auch H−1 ∈ C1(K). Wegen G ∈ C1(I,R) ist die in Gleichung (8.4) definierte Funktion ϕ aufder offenen Menge
{t ∈ I | G(t) +H(x0)−G(t0) ∈ K} 3 t0in C1. Man rechnet leicht nach, dass ϕ eine Losung von (8.2) mit ϕ(t0) = x0 ist.
Nehmen wir, dass ϕ eine Losung von (8.2) mit ϕ(t0) = x0 ist. Dann gilt
g(t) =ϕ′(t)
h(ϕ(t))=
d
dt(H(ϕ(t)) ,
also ist G(t)−H(ϕ(t)) eine Konstante, namlich G(t0)−H(x0). Und dies ergibt (8.4).
Beispiel 8.5. g : R→ R, g(t) = 1. h : Rr {0} → R, h(x) = −x2 6= 0. Die Differentialgleichung
ϕ′(t) = −ϕ(t)2
besitzt unter anderem die Losung ϕ ≡ 0. Jede andere Losung wird nie Null (Eindeutigkeit inPicard-Lindelof). Im Fall ϕ 6≡ 0 konnen wir umformulieren in
− ϕ′(t)
ϕ(t)2= 1
⇐⇒ d
dt
1
ϕ(t)= 1
⇐⇒ 1
ϕ(t)= t+ c
⇐⇒ ϕ(t) =1
t+ c
9. MEHR ZUM FLUSS EINES ZEITABHANGIGEN VEKTORFELDS 281
Beim Anfangswert ϕ(0) = α < 0 bekommen wir c = 1/α und das maximale Losungs-Intervallist (−∞, 1/|α|). Die Losung hort also bei 1/|α| auf zu existieren. Wir haben gesehen, dass diesesPhanomen bei den linearen Gleichungen nie auftreten kann.
Beispiel 8.6. ϕ′(t) = A(t)ϕ(t). NICHT GETIPPT...
Beispiel 8.7. ϕ′(t) = π( 12 t
3 + 14 t)(4 + ϕ(t)2). NICHT GETIPPT...
9. Mehr zum Fluss eines zeitabhangigen Vektorfelds
Sei wieder U ⊂ R× Rn eine offene Teilmenge und f : U → Rn Orts-Lipschitz-stetig und stetig.
Wir definieren jetztD ⊂ R× R× Rn
durch (t, s, y) ∈ D ⇐⇒ (s, y) ∈ U und es existiert eine Losung ϕs,y : I → Rn von
(9.1) ϕ′(t) = f(t, ϕ(t))
mit ϕs,y(s) = y und t ∈ I.26 Es folgt aus Zusatz 4.13:
{(t, t, y) | (t, y) ∈ U} ⊂◦D
Wir sehen spater, dass D offen in R× R× Rn ist, also◦D = D.
Wir definieren nun den Fluss Φ von f wie folgt:
Φ : D → Rn, Φ(t, s, y) := ϕs,y(t).
Dann gilt offensichtlichΦ(t, t, y) = y.
LEMMA 9.2.(t, s, y) ∈ D ⇐⇒ (s, t,Φ(t, s, y)) ∈ D
undΦ(s, t,Φ(t, s, y)) = y.
Beweis. Nach Definition von Φ gilt Φ(t, s, y) = ϕs,y(t). Daraus folgt
ϕs,y ≡ ϕt,Φ(t,s,y).
Wir erhalten dann an der Stelle s
y = ϕs,y(s) = ϕt,Φ(t,s,y)(s) = Φ(s, t,Φ(t, s, y)).
So ahnlich zeigt manΦ(r, t,Φ(t, s, y)) = Φ(r, s, y),
26In anderen Worten t liegt im zugehorigen maximalen Definitionsbereich.
282 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
falls alle Ausdrucke wohldefiniert sind.Begrundung:
Φ(r, s, y) = ϕs, y(r) = ϕt,Φ(t,s,y)(r) = Φ(r, t,Φ(t, s, y)) .
LEMMA 9.3. D ist offen.
Beweisskizze. 27 Sei (t, s, y) ∈ D. Wir wollen eine offene Umgebung von (t, s, y) konstruieren, die inD enthalten ist. O.B.d.A. t ≥ s. Wahle zu jedem τ ∈ [s; t] ein ε(τ) > 0 mit Bε(τ)((τ, τ,Φ(τ, s, y)) ⊂D. Dies liefert eine offene Uberdeckung ((τ − ε(τ); τ + ε(τ))τ∈[s;t] von [s; t]. Wahle mit Proposi-
tion 6.17 aus Kapitel 8 zu dieser Uberdeckung eine Lebesguesche Zahl ε > 0, und ein m ∈ N,m > 1/ε. Wir definieren
ti := s+i
m(t− s).
Wir schreiben ϕ1(s, y) := Φ(t1, s, y)
ϕi(y) := Φ(ti, ti−1, y) 2 ≤ i ≤ m− 1
ϕm(t, y) := Φ(t, tm−1, y)
Wir konnen nun schreiben:
Φ(t, s, y) = Φ(t, tm−1,Φ(tm−1, tm−2,Φ(. . .Φ(t1, s, y)
= ϕm(t, ϕm−1(ϕm−2(. . . ϕ2(ϕ1(s, y)) . . .)))
Wir betrachten beide Seiten der Gleichung als Funktion in t, s und y, also (t, s, y) 7→ Rn. Diesist eine
”Verkettung“ von stetigen Funktionen, wobei die Funktionen nicht uberall definiert sind.
Ist (t, s, y) im Definitionsbereich der Verkettung, dann auch in D. Im folgenden sei D(h) derDefinitionsbereich einer Funktion h. Der Definitionsbereich der Verkettung (s, y) 7→ ϕ2(ϕ1(s, y))ist
D(ϕ1) ∩(ϕ1
)−1(D(ϕ2)
),
also der Schnitt zweier offener Menge und somit wieder offen. Man zeigt dann induktiv, dass derDefinitionsbereich der Verkettung
(s, y) 7→ ϕm−1(ϕm−2(. . . ϕ2(ϕ1(s, y)) . . .)))
die Menge
V := D(ϕ1) ∩ (ϕ1)−1(D(ϕ2)
)∩ (ϕ2 ◦ ϕ1)−1
(D(ϕ3)
)∩ · · · (ϕm−2 ◦ · · · ◦ ϕ2 ◦ ϕ1)−1
(D(ϕm−1)
),
ist; und diese Menge ist als Schnitt offener Mengen ebenfalls offen. Der Definitionsbereich derVerkettung
(t, s, y) 7→ ϕm(t, ϕm−1(ϕm−2(. . . ϕ2(ϕ1(s, y)) . . .)))
27Diese Beweisskizze wurde in der Vorlesung aus Zeitgrunden ubersprungen.
10. EINIGE KOMMENTARE ZUM LANGZEITVERHALTEN VON GEW. DIFFIFFERENTIALGLEICHUNGEN283
ist dann(R× V ) ∩
(idR × (ϕm−1 ◦ · · · ◦ ϕ2 ◦ ϕ1)
)−1D(ϕm),
also auch offen.
PROPOSITION 9.4. Der Fluss Φ : D → Rn ist stetig.
Beweisskizze. Wegen Satz 4.20 wissen wir bereits, zu jedem (τ, y) ∈ U gibt es eine UmgebungW von (τ, y) in U und ein ε0 > 0, so dass Φ auf (τ − ε0; τ + ε0) ×W stetig ist. Man beachten
ε0 = ε0(τ, ε) hangt von τ und ε ab. Zu der Uberdeckung(
(τ − ε0; τ + ε0))τ∈[t;s]
von [t; s] wahle
eine Lebesguesche Zahl ε > 0, dann m > 1/ε. Der restliche Beweis geht ahnlich, wie der Beweis derOffenheit von D: wir schreiben lokal Φ als Verkettung vieler Abbildungen, bei denen wir bereitsdie Stetigkeit wissen.
ZUSATZ 9.5. Ist f ∈ Ck(U,Rn), dann ist auch Φ ∈ Ck(D,Rn).
Anschaulich: ist f ∈ Ck, dann ist die Losung ϕt0,x0(t) ist nicht nur Ck in t sondern auch Ck in t0und x0.28
Beweis. Dies zeigt man induktiv uber k, indem man ahnlich wie in Bemerkung 4.16 argumentiert.
KOROLLAR 9.6. Autonomer Fall: Sei U offen in Rn, f : U → Rn, ϕ′(t) = f(ϕ(t)) und Φ :D → Rn der zugehorige Fluss. Wir sagen f ist ein vollstandiges Vektorfeld, falls D = R×R×U .Dann ist Φ(t, s, y) = Φ(t + c, s + c, y) und Φ(t, s, · ) : U → U ist ein Homoomorphismus. (DennΦ(s, t, · ) : U → U ist die (stetige) Umkehrfunktion.)
Leicht zu prufen.
10. Einige Kommentare zum Langzeitverhalten von gew. DiffifferentialgleichungenFr. 26.7.
Wir haben mit dem Satz von Picard-Lindelof gesehen, dass wir fur kurze Zeiten Existenz undEindeutigkeit von Losungen von gewohnlichen Differentialgleichungen mit gegebenen Anfangswer-ten haben, vorausgesetzt, dass die Differentialgleichung in expliziter Form ist und die Gleichungstetig differenzierbar von den niedrigeren Ableitungen und der Zeit t abhangen. Gleiches gilt dannnaturlich auch fur die zugehorigen Flusse.
Man interessiert sich nun aber auch fur das langfristige Verhalten der Losungen und der zugehorigenFlusse. Wir haben bereits in Proposition 4.15 einige Ergebnisse zur Frage erhalten, wie langeLosungen existieren. Wir betrachten nun den Fall, dass Losungen ϕ fur alle zukunftigen bzw. allevergangenen Zeiten existieren, d.h. tmax = +∞ oder tmin = −∞. Wir betrachten der Einfachheithalber nur den autonomen, das heißt nicht explizit zeitabhangigen Fall.
28Aber die Formulierung im Zusatz ist noch etwas starker!
284 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Falls dann ϕ(t) fur t → ±∞ gegen ein x±∞ konvergiert, und dieses29 im Definitionsbereich dergewohnlichen Differentialgleichung liegt, so ist existiert eine konstante Losung ϕ±(t) := x±∞.Dieser Fall wird im Rahmen der Stabilitatstheorie untersucht, uber die wir im folgenden Abschnitteinen kleinen Uberblick geben wollen.
Es kann aber auch vorkommen, dass ϕ periodisch ist, das heißt, es gibt ein kleinstes L > 0, diePeriode, mit ϕ(L + t) = ϕ(t) fur alle t. Man fragt sich dann, ob Losung in der Nahe ebenfallsperiodisch sind. Andere Verhalten sind ebenfalls moglich, z.B. “quasiperiodisches Verhalten” oder“ergodisches Verhalten”, wobei man fur letzteres manchmal auch das aufreißerischer klingendeWort “chaotisches Verhalten” nutzt. Die mathematischen Gebiete, die sich damit beschafitgennennen sich dann je nach Ausrichtung “dynamische Systeme”, “Chaos-Theorie”, “Ergodentheorie”,. . . .
Eine reiche Quelle wichtiger und interessanter gewohnlicher Differentialgleichungen ist die klassi-sche Physik, hier insbesondere die Hamiltonsche Mechanik, die letztendlich auch die Himmelsme-chanik umfasst. Wir wollen mal ein Beispiel geben, um anzudeuten, welche Art von Resultatenhier erwartet werden konnen.
Wenn man zum Beispiel das langfristige Verhalten unseres Sonnensystems betrachtet und dieEntstehung des Lebens, die ja letztendlich einen uber astronomische Zeitraume hinweg relativkonstanten Abstand zur Sonne benotigt, so erscheint es unabdingbar zu fordern, dass sich allePlaneten nahezu periodisch um die Sonne bewegen. Dieses Verhalten kann auch relativ leichtmathematisch hergeleitet werden, wenn nur ein Planet um die Sonne kreisen wurde (Zwei-Korper-Problem). Es ist auch einfach zu zeigen, wenn man zwei Naherungen annimmt: zum einen nimmtman an, dass die Sonne auf grund der großen Masse sich nicht mehr bewegt und und zum anderen,dass sich die Planeten gegenseitig nicht anziehen. Wenn man diese Naherungen annimmt, dannhat man viele Erhaltungsgroßen, so dass man schließlich die Bewegung sehr gut beschreiben kann;man hat ein sogenanntes vollstandig integrables dynamisches System. Die Losungen solcher Systemesind immer quasiperiodisch (sie sind nur dann periodisch, wenn die Verhaltnisse der Umlaufzeitender Planeten rationale Zahlen sind, sonst sind sie eben fast periodisch, was mit quasiperdidischbezeichnet wird).
Diese beiden Naherungen sind aber leider in astronomischen Zeitskalen nicht mehr angebracht. Eshandelt sich also um eine Storung eines vollstandig integrablen Systems. Der Satz von Kolgomo-row, Arnold und Moser aus den Jahren 1954-1963 besagt, dass fast alle Losungen von derartigenStorungen von vollstandig integrablen Systemen ebenfalls quasiperiodisch sind, vorausgesetzt, dieStorungen sind nicht zu groß. Siehe zum Beispiel unter diesem Link fur weitere Informationen:
https://de.wikipedia.org/wiki/Kolmogorow-Arnold-Moser-Theorem.
All diese Satze werden wir aber leider im Rahmen des Analysis-Zyklus aus Zeitgrunden nicht weiterbehandeln konnen.
29Bei Differentialgleichungen ϕ(k)(t) = f(ϕ(t), . . . , ϕ(k−1)(t) der Ordnung k muss man hier naturlich uber-
prufen, ob (x±∞, 0, . . . , 0) = lim(ϕ(t), ϕ′(t), . . . ϕ(k−1)(t)) im Definitionsbereich der Funktion f liegt.
11. STABILITAT UND VERHALTEN IN DER NAHE VON KRITISCHEN PUNKTEN 285
11. Stabilitat und Verhalten in der Nahe von kritischen Punkten
In diesem Abschnitt wollen wir auf einige Beweise verzichten. In der Darstellung halten wir unseng an [23], Abschnitt 4.5 und an [35], Kapitel VII. In diesen beiden Buchern findet man auch diefehlenden Beweise.
Im ganzen Abschnitt sei U eine offene Teilmenge von Rn und v : U → Rn ein stetig differenzierbaresVektorfeld.
Definition 11.1. x0 ∈ U heißt kritischer Punkt von v, falls v(x0) = 0. Einen kritischen Punktx0 nennen wir stabil , falls fur jede Umgebung V ⊂ U von x0 eine offene Umgebung W ⊂ V vonx0 gibt, so dass jede Integralkurve ϕ von v mit ϕ(0) ∈ W auf [0,∞) definiert werden kann, undso dass ϕ([0,∞)) ⊂ V . Ein kritischer Punkt x0 wird Attraktor genannt, falls er stabil ist und fallsdas obige W so gewahlt werden kann, dass fur alle Integralkurven ϕ von v mit ϕ(0) ∈ W giltlimt→∞ ϕ(t) = x0.
30
Beispiele 11.2. Wir setzen die Beispiele 7.1 fort.
(1) In diesem Beispiel ist 0 ein Attraktor zum Vektorfeld
v : x 7→(−2 00 −1
)x
0 ist kein stabiler Punkt zum Vektorfeld −v.(2) In diesem Beispiel ist 0 kein stabiler Punkt zum Vektorfeld
v : x 7→(
1 00 1
)x
0 ist Attraktor zum Vektorfeld −v.(3) In diesem Beispiel ist 0 kein stabiler Punkt zum Vektorfeld
v : x 7→(−2 00 1
)x
0 ist auch kein stabiler Punkt zum Vektorfeld −v.(4) In diesem Beispiel ist 0 stabiler Punkt zum Vektorfeld
v : x 7→(
0 1−1 0
)x
0 ist auch stabiler Punkt zum Vektorfeld −v. Aber weder Attraktor zu v noch Attraktor zu−v.
30Man beachte, dass die hier verwendete Definition nicht ganz mit der in [23] verwendeten ubereinstimmt.
Wir haben Stabilitat in die Definition des Attraktors hineingenommen, und sind damit in Ubereinstimmung mitdem Großteil der fortgeschrittenen Literatur in diesem Gebiet. Der unten zitierte Beweis des Satzes von Poincare-
Ljapunow in [23] zeigt aber sogar unsere (starkere) Version des Attraktors.
286 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
(5) In diesem Beispiel ist 0 weder stabiler Punkt zum Vektorfeld
v : x 7→(
0 10 0
)x
noch ein stabiler Punkt zum Vektorfeld −v.
Allgemein gilt fur v(x) := Ax: 0 ist Attraktor, genau dann, wenn jeder Eigenwert von A einennegativen Realteil hat. 31
Beispiel 11.3. (aus [23])Sei v : R → R, v(x) = −xk, k ∈ N r {0}. Der einzige kritische Punkt ist 0. Mit Trennung derVariablen sieht man, dass ϕ′ = v(ϕ) fur ϕ 6= 0 aquivalent zu
d
dt
1
(k − 1)ϕ(t)k−1= 1
ist, falls k > 1. Fur k = 1 ahnlich mit Logarithmus. Mit Standard-Umformungen erhalt man mitAnfangswert ϕ(0) = x1
ϕ(t) =
{x1e−t k = 1
x1k−1√
1+(k−1)xk−11 t)
k > 1
Fur x1 > 0 oder k ungerade, existiert die Losung fur alle t ∈ [0,∞) und sie konvergiert gegen 0.Fur k gerade und x1 < 0 existiert die Losung nur endlich lange. Deswegen ist 0 ein Attraktor, fallsk ungerade, und 0 ist nicht einmal stabil, falls k gerade ist.
Ein passendes Bild
Definition 11.4. Die Linearisierung von v in x0 ∈ U ist die Abbildung Dx0v : Rn → Rn,x 7→ v′(x0)x.
Idee der folgenden Resultate: die Flusslinien (= Integralkurven) des Vektorfelds v sehen”ahnlich“
aus wie wie Flusslinien der Linearisierung. Das Phasenportrait in einer kleinen Umgebung deskritischen Punkt ist eine
”verbogene“ Version des Phasenportraits der Linearisierung.
THEOREM 11.5 (Poincare-Ljapunow). Sei x0 ein kritischer Punkt von des C1-Vektorfelds v :U → Rn. Fur jeden komplexen Eigenwert λ der Matrix v′(x0) gelte Re λ < 0. Dann ist x0 einAttraktor.
Beweis. Siehe [23], Abschnitt 4.5.
Definition 11.6. Eine Ljapunow-Funktion zum C1-Vektorfeld v : U → Rn und zum kritischenPunkt x0 ist eine C1-Funktion L : U → R, so dass 32
31Hier ware eigentlich ein Beweis notig, zu dem wir keine Zeit mehr haben: Falls A diagonalisierbar ist, dann ist
jede Losung eine Linearkombination von Losungen der Form etλ0ϕ0, mit Aϕ=λ0ϕ0. Wenn A nicht diagonalisierbarist, ist die Argumentation ahnlich.
32Im folgenden ist ∂x,vf wieder die Richtungsableitung von f im Punkt x in Richtung v.
11. STABILITAT UND VERHALTEN IN DER NAHE VON KRITISCHEN PUNKTEN 287
• L(x0) = 0• L(x) > 0, falls x ∈ U r {x0}• Fur alle x ∈ U gilt: ∂x,v(x)L ≤ 0. Oder es gilt fur alle x ∈ U : ∂x,v(x)L ≥ 0
Beispiel: Ist E eine Erhaltungsgroße, die in x0 ein absolutes Minimum hat, so ist E − E(x0) eineLjapunow-Funktion.
Konsequenz: Ist ϕ eine Flusslinie von v, dann gilt
d
dtL(ϕ(t)) = L′(ϕ(t))ϕ′(t) = ∂ϕ(t),v(ϕ(t))L ≤ 0 bzw. ≥ 0
THEOREM 11.7 (Ljapunow). Sei v, x0 und L wie oben.
(a) Falls ∀x ∈ U : ∂x,v(x)L ≤ 0, dann ist x0 ein stabiler Punkt.(b) Falls ∀x ∈ U r {x0} : ∂x,v(x)L < 0, dann ist x0 ein Attraktor(c) Falls ∀x ∈ U r {x0} : ∂x,v(x)L > 0, dann ist x0 kein stabiler Punkt.
Beweis. Siehe [23], Abschnitt 4.5.
Beispiel 11.8. Die Lienardsche Gleichung, siehe [23], Ende Abschnitt 4.5.
THEOREM 11.9 (Linearisierungssatz von Grobman und Hartman, 1959–1960). Sei x0 ein kri-tischer Punkt eines stetig differenzierbaren Vektorfelds v : U → Rn. Wir nehmen an, dass furjeden Eigenwert λ von v′(x0) gilt: Reλ 6= 0. Sei Dx0
v : Rn → Rn die Linearisierung von v in x0.Dann gibt es eine offene Umgebung V von x0 in U , eine offene Umgebung W von 0 und einenHomoomorphismus h : V →W , h(x0) = 0, so dass gilt
ϕ : (a, b)→ V ist Flusslinie zu v
⇐⇒ h ◦ ϕ : (a, b)→W ist Flusslinie zu Dx0v
Der Homoomorphismus h bildet Flusslinien auf Flusslinien ab. Die Flusslinien der Linearisierungsind die Abbildungen t 7→ eAtϕ0 mit ϕ0 ∈ Rn, A := v′(x0).
Wir bekommen alsoϕ(t) = h−1(eAth(ϕ(0)))
vorausgesetzt wir sind”nahe genug“ bei x0.
Wenn man das Theorem von Grobman und Hartman liest, so stellt sich die Frage, ob man nichtdas Wort
”Homoomorphismus“ durch
”Ck-Diffeomorphismus“ ersetzen kann, sobald v genugend
oft differenzierbar ist.
Man kann zeigen (siehe Abschnitt 2.9 von [28] fur mehr Details):
• Ist v ∈ C2, so gibt es einen C1-Diffeomorphismus h mit den obigen Eigenschaften.• Es gibt Vektorfelder v ∈ C∞, fur die es keinen C2-Diffeomorphismus h mit den obigen
Eigenschaften gibt
ANHANG A
Mehr Details zu den Grundlagen der Logik
1. Das Russellsche Paradoxon
(Auch Russellsche Antinomie genannt. Vorlaufer sind die Cantorsche Antinomie und das Burali-Forti-Paradoxon, siehe Wikipedia.)
Am Anfang der Vorlesung haben wir gesagt, dass unser Ziel ist, eine axiomatisch aufgebauteMathematik zu erhalten. Diesem Anspruch sind wir bisher nicht gerecht geworden. Immer wiederwurde die Intuition genutzt, um Objekte zu definieren, anstatt wirklich saubere mathematischeDefinitionen hinzuschreiben. Das Vorgehen war bis weit ins 19. Jahrhundert ganz ahnlich. Dasintuitive Verwenden des Mengenbegriffs fuhrte dann aber zu dem Russellschen Paradoxon.
Frage 1.1. Gibt es die Menge aller Mengen?
Stand der Mathematik gegen Ende des 19. Jahrhunderts: Nach Cantors Beschreibung (Beschrei-bung 3.1) sollte es die Menge M aller Mengen geben. Das Elementzeichen ∈ ist dann eine aufE ×M definierte Aussageform, wobei E die Menge aller Elemente irgendeiner Menge bezeichne,also E =
⋃M.
E ×M −→ {w, f}(x,M) 7→ x ∈M
Russell bildete nun daraus
N := {x ∈M | x 6∈ x}.
Gilt nun N ∈ N ? Fur alle Mengen x gilt
x ∈ N ⇐⇒ x 6∈ x
und wenn wir x := N setzen, so erhalten wir
N ∈ N ⇐⇒ N 6∈ N .
Aussagen in der Form A↔ ¬A sind aber immer falsch, also haben wir einen Widerspruch erhalten.
289
290 A. MEHR DETAILS ZU DEN GRUNDLAGEN DER LOGIK
Um die Mengenlehre und somit die Mathematik sauber auf Axiomen aufzubauen, mussen wir alsoviel genauer als bisher vorgehen und intuitive Argumente durch formal korrekte Beweise ersetzen.
Wie lost man dieses Paradoxon auf: Nicht jede”Zusammenfassung von bestimmten wohlunterschie-
denen Objekten“ ist eine Menge. Die Axiome sollen regeln, wann solche eine Zusammenfassung eineMenge ist. Insbesondere ist die
”Zusammenfassung“ M aller Mengen selbst keine Menge, sondern
etwas großeres, das wir Klasse nennen wollen. Analog sind auch N und E keine Mengen, sondernKlassen.
2. Axiomatische Mengenlehre
Wir wollen nun skizzieren, wie man die Mengenlehre sauber auf Axiomen aufbauen kann. Mannimmt hierzu mehrere Axiomen an, all diese Axiome zusammen nennt man dann ein Axiomen-System. Historisch sind hier wichtige Fortschritte zu Ende zu 19. Jahrhunderts und zu Beginndes 20. Jahrhunderts gemacht worden. Nun haben verschiedene Mathematiker verschiedene Axio-mensysteme entwickelt und benutzt. Das wohl bekannteste Axiomensystem heißt ZFC nach denMathematikern Zermelo und Fraenkel und C fur
”Axiom of Choice“ (= Auswahlaxiom). Wir stel-
len ein anderes vor (NBG), das sehr ahnliche Eigenschaften hat. Man kann zeigen, dass man mitZFC und NBG dieselben Satze uber Mengen herleiten kann. Die Axiome von ZFC machen oftrein mengentheoretische Argumente einfacher, wahrend die Axiome von NBG fur das praktischeArbeiten oft besser geeignet sind.
Grundlegende Ideen:
• Man will gar nicht mehr erklaren, was eine Menge ist, sondern fordert axiomatischeEigenschaften fur Mengen.• Man nimmt an, dass auch alle Elemente von Mengen ebenfalls Mengen sind. In anderen
Worten: jede Menge ist ein Mengensystem uber einer geeigneten Menge. In der Notationdes letzten Abschnitts gilt also nun M = E . Die Zusammenfassung aller RegensburgerAutos ist dann keine Menge. Der Satz
”Es existiert kein Auto“ ist also in einer streng
axiomatisch aufgebauten Vorlesung uber Logik und Mengenlehre eine wahre Aussage,denn ein Auto ist ja keine Menge von Mengen.• Trotz dieser Einschrankungen kann man immer noch naturliche, ganze, rationale und
reelle Zahlen und vieles mehr als Mengen definieren. Die Zahl π ist also eine Menge,deren Elemente wieder Mengen sind, deren Elemente wieder Mengen sind, . . . . Siehedazu auch die Peano-Axiome in Abschnitt B in Kapitel
”Zahlen“.
Die Axiome ubernehme ich aus [17], siehe auch [25]. Zum Vergleich zu ZFC verweise ich auf [13].
AXIOME 2.1 (Axiome der Mengenlehre nach von Neumann, Bernays, Godel (NBG)).
• Es gibt zwei Sorten von Objekten, Mengen und Klassen. Außerdem gibt es noch die Be-ziehung ∈, die besagt, wann eine Klasse das Element einer anderen Klasse ist.• Jede Menge ist eine Klasse.
2. AXIOMATISCHE MENGENLEHRE 291
• Alle Elemente von Klassen sind Mengen.• Extensionalitat. Zwei Klassen sind genau dann gleich, wenn sie dieselben Elemente ent-
halten.• Komprehension. Ist C eine auf allen Mengen definierte Aussagenform, die nach strikt
festgelegten Regeln aufgebaut ist, die wir hier der Kurze halber nicht genauer diskutieren.1
Dann ist {x ist eine Menge
∣∣ C(x)}
eine Klasse.• Die leere Klasse ∅ := {x ist eine Menge | x 6= x} ist eine Menge.• Aussonderungsmengenaxiom. Jede Teilklasse einer Menge ist eine Menge.
Benutzt wurde hierbei die folgende Definition: Eine Klasse A ist eine Teilklasse einerKlasse B, wenn jedes Element von A ein Element von B ist.• Paarmengenaxiom. Sind A und B Mengen, so ist auch {A,B} eine Menge.• Vereinigungsaxiom. Ist A eine Menge, so ist auch⋃
A :={x∣∣ ∃y ∈ A : x ∈ y
}eine Menge, die Vereinigungsmenge von A.• Potenzmengenaxiom. Ist A eine Menge, so ist auch P(A) := {x | x ⊂ A} eine Menge,
die Potenzmenge von A.• Fundierungsaxiom. Ist A 6= ∅, so gibt es ein x ∈ A mit x ∩A = ∅.• Ersetzungsaxiom.Sind X und Y Klassen und ist F eine funktionale
”Relationsklasse“2
mit D(F ) = X und B(F ) ⊂ Y . Ist die Teilklasse A ⊂ X eine Menge, so ist auch B(F |A)eine Menge.• Unendlichkeitsaxiom. Es gibt eine induktive Menge; eine Menge A heißt induktiv, wenn∅ ∈ A und wenn fur alle x ∈ A auch x ∪ {x} ∈ A ist.• Auswahlaxiom. Sei I eine nicht-leere Menge und (Mi)i∈I eine Familie von nicht-leeren
Mengen. Dann ist∏i∈IMi nicht die leere Menge.
Bemerkungen 2.2.
(a) Besonders interessant ist das Auswahlaxiom. Es folgt bereits aus den Axiomen zuvor, dass∏i∈IMi eine Menge ist. Falls I endlich ist, so gilt offensichtlich
∏i∈IMi 6= ∅. Fur unendliche
Indexmengen kann man aber∏i∈IMi 6= ∅ im allgemeinen nicht aus den anderen Axiomen
herleiten. Wenn man es annimmt,”weiß“ man zwar, dass
∏i∈IMi mindestens ein Element
besitzt, es kann aber vorkommen, dass kein einziges Element von∏i∈IMi angegeben werden
kann.Es ist nun ganz lehrreich, zu untersuchen, welche Aussagen der Mathematik nur unter Hin-zunahme des Auswahlaxioms gezeigt werden konnen, und fur welche Aussagen, das Auswahl-axiom notig ist. Angenommen wir hatten nur die Axiome bis zum Unendlichkeitsaxiom. Dann
1Siehe hierzu [17] und [13]. Gemeint ist eine Aussagenform 1. Stufe, in der nicht uber Klassenvariable quanti-
fiziert wird.2Unter einer Relationsklasse verstehen wir eine Klasse, deren Elemente Paare sind. Man kann dann die ublichen
Begriffe einer Relation definieren, z.B.”funktional“, Definitionsbereich, Bild, etc.
292 A. MEHR DETAILS ZU DEN GRUNDLAGEN DER LOGIK
kann man zeigen, dass das Auswahlaxiom aquivalent zur Aussage”Jeder Vektorraum besitzt
eine Basis“ ist.Wenn wir das Auswahlaxiom annehmen, dann gibt es einen Vektorraum, der zwar eine Basisbesitzt, aber zugleich kann keine Basis angegeben werden.Das Auswahlaxiom ist auch aquivalent zur Aussage:
”Sind X und Y Mengen, dann gibt es eine
injektive Abbildung f : X −→ Y oder es gibt eine injektive Abbildung f : Y −→ X“.(b) Man kann aus den Axiomen der Mengenlehre nicht folgern, dass die Mengenlehre widerspruchs-
frei ist! (Zweiter Godelscher Unvollstandigkeitssatz). Die Mathematik beruht auf der Annahme,dass die Axiome der Mengenlehre widerspruchsfrei sind.
(c) Es gibt Aussagen, von denen gezeigt werden kann, dass weder diese Aussage noch die Negationdieser Aussage beweisbar ist. Die Cantorsche Kontinuumshypothese ist solch eine Aussage:
”Sei M eine Menge, so dass es keine injektive Abbildung M −→ N gibt.
Dann gibt es eine injektive Abbildung R −→M .“
Solche Aussagen gibt es in jedem hinreichend großen logischen System (Erster GodelscherUnvollstandigkeitssatz).
Bemerkung 2.3. Das Auswahlaxiom ist”unabhangig“ von den anderen Axiomen der Mengen-
lehre. Aufgrund der Nicht-Konstruktivitat und etwas ungewohnlicher Konsequenzen wird im Nor-malfall explizit angegeben, wenn ein Beweis das Auswahlaxiom verwendet.
Aus den obigen Axiomen kann man nun Schritt fur Schritt die ganze Mathematik heraus herleiten.
ANHANG B
Die Peano-Axiome
1. Die Axiome und erste Konsequenzen
Die naturlichen Zahlen wurden von Dedekind (1888) und Peano (1889) axiomatisiert. Siehe [17,Kapitel 3 und 4], [20], oder [13, Kapitel V] fur mehr Details.
AXIOME 1.1 (”Axiome“ der naturlichen Zahlen (Peano-Axiome)). Gegeben sei
• eine Menge N ,• ein (ausgewahltes) Element in N , das wir 0 nennen,• eine Abbildung s : N −→ N , x 7→ s(x), genannt die Nachfolger-Abbildung.
Wir sagen, dass (N, 0, s) die Peano-Axiome erfullt, falls gilt:
(P1) 0 6∈ B(s)(P2) Die Abbildung s : N −→ N ist injektiv.(P3) (Induktionsaxiom) Erfullt T ⊂ N die Bedingungen 0 ∈ T und s#(T ) ⊂ T , dann gilt bereits
T = N .
Wenn (N, 0, s) die Peano-Axiome erfullt, sagt man (N, 0, s) ist ein Modell der naturlichen Zahlen.
PROPOSITION 1.2. Es gibt eine Menge N ein Element 0 ∈ N und eine Nachfolger-Abbildungs : N −→ N , so dass (N, 0, s) die Peano-Axiome erfullt.
Beweis folgt unten.
PROPOSITION 1.3. Wenn (N , 0, s) und (N , 0, s) die Peano-Axiome erfullen, dann gibt es eine
bijektive Abbildung F : N −→ N , so dass F (0) = 0 und F ◦ s = s ◦ F .
Man sagt dann oft: (N , 0, s) und (N , 0, s) sind kanonisch isomorph.
Beweis spater.
Die letzte Gleichung schreibt man am besten als Diagramm, ein sogenanntes kommutatives Dia-gramm
293
294 B. DIE PEANO-AXIOME
N N
N N
F
F
s s
Alles, was man ublicherweise mit naturlichen Zahlen macht (Addition, Multiplikation, Teilbarkeit,Primzahlen, etc.) beruht letztendlich auf dem Tripel (N, 0, s) und den Peano-Axiomen. Deswegenbesagt Prop. 1.3, dass alle Eigenschaften von (N, 0, s) die man aus den Peano-Axiomen herleitenkann, entweder in allen Modellen gelten oder in keinem. Beispiele: In jedem Modell gibt es unendlich
viele Primzahlen, n ist eine Zahl mit 4 Teilern in (N , 0, s) genau dann wenn F (n) eine Zahl mit 4
Teilern in (N , 0, s) ist. Es kann uns also egal sein, welches Modell die naturlichen Zahlen beschreibt,wichtig sind allein die Peano-Axiome.
Bemerkung 1.4. Sind die Peano-Axiome weitere Axiome? Oder eine Definition? Oder Aussagen?Es gibt hier zwei verschiedene Sichtweisen. Je nach Anwendung und Dozent wird die eine oderandere bevorzugt.
(a) Die mengentheoretische Sichtweise: Die Peano-Axiome sind eine Definition.Proposition 1.2 besagt: Es gibt mindestens ein Tripel (N, 0, s), das die Peano-Axiome erfullt.
Und: Erfullen (N , 0, s) und (N , 0, s) die Peano-Axiome, so sind (N , 0, s) und (N , 0, s)”im
wesentlichen gleich“ (Proposition 1.3).(b) Die axiomatische Sichtweise: wir wollen im mathematischen Teilgebiet
”Theorie der naturlichen
Zahlen“ annehmen, dass es eine Menge N , ein 0 ∈ N und eine Nachfolger-Abbildung gibt undnehmen die Peano-Axiome als Axiome dieses Teilgebiets. Proposition 1.2 besagt dann,dass es ein mengentheoretisches Modell gibt, das die Axiome erfullt. Wie dieses Modell aberaussieht, ist fur unsere weiteren Uberlegungen irrelevant, da wir nur die Axiome fur weitereSchritte nutzen.
Beweis von Proposition 1.2. Wiederholung: eine Menge A heißt induktiv , wenn ∅ ∈ A und wennfur alle x ∈ A auch x ∪ {x} ∈ A ist.
Nach dem Unendlichkeitsaxiom gibt es eine induktive Menge A. Wir setzen 0 := ∅. Wir definierennun die Nachfolger-Abbildung
s : A −→ A, x 7→ x ∪ {x}.Das Tripel (A, 0, s) erfullt offensichtlich (P1).
Fur (P2) muss etwas gearbeitet werden, wir beweisen die Injektivitat von s : A −→ A mit einemWiderspruchsbeweis.
Angenommen die Abbildung sei nicht injektiv. Dies bedeutet:
(1.5) ∃x, y ∈ A : x 6= y ∧ s(x) = s(y)
1. DIE AXIOME UND ERSTE KONSEQUENZEN 295
Es folgt x ∪ {x} = y ∪ {y} und hieraus folgen wiederum die Aussagen
(1.6) x ∈ y ∨ x ∈ {y}
und
(1.7) y ∈ x ∨ y ∈ {x}.
Nun ist aber x ∈ {y} gleichbedeutend mit x = y und dies haben wir oben ausgeschlossen. Somiterhalten wir aus (1.6) dann x ∈ y, und analog erhalten wir y ∈ x aus (1.7).
Wir definieren nun B := {x, y}. Wegen B 6= ∅ ergibt das Fundierungsaxiom die Existenz einesb ∈ B mit b ∩ B = ∅. Im Fall b = x erhalten wir x ∩ {x, y} ⊃ {y} also b ∩ B 6= ∅. Im Fallb = y zeigen wir b ∩ B 6= ∅ analog. Wir haben einen Widerspruch erhalten, da wir gleichzeitigb∩B 6= ∅ und b∩B = ∅ erhalten haben. Also war eine Annahme (1.5) falsch. Wir haben mit einemWiderspruchsbeweis die Injektivitat von s gezeigt.
Es verbleibt aber unklar, ob (A, 0, s) auch (P3) erfullt.
Wir setzen nun
N :=⋂{B ∈ P(A) | B ist induktiv}.
Der Schnitt dieser induktiven Mengen ist wieder induktiv. Das Tripel (N, 0, s|N ) erfullt offen-sichtlich (P1) und (P2). Erfullt T die Voraussetzungen in (P3), so ist T induktiv und es giltT ∈ P(N) ⊂ P(A). Also folgt N ⊂ T , somit T = N . Wir erhalten (P3).
Beispiel 1.8. Die Konstruktion liefert dann 0 = ∅, 1 = s(0) = {∅}, 2 = s(1) = {∅, {∅}}, 3 =s(2) = {∅, {∅}, {∅, {∅}}}.
PROPOSITION 1.9. Jede naturliche Zahl ungleich 0 ist der Nachfolger genau einer naturlichenZahl.
Beweis (Direkter Beweis). Wir wissen bereits, dass jede naturliche Zahl der Nachfolger hochstenseiner naturlichen Zahl ist. Zu zeigen bleibt also, dass jede naturlichen Zahl n ungleich 0 Nachfolgereiner naturlichen Zahl ist. Wir definieren:
U := {n ∈ N |n ist Nachfolger einer naturlichen Zahl}
und dann
T := U ∪ {0}.
Die Menge T erfullt die Eigenschaften im Peano-Axiom (P3): 0 ist in T , und wenn n in T enthaltenist, dann ist n eine naturliche Zahl, und somit ist s(n) eine naturliche Zahl, die Nachfolger einernaturlichen Zahl ist. Somit ist s(n) in T . Axiom 3 besagt also, dass T gleich N ist. Daraus folgtU = N oder U = N r{0}. Also ist jede Zahl ungleich 0 Nachfolger einer naturlichen Zahl. Mankann den Beweis auch anders fuhren, als sogenannten Widerspruchsbeweis.
296 B. DIE PEANO-AXIOME
Beweis (Widerspruchsbeweis). Wir nehmen an, die Aussage des Lemmas ist falsch, undwollen daraus einen Widerspruch herleiten. Wenn die Aussage des Lemmas falsch ist,dann konnen wir annehmen: Es gebe eine naturliche Zahl n ungleich 0, die nicht Nachfolgereiner naturlichen Zahl ist. Wir definieren T := N r {n}. Die Menge T enthalt 0, da n 6= 0. Istt ∈ T , so ist t auch eine naturliche Zahl und somit ist auch der Nachfolger s(t) eine naturlicheZahl. Da n kein Nachfolger einer naturlichen Zahl ist, folgt s(t) 6= n und somit s(t) ∈ T . DieMenge T erfullt also die Eigenschaften in Peano-Axiom (P3) und somit gilt T = N . Zusammenmit n ∈ N und n 6∈ T ergibt sich ein Widerspruch. Da die Existenz einer Zahl n mit denobigen Eigenschaften zu einem Widerpruch fuhren wurde, wissen wir, dass es einsolches Gegenbeispiel nicht gibt, und die Aussage des Lemmas ist somit bewiesen.
2. Vollstandige Induktion und rekursive Definition
In diesem Abschnitt nehmen wir an, dass (N, 0, s) die Peano-Axiome erfullt. Die Addition + istnoch nicht definiert! Wir schreiben 1 fur s(0), 2 fur s(1) etc.. Die Notation n+ 1 ist im Sinne vons(n) zu lesen.
SATZ 2.1 (Vollstandige Induktion). Sei A( · ) eine auf N definierte Aussageform. Wir setzenvoraus, dass Induktionsanfang und Induktionsschritt erfullt sind:Induktionsanfang: A(0) ist wahr.Induktionsschritt: Fur alle n ∈ N gilt: (A(n) =⇒ A(n+ 1))).Dann gilt fur alle n ∈ N die Aussage A(n).
Im Induktionsschritt nennt man A(n) die Induktionsvoraussetzung .
Beweis. SeiT := {n ∈ N | A(n)}.
Auf Grund des Induktionsanfangs ist 0 in T . Der Induktionsschritt besagt: wenn n ∈ T , dann istauch n + 1 in T . Die Menge T erfullt also die Eigenschaften in Peano-Axiom (P3) und somit giltT = N .
Viele Variation hiervon, z.B.
SATZ 2.2 (Vollstandige Induktion, Starke Version). Sei A(n) eine auf N definierte Aussage. Wirsetzen voraus, dass Induktionssanfang und der modifizierte Induktionsschritt erfullt sind:Induktionsanfang: A(0) ist wahr.Modifizierter Induktionsschritt: Fur alle n ∈ N gilt: Aus A(0) ∧A(1) ∧ . . . ∧A(n) folgt A(n+ 1)).Dann gilt fur alle n ∈ N die Aussage A(n).
Beweis. Ubungsblatt 4, Aufgabe 4
SATZ 2.3 (Dedekindscher Rekursionssatz). Sei M eine Menge, a ∈ M und g : M × N −→ Meine Abbildung. Dann gibt es genau eine Abbildung f : N −→M so dass f(0) = a und
∀n ∈ N : f(s(n)) = g(f(n), n).
2. VOLLSTANDIGE INDUKTION UND REKURSIVE DEFINITION 297
Naturlich kann man hier auch wieder n+ 1 statt s(n) schreiben.
Wenn eine Abbildung auf diese Art und Weise definiert wird, nennen wir dies eine rekursive Defi-nition.
Beweis. Wir beweisen zunachst durch vollstandige Induktion die folgende Aussage A(n), n ∈ N :
Es gibt eine eindeutige1 Abbildung fn : {0, 1, 2, . . . , n} −→M mit den Eigenschaften2
fn(0) = m und ∀i ∈ {0, 1, 2, . . . , n− 1} : fn(i+ 1) = g(fn(i), i).
Induktionsanfang: n = 0. Die Abbildung f0 : {0} −→ M , 0 7→ m ist solch eine Abbildung. Undes ist offensichtlich die einzige.
Induktionsschritt:Induktionsvoraussetzung: A(n)Also wir haben eine Abbildung fn wie oben.
Wir definieren dann
fn+1(i) :=
{fn(i) falls i ∈ {0, 1, 2, . . . , n},g(fn(n), n) falls i = n+ 1.
Diese Abbildung erfullt die in A(n + 1) genannte Eigenschaft und man sieht leicht, dass es dieeinzige ist.
Wir setzen nun: f(n) := fn(n). Die so definierte Abbildung f : N −→M erfullt die Eigenschaftendes Satzes.
Wir konnen nun Proposition 1.3 zeigen.
Beweis von Prop. 1.3. Wir definieren rekursiv F (1) = 1 und fur n ∈ N : F (s(n)) = s(F (n)). Dies
ergibt eine Abbildung F : N −→ N . Analog definiert man eine G : N −→ N durch G(1) = 1und G(s(n)) = s(G(n)). Man zeigt nun durch Induktion G ◦ F = ∆N und F ◦ G = ∆N , d.h.
G : N −→ N ist die Umkehrfunktion von F : N −→ N und somit ist F : N −→ N bijektiv. Dieubrigen Eigenschaften dieser Abbildung folgen direkt aus der Definition von F .
Aus Proposition 1.3 folgt: alles was wir fur aus den Peano-Axiomen heraus fur (N, s, 0) zeigen, giltauch fur (N ′, s′, 0′). Es ist also unerheblich, welches Modell wir nutzen. Wir nehmen nun eines her
1”eindeutig“ bedeutet: es gibt so eine Funktion, und dies ist die einzige Funktion, die das erfullt!
2Man muss sich an dieser Stelle eigentlich Gedanken machen, was hier mit {0, 1, 2 . . . , n} gemeint ist. Es ist die
Menge Kn mit den Eigenschaften
(1) 0 ∈ Kn,
(2) s#(Kn r {n}) ⊂ Kn,(3) Ist T eine Menge mit 0 ∈ T und s#(T r {n}) ⊂ T , dann gilt Kn ⊂ T .
Dann ist zu zeigen dass s(n) 6∈ Kn und Kn+1 = Kn ∪ {s(n)}. Man sieht also, dass Kn genau das ist, was wir uns
unter {0, 1, 2, . . . , n} vorstellen.
298 B. DIE PEANO-AXIOME
und schreiben ab sofort N an Stelle von N , n 7→ n+ 1 an Stelle von s und weiterhin 0. Wir nennenN die Menge der naturlichen Zahlen.
Beispiele 2.4.
(1) Addition: Sei M = N, g(m,n) := s(m), a ∈ N. Wir erhalten eine Abbildung αa : N −→ Nmit αa(0) = a und mit ∀n ∈ N : αa(s(n)) = s(aa(n)). Wir schreiben a+ n := αa(n). Furn = 1 stimmt dies mit der bisherigen Definition von a+ 1 uberein.
(2) Multiplikation: Sei M = N, i ∈ N, g : N × N −→ N, (m,n) 7→ m + i. Wir erhalten eineAbbildung µi : N −→ N mit µi(0) = 0 und mit ∀n ∈ N : µi(s(n)) = µi(n) + i. Wirschreiben i ·m := µi(m).
(3) Potenzieren: Sei M = N, i ∈ N, g : N × N −→ N, (m,n) 7→ m · i. Wir erhalten eineAbbildung pi : N −→ N mit pi(0) = 1 und mit ∀n ∈ N : pi(s(n)) = pi(n) · i. Wirschreiben im := pi(m).
(4) Fakultat : Sei M = N, g : N× N −→ N, (m,n) 7→ (n+ 1) ·m. Wir definieren dadurch dieAbbildung ! : N −→ N durch 0! := 1 und (m+ 1)! := m! · (m+ 1). Also n! = 1 · 2 · · · · · n.
SATZ 2.5. (N,+, ·) erfullt die folgenden Eigenschaften:
(Aa) Addition ist assoziativ.Fur alle x, y, z ∈ N gilt
(x+ y) + z = x+ (y + z).
(An) Addition hat neutrales Element.Es gibt ein Element 0 ∈ N, so dass fur alle x ∈ N gilt
x+ 0 = 0 + x = x.
(Ak) Addition ist kommutativ.Fur alle x, y ∈ N gilt
x+ y = y + x.
(Ma) Multiplikation ist assoziativ.Fur alle x, y, z ∈ N gilt
(x · y) · z = x · (y · z).(Mn) Multiplikation hat neutrales Element.
Es gibt ein Element 1 ∈ N, so dass fur alle x ∈ N gilt
x · 1 = 1 · x = x.
(Mk) Multiplikation ist kommutativ.Fur alle x, y ∈ N gilt
x · y = y · x.(AMd) Addition und Multiplikation erfullen das Distributivgesetz.
Fur alle x, y, z ∈ N gilt
x · (y + z) = x · y + x · z
3. ORDNUNG DER NATURLICHEN ZAHLEN 299
(y + z) · x = y · x+ z · x
Den Beweis kann man mit vollstandiger Induktion durchfuhren, die wir im nachsten Abschnittkennenlernen werden. Es ist eine gute Ubung, einmal die Kommutativitat der Addition durchvollstandige Induktion oder direkt aus den Peano-Axiomen herzuleiten. Dies ist etwas muhsam,aber prinzipiell moglich.
Offensichtlich ist 0 die einzige Zahl, die an Stelle von 0 die obige Eigenschaft erfullt. Wir nennen0 = 0 das neutrale Element der Addition. Analoges gilt fur 1 und 1, und man nennt 1 = 1 dasneutrale Element der Multiplikation.
LEMMA 2.6 (Kurzungsregel). Seien n,m, k ∈ N mit n+ k = m+ k. Dann gilt auch m = n.
In anderen Worten
∀n,m, k ∈ N : n+ k = m+ k =⇒ m = n.
Der Beweis folgt durch Induktion nach k (wird nicht im Detail ausgefuhrt).
LEMMA 2.7. Jede von 0 verschiedene naturliche Zahl ist Nachfolger einer naturlichen Zahl.
Beweis. Angenommen k ∈ N, k 6= 0 und k 6∈ s#(N). Definiere T := Nr {k}. Dann gilt 0 ∈ T unds#(T ) ⊂ T und somit erhalten wir den Widerspruch T = N.
LEMMA 2.8. Sind n,m ∈ N. Es gelte n+m = 0. Dann gilt n = m = 0.
Beweis. (Widerspruchsbeweis) Wir nehmen an, dass n 6= 0 oder m 6= 0. Da der Fall m 6= 0 ganzanalog zum Fall n 6= 0, genugt es den Fall n 6= 0 zu betrachten. 3 Dann gibt es eine Zahl k ∈ N mitn = s(k). Es folgt 0 = s(k) +m = s(k+m), was der Tatsache widerspricht, dass 0 kein Nachfolgereiner naturlichen Zahl ist.
Hier gabe es noch viel hinzuzufugen. Deswegen wird der Anhang evtl. hier noch erweitert.
3. Ordnung der naturlichen Zahlen
Wir definieren nun eine Relation:
≤:= {(n,m) ∈ N× N | ∃k ∈ N : m = n+ k}.
LEMMA 3.1. Diese Relation ≤ ist eine totale Ordnung auf N. Es gilt:
(1) Reflexivitat auf N: Fur alle m in N ist m ≤ m wahr.
3Da Satze in dieser Art oft vorkommen, sagt man”Ohne Beschrankung der Allgemeinheit (OBdA) gilt n 6= 0.“
300 B. DIE PEANO-AXIOME
(2) Antisymmetrie: Fur alle n und m in N gilt
n ≤ m ∧m ≤ n =⇒ n = m.
(3) Transitivitat: Fur alle n, m und k in N gilt:
n ≤ m ∧m ≤ k =⇒ n ≤ k.
(4) Totalitat: Fur alle n und m in N gilt
n ≤ m ∨m ≤ n
(5) Fur alle n ∈ N gilt n ≤ n+ 1.
Beweis. Aussagen (1), (3) und (5) sind offensichtlich.
Zu (2) (Antisymmetrie): Es gelte n ≤ m und m ≤ n. Dann gibt es k1, k2 ∈ N mit m = n+ k1 undn = m+ k2. Daraus folgt
n = m+ k2 = n+ k1 + k2.
Mit der Kurzungsregel (Lemma 2.6) folgt k1 + k2 = 0 und mit Lemma 2.8 ergibt sich k1 = k2 = 0.Also n = m.
Zu (4) (Totalitat): Zu n ∈ N definieren wir
Tn := {m ∈ N | m ≤ n ∨ n ≤ m}.
Man zeigt mit etwas Aufwand 0 ∈ Tn und s#(Tn) ⊂ Tn. Mit (P3) folgt Tn = N, also die Behaup-tung.
Definition 3.2. Sei R eine (partielle) Ordnungsrelation auf M . Ein Minimum (beziehungsweiseMaximum) ist ein Element m ∈M , so dass fur alle n ∈M gilt: mRn (bzw. nRm).
Bemerkung. Wegen der Antisymmetrie gibt es hochstens ein Minimum.
Beispiele: Das offene Intervall ]0, 1[ in R hat kein Minimum bezuglich ≤.
Die Menge M := {{a}, {b}, {a, b}} tragt die Ordnungsrelation ⊂. Es existiert kein Minimum in M .
PROPOSITION 3.3 (Wohlordnung von N). Sei A eine nichtleere Teilmenge von N, dann besitztA ein Minimum.
Beweis. Wir nehmen an, A besaße kein Minimum. Definiere
T := {n ∈ N | ∀k ∈ A : k > n}= {n ∈ N | ∀k ∈ N : (k ≤ n =⇒ k 6∈ A)}= {n ∈ N | ¬(∃k ∈ N : (k ≤ n ∧ k ∈ A))}.
Offensichtlich gilt 0 ∈ T : denn wenn 0 /∈ T ware, dann gabe es ein k ∈ N mit k ≤ 0 und k ∈ A,also 0 ∈ A; und dann ware 0 ein Minimum von A.
3. ORDNUNG DER NATURLICHEN ZAHLEN 301
Wir zeigen nun
(3.4) (n ∈ T ) =⇒ (n+ 1 ∈ T ).
Daraus folgt dann mit (P3) die Aussage T = N, also A = ∅.
Um (3.4) zu zeigen, nehmen wir an, es gebe ein n ∈ T mit n+ 1 6∈ T . Daraus folgt dann n+ 1 ∈ A,und aus n ∈ T folgt mit der Totalitat dann, dass n + 1 ein Minimum von A ist. Dies ist einWiderspruch zur obigen Annahme.
4
Bemerkung 3.5. Sei R eine totale Ordnung auf einer Menge M . Wir sagen, R ist eine Wohlord-nung oder (M,R) ist eine wohlgeordnete Menge, wenn jede nicht-leere Teilmenge A ein Minimumbesitzt. Die letzte Proposition besagt also, dass (N,≤) wohlgeordnet ist. Hingegen ist (R,≤) nichtwohlgeordnet. Man kann aber zeigen:
Zu jeder Menge M gibt es eine Wohlordnung auf M .
Diese Aussage ist zum Auswahlaxiom aquivalent, wenn wir die ubrigen Axiome der Mengenlehreannehmen.
4Alternativer Beweis: Wir nehmen an, A besitze kein Minimum. Zu zeigen ist, dass A die leere Menge ist. Wir
zeigen induktiv die AussageP (n) :⇐⇒ {0, 1, 2, . . . , n} ∩A = ∅,
woraus die Aussage folgt.
Induktionsanfang: Angenommen 0 ware in A. Dann ist 0 das Minimum. Da es aber kein Minimum in A gibt, folgt
0 6∈ A, also P (0).Induktionsschritt : Es gelte P (n). Falls n+ 1 ∈ A, so ist n+ 1 ein Minimum von A. Da es aber kein Minimum gibt,
gilt n+ 1 6∈ A, und somit P (n+ 1).
ANHANG C
Konstruktion von R mit Hilfe von Cauchy-Folgen
In diesem Anhang stellen wir eine alternative Moglichkeit dar, ein Modell fur die reellen Zahlen zukonstruieren, namlich mit Hilfe von Cauchy-Folgen. Wenn man die Einfuhrung von Cauchy-Folgenin diesem Anhang mit der Einfuhrung im Hauptteil in Abschnitt 1.6 vergleicht, so sieht man, dasswir in diesem Anhang einige Eingeschaften explizit prufen mussen, die im Hauptteil aus den imAbschnitt 6 behandelten Aussagen folgen. In Abschnitt 1.6 setzen wir voraus, dass wir bereitswissen, was R ist und dass jeder archimedisch geordnete Korper Teilkorper von R ist. Auch dieDefinition einer Cauchy-Folge muss leicht angepasst werden. 1
1. Mehr zu Aquivalenzrelationen
Wir besprechen hier Aquivalenzrelationen noch etwas detailierter als zuvor. Derartige Sachver-halte wurden bereits in der Linearen Algebra I im Detail behandelt. Wir wiederholen sie in derZentralubung am 26.11.2013, u.a. um sicherzustellen, dass auch diejenigen folgen konnen, die dieLineare Algebra I nicht horen.
UBUNG 1.1. Seit f : M −→ N eine Abbildung. Wir definieren
Rf := {(x, y) ∈M ×M | f(x) = f(y)}.Zeigen Sie, R ist eine Aquivalenzrelation.
Sei R eine Aquivalenzrelation auf M .
Fur x ∈M definieren wir die Aquivalenzklasse von x als
[x] := {y ∈M | xRy}.Man sagt auch x ist ein Reprasentant von [x] oder x reprasentiert [x].
UBUNG 1.2. Zeigen Sie, dass fur alle x, y ∈M gilt:
(a)y ∈ [x]⇐⇒ [x] = [y]
1Dieser Teil wurde von meinem fruheren Skript der Vorlesung im Wintersemester 2013/14 ubernommen. Leiderkonnen kleinere ubernahmebedingten Druckfehler nicht ganz ausgeschlossen werden. Auch werden manche Themender Hauptvorlesung hier potentiell verdoppelt.
303
304 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
(b)
[x] = [y] Y [x] ∩ [y] = ∅.
UBUNG 1.3. Sei Rf wie oben definiert. Bestimmen Sie die Aquivalenzklassen.
Ist R eine Aquivalenzrelation auf M , so definieren wir den Quotient von M nach R als
M/R := {[x] | x ∈M}.
Die Abbildung [ · ] : M →M/R, x 7→ [x] nennt man die kanonische Projektion.
UBUNG 1.4. Sei eine Abbildung F : M −→ X gegeben und R eine Aquivalenzrelation auf M .
Zeigen Sie, es gibt genau dann eine Abbildung F : M/R −→ X, so dass F ◦ [ · ] = F , falls fur allex, y ∈M gilt
xRy =⇒ F (x) = F (y).
Die Abbildung F : M/R −→ X ist daraus eindeutig bestimmt.
M X
M/R
F
[ · ]F
Gilt sogar
xRy ⇐⇒ F (x) = F (y),
dann wissen wir noch zusatzlich, dass F injektiv ist.
Beispiel: Sei f : M −→ N , Rf wie oben. Dann gibt es eine eindeutige Abbildung f : M/Rf −→ N ,so dass
M N
M/Rf
f
[ · ]f
kommutiert. Außerdem ist f injektiv. Wir erhalten eine bijektive Abbildung f : M/Rf −→ B(f).
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 305
2. Folgen, Konvergenz und Cauchy-Folgen
Wenn wir die reellen Zahl uber Cauchy-Folgen konstruieren wollen, so benotigen wir Begriffe wieKonvergenz, Cauchyfolgen und ahnliche fur beliebige archimedisch geordnete Korper. Wir durfenja insbesondere nicht nutzen, dass jeder solche Korper ein Unterkorper von R ist. Deswegen mussenwir in großen Teilen unsere Einfuhrung in Folgen und Reihen nochmals in etwas großerer Allge-meinheit wiederholen.
Wir schreiben im folgenden zumeist K fur einen geordneten Korper (K,+, ·,≤). Und |a| ∈ K≥0
sei (wie immer) der Betrag von a ∈ K.
Definition 2.1. Eine K-wertige Folge (ai)i∈N heißt beschrankt2 ,
:⇐⇒ {ai | i ∈ N} ist (nach oben und unten) beschrankt in K
⇐⇒ ∃r1, r2 ∈ K : ∀i ∈ N : r1 ≤ ai ≤ r2
⇐⇒ ∃r ∈ K : ∀i ∈ N : |ai| ≤ r⇐⇒ {|ai| | i ∈ N} ist beschrankt in K
Bemerkung 2.2. Falls K archimedisch ist, so gilt auch:
(ai)i∈N ist beschrankt in K ⇐⇒ ∃n ∈ N : ∀i ∈ N : |ai| ≤ n.
Die Implikation ⇐= ist klar, und =⇒ folgt direkt aus der archimedischen Eigenschaft
Definition 2.3 (Konvergenz von Folgen). Eine K-wertige Folge (ai)i∈N konvergiert 3 gegen a ∈ K,falls gilt
∀ε ∈ K>0 : ∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤ ε).Man nennt a den Grenzwert der Folge (ai)i∈N und schreibt a = limi→∞ ai oder ai → a fur i→∞.Wir sagen (ai)i∈N konvergiert, falls es ein derartiges a ∈ K gibt. Folgen, die gegen 0 konvergieren,
nennt man Nullfolgen. Falls eine Folge nicht konvergiert, so sagen wir dazu sie divergiert.
!ACHTUNG!. Wenn wir a = limi→∞ ai schreiben, so bedeutet dies immer:
• der Grenzwert existiert, und• der Grenzert ist a.
2Wenn man hier ganz exakt sein will, sollte man hier besser”beschrankt in K“ oder
”K-beschrankt“ sagen,
denn ob eine Folge beschrankt ist, hangt von K ab. Beispiel: Die Folge (i)i∈N ist unbeschrankt in Q, aber beschranktim Korper der rationalen Funktionen mit rationalen Koeffizienten. Sind aber K1 und K2 archimedische geordnete
Korper, so sieht man mit der unten stehenden Bemerkung, dass K1-Beschranktheit und K2-Beschranktheit die
gleiche Bedeutung haben.3Wenn man hier ganz exakt sein will, sollte man hier besser
”K-konvergiert“ sagen, denn ob eine Folge konver-
giert, hangt von K ab. Beispiel: Die Folge (1/i)i∈N Q-konvergiert in Q gegen 0, aber nicht im Korper der rationalenFunktionen mit rationalen Koeffizienten. Sind aber K1 und K2 archimedische geordnete Korper, so sieht man mit
einer der unten stehenden Bemerkungen, dass K1-Konvergenz und K2-Konvergenz die gleiche Bedeutung haben.
306 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
Bemerkungen 2.4.
(a) Falls eine Folge einen Grenzwert besitzt, so ist dieser eindeutig bestimmt. Seien a und a′ zweiGrenzwerte von (ai)i∈N. Zu einem gegebenen ε ∈ K>0 gilt also:
∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤ ε).∃i′0 ∈ N : ∀i ∈ N : (i ≥ i′0 =⇒ |ai − a′| ≤ ε).
Wahle nun so ein i0 und i′0. Dann gilt fur alle i ≥ max{i0, i′0}:|a− a′| ≤ |a− ai|+ |ai − a′| ≤ ε+ ε = 2ε.
Dies gilt fur alle ε ∈ K>0. Angenommen wir haben a 6= a′, so gilt dies insbesondere furε := |a − a′|/3 > 0. Also folgt 3ε ≤ 2ε und somit ergibt sich der Widerspruch ε ≤ 0. DieAnnahme a 6= a′ war also falsch, d.h. es gilt a = a′.
(b) Falls (ai)i∈N konvergiert, so ist (ai)i∈N beschrankt. Um dies zu zeigen, wahlen wir zu ε := 1ein passendes i0. Es gilt somit fur alle i ∈ N mit i ≥ i0:
|ai| ≤ |ai − a|+ |a| ≤ |a|+ 1.
Nun setzen wirr := max{|a1|, |a2|, . . . , |ai0−1|, |a|+ 1}.
Dann gilt fur alle i ∈ N: |ai| ≤ r. Somit ist (ai)i∈N beschrankt.(c) Ist K archimedisch, so gilt
a = limi→∞
ai ⇐⇒ ∀n ∈ N : ∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤1
n).
Die Implikation =⇒ ist klar, und ⇐= folgt aus Lemma 2.5.
LEMMA 2.5. Ist K archimedisch, dann gibt es fur alle ε ∈ K>0 ein n ∈ N mit ε ≥ (1/n).
Beweis. Zu 1/ε ∈ K gibt es ein n ∈ N mit 1/ε ≤ n, und dies ist aquivalent zu ε ≥ (1/n).
Beispiele 2.6. (a) Eine Folge (ai)i∈N heißt konstant, falls a1 = a2 = a3 = . . .. Konstante Folgensind beschrankt und konvergieren. a1 = limi→∞ ai.
(b) Sei K = Q. Dann ist ( 1i )i∈N eine Nullfolge. (Nutze z.B. Bem. 2.4 (c) und setze i0 := n).
(c) Die Folge((−1)i
)i∈N hat 1 als obere und −1 als untere Schranke und ist somit beschrankt.
Wir werden bald sehen, dass sie nicht konvergiert.
Definition 2.7. Sei (ai)i∈N eine Folge von Elementen ai ∈M . Sei f : N→ N eine Abbildung mitder Eigenschaft
∀i, j ∈ N : i < j =⇒ f(i) < f(j)
(Man sagt zu dieser Eigenschaft: f ist streng monoton wachsend .) Dann nennt man (af(k))k∈N eineTeilfolge von (ai)i∈N.
Beispiel 2.8. Die Folge (i)i∈N hat folgende Teilfolgen:4
4Diese Folge hat naturlich noch viel mehr Teilfolgen. U.a. gibt es sogar Teilfolgen, die man gar nicht beschreiben
kann. Wieso es nicht beschreibbare Teilfolgen gibt, kann erst spater erklart werden.
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 307
• sich selbst,• die Folge der ungeraden Zahlen (1, 3, 5, 7, . . .),• die Folge der Primzahlen (2, 3, 5, 7, . . .).
Konvergiert (ai)i∈N gegen a, so konvergiert jede Teilfolge ebenfalls gegen a.
LEMMA 2.9. Die Folge((−1)i
)i∈N aus Beispiele 2.6 (c) divergiert.
Beweis. Angenommen, die Folge((−1)i
)i∈N konvergiert gegen ein a ∈ K. Dann konvergieren auch
die Teilfolgen((−1)2k
)k∈N = (1)k∈N und
((−1)2k+1
)k∈N = (−1)k∈N gegen a. Da diese Teilfolgen
konstant sind, erhalten wir a = 1 und a = −1, was in K nicht moglich ist, denn es gilt ja−1 < 0 < 1.
UBUNG 2.10. Seien (ai)i∈N und (bi)i∈N konvergente Folgen. Dann gilt:
limi→∞
(ai + bi) = limi→∞
ai + limi→∞
bi
limi→∞
(ai − bi) = limi→∞
ai − limi→∞
bi
limi→∞
(ai · bi) = limi→∞
ai · limi→∞
bi
Gilt zusatzlich: ∀i ∈ N : bi 6= 0, und ist (bi)i∈N keine Nullfolge, so gilt auch
limi→∞
aibi
=limi→∞
ai
limi→∞
bi.
Die Beweise sind ahnlich wie in der folgenden Proposition.
Definition 2.11. Eine K-wertige Folge (ai)i∈N heißt Cauchy-Folge,5 falls
∀ε ∈ K>0 : ∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0) =⇒ |ai − aj | ≤ ε.PROPOSITION 2.12.
(1) Jede konvergente Folge ist eine Cauchy-Folge.(2) Jede Cauchy-Folge ist beschrankt.(3) Seien (ai)i∈N und (bi)i∈N Cauchy-Folgen. Dann sind (ai + bi)i∈N, (ai − bi)i∈N und (ai · bi)i∈N
ebenfalls Cauchy-Folgen.
(4) Zusatzlich zu den Voraussetzungen in (3) gelte ∀i ∈ N : bi 6= 0, und die Folge (bi)i∈N sei keine
Nullfolge. Dann ist auch(aibi
)i∈N
eine Cauchy-Folge.
Um die Proposition zu zeigen, nutzen wir ein Lemma.
5Genau genommen musste man hier wieder sagen: eine K-Cauchy-Folge, da die Definition zuachst von K
abhangt. Die Bedeutung ist dann aber fur alle archimedischen Korper dieselbe.
308 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
LEMMA 2.13. Sei A( · ) eine auf K>0 definierte Aussageform, und q ∈ K>0. Dann gilt
∀ε ∈ K>0 : A(ε) ⇐⇒ ∀ε ∈ K>0 : A(qε)
Das Lemma gibt es vielen Variationen. Wichtiger als die Aussage des Lemmas ist es, zu verstehen,wie man das Lemma (oder eine Variation davon!) kurz beweist.
Beweis des Lemmas.
”=⇒“: Es gelte
(2.14) ∀ε ∈ K>0 : A(ε).
Fur ein gegebenes ε > 0 wollen wir nun A(qε) zeigen. Wir wenden (2.14) fur ε := qε an, und habendann das gewunschte.
”⇐=“: Analog mit ε := q−1ε
Beweis der Proposition.(1): Es gelte limi→∞ ai = a. Das heißt: fur alle ε ∈ K>0 gibt es ein i0 ∈ N, so dass fur allenaturlichen Zahlen i ≥ i0 gilt: |ai − a| ≤ ε.
Fur solch ein ε und ein passendes i0 nehmen wir nun naturliche Zahlen i ≥ i0 und j ≥ i0 undrechnen nach:
|ai − aj | ≤ |ai − a|+ |a− aj | ≤ ε+ ε = 2ε.
Wir haben nun also gezeigt:
∀ε ∈ K>0 : A(2ε),
wobei A(·) die folgende auf K>0 definierte Aussageform ist
A(ε) :⇐⇒ ∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0) =⇒ |ai − aj | ≤ ε
Nach dem obigen Lemma ist dies aquivalent zu
∀ε ∈ K>0 : A(ε)
und dies ist gerade die Definition einer Cauchy-Folge.
(2): Ahnlich wie Bemerkung 2.4 (b).
(3): Angenommen (ai)i∈N und (bi)i∈N seien Cauchy-Folgen. Dies bedeutet, dass wir fur jedes ε ∈K>0 die folgenden Aussagen haben:
∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0) =⇒ |ai − aj | ≤ ε∃j0 ∈ N : ∀i, j ∈ N : (i ≥ j0 ∧ j ≥ i0) =⇒ |bi − bj | ≤ ε
Wir wahlen nun solch ein i0 und solch ein j0. Wir setzen k0 := max{i0, j0}. Dann gilt fur diesesk0:
∀i, j ∈ N : (i ≥ k0 ∧ j ≥ k0) =⇒ |ai − aj | ≤ ε ∧ |bi − bj | ≤ ε.
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 309
Wir rechnen fur i, j ≥ k0:
|(ai + bi)− (aj + bj)| = |(ai − aj) + (bi − bj)| ≤ |ai − aj |+ |bi − bj | ≤ ε+ ε = 2ε.
Also ergibt sich insgesamt
∀ε ∈ K>0 : ∃k0 ∈ N : ∀i, j ∈ N : (i ≥ k0 ∧ j ≥ k0) =⇒ |(ai + bi)− (aj + bj)| ≤ 2ε.
Nach dem obigen Lemma konnen wir auch hier 2ε durch ε ersetzen. Dann steht hier gerade dieDefinition, dass (ai + bi)i∈N eine Cauchy-Folge ist.
Der Beweis fur (ai − bi)i∈N ist vollig analog.
Fur das Produkt (ai · bi)i∈N muss man etwas anders vorgehen. Zunachst nutzen wir die Tatsache,dass (ai)i∈N und (bi)i∈N beschrankt sind. Also gibt es ein r ∈ K mit
∀i ∈ N : |ai| ≤ r ∧ |bi| ≤ r
Dann argumentieren wir wie bei der Summe, rechnen dann aber:
|aibi − ajbj | = |ai(bi − bj) + (ai − aj)bj | ≤ |ai||bi − bj |+ |ai − aj ||bj | ≤ rε+ εr = 2rε.
Nun argumentiert man wie bei der Summe, wobei man das Lemma mit q := 2r nutzt.
(4): Es reicht zu zeigen: Sei (bi)i∈N eine Folge wie oben, dann ist ( 1bi
)i∈N ebenfalls eine Cauchy-
Folge. Die eigentliche Aussage folgt dann mit (3).
Wir zeigen zunachst durch Widerspruch, dass ( 1bi
)i∈N beschrankt ist. Angenommen ( 1bi
)i∈N seinicht beschrankt, dann gilt
∀r ∈ K : ∃n ∈ N :
∣∣∣∣ 1
bn
∣∣∣∣ > r.
Dies impliziert
∀r ∈ K>0 : ∃n ∈ N : |bn| <1
rund dies ergibt
(2.15) ∀δ ∈ K>0 : ∃n ∈ N : |bn| < δ,
wobei die folgende Variation des obigen Lemmas benutzt wurde
∀r ∈ K>0 : A(1/r) ⇐⇒ ∀δ ∈ K>0 : A(δ).
Die Folge (bi)i∈N ist eine Cauchy-Folge. Zu einem gegebenen ε ∈ K>0 gibt es also ein i0 ∈ N, sodass gilt
(2.16) ∀i, j ∈ N : i ≥ i0 ∧ j ≥ i0 =⇒ |bi − bj | ≤ ε
Wir wahlen nun zu diesem i0:
δ :=min{ε, |b1|, |b2|, . . . , |bi0 |}
2.
310 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
Mit (2.15) erhalten wir ein n ∈ N mit |bn| < δ. Auf Grund der Definition von δ gilt n > i0. Mit(2.16) folgt:
∀j ∈ N : j ≥ i0 =⇒ |bn − bj | ≤ εund mit der Rechnung
|bj | ≤ |bj − bn|+ |bn| ≤ ε+ε
2≤ 2ε
folgt
∀ε ∈ K>0 : ∃i0 ∈ N : ∀j ∈ N : j ≥ i0 =⇒ |bj − 0| ≤ 2ε.
Dies ergibt unter Nutzung des Lemmas fur q = 2, dass (bj)j∈N eine Nullfolge ist. Dies ist einWiderspruch zur Annahme. Also haben wir die Beschranktheit gezeigt, d.h.
∃r ∈ K : ∀n ∈ N :
∣∣∣∣ 1
bn
∣∣∣∣ ≤ r.Nun sei wiederum ε > 0 und i0 wie oben. Wir rechnen dann∣∣∣∣ 1
bi− 1
bj
∣∣∣∣ ≤ ∣∣∣∣bj − bibibj
∣∣∣∣ ≤ |bj − bi||bi||bj |≤ r2ε
Unter Nutzung des Lemmas fur q = r2 erhalten wir, dass ( 1bi
)i∈N eine Cauchy-Folge ist.
Definition 2.17. Wir sagen K ist vollstandig , falls jede K-wertige Cauchy-Folge in K konvergiert.
Definition 2.18. Sei A( · ) eine auf N definierte Aussageform.
Fur fast alle i ∈ N gilt A(i)
:⇐⇒ Es gibt ein i0 ∈ N, so dass fur alle i ∈ N: i ≥ i0 =⇒ A(i)
⇐⇒ Die Menge {i ∈ N | ¬A(i)} ist endlich
Beispiel: limi→∞ ai = a ⇐⇒ Fur alle ε ∈ K>0 gilt fur fast alle i ∈ N: |ai − a| ≤ ε 6⇐⇒ Fur fastalle i ∈ N gilt fur alle ε ∈ K>0: |ai − a| ≤ ε
Notation: Da wir immer wieder Ausdrucke der Art
∀i ∈ N : i ≥ i0 =⇒ A(i)
haben, schreiben wir hierfur kurz
∀i ∈ {i0, i0 + 1, . . .} : A(i).
LEMMA 2.19. Besitzt eine Cauchy-Folge eine konvergente Teilfolge, so ist die Cauchy-Folge be-reits konvergent.
Beweis. Sei nun (ai)i∈N eine Cauchy-Folge, sei f : N −→ N eine streng monotone wachsendeAbbildung, und sei (af(n))n∈N eine konvergente Teilfolge mit Grenzwert a.
Es gilt fur ein zunachst fixiertes ε ∈ K>0:
(2.20) ∃i0 ∈ N : ∀i, j ∈ {i0, i0 + 1, . . .} : |ai − aj | ≤ ε.
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 311
und
(2.21) ∃n0 ∈ N : ∀n ∈ {n0, n0 + 1, . . .} : |af(n) − a| ≤ ε.
Fur solche i0 und n0 setzen wir k0 := max{i0, f(n0)}. Da f streng monoton wachsend ist, konnenwir ein n ∈ {n0, n0 + 1, . . .} wahlen mit f(n) ≥ k0. 6 Wir wahlen dann j := f(n) und haben somitfur alle i ∈ {i0, i0 + 1, . . .} erhalten:
|ai − a| ≤ |ai − af(n)|+ |af(n) − a| ≤ ε+ ε ≤ 2ε.
Wir haben also insgesamt gezeigt:
∀ε ∈ K>0 : ∃i0 ∈ N : ∀i ∈ {i0, i0 + 1, . . .} : |ai − a| ≤ 2ε.
Und wenn wir Lemma 2.13 verwenden mit q = 2, erhalten wir limi→∞ ai = a.
SATZ 2.22. Sei K ein geordneter Korper. Dann sind aquivalent:
(1) K erfullt die Supremumseigenschaft(2) K ist archimedisch und vollstandig
Beweis.”(1) =⇒ (2)“: Angenommen K erfulle die Supremumseigenschaft. Wir haben bereits
gesehen, dass dann K archimedisch ist.
Sei nun (ai)i∈N eine Cauchy-Folge. Wir definieren
M := {x ∈ K | Fur fast alle i ∈ N gilt: x ≤ ai},= {x ∈ K | ∃i0 ∈ N : ∀i ∈ {i0, i0 + 1, . . .} : x ≤ ai}.
Jede Cauchy-Folge ist beschrankt. Es gibt also r1, r2 mit ∀i ∈ N : r1 ≤ ai ≤ r2. Dann gilt r1 ∈Mund r2 ist eine obere Schranke von M . Da M nicht-leer und nach oben beschrankt ist, existierta := supM ∈ K.
Wir wollen zeigen: limi→∞ ai = a.
Sei ε ∈ K>0. Dann ist a+ ε 6∈M , denn sonst ware a keine obere Schranke von M . Also
(2.23) ∀i0 ∈ N : ∃i ∈ {i0, i0 + 1, . . .} : a+ ε > ai.
Andererseits gilt: x′ ≤ x ∈M =⇒ x′ ∈M . Ware a− ε 6∈M wahr, dann ware auch a− ε eine obereSchranke, also a nicht das Supremum. Somit wissen wir a− ε ∈M . Wir erhalten
(2.24) ∃k0 ∈ N : ∀k ∈ {k0, k0 + 1, . . .} : a− ε ≤ ak.
Sei nun j0 ∈ N gegeben. Wir wahlen ein k0 wie in (2.24). Wende (2.23) mit i0 := max{k0, j0} an.Dann existiert ein i ∈ {i0, i0 + 1, . . .} mit a + ε > ai und a − ε ≤ ai, also mit |ai − a| ≤ ε. Wirhaben gezeigt
(2.25) ∀ε ∈ K>0 : ∀j0 ∈ N : ∃i ∈ {j0, j0 + 1, . . .} : |ai − a| ≤ ε.
6Man zeigt dazu zunachst f(a+ b) ≥ f(a) + b. Dann sieht man, dass es fur n := n0 + (k0 − f(n0)) erfullt ist.
312 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
Wir definieren nun f : N −→ N rekursiv. Wahle f(1) := 1. Ist f(n) gewahlt, so wenden wir (2.25)mit ε := 1/(n + 1) und j0 := f(n) + 1 an. Fur das so erhaltene i setzen wir f(n + 1) := i. Dannist (af(n))n∈N eine Teilfolge und |af(n)− a| ≤ 1/n. Daraus folgt a = limn→∞ af(n). Da (ai)i∈N eineCauchy-Folge mit einer konvergenten Teilfolge ist, folgt mit Lemma 2.19 dann limi→∞ ai = a.
”(2) =⇒ (1)“: Angenommen K ist archimedisch und vollstandig. Sei ∅ 6= M ⊂ K, r ∈ K, ∀x ∈M : x ≤ r. Fur jedes q ∈ N finden wir ein p ∈ N mit qr ≤ p. Die Menge
Aq := {p ∈ Z | pq
ist obere Schranke von M}
ist somit nicht-leer. Zu einem x ∈M bestimme nun s ∈ Z mit s ≤ qx < s+ 1 (analog zu Aufgabe4a) auf Ubungsblatt 6). Dieses s ist untere Schranke von Aq ⊂ Z. Jede nach unten beschranktenicht-leere Teilmenge von Z hat ein Minimum. 7 Somit existiert
pq := minAq ∈ Z.
Dann ist also aq :=pqq ∈ Q eine obere Schranke von M , wohingegen
pq−1q keine obere Schranke
von M ist, d.h. es gibt ein xq ∈ M mit aq − (1/q) < xq. Es folgt fur alle q, i ∈ N: aq − (1/q) ≤ aiund dies wiederum besagt |aq − ai| ≤ max{1/q, 1/i}. Deswegen ist (ai)i∈N eine Cauchy-Folge, dieauf Grund der Annahme gegen ein a ∈ K konvergiert. Man sieht leicht, dass der Grenzwert vonoberen Schranken wieder eine obere Schranke ist. Ebenso sind alle ai− (1/i) keine obere Schranke,und da K archimedisch ist, gibt es keine kleinere obere Schranke von M . Mit anderen Worten: aist die kleinste obere Schranke von M , also a = supM .
3. Existenz und Eindeutigkeit der reellen Zahlen
Wir wollen nun zeigen, dass es mindestens ein Modell der reellen Zahlen gibt (Existenzaussa-ge), und dass je zwei Modelle (kanonisch) isomorph sind (Eindeutigkeitsaussage). Im Gegensatzzu Abschnitt 6.4 in Kapitel 2 wollen wir dies nicht mit Dedekindschen Schnitten, sondern mitCauchy-Folgen durchfuhren. Wie so oft in der Mathematik ist es am besten mit der Eindeutig-keitsaussage anzufangen, denn der Beweis der Eindeutigkeit liefert entscheidende Ideen fur denBeweis der Existenz. Die verwendete Technik heißt Vervollstandigung und ist in leicht veranderterForm fur viele Anwendungen der Mathematik (partielle Differentialgleichungen, Quantenmechanik,Allgemeine Relativitatstheorie,. . . ) sehr wichtig.
Sei CF die Menge aller Q-wertigen Cauchy-Folgen.
Angenommen (K,+, ·,≤) sei ein Modell der reellen Zahlen, d.h. (K,+, ·,≤) ist ein geordneterKorper mit Supremumseigenschaft. Wir betrachten wieder die injektive Abbildung iQ : Q −→ K,die Addition, Multiplikation und die Ordnung erhalt, siehe Lemma 5.7 in Kapitel 2. Fur (ai)i∈N ∈CF ist dann (iQ(ai))i∈N eine Cauchy-Folge in K. Da K die Supremumseigenschaft hat, existiertf((ai)i∈N) := limi→∞ iQ(ai). Wir erhalten eine Abbildung f : CF −→ K.
7Denn ist A solche eine Teilmenge und s eine unter Schranke dann ist {p − s | p ∈ A} ⊂ N und hat deswegen
nach Proposition 3.3 in Anhang 3 ein Minimum. Dann aber auch A.
3. EXISTENZ UND EINDEUTIGKEIT DER REELLEN ZAHLEN 313
Nun definieren wir eine Addition und Multiplikation auf CF :
+ : CF × CF → CF (ai)i∈N + (bi)i∈N := (ai + bi)i∈N
· : CF × CF → CF (ai)i∈N · (bi)i∈N := (ai · bi)i∈NMan sieht leicht, dass (CF,+, ·) ein kommutativer Ring mit Eins ist. Hierbei ist (0)i∈N das neu-trale Element der Addition und (1)i∈N das neutrale Element der Multiplikation. Es ist aber keinKorper, denn die Cauchy-Folge (0, 1, 1, 1, . . .) besitzt kein multiplikatives Inverses. Außerdem be-sagt Ubung 2.10, dass f Addition und Multiplikation erhalt.
Die Abbildung f ist nicht injektiv. Es gilt:
f((ai)i∈N) = f((bi)i∈N) ⇐⇒ (ai − bi)i∈N ist eine Nullfolge.
Definition 3.1. Fur (ai)i∈N, (bi)i∈N ∈ CF definieren wir die Relation ∼⊂ CF × CF durch
(ai)i∈N ∼ (bi)i∈N ⇐⇒ (ai − bi)i∈N ist eine Nullfolge.
Auf R := CF/ ∼ definieren wir Addition und Multiplikation wie folgt:
+ : R× R→ R [(ai)i∈N] + [(bi)i∈N] := [(ai + bi)i∈N]
· : R× R→ R [(ai)i∈N] · [(bi)i∈N] := [(ai · bi)i∈N]
Die Ordnung definieren wir wie folgt:
[(ai)i∈N] > [(bi)i∈N] :⇐⇒ ∃ε ∈ Q>0 : fur fast alle i ∈ N gilt ai ≥ bi + ε.
Man kann sich uberlegen, dass hierdurch eine totale Ordnung auf R definiert wird.
PROPOSITION 3.2. Die Addition und Multiplikation auf R sind wohldefiniert 8 und (R,+, ·,≤)ist ein geordneter Korper. Die Abbildung [ · ] : CF −→ R, (aj)j∈N 7→ [(aj)j∈N] bewahrt die Addi-tion, die Multiplikation und sendet die Eins von CF auf die Eins von R. (Man nennt dies einenHomomorphismus von Ringen mit Eins.)
Beweisskizze. Der Beweis ist nun einfach, nur die Existenz eines multiplikativen Inversen ist etwastrickreich. Das Null-Element ist [(0)i∈N] =: 0.
Sei [(bi)i∈N] 6= 0. Dann ist (bi)i∈N keine Nullfolge. Das heißt:
∃ε ∈ Q>0 : ∀i0 ∈ N : ∃i ∈ {i0, i0 + 1, . . .} : |bi| ≥ εWir 9 zeigen zunachst, dass {i ∈ N | bi = 0} endlich ist. 10
Angenommen {i ∈ N | bi = 0} ware unendlich groß, dann gibt es eine injektive Funktion f : N −→N mit ∀n ∈ N : bf(n) = 0. Dies bedeutet, dass (bi)i∈N eine Cauchy-Folge mit einer konvergenten
8”Wohldefiniert“ bedeutet hier: die Definition hangt nur von der Aquivalenzklasse ab und nicht von der Wahl
des Reprasentanten. Da wir ja eine Abbildung definieren wollen, die einer Aquivalenzklasse etwas zurodnet, ist dieseEigenschaft das, was wir zeigen mussen, um zu sehen, dass diese Definitionen von + und · sinnvolle Definitionen
sind.9Beweis ab hier etwas anders als in der Vorlesung auf Grund einer Nachfrage10Die leere Menge ist auch endlich, ist also hier nicht ausgeschlossen.
314 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
Teilfolge ist. Wenn wir nun Lemma 2.19 anwenden, folgt daraus, dass (bi)i∈N eine Nullfolge ist. Dasheißt wir erhalten den Widerspruch [(bi)i∈N] = 0. Wir haben somit gesehen, dass {i ∈ N | bi = 0}endlich ist.
Nun definieren wir
bi :=
{bi falls bi 6= 0
1 falls bi = 0
Fur fast alle i ∈ N gilt bi = bi, und somit bekommen wir auch [(bi)i∈N] = [(bi)i∈N]. Auf die Folge
(bi)i∈N konnen wir nun Proposition 2.12 (4) anwenden. Wir sehen, dass
ci :=1
bi=
{(bi)−1 falls bi 6= 0
1 falls bi = 0
eine Cauchy-Folge ist.
Es gilt dann fur fast alle i ∈ N: ci · bi = 1, und deswegen gilt
[(ci)i∈N] · [(bi)i∈N] = [(ci)i∈N] · [(bi)i∈N] = [(1)i∈N].
Man beachte: die obige Definition, die obige Proposition und der Beweis benotigen die Existenzeines Modells nicht.
Beweis der Eindeutigkeit bis auf Isomorphie. Nehmen wir also wieder wie oben an, dass einModell (K,+, ·,≤) existiert. Dann gibt es genau eine Abbildung F : R −→ K, so dass das folgendeDiagramm kommutiert11
CF K
R
f
[ · ]F
Alle Abbildungen hier erhalten Addition und Multiplikation und bilden die Eins auf die Eins ab.Außerdem ist F injektiv und erhalt die Ordnung. Da R archimedisch geordnet ist, erhalten wir ausWS 2013/14 Aufgabe 4d) von Ubungsblatt 6, dass f : CF −→ K und somit F : R −→ K surjektivist. Also ist F : CF −→ K ein Isomorphismus von geordneten Korpern und Satz 6.8 aus Kapitel 2
folgt im Fall K = R. Wenn nun (K,+, · ≤) und (K, +, ·, ≤) zwei Modelle der reellen Zahlen sind,
so erhalten wir Isomorphismen F : R −→ K und F : R −→ K. Dann ist auch F ◦ F−1 : K −→ K
ein Isomorphismus und Satz 6.8 aus Kapitel 2 ist fur alle K gezeigt.
11”kommutiert“ bedeutet hier F ◦ [ · ] = f .
3. EXISTENZ UND EINDEUTIGKEIT DER REELLEN ZAHLEN 315
Wie bereits in Lemma 5.7 aus Kapitel 2 gesehen, gibt es nun eine injektive Abbildung iQ : Q −→R, die Addition, Multiplikation und die Ordnung erhalt. Es gilt hier iQ(a) = [(a)i∈N], d.h. dierationalen Zahlen werden von konstanten Cauchy-Folgen reprasentiert.
Beweis Existenz. Wir zeigen, dass (R,+, ·,≤) archimedisch und vollstandig ist. Dann haben wiralso ein Modell, d.h. Satz 6.7 aus Kapitel 2 ist gezeigt.
Zur archimedischen Eigenschaft: Sei ein Element x ∈ R gegeben. Zu zeigen ist: es gibt ein n ∈ Nmit x ≤ iN(n). Es gibt nun eine Q-wertige Cauchy-Folge (ai)i∈N mit x = [(ai)i∈N]. Die Cauchy-Folge ist beschrankt, d.h. es gibt ein r ∈ Q mit ∀i ∈ N : |ai| ≤ r. Da Q archimedisch ist, gibt esein n ∈ N mit r ≤ n. Man zeigt dann leicht, dass
x = [(ai)i∈N] ≤ [(n)i∈N] = iN(n).
Zur Vollstandigkeit: Sei (xi)i∈N eine R-wertige Cauchy-Folge. Falls es ai ∈ Q gibt mit xi = iQ(ai) =(ai)n∈N,12 dann (ai)i∈N ∈ CF und es gilt dann
limi∈N
xi = [(ai)i∈N].
Der allgemeine Fall ist ein bisschen aufwandiger und soll nur skizziert werden. Wir schreiben
xi = [(ai,n)n∈N].
Man nutzt nun die Tatsache, dass sowohl (xi)i∈N eine Cauchy-Folge in R ist als auch dass fur allei ∈ N die Folge (ai,n)n∈N eine Cauchy-Folge in Q ist, und konstruiert damit eine streng monotonwachsende Abbildung f : N −→ N,13 so dass wiederum (ai,f(i))i∈N eine Cauchy-Folge ist. Mannennt solch eine Folge eine Diagonalfolge. Außerdem kann man nun
limi∈N
xi = [(ai,f(i))i∈N]
zeigen.
Ab jetzt identifizieren wir Q mit seinem Bild in R vermoge iQ.
12Hier ist kein Druckfehler. Gemeint ist die konstante Folge, die konstant ai ist.13Hier steckt etwas Konstruktionsarbeit, die wir (momentan) uberspringen.
ANHANG Z
Uberblick uber algebraische Strukturen
(Aa) Addition ist assoziativ.Fur alle x, y, z ∈ X gilt
(x+ y) + z = x+ (y + z).
(An) Addition hat neutrales Element.Es gibt ein Element 0 ∈ X, so dass fur alle x ∈ X gilt
x+ 0 = 0 + x = x.
Man nennt 0 das neutrale Element der Addition.(Ai) Addition hat inverse Elemente.
Zu jedem x ∈ X gibt es ein y ∈ X, so dass
x+ y = y + x = 0.
Man nennt y das Inverse von x bezuglich der Addition und schreibt normalerweise −xanstelle von y.
(Ak) Addition ist kommutativ.Fur alle x, y ∈ X gilt
x+ y = y + x.
(Ma) Multiplikation ist assoziativ.Fur alle x, y, z ∈ X gilt
(x · y) · z = x · (y · z).(Mn) Multiplikation hat neutrales Element.
Es gibt ein Element 1 ∈ X, so dass fur alle x ∈ X gilt
x · 1 = 1 · x = x.
Man nennt 1 das neutrale Element der Multiplikation.(Mi) Multiplikation hat inverse Elemente.
Zu jedem x ∈ X r {0} gibt es ein y ∈ X, so dass
x · y = y · x = 1.
Man nennt y das Inverse von x bezuglich der Multiplikation und schreibt normalerweisex−1 anstelle von y.
317
318 Z. UBERBLICK UBER ALGEBRAISCHE STRUKTUREN
(Mk) Multiplikation ist kommutativ.Fur alle x, y ∈ X gilt
x · y = y · x.(AMd) Addition und Multiplikation erfullen das Distributionsgesetz.
Fur alle x, y, z ∈ X gilt
x · (y + z) = x · y + x · z(y + z) · x = y · x+ z · x
Literaturverzeichnis
[1] H. Amann, J. Escher, Analysis I, Birkhauser
[2] H. Amann, J. Escher, Analysis II, Birkhauser[3] H. Amann, J. Escher, Analysis III, Birkhauser
[4] H. Amann, Gewohnliche Differentialgleichungen, de Gruyter
[5] G. Aumann, O. Haupt, Einfuhrung in die reelle Analysis, de Gruyter[6] M. Barner, F. Flohr, Analysis I, de Gruyter
[7] M. Barner, F. Flohr, Analysis II, de Gruyter
[8] C. Blatter, Analysis 1, Springer[9] T. Brocker, Analysis I, Spektrum
[10] T. Brocker, Analysis II, BI Wissenschaftsverlag[11] E. A. Coddington, N. Levinson, Theory of ordinary differential equations, McGraw Hill
[12] O. Deiser, Einfuhrung in die Mengenlehre, Springer
[13] H.D. Ebbinghaus, Einfuhrung in die Mengenlehre, BI Wissenschaftsverlag[14] O. Forster, Analysis 1, Vieweg Studium
[15] O. Forster, Analysis 2, Vieweg Studium
[16] O. Forster, Analysis 3, Vieweg Studium[17] U. Friedrichsdorf, A. Prestel, Mengenlehre fur den Mathematiker, Vieweg Studium
[18] D. Grieser, Analysis I, Spriger Studium Mathematik
[19] D. Grieser, Vorlesungsskript Analysis I, Universitat Oldenburg[20] P. R. Halmos, Naive Mengenlehre, Vandenhoeck und Ruprecht
[21] S. Hildebrandt, Analysis I, Springer
[22] K. Konigsberger, Analysis 1, Springer[23] K. Konigsberger, Analysis 2, Springer
[24] S. Lang, Real and functional analysis, Springer[25] C. Loh, Vorlesungsskript Analysis I, Universitat Regensburg
[26] C. Loh, Vorlesungsskript Analysis II, Universitat Regensburg
[27] A. Peyerimhoff, Gewohnliche Differentialgleichungen I und II, Akademische Verlagsgesellschaft Wiesbaden[28] L. Perko, Differential equations and dynamical systems, Third edition, Springer
[29] B. v. Querenburg, Mengentheoretische Topologie, Springer
[30] W. Rudin, Analysis, Oldenbourg[31] W. Rudin, Reelle und komplexe Analysis, Oldenbourg
[32] L. A. Steen, J. A. Seebach, Counterexamples in Topology[33] W. Walter, Analysis 1, Springer[34] W. Walter, Analysis 2, Springer
[35] W. Walter, Gewohnliche Differentialgleichungen, Springer
319
Stichworte
C1-Diffeomorphismus, 232
C`-Diffeomorphismus, 232
C`-Immersion, 243
n-dimensionale Sphare, 235
p-Norm, 178
Aquivalenzklasse, 303
Aquivalenzrelation, 23
aquivalent, 6, 8
aquivalente Normen, 180
uberabzahlbar, 29
Abbildung, 26
abgeschlossen, 128
abgeschlossene Hulle, 187
Ableitung, 135, 203
der Umkehrfunktion, 139
Abschluss, 187
Absolutbetrag, 53
absolute Konvergenz, 100
abzahlbar, 29
Addition, 298
von Dedekindschen Schnitten, 62
Allquantor, 16
alternierende Reihe, 101
analytisch, 175
Anfangswert, 263
antisymmetrisch, 23
archimedisch geordneter Korper, 52
archimedisches Axiom, 52
Attraktor, 285
auf Y induzierte Topologie, 186
Aussage, 5
Aussageform, 7
aussagenlogische Formel, 7
aussagenlogische Verknupfung, 6
Aussonderungsmengenaxiom, 291
Auswahlaxiom, 291
autonom, 257
Axiom
archimedisches, 52
Axiome der Mengenlehre, 290
Axiome der reellen Zahlen, 4
Ball , 128
Banachraum, 182
beschrankt, 56, 77, 305
beschrankt im normierten Raum, 179
beschrankte Funktion, 178
Betragsfunktion, 53
der komplexen Zahlen, 73
bijektiv, 27
Bild, 30
Bild der Relation, 25
Binomialkoeffizient, 44
Bolzano-Weierstraß
Satz von, 89, 181
Cauchy-Folge, 89, 307
Cauchy-Produkt, 107
Dedekindscher Schnitt, 60
Definitheit der Norm, 177
Definitionsbereich, 25
Definitionsmenge, 12
Dezimal-Darstellung, 91
dicht, 188
Diffeomorphismus, 232
Differential, 203
Differentialgleichung
autonome, 257
explizite gewohnliche, 260
gewohnliche, 257
homogen, 273
inhomogen, 273
lineare, 273
partielle, 258
Differenz
321
322 STICHWORTE
symmetrische, 14
Differenzenquotient, 135
differenzierbar, 135, 203disjunkt, 15
diskrete Topologie, 186
Divergenzvon Folgen, 77, 305
Dreiecksungleichung der Norm, 177
Einbettung, 247
Einschrankung, 27
elliptisches Paraboloid, 224endlich, 29
endliche Teiluberdeckung, 196
Entwicklungspunkt, 144Erhaltungsgroße, 261
Ersetzungsaxiom., 291
erstes Integral, 261erweiterten reellen Zahlen, 84
euklidischen Abstand, 127Eulersche Zahl, 113
Existenzquantor, 16
explizite gewohnliche Differentialgleichung, 260explizite lineare gewohnliche Differentialgleichung,
273
Exponentialfunktion, 109Exponentialreihe, 108
Extensionalitat, 291
Extremumlokales, 140, 252
Fakultat, 298Familie, 31
fast alle, 95, 310
Flache, 237Fluss, 281
Flusslinie, 260
FolgeM -wertige, 31
in M , 31
von Funktionen, 167Folgen, 77
beschrankte, 77
monotone, 82folgenkompakt, 131, 193folgenstetig, 117, 190Formel
aussagenlogische, 7
Fundamentalsatz der Algebra, 74Fundierungsaxiom, 291
Funktion
beschrankte, 178
reell-wertige, 26
Funktionalgleichung
der Exponentialfunktion, 109
der Logarithmusfunktion, 124
Godelscher Unvollstandigkeitssatz, erster, 292
Godelscher Unvollstandigkeitssatz, zweiter, 292
ganze Zahlen, 47
Gaußschen Zahlenebene, 71
Gebiet, 213
geometrische Reihe, 94
geordneter Korper, 50
gewohnliche Differentialgleichung, 257
autonome, 257
explizite, 260
lineare, 273
gewohnliche Differentialgleichung mit getrennten
Variablen, 279
gleich machtig, 29
gleichmaßig stetig, 199
gleichmaßig stetig auf [a, b], 155
Grad, 74
Grad des Polynoms, 53
Graph, 26
Grenzwert, 77
Grenzwert der Folge, 305
Grenzwert von Funktionen, 133
Haufungspunkt der Folge, 84
Haufungspunkt einer Menge, 131
harmonische alternierende Reihe, 102
harmonische Reihe, 94
Hauptsatz der Differential- und Integralrechnung
Teil I, 156
Teil II, 158
Hausdorff-Eigenschaft, 188
Hausdorffraum, 188
Heine-Borel-Eigenschaft, 195
Hesse-Abbildung, 214
Hesse-Matrix, 214
Hilbertraum, 182
homoomorph, 199
Homoomorphismus, 198
homogen, 273
Homogenitat der Norm, 177
Homomorphismus von Ringen mit Eins, 313
hyperbolisches Paraboloid, 224
Hyperflache, 238
Identitat, 26
STICHWORTE 323
imaginar, 72
Imaginarteil, 72
Immersion, 243implizit definierte, 235
indefinit, 222
Induktionsanfang, 37, 296Induktionsaxiom, 35, 293
Induktionsschritt, 37, 296
Induktionsvoraussetzung, 37, 296induktiv, 291, 294
induzierte Metrik, 127, 179auf Teilmenge, 127, 166
von Norm, 179
induzierte Normauf Unterraum, 178
induzierte Topologie
von Teilmenge, 186Infimum, 56
inhomogen, 273
injektiv, 27Inklusion, 26
Innere, 187
inneren Kern, 187Integralkurve, 260
Integration
durch Substitution, 160partielle, 160
Intervalle, 84Isometrie, 127
isomorph (als Ring), 49
Isomorphismus von Ringen, 49
Jacobi-Matrix, 209
k-mal stetig differenzierbar, 142Korper, 50
archimedisch geordneter, 52
der komplexen Zahlen, 71der rationalen Zahlen, 49
der reellen Zahlen, 55
geordneter, 50Korper der rationalen Funktionen, 53
kanonische Projektion, 304
Klassen, 290Klumpentopologie, 186Koeffizienten, 74kommutativer Ring, 48kompakt, 196
Komplement, 14komplexe Exponentialfunktion, 109
komplexe Konjugation, 73
komplexe Zahlen, 71Komponente, 32
Komposition, 27
Komprehension, 291Kontraktion, 183
Konvergenzuneigentliche, 84
von Folgen, 77
Konvergenzradius, 99konvergiert, 130
absolut, 100, 162
gegen ∞, 84gegen unendlich, 84
gleichmaßig, 168
in R, 85
punktweise, 167
Kosinus, 111Kreiszahl π, 125
kritischen Punkt, 225
kritischer Punkt, 252, 285
Losung, 257
Losungsintervall, 257Lagrange-Multiplikatoren, 252
Lagrangesche Restglieddarstellung, 143
Lebesguesche Zahl, 200leere Menge, 12
Leibniz-Regel, 101
Leitkoeffizient, 74Limes, 77
Limes inferior, 87
Limes superior, 87Linearisierung, 286
linksseitige Grenzwert oder Limes, 133Lipschitz-Konstante, 262
Ljapunow-Funktion, 286
Logarithmus, 124lokal Orts-Lipschitz-stetig, 263
lokal umkehrbar, 228
lokale C`-Parametrisierung, 247lokales Extremum, 140, 225, 252
lokales Maximum, 140, 225, 252
lokales Maximum oder Minimum, 225lokales Minimum, 140, 225, 252lokales striktes Maximum, 225
lokales striktes Minimum, 225lokalkonstant, 213
machtiger, 29Majorante, 96
Majoranten-Kriterium, 96
324 STICHWORTE
maximale Losungs-Intervall, 269
Maximum, 40, 300
lokales, 225, 252lokales striktes, 225
Menge, 11
der ganzen Zahlen, 47der komplexen Zahlen, 71
der naturlichen Zahlen, 36, 298
der rationalen Zahlen, 49der reellen Zahlen, 55
leere, 12
Mengensystem, 19Metrik, 127
metrischer Raum, 127, 165, 183Minimum, 40, 300
lokales, 225, 252
lokales striktes, 225Minkowski-Ungleichung, 178
Mittel
arithmetisches, 54geometrisches, 54
Mittelwertsatz
erster, 141zweiter, 141
Modell der naturlichen Zahlen, 293
Multiplikation, 298von Dedekindschen Schnitten, 64
Multiplizitat der Nullstelle, 75
nach oben beschrankt, 56
nach unten beschrankt, 56
Nachfolger-Abbildung, 35, 293Naturliche Zahlen, 3
Negation, 6
negativ definit, 222negativ semi-definit, 222
nicht zusammenhangend, 191normierten Vektorraum, 177
Nullfolgen, 78, 305
Nullstelle, 74
obere Schranke, 56
Oberintegral, 149
Oberklasse, 61offen, 128offene Uberdeckung, 195offene Menge in (X,O), 186Ordnung, 23
partielle, 23totale, 24
Ordnungsrelation, 23
Orts-Lipschitz-stetig, 262
Paar, (geordnetes), 20
Paarmengenaxiom, 291
Paraboloid
elliptisches, 224
hyperbolisches, 224
Parametrisierung
lokale ∼ einer Untermannigfaltigkeit, 247
Partialsumme, 93
partiell differenzierbar, 205
partielle Ableitung, 205
partielle Differentialgleichung, 258
Partielle Integration, 160
partielle Ordnung, 23
Partition, 147
Peano-Axiome, 35, 293
Permutation, 43
polynomiale Funktion, 74
positiv definit, 222
positiv semi-definit, 222
Potenzieren, 298
Potenzmenge, 19
Potenzmengenaxiom, 291
Potenzreihe, 98
Produkt
von Dedekindschen Schnitten, 64
Produkt, (kartesisches), 20
Produkt, (kartesisches,) von Mengenfamilien, 32
Produktregel, 137
Produktreihe, 106
Produktreihensatz, 106
Produkttopologie, 186
Produktzeichen, 36
Punkt
kritischer, 252
stationarer, 252
Quadrupel, 22
Quintupel, 22
Quotienten-Kriterium, 97
Quotientenregel, 137
Rand, 187
rationale Zahlen, 49
Realteil, 72
rechtsseitige Grenzwert oder Limes, 133
reell-analytisch, 175
reelle Exponentialfunktion, 109
Reelle Zahlen, 55
reflexiv, 23
STICHWORTE 325
Regel
von Leibniz, 101
regularer Wert, 240
Reihe, 93
alternierende, 101
rein imaginar, 72
rekursive Definition, 297
Relation, 22
Relation, funktionale, 24
Reprasentant, 303
reprasentiert, 303
Restglied, 143
Restriktion, 27
Richtungsableitung, 205
Riemann-Integral, 149
Riemann-integrierbar, 149
Riemannscher Umordnungssatz, 103
Riemannsches Kriterium, 149
Ring, 48
der ganzen Zahlen, 47
kommutativer, 48
Ring mit Eins, 48
Russellsche Paradoxon, 289
Satz
uber 1. Ableitung in Extrema, 140
uber 2. Ableitung in Extrema, 142
vom Cauchy-Produkt, 107
von Blozano-
Weierstraß, 89
von Bolzano-
Weierstraß fur endl.-dim. Vektorraume, 181
von Dedekind, 68
von Rolle, 140
von Schroder-Bernstein, 29
von Taylor, 143
Satz von Taylor, 220
Schnitt, 13, 14
Schnittmenge, 14
singularen Wert, 240
Sinus, 111
Spurtopologie, 186
stabil, 285
Stammfunktion, 157
stationaren Punkt, 225
stationarer Punkt, 252
sternformig bezuglich x0 ∈ A, 192
stetig, 118, 128, 188
stetig differenzierbar, 142, 207
stetig in x0, 188
streng monoton wachsend, 306
Substitution, 160
Summe
von Dedekindschen Schnitten, 62
Summenzeichen, 36
Supremum, 56
Supremums-Distanz, 168
Supremumseigenschaft, 57
Supremumsnorm, 178
surjektiv, 27
symmetrisch, 23
Tangentialraum, 250
Taylor-Polynom, 144
Taylorreihe, 144
Teiluberdeckung
endliche, 196
Teilfolge, 83, 306
Teilmenge, 12
echte, 12
Teilsumme, 93
tertium non datur, 5
Topologie, 185
topologischer Raum, 186
total differenzierbar, 203
totale Ordnung, 24
transitiv, 23
Trennungszahl, 68
Treppenfunktion, 147
Tripel, 22
Umgebung, 128
Umkehrabbildung, 28
Umkehrung, 28
Umordnung, 103
uneigentliche Konvergenz, 84
Uneigentliches Riemann-Integral, 161
unendlich, 29
Unendlichkeitsaxiom, 291
untere Schranke, 56
Unterintegral, 149
Unterklassen, 61
Untermannigfaltigkeit, 237
Untermannigfaltigkeitskarte, 237
Urbild, 30
Vektorfeld, 260
Vereinigung, 14
Vereinigungsaxiom, 291
Verkettung, 27
Verknupfung
326 STICHWORTE
aussagenlogische, 6
Vervollstandigung, 312
vollstandig, 90, 166, 310Vollstandige Induktion, 37, 296
vollstandiges Vektorfeld, 283
Wahrheitstafel, 6
wegzusammenhangend, 192
wohldefiniert, 52wohlgeordnete Menge, 301
Wohlordnung, 301
Wohlordnung von N, 40Wronski-Determinante, 276
Wurzel-Kriterium, 97
Zerlegung, 147
Zielbereich, 26
Symbole
(e1, . . . , en), Standardbasis von Rn, 180
:=, 2
B(D,K), beschrankte Funktionen, 178
C0((a, b)), 142
C∞((a, b)), 142
Ck((a, b)), 142
Lσ , 240
Sk, 240
∩, ∪, r, ∆, 14
◦, 27
deg(P ), 74
dglm, 168
dsup, 168
∅, 12
∃,∀, 16
exp, 109
⇐⇒, =⇒, 9
inf, Infimum, 56
limi→∞ ai, 305
limj→∞ aj , 77
limx→x0 , Grenzwert von Funktionen, 133
lim inf, Limes inferior, 87
lim sup, Limes superior, 87
N, 3
N>0, 3
Q, 49
R, 12, 55
R>0, 12
Z, 47
P(M), 19
max, Maximum, 40
min, Minimum, 40
¬, 6∏nj=1, 36
dre, 82
brc, 82
⊂, (, 12∑nj=1, 36
sup, Supremum, 56
×, 20∧, ∨, Y, →, ←, ↔, 6
{}, 12
ai → a, 305aj → a, 77
f ′, Ableitung von f , 135
f#(N), Urbild von N unter f , 30
f (k), k-te Ableitung, 142
f#(M), Bild von M unter f , 30
p-Norm, 178
327