Current 2
Current 2
Current 2
Analysis 1
Vorlesung Winter 2015/6, Bonn
3 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.1 Elementare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.1 Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2.2 Der Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2.3 Die trigonometrischen Funktionen . . . . . . . . . . . . . . . . . . . . . . 62
3.3 Stetigkeit und lokales Verhalten von Funktionen . . . . . . . . . . . . . . . . . 63
v
vi Inhaltsverzeichnis
5 Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.1 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.2 Das Riemann Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.2.1 Der Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.2.2 Riemann Summen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.3 Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . 102
5.4 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.5 Summen und Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6 Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.1 Lösung durch Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.2 Existenz- und Eindeutigkeitssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.3 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.4 Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . . . . . 115
6.5 Anwendungen des Eindeutigkeitssatzes . . . . . . . . . . . . . . . . . . . . . . . . 116
6.6 Lineare Differentialgleichungen mit konstanten Koeffizienten,
oder: Analysis trifft lineare Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.7 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.8 Zurück zu linearen Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . 123
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
Kapitel 1
Logik, Mengen, Zahlen
Wir beginnen die Vorlesung mit einigen elementaren Vorbereitungen. Diese betref-
fen zunächst Elemente der Aussagenlogik und der Mengenlehre. Danach beginnen
wir mit der Einführung der Zahlensysteme. Eine wesentlich detailliertere Darstel-
lung die ich sehr empfehle findet sich in dem Buch Analysis 1 von Terence Tao
[6]. Auch wenn wir später einen pragmatischeren Standpunkt einnehmen werden,
so sind die die hier behandelten Konzepte wichtig für die Technik des Beweisens.
Es gibt uns auch Gelegenheit, das formale Beweisen an elementaren Sachverhalten
zu üben. Weitere Lehrbücher sind etwa Königsberger [4] und Forster [2].
1.1 Aussagenlogik
Unter einem Objekt wollen wir alles verstehen, worüber wir sprechen können. Ob-
jekte werden wir in der Regel durch Buchstaben symbolisieren. Wir sagen dann
etwa ’Sei ω ein Objekt’ und machen dann Aussagen, die dieses Objekt näher be-
schreiben. Wir könnten statt Buchstaben auch kleine Bildchen benutzen, aber es ist
praktisch, Buchstaben zu nehmen, da wir diese leicht wieder erkennen. Die Kenntnis
des lateinischen und griechischen Alphabets setzen wir ab sofort voraus. Da diese
Alphabete über sehr wenige Buchstaben verfügen, werden wir auch zusammenge-
setzte Symbole benutzen, wie etwa a1 , b x , etc.. Buchstaben die in verschiedenen
Schriftarten geschrieben sind, repräsentieren a priori nicht das gleiche Objekt. So
können wir gleichzeitig von den Objekten n, N, N, und N sprechen, die alle etwas
verschiedenes sind.
Unter Aussagen verstehen wir Objekte, denen ein Wert wahr oder falsch zuge-
ordnet werden kann. Wir nehmen an, wir hätten eine Sammlung sogenannter ele-
mentarer Aussagen, für die diese Zuordnung bekannt ist. Ziel der Aussagenlogik ist
es, aus elementaren Aussagen neue Aussagen zu gewinnen und deren Bewertung zu
bestimmen.
Die Gewinnung neuer Aussagen geschieht mittels der logischen Operationen ∧
(und), ∨ (oder), ⇒ (wenn, dann) und ¬ (Negation). Die ersten drei Operationen
1
2 1 Logik, Mengen, Zahlen
bilden aus zwei Aussagen eine neue Aussage, die letztere verwandelt eine Aussage
in einen andere. Es gelten folgende Regeln:
¬ Wenn a wahr, dann ¬a falsch; wenn a falsch, dann ¬a wahr;
∧ Wenn a wahr und b wahr, dann a ∧ b wahr, in allen anderen Fällen ist a ∧ b
falsch;
∨ Wenn a falsch und b falsch, dann ist a ∨ b falsch, in allen anderen Fällen ist a ∨ b
wahr;
⇒ Wenn a wahr und b falsch, dann ist a ⇒ b falsch, in allen anderen Fällen ist
a ⇒ b wahr.
Es ist etwas unerfreulich, dass wir zur Definition dieser Begriffe auf Umgangs-
sprache zurückgreifen müssen, also insbesondere das Wort wenn benutzen, um die
Implikation wenn, dann zu definieren.
Aus den elementaren logischen Operationen kann man noch einige wichtige
kombinierte Operationen konstruieren. Insbesondere
⇔: a ⇔ b bezeichnet die Aussage (a ⇒ b) ∧ (b ⇒ a). a ⇔ n ist wahr, wenn a
wahr und b wahr sowie wenn a falsch und b falsch ist; in allen anderen Fällen ist
a ⇔ b falsch;
XOR: a XOR b bezeichnet die Aussage ¬(a ⇔ b).
In der Mathematik geht es weitgehend darum, Aussagen zu machen, die nachge-
wiesenermaßen wahr sind. Solche Aussagen nennen wir Lemma, Satz oder Theo-
rem. Um eine Aussage zu einem solchen zu machen, benötigen wir einen Beweis.
Im Prinzip geht das dadurch, dass wir wahre Aussagen finden, die nur dann wahr
sein können, wenn unsere gewünschte Aussage wahr ist. Dabei hilft es, dass gewisse
Aussagen einen bekannten Wahrheitswert haben.
Lemma 1.1. Sei a eine beliebige Aussage. Gilt:
(i) Die Aussage a ∨ ¬a ist stets wahr;
(ii) Die Aussage a ∧ ¬a ist stets falsch.
Beweis. Offensichtlich. t
u
Eine beliebte Vorgehensweise ist der Beweis durch Widerspruch. Das geht so.
Satz 1.2. a ist wahr.
Beweis. Wir suchen eine Aussage b von der wir wissen, dass ¬b wahr ist und gleich-
zeitig ¬a ⇒ b wahr ist. Dann wissen wir, dass ¬a falsch ist, also a wahr ist. u
t
In der Mathematik benötigen wir, um überhaupt etwas beweisen zu können Aus-
sagen, die als wahr festgelegt werden. Diese nennen wir Axiome. Von Axiomen
zu unterscheiden sind Definitionen. Eine Definition beschreibt eine Klasse von Ob-
jekten, für die gewisse Aussagen wahr sind. Zum Beispiel ’Ein Schlüssel ist ein
Objekt mit dem man Schlösser öffnet’ definiert eine Klasse von Objekten, die wir
Schlüssel nennen. Die Aussage ’Ein Schlüssel öffnet Schlösser’ ist dann eine wahre
Aussage, wobei zunächst unklar ist, ob es solche Objekte gibt. Die Aussage ’Es gibt
Schlüssel’ als wahr zu setzen wäre dagegen ein Axiom, falls man diese nicht durch
Vorzeigen eines Schlüssels beweisen kann.
1.2 Mengen 3
1.2 Mengen
Die Mengenlehre ist eine konzeptuell sehr tiefe und anspruchsvolle Theorie. Sie
nimmt ihren Ursprung in einer Arbeit von Georg Cantor aus dem Jahr 1874 [1]. Wir
können in dieser Vorlesung auf diese Aspekte nicht eingehen und betrachten nur
einige elementare Aspekte, die für uns wichtig sind.
Eine Menge ist eine Sammlung von Objekten. Dies können wir formal durch
eine Relation ∈ beschreiben. Gegeben ein Objekt ω und eine Menge A, so sagen
wir, die Aussage ω ∈ A sei wahr, wenn ω in A enthalten ist. Wir sagen dann auch,
ω ist Element von A. Die Menge A ist dann die Sammlung aller Objekte ω, für
die ω ∈ A wahr ist. Eine besondere Rolle spielt die Menge ∅, die leere Menge, die
die Eigenschaft hat, dass es kein Objekt gibt, dass in ihr enthalten ist, also dass die
Aussage ω ∈ ∅ stets falsch ist. Statt ¬(ω ∈ A) schreiben wir auch ω < A.
In natürlicher Weise können Mengen in Beziehung zueinander stehen.
Definition 1.3 (Teilmengen). Sind A und B zwei Mengen, so schreiben wir A ⊆ B
wenn die Aussage ω ∈ A ⇒ ω ∈ B stets (d.h. für jedes Objekt ω) wahr ist. Wir sagen
dann, A ist Teilmenge von B. Falls A ⊆ B und B ⊆ A, dann sagen wir A = B, A
gleich B. Wenn A nicht gleich B ist aber A ⊆ B, so sagen wir A ⊂ B, A ist strikt in B
enthalten. Statt ¬(A = B) schreiben wir auch A , B.
Als nächstes können wir Mengenoperationen einführen.
Definition 1.4 (Mengenoperationen). Seien A and B Mengen.
(i) Wir schreiben C = A ∪ B für die Aussage ω ∈ C ⇔ ω ∈ A ∨ ω ∈ B. Wir nennen
A ∪ B die Vereinigung von A und B.
(ii) Wir schreiben C = A ∩ B für die Menge, für die die Aussage ω ∈ C ⇔ ω ∈
A ∧ ω ∈ B wahr ist. Wir nennen A ∩ B den Durchschnitt von A und B.
(iii) Wenn A ⊆ B, so schreiben wir C = B\A für die Menge, für die die Aussage
ω ∈ C ⇔ ω ∈ B ∧ ω < A) wahr ist. C ist die Differenz der Mengen B und A.
(iv) Die nennen die Menge C = A∆B = (A ∪ B)\(A ∩ B) die symmetrische Differenz
der Mengen A und B.
Das folgende Lemma beantwortet die Frage, ob diese Definitionen sinnvoll sind.
Beweis. Wir beweisen nur, dass C = A ∪ B eindeutig festgelegt ist. Der Rest ist
als Übungsaufgabe zu lösen. Angenommen es gäbe zwei verschiedene Mengen
C,C 0 , so dass sowohl die Aussage ω ∈ C ⇔ ω ∈ A ∨ ω ∈ B als auch die Aussage
ω ∈ C 0 ⇔ ω ∈ A ∨ ω ∈ B für alle ω wahr sind. Wir können ohne Beschränkung der
Allgemeinheit annehmen, dass C , ∅. Wenn nun C , C 0 , so gibt es mindestens ein
Element, ω, so dass ω ∈ C ∧ ω < C 0 , oder umgekehrt, ω ∈ C 0 ∧ ω < C. Angenommen
es gelte ersteres (das Argument im zweiten Fall ist identisch). Dann muss die Aus-
sage ω ∈ A ∨ ω ∈ B wahr sein weil ω ∈ C und gleichzeitig muss die selbe Aussage
falsch sein, da ω < C 0 . Dies ist aber unmöglich, da eine Aussage nicht gleichzeitig
4 1 Logik, Mengen, Zahlen
wahr und falsch sein kann. Da wir dies aber aus der Aussage C , C 0 geschlossen
haben, muss diese falsch sein. u
t
Wir unterscheiden zwischen einem Objekt ω und der Menge {ω} die nur das ein
Element ω enthält. Insbesondere ist die leere Menge nicht gleich der Menge {∅}, die
die leere Menge als Element enthält. So ist auch ∅ ⊂ ∅, aber ∅ < ∅ und ∅ ∈ {∅}.
Beachte, dass Mengen selbst auch Objekte sind. Daher kann man Mengen be-
trachten, deren Elemente Mengen sind. Ein Beispiel die Potenzmenge P(A) einer
Menge A: Ihre Elemente sind alle Mengen B mit der Eigenschaft B ⊆ A.
Im letzten Beispiel habe wir gesehen, dass eine Menge implizit definiert werden
kann durch die Beschreibung der Eigenschaften ihrer Elemente. Dies kann aller-
dings zu logischen Paradoxa führen, wie etwa Russels Paradox von der ’Menge
aller Mengen, die sich nicht selbst enthalten’. Nicht alle Aussagen definieren eine
Menge.
Sehr viele Aussagen betreffen Mengen. So etwa die Aussage ω ∈ A oder A ⊂ B.
Zwei wichtige Typen von Aussagen, die wir später immer wieder brauchen sind:
• ’Für alle Elemente ω einer Menge A ist die Aussage a(ω) wahr’. Wir schreiben
dies als ∀ω∈A a(ω). Sie ist logisch äquivalent zur Aussage ’ω ∈ A ⇒ a(ω)’. Das
Symbol ∀ nennt man den Allquantor.
• ’Es gibt eine Element ω ∈ A für das die Aussage a(ω) wahr ist. Wir schreiben:
∃ω∈A a(ω). Sie kann logisch ausgedrückt werden als: ’¬ (∀ω∈A ¬a(ω))’. ∃ heißt
der Existenzquantor.
Eine weitere fundamentale Operation auf Mengen ist die der Abbildung oder
Funktion. Hierzu benötigen wir den Begriff der Produktmenge.
schreiben.
Wir stellen uns eine Abbildung als eine Liste vor, in der jedem Element von A
ein Element von B zugeordnet ist.
Die Menge A nennt man auch Definitionsbereich der Funktion φ. Die Menge der
b ∈ B, so dass ein a ∈ A existiert, so dass (a, b) ∈ φ nennen wir das Bild von φ. Wir
schreiben für das Bild von φ auch Im(φ) oder φ(A).
Alternativ können wir uns eine Abbildung auch als einen Graphen vorstellen.
Von jedem Element in A geht genau ein Pfeil zu einem Element in B. Bei einer
surjektiven Abbildung ist jedes Element von B auch Ziel eines Pfeils, bei einer in-
jektiven Abbildung endet in jedem Element von B höchsten ein Pfeil und bei einer
bijektiven Abbildung endet in jedem Element von B genau ein Pfeil.
6 1 Logik, Mengen, Zahlen
Anmerkung. Die Bedingung, dass f surjektiv ist kann man in der Definition der
Komposition auch weglassen. Allerdings ist dann h ohnehin nur von der Ein-
schränkung der Funktion g auf den Bildbereich von f abhängig.
Ein weiterer wichtiger Begriff ist der der Äquivalenzrelation und der Äquivalenz-
klassen.
1.2 Mengen 7
Definition 1.10 (Äquivalenzrelation). Sei A eine Menge. Dann heißt eine Teilmen-
ge E ⊂ A × A eine Äquivalenzrelation, genau dann wenn gilt:
(i) ∀a ∈ A : (a, a) ∈ E;
(ii) (a, b) ∈ E ⇒ (b, a) ∈ E:
(iii) ((a, b) ∈ E ∧ (b, c) ∈ E) ⇒ (a, c) ∈ E.
Anstatt (a, b) ∈ E schreibt man oft auch a ∼ b.
Definition 1.11 (Äquivalenzklasse). Sei A eine Menge und E eine Äquivalenz-
relation. Sei a ∈ A. Dann heißt die Menge
Lemma 1.12 (Partition). Sei A eine nicht leere Menge und E eine Äquivalenz-
relation. Seien a ∈ A und b ∈ A. Dann gilt
Es gilt auch ∪a∈A [a] = A. Die zweite Aussage überlassen wir dem Leser.
Beweis. Falls [a] , [b], aber [a] ∩ [b] , ∅. Dann existiert c ∈ [a], so dass c ∈ [b]. Aus
der Eigenschaft (iii) folgt dann aber, dass (a, c) ∈ E und (b, c) ∈ E, also (b, a) ∈ E.
Mithin folgt [a] = [b]. ut
Die Äquivalenzklassen einer Menge bezüglich einer Äquivalenzrelation stellen
eine Zerlegung der Menge in disjunkte Untermengen dar. Eine solche Zerlegung
nennt man auch Partition.
Man kann auch umgekehrt vorgehen. Wenn wir eine Partition einer Menge ge-
geben haben, so können wir eine Äquivalenzrelation dadurch definieren, dass zwei
Elemente, die in der selben Teilmenge liegen, als äquivalent bezeichnet werden.
Wir werden sehr bald sehen, dass das Konzept der Äquivalenzklassen von absolut
zentraler Bedeutung in der Analysis ist.
1.3 Zahlen
Der Begriff der Zahlen ist zunächst intuitiv durch das Abzählen von Objekten ver-
stehbar. Es wäre nicht schwierig, endlich viele Zahlen einfach hinzuschreiben. Zum
Beispiel könnten wird die Menge der Zahlen von 1 bis 10 hinschreiben als
Definition 1.13 (Peano Axiome). Eine Menge N heißt die Menge der natürlichen
Zahlen, wenn folgendes gilt:
(i) 1 ∈ N.
(ii) Es gibt eine injektive Abbildung φ : N → N so, dass
(iia) Für alle n ∈ N ist φ(n) , n;
(iib) Für alle n ∈ N gilt (n, 1) < φ.
(iii) Die Menge N ist minimal, d.h. jede Teilmenge von N, die die Eigenschaften
(i), (ii) (mit der gleichen Abbildung φ eingeschränkt auf diese Teilmenge) erfüllt
ist gleich N.
Anmerkung. Man nennt die Bedingungen, die in der Definition von N aufgestellt
sind, oft Peano Axiome. Streng genommen sind dies aber keine Axiome, sondern
definierende Eigenschaften. Das eigentliche Axiom formulieren wir unten.
Anmerkung. Die Eigenschaft (iia) kann man aus der Injektivität und der Minima-
litätsforderung (iii) herleiten.
Die Forderungen in den Peano Axiomen sind gut gewählt. Wenn wir einzelne
Forderungen weglassen, so könnten wir seltsame Zahlensysteme konstruieren.
Beispiel 1.14. Wenn wir die Forderung (iia) fallenlassen (und die Injektivität), so
könnten wir wählen: N = {1, 2, 3, V} mit φ(1) = 2, φ(2) = 3, φ(3) = V, φ(V) = V. Das
wären dann Zahlen für Leute, die nur bis 3 zählen können. Alles was danach kommt,
heißt einfach V (viele).
Beispiel 1.15. Wenn wir die Bedingung (iib) fallen lassen, so könnten wir wählen
N = {1, 2, 3} und φ(1) = 2, φ(2) = 3, φ(3) = 1. Das wären also zyklische Zahlen.
Beispiel 1.16. Wenn wir die Bedingung (iii) fallen lassen, könnten wir N so wählen,
dass es Zahlen gibt, die nicht durch sukzessive Anwendung der Abbildung φ auf die
1 erhalten werden können. Diese brauchen wir zunächst nicht.
Wir werden φ(n) den Nachfolger von n nennen. Umgekehrt nennen wir n den
Vorgänger von φ(n). Wir sehen, dass jede natürliche Zahl einen Nachfolger hat, und
jede natürliche Zahl außer der 1 einen Vorgänger hat.
Wir haben nun also eine Menge N beschrieben, die gewisse Eigenschaften haben
soll. Die erste Frage ist, ob es diese Menge gibt.
Lemma 1.17. Es gibt keine endliche Menge, die die Eigenschaften der Menge N
hat.
10 1 Logik, Mengen, Zahlen
Da N also nicht endlich ist, können wir die Existenz dieser Menge nicht durch ex-
plizites Aufschreiben beweisen, so wie in den Beispielen endlicher Zahlensysteme
oben.
Wir müssen daher ihre Existenz als Axiom, also als eine als wahr festgesetzte
Aussage postulieren.
Axiom 1.18 Die Aussage ’Die Menge N existiert’ ist wahr.
Das nächste Lemma macht die Beobachtung, dass die Abbildung φ auf N keine
geschlossenen Zykeln bildet
Lemma 1.19. Sei n ∈ N. Dann ist φ(φ(n)) , n und ebenso für jede endliche Iteration
der Abbildung φ(φ(. . . (φ(n) . . . ))) , n.
Beweis. Wir betrachten zunächst den ersten Fall. Wir wissen, dass φ(n) = k ∈ N ist
und k , n. Also ist φ(n) = k und φ(k) = n. Da φ injektiv ist, gibt es keine andere
Zahl m ∈ N, so dass φ(m) = k oder φ(m) = n. Wenn nun N die Peano Axiome (i) und
(ii) erfüllt, so tut dies auch N\{k, n}, denn weder k noch n können 1 sein (Bedin-
gung (iib)), an der Eigenschaft (iia) sowie an der Injektivität ändert sich durch das
Entfernen vom k und n nichts. Schließlich ist das Bild von N\{k, n} in N\{k, n}, also
φ : N\{k, n} → N\{k, n}. Damit haben wir einen Widerspruch zu Bedingung (iii). Der
Fall, dass der m-te Nachfolger von n gleich n ist, kann ganz analog ausgeschlossen
werden. u t
Nachdem wir die Existenz der natürlichen Zahlen postuliert haben, könnte es
mehrere Mengen geben, die diese Eigenschaften haben. Hätten wir die Forderung
(iia) weggelassen, könnten wir z.B. {1, 2, 3, V} aber auch {1, 2, 3, 4, 5, V} als Zahl-
system wählen. Im Fall der natürlichen Zahlen können wir aber zeigen, dass alle
Mengen, die die Eigenschaften der natürlichen Zahlen haben, gleich aussehen.
Satz 1.20. Wenn zwei Mengen und Abbildungen (N, φ), (N0 , φ0 ) existieren, die die
Eigenschaften der Definition 1.13 erfüllen, dann gibt es eine bijektive Abbildung
b : N → N0 so, dass
(i) b(1) = 1,
(ii) Für alle n ∈ N gilt b(φ(n)) = φ0 (b(n)).
Beweis. Wir beweisen, dass die Eigenschaften (i) und (ii) b bereits vollständig
festlegen. Zunächst können wir (i) stets festlegen. Dann definieren wir b(φ(1)) =
φ0 (b(1)) = φ0 (1). Nun verwenden wir die vollständige Induktion. Wenn wir b(n)
kennen, so ist b(φ(n)) durch (ii) bestimmt. Damit ist b für alle n ∈ N bestimmt.
Also existiert eine Abbildung b : N → N0 . Als nächstes zeigen wir, dass b surjektiv
ist. Dazu müssen wir nachweisen, dass jedes n0 ∈ N0 im Bild von b liegt. Wieder
1.3 Zahlen 11
Abb. 1.6 Die natürlichen Zahlen plus ein extra Zykel von φ.
verwenden wir vollständige Induktion. Zunächst liegt 1 im Bild wegen (i). Nehmen
wir an, dass n0 im Bild von b liegt. Dann gibt es ein n ∈ N, so dass b(n) = n0 . Wegen
(ii), φ0 (n0 ) = φ0 (b(n)) = b(φ(n)), also liegt φ0 (n0 ) im BIld von b. Damit folgt dass alle
n0 ∈ N0 im Bild von b liegen. Schliesslich bleibt zu zeigen, dass b injektiv ist. Wir
müssen zeigen, dass für alle m , n, b(m) , b(n). Sei dazu ohne Beschränkung der
Allgemeinheit m > n. Zunächst ist wegen (ii), b(n + 1) = b(φ(n)) = φ0 (b(n)) > b(n).
Sei für k ∈ N b(n + k) > b(n). Dann ist b(φ(n + k)) = φ0 (b(n + k)) > b(n + k) > b(n).
Also ist für alle k ∈ N, b(n + k) , b(n). Somit ist b injektiv. Also ist b bijektiv. u t
Die beschriebene Definition der natürlichen Zahlen geht auf Peano [5] zurück.
Die Abbildung φ führt eine Ordnung auf der Menge N ein. Die Zahl m heißt
Nachfolger von n, falls (n, m) ∈ φ. Umgekehrt heißt n der Vorgänger von m. Jede
natürliche Zahl hat einen Nachfolger und jede, außer der 1, hat einen Vorgänger.
Definition 1.21 (Ordnung). Seien n, m ∈ N. Dann sagen wir m > n, falls
(i) m = φ(n), oder
(ii) Es gibt eine Zahl ` > n, so dass m = φ(`).
Wir schreiben m < n, wenn n > m. Wir schreiben auch (m ≤ n) ⇔ (m < n) ∨ (m = n)
und (m ≥ n) ⇔ (m > n) ∨ (m = n)
Die Definition sieht etwas seltsam aus, ist aber nachprüfbar. Folgendes einfache
Lemma macht das schon deutlicher.
Lemma 1.22. Eine Zahl m ist grösser als n (m > n), genau dann, wenn entweder
m = φ(n) oder es ein k ∈ N und eine Teilmenge {m1 , . . . , mk } von Elementen von N
gibt, so dass (n, m1 ), (m1 , m2 ), . . . , (mk , m) alle in φ sind.
12 1 Logik, Mengen, Zahlen
Beweis. Die eine Richtung ist einfach. Wenn m = φ(n), ist m > n nach Punkt (i). Falls
es die besagte Menge {m1 , . . . , mk } gibt, so ist m1 > n, wegen (ii) dann m2 > m und
so weiter, bis schliesslich n > m. Die Gegenrichtung erhalten wir durch sukzessive
Fallunterscheidungen. Wir wissen, dass m > n. Wenn dies der Fall ist, weil m = φ(n),
dann sind wir in der ersten Alternative. Ansonsten wissen wir, dass es ein `1 > n gibt,
so dass m = φ(`1 ). Also ist (`1 , m) ∈ φ. Da `1 > n, ist entweder `1 = φ(n), oder es gibt
`2 > n, so dass `1 = φ(`2 ). Im ersteren Fall ist k = 1 und unsere Menge {m1 } = {`1 }.
Im anderen Fall iterieren wir: Falls `2 = φ(n), ist die gesuchte Menge {`2 , `1 }, sonst
gibt es `3 > n, so dass `2 = φ(`3 ). Dann ist die gesuchte Menge entweder {`3 , `2 , `1 },
oder es gibt `4 > n, so dass `3 = φ(`4 ), etc. Diese Iteration muss nach endlich vielen
Schritten abbrechen. u t
Lemma 1.23 (Ordnung von N). Wenn m, n ∈ N, dann ist entweder m = n, m > n,
oder n > m.
Beweis. Wir nehmen an, dass m , n und m nicht größer als n ist. Wir wollen zei-
gen, dass dann n größer als m ist. Dazu betrachten wir die Ketten von Vorfahren
von m und n. Wegen Bedingung (iv) müssen diese jeweils in der 1 enden. Denn
keine Vorfahrenkette kann in einer anderen Zahl als der 1 enden, wegen Lemma
1.19. Denn gäbe es eine zweite solche Zahl, sagen wir 2, dann würden sowohl die
Menge aller Nachfolger der 1 als auch die der 2 die Eigenschaften (i)-(iii) erfüllen,
so dass wir wegen (iv) die Nachfolger der 2 aus den natürlichen Zahlen entfernen
müssten. Gleiches gälte, wenn es eine Zahl gäbe, deren Vorfahrenkette nicht ab-
bricht. Dann wäre die Menge der Nachfolger und Vorfahren dieser Zahl disjunkt
zu den Nachfolgern der 1 und müsste ausgesondert werden. Damit aber enden die
Vorfahrensketten von n und von m in der 1. Die Vorfahrensketten von m und von
n müssen sich also schneiden. Angenommen, dies passiert in einem Punkt k. Dann
sind aber die Nachfolger von k identisch (da φ eine Abbildung ist, und wenn φ(k) in
beiden Vorfahrensketten enthalten ist, so haben sich diese schon in φ(k) getroffen).
Damit bleibt als Treffpunkt nur m oder n möglich. Dann ist aber entweder m > n
oder n > m. u t
Die Definition der natürlichen Zahlen gibt uns die Methode der vollständigen
Induktion als Beweisverfahren an die Hand.
Satz 1.24 (Vollständige Induktion). Für jedes n ∈ N sei a(n) eine Aussage (genau-
er können wir a als eine Abbildung von N in die Menge aller Aussagen betrachten).
Es gelte
(i) a(1) ist wahr und
(ii) wenn a(n) wahr ist, dann ist auch a(φ(n)) wahr.
Dann ist a(n) für alle n ∈ N wahr.
Beweis. Angenommen es gäbe ein n ∈ N so dass a(n) falsch ist. Dann muss a(k)
auch falsch sein, wenn (k, n) ∈ φ. Dieses Argument wiederholen wir endlich oft und
gelangen damit zu der Aussage, dass a(1) falsch ist, im Widerspruch zu (1). ut
1.3 Zahlen 13
Anmerkung. Alternativ kann man die Aussage auch beweisen indem am zeigt, dass
{n ∈ N|a(n)} = N.
Nun ist die linke Menge nach Definition in N enthalten. Nun überprüft man das sie
die Peano Axiome (i) (da a(1) nach Annahme war) und (ii) (da die Einschränkung
von φ auf diese Menge sinn ergibt, nach Teil (ii) der Annahme oben) erfüllt. Damit
folgt aufgrund der Minimalität von N die obige Gleichheit.
Anmerkung. Die Forderung (iii) in Definition 1.13 ist wesentlich für die Gültigkeit
von Theorem 1.24. Ansonsten könnte es in N Zahlen geben, die nicht als iteriertes
Bild der 1 erhalten werden können. Umgekehrt kann Theorem 1.24 die Forderung
(iii) ersetzen.
Anmerkung. Man beachte, dass im Beweis nur endliche viele Schritte (für jedes ge-
gebene n) ausgeführt werden müssen. Der Satz liefert dann aber die eine Richtigkeit
von unendlich vielen Aussagen.
Wir haben die Menge N strukturell definiert und dann ihre Existenz postuliert.
Wir können Elemente von N symbolisch darstellen, indem wir die Elemente von φ
schreiben als (n, n + 1). D.h.,
N = {1, 1 + 1, 1 + 1 + 1, 1 + 1 + 1 + 1, . . . }. (1.7)
Es stehen hier nur die ersten paar Elemente von N, mit den Pünktchen deuten wir
formal an, dass das immer so weitergehen soll. Vollständiges aufschreiben der Men-
ge geht eben nicht. Natürlich sind diese Namen sehr unpraktisch und wir benutzen
Abkürzungen, wie etwa 1 + 1 = 2, die mit weniger Platz auskommen. Wir kommen
darauf aber erst später zurück.
Die oben eingeführte Schreibweise erlaubt es in einfacher symbolischer Form
die Addition natürlicher Zahlen zu definieren.
Anmerkung. Die Benutzung des Symbols + ist eine ähnliche Abkürzung wie ∼
bei Äquivalenzrelationen. Eigentlich müssten wir eine Abbildung f + : N × N →
N einführen. Dies wäre die Teilmenge von (N × N) × N, die aus den Trippeln
((n, m), n + m) besteht. Die definierenden Relationen (1.8) lauten dann
Beweis. Wir können hier gleich die vollständige Induktion zur Anwendung bringen.
Wir müssen zeigen, dass die Operation n+m eindeutig durch unsere Regel bestimmt
ist. Zunächst wissen wir, dass für jedes n ∈ N die Aussage ’n + 1 ist eindeutig be-
stimmt’ wahr ist, da n + 1 = φ(n). Ausserdem wissen wir, dass für alle n, m ∈ N die
14 1 Logik, Mengen, Zahlen
Man beachte dass die Addition mit der Notation (1.7) kompatibel ist. Sie sieht in
dieser Notation sogar fast tautologisch aus. Etwa
Lemma 1.26 (Kommutativität und Assoziativität). Die Addition hat folgende Ei-
genschaften:
(i) Für alle n, m, k ∈ N gilt (n + m) + k = n + (m + k).
(ii) Für alle n, m ∈ N gilt n + m = m + n;
Anmerkung. Die Eigenschaft (i) nennt man Kommutatitvität, die Eigenschaft (ii)
nennt man Assoziativität.
Beweis. Die Beweise beruhen auf vollständiger Induktion. Um (i) zu zeigen, zeigen
wir zunächst, dass für alle n, m ∈ N, (n+m)+1 = n+(m+1). Nun ist aber (n+m)+1 =
φ(n + m) und n + (m + 1) = n + φ(m) = φ(n + m), wegen (1.8). Wir beweisen nun den
Induktionsschritt: Wenn für alle n, m ∈ N und ein k ∈ N (i) gilt, dann gilt auch (n +
m) + φ(k) = n + (m + φ(k)). Es ist nämlich wegen (1.8) (n + m) + φ(k) = φ((n + m) + k)
und n + (m + φ(k)) = n + φ(m + k) = φ(n + (m + k)) Aufgrund der Induktionsannahme
sind diese Ausdrücke aber gleich.
Um (ii) zu zeigen, zeigen wir zunächst, dass für alle n ∈ N, n + 1 = 1 + n. Für n = 1
is die Aussage trivialerweise wahr. Weiter gilt für alle n ∈ N, ’wenn n + 1 = 1 + n,
dann ist φ(n) + 1 = 1 + φ(n)’. Wir wissen nämlich, das
wo wir im letzten Schritt (1.8) verwendet haben. Damit folgt aus Theorem 1.24, dass
n+1 = 1+n für alle n ∈ N. Diese Erkenntnis benutzen wir nun als Induktionsvorraus-
setzung im Beweis von (i). Es bleibt zu zeigen, dass die Aussage ’wenn n+m = m+n
für alle n ∈ N wahr ist, dann ist n + φ(m) = φ(m) + n für alle n ∈ N wahr. Dies folgt
aber wieder leicht aus (1.8) und der Assozitivität. Es ist nämlich n + φ(m) = φ(n + m)
und φ(m) + n = (m + 1) + n = m + (1 + n) = m + φ(n) = φ(m + n) = φ(n + m). u t
(a + b) + c = a + (b + c). (1.11)
Eine Halbgruppe heißt kommutativ oder abelsch, wenn für alle a, b ∈ H gilt
a + b = b + a. (1.12)
1.3 Zahlen 15
Anmerkung. Wir hätten die 0 auch statt der 1 direkt in den natürlichen Zahlen
einführen können, und viele Autoren tun dies auch. Allerdings bräuchte man dann
einen symbolischen Namen für die Zahl φ(0), oder man müsste φ(0) + φ(0) + . . . φ(0)
für eine natürliche Zahl schreiben, was ich hässlich finde.... Wir bezeichnen die
Menge N ∪ {0} mit N0 . Wir schreiben auch N = Z+ .
Definition 1.30 (Ganze Zahlen). Wir bezeichnen mit N− die Menge N− = {−n : n ∈
N} und setzen
Z ≡ N− ∪ {0} ∪ N. (1.13)
Wir definieren auf Z die Abbildung − : Z → Z durch:
(i) Für n ∈ N is −(n) = −n ∈ N− ;
(ii) −0 = 0;
(iii) Für −n ∈ N− ist −(−n) = n.
Die Abbildung φ aus der Definition der natürlichen Zahlen erweitern wir auf ganz
Z indem wir setzen
− (z + z0 ) = −z + (−z0 ). (1.15)
Wie im Fall der natürlichen Zahlen ist die Addition eindeutig definiert und erfüllt
die Addition das Assoziativgesetz und ist kommutativ:
Lemma 1.32. Die in Definition 1.31 definierte Abbildung + ist eindeutig definiert,
erfüllt das Assoziativgesetz und ist kommutativ.
Beweis. Der Beweis is völlig analog zu dem für die natürlichen Zahlen und wird als
Übung gestellt. [Übung!]. u
t
Als Zugewinn erhalten wir die Existenz eines neutralen Elements und eines in-
versen Elements.
Beweis. Wir könnten auch dieses Lemma durch vollstängige Induktion beweisen.
[Übung!] Es geht aber auch einfacher. Wegen (1.15) und der Kommutativität gilt
D.h. wenn wir x = z + (−z) setzen, so haben wir −x = x. Die einzige Ganze Zahl, die
dies erfüllt ist nach Definition 1.30 aber die 0. Also ist x = 0. Wegen der Kommuta-
tivität ist die erste Gleichung in (1.17) richtig. u
t
Lemma 1.34. Die ganzen Zahlen Z bilden eine kommutative Gruppe bezüglich der
Addition.
Wir haben im Vorhergehenden gesehen, wie wir die Addition durch Iteration der
Addition von 1 konstruieren konnten. Wir können nun eine weitere Struktur auf den
ganzen Zahlen einführen, indem wir die Addition beliebiger Zahlen iterieren.
Wir haben nun auf den ganzen Zahlen zwei Operationen, nämlich + und ?. Dies
führt zu einer neuen algebraischen Struktur.
Lemma 1.37 (Ring der ganzen Zahlen). Die ganzen Zahlen bilden mit der Ope-
ration ? eine kommutative Halbgruppe mit neutralem Element 1. Bezüglich der
Operationen (+, ?) bilden sie einen Ring.
Beweis. Die Gruppeneigenschaft bezüglich der Addition haben wir schon gezeigt.
Wir müssen noch zeigen, dass bezüglich der Multiplikation eine kommutative Halb-
gruppe vorliegt, und dass das Distributivgesetz gilt, also z ? (z1 + z2 ) = (z ? z1 ) + (z ?
z2 ) gilt. Wir zeigen zunächst:
18 1 Logik, Mengen, Zahlen
Für alls m, n ∈ N gilt m ? n = n ? m. Dazu zeigen wir im ersten Schritt, dass für alle
n, m,
φ(m) ? n = m ? n + n. (1.19)
Wir beweisen dies durch Induktion über n. Für n = 1 gilt die Aussage, da wegen (ii)
φ(m) ? 1 = φ(m) = m + 1. Wenn die Aussage für n gilt, dann gilt sie auch für φ(n),
denn wegen (iii) und (1.19),
Als nächstes zeigt man leicht durch Induktion, dass n?1 = 1?n für alle n ∈ N. Daher
folgt die Behauptung, wenn wir aus m?n = n?m herleiten, dass m?φ(n) = φ(n)?m.
Es ist aber wegen (iii) und (1.19)
Anmerkung. Wir werden ab sofort die übliche Konvention benutzen, dass Klam-
mern um Multiplikationen weggelassen werden können. Das heißt, ein Ausdruck
a ? b + c ist immer als (a ? b) + c zu lesen.
Für spätere Zwecke führen wir hier schon einmal die Potenz ein.
Definition 1.38 (Potenzen). Sei n ∈ N ∪ {0} und z ∈ Z. Dann definieren wie die Ope-
ration zn durch folgende Eigenschaften:
(i) z0 = 1;
(ii) Für alle n ∈ N ∪ {0} gilt zφ(n) = zn ? z.
Man überzeugt sich leicht (durch vollständige Induktion), dass zn eindeutig de-
finiert ist. Man kann durch vollständige Induktion zeigen, dass für alle m, n ∈ N,
zm+n = zm zn gilt.
Wieder fehlen den ganzen Zahlen inverse Elemente bezüglich der Multiplikation.
Wenn wir diese hinzufügen, erhalten wir einen Körper, den Körper der rationalen
Zahlen.
Definition 1.39. Die Menge der Objekte der Form q = nz , mit n ∈ N und z ∈ Z heißt
die Menge aller Brüche. Wir definieren
1.3 Zahlen 19
Wir müssen nun zunächst die Multiplikation dieser neuen Zahlen mit ganzen
Zahlen definieren.
z1 z2
Definition 1.40. Seinen nz , n1 , n2 Brüche. Dann definieren wir
(o) − nz = −z
n .
(i)
z1 z2 z1 ? z2
? = . (1.24)
n1 n2 n1 ? n2
(ii)
z1 z2 z1 ? n2 + z2 ? n1
+ = . (1.25)
n1 n2 n1 ? n2
z
Anmerkung. Wir können jede ganze Zahl z mit dem Bruch 1 identifizieren.
Lemma 1.41. Addition und Multiplikation von Brüchen sind Kommutativ und erfüllen
jeweils das Assoziativgesetz sowie das Distributivgesetz. Falls z , 0, so gibt es für
jeden Bruch nz einen Bruch, der das inverse Element bezüglich der Addition ist. Falls
z > 0 ist, so ist dies nz , falls z < 0, so ist es −n
−z .
Beweis. Übung.
In natürlicher Weise sagen wir, ein Bruch q = nz sei positiv (q > 0), respektive
negativ (q < 0), wenn z > 0 respektive z < 0 ist. Mit der Regel für die Addition von
Brüchen folgt dann:
y
Lemma 1.42. Seien q = nz und p = m Brüche. Dann ist q > p wenn z ? m > y ? n.
Falls q > p sagen wir p < q.
Beweis. q > p soll bedeuten, dass q − p > 0. Nach der Regel (1.25) ist aber
z −y z ? m − y ? n
q − p = q + (−p) = + = . (1.26)
n m n?m
Die rechte Seite ist positiv, wenn z ? m > y ? n. t
u
Mit dieser Definition sind nun aber viele Brüche gleich. Dies liegt daran, dass
wir gesagt haben, dass für jedes n ∈ N, nn = 1, d.h. mittels unserer neuen Symbole
gibt es unendlich viele Möglichkeiten, die 1 darzustellen. Daraus folgt weiter, dass
für alle z ∈ Z, n, n0 ∈ N, gilt
z ? n0 z n0 z z
= ? = ?1 = . (1.27)
n ? n0 n n0 n n
Wir sehen, dass z ? n0 ? n = z ? n ? n0 , also unsere Definition von = gerade richtig
ist.
Wir müssen also zwischen dem Symbol nz und der Zahl, die dieser Bruch re-
präsentiert unterscheiden. Auf der Ebene der Brüche als Symbole ist die Relation =
aus Definition 1.43 eine Äquivalenzrelation.
Lemma 1.44. Die Relation = in Definition 1.43 ist eine Äquivalenzrelation auf der
Menge der Brüche.
Beweis. Übung. t
u
Was wir damit sagen wollen, ist, dass wenn zwei Brüche = sind, sie dieselbe Zahl
darstellen. So sind etwa 21 und 63 verschiedenen Brüche, stellen aber die gleiche Zahl
dar.
Dies ist die Grundidee hinter der folgenden Definition der rationalen Zahlen.
Definition 1.45 (Rationale Zahlen). Die Menge der Äquivalenzklassen der Menge
der Brüche
z
{ : z ∈ Z, n ∈ N}, (1.28)
n
unter der Äquivalenzrelation = heißt die Menge der rationalen Zahlen, bezeichnet
mit Q.
Wir können aus jeder Äquivalenzklasse einen eindeutigen Repräsentanten aus-
wählen. Jede Äquivalenzklasse enthält nämlich genau ein Element, nz , so dass es
kein z0 ∈ Z, n0 ∈ N und k ∈ N\{1} gibt, so dass
z = z0 ? k, n = n0 ? k. (1.29)
z1 z2 z01 z02
+ = + , (1.30)
n1 n2 n01 n02
und
z1 z2 z01 z02
? = ? . (1.31)
n1 n2 n01 n02
Beweis. (Überprüfen Sie das!) t
u
Damit kann man nachprüfen, dass Q bezüglich (+, ?) ein Körper ist. Wir erinnern
uns aus der linearen Algebra:
Definition 1.48. Eine Menge F mit zwei Abbildungen, +, ?, jeweils von F × F → F,
heißt ein Körper, genau dann, wenn:
(i) (F, +) ist eine kommutative Gruppe;
(ii) (F, ?) erfüllt alle Eigenschaften einer kommutative Gruppe, außer, dass das
neutrale Element der Operation + kein inverses Element besitzt:
(iii) Das Distributivgesetz, gilt, d.h. für alle f, g, h ∈ G gilt
f ? (g + h) = f ? g + f ? h (1.32)
Satz 1.49 (Körper der rationalen Zahlen). Die rationalen Zahlen bilden bezüglich
der Abbildungen, +, ? einen kommutativen Körper.
Darüber hinaus gilt, dass Q genau wie die ganzen Zahlen geordnet ist, also für
alle q, q0 ∈ Q entweder q = q0 , q > q0 oder q0 > q.
Letztlich bemerken wir noch:
Lemma 1.50. Für jedes q ∈ Q gibt es n ∈ Z, so dass n − 1 < q ≤ n.
Beweis. Übung. u
t
Im Gegensatz zu den ganzen Zahlen gibt es aber keinen natürlichen Nachfolger
einer rationalen Zahl. Im Gegenteil, zwischen zwei rationalen Zahlen liegt stets noch
eine weitere rationale Zahl.
Lemma 1.51. Seien q, p ∈ Q und q > p. Dann existiert eine rationale Zahl, r ∈ Q,
so, dass p < r < q gilt.
Beweis. Wir können zum Beispiel r = (p+q)/2 wählen. Da 2q > q+ p und 2p < q+ p
gilt nach unseren Regeln q > (p + q)/2 > p. u
t
Wir könnten nun zufrieden sein und mit den rationalen Zahlen als Zahlenkörper
arbeiten. Leider steht dem aber eine geometrische Interpretation von Zahlen im
Weg.
22 1 Logik, Mengen, Zahlen
Die natürlichen Zahlen hatten wir zum Zählen eingeführt. Ein anderer Bereich, in
dem Zahlen praktisch wären, ist die Geometrie. In der Geometrie geht es erst mal
darum, Abstände, bzw. Längen von Strecken zu messen. Dabei gibt es keine kleinste
Einheit, die wir mit der 1 bezeichnen könnten, sondern zwei Punkte können beliebig
nahe beieinander sein. Die rationalen Zahlen scheinen dafür gut geeignet, immerhin
gibt es keine kleinste positive rationale Zahl: Für jedes q > 0 in Q ist q ? 21 < q. Man
könnte daher glauben, die Distanz zweier Punkte sei immer durch eine rationale
Zahl gegeben. Dies stellt sich als falsch heraus.
Satz 1.52 (Unvollständigkeit von Q). Die Länge der Diagonalen in einem Quadrat
der Seitenlänge 1 is keine rationale Zahl.
√
Abb. 1.8 Geometrische Konstruktion von 2.
Beweis. Sei x die Länge der fraglichen Diagonalen. Man kann mit elementaren
geometrischen Konstruktionen (Satz von Pytharoras) zeigen, dass das Quadrat über
der Diagonalen den Flächeninhalt 2 hat. Der Flächeninhalt eines Quadrats mit Sei-
tenlänge x ist aber x ? x. x muss also die Gleichung
x? x = 2 (1.33)
Anmerkung. Natürlich gilt dasselbe wenn 2 durch irgendeine natürliche Zahl ersetzt
wird, die nicht das Quadrat einer natürlichen Zahl ist.
Als Geometer sind wir daher mit den rationalen Zahlen nicht zufrieden. Wir
würden schon gerne eine Zahl für die Längen von Diagonalen haben. In den ra-
tionalen Zahlen scheinen merkwürdige Lücken zu klaffen.....
Diese Lücken wollen wir nun stopfen. Wir wollen dazu zunächst den Begriff der
Folge definieren.
Wir schreiben oft (an )n∈N um eine solche Folge zu bezeichnen, wobei (n, an ) die
in a enthaltenen Elemente sind. Die Zahlen an nennen wir Folgenglieder. Von be-
sonderem Interesse für uns ist es, das Verhalten der Folgenglieder an zu beschreiben,
wenn n gross wird.
Definition 1.54 (Beschränkte Folgen). Eine Folge a heißt nach oben (unten) be-
schränkt, wenn es eine Zahl q ∈ Q gibt, so dass
Eine Folge heißt beschränkt, wenn sie von oben und von unten beschränkt ist.
Zum Beispiel ist die Folge a mit an = n1 beschränkt, die Folge a mit an = n ist
nach unten beschränkt, nicht aber nach oben.
Uns werden besonders Folgen interessieren, die mit wachsendem n annähernd
konstant werden, so wie die Folge a mit an = 1/n. Es ist praktisch dazu noch den
Begriffs des Betrags einzuführen.
Beweis. Übung. t
u
Definition 1.57 (Maximum und Minimum). Sei M ⊂ Q eine Menge von rationalen
Zahlen. Dann heißt q ∈ M das Maximum von M, q = max M, falls für alle p ∈ M,
q ≥ p. Analog heißt q Minimum von M, q = min M, falls für alle p ∈ M, q ≤ p.
Anmerkung. Wenn die Menge M endlich und nicht leer ist, so existiert stets sowohl
das Maximum als auch das Minimum. Wenn M nicht endlich ist, so muss dies nicht
der Fall sein. Wir kommen darauf später noch zurück.
Lemma 1.58. Eine Folge a ist genau dann beschränkt, wenn die Folge |a| mit Fol-
gengliedern |an | nach oben beschränkt ist.
Beweis. Wenn die Folge |a| nach oben beschränkt ist, so ist sowohl a als auch −a
nach oben beschränkt. Wenn −a aber nach oben beschränkt ist, so ist a nach unten
beschränkt und somit a beschränkt. u
t
Definition 1.59 (Cauchy-Folgen). Eine Folge a von rationalen Zahlen heißt Cauchy-
Folge, genau dann wenn folgendes gilt:
1
∀k∈N ∃n0 ∈N ∀n≥n0 ∀m≥0 : |an − an+m | ≤ . (1.37)
k
Dies kompliziert wirkende Definition besagt einfach, dass sich ab einem hinreichend
grossen Wert von n die Folgenglieder kaum mehr von an unterscheiden werden. Um
diese vage Aussage genau zumachen, sagen wir: Gebe ’kaum’ vor als ’der Unter-
schied überschreitet nicht mehr die Schwelle 1/k’. Dann gibt es zu jedem k ∈ N ein
n0 , so dass dies zutrifft.
Anmerkung. Mit Hilfe der Dreiecksungleichung kann man leicht zeigen, dass eine
Folge Cauchy-Folge ist, wenn
1
∀k∈N ∃n∈N ∀m≥0 : |an − an+m | ≤ . (1.38)
k
Die Formulierung in der Definition 1.37 wird in der Literatur standardmäßig ver-
wendet, da sie betont, dass ab einen gewissen n0 , alle Folgenglieder nahe beieinan-
der liegen.
Anmerkung. Eine Cauchy-Folge deren Folgenglieder rational sind nennen wir auch
eine rationale Cauchy-Folge.
Beweis. Wähle k = 10. Sei n0 die zugehörige Zahl aus der Forderung (1.37).
Die endlich vielen Zahlen |a1 |, |a2 |, . . . , |an0 | haben einen maximalem Wert, M =
max{|a1 |, |a2 |, . . . , |an0 |}. Andererseits sind für alle m ∈ N |an0 − an0 +m | ≤ 10
1
. Also gilt,
wegen der Dreiecksungleichung, |an0 +m | ≤ |an0 | + 10 . Daher sind alle |an | kleiner als
1
M + 1/10. u t
1.4 Die reellen Zahlen 25
Die Folge an = n1 ist offenbar eine Cauchy-Folge, denn für alle m ≥ 0 ist
1
n
1
− n+m ≤ n1 , für jedes k ∈ N ist die Aussage in der Definition mit n0 = k erfüllt.
Nun nähert sich 1/n zunehmend der Zahl 0 an. Dies können wir durch den Begriff
der Konvergenz formal beschreiben.
Definition 1.61 (Konvergenz). Eine Folge a von rationalen Zahlen heißt konver-
gent (in Q), falls es eine Zahl q ∈ Q gibt, so dass
1
∀k∈N ∃n0 ∈N ∀n≥n0 |an − q| ≤ . (1.39)
k
Die Zahl q heißt der Grenzwert oder Limes der Folge a. Wir schreiben manchmal
auch kurz a → q.
Man prüft leicht nach, dass die Folge an = n1 konvergiert und den Grenzwert 0
hat. Folgen, die gegen den Grenzwert 0 konvergieren, bezeichnen wir als Nullfolgen.
2 1
|an − an+m | = |an − q + q − an+m | ≤ |an − q| + |q − an+m | ≤ = , (1.40)
2k k
und a ist Cauchy-Folge. t
u
Die Frage ist, ob auch die umgekehrte Aussage gilt. Wir vermuten schon, dass
dies nicht der Fall sein wird, da Q ja löchrig ist.
Lemma 1.63 (Unvollständigkeit von Q). Es gibt rationale Cauchy-Folgen, die
nicht gegen eine rationale Zahl konvergieren.
Beweis. Wir definieren die Folge a wie folgt: Für jedes n ∈ N sei mn die größte
natürliche Zahl, so das mnnn mn
≤ 2. Dann setzen wir an = mnn . Vorsorglich definieren
wir auch eine Folge b mit bn = mnn+1 . Offenbar gilt an an ≤ 2 und bn bn > 2 (in der Tat
ist an an < 2, da wir schon wissen, dass Gleichheit nicht gelten kann). Wir wissen,
dass
1 1
|an − bn | = , |an+m − bn+m | = , (1.41)
n n+m
und sowohl bn als auch bn+m ist größer als sowohl an als auch an+m . Dann sind
0 ≤ min(bn , bn+m ) − an ≤ 1/n, 0 ≤ min(bn , bn+m ) − an+m ≤ 1/(n + m). Dann muss für
alle m ∈ N
1 1
|an − an+m | = |an − min(bn , bn+m ) + min(bn , bn+m ) − an+m | ≤ + (1.42)
n n+m
sein. Damit ist a Cauchy-Folge, und ebenso b. Nehmen wir nun an, dass a zu einer
Zahl q konvergiert. Dann muss gelten, dass q2 ≤ 2. Nehmen wir an, dass q2 < 2. Nun
ist aber
26 1 Logik, Mengen, Zahlen
!2
1 2bn 1 4
a2n = bn − = b2n − + 2 ≥ 2− , (1.43)
n n n n
wo wir benutzt haben, dass b2n ≥ 2 und bn ≤ 2 ist. Damit gibt es aber ein n0 , so dass
2 2
für alle n ≥ n0 , a2n ≥ 2 − 2−q 2−q
2 = q + 2 , was im Widerspruch dazu steht, dass an
2
gegen q konvergiert. q2 ist also sowohl kleiner gleich als auch größer
√ gleich 2, wes-
wegen als einzig möglicher Grenzwert die nicht-existente Zahl 2 in Frage käme.
Also gibt es eine Cauchy-Folge rationaler Zahlen, die nicht zu einer rationalen Zahl
konvergiert. u t
Jetzt ist auch die Lösung unseres Problems in Sicht. Wir möchten die reellen Zah-
len als die fehlenden Grenzwerte von Cauchy-Folgen definieren. Dazu gehen wir
wie folgt vor. Zunächst bezeichnen wir die Menge aller rationalen Cauchy-Folgen
mit C. Dann definieren wir eine Äquivalenzrelation auf diesem Raum, die impliziert,
dass zwei äquivalente Folgen, wenn überhaupt, dann denselben Grenzwert haben.
Definition 1.64 (Äquivalenz von Cauchy-Folgen). Seien a, b ∈ C. Dann sind a ∼ b,
genau dann wenn die Differenzenfolge a − b = (an − bn )n∈N den Grenzwert 0 hat
(’eine Nullfolge ist’).
Lemma 1.65. ∼ ist eine Äquivalenzrelation auf C.
Beweis. Der Beweis ist eine einfache Übungsaufgabe. t
u
Wir bezeichnen im Folgenden die Äquivalenzklasse einer Cauchy-Folge a mit
[a], also
[a] = {b ∈ C : a ∼ b}. (1.44)
Definition 1.66 (Reelle Zahlen). Die Menge der Äquivalenzklassen von Cauchy-
Folgen heißt R, die reellen Zahlen.
Beachte, dass jede rationale Zahl in R eingebettet werden kann. Dazu identifizie-
ren wir eine rationale Zahl q ∈ Q mit der Äquivalenzklasse der konstanten Cauchy-
Folge q̃ mit Folgengliedern q̃n = q, für alle n ∈ N. Die Äquivalenzklasse [q̃] dieser
Folge ist dann das der Zahl q entsprechende Element von R.
Wir müssen nun lernen, mit reellen Zahlen zu rechnen. Als erstes müssen wir
uns um die Ordnungsrelation der reellen Zahlen Sorgen machen. Dazu müssen wir
entscheiden können, ob eine reelle Zahl positiv oder negativ ist. Nun ist es aber
leicht einzusehen, dass eine Cauchy-Folge, die nicht gegen Null konvergiert, ab
einem gewissen Wert n nur noch positive oder nun noch negative Folgenglieder
haben kann. Dies legt folgenden Definition nahe.
Definition 1.67 (Ordnung von Cauchy-Folgen). Eine Cauchy-Folge heißt positiv
(a > 0), genau dann, wenn,
1
∃k∈N ∃n0 ∈N ∀n≥n0 : an ≥ . (1.45)
k
Eine Cauchy-Folge heißt negativ (a < 0), genau dann, wenn,
1.4 Die reellen Zahlen 27
1
∃k∈N ∃n0 ∈N ∀n≥n0 : an ≤ − . (1.46)
k
In der Definition können wir ≥ und ≤ durch > bzw. < ersetzen, ohne dass sich
etwas ändert.
Lemma 1.68. Eine Cauchy-Folge, die weder positiv noch negativ ist, konvergiert
gegen Null.
Beweis. Sei a Cauchy-Folge, aber weder positiv noch negativ. Dann gilt, dass für
jedes k ∈ N für jedes n0 ein n1 < n0 existiert, so dass an1 < 1/k und ein n2 ≥ n0 , so
dass an2 > −1/k. Nun ist aber a Cauchy, d.h. für hinreichend große n1 , ist in jedem
Fall |an1 − an2 | ≤ 1/k. Also ist insbesondere auch an1 ≥ −2/k und somit |an1 | ≤ 2/k.
Da a Cauchy ist, gilt dann für jedes m ∈ N |an1 − an1 +m | ≤ 1/k. Daraus folgt aber,
dass es für jedes k ein n1 gibt, so dass |an1 +m | ≤ 3k , für alle m ∈ N. Somit konvergiert
a gegen Null. u t
Lemma 1.69. Die Elemente einer Äquivalenzklasse von Cauchy-Folgen sind entwe-
der alle positiv, alle negativ, oder konvergieren alle gegen 0. D.h., die Ordung auf
der Menge der Cauchy-Folgen induziert eine Ordnung auf der Menge der reellen
Zahlen.
Beweis. Übung. t
u
Das Lemma sagt einfach, dass [a] > [b] ist, wenn a > b, und so weiter. Somit gilt
für alle reellen Zahlen x entweder x > 0, x < 0, oder x = 0. Es folgt, dass die reellen
Zahlen genau wie die rationalen Zahlen geordnet sind, d.h. für jedes x, y ∈ R gilt
x > y, x < y, oder x = y.
Der Absolutbetrag einer reellen Zahl wird genau so definiert, wie der einer ratio-
nalen Zahl. Es gilt auch, dass |[a]| = [|a|]. Lemma 1.56 gilt auch für reelle Zahlen.
Ebenso definieren wir Maximum und Minimum einer Menge von reellen Zahlen.
Die folgende einfache Beobachtung ist sehr wichtig.
28 1 Logik, Mengen, Zahlen
Lemma 1.70 (Archimedes). Für jedes Paar von reellen Zahlen x, y ∈ R mit x < y
existiert eine rationale Zahl q ∈ Q, so dass x < q < y. Insbesondere existiert für jedes
x > 0 ein K ∈ N, so dass 1/K < x.
Beweis. Sei x = [a], y = [b] für zwei rationale Folgen a, b. Da x < y, existiert k ∈ N
und n0 ∈ N, so dass für alle n ≥ n0 , bn − an > 1/K. Da aber a und b Cauchy sind, gibt
es n1 ∈ N, so dass für alle n, m > n1 , |an − am | ≤ 1/10k und |bn − bm | ≤ 1/10k. Sei nun
k = max(n0 , n1 ). Dann gilt |ak − x| ≤ 1/10k, |bk − x| ≤ 1/10k und bk − ak > 1/k. Dann
ist q = bk +a
2 ∈ Q und x < q < y, wie gewünscht. u
k
t
Anmerkung. Das Lemma gibt uns eine wichtige Methode in die Hand, um zu be-
weisen, dass eine reelle Zahl x gleich Null ist. Man zeigt zunächst, dass für jedes
K ∈ N gilt |x| < 1/K. Dann folgt aus dem lemma, dass |x| = 0. Daraus folgt wieder,
dass x = 0 ist. Das mag banal klingen, in der Praxis ist es von zentraler Bedeutung,
insbesondere wenn x als Limes einer Cauchyfolge gegeben ist. Man bezeichnet dies
auch als Archimedisches Prinzip, da dies bereits von Archimedes benutzt wurde.
Die Rechenoperationen für reelle Zahlen werden nun einfach von den rationalen
Zahlen übernommen, indem jeweils eine rationale Cauchy-Folge, die die jeweili-
ge reelle Zahl darstellt hergenommen wird und dann die Rechenoperation auf den
Folgengliedern ausgeführt werden. Dazu benötigen wir folgende Beobachtung.
Lemma 1.71. Wenn a und b Cauchy-Folgen sind, dann sind auch die Folgen a + b
und ab (mit Folgengliedern an + bn bzw. an bn ) Cauchy-Folgen.
Beweis. Wir zeigen nur den Fall der Multiplikation, der Beweis für die Addition ist
einfacher. Wir haben
Nun wissen wir, dass es M gibts, so dass |an | ≤ M und |bn | ≤ M, für alle n ∈ N.
Ausserdem gibt es für jedes k ∈ N ein n0 , so dass für alle n ≥ n0 und alle m ∈ N,
1 1
|bn − bn+m | ≤ 2Mk und |an − an+m | ≤ 2Mk . Daher ist für solche n, m,
1
|an bn − an+m bn+m | ≤ , (1.48)
k
was zeigt, dass die Folge der Produkte eine Cauchy-Folge ist. t
u
Lemma 1.72. Es seien a ∼ a0 und b ∼ b0 Cauchy-Folgen. Dann ist a + b ∼ a0 + b0
und ab ∼ a0 b0 .
Beweis. Wir zeigen zunächst, dass (a + b) − (a0 + b0 ) eine Nullfolge ist. Es gilt aber
|an bn − a0n b0n | ≤ |an (bn − b0n ) + (an − a0n )b0n | ≤ |an ||bn − b0n | + |an − a0n ||b0n |. (1.50)
Da sowohl |a| als |b0 | beschränkte Folgen sind, existiert ein K ∈ R, so dass die rechte
Seite der Ungleichung kleiner ist als
Dies konvergiert gegen Null aus dem gleichen Grund wie vorher. t
u
Wir wollen noch zeigen dass jede reelle Zahl außer der Null ein inverses Element
besitzt.
Lemma 1.74. Sei [a] , 0 eine reelle Zahl. Dann existiert eine reelle Zahl [a]−1 , so
dass [a][a]−1 = [a]−1 [a] = 1.
Beweis. Ohne Beschränkung der Allgemeinheit nehmen wir an, dass [a] > 0. Aus
Lemma 1.70, d.h. das a > 0 im Sinne der Definition 1.67, was bedeutet, dass es
ein K ∈ N gibt und eine n0 ∈ N, so dass für alle n ≥ n0 , gilt, dass an > 1/K. Nun
definieren wir die Folge a0 mit Folgengliedern
an , wenn n ≥ n0
an =
0
(1.54)
1,
wenn n < n0 .
Wir sehen leicht, dass a ∼ a0 , denn für alle n ≥ n0 ist |an − a0n | = 0, so dass a −
a0 offensichtlich eine Nullfolge ist. Daher ist [a] = [a0 ]. Die Folge 1/a0 ist wieder
eine Cauchy-Folge (Beweis analog zum Beweis von Lemma 1.71), und wir setzen
[a]−1 = [1/a0 ]. Dann ist a/a0 die Folge mit Folgengliedern
1,
wenn n ≥ n0 ,
an /an =
0
(1.55)
(an , wenn n < n0 .
Daher ist a/a0 offensichtlich äquivalent zur Folge die konstant den Wert 1 annimmt.
Nach Definition der Multiplikation [a][a]−1 = [a0 ][1/a0 ] = [a0 /a0 ] = 1. Genauso folgt
[a]−1 [a] = 1. u
t
Es liegt nun sehr nahe zu vermuten, dass eine Cauchy-Folge a gegen die reelle
Zahl, die durch die Äquivalenzklasse [a] definiert ist, konvergiert. Das ist in der Tat
der Fall, wie das folgenden Lemma zeigt.
Als erstes müssen wir und klar machen, was |an − [a]| ≤ 1/k bedeutet. Zunächst
identifizieren wir die rationale Zahl an mit der Äquivalenzklasse der konstanten
Folge ãn , deren Folgenglieder alle gleich an sind, also (ãn )m = an für alle m ∈ N.
Damit ist [a] − an = [a − ãn ], und a − ãn ist die Folge (am − an )m∈N . Weiter ist |[a −
ãn ]| = [|a − ãn |]. Weiter fassen wir auch 1/k als reelle Zahl, also als Äquivalenzklasse
der konstanten Folge mit Folgengliedern 1/k auf. Damit wird wegen Lemma (1.68)
die Aussage |[an − [a]| ≤ 1/k äquivalent zu der Aussage, dass die rationale Cauchy-
Folge c mit Folgengliedern cm = |an − am | − 1/k, m ∈ N, nicht positiv ist. Das bedeutet
aber nach unserer Definition 1.67, dass
Nun ist aber a Cauchy-Folge, so dass es ein n2 ∈ N gibt, so dass für alle m ≥ n2 und
n ≥ n2 , |am − an | ≤ 1/2k < 1/k + 1/p gilt. Daher gilt für alle n ≥ n2 , dass für alle p ∈ N
für alle m ≥ n2 , |am − an | − 1/k < 1/p. Insbesondere ist für alle n ≥ n2 die Aussage
(1.57). Damit ist für alle n ≥ n2 , dass |an − [a]| ≤ 1/k. Mithin gibt es für alle k ∈ N ein
n0 (nämlich obiges n2 ), so dass für alle n ≥ n0 , |an − [a]| ≤ 1/k. Dies ist aber gerade
die Aussage des Lemmas. u t
Wir sind nun fast fertig. R hat alle Eigenschaften bez. Addition und Multiplika-
tion, die es zu einem kommutativen Körper machen, wie man leicht nachprüft. Die
Löcher in Q, die die fehlenden Grenzwerte von rationalen Cauchy-Folgen waren,
sind gestopft.
Wir können nun auch Folgen reeller Zahlen definieren.
Definition 1.76 (Folgen). Eine Abbildung a : N → R heißt eine Folge reeller Zahlen
oder eine reelle Folge.
Alle Definitionen von Beschränktheit, Cauchy-Folgen, Konvergenz und so wei-
ter übertragen sich wörtlich auf reelle Folgen, indem man die Wörter rational durch
reell ersetzt. Wir müssen nur noch sicherstellen, dass keine neuen Löcher auftau-
chen, wenn wir Cauchy-Folgen von reellen Zahlen betrachten. Dies is aber nicht
der Fall.
Satz 1.77 (Vollständigkeit von R). Jede Cauchy-Folge mit Folgengliedern in R
konvergiert gegen eine Zahl in R.
Beweis. Wir müssen nur zeigen, dass wir für jede Cauchy-Folge a eine Cauchy-
Folge b mit rationalen Folgengliedern finden können, so dass die Differenz a − b
der Folgen nach Null konvergiert. Wir wissen, dass es für jedes n ∈ N eine rationale
Cauchy-Folge a(n) gibt, die gegen an konvergiert. Daher gibt es für jedes n ∈ N ein
K(n) ∈ N, so dass |a(n) (n)
K(n) − an | ≤ n . Wähle jetzt bn = aK(n) . Dann ist für jedes n ∈ N,
1
|bn −an | ≤ 1n , und insbesondere a−b eine Nullfolge. Ausserdem ist für jedes n, m ∈ N,
|bn −bn+m | = |bn −an +an −an+m +an+m −bn+m | ≤ |bn −an |+|an −an+m |+|an+m −bn+m |.
(1.58)
1.4 Die reellen Zahlen 31
Nach Konstruktion ist der erste und letzte Term nicht größer als 1/n, und da auch a
Cauchyfolge ist, gibt es für jedes k ∈ N ein n0 ∈ N, so dass für alle n ≥ n0 und alle
m ∈ N, auch |an − an+m | ≤ 1/k. Daraus folgt aber, wählen, dass es für jedes k ∈ N ein
m0 = max(k, n0 ) ∈ N gibt, so dass für alle n ≥ m0 und alle m ∈ N,
Daher ist b eine rationale Cauchy-Folge die gegen den Grenzwert [b] konvergiert.
Schliesslich ist |an − [b]| ≤ |an − bn | + |bn − [b]| ≤ 1/n + |bn − [b]|. Da lim b = [b], gilt,
dass ∀k∈N ∃n0 ∈N ∀n≥n0 |bn − [b]| ≤ 1k und somit mit m0 = max(k, n0 ),
Satz 1.78 (Körper der reellen Zahlen). Die reellen Zahlen bilden bez. der Addition
und Multiplikation einen kommutativen geordneten abgeschlossenen Körper. Hier
bedeutet abgeschlossen, dass jede Cauchy-Folge konvergiert. Die rationalen Zahlen
bilden eine dichte Teilmenge von R, d.h. jede reelle Zahl ist der Grenzwert einer
rationalen Cauchyfolge.
Wir kommen jetzt nochmal auf Potenzen zurück. Wir hatten ja Potenzen mn für
m, n ∈ N definiert. Dies lässt sich ohne Probleme mit dem was wir bisher gelernt
haben, auf Potenzen xm erweitern, wo x ∈ R und m ∈ Z. Dabei treffen wir die Kon-
vention, dass 00 = 1 sei.
Einen wesentliche Eigenschaft von Potenzen ist, dass xn xm = xn+m , für alle x ∈
R, n, m ∈ Z. Die Lösung der Gleichung x2 = 2, die wir ja nun als reelle Zahl konstru-
iert haben, würden wir dann gerne mit 21/2 bezeichnen, da dann 21/2 21/2 = 21 = 2.
Wir können nach dem gleichen Muster auch Lösungen für jede Gleichung xm = y
über Cauchy-Folgen konstruieren.
Lemma 1.79. Für jedes 0 ≤ y ∈ R und p ∈ N existiert eine Cauchy-Folge, die gegen
die Lösung, x ∈ R, der Gleichung x p = y konvergiert. Die Äquivalenzklasse dieser
√
Cauchy-Folge heißt y1/p (oder p-te Wurzel von y, geschrieben p y).
Beweis. Der Beweis ist eine Übung. Man muss nur den Beweis von Lemma 1.63
anpassen. u t
m
Definition 1.80. Sei 0 ≤ y ∈ R und q = m/n ∈ Q. Dann ist ym/n = y1/n = (ym )1/n .
y p yq = y p+q . (1.61)
Beweis. Für den Fall, dass p, q in Z sind, folgt Gleichung (1.61)aus der Definition
1.38. Der allgemeine Fall führt sich darauf zurück, dass wir p und q als p = mn
zn
und
ym
q = mn darstellen und die Definition 1.80 benutzen. u t
Die Konstruktion der reellen Zahlen folgt also demselben Schema der Erwei-
terung um gewünschte Zahlen, dass wir schon bei den ganzen und den rationalen
Zahlen benutzt haben. Auch wurde wieder das Prinzip der Äquivalenzklassen an-
gewandt. Allerdings ist gegenüber der Erweiterung auf die rationalen Zahlen etwas
deutlich Dramatischeres passiert. Wenn wir auch nicht eine Liste aller rationalen
Zahlen erstellen können, so können wir doch jede gegebene rationale Zahl symbo-
lisch (durch Einsen) hinschreiben. Bei den reellen Zahlen ist dies nicht mehr der
Fall. Schon eine einzige reelle Zahl anzugeben erfordert die Angabe unendlich vie-
ler rationaler Zahlen. Natürlich gibt es einige reelle Zahlen die nicht rational
√ sind,
und doch halbwegs explizit angegeben werden können (etwa die Zahl 2), aber
dies bildet die Ausnahme.
Das etwas Dramatisches passiert is,t zeigt auch die folgende Beobachtung. Dazu
brauchen wir den Begriff der Abzählbarkeit.
Definition 1.82 (Abzählbarkeit). Eine Menge A heißt abzählbar, wenn es eine in-
jektive Abbildung C : A → N gibt. Die Menge heißt abzählbar unendlich, wenn es
eine bijektive Abbildung C : A → N gibt.
Anmerkung. Man sagt auch, eine abzählbar unendliche Menge habe die gleiche
Mächtigkeit wie die natürlichen Zahlen. Eine Menge, die abzählbar, aber nicht
abzählbar undendlich ist, ist endlich. Jede endliche Menge ist trivialerweise abzählbar.
Anmerkung. Die Definition (1.82) ist äquivalent zu: Eine Menge A heißt abzählbar,
wenn es eine surjektive Abbildung x : N → A (also eine Folge mit Werten in A) gibt.
Die Menge heißt abzählbar unendlich, wenn es eine bijektive Abbildung x : N → A
gibt. Im letzteren Fall ist a einfach die Umkehrabbildung von C, x = C −1 .
Beweis. Punkt (i) ist trivial. Um (ii) zu zeigen, konstruieren wir die Abbildung C
wie folgt:
1, wenn z = 0,
C(z) = n + n, wenn z = n ∈ N,
(1.62)
n + n + 1,
wenn ; z = −n, n ∈ N.
Offenbar erfüllt diese die Ansprüche. Für die rationalen Zahlen ist es etwas kom-
plizierter, eine explizite Abbildung anzugeben. Die Idee ist aber einfach: Wie-
der ist C(0) = 1. Für k ∈ N nummerieren wir zunächst alle rationalen Zahlen nz
(wenn ein Bruch auftaucht, der äquivalent zu einem schon früher gezählt wurde,
so überspringen wir diesen einfach) mit |z| ≤ 1, n = 1. Dann nummerieren wir die
1.4 Die reellen Zahlen 33
verbleibenden Zahlen mit |z| ≤ 2, n ≤ 2, und so weiter. Da es für jede rationale Zahl
ein k gibt, so dass |z| ≤ k und n ≤ k, erhält jede rationale Zahl nach hinreichend
vielen Iterationen eine verschiedene Nummer aus N. Damit liefert dieses Vorgehen
eine Bijektion.
Abb. 1.10 Abzählschema der rationalen Zahlen bis |z| ≤ z, n ≤ 7. Die Kreuze markieren Brüche,
die keine neuen rationalen Zahlen sind und daher übersprungen werden.
Dass R nicht abzählbar ist, beweisen wir durch Widerspruch. Dazu nehmen wir
an, es gäbe eine Aufzählung aller reellen Zahlen, also eine Folge x = {x1 , x2 , x3 , . . . , }
deren Bild alle reellen Zahlen sind. Wenn wir zeigen können, dass es eine Cauchy-
Folge gibt, die gegen keinen der Punkte xi , i ∈ N konvergiert, dann haben wir gezeigt,
dass es eine reelle Zahl gibt, die nicht in der Folge x vorkommt. Die Idee ist es
eine Folge zu konstruieren, die sehr schnell konvergiert und dabei den Punkten in x
fernbleibt. Wir wollen nun eine solche Folge konstruieren: Es sei a1 = x1 + 1. Weiter
wählen wir an+1 jeweils so, dass einerseits |an+1 − an | ≤ 3−n , aber |an+1 − xn+1 | ≥
3−n . Dies ist stets möglich, da ja entweder xn+1 ≤ an oder xn+1 ≥ an gelten muss.
Entsprechend wählen wir an+1 jeweils auf der anderen Seite von an . Wir behaupten
nun folgendes:
(i) a ist eine Cauchy-Folge;
34 1 Logik, Mengen, Zahlen
Lemma 1.84 (Geometrische Reihe, 1). Sei x , 1 eine reelle Zahl. Dann gilt
n
xk − xn+1
x` =
X
. (1.63)
`=k
1− x
Beweis. Zunächst ist klar, dass n`=k x` = xk n−k x` . Wir müssen also nur den Fall
P P
Pn k `=0
k = 0 betrachten. Wir setzen S n = k=0 x . Nun gilt einerseits: S n+1 = 1 + xS n ,
andererseits S n+1 = S n + xn+1 . Daher muss auch gelten 1 + xS n = S n + xn+1 , oder
S n (1 − x) = 1 − xn+1 . Da nach Voraussetzung 1 − x , 0, folgt daraus die Gleichung
(1.63). u t
Korollar 1.85. Sei x ∈ R mit 0 ≤ x < 1. Sei a die Folge mit Folgengliedern an = xn .
Dann gilt lim a = 0.
Weiter ist offenbar an+1 = xn+1 = xxn = xan < an . Falls lim a = y > 0, ist daher für
alle n ∈ N, an > y. Dann ist n`=1 a` ≥ ny, n ∈ N. Offensichtlich gibt es n ∈ N, so dass
P
ny > 1−x
1
, im Widerspruch zu (1.64). Da ausserdem an ≥ 0, für alle n ∈ N, gilt,
3 3
|an − xk | = |an − ak + ak − xk | ≥ |ak − xk | − |an − ak | ≥ 33−k − 3−k = 3−k . (1.67)
2 2
t
u
Definition 1.86 (Monotone Folgen). Eine Folge a heißt monoton wachsend genau
dann, wenn für alle n ∈ N, an+1 ≥ an . Sie heißt streng monoton wachsend wenn
für alle n ∈ N, an+1 > an . Entsprechend sind monoton fallende und streng monoton
fallende Folgen definiert.
Lemma 1.88. Falls a eine Cauchy-Folge ist und b eine Teilfolge, dann ist a ∼ b.
Beweis. Übung. t
u
Lemma 1.89. Jede Folge besitzt eine monoton wachsende oder eine monoton fal-
lende Teilfolge.
36 1 Logik, Mengen, Zahlen
Beweis. Zum Beweis führen wir die Folge der Rekorde ein. Wir sagen, dass n eine
Rekord von a ist, wenn für alle m > n, am ≤ an . Falls die Menge der Rekorde nicht
endlich ist, so gibt es eine streng monoton wachsende Folge (nk )k∈N von Rekorden,
und die Teilfolge b mit bk = ank , k ∈ N ist monoton fallend. Damit sind wir in diesem
Fall fertig. Sein nun die Menge der Rekorde endlich aber nicht leer. Dann gibt es
ein größtes Element in dieser Menge, dass wir N nennen. Dann ist m1 = N + 1 kein
Rekord, und es gibt notwendigerweise m2 > m1 , so dass am2 > am1 . Aber auch m2
ist kein Rekord, und es gibt m3 , so dass am3 > am2 . Durch vollständige Induktion
folgt, dass es für jedes k ∈ N ein mk > mk−1 gibt, so dass amk > amk−1 . Dann ist b
mit bk = amk , k ∈ N eine monoton wachsende Teilfolge von a. Falls die Menge der
Rekorde leer ist, so setzen wir m1 = 1 in der obigen Konstruktion und erhalten so
ebenfalls eine monoton wachsende Teilfolge. Damit ist das Lemma bewiesen. u t
Lemma 1.90. Sei [a] eine reelle Zahl. Dann gibt es eine monoton wachsende (mo-
noton fallende) Cauchy-Folge, b, so dass b ∼ a.
Beweis. Aus Lemma 1.89 wissen wir, dass jede Folge entweder eine monoton
wachsende oder eine monoton fallende Teilfolge besitzt. Wenn a eine monoton
wachsende Teilfolge b hat, so ist b die gewünschte Folge.
Es bleibt der Fall, dass a nur eine monoton fallende Teilfolge hat. Dann muss
diese sogar eine streng monoton fallende Teilfolge enthalten, da sonst eine konstan-
te Teilfolge existieren müsste, die dann auch monoton wachsend wäre, im Wider-
spruch zur Annahme.
Wir können also ohne Beschränkung der Allgemeinheit annehmen, dass a selbst
streng monoton fallend ist. Wir wollen zeigen, dass es dann eine zu a äquivalente
Folge gibt, die monoton wachsend ist. Da a Cauchy-Folge und fallend ist, gibt es für
jedes n ∈ N, ein kn ∈ N, so dass für alle m > kn , akn − am < 41 (an−1 − an ). Wir können
kn so wählen, dass die Folge k mit Folgengliedern kn monoton wachsend ist.
Definiere nun die Folge b so dass bn = 2akn+1 − an . Dann ist
1
bn − bn−1 = 2akn+1 − an − 2akn + an−1 = an−1 − an − 2 akn − akn+1 ≥ (an−1 − an ) > 0,
2
(1.68)
und somit ist b streng monoton wachsend. Andererseits ist |an − bn | = 2|akn − an |, und
diese Folge konvergiert gegen Null, weil a Cauchy-Folge ist. u t
Anmerkung. Bei der Konstruktion der reellen Zahlen kann man sich auf eine noch
kleinere Menge von Cauchy-Folgen einschränken. Zum Beispiel kann man die Men-
ge der dyadischen Zahlen, D, definieren als
(
D = d ∈ Q : ∃n,m∈N ∃dm ∈{0,1},...,d1 ∈{0,1},d0 ∈{0,1},d−1 ∈{0,1},...,d−n ∈{0,1} :
n
m
)
X X
d = dk 2 ∧ d = −
−k dk 2 .
k
(1.69)
k=−m k=−n
1.5 Die komplexen Zahlen 37
für eine gegebene Folge (dk )−m≤k∈Z . Die Folge d zusammen mit der Zahl m nennt
man die Binärdarstellung der reellen Zahl x, wobei m durch Markierung eines Punk-
tes in der Folge bezeichnet wird, also
x = 10100010101.011000001100100100010010010010010101 . . . (1.71)
Im obigen Beispiel ist dann m = 11. Natürlich kann man auch hier die Zahl im
Allgemeinen nicht vollständig aufschreiben. Benutzt man statt der Zahl 2 die Zahl
10 und erlaubt, dass dk ∈ {0, 1, . . . , 9}, erhält man die Dezimaldarstellung der reellen
Zahlen (hierbei Verwendet man die Abkürzungen 1 + 1 = 2, 1 + 1 + 1 = 3, etc.
Mit den reellen Zahlen haben wir Zahlen bereitgestellt, die alle geometrischen
Größen quantifizieren können. Wenn wir aber zu unserem Ausgangspunkt, der Fra-
ge, ob die Gleichung x2 = 2 eine Lösung hat, zurückgehen, so sehen wir das in ei-
nem ganz ähnlichen Problem auch die reellen Zahlen scheitern. Wenn wir nämlich
fragen, ob es eine reelle Zahl gibt, so dass x2 = −1, lautet die Antwort nein. In-
zwischen schreckt uns nichts mehr, und wir versuchen einfach, eine fiktive Lösung
dieser Gleichung in einen erweiterten Zahlenkörper einzuschmuggeln. Wir geben
dieser Zahl das Symbol i. Addition und Multiplikation werden einfach fortgesetzt
so dass für jede reelle Zahl x, x + i und x ? i = ix. Die komplexen Zahlen bilden
wiederum einen kommutativen Körper, der aber nicht mehr geordnet ist. Man kann
zeigen, dass jede algebraische Gleichung in C lösbar ist. Wir kommen auf die kom-
plexen Zahlen später wieder zurück.
Kapitel 2
Folgen und Reihen
Konvergenz ist der zentrale Begriff der Analysis. Wir haben dazu schon Einiges
bei der Konstruktion der reellen Zahlen gelernt. Die wollen wir in diesem Kapitel
vertiefen.
Wir führen zunächst ein paar einfache Konzepte ein, deren Bedeutung uns später
noch klarer werden wird. Alles spielt sich hier in den reellen Zahlen ab. Wir benut-
zen folgende Konvention: Das Symbol ist immer eine positive reelle Zahl.
Definition 2.1 (-Umgebung). Sei x ∈ R und ∈ R, > 0. Dann heißt die Menge
I (x) = {y ∈ R : |x − y| < }, die offene -Umgebung von x.
Anmerkung. Offenheit und Abgeschlossenheit schließen sich nicht aus. Die leere
Menge ist offen und abgeschlossen. Es ist vernünftig, die leere Menge als offen und
abgeschlossen zu bezeichnen. Denn da ∅ ja keinen Punkt enthält, ist die Forderung
(2.1) leer erfüllt. Somit sollte ∅ offen sein. Andererseits ist das Komplement von
∅ ja R\∅ = R, und R erfüllt die Forderung an eine offene Menge. Damit muss ∅
abgeschlossen sein.
39
40 2 Folgen und Reihen
Beweis. (i): Für jedes x ∈ R und jedes > 0 ist I (x) ⊂ R, also ist R offen. Anderer-
seits ist Rc = R\R = ∅ ebenfalls offen. Also ist R abgeschlossen.
(ii): Wenn y ∈ G x , dann ist I(y−x)/2 (y) ∈ G x , und somit ist G x offen.
(iii): K xc = {y ∈ R : y < x} ist genau wie in (ii) offen. Also ist K x nach Definition
abgeschlossen.
(iv): Das Komplement von I (x) ist die Vereinigung zweier offener Halbgeraden.
Daher ist I (x) abgeschlossen. u t
und
(iii) den Abschluss von M,
M = M ∪ ∂M. (2.4)
Beweis. Übung. t
u
Anmerkung. Wenn die Menge M abzählbar ist, so ist notwendig int M = ∅. Insbe-
sondere ist int Q = ∅.
Definition 2.6 (Sup und inf). Sei M ⊂ R. Dann ist sup M die kleinste reelle Zahl,
so dass alle Elemente von M kleiner oder gleich sup M sind. Präzise formuliert:
(sup M = z) ⇔ (∀ x∈M : x ≤ z) ∧ ∀y<z ∃ x∈M : x > y . (2.5)
inf M ist die größte reelle Zahl, so dass alle Elemente von M größer oder gleich
inf M sind.
(inf M = z) ⇔ (∀ x∈M : x ≥ z) ∧ ∀y>z ∃ x∈M : x < y . (2.6)
Anmerkung. Supremum und Infimum einer Menge müssen nicht existieren. So hat
R kein Supremum und kein Infimum. Wir sagen dann auch, das Supremum von R sei
plus unendlich und das Infimum von R sei minus unendlich und schreiben sup R =
2.1 Erste topologische Begriffe 41
+∞ und inf R = −∞. ±∞ haben keine guten Eigenschaften als Zahlen (z. B. für alle
ist ∞ + x = ∞), sind aber oft nützlich um bestimmte Sachverhalte auszudrücken.
Man bezeichnet die Menge R = R ∪ {−∞, +∞} als die erweiterte Zahlengerade oder
die erweiterten reellen Zahlen.
Lemma 2.7. Sei M ⊂ R beschränkt. Dann existieren sup M und inf M in R.
Beweis. Wir betrachten nur sup M, das Argument für inf M ist identisch. Nach De-
finition gibt es N ∈ N, so dass für alle x ∈ M, x < N. Wir wollen nun zwei Cauchy-
Folgen konstruieren, die gegen sup M konvergieren. Dazu wählen wir ein x ∈ M und
setzen a1 = x, b1 = N. Falls a1 oder b1 die Eigenschaft des Supremum hat, sind wir
fertig. Andernfalls setzen wir c1 = (a1 + b1 )/2. Nun setzen wir
a1 ,
wenn ∀ x∈M : c1 ≥ x,
a2 =
(2.7)
c1 ,
wenn ∃ x∈M : c1 < x,
und
c1 ,
wenn ∀ x∈M : c1 ≥ x,
b2 =
(2.8)
b1 ,
wenn ∃ x∈M : c1 < x,
und weiter, für n ∈ N, cn = (an + bn )/2
an , wenn ∀ x∈M : cn ≥ x,
an+1 =
(2.9)
cn , wenn ∃ x∈M : cn < x,
und
cn ,
wenn ∀ x∈M : cn ≥ x,
bn+1 =
(2.10)
bn ,
wenn ∃ x∈M : cn < x.
42 2 Folgen und Reihen
Nach Konstruktion ist für alle n ∈ N, bn ≥ an und bn+1 − an+1 = (bn − an )/2. Dar-
aus folgt, dass bn − an ≤ 2−(n−1) (b1 − a1 ). Ausserdem ist b monoton fallend und a
monoton wachsend. Damit ist auch, für alle m ∈ N,
Damit ist b eine Cauchy-Folge und konvergiert gegen eine Zahl z ∈ R. Da für alle
n, für alle x ∈ M, bn ≥ x, ist für alle x ∈ M auch z ≥ x. Somit erfüllt z die erste
Anforderung an sup M. Angenommen es gäbe y < z, so dass diese Anforderung
auch von y erfüllt ist. Nun ist aber nach Konstruktion auch lim a = z, und für alle n
gibt es x ∈ M, so dass x ≥ an . Es gibt aber n0 ∈ N, so dass für alle n ≥ n0 , |z − an | ≤
|z − y|/2. Dann ist für x ≥ an auch x > y, was der angenommenen Eigenschaft von y
widerspricht. Daher gibt es kein solches y und z = sup M. u t
Lemma 2.8. (i) Wenn O offen ist, dann ist sup O < O und inf O < O.
(ii) Wenn A abgeschlossen und beschränkt ist, dann ist sup A ∈ A und inf A ∈ A.
Beweis. Der Beweis von (i) ist sehr einfach: Keine -Umgebung von sup O oder
inf O kann ganz in O enthalten sein, da sonst sup O + /2 ∈ O, bzw. inf O − /2 ∈ O
wäre, was der Definition widerspricht. Um (ii) zu zeigen, bemerken wir zunächst,
dass weil A beschränkt ist, sup A und inf A in R existieren. Wir nehmen nun an
sup A < A. Dann ist sup A ∈ Ac , welches aber offen ist. Dann gibt es > 0, so dass
I (sup A) ∈ Ac . Dass ist aber auch sup A − /2 größer als jedes Element in A, was der
Definition von sup A widerspricht. u t
2.2 Folgen
Wir wissen bereits, was eine Folge reeller Zahlen ist, was eine Cauchy-Folge und
was eine konvergente Folge ist. Wenn eine Folge nicht konvergiert, so sagen wir,
dass sie divergiert. Insbesondere wissen wir, dass es für Folgen reeller Zahlen
äquivalent ist eine Cauchy-Folge oder eine konvergente Folge zu sein. Wir wissen
auch schon, was eine Teilfolge ist. Wir machen nun noch einige wichtige Beobach-
tungen.
Lemma 2.9 (Monotone Konvergenz). Sei a eine monoton wachsende Folge reel-
ler Zahlen und sei a beschränkt. Dann konvergiert a gegen sup{an , n ∈ N}. Ebenso
konvergiert jede monoton fallende beschränkte Folge gegen inf{an , n ∈ N}.
Beweis. Wir betrachten die Menge A = {an : (n, an ) ∈ a, n ∈ N}. Dann ist sup A ∈ R, da
ja A nach oben beschränkt ist. Nun wissen wir nach der Definition des Supremums,
dass für jedes k ∈ N, es ein Element an ∈ A gibt, so dass an > sup A − 1/k. wegen der
Monotonie gilt dies dann auch für alle am mit m ≥ n. Daraus folgt, das es für jedes
k ∈ N ein n ∈ N gibt, so dass für alle m ≥ n,
2.2 Folgen 43
d.h. z ist die kleinste Zahl, die die Folge auf lange Sicht nur beliebig wenig
überschreitet. Entsprechend ist lim inf a definiert.
Ein weiterer wichtiger Begriff ist der des Häufungspunktes einer Folge.
Definition 2.12 (Häufungspunkt). Sei a eine Folge reeller Zahlen. Dann heißt x ∈
R Häufungspunkt von a, falls es eine Teilfolge von a gibt, die gegen x konvergiert.
Lemma 2.13. Ein Punkt x ∈ R ist Häufungspunkt einer Folge a genau dann, wenn
es für jedes k ∈ N eine unendliche Teilmenge von Nk ⊆ N gibt, so dass für alle n ∈ Nk ,
|an − x| ≤ 1/k.
Beweis. Es folgt aus der Definition von Konvergenz, dass aus der Existenz einer
Teilfolge, die gegen x konvergiert der zweite Teil der Aussage folgt. Der umgekehrte
Schluss ist schwieriger und interessanter. Für jedes k ∈ N gibt es eine unendliche
Teilmenge, Nk ⊂ N, so dass für alle m ∈ Nk , |am − x| ≤ 1/k. Wir können diese so
wählen, dass Nk+1 ⊂ Nk . Nun wählen wir ein Element aus N1 , sagen wir n1 = min N1 .
Dann wählen wir n2 als das kleinste Element aus N2 , so dass n2 > n1 , und induktiv
Weil alle Mengen Nk unendlich sind, existieren alle nk für k ∈ N. Man zeigt nun
leicht durch Nachprüfen der Definition von Konvergenz, dass die Folge b mit bk =
ank , k ∈ N gegen x konvergiert. Damit ist die gewünschte Unterfolge erhalten. u
t
Lemma 2.14. Sei a eine reelle Folge und es sei lim sup a = z ∈ R. Dann ist z der
größte Häufungspunkt von a. Falls lim inf a = y ∈ R existiert, dann ist y der kleinste
Häufungspunkt von a.
44 2 Folgen und Reihen
Beweis. Übung. t
u
Lemma 2.15. Eine reelle Folge a konvergiert genau dann gegen eine reelle Zahl x,
wenn lim sup a = lim inf a = x.
Beweis. Übung. t
u
Es ist noch nützlich, bei Folgen die nicht konvergieren zu unterscheiden, ob sie
dies nicht tun, weil es mehrere Häufungspunkte gibt, oder weil es keine Häufungspunkte
in R gibt. Eine ganz einfache Folge, die zwei Häufungspunkte hat ist etwa an =
(−1)n . Die Folge an = n dagegen hat gar keinen Häufungspunkt, dafür aber ein kla-
res Ziel: unendlich!
Definition 2.16 (Uneigentliche Konvergenz). Wir sagen, dass eine reelle Folge a
uneigentlich gegen +∞ konvergiert, wenn lim inf a = lim sup a = +∞. a konvergiert
gegen −∞, wenn lim sup a = lim inf a = −∞. Dabei bedeutet die Aussage lim inf a =
+∞, dass ∀N∈N ∃n0 ∈N ∀n≥n0 an ≥ N. (Entsprechend für lim sup a = −∞). Die Aussage
lim sup a = +∞ bedeutet ∀N∈N ∀n0 ∈N ∃n≥n0 an ≥ N.
Falls
an
lim = 0, (2.17)
n↑∞ bn
so sagt man a sei asymptotisch von kleinerer Ordnung als b und schreibt a = o(b).
Lemma 2.18. Falls a konvergiert, und b asymptotisch gleich zu a ist, dann ist b
äquivalent zu a. Dies ist nicht notwendig der Fall, wenn a uneigentlich gegen ±∞
konvergiert. Wenn b konvergiert und a = o(b), dann konvergiert a gegen Null. Insbe-
sondere sind die Aussagen ’a = o(1)’ und ’a ist eine Nullfolge’ äquivalent.
Beweis. Wir nehmen an lim a = z > 0 und a asymptotisch gleich zu b. Nun wissen
wir, dass auch die Folge b/a gegen 1 konvergiert. Schließlich ist a − b = a(1 − b/a),
und diese Folge konvergiert gegen lim a lim(1 − b/a) = 0. Falls lim a = 0, so existiert
einerseits für jedes K ∈ N ein n0 ∈ N so dass für alle n ≥ n0 , |an | ≤ 1/K 2 . Nehmen wir
nun an, dass b keine Nullfolge ist. Dann gibt es K 0 ∈ N, so dass für alle n1 ∈ N ein
n ≥ n1 existiert, so dass |bn | > 1/K 0 . Dann ist natürlich erst recht |bn | > 1/K, wenn
K ≥ K 0 . (siehe Lemma 1.72 und Lemma 1.74). Insbesondere gilt Letzteres für n ≥ n0
2.3 Reihen 45
von oben. Daraus folgt aber, dass es für jedes K ∈ N mit K > K 0 ein n0 gibt sowie
ein n ≥ n0 , so dass abnn ≤ 1/K. Dann ist aber abnn − 1 ≥ 1 − 1/K, weswegen a/b nicht
gegen 1 konvergieren kann. Der Beweis der zweiten Aussage ist eine Übung. u
t
2.3 Reihen
Eine besonders wichtige Klasse von Folgen sind die sogenannten Reihen. Die Un-
tersuchung von Reihen und deren Verhalten ist eine ganz zentrale Aufgabe der Ana-
lysis, die bei der Lösung zahlreicher Probleme immer wieder auftritt. Dieses Kapitel
ist daher auch wesentlich praktischer ausgerichtet als die bisherigen, in denen kon-
zeptuelle Dinge im Vordergrund standen.
Reihen werden aus Folgen konstruiert.
Definition 2.19 (Reihen). Sei a eine Folge reeller Zahlen. Dann heißt die Folge S
mit Folgengliedern
Xn
Sn = an (2.18)
k=1
eine Reihe. Wenn S zu einer reellen Zahl konvergiert, so sagt man, die Reihe kon-
vergiert und schreibt
∞
X
lim S = lim S n = ak . (2.19)
n↑∞
k=1
P∞
Anmerkung. Beachte, dass die Schreibweise k=1 ak nur über die linke Seite defi-
P
niert ist. Man schreibt äquivalent auch k∈N ak . Manchmal möchte man auch Rei-
hen nicht bei 1 sondern bei 0 beginnen lassen. Wir verstehen schon, dass dies völlig
äquivalent ist.
Das wichtigste Beispiel von Reihen ist uns schon begegnet. Es ist die
Wir wissen schon, dass wir S n explizit ausrechnen können. Das kommt bei Rei-
hen sehr selten vor.
46 2 Folgen und Reihen
Lemma 2.21. Sei S die geometrische Reihe aus (2.20). Dann gilt
1 − xn
Sn = , (2.21)
1− x
wenn x , 1. Wenn x = 1, so ist S n = n + 1. Insbesondere gilt: S konvergiert genau
dann, wenn |x| < 1 und es gilt
∞
X 1
xk = . (2.22)
k=0
1− x
Beweis. Gleichung (2.21) hatten wir schon in Gl. (1.84) hergeleitet. Aus dieser
xn
Gleichung folgt aber, dass S n − 1−x 1
= 1−x , und da für |x| < 1, xn nach Null konver-
giert, ist S n in der Äquivalenzklasse der konstanten Folge 1/(1 − x), also konvergent
mit Grenzwert wie behauptet. Falls |x| ≥ 1, so ist |S n+1 − S n | = |x|n ≥ 1, weswegen S
keine Cauchy-Folge sein kann, und also auch nicht konvergiert. u t
Wir sehen in diesem Beispiel, dass die Reihe S konvergiert, wenn die Reihen-
glieder xn nach 0 streben, und umgekehrt. Kann man das verallgemeinern?
Lemma 2.22. Sie a eine reelle Folge und S die Reihe mit Partialsummen S n =
k=1 ak . Wenn S konvergiert, dann konvergiert a und lim a = 0.
Pn
Beweis. Da S konvergiert, gibt es für jedes k ein n0 , so dass für alle n ≥ n0 ins-
besondere |S n+1 − S n | < 1/k, also |an+1 | < 1/k. Damit konvergiert aber a gegen 0.
t
u
heißt die harmonische Reihe. Die harmonische Reihe konvergiert nicht, bzw. sie
konvergiert uneigentlich nach +∞.
Beweis. Wir wollen zeigen, dass die harmonische Reihe nicht nach oben beschränkt
ist. Dazu wählen wir n = 2m , mit m ∈ N. Wir können die natürlichen Zahlen von
1 bis 2m in m Teilmengen I1 , . . . , Im zerlegen, wobei I` = {2`−1 + 1, 2`−1 + 2, . . . 2` },
` = 1, . . . , m. Nun benutzen wir folgende Abschätzung: Wenn k ∈ I` , dann ist 1k ≥ 2−` .
Es folgt daher, dass
2.3 Reihen 47
m
X X 1
S n = S 2m =
k
`=1 k∈I`
m
X X −`
≥ 2
`=1 k∈I`
m
m
2−` 2`−1 =
X
= . (2.24)
`=1
2
Daraus folgt lim sup S = +∞. Da die Folge monoton wächst, gilt auch lim inf S = +∞
und somit die Behauptung. u t
Das wichtigste Hilfsmittel um zu testen, ob eine Reihe konvergiert oder nicht ist
der Vergleich mit bekannten Reihen. Das haben wir im obigen Beweis auch schon
getan.
Satz 2.24 (Vergleichssatz). Es seien a und b reelle Folgen und es gibt ein m ∈ N
und ein C ∈ R+ , so dass für alle n ≥ m, |an | ≤ C|bn |. Dann gilt Folgendes:
(i) Falls die Reihe mit Reihengliedern |bn |, n ∈ N, konvergiert, dann konvergiert
die Reihe mit Reihengliedern an .
(ii) Falls die Reihe mit Reihengliedern an nicht konvergiert, so divergiert auch die
Reihe mit Reihengliedern |bn |.
Beweis. Der Satz ist sehr einleuchtend und der Beweis nicht schwer. Er sollte in
jedem Fall als Übung ausgeführt werden. u
t
Die Vergleichsreihe der Wahl ist meißt eine geometrische Reihe. Allerdings
funktioniert der Vergleich nicht immer sofort, sondern man muss, wie im Beispiel
der harmonischen Reihe, noch partiell vorsummieren. Dazu gehört ein gewisses Fin-
gerspitzengefühl und letztlich Erfahrung, die man nur durch viel Übung bekommen
kann. Grundlage ist dabei die Anwendung der folgenden sehr trivial aussehenden
Ungleichungen.
Lemma 2.25 (Maximum und Minimum Ungleichungen). Sei a eine reelle Folge.
Dann gilt
n
X n
ak ≤ n max ak (2.25)
k=1
k=1
und
n
X n
ak ≥ min ak . (2.26)
k=1
k=1
Lemma 2.26. Es sei S die Reihe mit S n = nk=1 k−s , s ∈ R. Dann gilt: S konvergiert
P
genau dann wenn s > 1.
Beweis. Es sei s > 1. Wir gehen vor wie im Fall der harmonischen Reihe, benutzen
aber die Abschätzung: Wenn k ∈ I` , dann gilt k s ≤ 2−s`+s . Damit haben wir
2m
X m X
X m
X
k−s ≤ 2−s`+s ≤ 2 s−1 2−(s−1)` . (2.28)
k=1 `=1 k∈I` `=1
Die letztere Reihe kann jetzt mit der geometrischen Reihe verglichen werden. Da
2−s < 1, erhalten wir, dass Zm = S 2m konvergiert. Da S n monoton wachsend ist,
folgt daraus, dass lim sup S ≤ lim Z, und trivialerweise lim inf S ≥ lim Z. Damit kon-
vergiert S .
Im Fall s ≤ 1 vergleichen wir einfach mit der harmonischen Reihe, da dann k−s ≥
−1
k . Da die harmonische Reihe divergiert, tut dies auch S . u t
Aus dem Vergleich mit der geometrischen Reihe leitet man die zwei folgenden,
gerne benutzten Kriterien her.
Beweis. Im Fall (i) muss es ein n0 ∈ N geben, so dass für alle n ≥ n0 , |an+1 /an | ≤
1+q
2 = q < 1. Dann ist für n ≥ n0 |an | ≤ |an0 |(q )
0 0 −n0 (q0 )n = C(q0 )n . Daher greift (i) aus
Satz 2.24 und die Reihe konvergiert wegen dem Vergleich mit einer konvergenten
geometrischen Reihe absolut. Der Fall (ii) is vollständig analog und wird als Übung
belassen. ut
Lemma 2.28 (Wurzelkriterium). Sei a eine Folge. Sei L = lim supn↑∞ |an |1/n . Dann
gilt:
(i) Wenn L < 1, so konvergiert die Reihe mit Reihengliedern an absolut;
(ii) Wenn L > 1, so divergiert die Reihe mit Reihengliedern an .
Beweis. Der Beweis des Wurzelkriteriums ist noch einfacher. Im Fall (i) gibt es
2 = L < 1. Damit ist für diese n |an | ≤ (L ) ,
n0 ∈ N, so dass für alle n ≥ n0 , |an |1/n ≤ L+1 0 0 n
und der Vergleich mit einer geometrischen Reihe zeigt Konvergenz sogar der Reihe
mit Reihengliedern |an |. Im Fall (ii) wissen wir, dass es eine Unterfolge nk und
2 = L > 1, also |ank | ≥ (L ) . Es
k0 ∈ N gibt, so dass für alle k ≥ k0 , |ank |1/nk ≥ L+1 0 0 nk
folgt aus dem Vergleichssatz, dass diese Unterfolge divergiert, und mithin die Folge
a divergiert. ut
Beispiele. Oft ist das Wurzelkriterium formal stärker als das Quotientenkriterium.
Betrachte als Beispiel die Reihe mit Reihengliedern
2−n , wenn n = 2k, k ∈ N,
aN =
(2.29)
5−n , wenn n = 2k − 1, k ∈ N.
Hier ist a2k+1 /a2k = 5−2k−1 22k = (2/5)2k /5, und a2k+2 /a2k+1 = 2−2k−2 52k+1 = (5/2)2k+1 /2,
d.h. die Folge der Quotienten divergiert und das Quotientenkriterium kann nicht ver-
wendet werden. Dagegen ist für alle n ∈ N, an1/n ≤ 1/2, also lim supn↑∞ |an | ≤ 1/2 (es
gilt sogar Gleichheit), und das Wurzelkriterium liefert sofort Konvergenz. (Das Bei-
spiel ist natürlich nicht sonderlich tiefsinnig).
Wir hatten gesehen, dass es für die Konvergenz einer Reihe nicht ausreicht, wenn
die zugrundeliegende Folge nach Null konvergiert. Das folgende Kriterium von
Leibniz gibt Beispiele, für die man auf Konvergenz schließen kann.
Lemma 2.29 (Leibniz-Kriterium). Sei a eine Folge mit monoton fallenden, nicht
negativen Folgengliedern. Wenn lim a = 0 ist, dann konvergiert die Reihe S mit S n =
Pn k+1 a und es gilt
k=1 (−1) k
∞
X
(−1)k+1 ak ≤ an+1 . (2.30)
k=n+1
bzw.
2n+1
X n
X
(−1)k+1 ak = a1 + (a2`+1 − a2` ) = un . (2.32)
k=1 `=1
50 2 Folgen und Reihen
Dann ist wegen der Monotonie der Folge a die Folge g monoton wachsend und die
Folge u monoton fallend. Andererseits gilt für alle n,
gn ≤ un (2.33)
Daraus folgt nun aber, dass gn ≤ gn+1 ≤ un+1 ≤ un , und damit durch vollständige
Induktion, gn+k ≤ un , für alle k und alle n. Ebenso gilt un+k ≥ gn . Damit sind die
monotonen Folgen u und g beschränkt und konvergieren nach dem Satz von der
monotonen Konvergenz. Weiterhin gilt, dass un − gn = a2n+1 , und a konvergiert ge-
gen Null. Also haben u und g den selben Grenzwert. Somit konvergiert die Reihe S .
Schließlich erhalten wir, dass für alle n ∈ N, lim g ≤ un , also 0 ≤ lim S − gn ≤ a2n+1
und 0 ≥ lim S − un ≥ −a2n+2 . Dies liefert (2.33). u t
Wir sagen, dass eine Reihe mit Reihengliedern an absolut konvergiert, wenn die
Reihe mit Reihengliedern |an | konvergiert. Das Leibniz-Kriterium zeigt, dass es Rei-
hen gibt, die konvergieren, aber nicht absolut konvergieren. Zum Beispiel konver-
giert D mit S n = n (−1)n+1 n−1 nach Leibniz, die Reihe ist aber nicht absolut kon-
P
vergent.
n+m
X
|S n − S n+m | ≤ |a` |. (2.34)
`=n+1
P
Da n |an | konvergiert, ist für jedes K ∈ N die rechte Seite für alle m ∈ N kleiner als
1/K, wenn n größer als ein gewisses n0 ist. Damit ist aber auch die Folge S eine
Cauchy-Folge und konvergiert. u t
2.3.1 Umordnungen
Wir haben gesehen, dass die partielle Vorsummierung von Reihen ein wichtiges
Hilfsmittel für die Untersuchung von Konvergenz ist. Folgendes Beispiel zeigt, dass
man hierbei leicht Fehler machen kann: Wir betrachten die Reihe S mit S n = n an
P
mit an = (−1)n+1 . Indem wir die Paare von aufeinander folgenden Terme zusammen
fassen, also b` = a2` − a2`−1 setzen, erhalten wie n an = ` b` . Nun ist aber b` =
P P
1−1 = 0, also gilt n an = 0. Natürlich haben wie hier gemogelt. Was wir auf diesem
P
Weg nur zeigen könnten, ist, dass S 2n = 2n n+1 = 0, und damit gibt es einen
P
k=1 (−1)
Unterfolge, die gegen Null konvergiert. Andererseits ist S 2n+1 = 1, und somit gibt
es eine weitere Unterfolge, die nach 1 konvergiert.
Eine andere Operation, die mit Vorsicht zu genießen ist, ist die Umordnung. Dazu
sei τ : N → N eine bijektive Abbildung. Sei a eine Folge und sei b die umgeordnete
Folge bn = aτ(n) . Man kann sich fragen, ob die Reihen S = n an und Σ = n bn den
P P
2.3 Reihen 51
selben Grenzwert haben (oder gemeinsam divergieren). Es zeigt sich, dass dies nur
bei absolut konvergenten Reihen der Fall ist.
Lemma 2.31. Seien a, b, S , Σ wie oben beschrieben. Dann ist lim S = lim Σ für alle
Umordnungen τ, genau dann wenn S absolut konvergent ist.
Beweis. Wir nehmen an, dass S absolut konvergiert. Für jedes n0 ∈ N muss es ein
N ∈ N geben, so dass das Bild der Menge {1, . . . , N} unter τ die Menge {1, . . . , n0 }
enthält (denn τ ist surjektiv: jedes Element von N liegt im Bild von τ). Damit kom-
men in den Summen S N und ΣN alle Terme ak mit k ≤ n0 vor und es folgt
∞
X
|S N − ΣN | ≤ |ak |. (2.35)
k=n0 +1
(die Summe auf der rechten Seite kann sogar durch eine endliche Summe ersetzt
werden). Wegen der absoluten Konvergenz von S ist die rechte Seite kleiner als
jedes 1/K, falls nur n0 groß genug gewählt wird. Damit folgt, ∀K∈N ∃N∈N ∀ M≥N :
| lim S − Σ M | < 1/K, und Σ konvergiert gegen den selben Grenzwert wie S .
Sei nun umgekehrt S konvergent aber nicht absolut konvergent. Es sei (an )+ =
max(an , 0) und (an )− = max(−an , 0) Es seien S + , S − die zugehörigen Reihen. Wir
wissen, dass S + − S − = S konvergiert und S + + S − = |an | divergiert. Dann muss
P
sowohl die Reihe S + als auch die Reihe S − divergieren (Warum?). Wir wollen eine
Umnummerierung τ konstruieren, die eine Teilfolge enthält, die gegen einen belie-
bigen Wert s konvergiert. Wir nehmen ohne Beschränkung der Allgemeinheit an,
dass s ≥ 0. Dann wählen wir σ(1) als das erste Mal, das die Reihe S + den Wert s
überschreitet,
σ(1) = inf{k : S + (k) ≥ s}, (2.36)
Als nächstes nehmen wir aus der Reihe der negativen Reihenglieder so viele, dass
wenn wir diese auf S + (σ(1) aufaddieren, wir wieder unter den Wert s fallen, d.h.
wir setzen
σ(2) = inf{k : S + (σ(1)) − S − (k) ≤ s}. (2.37)
Dann wissen wir, dass S + (σ(1)) > s und S + (σ(1)) − S − (σ(2)) ≤ s. Ausserdem wis-
sen wir, dass S + (σ(1)) − s ≤ a(σ(1)) und S + (σ(1)) − S − (σ(2)) − s ≥ a(σ(2)). Wir
iterieren nun, indem wir setzen
σ(2n − 1) = inf{k > σ(2n − 3) : S + (k) − S − (σ(2n − 2)) > s}, (2.38)
+
σ(2n) = inf{k ≥ σ(2n − 2) : S (σ(2n − 1)) − S (k) ≤ s}.
−
(2.39)
Nach Konstruktion ist 0 ≤ S + (σ(2n − 1)) − S − (σ(2n − 2)) − s ≤ |aσ(2n−1) |, und ent-
sprechend 0 ≥ S + (σ(2n − 1)) − S − (σ(2n)) − s ≥ −|aσ(2n) |. Da die Reihen S ± monoton
wachsen und nach +∞ uneigentlich konvergieren, folgt, dass σ(2n) und σ(2n − 1)
für alle n ∈ N existieren. Ausserdem streben die beiden Folgen jeweils nach +∞. Da
die Reihenglieder a Nullfolgen sind, sehen wir, dass die Folge
nach s konvergiert. Andererseits ist die Reihe Σ eine Teilfolge einer Umordnung der
Reihe S . Dies sieht man, indem wir schreiben
t
u
2.3.2 Mehrfachreihen
Eine Möglichkeit wäre wir folgt vorzugehen. Für i ∈ N definiere S n(i) = nj=1 ai j .
P
Falls für jedes i die Reihe S (i) konvergiert, so sei si = lim S (i) . Dann ist (si )i∈N ei-
ne Folge und wir können die zugehörige Reihe Σn = ni=1 si definieren. Falls diese
P
Reihe konvergiert, so wäre dies ein Kandidat für S . Allerdings könnten wir auch
( j)
S n = ni=1 ai j beginnen. Wenn diese
P
umgekehrt vorgehen, und mit den Summen b
konvergieren, so setzen wir σ j = lim b S ( j) und Σ
bn = Pn σ j . Es stellt sich die Fra-
j=1
ge, ob beide Vorgehensweisen dasselbe Resultat liefern. Da es sich hier wieder um
Umsortierungen von Summen handelt, wissen wir schon, dass Vorsicht geboten ist.
Wir zeigen zunächst, dass alles gut geht, falls die Funktion a nicht negativ (oder
entsprechend nicht positiv) ist. Wir führen die Bezeichnung R+ = {x ∈ R : x ≥ 0} ein.
Beweis. Wir beginnen mit der Annahme, dass die Folge Σ gegen einen Grenzwert
( j)
S n = ni=1 ai j kon-
S ( j) mit b
P
in R konvergiert. Dann folgt zunächst, dass alle Reihen b
vergieren. Denn es ist
n
X X ∞
n X n
X
( j)
Sn =
b ai j ≤ ai j = si ≤ lim Σ < ∞, (2.42)
i=1 i=1 j=1 i=1
S ( j) = σ j . Weiter ist
S ( j) beschränkt und daher konvergent. Wir setzen lim b
also ist b
2.3 Reihen 53
n
X n X
X N ∞
n X
X
σj = ai j + ai j (2.43)
j=1 j=1 i=1 j=1 i=N+1
Daraus folgt, dass auch die Reihe Σ b beschränkt ist und konvergiert. Es bleibt zu
zeigen, dass die Grenzwerte gleich sind. Da wir nun wissen, dass auch Σ b konver-
giert, können wir das vorhergehende Argument umgekehrt laufen lassen lassen und
erhalten sofort, dass lim Σ ≤ lim Σ,
b was Gleichheit der Grenzwerte impliziert.
Alternativ können wir auch so vorgehen. Wir
n X
X n ∞
n X
X
Σn = ai j + ai j (2.45)
i=1 j=1 i=1 j=n+1
Xn X n Xn X ∞
Σ
bn = ai j + ai j . (2.46)
j=1 i=1 j=1 i=n+1
Die beiden ersten Terme in diesen Gleichungen sind offenbar identisch. Die zwei-
ten Terme konvergieren gegen Null, wenn n ↑ ∞. Dazu zeigt man (mit demselben
Argument wie oben), dass
∞
n X
X ∞ X
X ∞
ai j ≤ ai j = lim Σ
b− Σ
bn , (2.47)
i=1 j=n+1 j=n+1 i=1
was wegen der Konvergenz von Σ b mit n gegen Null strebt. Für den zweiten Term
von (2.44) geht man analog vor. Wir haben damit nicht nur die Gleichheit der Grenz-
werte gezeigt, sondern auch, dass
n X
X n
lim Σ = lim Σ
b = lim ai j . (2.48)
n↑∞
i=1 j=1
Damit können wir nun den zweiten Teil des Satzes beweisen. Wir nennen Ik = {(i, j) :
1 ≤ i, j ≤ k}. Dann gilt wegen der Definition der Jn : Für jedes m ∈ N existieren
m ≤ n ≤ ` ∈ N : Im ⊂ Jn ⊂ I` . Damit gilt aber
54 2 Folgen und Reihen
X X X
ai j ≤ ai j ≤ ai j . (2.49)
(i, j)∈Im (i, j)∈Jn (i, j)∈I`
Daraus folgt
X X X X
lim ai j ≤ lim inf ai j ≤ lim sup ai j ≤ lim ai j . (2.50)
m↑∞ n↑∞ n↑∞ `↑∞
(i, j)∈Im (i, j)∈Jn (i, j)∈Jn (i, j)∈I`
Da die linken und rechten Grenzwerte existieren und gleich sind, folgt die Aussage.
t
u
Im allgemeinen Fall ist es am einfachsten, die Summen der positiven und der
negativen Terme getrennt zu betrachten. Wir setzen wie schon früher (ai j )+ =
max(ai j , 0) und (ai j )− = max(−ai j , 0).
Die Aussage des Satzes 2.32 gilt auch für nicht positive summierbare Funktio-
nen. Es ist offensichtlich, dass eine Funktion a summierbar ist wenn die positive
Funktion |a| summierbar ist.
Eine weiter Folgerung ist folgender Satz.
Satz 2.34. Seien S = n an und T = n bn absolut konvergente Reihen. Dann ist die
P P
Funktion d : N × N → R mit dnm = an bm summierbar und es gilt
X
lim S lim T = dnm (2.52)
(n,m)∈N×N
Beweis. Übungsaufgabe! t
u
Anmerkung. Alles was wir über Doppelsummen gesagt haben kann ohne Mühe auf
P
vielfache Summen der Form k1 ,...,k` ak1 ...k` verallgemeinert werden.
Kapitel 3
Funktionen
In diesem Kapitel kommen wir zu einem weiteren zentralen Objekt der Analysis,
den reellen Funktionen. Während bei Folgen, also Funktionen auf N nur das Ver-
halten bei ’Unendlich’ interessante Eigenschaften hatte (im Endlichen gibt es nur
endlich viele Funktionswerte), ist bei Funktionen auf R auch das ’lokale’ Verhalten
von Interesse, ja es ist gerade die wesentliche Aufgabe der Analysis, dieses Verhal-
ten zu beschreiben.
Definition 3.1. Sei D ⊆ R eine Teilmenge der reellen Zahlen. Eine reelle Funktion
mit Definitionsbereich D ist eine Abbildung f : D → R.
Notation. Eine Funktion wird in der Regel mit einem Buchstaben bezeichnet, z.B.
f (es gibt aber keinen Grund, eine Funktion nicht x zu nennen....). In der Regel wird
bei der Einführung einer Funktion Definitionsbereich und die Menge, in der das
Bild enthalten sind, angegeben. Oft kürzen wir aber auch ab und sagen nur ¨ Sei f
eine reelle Funktion¨. Für x ∈ D schreiben wir f (x) für diejenige reelle Zahl, für die
(x, f (x)) ∈ f . Alternativ schreibt man dafür auch x → f (x), also man sagt, f sei die
Funktion, die alle x ∈ D nach f (x) abbildet. Wir nennen f (x) den Wert der Funktion
an der Stelle x. f (x) ist keine Funktion!! Oft wird eine Funktion beschrieben, indem
eine Rechenregel angegeben wird, mittels derer der Funktionswert an jeder Stelle
x ∈ D bestimmt werden kann. Wir sagen dann korrekterweise: f ist die Funktion,
für die für jedes x ∈ D, f (x) = Rechenvorschrift(x). Zum Beispiel sei f : R → R die
Funktion, für die ∀ x∈R , f (x) = x2 . x2 is keine Funktion, sondern das Quadrat der
Zahl x. Wenn keine Missverständnisse aufkommen können, vergessen wir schon
mal zu betonen, dass f (x) = x2 für alle x ∈ R gelten soll und sagen kurz: Sei f die
Funktion für die f (x) = x2 . Funktionen, die durch Rechenoperationen definiert sind,
haben einen natürlichen maximalen Definitionsbereich in dem diese Rechenopera-
tion definiert ist. So können wir etwa die Funktion f , für die f (x) = 1/x sein soll
maximal auf der Menge R\{0} definieren.
55
56 3 Funktionen
Die einfachste Funktion ist die konstante Funktion für die f (x) = c, x ∈ D für ein
c ∈ R. Die einfachsten nicht-trivialen Funktionen sind die affinen Funktionen, für die
f (x) = a+cx, x ∈ D, mit a, c ∈ R fest. Wenn a = 0 nennt man die Funktion auch linear,
und manchmal verwenden wir die Begriffe affin und linear synonym. Wir werden
später sehen, dass die affinen Funktionen eine ganz besondere Rolle spielen. Affine
Funktionen können wir natürlich stets für D = R definieren.
Eine Funktion pn : R → R heißt ein Polynom vom Grad n, wenn es n ∈ N,
a0 , a1 , . . . , an−1 ∈ R und an , 0 gibt, so das für alle x ∈ R,
n
X
pn (x) = a0 + a1 x + a2 x2 + · · · + an xn = ak xk . (3.1)
k=0
ck(n) = c(n−1)
k
+ c(n−1)
k−1
. (3.5)
Diese Rekursion
n liefert genau das Pascalsche Dreieck für die Binomialkoeffizienten,
d.h. c(n)
k
= k = (n−k)!k! . Man kann leicht nachrechnen, dass dies (3.5) erfüllt, und
n!
dann mit vollständiger Induktion beweisen, dass diese Gleichung in der Tat für alle
n ∈ N und 0 ≤ k ≤ n gilt.
Eine Funktion r : D → R heißt rationale Funktion, wenn es zwei Polynome, p, q
gibt, so dass für alle x ∈ D
p(x)
r(x) = . (3.6)
q(x)
Hier muss natürlich gelten, dass ∀ x∈D q(x) , 0. Der größtmögliche Definitionsbe-
reich einer rationalen Funktion ist R vermindert um die Nullstellen des Polynoms
q.
3.2 Potenzreihen 57
Eine weitere Klasse von Funktionen sind die rationalen Potenzen, für die f (x) =
xq , mit q ∈ Q. Hier ist der Definitionsbereich im Allgemeinen maximal R+ oder so-
gar R+ \{0}. Weiter sind natürlich Summen und Produkte von Funktionen auch wie-
der Funktionen. Die bisher beschriebene Klasse von Funktionen hat die angenehme
Eigenschaften, dass sich die Funktionswerte explizit berechnen lassen, zumindest
für rationale x. Für allgemeine x ∈ R müssen wir eine rationale Cauchy-Folge in
der Äquivalenzklasse von x und die Funktion auf den Folgengliedern auswerten.
Nach unseren Rechenregeln für reelle Zahlen liefert dies wieder eine Cauchy-Folge
welche den Funktionswert repräsentiert.
3.2 Potenzreihen
Die oben beschriebenen Funktionen sind nur eine sehr kleine Teilmenge aller reellen
Funktionen, etwa wie die rationalen Zahlen nur eine winzige Untermenge der reel-
len Zahlen sind. Eine weitere wichtige Klasse sind Funktionen, deren Werte durch
konvergente Reihen gegeben sind.
Definition 3.3. Eine reelle Funktion f : D → R heißt Potenzreihe, wenn es eine re-
elle Folge a gibt, so dass für alle x ∈ D,
(i) die Reihe ∞ n
P
n=0Pan x konvergiert, und
(ii) ∀ x∈D : f (x) = n=0 an xn .
∞
Gegeben eine Folge a können wir natürlich stets eine Potenzreihe konstruieren.
Wir setzen dazu D = {x ∈ R : ∞ an xn konvergiert} und definieren die Funktion
P
Pn=0
f : D → R, so dass ∀ x∈D , f (x) = n=0 an xn .
∞
Definition 3.4. Sei a eine reelle Folge. Dann heißt r der Konvergenzradius der Po-
tenzreihe ∞ n
P
n=0 an x genau dann, wenn Folgendes gilt:
(i) Für alle x ∈ R mit |x| < r ist ∞ a xn absolut konvergent, und
P
P∞n=0 n n
(ii) für alle x ∈ R mit |x| > r ist n=0 an x divergent.
Wenn (i) für alle r ∈ R+ gilt, so sagen wir, der Konvergenzradius sei +∞.
Beachte, dass für |x| = r die Reihe sowohl konvergieren als auch divergieren kann.
Dass der Begriff des Konvergenzradius sinnvoll ist, folgt aus der Tatsache, dass
wenn eine Potenzreihe bei x konvergiert, die Reihe dann für alle y mit |y| < |x| absolut
konvergiert. Ebenso gilt, dass, wenn die Reihe für x nicht absolut konvergiert, dann
für alle y mit |y| > |x| die Reihe divergiert.
Lemma 3.5. Jede Potenzreihe ∞ n
P
n=0 an x besitzt einen Konvergenzradius r ∈ R+ ∪
{+∞}. Es gilt
X∞
r = sup{t ∈ R+ : |an |tn konvergiert}, (3.7)
n=0
mit der Konvention, dass r = +∞, falls das Supremum nicht existiert.
58 3 Funktionen
Beweis. Übung! Das Lemma folgt leicht unter Verwendung des Wurzelkriteriums.
Es folgt daraus auch, dass r = 1/ lim sup |an |1/n ist. u t
P∞
Anmerkung. Statt Potenzreihen der Form n=0 an xn kann man natürlich auch Po-
tenzreihen der Form ∞ n
P
n=0 an (x − x0 ) , für x0 ∈ R betrachten.
Ein wichtiges Beispiel einer Potenzreihe ist die Exponentialfunktion, exp. Dazu be-
xn
trachten wir die Reihe ∞
P
n=0 n! , x ∈ R. Wir zeigen zunächst.
P∞ xn
Lemma 3.6. Für jedes x ∈ R ist die Reihe n=0 n! absolut konvergent.
Wir können also die Funktion exp : R → R definieren, indem wir für alle x ∈ R,
∞ n
X x
exp(x) = , (3.8)
n=0
n!
setzen. Wir kommen später noch auf die Exponentialfunktion zurück. Hier wollen
wir aber schon einige Eigenschaften herleiten.
und
lim exp(x − 1/`) = exp(x). (3.10)
`↑∞
Beweis. Wir zeigen (3.9), der Beweis von (3.10) ist ganz analog. Für jedes feste m
gilt
m ∞
X (x + 1/`)k X (x + 1/`)k
exp(x + 1/`) = + . (3.11)
k=0
k! k=m+1
k!
Zunächst sieht man leicht, dass
m m
X (x + 1/`)k X xk
lim = . (3.12)
`↑∞ k! k!
k=0 k=0
Weiter ist
m ∞
X xk X xk
= exp(x) − . (3.13)
k=0
k! k=m+1
k!
3.2 Potenzreihen 59
Aus der absoluten Konvergenz der Exponentialreihe folgt, dass wir m so wählen
können, dass für jedes |y| ≤ 1,
∞ ∞
X (x + y)k X (|x| + 1)k
≤ ≤ 1/(2K). (3.14)
k=m+1
k! k=m+1
k!
(|x|+1)k
Dazu wählt man einfach m so, dass selbst ∞
P
k=m+1 k! ≤ 1/(2K). Damit ist für
jedes K
lim sup exp(x + 1/`) ≤ exp(x) + 1/K, (3.15)
`↑∞
und
lim inf exp(x + 1/`) ≥ exp(x) − 1/K, (3.16)
`↑∞
Hieraus folgt aber, dass lim sup und lim inf gleich exp(x) sind und somit folgt die
Behauptung. u t
Lemma 3.8 (Euler). Für jedes x ∈ R gilt
x n
lim 1 + = exp(x). (3.17)
n↑∞ n
Beweis. Aus dem Binomialsatz erhalten wir, dass
n
x n X n! xk
1+ = . (3.18)
n k=0
(n − k)!k! nk
Nun ist !k
n! (n − 1) (n − 2) (n − k + 1) k
1≥ k
= ... ≥ 1− , (3.19)
(n − k)!n n n n n
Wir betrachten zunächst den Fall x ≥ 0. Dann ist
n
x n X xk
1+ ≤ = Bn (x) ≤ exp(x), (3.20)
n k=0
k!
Da für alle x ∈ R, limm↑∞ Bm (x) = exp(x), folgt (3.17) für nicht-negatives x. Für den
Fall x < 0 geht der Beweis ganz ähnlich, man muss lediglich die Abschätzungen für
die geraden und ungeraden Partialsummen getrennt durchführen. u t
Beweis. Wir stellen zunächst fest, dass für jedes x ∈ R es n0 ∈ N gibt, so dass für alle
n ≥ n0 und y ≥ x, (1 + y/n) > 0. Damit ist für diese n richtig, dass (1 + y/n)n monoton
wachsend als Funktion von y ≥ x, und damit ist auch der Limes monoton wachsend.
Da dies aber für alle x ∈ R gilt, ist exp monoton wachsend. u t
Beweis. Es gilt
x n y n x y n x + y xy n
1+ 1+ = 1+ 1+ = 1+ + 2 . (3.25)
n n n n n n
Sei xy ≥ 0. Dann gilt für hinreichend große n (wegen der Monotonie von (1 + x/n)n )
x + y n x + y xy n
1+ ≤ 1+ + 2 (3.26)
n n n
und somit x n y n
exp(x + y) ≤ lim 1 + 1+ = exp(x) exp(y). (3.27)
n↑∞ n n
Nun gibt es für jedes x, y ∈ R und für jedes ` ∈ N ein n0 ∈ N, so dass für alle n ≥ n0 ,
xy/n ≤ 1/`. Daher gilt wieder wegen der Monotonie für hinreichend große n
#n
x + y xy n x + y + 1/`
"
1+ + 2 ≤ 1+ . (3.28)
n n n
Wir werden später zeigen, dass die Exponentialfunktion durch die Forderung,
dass (3.24) gelte, eindeutig festgelegt ist.
3.2 Potenzreihen 61
Man bezeichnet den Funktionswert exp(1) = e als Euler’sche Zahl. Aus der Glei-
chung (3.24) folgt, dass für jedes n ∈ N,
exp(n) = en . (3.31)
Also ist exp(1/n) = e1/n . Dann folgt ebenso, dass für jedes q ∈ Q,
exp(q) = eq . (3.33)
Es ist daher naheliegend, die reelle Potenz der Zahl e zu definieren als
e x = exp(x). (3.34)
Als letztes machen wir die Beobachtung, dass die Exponentialfunktion schneller
als jede Potenz wächst.
Da exp bijektiv ist, existiert eine inverse Funktion, ln : R+ \{0} → R, definiert durch
die Eigenschaft, dass für alle x ∈ R+ \{0},
62 3 Funktionen
ln exp(x) = x,
∀x ∈ R,
(3.37)
exp (ln(x)) = x,
∀x ∈ R+ \{0}.
Die Funktion ln heißt Logarithmus. Folgende Eigenschaften folgen aus denen der
Exponentialfunktion.
Lemma 3.13. (o) Der Bildbereich von ln ist R.
(i) ln : R+ \ {0} → R ist bijektiv.
(ii) ln ist monoton wachsend.
(iii) ln(1) = 0.
(iv) Für alle x, y ∈ R+ \{0} gilt ln(x) + ln(y) = ln(xy).
Beweis. Übung. t
u
Aus Lemma 3.12 für die Exponentialfunktion folgt dass der Logarithmus lang-
samer als jede Wurzel wächst.
Korollar 3.14. Für jedes n ∈ N gilt: Es gibt x0 ∈ R+ , so dass für alle x ≥ x0 ,
ln(x)
< x0 /x. (3.38)
x1/n
Beweis. Übung. t
u
Eng verwandt (was wir später noch deutlicher sehen werden) sind die Funktionen
sin und cos, die als Potenzreihen wie folgt definiert werden können: Für alle x ∈ R
ist
∞
X x2k
cos(x) = (−1)k , (3.39)
k=0
(2k)!
∞
X x2k+1
sin(x) = (−1)k . (3.40)
k=0
(2k + 1!
Mas sieht sofort, dass diese Reihen durch die Exponentialreihe dominiert werden
und daher für alle x ∈ R absolut konvergieren. Im Gegensatz zur Exponentialfunkti-
on sind diese Funktionen sogar beschränkt!
Lemma 3.15. Für alle x ∈ R gilt
Beweis. Der Beweis ist sehr einfach. Wegen der absoluten Konvergenz können wir
Satz 1.59 benutzen und einfach ausmultiplizieren und umsortieren, als hätten wir es
mit endlichen Summen zu tun. Damit ist
3.3 Stetigkeit und lokales Verhalten von Funktionen 63
∞ n
X X 1
cos2 (x) = (−1)n x2n , (3.42)
n=0 k=0
(2k)!(2n − 2k)!
und
∞ n
X X 1
sin2 (x) = (−1)n x2n+2
n=0 k=0
(2k + 1)!(2n − 2k + 1)!
∞ n−1
X X 1
=− (−1)n x2n
n=1 k=0
(2k + 1)!(2n − 2k − 1)!
(3.43)
Nun ist
∞ n ∞ n−1
X X 1 X X 1
(−1)n x2n − (−1)n x2n
n=1 k=0
(2k)!(2n − 2k)! n=1 k=0
(2k + 1)!(2n − 2k − 1)!
∞
n n−1
X X 1 X 1
= n 2n
(−1) x −
n=1
(2k)!(2n − 2k)!
k=0
(2k + 1)!(2n − 2k − 1)!
k=0
∞ 2n
1
(−1)`
X X
= (−1)n x2n
n=1 `=0
`!(2n − `)!
∞
X 1
= (−1)n x2n (1 − 1)2n = 0. (3.44)
n=1
2n!
Daher bleibt von cos2 (x) + sin2 (x) nur der n = 0-Term von cos übrig, der gleich 1 ist.
Daraus folgt die Behauptung. u t
Lemma 3.15 impliziert, dass sin(x) and cos(x) die Seitenlängen der Katheten
eines rechtwinkligen Dreiecks mit Hypothenuse der Länge 1 sind. Es ist naheliegend
zu glauben, dass x den Öffnungswinkel dieses Dreiecks darstellt, was wir später
auch noch zeigen werden. Im Moment ist dies allerdings noch nicht offensichtlich.
Bereits bei der Betrachtung der Exponentialfunktion haben wir gesehen, dass es in-
teressant ist zu wissen, wie sich eine Funktion in der Nähe eines Punktes verhält.
Die Beobachtung (3.33) wirft auch die interessante Frage auf, ob denn die Exponen-
tialfunktion durch ihre Werte auf den rationalen Zahlen vielleicht schon bestimmt
ist? Diese Frage ist natürlich angesichts der Unmenge von reellen Zahlen immer
interessant. Wie kann man überhaupt den Wert einer Funktion an einer reellen Zahl
erhalten? Bei den allgemeinen Rechenregeln für reelle Zahlen hatten wir ja gesagt,
64 3 Funktionen
dass wir eine rationale Cauchyfolge die nach x konvergiert auswählen, dann die
Rechenoperationen auf den Folgengliedern ausführen und dann eine neue Cauchy-
Folge erhalten, deren Limes das gesuchte Ergebnis der Rechnung ist.
Für eine reelle Funktion f stellt sich nun die Frage, on wir so auch vorgehen
können, um einen Funktionswert an einer reellen Zahl x zu bestimmen. Also: Sei
x ∈ R und q Cauchy-Folge in D mit Limes x. Stimmt es, dass f (x) = limn→∞ f (qn ),
und dies für alle Cauchy-Folgen in D in der Äquivalenzklasse von x? Es ist klar, dass
dies im Allgemeinen falsch sein wird. Dazu genügt es, die Funktion f zu betrachten,
für die
1, wenn x = 0,
f (x) =
(3.45)
0, wenn x , 0.
In Worten kann dies auch so formuliert werden: Für jedes > 0 gibt es eine δ-
Umgebung von x, so dass für jeden Punkt y in dieser Umgebung, f (y) in einer -
Umgebung von f (x) liegt.
Beweis. Dass aus (3.46) folgt, dass für jede Cauchy-Folge a in D mit Grenzwert x,
gilt, dass lim f (a) = f (x) sollte klar sein. Um die Gegenrichtung zu zeigen, nehmen
wir an, dass (3.46) nicht gilt. Dann existiert >, so dass jedes δ > 0 ein y ∈ D existier,
so dass |y − x| < δ aber | f (y) − f (x)| ≥ . Nehmen wir nun zum Beispiel δ = 1/n und
yn das jeweils existierende y für δ = 1/n, dann ist einerseits klar, dass die Folge y
nach x konvergiert, nicht aber die Folge f (y), da ja für alle n ∈ N, | f (yn ) − f (x)| ≥
ist. u t
3.3 Stetigkeit und lokales Verhalten von Funktionen 65
Stetige Funktionen sind in der Tat durch ihre Werte auf den rationalen Zahlen
festgelegt (wenn D genug rationale Zahlen enthält. Im wesentliche denken wir an
Mengen die offene oder abgeschlossene Intervalle, Halbachsen, oder ganz R sind).
Satz 3.19. Sei D ⊆ R eine Menge mit der Eigenschaft, dass für alle x ∈ D eine
Cauchy-Folge rationaler Zahlen in D existiert, so, dass lim q = x. Seien g, f : D → R
stetig auf D. Dann ist f = g genau dann, wenn ∀q∈D∩Q : f (q) = g(q).
Beweis. Übung.
Wie wir schon bemerkt haben, sind alle Rechenoperationen auf den reellen Zah-
len gerade über Grenzwerte von rationalen Cauchy-Folgen definiert. Daher gilt so-
fort:
Lemma 3.20 (Stetigkeit elementarer Funktionen). Alle elementaren (d.h. die Po-
lynome und die rationalen) Funktionen sind auf ihren Definitionsbereichen stetig.
Beweis. Der Beweis funktioniert wieder nach dem Prinzip: Zerlege dir Potenzreihe
in ein Polynom und einen Rest. Dann ist das Polynom stetig, und der Rest so klein
wie man will! Sei also > 0 beliebig. Wir schreiben für ein gegebenes x ∈ D
m
X ∞
X
f (x) = ak x k + ak xk = Pm (x) + Rm (x). (3.47)
k=0 k=m+1
Nun ist
∞
X
|Rm (x)| ≤ |ak ||x|k (3.48)
k=m+1
der Rest einer konvergenten Reihe und es gibt m ∈ N so, dass |Rm (x)| < /4, Weiter
gibt es δ0 >, so die Reihe auch für alle y ∈ D mit |x − y| < δ0 absolut konvergiert und
somit können wir m so wählen, dass auch maxy∈D:|x−y|≤δ0 |Rm (y)| < /4. Für dieses
m ist Pm immer noch ein Polynom und daher stetig, d.h. es gibt ein δ mit δ0 > δ > 0
so, dass für alle y : |x − y| < δ, |Pm (x) − Pm (y)| < /2. Dann ist aber für alle y mit
|x − y| < δ,
| f (x) − f (y)| ≤ |Pm (x) − Pm (y)| + |Rm (x)| + |Rm (y)| < /2 + /4 + /4 = . (3.49)
Stetige Funktionen sind im Prinzip die Ausnahme. Stetige Funktionen sind aber
wichtig, weil sie in vielen Anwendungen adequat sind.
Auch stetige Funktionen können sich sehr wild verhalten. So ist es z.B. im Allge-
meinen nicht möglich, den Graphen einer stetigen Funktion selbst über einem end-
lichen Intervall zu zeichnen, weil dieser unendlich lang sein kann. Dies liegt daran,
dass in der Definition der Stetigkeit keinerlei Anforderung daran gestellt wird, wie
klein δ für gegebenes sein soll. Wir haben also keinerlei Kontrolle darüber, wie
schnell | f (x) − f (y)| mit |x − y| wachsen kann.
Die Funktionen, mit denen man es in Anwendungen zu tun hat, sind meist viel
weniger wild. Eine wichtige Klasse sind die sogenannten Lipschitz-stetigen Funk-
tionen.
Definition 3.22 (Lipschitz-Stetigkeit). Sei f : D → R eine reelle Funktion. Dann
heißt f Lipschitz-stetig auf D, genau dann, wenn es eine Konstante L ∈ R+ gibt, so
dass für alle x, y ∈ D,
| f (x) − f (y)| ≤ L|x − y|. (3.50)
Die kleinstmögliche Konstante L für die (3.50) gilt nennt man auch die Lipschitz-
Konstante oder Lipschitz-Norm von f . Falls f : R → R auf R Lipschitz-stetig ist, so
sagt man, f sei global Lipschitz-stetig. Falls f : D → R für jedes x ∈ D eine offene -
Umgebung D ⊃ M 3 x existiert, so dass die Funktion in M Lipschitz-stetig ist (aber
mit Konstanten L die von M abhängen können), so nennt man f lokal Lipschitz-
stetig.
Lemma 3.23. Ist eine Funktion f auf D ⊆ R Lipschitz–stetig, so ist sie dort auch
stetig. Die Umkehrung gilt nicht.
Beweis. Übung. t
u
Beispiel 3.24. Jede affine Funktion ist global Lipschitz-stetig. Jedes Polynom ist
lokal Lipschitz-stetig, aber Polynome von Grad größer als 1 sind nicht global
Lipschitz-stetig.
Lemma 3.25. Wenn eine Funktion f auf einem beschränkten Gebiet M ⊂ R Lipschitz-
stetig ist, dann ist f auf M beschränkt (d.h. das Bild von M unter f ist eine be-
schränkte Teilmenge von R).
Beweis. Übung.
Notation. Wir benutzen ab sofort folgende Notationen für sog. Intervalle in R:
(i) Für a < b in R schreiben wir
und
(a; b] = {x ∈ R : a < x ≤ b}, (3.54)
Wir nennen (a; b] und [a; b) halboffene Intervalle.
(iv)Für a ∈ R schreiben wir
und
(a; ∞) = {x ∈ R : a < x}, (3.56)
sowie
(−∞; a] = {x ∈ R : a ≥ x}, (3.57)
und
(−∞; a) = {x ∈ R : a > x}. (3.58)
Wir benutzen (vorläufig) das Semikolon statt dem Komma, damit das Interval (a; b)
nicht mit dem Paar (a, b) verwechselt werden kann. In der Literatur wird meist das
Komma verwendet.
Lemma 3.26. Offene Intervalle sind offene Mengen und abgeschlossene Intervalle
sind abgeschlossene Mengen. Weiter sind (a; ∞) und (−∞; a) für alle a ∈ R offene
Mengen, die Mengen [a; ∞) und (−∞; a] sind abgeschlossen.
Wir kommen jetzt zu dem zentralen Satz über stetige Funktionen, der die intuiti-
ve Vorstellung, die man vielleicht von Stetigkeit hat, bestätigt. Der sogenannte Zwi-
schenwertsatz zeigt nochmals den tiefen Zusammenhang zwischen Stetigkeit und
der Vollständigkeit der reellen Zahlen.
Satz 3.27 (Zwischenwertsatz). Sei f : [a; b] → R eine stetige Funktion. Sei f (a) ≤
f (b). Dann gibt es für jedes y ∈ [ f (a); f (b)] ein x ∈ [a; b], so dass f (x) = y. Falls
f (a) > f (b), so gilt dasselbe für jedes y ∈ [ f (b); f (a)].
Anmerkung. Man formuliert den Satz auch als Eine stetige Funktion nimmt auf
einem abgeschlossenen Interval jeden Wert zwischen den Werten an den Endpunkten
an.
Beweis. Der Beweis ist fast trivial. Wir betrachten nur den Fall f (a) < f (b). Da für
y = f (a) und y = f (b) die Aussage trivial ist, nehmen wir y ∈ ( f (a); f (b)). Wir wollen
68 3 Funktionen
zeigen, dass die Annahme, dass für alle x ∈ [a; b], f (x) , y gilt zum Widerspruch
führt. Wir definieren
x− = sup{x ∈ [a; b] : f (x) < y}. (3.59)
Es sein nun q eine monoton fallende Folge mit lim q = x− . Dann muss einerseits
f (x− ) = lim f (q) ≥ y, da jedes Folgenglied f (qn ) ≥ y. Da aber nach Annahme f den
Wert y nicht annimmt, muss sogar lim f (q) = f (x− ) = y0 > y gelten. Umgekehrt sei
r eine monoton wachsende Folge mit lim r = x− . Wegen der Stetigkeit vom f muss
gelten lim f (r) = y0 . Andererseits wissen wir aus der Definition (3.46) von Stetigkeit,
dass es ein δ > 0 gibt, so dass für alle x ∈ (x− − δ, x− ], | f (x) − f (x− )| ≤ (y0 − y)/2, also
f (x) > y + (y0 − y)/2 > y ist, weswegen für diese x gilt, dass f (x) > y. Dann wäre
aber für alle x > x− − δ f (x) > y und somit sup{x ∈ [a; b] : f (x) < y} ≤ x− − δ, was der
der Definition von x− widerspricht. Damit führt die Annahme, dass f stetig ist und
den Wert y nicht annimmt im Widerspruch und der Satz ist bewiesen. u t
Lemma 3.28. Sei A ⊂ R abgeschlossen und sei a eine Cauchy-Folge, so dass für
alle n ∈ N, an ∈ A. Dann ist auch lim a ∈ A.
Beweis. Der Beweis ist nur eine kleine Adaption der Argumente, die im Beweis von
Lemma 2.8 verwendet werden. Wenn lim a ∈ Ac und da Ac offen ist, so müssen sogar
fast alle (= alle bis auf endlich viele) Folgenglieder in Ac liegen, im Widerspruch
zur Annahme. u t
Eine wichtige Eigenschaft kompakter Mengen ergibt sich aus der Verbindung des
Satzes von Bolzano-Weierstrass 2.10 mit Lemma 3.28.
Satz 3.30 (Bolzano-Weierstrass 2). Eine Menge K ⊂ R ist genau dann kompakt,
wenn jede Folge a mit an ∈ K für alle n ∈ N eine Teilfolge enthält, die gegen einen
Punkt x ∈ K konvergiert.
Beweis. Sei K kompakt. Dann ist K beschränkt und wegen Satz 2.10 enthält jede
Folge in K eine konvergente Teilfolge. Wegen Lemma 3.28 liegt deren Grenzwert
in K. Sei umgekehrt K nicht kompakt. Dann ist entweder K nicht beschränkt, oder
das Komplement ist nicht offen, d.h. es existiert ein Punkt y ∈ K c so dass es kei-
ne offenen Umgebung gibt, die K nicht schneidet. Im ersteren Fall kann man eine
unbeschränkte Folge konstruieren, im zweiten eine Cauchy-Folge in K die gegen
y konvergiert (Man nimmt dazu einfach die Folge der 1/n-Umgebungen von y und
wählt jeweils eine Punkt an ∈ U1/n (y) ∩ K aus. Diese Folge muss nach y konvergie-
ren). Dies beweist die Äquivalenz beider Aussagen. u t
Lemma 3.31. Sei K kompakt und sei f : K → R eine in K stetige Funktion. Dann
ist das Bild von K unter f ebenfalls kompakt.
Beweis. Dieser Satz folgt sofort aus der Tatsache, dass stetige Funktionen Cauchy-
Folgen auf Cauchy-Folgen abbilden und dem Satz 3.30. Sei y eine Folge im Bild
von K. Dann gibt es für jedes n ∈ N ein xn ∈ K so, dass yn = f (xn ). Da K kompakt
ist, besitzt (xn )n∈N eine in K konvergente Teilfolge. Sei oBdA x selbst diese Teil-
folge. Das Bild dieser Teilfolge unter f ist eine Teilfolge von y die im Bild von f
konvergiert, nämlich gegen f (lim x). Damit ist das Bild von K kompakt nach Satz
3.30. u t
Aus dieser Eigenschaft folgt eine weitere wichtige Eigenschaft stetiger Funktio-
nen.
Beweis. Wir wissen, dass das Bild von K kompakt ist. Dann sind nach Lemma 2.8
sowohl das Supremum als das Infimum des Bildes im Bild. Daraus folgt die Aussage
sofort. u
t
Für offene Mengen gilt die analoge Aussage nicht. Betrachte etwa die auf (0; 1)
definierte Funktion f mit Werten f (x) = x(1−x)
1
. Das Bild von (0, 1) ist hier R+ und
die Funktion strebt bei 0 und 1 gegen +∞, d.h. sup f = +∞. Daher nimmt sie ihr
Supremum nicht an.
Eine Verschärfung der Stetigkeit in einer Menge ist die der gleichmäßigen Ste-
tigkeit.
Wichtig ist hier, dass die Wahl von δ unabhängig vom Punkt x getroffen werden
kann. Eine gleichmäßig stetige Funktion hat in ganz D einen maximalen ’Verzer-
rungsgrad’. Die gerade betrachtete Funktion f mit f (x) = x(1−x)
1
ist stetig auf (0; 1)
aber nicht gleichmäßig stetig.
Ein wichtiger Satz, den man sich merken sollte, sagt nun, dass auf kompakten
Mengen alle stetigen Funktionen gleichmäßig stetig sind.
Satz 3.34. Sei K kompakt und f : K → R auf K stetig. Dann ist f auf K gleichmäßig
stetig.
Beweis. Der Beweis beruht auf der Konstruktion eines Widerspruchs. Wir zeigen,
dass, wenn f nicht gleichmäßig stetig wäre, f nicht stetig wäre. Falls nämlich f
70 3 Funktionen
nicht gleichmäßig stetig ist, so ist (3.61) falsch, und es gibt ein > 0, so dass für
jedes 1/n > 0, xn , yn existieren so dass |xn − yn | < 1/n, aber | f (xn ) − f (yn )| > . Nun
besitzt (xn )n∈N eine konvergente Teilfolge, und wir können ohne Beschränkung der
Allgemeinheit annehmen, dass (xn )n∈N konvergiert (in K). Dann aber ist x − y eine
Nullfolge, und lim y = lim x. Da aber für alle n ∈ N gilt, dass | f (xn ) − f (yn )| > , so
ist auch | lim f (x) − lim f (y)| ≥ , was der Stetigkeit von f widerspricht. Damit ist der
Satz bewiesen. u t
Kapitel 4
Ableitungen und lokale Approximation von
Funktionen
Wir wollen eine Funktion differenzierbar nennen, wenn sie in der Nähe eines Punk-
tes gut durch eine lineare Funktion approximiert werden kann. Die folgende Defini-
tion macht diese Idee präzise.
Definition 4.1 (Ableitung). Sei f : D → R eine reelle Funktion. Wir sagen, dass f
an der Stelle x ∈ D differenzierbar ist, genau dann wenn es eine reelle Zahl a ∈ R
gibt, so dass, für
h(y) ≡ f (x + y) − f (x) − ay, x + y ∈ D, (4.1)
gilt, dass
lim |h(y)|/|y| = 0. (4.2)
y→0
Hier meint limy→0 |h(y)|/|y| = 0, dass für jede Nullfolge (yn )n∈N für die für alle n ∈ N
gilt, dass yn , 0 und x + yn ∈ D, die Bildfolge (h(yn )/yn )n∈N nach Null konvergiert.
Falls es ein solches a gibt heißt a die Ableitung von f an der Stelle x und wir schrei-
71
72 4 Ableitungen und lokale Approximation von Funktionen
ben
d f (x)
a = f 0 (x) = (4.3)
dx
Die Funktion heißt differenzierbar in D genau dann, wenn sie für jeden Punkt x ∈ D
differenzierbar ist.
Anmerkung. Genau wie im Fall der Stetigkeit, können wir auch eine − δ Definition
der Differenzierbarkeit geben: f : D → R ist differenzierbar bei x ∈ D genau dann,
wenn
∀>0 ∃δ>0 ∀y∈R:0<|y|<δ : |h(y)|/|y| < . (4.4)
Die lineare Funktion `(z) = f (x) + f 0 (x)(z − x) nennen wir auch die Tangente an
f an der Stelle x.
Definition 4.4. Sei f : D → R eine reelle Funktion. Wir sagen, dass f an der Stelle
x ∈ D differenzierbar von rechts [links] ist, genau dann wenn es eine reelle Zahl
a ∈ R gibt, so dass, für
h(y) ≡ f (x + y) − f (x) − ay, (4.5)
gilt, dass " #
lim |h(y)|/|y| = 0, lim |h(y)|/|y| = 0 , (4.6)
y↓0 y↑0
Falls es ein solches a gibt heißt a die rechtsseitige [linksseitige] Ableitung von f an
der Stelle x und wir schreiben
a = f±0 (x). (4.7)
Dabei bedeutet " #
lim |h(y)|/|y| = 0, lim |h(y)|/|y| = 0, (4.8)
y↓0 y↑0
dass für jede strikt monoton fallende [wachsende] Nullfolge (yn )n∈N , limn↑∞ |h(yn )|/|yn | =
0.
Lemma 4.5. Sei f : D → R bei x ∈ D sowohl links- als auch rechtsseitig differen-
zierbar und es gelte
f+0 (x) = f−0 (x). (4.9)
Dann ist f bei x differenzierbar und f 0 (x) = f±0 (x).
Beweis. Übung. t
u
Anmerkung. Wir haben die Ableitung von Funktionen definiert, die auf offenen
Mengen definiert sind. Man kann die Definition verallgemeinern auf Funktionen, die
auf beliebigen Teilmengen M ⊆ R definiert sind. Dazu benötigen wir noch den Be-
griff des Häufungspunkts einer Menge: Sei M ⊂ R, dann heißt x ∈ M Häufungspunkt
von M genau dann, wenn jede -Umgebung I (x) unendlich viele Punkte aus M
enthält.
Man trifft dann folgende Festsetzung:
(i) Wenn x ∈ M kein Häufungspunkt von M ist, so ist f bei x nicht differenzierbar.
(ii) Wenn x ∈ M Häufungspunkt von M ist, aber x nicht im Innern von M liegt,
so fordert man nur, dass für alle Nullfolgen (yn )n∈N mit der Eigenschaft, dass für
alle n ∈ N x + yn ∈ M\{x}, die Folge (h(yn )/yn )n∈N eine Nullfolge ist.
Insbesondere ist dann eine auf einem abgeschlossenen Intervall [a; b] definierte
Funktion bei a differenzierbar, falls die rechtsseitige Ableitung bei a existiert und
bei b differenzierbar, falls die linksseitige Ableitung bei b existiert.
Die Differenzierbarkeit ist mit der Lipschitz Stetigkeit verwandt, aber wesentlich
restriktiver. Einerseits gilt:
74 4 Ableitungen und lokale Approximation von Funktionen
zwar global Lipschitz stetig mit Lipschitz Konstante 1, aber in 0 nicht differen-
zierbar. Man kann sich dies veranschaulichen in dem man sich alle Geraden die
durch den Nullpunkt gehen ansieht und mit f vergleicht. Der Approximationsfehler
wächst entweder nach links oder nach rechts linear mit der Distanz von der Null. Es
ist nicht klar, welche Gerade die beste Approximation wäre.
Beispiel 4.7. Sei f die Funktion mit f (x) = xn , n ∈ N. Dann gilt f 0 (x) = nxn−1 . Hierzu
benutzen wir den Binomialsatz. Wir wissen, dass
n !
X n n−k
zn = (x + (z − x))n = xn + x (z − x)k , (4.11)
k=1
k
also
n !
X n n−k
h(z − x) ≡ zn − xn − nxn−1 (z − x) = x (z − x)k . (4.12)
k=2
k
Nun gilt offenbar, dass
n !
|h(z − x)| X n n−k
≤ |x| |z − x|k−1 . (4.13)
|z − x| k=2
k
Offenbar konvergiert die rechte Seite nach 0, wenn z → x, also ist nxn−1 die Ablei-
tung von f an der Stelle x.
Beispiel 4.8. Wir betrachten die Funktion exp. Wir wissen aus Satz 3.10, dass
Nun ist
∞ k ∞ ∞
X y X yk X yk
exp(y) − 1 = = y+ = y + y2 . (4.15)
k=1
k! k=2
(k)! k=0
(k = 2)!
yk
Die Reihe ∞
P
k=0 (k+2)! ist genau wie die Exponentialreihe absolut konvergent für alle
y ∈ R. Daraus folgt
∞
X yk
exp(x + y) − exp(x) − exp(x)y = exp(x)y2 = h(y), (4.16)
k=0
(k + 2)!
4.2 Ableitungsregeln 75
und
∞
X yk
h(y)/y = y (4.17)
k=0
(k + 2)!
konvergiert nach Null konvergiert, wenn y → 0. Daher ist exp0 (x) = exp(x).
Formal können wir dieses Ergebnis auch erhalten, indem wir so tun als könnten
wir die Exponentialreihe Term für Term ableiten:
∞ ∞ ∞ ∞ k
X 1 dxk X kxk−1 X xk−1 X x
exp0 (x) = = = = = exp(x). (4.18)
k=0
k! dx k=1
k! k=1
(k − 1)! k=0
k!
Obwohl das etwas gewagt aussieht, liefert dies die richtige Antwort. Wir werden
später sehen, dass wir das auch rechtfertigen können.
4.2 Ableitungsregeln
Aus der Definition der Ableitung folgen einige wichtige Regeln, die zur Berechnung
von Ableitungen wichtig sind.
(ii) Wenn f und g an der Stelle x ∈ D differenzierbar sind, dann ist die Funktion
φ = f g an der Stelle x differenzierbar und es gilt:
(iii) Wenn f an der Stelle x ∈ D differenzierbar ist und es ein > 0 gibt, so dass für
alle y ∈ I (x), f (z) , 0, dann ist φ = 1/ f an der Stelle x differenzierbar und es
gilt:
φ0 (x) = − f 0 (x)/ f (x)2 . (4.21)
Beweis. Der Beweis von Punkt (i) ist elementar. Um Punkt (ii) zu beweisen, schrei-
ben wir
Daher ist
76 4 Ableitungen und lokale Approximation von Funktionen
Der Koeffizient von (z − x) konvergiert nach 0 weil g stetig bei x ist und g und f bei
x differenzierbar sind, wenn z → x, und daher ist f (x)g0 (x) + f 0 (x)g(x) die Ableitung
von φ bei x, wie behauptet.
Um (iii) zu zeigen, gehen wir genauso vor. Für z ∈ I (x) haben wir
Der Ausdruck in eckigen Klammern auf der rechten Seite konvergiert nach 0, wenn
f 0 (x)
z nach x konvergiert, und somit ist f (x) f (x) die Ableitung von 1/ f an der Stelle x.
t
u
Eine weitere wichtige Regel betrifft die Ableitung von verketteten Funktionen.
Weiter ist
(g(z) − g(x)) f 0 (g(x)) = (z − x)g0 (x) f 0 (g(x)) + (g(z) − g(x) − g0 (x)(z − x)) f 0 (g(x)).
(4.28)
Da g bei x differenzierbar ist, wissen wir, dass
Aus der Kettenregel folgt unmittelbar eine Formel für die Ableitung der Inversen
einer Funktion.
Korollar 4.11 (Ableitung der inversen Funktion). Seien I, J ⊆ R offene Intervalle.
Sei f : I → J bijektiv und differenzierbar an der Stelle x ∈ I und f −1 : J → I die
inverse Funktion zu f . Dann gilt: f −1 ist differenzierbar an der Stelle y = f (x),
wenn f 0 (x) , 0, und
0 1
f −1 (y) = 0 −1 . (4.34)
f ( f (y))
Beweis. Benutze, dass die Ableitung der Funktion f ( f −1 (y)) = y gleich 1 ist und
verwende die Kettenregel auf der linken Seite der Gleichung. u t
Mit diesen Regeln können wir schon eine ganze Reihe von Ableitungen ausrech-
nen.
Wir kommen nun zu einem zentralen Resultat, dem sog. Mittelwertsatz. Er ist eng
mit dem Zwischenwertsatz, Satz 3.27 verwandt.
Satz 4.12 (Mittelwertsatz). Sei f : [a; b] → R auf [a; b] stetig und auf (a; b) diffe-
renzierbar. Dann existiert ein x ∈ (a; b), so dass
f (b) − f (a)
= f 0 (x). (4.35)
b−a
78 4 Ableitungen und lokale Approximation von Funktionen
Beweis. Offensichtlich genügt es, den Fall, dass f (b) = f (a) gilt zu betrachten,
da der allgemeine Fall durch die Addition einer linearen Funktion auf diesen
zurückgeführt werden kann. Falls nun f (a) = f (b), so nimmt nach Satz 3.32 die ste-
tige Funktion f auf der kompakten Menge [a; b] ein Maximum und ein Minimum
an. Wenn sowohl das Maximum als auch das Minimum im Rand von [a; b] ange-
nommen werden, dann muss f die konstante Funktion sein und es gilt f 0 (x) = 0 für
alle x ∈ (a; b). Andernfalls gibt es ein x ∈ (a; b) so dass f dort ein Minimum oder ein
Maximum annimmt. Das folgende Lemma sagt uns, dass dann f 0 (x) = 0 gilt, mithin
(4.35).
Anmerkung. Der Spezialfall des Mittelwertsatzes wenn f (a) = f (b) ist heißt auch
Satz von Rolle.
Lemma 4.13. Sei f : (a; b) → R differenzierbar und nehme f für ein x ∈ (a; b) ein
Minimum oder ein Maximum an. Dann ist f 0 (x) = 0.
Beweis. Wir betrachten nur den Fall, dass f bei x ein Maximum annimmt. Der Fall
eines Minimums ist identisch. Es gilt also, dass für alle z ∈ (a; x)
f (z) − f (x)
≤ 0, (4.36)
z− x
und für alle z ∈ (x; b)
f (z) − f (x)
≥ 0, (4.37)
z− x
4.3 Der Mittelwertsatz 79
Aus der ersten Ungleichung folgt, dass f 0 (x) ≤ 0, aus der zweiten, dass f 0 (x) ≥ 0,
also ist f 0 (x) = 0. u
t
Mit Hilfe des Mittelwertsatzes können wir nun auch den Schrankensatz 4.6 be-
weisen.
Beweis (von Satz 4.6). Es gilt nach dem Mittelwertsatz, dass für jedes x < z ∈ D ein
y ∈ (x; z) ⊂ D existiert, so dass
| f (z) − f (x)| f (z) − f (x)
= = | f 0 (y))|. (4.38)
|z − x| z− x
Nach Voraussetzung ist | f 0 (y)| ≤ L. Das wars. t
u
Lemma 4.14. Sei f : [a; b] → R eine stetige und auf (a; b) differenzierbare Funktion.
Dann ist f konstant auf [a; b] wenn f 0 (x) = 0 für alle x ∈ (a; b).
Beweis. Wenn f konstant ist, so ist offenbar f 0 (x) = 0 für alle x ∈ (a; b). Sei umge-
kehrt f 0 (x) = 0 für alle x ∈ (a; b). Dann folgt aus dem Mittelwertsatz, dass für alle
x, z ∈ [a; b],
f (z) − f (x)
= 0, (4.39)
z− x
also ist die Funktion konstant. u t
Korollar 4.16. Die Exponentialfunktion ist die einzige Funktion auf R für die gilt
∀ x∈R : f 0 (x) = f (x) und f (0) = 1.
Beweis. Es sei f so dass f 0 (x) = f (x) für alle x ∈ R. Sei h = f / exp. Dann gilt nach
Satz 4.9 für alle x ∈ R
h0 (x) = f 0 (x)/ exp(x) − f (x) exp0 (x)/ exp(x)2 = f (x)/ exp(x) − f (x)/ exp(x) = 0.
(4.40)
Also ist nach Lemma 4.14 h = C. Da h(0) = 1, muss auch C = 1 sein. Damit ist die
Aussage bewiesen. u t
Wo wir gerade dabei sind, können wir auch noch die Ableitung des Logarithmus
berechnen. Wir erinnern uns an die Definition der Funktion ln : R+ → R in (3.37).
80 4 Ableitungen und lokale Approximation von Funktionen
Lemma 4.17. Die Funktion ln ist auf R+ differenzierbar und es gilt für alle x ∈ R+ ,
1
ln0 (x) = . (4.41)
x
Beweis. Folgt sofort aus der Formel für die Ableitung der Inversen einer Funktion
in Korollar 4.11. u
t
Wir werden später noch eine kleine und sehr einfache Verallgemeinerung von
Lemma 4.14 benötigen.
Lemma 4.18 (Eindeutigkeit). Sei f : [a; b] → R eine auf [a; b] stetige Funktion,
die in allen bis auf abzählbar vielen Punkten in (a; b) differenzierbar ist. Dann ist
f konstant auf [a; b] genau dann, wenn f 0 (x) = 0 für alle x ∈ (a; b) an denen die
Ableitung existiert.
Beweis. Sei A die Menge auf der f nicht differenzierbar ist. Wir betrachten zwei
Punkte y < z in [a; b]. Für ein > 0 definieren wir die Funktion F für x ≥ y
Wir wollen zeigen, dass F (z) ≤ 0. Angenommen es gäbe ein > 0 so dass F (z) > 0.
Da A abzählbar ist, ist auch die Bildmenge von A unter F abzählbar und daher
existiert ein γ das nicht im Bild von A liegt mit
Sein nun c die grösste Zahl in [y; z] so, dass F (c) = γ. (Dieses existiert, da es nach
dem Zwischwertsatz ein y < c0 < z gibt mit F (c0 ) = γ. Dann erfüllt c = sup{c0 :
F (c0 ) = γ} die geforderte Bedingung.) Da F stetig ist und F (z) > γ darf F in
(c; z] nie mehr kleiner oder gleich γ sein. Also ist
F (x) − F (c)
> 0, ∀x ∈ (c; z]. (4.44)
x−c
Nun ist aber für diese x mit Hilfe der umgekehrten Dreiecksungleichung (|a| − |b| ≤
|a − b|)
F (x) − F (c) | f (x) − f (y)| − | f (c) − f (y)| − (x − c)
= (4.45)
x−c x−c
| f (x) − f (c)| − (x − c) f (x) − f (c)
≤ = − .
x−c x−c
Nun ist aber f bei c differenzierbar mir Ableitung 0, weswegen für alle x hinrei-
chend nahe bei c der erste Term kleiner als /2 ist, mithin (4.45) negativ ist, im
Widerspruch zur Positivität von (4.44). Also kann F (z) nicht strikt positiv sein, und
es folgt F (z) ≤ 0. Da dies für alle > 0 gilt, folgt f (z) = f (y). Damit ist f konstant
wie behauptet. u t
4.4 Ableitung absolut konvergenter Potenzreihen 81
Der Korollar 4.15 gilt dann auch mit der entsprechend abgeschwächten Voraus-
setzung.
Wir haben schon bei der Berechnung der Ableitung der Exponentialfunktion gese-
hen, dass wir das richtige Ergebnis erhalten, wenn wir die Reihendarstellung der
Funktion Term für Term ableiten. Wir wollen nun zeigen, dass dies für alle absolut
konvergenten Potenzreihen zutrifft. Dies passt natürlich gut zu unserer Vorstellung,
dass absolut konvergente Potenzreihen sich im Wesentlichen so verhalten wie end-
liche Summen.
Satz 4.19 (Vertauschung von Summe und Ableitung). Sei I ein offenes Intervall
und f : I → R eine absolut konvergente Potenzreihe,
∞
X
f (x) = an xn , (4.46)
n=0
∞
X n−1
X
f (z) − f (x) = (z − x) an xk zn−1−k
n=1 k=0
∞
X n−1
X
= (z − x) an xn−1 1 + x−n+1+k zn−1−k − 1
n=1 k=0
∞
X
= (z − x) an xn−1 n
n=1
∞
X n−2
X
+ (z − x) an xk zn−1−k − xn−1 . (4.50)
n=1 k=0
Der Koeffizient von an in der letzten Zeile ist, indem wir wieder (4.49) benutzen,
n−2
X Xn−2
xk zn−1−k − xn−1 = xk zn−1−k − xn−1−k
k=0 k=0
n−2 n−2−k
x` zn−2−k−` .
X X
= xk (z − x) (4.51)
k=0 `=0
Wir setzen noch r = max(|x|, |z|) und erhalten, dass der Absolutbetrag der letzten
Zeile nicht größer ist als
n−2 n−2−k
X X
|z − x| rn−2 ≤ |z − x|rn−2 (n − 1)(n − 2)/2. (4.52)
k=0 `=0
Damit ist der Koeffizient von (z − x) in der letzten Zeile von (4.50) im Absolutbetrag
nicht größer ist als
∞
X
|z − x| |an |rn−2 (n − 1)(n − 2)/2. (4.53)
n=2
Auch diese Reihe konvergiert absolut und somit ist der Koeffizient von (z − x) in der
letzten Zeile von (4.50) kleiner als |z − x|C, woraus die Behauptung unseres Satzes
sofort folgt. ut
Wir wenden den vorhergehenden Satz nun an um mehr über die Funktionen sin und
cos zu lernen. Eine mit Satz 4.19 elementare Rechnung zeigt folgendes Lemma.
Lemma 4.20. Die Funktionen sin und cos sind in ganz R differenzierbar und es gilt
Insbesondere ist also sin in 0 steigend mit Ableitung 1. Außerdem verschwindet die
Ableitung des Sinus nur, wenn der Kosinus verschwindet, und dann muss der Sinus
im Betrag gleich 1 sein. Die erste Frage, die wir uns stellen, ist, ob der Sinus jemals
den Wert 1 erreicht. Angenommen, dies wäre nicht der Fall. Dann müsste Sinus mo-
noton wachsen und daher gegen einen Wert, a ≤ 1 konvergieren. Dies würde √ aber
implizieren, dass auch der Kosinus konvergiert, und zwar zu einem Wert ± 1 − a2 .
Wenn aber sin(x) gegen eine Konstante konvergiert, so muss auch cos(x) konvergie-
ren, und beider Ableitungen müssen gegen Null geben, was aber wegen der Glei-
chung (4.54) unmöglich ist. Also gibt es eine reelle Zahl, π/2, so dass
Es gilt dann auch, das der Kosinus monoton fallend auf [0, π/2] ist und cos(π/2) = 0.
Insbesondere nehmen sin und cos alle Werte zwischen −1 und 1 an wenn x zwi-
schen 0 und 2π variiert. Dies rechtfertigt die Interpretation dieser Funktionen als
Kreisfunktionen aus der elementaren Geometrie.
Wenn eine Funktion f : D → R auf D differenzierbar ist, so können wie eine neue
Funktion d f : D → R definieren indem wir fordern, dass für alle x ∈ D d f (x) = f 0 (x).
Wir nennen dann d f die Ableitungsfunktion von f oder wieder kurz die Ableitung
von f . In aller Regel benutzen wir auch die Schreibweise d f = f 0 . Damit steht die
Tür offen, den Begriff der Ableitung zu iterieren.
Definition 4.22 (n-te Ableitung). Sei f : D → R eine reelle Funktion. Wir setzen
f = f (0) . Jede Funktion ist 0-mal differenzierbar. Für n ∈ N sagen wir, dass f n-mal
differenzierbar an der Stelle x ist, wenn f n − 1-mal differenzierbar in D ist und die
n − 1-te Ableitungsfunktion f (n−1) : D → R an der Stelle x differenzierbar ist. Wenn
f (n−1) in D differenzierbar ist, so nennen wir die Ableitungsfunktion f (n) . Wenn
die n-te Ableitung von f eine stetige Funktion ist, so nennen wir f n-mal stetig
differenzierbar. Die Klasse der n-mal stetig differenzierbaren Funktionen nennen
wir C n (D). Falls für jedes n ∈ N, f ∈ C n (D), so sagen wir dass f unendlich oft
differenzierbar ist und schreiben f ∈ C ∞ (D).
Anmerkung. Wir benutzen auch die Bezeichnung C 0 (D) für die stetigen Funktionen
auf D.
dn f (x)
Anmerkung. Anstatt f (n) (x) schreibt man auch dxn .
84 4 Ableitungen und lokale Approximation von Funktionen
Wir haben die Ableitung als beste lineare Approximation an eine Funktion in
einem Punkt x definiert. Wir wollen nun zeigen, dass die höheren Ableitungen etwas
mit der besten Approximation einer Funktion durch ein Polynom zu tun haben. Dazu
sei zunächst p eine Polynom vom Grad n, also
p(x) = a0 + a1 x + a2 x2 + · · · + an xn . (4.57)
Anwendung des Satzes von Rolle auf die Funktion h(1) (mit a = 0 und b = θ1 x)
liefert, da h(1) (0) = 0, dass es θ2 ∈ (0, 1) gibt, so dass
wie behauptet. t
u
Jetzt müssen wir nur noch zeigen, dass wir ein Polynom p vom Grad n finden
können, so dass f − p die Voraussetzungen des Satzes erfüllt. Sei also f in einer
Umgebung von 0 n-mal differenzierbar. Wir definieren zunächst ein Polynom q mit
Wenn wir g = f − q setzen, so ist schon mal g(k) (0) = 0, für k = 0, 1, . . . , n − 1. Aller-
dings gilt noch nicht g(x) = 0. Um dies zu erreichen, addieren wir zu q noch einen
Term der Ordnung n, wir setzen also
also
f (x) − q(x) = λxn ⇔ λ = x−n ( f (x) − q(x)). (4.67)
Damit erfüllt die Funktion h mit
die Voraussetzungen von Lemma 4.23. Daher existiert θ ∈ (0; 1) so, dass
Andererseits ist
h(n) (u) = f (n) (u) − n!x−n ( f (x) − q(x)). (4.70)
Also gilt
0 = f (n) (θx) − n!x−n ( f (x) − q(x)). (4.71)
Lösen wir dies nach f (x) auf, so erhalten wir
xn (n)
f (x) − q(x) = f (θx). (4.72)
n!
Damit haben wir aber den extrem wichtigen Satz von Taylor bewiesen!
Satz 4.24 (Satz von Taylor). Sei D ein offenes Intervall und sei f : D → R n-mal
differenzierbar in D. Dann existiert für jedes y, x ∈ D (oBda sei y < x) ein z ∈ (y; x),
so dass
f (1) (y) f (2) (y) f (n−1) (y)
f (x) − f (y) − (x − y) − (x − y)2 − · · · − (x − y)n−1
1! 2! (n − 1)!
(x − y)n (n)
= f (z). (4.73)
n!
Beweis. Der Satz folgt aus (4.72) mit der trivialen Verallgemeinerung dass wir 0
durch einen beliebigen Punkt y ersetzt haben. ut
Anmerkung. Der oben gegeben Beweis ist dem Blog von Timothy Gowers entnom-
men. Das Schöne an diesem Beweis ist, dass nur der Mittelwertsatz benutzt wird.
Das zeigt eben, dass die Idee der n-ten Ableitung ist, das ihre Existenz eine beste
lokale Approximation durch ein Polynom vom Grad n − 1 sicherstellt.
86 4 Ableitungen und lokale Approximation von Funktionen
Anmerkung. Man nennt das Polynom q(x) Taylor-Polynom vom Grad n − 1 und den
n
Term (x−y) (n)
n! f (z) Restglied der Ordnung n. Genauer nennt man dieses Restglied
das Lagrange’sch Restglied der Ordnung n. Es gibt daneben noch andere Formen,
die aber weitgehend äquivalent sind.
Korollar 4.25. Sei D ein offenes Intervall und sei f : D → R n-mal stetig differen-
zierbar in D. Dann gilt für alle x, y ∈ D, dass
Beweis. Der Beweis folgt direkt aus der Gleichung (4.73) und der Tatsache, dass
f (n) stetig ist. Wege Satz 4.24 ist die linke Seite von Gl. (4.74) nämlich gleich
(x − y)n (n)
f (z) − f (n) (y) , (4.75)
n!
also ist rn (y) = n!1 f (n) (z) − f (n) (y) (beachte, dass z ∈ (x; y) eine Funktion von x ist)
stetig und rn (y) = 0, woraus die Behauptung folgt. u t
Das Polynom
Korollar 4.26 (Taylor Schranke). Sei D ein offenes Intervall und sei f : D → R n-
mal differenzierbar in D. Wenn auf einer Teilmenge K ⊂ D f (n) uniform beschränkt
ist, also ∀z∈K f (n) (z) ≤ M, mit M ∈ R+ , gilt, Dann ist für jedes y < x ∈ K ein z ∈ (y <
x), so dass
|x − y|n
| f (x) − (T n f )(y)| ≤ M. (4.77)
n!
Wenn in einer -Umgebung I (x) die Folge der Taylorpolynome (T n (y))n∈N für
alle y ∈ I (x) konvergiert, und wenn limn↑∞ (T n f )(y) = f (y), so nennt man die Funk-
tion f in I (x) reell analytisch. In diesem Fall ist f ist eine konvergente Potenzreihe.
Beachte, dass das Korollar (4.25) nicht sicherstellt, dass die Taylorreihe konvergiert
und selbst wenn sie konvergiert, dass der Limes gleich der Funktion f ist! Man nennt
eine Approximation wie in diesem Korollar eine asymptotische Entwicklung. Dabei
wird zwar für jede Ordnung n der Fehler klein, wenn y − x nach 0 geht, es kann aber
sein, dass mit wachsendem n x − y immer kleiner genommen werden muss, um eine
gute Approximation zu erhalten.
4.6 Konvexität und Ungleichungen 87
Beispiel 4.27. Als Beispiel betrachten wir die Funktion f mit f (x) = exp(−1/x2 ).
Man kann leicht durch vollständige Induktion zeigen, dass die n-te Ableitung von f
die Form
f (n) (x) = pn (1/x) exp(−1/x2 ) (4.78)
hat, wo pn ein Polynom vom Grad 3n ist. Dann folgt, dass lim x↓0 f (n) (x) = 0, für alle
n ∈ N0 . Darum ist das Taylorpolynom von f and der Stelle 0 einfach (T n f )(y) = 0,
und somit auch limn↑∞ (T n f )(y) = 0 , f (y).
Ein wichtiges Konzept von großer praktischer Bedeutung in der Analysis ist die
Konvexität.
L ist die einzige lineare Funktion die an den Stellen x und y gerade die Werte f (x)
und f (y) annimmt. Geometrisch ist dies also die Sekante durch die Punkte (x, f (x))
und (y, f (y)). Konvexität bedeutet also, dass die Funktion zwischen je zwei Punkten
unterhalb der Sekante durch diese Punkte liegt.
Anmerkung. Wenn die Ungleichung in (4.79) strikt ist, so sagen wir, die Funktion
sei strikt konvex. Wenn es zwischen zwei Punkten x, y ∈ I einen Punkt z gibt, so dass
in (4.79) Gleichheit besteht, so ist f auf dem Interval [x; y] linear.
Für differenzierbare Funktionen können wir Konvexität auch anders beschreiben.
Beweis. (1) Sei f konvex. Angenommen, es gäbe einen Punkt x < z ∈ I so, dass
f (z) < f (x) + (z − x) f 0 (x), d.h. die Steigung der Sekante zwischen x und z ist klei-
ner als die der Tangente. Da die konvexe Funktion zwischen x und z unterhalb der
88 4 Ableitungen und lokale Approximation von Funktionen
c
a
Sekante liegen muss, gilt dann für alle y ∈ (x, z), dass f (y) − f (x) < (y − x) f (z)− f (x)
z−x .
Daher ist
f (z) − f (x)
f 0 (x) ≤ < f 0 (x), (4.80)
z− x
was aber nicht sein kann. Also gibt es keinen solchen Punkt. Genau dasselbe folgt,
wenn es einen Punkt z < x gäbe wo f unterhalb der Tangente liegt.
(2)Umgekehrt nehmen wir nun an, dass f stets oberhalb ihrer Tangenten liegt.
Nehmen wir nun an, f sei nicht konvex, d.h. es gäbe zwei Punkte x < y ∈ I und
einen Punkt z ∈ (x, y) wo f oberhalb der Sekante durch x, y liegt, also
f (y) − f (x)
f (z) > f (x) + (z − x). (4.81)
y− x
Die Tangente an f bei z ist
f (y) − f (x)
T z (y) = f (z) + f 0 (z)(y − x) > f (z) + (y − z). (4.83)
y− x
Wegen (4.81) ist dann
f (y) − f (x) f (y) − f (x)
T z (y) > f (x) + (z − x) + (y − z) = f (y), (4.84)
y− x y− x
im Widerspruch zur Annahme , dass f stets über ihren Tangenten liegt. Im zweiten
Fall folgt völlig analog, dass
T z (x) > f (x), (4.85)
ebenfalls im Widerspruch zur Annahme. t
u
4.6 Konvexität und Ungleichungen 89
Übung 4.30. Hier ist eine Übung für etwas ehrgeizigere Studenten. Im Beweis des
Lemmas haben wir nicht wirklich benutzt, dass f differenzierbar ist. Wie könnten
wir die Aussage abändern, so dass sie auch für nicht-differenzierbare Funktionen
richtig bleibt? Hinweis: Schauen Sie sich unsere Diskussion der Funktion aus (4.10)
nochmal an!
Ein einfaches aber wichtiges Korollar ist für praktische Anwendungen wichtig.
Korollar 4.31. Sei I = [a; b] ⊂ R ein Intervall und f : I → R eine in I stetige und in
(a; b) differenzierbare Funktion. Dann ist f genau dann konvex in I, wenn die Ab-
leitungsfunktion f 0 in (a; b) monoton wachsend ist. Falls f zweimal differenzierbar
in I ist, so ist f genau dann konvex, wenn für alle x ∈ (a, b), f 00 (x) ≥ 0.
Beweis. Übung. u
t
Konvexe Funktionen verhalten sich gut. Zunächst sind konvexe Funktionen ste-
tig.
Lemma 4.32. Sei I = (a; b) ⊂ R ein Intervall und f : I → R eine in I konvexe Funk-
tion. Dann ist f in (a; b) stetig und in jedem abgeschlossenen Teilinterval Lipschitz
stetig.
Beweis. Der Beweis ist nicht ganz einfach und wird hier nicht gegeben.
Anmerkung. Die Polynome f mit f (x) = x2n , n ∈ N, sind konvex auf R. Die Potenzen
f mit f (x) = xρ , ρ ≥ 1, sind konvex auf R+ . Die Exponentialfunktion ist konvex.
Wenn f bijektiv und konvex ist, dann ist die inverse Funktion f −1 konkav. Insbe-
sondere sind die Funktionen f mit f (x) = xρ , 0 ≤ ρ ≤ 1, für x ∈ R+ konkav. Ebenso
ist der Logarithmus konkav.
Die vielleicht wichtigste Eigenschaft konvexer Funktionen ist die Jensen Unglei-
chung.
Satz 4.33 (Jensen Ungleichung). Sei a eine reelle Folge und sei ϕ : R → R eine
konvexe Funktion auf R. Sei weiter für n ∈ N und k = 1, . . . , n, λk ∈ R+ so, dass
k=1 λk = 1. Dann gilt
Pn
n
n
X X
λk ϕ(ak ) ≥ ϕ λk ak .
(4.86)
k=1 k=1
Beweis. Da ϕ konvex ist, gibt es an jedem Punkt y ∈ R eine lineare Funktion L mit
L(y) = φ(y), so dass ϕ ≥ L. Also gibt es ein m ∈ R, so dass für alle x ∈ R, ϕ(x) ≥
ϕ(y) + (x − y)m. Insbesondere ist mit x = a` und y = nk=1 λk ak
P
90 4 Ableitungen und lokale Approximation von Funktionen
n n
X X
φ (a` ) ≥ φ λk ak + a` −
λk ak m. (4.87)
k=1 k=1
Wenn wir dann mit λ` multiplzieren und über ` summieren, erhalten wir, da
`=1 λ` = 1,
Pn
n
n n n
X X X X
λ` φ(a` ) ≥ φ λk ak + λ` a` − λk ak m. (4.88)
`=1 k=1 `=1 k=1
Da die letzten Terme sich wegheben, erhalten wir die Ungleichung (4.86) t
u
Wir nennen kak p die p-Norm des Vektors a. Aus der Jensen Ungleichung erhalten
wir die sehr wichtige Familie von Hölder Ungleichungen.
n
X
ak bk ≤ kakq kbk p . (4.90)
k=1
Beweis. Da offensichtlich nk=1 ak bk ≤ nk=1 |ak ||bk | gilt, können wir oBdA anneh-
P P
men, dass a und b Vektoren mit nicht-negativen Komponenten sind. Wir schreiben
4.6 Konvexität und Ungleichungen 91
n p n Pn q p
ak bk = ak bk aq a−q Pm=1 am
X X
k k n q
`=1 a`
k=1 k=1
p
X aq
n n
X
k 1−q q
= Pn q ak bk am
k=1 `=1 `
a m=1
n q n
p
X a 1−q X
k q
≤ Pn q ak bk
am
k=1 `=1 k
a m=1
q X q p
n
n
X ak (1−q)p p
= Pn q ak bk am
k=1 `=1 `
a m=1
X q p−1 X
n n
p
= ak bk . (4.91)
k=1 k=1
Hier haben wir in der ersten Ungleichung die Jensen Ungleichung für die konvexe
q
a
Funktion φ mit φ(x) = x p und λk = Pn k q . benutzt. In der letzten Gleichung haben
`=1 a`
wir benutzt, dass (1 − q)p = −q. Wenn wir nun die p-te Wurzel nehmen, erhalten
wir, da (p − 1)/p = 1/q,
Ein wichtiger Spezialfall der Hölder Ungleichung ist die Cauchy-Schwarz Un-
gleichung:
X n
an bn ≤ kak2 kbk2 . (4.93)
k=1
dann können wir (über eine ganz einfache Verallgemeinerung der Maximums Un-
gleichung (2.25) auch den Fall p = 1, q = ∞ einschliessen.
Die p-Normen erfüllen eine weitere wichtige Ungleichung, die Minkowski Un-
gleichung. Sie ist nichts anderes als die Dreiecksungleichung.
Beweis. Übung. t
u
Wir nutzen die Gelegenheit, um den wichtigen Begriff der Norm im Allgemeinen
einzuführen.
Definition 4.36 (Norm). Sei E ein linearer Raum, d.h. eine Menge E mit folgenden
Eigenschaften:
(i) Es existiert eine Abbildung + : E × E → E, und (E, +) ist eine kommutative
Gruppe.
(ii) Es existiert eine Abbildung ? : R × E → E, so dass für alle a, b ∈ E und x, y ∈ R
gilt
x ? (a + b) = x ? a + x ? b, (4.96)
und
(x + y) ? a = x ? a + y ? a, (4.97)
sowie
(xy) ? a = x ? (y ? a), (4.98)
und
1 ? a = a. (4.99)
Dann heißt eine Abbildung k · k : E → R+ eine Norm, genau dann wenn:
(i) Für alle x ∈ R und a ∈ E gilt kx ? ak = |x|kak.
(ii) Für alle a, b ∈ E gilt ka + bk ≤ kak + kbk.
(iii) a = 0 ⇔ kak = 0.
Anmerkung. Beachte, dass für jede Abbildung ρ : E → R, die die Eigenschaften (i)
und (ii) erfüllt gelten muss, dass ρ(0) = 0 und für alle a ∈ E, ρ(a) ≥ 0. (Warum?)
Lemma 4.37. Die p-Normen mit p ∈ [1; ∞] sind Normen auf dem Raum Rn .
Beweis. Übung. u
t
Kapitel 5
Integration
Wir hatten bereits im Korollar 4.14 gesehen, dass eine Funktion bis auf eine Kon-
stante durch ihre Ableitung festgelegt ist. Das eröffnet die Möglichkeit, die Frage-
stellungen der vorhergehenden Kapitel, in denen es darum ging, lokale Eigenschaf-
ten gegebener Funktionen zu beschreiben, umzukehren, und zu versuchen, Funktio-
nen aus der Angabe ihrer lokalen Eigenschaften zu rekonstruieren. Dies ist in zahl-
reichen Anwendungen fundamental: Physikalische Gesetze sind oft von der Form,
dass die Rate, mit der sich eine Größe verändert (also eine Ableitung) gegeben wer-
den. Die Aufgabe besteht dann darin, das Verhalten dieser Größe auf lange Zeit zu
bestimmen.
5.1 Stammfunktionen
Unsere erste Frage ist also die nach einer Art der Umkehrung der Differentiation.
Dies führt auf den Begriff der Stammfunktion.
Wir wissen bereits, dass, wenn zwei Funkionen F und G Stammfunktionen von
f sind, folgt, dass F = G + C, wo C eine Konstante ist. Umgekehrt wissen wir auch,
dass wenn F Stammfunktion von f ist, dann F + C auch eine Stammfunktion ist.
Was wir noch nicht wissen, ist, welche Funktionen überhaupt Stammfunktionen
haben.
Die Tatsache, dass wir eine abzählbare Ausnahmemenge an Punkten zulassen,
wo F nicht differenzierbar ist, kommt von der Betrachtung sehr einfacher Funktio-
nen, wie der Funktion f mit
93
94 5 Integration
−1,
x < 0,
f (x) =
(5.1)
1,
x ≥ 0.
eine Stammfunktion ist. Aber natürlich ist F bei 0 nicht differenzierbar. Daher lassen
wir solche Ausnahmepunkte zu. Wir werden hierauf noch zurückkommen.
Eine weitere triviale aber wichtige Beobachtung ist, dass, ebenso wie das Ablei-
ten, das Finden einer Stammfunktion linear ist.
Beweis. Trivial. t
u
Das Finden von Stammfunktionen ist nicht leicht. Dagegen ist es sehr leicht,
nachzuprüfen, ob eine gegebene Funktion die gewünschte Stammfunktion ist: man
braucht sie nur abzuleiten und vergleicht. Um für eine gegebene Funktion f eine
Stammfunktion zu finden, braucht man also nur alle Funktionen, die einem einfal-
len abzuleiten, bis man eine gefunden hat, deren Ableitung f ist. Es empfiehlt sich
dafür, die erhaltenen Paare von Funktionen und Ihrer Ableitungen aufzulisten und
diese Listen in umgekehrter Richtung zu nutzen. Dies ist im großen Umfang gesche-
hen und die entstandenen Tabellen heißen Integraltafeln. Eine der ausführlichsten
Sammlungen ist der Gradstein-Rhyshik [3]. Auch Wolframs Mathematika ist in der
Lage für eine große Menge von Funktionen die Stammfunktion herauszufinden. Nur
sehr wenige Funktionen besitzen Stammfunktionen, die man explizit angeben kann.
Andererseits werden wir sehr bald sehen, dass sehr viele Funktionen eine Stamm-
funktion besitzen.
Trotzdem ist es gut zu wissen, dass sich aus den Regeln für die Ableitungen
Regeln für das Finden von Stammfunktionen herleiten lassen, die oft sehr nützlich
sind. Die erste dieser Regeln folgt aus der Kettenregel.
Beweis. Der Beweis folgt einfach aus der Kettenregel. Es gilt danach, dass für alle
x so, dass G bei h(x) differenzierbar ist,
Da h monoton ist, gibt es nur abzählbar viele x, so dass G bei h(x) nicht differen-
zierbar ist. Daher ist F Stammfunktion wie behauptet. u t
5.1 Stammfunktionen 95
Anmerkung. Die gleiche Folgerung gilt, wenn wir annehmen, dass g stetig und h
stetig differenzierbar ist.
So einfach der Beweis ist, so schwierig ist die Anwendung. Man muss sich ei-
ne Funktion anschauen und sehen, ob man sie in der gewünschten Form schreiben
kann.
Ein hübsches Beispiel ist die Funktion f (x) = exp(−x2 /2)x. Mit g = exp und
h(x) = −x2 /2 hat sie genau die gewünschte Form (bis auf das Vorzeichen). Nun
wissen wir, dass exp0 = exp, also die Stammfunktion von exp auch exp ist. Somit ist
die Stammfunktion unsere Funktion f gegeben durch F(x) = − exp(−x2 /2).
Eine weitere nützliche Formel folgt aus der Produktregel. Man bezeichnet sie als
partielle Integration.
Lemma 5.4 (Partielle Integration). Sei g : I → R und sei h : I → R differenzierbar
in I. Wenn F2 Stammfunktion von g0 h ist, dann hat hg0 eine Stammfunktion F1 , und
es gilt
F1 = hg − F2 + C, (5.4)
wo C eine Konstante ist.
Beweis. Wir nehmen an, dass F2 existiert. Wir setzen F1 = hg − F2 + C. Dann ist
nach Annahme F1 in I bis auf abzählbar viele Punkte differenzierbar und es gilt
Man rechnet leicht nach, dass die Ableitung der rechten Seite in der Tat x ergibt.
Allgemeiner können wir die Funktionen wn (x) = xn exp(−x) betrachten. Wir
schreiben w = h0 g mit h(x) = − exp(−x) und g(x) = xn . Dann ist
wo F2 Stammfunktion von hg0 mit h(x)g0 (x) = −n exp(−x)xn−1 = −nwn−1 (x). Das
heißt, die Stammfunktion von wn kennen wir, wenn wir die von wn−1 kennen. Da
96 5 Integration
wir die Stammfunktion von w0 (und sogar auch schon von w1 ) kennen, sind wir
nach endlich vielen Schritten am Ziel.
Mit diesen Regeln kann man schon allerlei Stammfunktionen bestimmen.
Wir bewegen uns nun in Richtung auf den Beweis der Existenz einer Stammfunkti-
on für eine große Klasse von Funktionen. Dazu gehen wir aber erst einmal in eine
ganz andere Richtung. Wir erinnern uns, dass die elementaren Rechenoperationen
Addition und Multiplikation klare geometrische Interpretationen hatten. Eine posi-
tive reelle Zahl stellt die Länge einer Strecke dar, die Summe zweier solcher Zahlen
ist die Länge der aneinander gelegten Strecken. Das Produkt ist der Flächeninhalt
des Rechtecks mit den entsprechenden Seitenlängen. Wir können also mit Hilfe un-
seres Rechenkalküls für reelle Zahlen den Flächeninhalt von beliebigen Rechtecken
berechnen. Wie können wir Flächeninhalte anderer Teilmengen des R2 berechnen?
Die wesentliche Forderung, die wir an einen Flächeninhalt stellen wollen, ist in der
folgenden (etwas tentativen) Definition festgehalten.
Definition 5.5 (Flächeninhalt). Sei A ⊂ P(R2 ) eine Klasse von Teilmengen des R2
die alle endlichen Rechtecke enthält. Eine Abbildung V : A → R+ heißt Flächeninhalt,
wenn folgendes gilt:
(o) V(∅) = 0.
(i) Falls A, B ∈ A und A ∩ B = ∅, dann ist V(A ∪ B) = V(A) + V(B).
(iii) Falls A ein Rechteck mit Seitenlängen a und b ist, so ist V(A) = ab.
Wir bleiben an dieser Stelle eine genaue Angabe der Klasse A schuldig. Im Fol-
genden wollen wir Mengen betrachten, die man als Gebiete unterhalb des Graphen
von Funktionen erhalten kann, also Mengen der Form
Anmerkung. Beachte, dass wir nicht darüber fordern, welche Werte f an den end-
lich vielen Stellen xk , k = 1, . . . n annimmt. Wir könnten uns allerdings auch auf Trep-
penfunktionen einschränken, die z.B. links-stetig sind, und dann in der Form
n
wi 1[xi−1 ;xi ) ,
X
φ= (5.10)
i=1
Definition 5.8 (Integral von Treppenfunktionen). Sei φ ∈ T([a; b]) eine Treppen-
funktion wie in der Definition. Dann ist
Z b n
X
φ(x)dx = wk (xk − xk−1 ). (5.11)
a k=1
Beachte, dass der Wert des Integrals nicht davon abhängt, welche Werte f auf
den Punkten xi annimmt. Wir können dies auch so ausdrücken, dass a 1{y} (x)dx =
Rb
0 für jeden Punkt y ∈ R. Geometrisch bedeutet dies einfach, dass ein eine Linie
Flächeninhalt Null hat.
Lemma 5.9. Sei φ eine nicht-negative Treppenfunktion und sei A die in (5.8) defi-
nierte Menge bezüglich der Funktion φ. Dann ist
Z b
V(A) = φ(x)dx (5.12)
a
Beweis. Elementar. Die Fläche unter der Treppenfunktion lässt sich in disjunkte
Rechtecke zerlegen deren Volumen nach (ii) wk (xk − xk−1 ) sind. Wegen (i) muss
dann V(A) die Summe auf der rechten Seite von (5.11) sein. (5.13) und (5.14) sind
offensichtlich. u
t
Es ist nun naheliegend, das Integral allgemeiner Funktionen durch das Integral
von Treppenfunktionen zu approximieren. Zumindest für nicht allzu wilde Funktio-
nen sollte dies möglich sein.
Definition 5.10 (Ober- und Unterintegral). Sei f : [a; b] → R eine beschränkte
Funktion. Dann definieren wir das Oberintegral,
Z b,∗ Z b !
f (x)dx = inf φ(x)dx : φ ∈ T([a; b]) ∧ φ ≥ f , (5.15)
a a
und
φ−n (x) = inf f (y), wenn x ∈ Ik , k = 1, . . . , n. (5.20)
y∈Ik
Da f stetig in [0; 1] ist, ist f dort sogar gleichmäßig stetig. Also gibt es für jedes
> 0 ein n0 ∈ N, so dass für alle n ≥ n0 , für alle k = 1, . . . , n für alle y, z ∈ Ik gilt, dass
| f (z) − f (y)| < . Insbesondere ist dann
Weiter ist
Z 1 Z 1 !
f (x)dx = sup φ(x)dx; φ ≤ f (5.22)
0,∗ 0
Z 1 Z 1
≥ φ+n (x)dx −
φ−n (x)dx >
0 0
Z 1 !
≥ inf φ(x)dx; φ ≥ f −
0
Z 1,∗
= f (x)dx − .
0
Da andererseits Z 1 Z 1,∗
f (x)dx ≤ f (x)dx, (5.23)
0,∗ 0
ist für alle > 0 die Differenz zwischen Ober- und Unterintegral kleiner als , und
daher müssen sie gleich sein. Also ist f integrierbar. u
t
Eine weitere Klasse integrierbarer Funktionen sind monotone Funktionen.
Lemma 5.13 (Monotone Funktionen). Sei f : [a; b] → R monoton wachsend (oder
monoton fallend). Dann ist f Riemann integrierbar.
100 5 Integration
Beweis. Der Beweis ist noch einfacher als der vorhergehende. Man benutzt die-
selben Treppenfunktionen φ±n , weiß nun aber, wegen der Monotonie, das Infimum
und Supremum in jedem Ik am Intervallanfang bzw. am Intervallende angenommen
werden. Eine elementare Rechnung zeigt dann, dass
Z 1 Z 1
1
φ+n (x)dx − φ−n (x)dx = ( f (1) − f (0)). (5.24)
0 0 n
Hieraus folgt das Lemma (siehe auch das Bild 5.2). t
u
Wir kommen nun zu dem einfachen Analogon des Zwischenwertsatzes für die In-
tegration. Er besagt im Wesentlichen nichts weiter, als dass der Flächeninhalt unter
einer Kurve über einem Intervall [a; b] gleich dem Flächeninhalt eines Rechtecks
mit einer Seite [a; b] ist.
Satz 5.14 (Mittelwertsatz). Sei f : [a; b] → R stetig. Dann existiert ein m ∈ (a; b)
so, dass Z b
f (x)dx = (b − a) f (m). (5.25)
a
Rb
so, dass a f (x)dx = w(b − a). Andererseits nimmt f jeden Wert zwischen inf und
sup an, also gibt es ein m ∈ [a; b], so dass w = f (m). Man überlegt sich auch leicht,
dass es ein solches m sogar im Innern des Intervalls geben muss. u t
In der Literatur wird gerne auch der Begriff der Riemann Summe eingeführt. Diese
sind gegebenenfalls für die numerische Berechnung von Integralen von Bedeutung.
Dazu betrachtet man eine beliebige Partition des Intervalls [a; b], Ik(n) , k = 1, . . . , n
wie vorher, und eine Wahl von Werten ξk ∈ Ik(n) . Dies liefert eine Treppenfunkti-
on φn,ξ1 ,...,ξk die auf den Intervallen Ik den Wert f (ξk ) annimmt. Man nennt dann
Rb
Rn (ξ1 , . . . , ξn ) = a φn,ξ1 ,...,ξk (x)dx eine Riemann Summe bezüglich (ξk )nk=1 . Es gilt
folgender Satz, dessen Beweis wir als Übung stellen.
Lemma 5.16. Eine Funktion f : [a; b] → R ist genau dann Riemannn integrier-
bar, wenn für jede Folge von Partitionen I (n) , n ∈ N mit der Eigenschaft, dass
limn↑∞ maxnk=1 |Ik(n) | = 0, und jede Wahl der ξ1(n) , . . . , ξn(n) , n ∈ N, die Folgen Rn (ξ1 , . . . , ξn )
zu dem gleichen Grenzwert konvergieren. Diese ist dann das Riemann Integral von
f.
Man sagt dann, dass I das Kurzweil Integral von f ist, wenn für jedes > 0 eine
Eichfunktion δ existiert, so dass für jede δ-feine Partition und Zwischenwerte
Das Kurzweil Integral stimmt für Riemann integrierbare Funktionen mit diesem
überein, erlaubt aber weit mehr Funktionen zu integrieren. Die wichtigsten Eigen-
schaften des Integrals bleiben ebenfalls erhalten.
Wir kommen nun zu dem zentralen Satz, der das analytische Konzept der Stamm-
funktion mit dem geometrischen Konzept des Integrals verknüpft. Dies Verbindung
ist in beide Richtungen äußerst fruchtbar. Man nennt ihn nicht zu Unrecht den
Hauptsatz der Differential- und Integralrechnung (Engl.: Fundamental theorem of
calculus).
Satz 5.17 (Hauptsatz). Sei I = [a; b] ein Intervall und f : I → R eine Riemann inte-
grable Funktion. Wir definieren eine Funktion F : I → R so dass, für alle x ∈ I,
Z x
F(x) = f (y)dy. (5.31)
a
Dann gilt:
(i) Für alle x ∈ I an denen f stetig ist, ist F differenzierbar, und es gilt
(ii)Wenn f in [a; b] an allen bis au abzählbar vielen Punkten stetig ist und Φ eine
beliebige Stammfunktion von f ist, so gilt
Beweis. Der Erste Teil der Aussage ist eine einfache Konsequenz des Mittelwert-
satzes 5.14. Wir müssen ja zeigen, dass
wenn (x − y) nach 0 geht. Nun ist aber wie im Beweis des Mittelwertsatz (sei oBdA
x > y)
Z x
|F(x) − F(y) − f (x)(x − y)| = f (z)dz − f (x)(x − y) = |(w − f (x))(x − y)| , (5.35)
y
h i
mit w ∈ inf z∈[x;y] f (z); supz∈[x;y] f (z) . Also ist
5.4 Uneigentliche Integrale 103
Da f bei x stetig ist muss sowohl supz∈[x;y] f (z) als auch inf z∈[x;y] f (z) nach f (x)
konvergieren, wenn y nach x geht. Also muss auch w gegen f (x) konvergieren und
somit konvergiert die rechte Seite nach 0, wie behauptet.
Die zweite Aussage folgt aus dem Eindeutigkeitssatz, Lemma 4.18. Wenn Φ eine
Stammfunktion für f , so ist für alle bis auf abzählbar viele x ∈ I, Φ0 (x) = f (x).
Andererseits ist nach Punkt (i) auch F 0 (x) = f (x) and allen bis auf abzählbar vielen
Punkten x ∈ I. Damit gilt, das für alle bis auf abzählbar viele Punkte F 0 (x) = Φ0 (x)
so dass aus Lemma 4.18 folgt, dass F = Φ + C. Nun wissen wir aber, dass F(a) = 0,
also muss C = −Φ(a) sein. u t
Obwohl der Beweis nach unseren Vorarbeiten ganz einfach aussah, soll man sich
über die Tiefe dieser Aussage nicht täuschen.
Die Definition des Riemann Integrals erlaubt bisher nur die Berechnung von In-
tegralen über
R ∞kompakte Intervalle. Dies ist zu restriktiv. SoR wären wir geneigt, zu
y
sagen, dass 0 f (x)dx existiert, wenn für alle y > 0, F(y) = 0 f (x)dx existiert, und
die Funktion F(y) einen Grenzwert für y → ∞ besitzt. Allerdings müssen wir hier,
ebenso wie bei der Summierung von Reihen, darauf achten, keine unsinnigen Addi-
tionen von +∞ und −∞ zu produzieren. Zum Beispiel existiert für jedes y ∈ R+ ,
Z y
xdx = F(y) = 0, (5.37)
−y
wie Rman sich schon geometrisch leicht klar macht. Damit wäre auch limy↑∞ F(y) =
∞
0 = −∞ xdx. Andererseits ist
Z y+1
xdx = y + 1/2, (5.38)
−y
R∞
so dass wir mit gleichem Recht sagen könnten −∞
xdx = +∞, oder auch,
Z ∞ Z y+1/y !
1
xdx = lim xdx = lim 1 + 2 = 1. (5.39)
−∞ y↑∞ −y y↑∞ 2y
Wenn beide Integrale uneigentlich nach +∞ konvergieren, kann man das Integral
nicht definieren.
Wichtige Beispiele sind die Potenzen x−α = exp(−α ln(x)) mit α ∈ R+ . Hier gilt
folgendes:
Lemma 5.20. Sei f : (0, ∞) → R gegen durch f (x) = x−α . Dann gilt folgendes:
(i) Wenn α ∈ [0, 1), dann existiert für alle c ∈ R+ das uneigentliche Integral
Z c
c1−α
f (x)dx = . (5.44)
0 1−α
Dagegen ist Z ∞
f (x)dx = +∞. (5.45)
c
5.5 Summen und Integrale 105
(ii) Wenn α ∈ (1, ∞), dann existiert für alle c ∈ R+ das uneigentliche Integral
Z ∞
c1−α
f (x)dx = . (5.46)
c α−1
Dagegen ist Z c
f (x)dx = +∞ (5.47)
0
(iii) Wenn α = 1, so gilt Z ∞
f (x)dx = +∞ (5.48)
c
und Z c
f (x)dx = +∞ (5.49)
0
Beweis. Mit Hilfe der Kettenregel und der bekannten Ableitungen der Funktionen
1−α
exp und ln finden wir, dass die Ableitung der Funktion F(x) = x1−α gerade F 0 (x) =
x−α , wenn α ∈ R+ \ {1}. Denn x1−α = exp((1 − α) ln(x)), und
d 1
exp((1 − α) ln(x)) = exp((1 − α) ln(x))(1 − α) ln0 (x) = x1−α (1 − α) = (1 − α)x−α .
dx x
(5.50)
Damit ist für α¬1 für all 0 < a < b < ∞
Z b
b1−α a1−α
x−α dx = − . (5.51)
a 1−α 1−α
Wenn α < 1 ist, so ist der Limes a ↓ 0 endlich, und der Limes b ↑ +∞ ist +∞ (unei-
gentlich). Im Fall α > 1 ist es gerade umgekehrt.
Wenn α = 1, also f (x) = 1x , so ist die Stammfunktion von f gerade ln. Also ist
dann für all 0 < a < b < ∞
Z b
x−1 dx = ln(b) − ln(a). (5.52)
a
Da ln bei 0 nach −∞ divergiert und bei +∞ nach +∞ divergiert, erhalten wir (5.48)
und (5.49). u t
Integrale (uneigentliche) können oft dabei helfen, die Konvergenz von Reihen zu
kontrollieren. Ein einfaches Resultat dazu ist das folgende Lemma.
Beweis. Indem man die Funktion f von unten und oben durch Stufenfunktionen,
die zwischen ganzen Zahlen konstant sind von unten und oben approximiert, sieht
man leicht, dass
∞
X ∞
X Z ∞ ∞
X
f (n) = f (n + 1) ≤ f (x)dx ≤ f (n). (5.53)
n=2 n=1 1 n=1
Wir hatten schon gesehen, dass eine differenzierbare Funktion durch die Angabe ih-
rer Ableitung bis auf eine Konstante eindeutig bestimmt ist. In sehr vielen Situatio-
nen ist das Verhalten eines Systems dadurch beschrieben, dass man eine Gleichung
für die Ableitung gegeben hat. Das historisch erste Beispiel sind die Newton’schen
Gleichungen. Sie sind Gleichungen für die Geschwindigkeit v eines Teilchens unter
dem Einfluss einer sog. Kraft. Sie lauten
Man kann diese zwei Gleichungen auch als eine Gleichung in der Form
zusammenfassen. Wir wollen uns der Frage zuwenden, inwieweit solche Gleichun-
gen die Funktionen festlegen, und unter welchen Bedingungen solche Gleichungen
überhaupt Lösungen haben.
lösen. Wenn nämlich g : [0; T ] → R Riemann integrierbar ist, so wissen wir, dass
Z t
f (t) = g(s)ds + f0 (6.4)
0
die einzige Lösung mit f (0) = f0 ist. Wir nennen f0 den Anfangswert der Lösung
f . Wir wissen bereits, dass dieser frei gewählt werden kann. Die Form (6.3) ist
107
108 6 Differentialgleichungen
natürlich nicht besonders interessant. Im Allgemeinen wollen wir, dass die rechte
Seite der Gleichung auch die Funktion involviert. Manchmal kann man die Lösung
trotzdem auf eine solche einfache Integration zurückführen. Betrachten wir das Bei-
spiel
f 0 (t) = c f (t). (6.5)
Wenn wir annehmen, dass f > 0 ist, so können wir dividieren und erhalten
f 0 (t)
= c. (6.6)
f (t)
Wegen der Kettenregel und da wir die Ableitung des Logaritmus kennen, wissen wir
aber, dass
f 0 (t) d
= ln ( f (t)) . (6.7)
f (t) dt
Es folgt also durch Integration, dass
Z t
ln ( f (t)) = cds + ln( f0 ) = ct + ln( f0 ), (6.8)
0
Also ist
f (t) = f0 exp(ct) (6.9)
die einzige Lösung mit f (0) = f0 . Wenn f0 > 0, so bestätigt sich auch im Nachhinein
unsere Annahme f > 0. Dasselbe Vorgehen können wir natürlich auf Gleichungen
der Form f 0 (t) = g(t) f (t) anwenden. Mit ähnlichen Tricks lassen sich eine ganze
Reihe von Differentialgleichungen lösen, allerdings ist dies nicht der Normalfall.
Wir wollen dieses Thema hier deshalb auch nicht vertiefen und uns mehr allgemei-
nen Fragen zuwenden.
WennRA = 0, so gilt (6.11) auch mit A = und jedes > 0. Daher ist f (t) ≤
t
exp 0 g(s)ds , für jedes > 0, und daher (beachte, dass für alle t ∈ [0, b) die Funk-
Rt
tion g auf [0, t] stetig ist und somit 0 g(s)ds < ∞) für alle t ∈ R+ f (t) = 0. u t
Wir können mit diesem Lemma nun sofort einen Eindeutigkeitssatz beweisen.
Satz 6.2 (Eindeutigkeitssatz). Sei F : R → R Lipschitz stetig mit Lipschitz Kon-
stante L. Wenn x1 , x2 : R+ → R die Differentialgleichung (6.10) für t ∈ (0, T ) (oder
t ∈ R+ ) lösen, dann gilt
Insbesondere gilt, wenn x1 (0) = x2 (0), so ist x1 (t) = x2 (t) für alle t ∈ [0, T ).
Beweis. Wir setzen f = |x1 − x2 |. Indem wir beide Seiten von (6.10) integrieren er-
halten wir die Integralgleichungen
Z t
xi (t) = xi (0) + F(xi (s))ds, i = 1, 2. (6.17)
0
Daraus folgt
Z t
x2 (t) − x1 (t) = x2 (0) − x1 (0) + (F(x2 (s)) − F(x1 (s)))ds, (6.18)
0
110 6 Differentialgleichungen
und somit
Z t
f (t) = |x2 (t) − x1 (t)| ≤ |x2 (0) − x1 (0)| + |F(x2 (s)) − F(x1 (s))|ds. (6.19)
0
Wenn wir die Lipschitz Stetigkeit von F ausnutzen, erhalten wir hieraus
Z t
f (t) ≤ |x2 (0) − x1 (0)| + L| f (s)|ds, (6.20)
0
wo L die Lipschitz Konstante von F ist. Damit können wir das Gronwall Lemma
anwenden und erhalten sofort die Behauptungen. u t
Die Voraussetzungen des Satzes können wir abschwächen. So genügt es anzu-
nehmen, dass F lokal Lipschitz stetig ist. Wir nehmen dann DL ⊆ R so, dass F in DL
Lipschitz mit Lipschitz Konstanter L ist. Dann sei T L = inf(t : x1 (t < DL ∨ x2 (t) < DL ).
Wenn wir mit Anfangsbedingungen in DL starten, können wir dann zeigen, dass für
alle t < T L , x1 (t) = x2 (t) ist. Man hat so Eindeutigkeit bis die Lösung ein Gebiet
trifft, in dem F nicht mehr Lipschitz ist. Wie wir gleich sehen werden, kann dies in
endlicher Zeit passieren.
Als nächstes beweisen wir die Existenz von Lösungen unter den selben Bedin-
gungen.
Satz 6.3 (Existenzsatz). Sei wieder F Lipschitz mit Lipschitz Konstante L. Dann
existiert für jedes T ∈ R+ und jedes x0 ∈ R eine stetige Funktion x, so dass x für alle
t ∈ (0, T ) die Gleichung (6.10) erfüllt und x(0) = x0 .
Beweis. Für Funktionen x : [0, T ] → R definieren wir die Funktion G[x] : [0; T ] → R
als die Funktion so, dass für alle t ∈ [0; T ],
Z t
G[x](t) = x(0) + F(x(s))ds. (6.21)
0
Beachte, dass, wenn x auf stetig und auch (0; T ) differenzierbar ist, dann auch die
Funktion G[x] stetig und auf (0; T ) differenzierbar ist. Für zwei Funktionen x, y,
haben wir dann
Z t
|G[x](t) − G[y](t)| ≤ |x(0) − y(0)| + |F(x(s)) − F(y(s))|ds
0
Z t
≤ |x(0) − y(0)| + L |x(s) − y(s)|ds. (6.22)
0
Es gilt, dass xn (0) = x(0), für alle n ∈ N. Wegen (6.24) haben wir
Z t
sup |xn+1 (s) − xn (s)| ≤ L sup |xn (r) − xn−1 (r)|ds. (6.27)
s≤t 0 r≤s
Wir behaupten, dass daraus folgt, dass für alle n ∈ N, für alle t < T ,
(Lt)n
sup |xn (s) − xn−1 (s)| ≤ . (6.28)
s≤t n!
Zunächst gilt dies für n = 1. Angenommen, es gilt für n. Dann folgt wegen (6.27),
Z t
(Ls)n (Lt)n+1
sup |xn+1 (s) − xn (s)| ≤ L ds = . (6.29)
s≤t 0 n! (n + 1)!
Also folgt (6.28) durch vollständige Induktion. Aus dieser Abschätzung folgt aber,
dass die Folge (xn (t))n∈N für alle t ∈ [0, T ) eine Cauchy-Folge ist, denn
m m ∞
X X (Lt)n+k X (Lt)k
|xn+m (t) − xn (t)| ≤ |xn+k (t) − xn+k−1 (t)| ≤ ≤ . (6.30)
k=1 k=1
(n + k)! k=n+1
k!
Der letzte Ausdruck konvergiert für jedes t ∈ R nach Null, wenn n ↑ ∞, wie wir von
der Exponentialreihe wissen. Tatsächlich wissen wir sogar mehr, nämlich, dass die
Folge auf kompakten Intervallen [0, T ] gleichmäßig konvergiert. Aus (6.27) folgt
nämlich, dass für jedes t ∈ R+ ,
∞
X (Lt)k
sup |xn (s) − x(s)| ≤ . (6.31)
s≤t k=n+1
k!
Daher gilt auch, dass die Folge G[xn ](t) für alle t ∈ R0 nach G[x](t) konvergiert. Es
ist nämlich
Z t Z t
|G[xn ](t) − G[x](t)| = F(xn (s))ds − F(x(s))ds (6.32)
0 0
Z t Z t
≤ |F(xn (s)) − F(x(s))| ds ≤ L |xn (s) − x(s)| ds
0 0
∞
X (Lt)k
≤ Lt sup |xn (s) − x(s)| ≤ Lt .
s≤t k=n+1
k!
112 6 Differentialgleichungen
Daher ist
G[x](t) = lim G[xn ](t) = lim xn−1 (t) = x(t), (6.33)
n↑∞ n↑∞
also Z t
x(t) = x(0) + F(x(s))ds, (6.34)
0
Es bleibt zu zeigen, dass x differenzierbar ist. Dies folgt aus dem Hauptsatz, wenn
wir wissen, dass F(x(s)) stetig ist, was wegen der Lipschitz Stetigkeit von F aus
der Stetigkeit von x folgt. Stetigkeit von x folgt aber wegen (6.34) sofort, wenn
wir wissen, dass F(x(s) beschränkt ist, was wiederum aus der Beschränktheit von
x folgt. Beschränktheit von x folgt aber aus der Tatsache, dass es wegen (6.31) in
jedem Kompakten Intervall ein n gibt, so dass sich x und xn nicht um mehr als z.B.
1 unterscheiden. xn ist aber stetig und damit auf kompakten Intervallen beschränkt.
Damit haben wir die Existenz einer Lösung für ein beliebiges Interval [0; T ) gezeigt
und der Satz ist bewiesen. u t
Beispiel 6.4. Im folgenden einfachen Beispiel können wie die Picard Iteration ex-
plizit durchführen. Wir betreachten die Differentialgleichung
Dies sind also die Partialreihen der Exponentialreihe und wie erwartet konvergiert
die Folge xn (t) gegen exp(ct).
Anmerkung. Wenn wir statt der globalen Lipschitz Eigenschaft nur verlangen, dass
L lokal Lipschitz ist, so können wir immer noch die Existenz von Lösungen für klei-
ne Zeiten zeigen, wenn die Anfangsbedingung in einem Gebiet liegt, wo F Lipschitz
ist.
6.3 Systeme von Differentialgleichungen 113
Anmerkung. Wenn F nur lokal Lipschitz stetig ist, so kann es sein, dass Lösungen
in endlicher Zeit nach unendlich divergieren. Als Beispiel betrachten wir die Glei-
chung
x0 (t) = x(t)2 . (6.40)
Wir dividieren durch x2 und sehen und benutzen, dass nach der Kettenregel
1/x(t) = −t + C. (6.43)
Schon in unserem ersten Beispiel aus der Physik haben wir nicht eine einzige
Differentialgleichung gesehen, sonder ein System von zwei solchen Gleichungen.
Daräber hinaus sind Ort und Geschwindigkeit eines Teilchens meist nicht durch nur
eine reelle Zahl beschreibbar, sondern wir müssen etwa einen dreidimensionalen
Vektor, (x1 , x2 , x3 ) angeben. Es ist daher sinnvoll, dass wir uns im Folgenden mit
Funktionen befassen, die Werte in einem Vektorraum Rd , d ∈ N, annehmen. Wir ge-
hen hier davon aus, dass solche Vektorräume aus der linearen Algebra bekannt sind
(wir brauchen aber hier nur die Definition 4.36. Für uns ändert sich zum Glück so
gut wie nichts. Eine Funktion x : D → Rd ist nichts anderes als ein d Funktionen
xk : D → R, k = 1, . . . , d, also x = (x1 , . . . , xd ). Eine System von d Differentialglei-
chungen erster Ordnung ist dann gegeben durch
Ganz analog definiert man auch die lokale Lipschitz Stetigkeit. Wir können jetzt
unsere Existenz- und Eindeutigkeitsaussagen sofort auf Systeme von Differential-
gleichungen verallgemeinern.
Insbesondere gilt, wenn x1 (0) = x2 (0), so ist x1 (t) = x2 (t) für alle t ∈ [0, T ).
Beachte, dass die Anfangsdaten, die benötigt werden um eine Lösung eindeutig
festzulegen jetzt der d-dimensionale Vektor x(0) ∈ Rd ist. Das war sicher zu erwar-
ten.
Satz 6.7 (Existenzsatz). Sei wieder F : Rd → R Lipschitz stetig mit Lipschitz Kon-
stante L. Dann existiert für jedes T ∈ R+ und jedes x0 ∈ Rd eine stetige Funktion
x : [0, T ] → Rd , die in (0; T ) differenzierbar ist und für alle t ∈ (0, T ) die Gleichung
(6.10) erfüllt und x(0) = x0 ..
Die Beweise dieser Sätze sind identisch zu denen von Satz 6.2 bzw. 6.3, wenn
man nur jeweils den Betrag durch die entsprechende Norm ersetzt. Sie sollten dies
einfach einmal selbst zu Übung durchgehen.
Wenn man die Annahmen der Lipschitz Stetigkeit durch lokale Lipschitz Stetig-
keit ersetzt, so kann man immer noch Existenz und Eindeutigkeit für kleine Zeit-
intervalle zeigen. Was dann passiert hängt davon ab, ob die Lösung in ein Gebiet
mit kleinerer oder größerer Lipschitz Norm läuft. Man sieht dies schon in unserem
Beispiel oben recht schön.
6.4 Differentialgleichungen höherer Ordnung 115
Wir können aus den Sätzen für Systeme von Differentialgleichungen mit zeitun-
abhängigem F auch sofort aus solche mit Zeitabhängigem F schliessen. Wenn wie
nämlich eine Differentialgleichung der Form
mit Anfangsbedingung x(0) = x0 , y(0) = 0 assoziieren. Das System (6.51) ist von
der Form x0 = G(x), mit x ∈ Rd+1 ,G : Rd+1 → Rd+1 . Die eindeutige Lösung dieser
Gleichung ist aber (x(t), t), wo x(t) die Gleichung (6.50) mit x(0) = x0 löst.
Trotz der Einfachheit der Beweise sind die Sätze zur Existenz und Eindeutigkeit
von fundamentaler Bedeutung in der Analysis.
Aus dieser Beobachtung folgt, dass für eine DIfferentialgleichung n-ter Ordnung
n Anfangsdaten benötigt werden um eine Lösung festzulegen, nämlich die Werte
x(0), x0 (0), . . . , x(n−1) (0).
116 6 Differentialgleichungen
Übung 6.8. Angenommen, die Funktion G : Rn → R ist Lipschitz stetig mit Lip-
schitz Norm L. Zeige, dass für die Lipschitz Norm
√ L der durch die Gleichungen
e
n n
(6.54) definierten Funktion F : R → R gilt eL ≤ L2 + 1.
Der Eindeutigkeitssatz für Lösungen von Differentialgleichungen gibt uns ein neu-
es und oft sehr hilfreiches Werkzeug an die Hand um Gleichungen zu beweisen.
Die Idee ist sehr einfach. Angenommen wir haben zwei Funktionen gegeben, sa-
gen wir f, g, die auf verschieden Arten beschrieben sind. Wir vermuten, dass f = g.
Um dies zu beweisen, können wir versuchen, zu zeigen, dass diese jeweils dieselbe
Differentialgleichung lösen, also das
Lemma 6.10. Die Exponentialfunktion exp ist die einzige differenzierbare Funktion
mit den Eigenschaften
(i) e0 (0) = 1 und
(ii) für alle x, y ∈ R gilt, dass e(t + s) = e(t)e(s).
6.5 Anwendungen des Eindeutigkeitssatzes 117
Beispiel 6.11 (Die trigonometrischen Funktionen). Wir können Lemma 4.20 aus
Kapitel 4.4 so interpretieren, dass die Funktionen f2 = cos und f1 = sin das Dif-
ferentialgleichungssystem
mit den Anfangsbedingungen f1 (0) = 0 und f2 (0) = 1 lösen. Unser Existenz- und
Eindeutigkeitssatz garantiert, das es nur ein solches Tupel von Funktionen gibt
und dass diese auf ganz R+ definiert sind. Insbesondere müssen sie mit den durch
konvergente Potenzreihen dargestellten Funktionen cos und sin übereinstimmen.
Übrigens folgt aus der Diffferentialgleichung und den Anfangsbedingungen sofort,
dass Gleichung (3.41) gilt. Wenn wir nämlich h definieren durch h(t) = f12 (t) + f22 (t),
so folgt mit der Produktregel,
h0 (t) = 2 f1 (t) f10 (t) + 2 f2 (t) f20 (t) = 2 f1 (t) f2 (t) − 2 f2 (t) f1 (t) = 0, (6.60)
mit den Anfangsbedingungen g1 (0) = 1 und g2 (0) = 0. Man kann nun leicht nach-
prüfen, dass die eindeutige Lösung dieses Systems gegeben ist durch g1 = cos und
g2 = − sin. Weiter folgt nun, dass f1 (π) = cos(π/2) = 0, und f2 (π) = − sin(π/2) = −1.
Wenn wir nun hi (t) = fi (t + π), i = 1, 2 setzen, erfüllen diese wieder dieselben Dif-
ferentialgleichungen, aber mit den Anfangsbedingungen h1 (0) = 0, h2 (0) = −1.
Wieder sieht man, dass nun h1 (t) = − sin(t) und h2 (t) = − cos(t) die eindeutige
Lösung sind. Also ist f1 (3π/2) = 0 und f2 (3π/2) = −1). Daraus folgt wie gehabt
f1 (3π/2 + x) = − cos(t), f2 (3π/2 + x) = sin(t). Schließlich ist f1 (2π) = 0, f2 (2π) = 1,
so dass f1 (2π+ x) = f1 (t) und f2 (2π+ x) = f2 (t). Wir erhalten also folgendes Resultat.
Lemma 6.12. Die Funktionen cos und sin sind gemeinsam periodisch mit Periode
2π.
2π ist der Umfang eines Kreises, und cos(t) und sin(t) sind die gerichteten Längen
der Katheten eines rechtwinkligen Dreiecks mit Öffnungswinkel x.
118 6 Differentialgleichungen
mit jeweils Konstanten ak` , bk . Im Fall n = 1 kennen wir die Lösung schon: Die
Lösung der homogenen Gleichung ist x(t) = x(0) exp(at), wo x(0) das gegebene An-
fangsdatum ist. Für die inhomogene Gleichung können wir eine Lösung erraten:
Z t
x(t) = exp(at) exp(−as)bds, (6.65)
0
die allerdings die Anfangsbedingung x(0) = 0 hat. Nun ist aber klar, dass, wenn x
eine Lösung von (6.64) ist und y eine Lösung von (6.63) ist, dann x + y auch Lösung
von (6.64) ist. Also erhalten wir eine Lösung von (6.64) mit beliebiger Anfangsbe-
dingung x(0) als
Z t
x(t) = exp(at) exp(−as)bds + x(0) exp(at). (6.66)
0
6.6 Lineare Differentialgleichungen mit konstanten Koeffizienten, oder: Analysis trifft lineare Algebra
119
Wir kommen nun zu dem allgemeinen Fall. Wir fassen die Konstanten ak` als
Elemente einer n × n-Matrix A auf, und schreiben x(t) für den Vektor mit Kompo-
nenten xk (t). Dann lautet (6.63) einfach
Lemma 6.13. Die Funktion F : Rn → Rn mit F(x) = Ax ist Lipschitz stetig bezüglich
der 2-Norm mit Lipschitz Konstante
v
u
tXn
kAk = a2k` . (6.68)
k,`=1
Beweis. Dies ist eine einfache Rechnung die nur die Cauchy-Schwarz Ungleichung
benutzt.
n
n X
2
X
kAx − Ayk22 =
ak` (x` − y`) (6.69)
k=1 `=1
n X
n n
X X
2 2
≤ ak` |x` − y` |
k=1 `=1 `=1
= kAk2 kx − yk22 .
Offenbar ist für jede n × n-Matrix A die Norm kAk < ∞, und also hat (6.67) ei-
ne eindeutige Lösung für jede Anfangsbedingung x(0) = x0 ∈ Rn . Diese Lösung
können wir zum Beispiel mittels der Picard-Lindelöf iteration gewinnen. Indem wir
die Rechnungen im Beispiel 6.4 wort-wörtlich wiederholen, finden wir dann, dass
die Lösung der Gleichung gegeben ist durch
∞
X 1 n n
x(t) = t A x0 . (6.70)
n=0
n!
Damit haben wie die Funktion exp : R2n → R2n auf dem Raum der n × n-Matrizen
definiert.
Wir haben als Folgerung:
120 6 Differentialgleichungen
Satz 6.14. Die einzige Lösung des Differentialgleichungssystems (6.67) mit An-
fangsbedigung x(0) = x0 ist die vektorwertige Funktion x, für die
Beispiel 6.15. Wir kommen wieder zu unserem bekannten Beispiel (6.59) zurück.
In Matrixform nimmt es die Form
!
0 1
x0 (t) = x(t) (6.73)
−1 0
was, wie man leicht nachrechnet, das selbe sein muss wie
Wir sehen hier also einen interessanten und zunächst überraschenden Zusammen-
hang zwischen der Exponentialfunktion und den trigonometrischen Funktionen. In
der Tat können wir die mittels unserer Differentialgleichungen erhaltenen Identität
(6.77) auch direkt aus der Reihendarstellung herleiten. Es ist nämlich
!2 !
0 1 10
=− , (6.78)
−1 0 01
und daher
1 0
(−1) ,
n/2
wenn n gerade ist,
!n
01
0 1
=
(6.79)
−1 0 0 1
,
(−1) (n−1)/2 wenn n ungerade ist,
−1 0
Damit können wir in der Exponentialreihe alle Matrixpotenzen ausrechnen und wir
erhalten
6.6 Lineare Differentialgleichungen mit konstanten Koeffizienten, oder: Analysis trifft lineare Algebra
121
! ∞ 2k
! ∞
t2k+1
! !
0 1 10 X k t 0 1 X
exp t = (−1) + (−1)k , (6.80)
−1 0 01 (2k)! −1 0
k=0
(2k + 1)!
k=0
was gerade die rechte Seite von (6.77) ist! Die vorhin beschriebenen Periodi-
zitätdseigenschaften von cos und sin können wir nun auch anders herleiten, nämlich
aus denen der Exponentialfunktion. Wir erinnern uns, dass π/2 als die kleinste po-
sitive Zahl definiert war, für die sin(π/2) = 1 (und damit cos(π/2) = 0. Es gilt damit
! ! !
0 1 0 1
exp π/2 = , (6.81)
−1 0 −1 0
und daher
! ! ! ! ! !
0 1 0 1 0 1
exp (t + 2π) = exp t exp 2π
−1 0 −1 0 −1 0
! ! !4
0 1 0 1
= exp t
−1 0 −1 0
! ! !
0 1 10
= exp t
−1 0 01
! !
0 1
= exp t . (6.82)
−1 0
Dies impliziert die Periodizität der trigonometrischen Funktionen. Weiter erhält man
auf diese Weise die Additionstheoreme für den Sinus und Kosinus.
Wir haben ! von den zwei Matrizen nur (6.78) und die Tatsache, dass sich die Ma-
10
trix wie die 1 verhält verwendet. Nun erinnern wir uns an die Zahl i, die die
01
Eigenschaft i2 = −1 haben sollte. Somit haben wir jetzt zweierlei: ein explizites
mathematisches Objekt, dass genau die Eigenschaft von i hat. Wir könnten, wenn
wir wollten, komplexe Zahlen daher als 2 × 2- Matrizen darstellen und brauchten
dann nicht mit der imaginären Zahl i zu operieren. In der Tat gelten die Rechenre-
gel für Addition
! und Multiplikation
! genau! so, wie wir
! und das vorstellen: Es seine
10 0 1 10 0 1
Z1 = x1 + y1 und Z2 = x2 + y2 . Dann ist
01 −1 0 01 −1 0
! !
10 0 1
Z1 + Z2 = (x1 + x2 ) + (y1 + y2 ) , (6.87)
01 −1 0
und ! !
10 0 1
Z1 Z2 = (x1 x2 − y1 y2 )) + (x1 y2 + y1 x2 ) , (6.88)
01 −1 0
was kompatibel mit der Regel für die Addition und Multiplikation komplexer Zah-
len ist.
Weiter können wir komplexe Zahlen als Punkte in der sogenannten komplexen
Ebene auffassen, d.h. wir stellen die komplexe Zahl x + iy ∈ C als den Punkt (x, y) ∈
R2 dar. Daraus ergibt sich eine natürliche Definition für den Absolutbetrag einer
komplexen Zahl: Dieser soll einfach die Länge des Vektors (x, y) sein:
Definition 6.17 (Absolutbetrag einer komplexen Zahl). Sein z = x + yi ∈ C. Dann
ist der Absolutbetrag von z, geschrieben |z|, gegeben durch
q
|z| = x2 + y2 . (6.89)
Lemma 6.18. Der Absolutbetrag ist eine Norm auf C. Wenn wir für z = x + yi ∈ C
die komplex-konjugierte Zahl z∗ = x − yi definieren, so gilt
√
|z| = zz∗ . (6.90)
Insbesondere gilt für zwei komplexe Zahlen z1 , z2 , dass |z1 z2 | = |z1 ||z2 |.
Beweis. Übung. t
u
Die Darstellung der komplexen Zahlen als Punkte in der komplexen Ebene hat
noch eine tiefere Bedeutung. Sei nämlich φ = arctan(x/y). Dann ist die Matrixdar-
stellung der komplexen Zahl z = x + yi gerade
6.8 Zurück zu linearen Differentialgleichungen 123
! ! !
0 1 cos(φ) sin(φ)
Z = |z| exp φ = |z| . (6.91)
−1 0 − sin(φ) cos(φ)
!
cos(φ) sin(φ)
Die Matrix stellt eine Drehung um den Winkel φ dar. Es gilt dann
− sin(φ) cos(φ)
auch
cos(φ1 + φ2 ) sin(φ1 + φ2 )
! ! !
0 1
Z1 Z2 = |z1 ||z2 | exp (φ + φ2 ) = |z1 ||z2 | . (6.92)
−1 0 1 − sin(φ1 + φ2 ) cos(φ1 + φ2 )
D.h. aber, die Multiplikation zweier komplexer Zahlen entspricht einer Addition der
Winkel und einer Multiplikation ihrer Beträge als Punkte in der komplexen Ebene.
Wir können wir aber auch alles was wir eben gelernt haben auf die komplexe
Exponentialfunktion exp : C → C anwenden. Dabei ist wieder exp(z) durch ihre
Reihendarstellung definiert. Aus (6.77) wird dann das folgende Lemma.
Kehren wir nun wieder zu unserem allgemeinen System (6.67) zurück. Um exp(A)
zu berechnen, müssen wir alle Potenzen der Matrix A berechnen. Das scheint
schwierig, hat aber in dem Beispiel geklappt. Ein besonders einfacher Fall tritt ein,
wenn die Matrix A diagonal ist, also akk = λk ∈ C, und ak` = 0, wenn k , `. Dann
ist An auch diagonal und hat auf der Diagonalen die Einträge λnk . Dann ist aber auch
exp(At) diagonal mit Einträgen exp(λk t) auf der Diagonalen.
Satz 6.20. Sei A eine (reelle oder komplexe) n × n-Matrix. Angenommen, es eine
invertierbare n × n-Matrix V so, dass V −1 AV = Λ, wo Λ eine komplexe Diagonalma-
trix ist. Dann sind die Lösungen des Differentialgleichungssystems (6.67) gegeben
durch
x(t) = V exp(Λt)V −1 x(0) (6.94)
wo x(0) der Vektor der Anfangsbedingungen ist und exp(Λt) die Diagonalmatrix mit
Einträgen exp(λk t) ist.
Die Lösungen der inhomogenen Gleichungen sind nun ebenso einfach anzuge-
ben.
124 6 Differentialgleichungen
Satz 6.21. Sei A eine (reelle oder komplexe) n × n-Matrix. Angenommen, es eine in-
vertierbare n×n-Matrix V so, dass V −1 AV = Λ, wo Λ eine komplexe Diagonalmatrix
ist. Dann sind die Lösungen des inhomogenen Differentialgleichungssystems (6.66)
gegeben durch
Z t
x(t) = V exp(Λt)V −1
V exp(Λs)V −1 bds + V exp(Λt)V −1 x(0) (6.95)
0
wo x(0) der Vektor der Anfangsbedingungen ist und exp(Λt) die Diagonalmatrix mit
Einträgen exp(λk t) ist.
Die ganze Arbeit machen hier also die Algebraiker, die die Matrizen V und Λ
finden müssen. Leider gibt es die nicht immer. Man kann aber immer eine Transfor-
mation auf die sog. Jordan Normalform durchführen, deren n-te Potenzen ebenfalls
explizit berechnet werden können.
Literaturverzeichnis
1. Georg Cantor. Über eine Eigenschaft des Inbegriffes aller reellen algebraischen Zahlen. Journal
für die Reine und Angewandte Mathematik, 77:258–262, 1874.
2. Otto Forster. Analysis 1. Grundkurs Mathematik. Vieweg + Teubner, Wiesbaden, expanded
edition, 2011. Differential- und Integralrechnung einer Veränderlichen.
3. I. S. Gradstein and I. M. Ryshik. Summen-, Produkt- und Integraltafeln. Band 1, 2. Verlag
Harri Deutsch, Thun, 1982.
4. Konrad Königsberger. Analysis. 1. Springer-Lehrbuch. Springer-Verlag, Berlin, sixth edition,
2004.
5. Giuseppe Peano. Arithmetices principia nova methodo exposita. Fratres Bocca, Torino, 1889.
6. Terence Tao. Analysis. I, volume 37 of Texts and Readings in Mathematics. Hindustan Book
Agency, New Delhi, third edition, 2014.
125
Sachverzeichnis
C, 38 Beweise, 2
N, 23 bijektiv, 5
N0 , 15 Bildbereich, 5
Q, 20 Binärdarstellung, 37
R, 26 Brüche, 19
R+ , 47
Z, 32 Carthesisches Produkt, 4
-Umgebung, 39 Cauchy-Folgen, 24, 42
i, imaginäre Einheit, 38 Äquivalenz, 26
±∞, 40 Cauchy-Schwarz Ungleichung, 91
e: Euler’sche Zahl, 61
Äquivalenzklasse, 7 Definitionen, 2
Äquivalenzrelation, 7 Definitionsbereich, 5
Dezimaldarstellung, 37
Differentialgleichungen, 107
Abbildungen, 4 lineare, 123
abgeschlossen, 39 Differenzierbarkeit, 71
Ableitung, 71 Distributivgesetz, 17, 18
höhere, 83 Divergenz, 42
inverse Funktion, 77 Dreiecksungleichung, 24
linksseitig, 73 dyadische Zahlen, 37
rechtsseitig, 73
von Potenzreihen, 81 Eindeutigkeitssatz
Ableitungsregeln, 75 für Differentialgleichungen, 109, 114
Abschluss, 40 Euler’sche Zahl, 61
Absolutbetrag, 23 Existenzsatz
absolute Konvergenz, 50 für Differentialgleichungen, 110, 114
Abzählbarkeit, 32 Exponentialfunktion
Addition, 13 Ableitung, 74
Additionstheoreme Differentialgleichung, 116
Sinus und Kosinus, 121 komplexe, 123
Anfangswert, 108
Archimedisches Prinzip, 28 Flächeninhalt, 96
Assoziativgesetz, 14 Folge
asymptotische Äquivalenz, 44 monoton, 36
Aussage, 1 Folgen, 23, 31, 42
Axiome, 2 beschränkte, 23
127
128 Sachverzeichnis
konvergente, 25 Mehrfachreihen, 52
rationale, 23 Mengen, 3
reelle, 31 Mengenrelationen, 3
Funktionen, 4 Minimum, 24
Minkowski Ungleichung, 91
ganze Zahlen, 15 Mittelwertsatz, 77, 100
geometrische Reihe, 34, 46 monotone Folgen, 36
Grenzwert, 25 monotone Konvergenz, 42
Gronwall lemma, 108 Multiplikation, 19
Gruppe, 15
natürliche Zahlen, 9
Häufungspunkt, 43, 73 Norm, 92, 113
Hölder Nullfolgen, 25
Ungleichung, 90
Halbgruppe, 15 Oberintegral, 98
harmonische Reihe, 46 Objekt, 1
Hauptsatz der Differential- und Integralrech- offen, 39
nung, 102 Ordnung
Hintereinanderausführung, 6 reeller Zahlen, 27
homogene Differentialgleichung, 118 Ordnungsrelationen, 27