Current 2

Anton Bovier
Analysis 1
Vorlesung Winter 2015/6, Bonn
12. Juli 2022

Inhaltsverzeichnis
1 Logik, Mengen, Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Die natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.2 Die ganzen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.3 Die rationalen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4 Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.5 Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2 Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.1 Erste topologische Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2 Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.3 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.3.1 Umordnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.3.2 Mehrfachreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.1 Elementare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.1 Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2.2 Der Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2.3 Die trigonometrischen Funktionen . . . . . . . . . . . . . . . . . . . . . . 62
3.3 Stetigkeit und lokales Verhalten von Funktionen . . . . . . . . . . . . . . . . . 63
4 Ableitungen und lokale Approximation von Funktionen . . . . . . . . . . . . 71

4.1 Der Begriff der Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2 Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.3 Der Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4 Ableitung absolut konvergenter Potenzreihen . . . . . . . . . . . . . . . . . . . 81
4.4.1 Die trigonometrischen Funktionen . . . . . . . . . . . . . . . . . . . . . . 82
v
vi Inhaltsverzeichnis
4.5 Höhere Ableitungen und Taylor Reihen . . . . . . . . . . . . . . . . . . . . . . . . 83

4.6 Konvexität und Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.6.1 Definition und erste Eigenschaften konvexer Funktionen . . . 87
4.6.2 Die Jensen Ungleichung und ihre Folgen . . . . . . . . . . . . . . . . 89
5 Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.1 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.2 Das Riemann Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.2.1 Der Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.2.2 Riemann Summen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.3 Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . 102
5.4 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.5 Summen und Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6 Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.1 Lösung durch Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.2 Existenz- und Eindeutigkeitssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.3 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.4 Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . . . . . 115
6.5 Anwendungen des Eindeutigkeitssatzes . . . . . . . . . . . . . . . . . . . . . . . . 116
6.6 Lineare Differentialgleichungen mit konstanten Koeffizienten,
oder: Analysis trifft lineare Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.7 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.8 Zurück zu linearen Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . 123
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
Kapitel 1
Logik, Mengen, Zahlen
Wir beginnen die Vorlesung mit einigen elementaren Vorbereitungen. Diese betref-
fen zunächst Elemente der Aussagenlogik und der Mengenlehre. Danach beginnen
wir mit der Einführung der Zahlensysteme. Eine wesentlich detailliertere Darstel-
lung die ich sehr empfehle findet sich in dem Buch Analysis 1 von Terence Tao
[6]. Auch wenn wir später einen pragmatischeren Standpunkt einnehmen werden,
so sind die die hier behandelten Konzepte wichtig für die Technik des Beweisens.
Es gibt uns auch Gelegenheit, das formale Beweisen an elementaren Sachverhalten
zu üben. Weitere Lehrbücher sind etwa Königsberger [4] und Forster [2].
1.1 Aussagenlogik
Unter einem Objekt wollen wir alles verstehen, worüber wir sprechen können. Ob-
jekte werden wir in der Regel durch Buchstaben symbolisieren. Wir sagen dann
etwa ’Sei ω ein Objekt’ und machen dann Aussagen, die dieses Objekt näher be-
schreiben. Wir könnten statt Buchstaben auch kleine Bildchen benutzen, aber es ist
praktisch, Buchstaben zu nehmen, da wir diese leicht wieder erkennen. Die Kenntnis
des lateinischen und griechischen Alphabets setzen wir ab sofort voraus. Da diese
Alphabete über sehr wenige Buchstaben verfügen, werden wir auch zusammenge-
setzte Symbole benutzen, wie etwa a1 , b x , etc.. Buchstaben die in verschiedenen
Schriftarten geschrieben sind, repräsentieren a priori nicht das gleiche Objekt. So
können wir gleichzeitig von den Objekten n, N, N, und N sprechen, die alle etwas
verschiedenes sind.
Unter Aussagen verstehen wir Objekte, denen ein Wert wahr oder falsch zuge-
ordnet werden kann. Wir nehmen an, wir hätten eine Sammlung sogenannter ele-
mentarer Aussagen, für die diese Zuordnung bekannt ist. Ziel der Aussagenlogik ist
es, aus elementaren Aussagen neue Aussagen zu gewinnen und deren Bewertung zu
bestimmen.
Die Gewinnung neuer Aussagen geschieht mittels der logischen Operationen ∧
(und), ∨ (oder), ⇒ (wenn, dann) und ¬ (Negation). Die ersten drei Operationen
1
2 1 Logik, Mengen, Zahlen
bilden aus zwei Aussagen eine neue Aussage, die letztere verwandelt eine Aussage
in einen andere. Es gelten folgende Regeln:
¬ Wenn a wahr, dann ¬a falsch; wenn a falsch, dann ¬a wahr;
∧ Wenn a wahr und b wahr, dann a ∧ b wahr, in allen anderen Fällen ist a ∧ b
falsch;
∨ Wenn a falsch und b falsch, dann ist a ∨ b falsch, in allen anderen Fällen ist a ∨ b
wahr;
⇒ Wenn a wahr und b falsch, dann ist a ⇒ b falsch, in allen anderen Fällen ist
a ⇒ b wahr.
Es ist etwas unerfreulich, dass wir zur Definition dieser Begriffe auf Umgangs-
sprache zurückgreifen müssen, also insbesondere das Wort wenn benutzen, um die
Implikation wenn, dann zu definieren.
Aus den elementaren logischen Operationen kann man noch einige wichtige
kombinierte Operationen konstruieren. Insbesondere
⇔: a ⇔ b bezeichnet die Aussage (a ⇒ b) ∧ (b ⇒ a). a ⇔ n ist wahr, wenn a
wahr und b wahr sowie wenn a falsch und b falsch ist; in allen anderen Fällen ist
a ⇔ b falsch;
XOR: a XOR b bezeichnet die Aussage ¬(a ⇔ b).
In der Mathematik geht es weitgehend darum, Aussagen zu machen, die nachge-
wiesenermaßen wahr sind. Solche Aussagen nennen wir Lemma, Satz oder Theo-
rem. Um eine Aussage zu einem solchen zu machen, benötigen wir einen Beweis.
Im Prinzip geht das dadurch, dass wir wahre Aussagen finden, die nur dann wahr
sein können, wenn unsere gewünschte Aussage wahr ist. Dabei hilft es, dass gewisse
Aussagen einen bekannten Wahrheitswert haben.
Lemma 1.1. Sei a eine beliebige Aussage. Gilt:
(i) Die Aussage a ∨ ¬a ist stets wahr;
(ii) Die Aussage a ∧ ¬a ist stets falsch.
Beweis. Offensichtlich. t
u
Eine beliebte Vorgehensweise ist der Beweis durch Widerspruch. Das geht so.
Satz 1.2. a ist wahr.
Beweis. Wir suchen eine Aussage b von der wir wissen, dass ¬b wahr ist und gleich-
zeitig ¬a ⇒ b wahr ist. Dann wissen wir, dass ¬a falsch ist, also a wahr ist. u
t
In der Mathematik benötigen wir, um überhaupt etwas beweisen zu können Aus-
sagen, die als wahr festgelegt werden. Diese nennen wir Axiome. Von Axiomen
zu unterscheiden sind Definitionen. Eine Definition beschreibt eine Klasse von Ob-
jekten, für die gewisse Aussagen wahr sind. Zum Beispiel ’Ein Schlüssel ist ein
Objekt mit dem man Schlösser öffnet’ definiert eine Klasse von Objekten, die wir
Schlüssel nennen. Die Aussage ’Ein Schlüssel öffnet Schlösser’ ist dann eine wahre
Aussage, wobei zunächst unklar ist, ob es solche Objekte gibt. Die Aussage ’Es gibt
Schlüssel’ als wahr zu setzen wäre dagegen ein Axiom, falls man diese nicht durch
Vorzeigen eines Schlüssels beweisen kann.
1.2 Mengen 3
1.2 Mengen
Die Mengenlehre ist eine konzeptuell sehr tiefe und anspruchsvolle Theorie. Sie
nimmt ihren Ursprung in einer Arbeit von Georg Cantor aus dem Jahr 1874 [1]. Wir
können in dieser Vorlesung auf diese Aspekte nicht eingehen und betrachten nur
einige elementare Aspekte, die für uns wichtig sind.
Eine Menge ist eine Sammlung von Objekten. Dies können wir formal durch
eine Relation ∈ beschreiben. Gegeben ein Objekt ω und eine Menge A, so sagen
wir, die Aussage ω ∈ A sei wahr, wenn ω in A enthalten ist. Wir sagen dann auch,
ω ist Element von A. Die Menge A ist dann die Sammlung aller Objekte ω, für
die ω ∈ A wahr ist. Eine besondere Rolle spielt die Menge ∅, die leere Menge, die
die Eigenschaft hat, dass es kein Objekt gibt, dass in ihr enthalten ist, also dass die
Aussage ω ∈ ∅ stets falsch ist. Statt ¬(ω ∈ A) schreiben wir auch ω < A.
In natürlicher Weise können Mengen in Beziehung zueinander stehen.
Definition 1.3 (Teilmengen). Sind A und B zwei Mengen, so schreiben wir A ⊆ B
wenn die Aussage ω ∈ A ⇒ ω ∈ B stets (d.h. für jedes Objekt ω) wahr ist. Wir sagen
dann, A ist Teilmenge von B. Falls A ⊆ B und B ⊆ A, dann sagen wir A = B, A
gleich B. Wenn A nicht gleich B ist aber A ⊆ B, so sagen wir A ⊂ B, A ist strikt in B
enthalten. Statt ¬(A = B) schreiben wir auch A , B.
Als nächstes können wir Mengenoperationen einführen.
Definition 1.4 (Mengenoperationen). Seien A and B Mengen.
(i) Wir schreiben C = A ∪ B für die Aussage ω ∈ C ⇔ ω ∈ A ∨ ω ∈ B. Wir nennen
A ∪ B die Vereinigung von A und B.
(ii) Wir schreiben C = A ∩ B für die Menge, für die die Aussage ω ∈ C ⇔ ω ∈
A ∧ ω ∈ B wahr ist. Wir nennen A ∩ B den Durchschnitt von A und B.
(iii) Wenn A ⊆ B, so schreiben wir C = B\A für die Menge, für die die Aussage
ω ∈ C ⇔ ω ∈ B ∧ ω < A) wahr ist. C ist die Differenz der Mengen B und A.
(iv) Die nennen die Menge C = A∆B = (A ∪ B)\(A ∩ B) die symmetrische Differenz
der Mengen A und B.
Das folgende Lemma beantwortet die Frage, ob diese Definitionen sinnvoll sind.
Lemma 1.5. Die Mengenoperationen ∪, ∩, \, ∆ definieren die Mengen C jeweils ein-

deutig.
Beweis. Wir beweisen nur, dass C = A ∪ B eindeutig festgelegt ist. Der Rest ist
als Übungsaufgabe zu lösen. Angenommen es gäbe zwei verschiedene Mengen
C,C 0 , so dass sowohl die Aussage ω ∈ C ⇔ ω ∈ A ∨ ω ∈ B als auch die Aussage
ω ∈ C 0 ⇔ ω ∈ A ∨ ω ∈ B für alle ω wahr sind. Wir können ohne Beschränkung der
Allgemeinheit annehmen, dass C , ∅. Wenn nun C , C 0 , so gibt es mindestens ein
Element, ω, so dass ω ∈ C ∧ ω < C 0 , oder umgekehrt, ω ∈ C 0 ∧ ω < C. Angenommen
es gelte ersteres (das Argument im zweiten Fall ist identisch). Dann muss die Aus-
sage ω ∈ A ∨ ω ∈ B wahr sein weil ω ∈ C und gleichzeitig muss die selbe Aussage
falsch sein, da ω < C 0 . Dies ist aber unmöglich, da eine Aussage nicht gleichzeitig
wahr und falsch sein kann. Da wir dies aber aus der Aussage C , C 0 geschlossen
haben, muss diese falsch sein. u
t
Wir unterscheiden zwischen einem Objekt ω und der Menge {ω} die nur das ein
Element ω enthält. Insbesondere ist die leere Menge nicht gleich der Menge {∅}, die
die leere Menge als Element enthält. So ist auch ∅ ⊂ ∅, aber ∅ < ∅ und ∅ ∈ {∅}.
Beachte, dass Mengen selbst auch Objekte sind. Daher kann man Mengen be-
trachten, deren Elemente Mengen sind. Ein Beispiel die Potenzmenge P(A) einer
Menge A: Ihre Elemente sind alle Mengen B mit der Eigenschaft B ⊆ A.
Im letzten Beispiel habe wir gesehen, dass eine Menge implizit definiert werden
kann durch die Beschreibung der Eigenschaften ihrer Elemente. Dies kann aller-
dings zu logischen Paradoxa führen, wie etwa Russels Paradox von der ’Menge
aller Mengen, die sich nicht selbst enthalten’. Nicht alle Aussagen definieren eine
Menge.
Sehr viele Aussagen betreffen Mengen. So etwa die Aussage ω ∈ A oder A ⊂ B.
Zwei wichtige Typen von Aussagen, die wir später immer wieder brauchen sind:
• ’Für alle Elemente ω einer Menge A ist die Aussage a(ω) wahr’. Wir schreiben
dies als ∀ω∈A a(ω). Sie ist logisch äquivalent zur Aussage ’ω ∈ A ⇒ a(ω)’. Das
Symbol ∀ nennt man den Allquantor.
• ’Es gibt eine Element ω ∈ A für das die Aussage a(ω) wahr ist. Wir schreiben:
∃ω∈A a(ω). Sie kann logisch ausgedrückt werden als: ’¬ (∀ω∈A ¬a(ω))’. ∃ heißt
der Existenzquantor.
Eine weitere fundamentale Operation auf Mengen ist die der Abbildung oder
Funktion. Hierzu benötigen wir den Begriff der Produktmenge.
Definition 1.6. [Karthesisches Produkt] Seien A und B Mengen. Dann ist C = A × B

die Menge aller (geordneten) Paare (a, b) für die a ∈ A und B ∈ B ist. Wir nennen C
die Produktmenge von A und B oder das karthesische Produkt von A und B.
Abb. 1.1 Das karthesische Produkt der Mengen A und B.

1.2 Mengen 5
Abb. 1.2 Die fetten Punkte in A × B bilden eine Funktion f : A → B.
Definition 1.7 (Abbildungen, Funktionen). Seien A und B Mengen. Eine Abbil-

dung oder eine Funktion φ : A → B ist eine Teilmenge der Produktmenge A × B mit
der Eigenschaft, dass für jedes Element a ∈ A genau ein Paar (a, b) mit b ∈ B in φ
vorkommt. Wenn (a, b) ∈ φ, dann schreiben wir auch b = φ(a).
Anmerkung. Dann können wir φ in der Form
φ = ∪a∈A {(a, φ(a))} = {(a, φ(a)), a ∈ A} (1.1)
schreiben.
Wir stellen uns eine Abbildung als eine Liste vor, in der jedem Element von A
ein Element von B zugeordnet ist.
Definition 1.8 (surjektiv, injektiv, bijektiv). Eine Abbildung φ : A → B heißt:

(i) surjektiv, wenn für jedes b ∈ B ein a ∈ A existiert, so dass (a, b) ∈ φ;
(ii) injektiv, wenn für jedes b ∈ B höchstens ein a in A existiert, so dass (a, b) ∈ φ.
(iii) bijektiv, wenn für jedes b ∈ B genau ein a in A existiert, so dass (a, b) ∈ φ.
Die Menge A nennt man auch Definitionsbereich der Funktion φ. Die Menge der
b ∈ B, so dass ein a ∈ A existiert, so dass (a, b) ∈ φ nennen wir das Bild von φ. Wir
schreiben für das Bild von φ auch Im(φ) oder φ(A).
Alternativ können wir uns eine Abbildung auch als einen Graphen vorstellen.
Von jedem Element in A geht genau ein Pfeil zu einem Element in B. Bei einer
surjektiven Abbildung ist jedes Element von B auch Ziel eines Pfeils, bei einer in-
jektiven Abbildung endet in jedem Element von B höchsten ein Pfeil und bei einer
bijektiven Abbildung endet in jedem Element von B genau ein Pfeil.
Abb. 1.3 Verschiedene Typen von Funktionen als Graphen dargestellt
Es ist nützlich den Begriff der Zusammensetzung oder Hintereinanderausführung

von Funktionen einzuführen.
Definition 1.9 (Komposition). Seien A, B,C Mengen und seien f : A → B und g :

B → C Abbildungen, wobei f surjektiv ist. Dann ist g ◦ f die Abbildung von A → C
die gegeben ist durch
g ◦ f = {(a, c) ∈ A × C : ∃b∈B : (a, b) ∈ f ∧ (b, c) ∈ g} (1.2)
Wir können uns g ◦ f auch vorstellen als die Menge
{(a, g( f (a)), a ∈ A}. (1.3)
Anmerkung. Die Bedingung, dass f surjektiv ist kann man in der Definition der
Komposition auch weglassen. Allerdings ist dann h ohnehin nur von der Ein-
schränkung der Funktion g auf den Bildbereich von f abhängig.
Ein weiterer wichtiger Begriff ist der der Äquivalenzrelation und der Äquivalenz-
klassen.
1.2 Mengen 7
Abb. 1.4 Hintereinanderausführung von zwei Funktionen als Graphen
Definition 1.10 (Äquivalenzrelation). Sei A eine Menge. Dann heißt eine Teilmen-
ge E ⊂ A × A eine Äquivalenzrelation, genau dann wenn gilt:
(i) ∀a ∈ A : (a, a) ∈ E;
(ii) (a, b) ∈ E ⇒ (b, a) ∈ E:
(iii) ((a, b) ∈ E ∧ (b, c) ∈ E) ⇒ (a, c) ∈ E.
Anstatt (a, b) ∈ E schreibt man oft auch a ∼ b.
Definition 1.11 (Äquivalenzklasse). Sei A eine Menge und E eine Äquivalenz-
relation. Sei a ∈ A. Dann heißt die Menge
[a] = {b ∈ A : (a, b) ∈ E} (1.4)
die Äquivalenzklasse von a.
Lemma 1.12 (Partition). Sei A eine nicht leere Menge und E eine Äquivalenz-
relation. Seien a ∈ A und b ∈ A. Dann gilt
([a] = [b]) XOR ([a] ∩ [b] = ∅). (1.5)

Es gilt auch ∪a∈A [a] = A. Die zweite Aussage überlassen wir dem Leser.
Beweis. Falls [a] , [b], aber [a] ∩ [b] , ∅. Dann existiert c ∈ [a], so dass c ∈ [b]. Aus
der Eigenschaft (iii) folgt dann aber, dass (a, c) ∈ E und (b, c) ∈ E, also (b, a) ∈ E.
Mithin folgt [a] = [b]. ut
Die Äquivalenzklassen einer Menge bezüglich einer Äquivalenzrelation stellen
eine Zerlegung der Menge in disjunkte Untermengen dar. Eine solche Zerlegung
nennt man auch Partition.
Abb. 1.5 Zerlegung einer Menge A in Äquivalenzklassen.
Man kann auch umgekehrt vorgehen. Wenn wir eine Partition einer Menge ge-
geben haben, so können wir eine Äquivalenzrelation dadurch definieren, dass zwei
Elemente, die in der selben Teilmenge liegen, als äquivalent bezeichnet werden.
Wir werden sehr bald sehen, dass das Konzept der Äquivalenzklassen von absolut
zentraler Bedeutung in der Analysis ist.
1.3 Zahlen
Der Begriff der Zahlen ist zunächst intuitiv durch das Abzählen von Objekten ver-
stehbar. Es wäre nicht schwierig, endlich viele Zahlen einfach hinzuschreiben. Zum
Beispiel könnten wird die Menge der Zahlen von 1 bis 10 hinschreiben als
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. (1.6)

1.3 Zahlen 9
Damit sind wie aber nicht zufrieden.
1.3.1 Die natürlichen Zahlen
Definition 1.13 (Peano Axiome). Eine Menge N heißt die Menge der natürlichen
Zahlen, wenn folgendes gilt:
(i) 1 ∈ N.
(ii) Es gibt eine injektive Abbildung φ : N → N so, dass
(iia) Für alle n ∈ N ist φ(n) , n;
(iib) Für alle n ∈ N gilt (n, 1) < φ.
(iii) Die Menge N ist minimal, d.h. jede Teilmenge von N, die die Eigenschaften
(i), (ii) (mit der gleichen Abbildung φ eingeschränkt auf diese Teilmenge) erfüllt
ist gleich N.
Anmerkung. Man nennt die Bedingungen, die in der Definition von N aufgestellt
sind, oft Peano Axiome. Streng genommen sind dies aber keine Axiome, sondern
definierende Eigenschaften. Das eigentliche Axiom formulieren wir unten.
Anmerkung. Die Eigenschaft (iia) kann man aus der Injektivität und der Minima-
litätsforderung (iii) herleiten.
Die Forderungen in den Peano Axiomen sind gut gewählt. Wenn wir einzelne
Forderungen weglassen, so könnten wir seltsame Zahlensysteme konstruieren.
Beispiel 1.14. Wenn wir die Forderung (iia) fallenlassen (und die Injektivität), so
könnten wir wählen: N = {1, 2, 3, V} mit φ(1) = 2, φ(2) = 3, φ(3) = V, φ(V) = V. Das
wären dann Zahlen für Leute, die nur bis 3 zählen können. Alles was danach kommt,
heißt einfach V (viele).
Beispiel 1.15. Wenn wir die Bedingung (iib) fallen lassen, so könnten wir wählen
N = {1, 2, 3} und φ(1) = 2, φ(2) = 3, φ(3) = 1. Das wären also zyklische Zahlen.
Beispiel 1.16. Wenn wir die Bedingung (iii) fallen lassen, könnten wir N so wählen,
dass es Zahlen gibt, die nicht durch sukzessive Anwendung der Abbildung φ auf die
1 erhalten werden können. Diese brauchen wir zunächst nicht.
Wir werden φ(n) den Nachfolger von n nennen. Umgekehrt nennen wir n den
Vorgänger von φ(n). Wir sehen, dass jede natürliche Zahl einen Nachfolger hat, und
jede natürliche Zahl außer der 1 einen Vorgänger hat.
Wir haben nun also eine Menge N beschrieben, die gewisse Eigenschaften haben
soll. Die erste Frage ist, ob es diese Menge gibt.
Lemma 1.17. Es gibt keine endliche Menge, die die Eigenschaften der Menge N
hat.
Beweis. Angenommen, N wäre endlich, sagen wir N habe N + 1 Elemente. Da 1

nicht im Bild von φ liegt, hat das Bild von φ höchstens N Elemente. Andererseits
ist φ injektiv, was erfordert, dass das Bild genau so viele Elemente hat wie der
Definitionsbereich. Daher kann N nicht endlich sein. u t
Da N also nicht endlich ist, können wir die Existenz dieser Menge nicht durch ex-
plizites Aufschreiben beweisen, so wie in den Beispielen endlicher Zahlensysteme
oben.
Wir müssen daher ihre Existenz als Axiom, also als eine als wahr festgesetzte
Aussage postulieren.
Axiom 1.18 Die Aussage ’Die Menge N existiert’ ist wahr.
Das nächste Lemma macht die Beobachtung, dass die Abbildung φ auf N keine
geschlossenen Zykeln bildet
Lemma 1.19. Sei n ∈ N. Dann ist φ(φ(n)) , n und ebenso für jede endliche Iteration
der Abbildung φ(φ(. . . (φ(n) . . . ))) , n.
Beweis. Wir betrachten zunächst den ersten Fall. Wir wissen, dass φ(n) = k ∈ N ist
und k , n. Also ist φ(n) = k und φ(k) = n. Da φ injektiv ist, gibt es keine andere
Zahl m ∈ N, so dass φ(m) = k oder φ(m) = n. Wenn nun N die Peano Axiome (i) und
(ii) erfüllt, so tut dies auch N\{k, n}, denn weder k noch n können 1 sein (Bedin-
gung (iib)), an der Eigenschaft (iia) sowie an der Injektivität ändert sich durch das
Entfernen vom k und n nichts. Schließlich ist das Bild von N\{k, n} in N\{k, n}, also
φ : N\{k, n} → N\{k, n}. Damit haben wir einen Widerspruch zu Bedingung (iii). Der
Fall, dass der m-te Nachfolger von n gleich n ist, kann ganz analog ausgeschlossen
werden. u t
Nachdem wir die Existenz der natürlichen Zahlen postuliert haben, könnte es
mehrere Mengen geben, die diese Eigenschaften haben. Hätten wir die Forderung
(iia) weggelassen, könnten wir z.B. {1, 2, 3, V} aber auch {1, 2, 3, 4, 5, V} als Zahl-
system wählen. Im Fall der natürlichen Zahlen können wir aber zeigen, dass alle
Mengen, die die Eigenschaften der natürlichen Zahlen haben, gleich aussehen.
Satz 1.20. Wenn zwei Mengen und Abbildungen (N, φ), (N0 , φ0 ) existieren, die die
Eigenschaften der Definition 1.13 erfüllen, dann gibt es eine bijektive Abbildung
b : N → N0 so, dass
(i) b(1) = 1,
(ii) Für alle n ∈ N gilt b(φ(n)) = φ0 (b(n)).
Beweis. Wir beweisen, dass die Eigenschaften (i) und (ii) b bereits vollständig
festlegen. Zunächst können wir (i) stets festlegen. Dann definieren wir b(φ(1)) =
φ0 (b(1)) = φ0 (1). Nun verwenden wir die vollständige Induktion. Wenn wir b(n)
kennen, so ist b(φ(n)) durch (ii) bestimmt. Damit ist b für alle n ∈ N bestimmt.
Also existiert eine Abbildung b : N → N0 . Als nächstes zeigen wir, dass b surjektiv
ist. Dazu müssen wir nachweisen, dass jedes n0 ∈ N0 im Bild von b liegt. Wieder
1.3 Zahlen 11
Abb. 1.6 Die natürlichen Zahlen plus ein extra Zykel von φ.
verwenden wir vollständige Induktion. Zunächst liegt 1 im Bild wegen (i). Nehmen
wir an, dass n0 im Bild von b liegt. Dann gibt es ein n ∈ N, so dass b(n) = n0 . Wegen
(ii), φ0 (n0 ) = φ0 (b(n)) = b(φ(n)), also liegt φ0 (n0 ) im BIld von b. Damit folgt dass alle
n0 ∈ N0 im Bild von b liegen. Schliesslich bleibt zu zeigen, dass b injektiv ist. Wir
müssen zeigen, dass für alle m , n, b(m) , b(n). Sei dazu ohne Beschränkung der
Allgemeinheit m > n. Zunächst ist wegen (ii), b(n + 1) = b(φ(n)) = φ0 (b(n)) > b(n).
Sei für k ∈ N b(n + k) > b(n). Dann ist b(φ(n + k)) = φ0 (b(n + k)) > b(n + k) > b(n).
Also ist für alle k ∈ N, b(n + k) , b(n). Somit ist b injektiv. Also ist b bijektiv. u t
Die beschriebene Definition der natürlichen Zahlen geht auf Peano [5] zurück.
Die Abbildung φ führt eine Ordnung auf der Menge N ein. Die Zahl m heißt
Nachfolger von n, falls (n, m) ∈ φ. Umgekehrt heißt n der Vorgänger von m. Jede
natürliche Zahl hat einen Nachfolger und jede, außer der 1, hat einen Vorgänger.
Definition 1.21 (Ordnung). Seien n, m ∈ N. Dann sagen wir m > n, falls
(i) m = φ(n), oder
(ii) Es gibt eine Zahl ` > n, so dass m = φ(`).
Wir schreiben m < n, wenn n > m. Wir schreiben auch (m ≤ n) ⇔ (m < n) ∨ (m = n)
und (m ≥ n) ⇔ (m > n) ∨ (m = n)
Die Definition sieht etwas seltsam aus, ist aber nachprüfbar. Folgendes einfache
Lemma macht das schon deutlicher.
Lemma 1.22. Eine Zahl m ist grösser als n (m > n), genau dann, wenn entweder
m = φ(n) oder es ein k ∈ N und eine Teilmenge {m1 , . . . , mk } von Elementen von N
gibt, so dass (n, m1 ), (m1 , m2 ), . . . , (mk , m) alle in φ sind.
Beweis. Die eine Richtung ist einfach. Wenn m = φ(n), ist m > n nach Punkt (i). Falls
es die besagte Menge {m1 , . . . , mk } gibt, so ist m1 > n, wegen (ii) dann m2 > m und
so weiter, bis schliesslich n > m. Die Gegenrichtung erhalten wir durch sukzessive
Fallunterscheidungen. Wir wissen, dass m > n. Wenn dies der Fall ist, weil m = φ(n),
dann sind wir in der ersten Alternative. Ansonsten wissen wir, dass es ein `1 > n gibt,
so dass m = φ(`1 ). Also ist (`1 , m) ∈ φ. Da `1 > n, ist entweder `1 = φ(n), oder es gibt
`2 > n, so dass `1 = φ(`2 ). Im ersteren Fall ist k = 1 und unsere Menge {m1 } = {`1 }.
Im anderen Fall iterieren wir: Falls `2 = φ(n), ist die gesuchte Menge {`2 , `1 }, sonst
gibt es `3 > n, so dass `2 = φ(`3 ). Dann ist die gesuchte Menge entweder {`3 , `2 , `1 },
oder es gibt `4 > n, so dass `3 = φ(`4 ), etc. Diese Iteration muss nach endlich vielen
Schritten abbrechen. u t
Lemma 1.23 (Ordnung von N). Wenn m, n ∈ N, dann ist entweder m = n, m > n,
oder n > m.
Beweis. Wir nehmen an, dass m , n und m nicht größer als n ist. Wir wollen zei-
gen, dass dann n größer als m ist. Dazu betrachten wir die Ketten von Vorfahren
von m und n. Wegen Bedingung (iv) müssen diese jeweils in der 1 enden. Denn
keine Vorfahrenkette kann in einer anderen Zahl als der 1 enden, wegen Lemma
1.19. Denn gäbe es eine zweite solche Zahl, sagen wir 2, dann würden sowohl die
Menge aller Nachfolger der 1 als auch die der 2 die Eigenschaften (i)-(iii) erfüllen,
so dass wir wegen (iv) die Nachfolger der 2 aus den natürlichen Zahlen entfernen
müssten. Gleiches gälte, wenn es eine Zahl gäbe, deren Vorfahrenkette nicht ab-
bricht. Dann wäre die Menge der Nachfolger und Vorfahren dieser Zahl disjunkt
zu den Nachfolgern der 1 und müsste ausgesondert werden. Damit aber enden die
Vorfahrensketten von n und von m in der 1. Die Vorfahrensketten von m und von
n müssen sich also schneiden. Angenommen, dies passiert in einem Punkt k. Dann
sind aber die Nachfolger von k identisch (da φ eine Abbildung ist, und wenn φ(k) in
beiden Vorfahrensketten enthalten ist, so haben sich diese schon in φ(k) getroffen).
Damit bleibt als Treffpunkt nur m oder n möglich. Dann ist aber entweder m > n
oder n > m. u t
Die Definition der natürlichen Zahlen gibt uns die Methode der vollständigen
Induktion als Beweisverfahren an die Hand.
Satz 1.24 (Vollständige Induktion). Für jedes n ∈ N sei a(n) eine Aussage (genau-
er können wir a als eine Abbildung von N in die Menge aller Aussagen betrachten).
Es gelte
(i) a(1) ist wahr und
(ii) wenn a(n) wahr ist, dann ist auch a(φ(n)) wahr.
Dann ist a(n) für alle n ∈ N wahr.
Beweis. Angenommen es gäbe ein n ∈ N so dass a(n) falsch ist. Dann muss a(k)
auch falsch sein, wenn (k, n) ∈ φ. Dieses Argument wiederholen wir endlich oft und
gelangen damit zu der Aussage, dass a(1) falsch ist, im Widerspruch zu (1). ut
1.3 Zahlen 13
Anmerkung. Alternativ kann man die Aussage auch beweisen indem am zeigt, dass
{n ∈ N|a(n)} = N.
Nun ist die linke Menge nach Definition in N enthalten. Nun überprüft man das sie
die Peano Axiome (i) (da a(1) nach Annahme war) und (ii) (da die Einschränkung
von φ auf diese Menge sinn ergibt, nach Teil (ii) der Annahme oben) erfüllt. Damit
folgt aufgrund der Minimalität von N die obige Gleichheit.
Anmerkung. Die Forderung (iii) in Definition 1.13 ist wesentlich für die Gültigkeit
von Theorem 1.24. Ansonsten könnte es in N Zahlen geben, die nicht als iteriertes
Bild der 1 erhalten werden können. Umgekehrt kann Theorem 1.24 die Forderung
(iii) ersetzen.
Anmerkung. Man beachte, dass im Beweis nur endliche viele Schritte (für jedes ge-
gebene n) ausgeführt werden müssen. Der Satz liefert dann aber die eine Richtigkeit
von unendlich vielen Aussagen.
Wir haben die Menge N strukturell definiert und dann ihre Existenz postuliert.
Wir können Elemente von N symbolisch darstellen, indem wir die Elemente von φ
schreiben als (n, n + 1). D.h.,
N = {1, 1 + 1, 1 + 1 + 1, 1 + 1 + 1 + 1, . . . }. (1.7)
Es stehen hier nur die ersten paar Elemente von N, mit den Pünktchen deuten wir
formal an, dass das immer so weitergehen soll. Vollständiges aufschreiben der Men-
ge geht eben nicht. Natürlich sind diese Namen sehr unpraktisch und wir benutzen
Abkürzungen, wie etwa 1 + 1 = 2, die mit weniger Platz auskommen. Wir kommen
darauf aber erst später zurück.
Die oben eingeführte Schreibweise erlaubt es in einfacher symbolischer Form
die Addition natürlicher Zahlen zu definieren.
Lemma 1.25 (Addition). Es gibt eine eindeutige Abbildung, + , genannt Addition,

von N × N → N so dass für alle n, m ∈ N gilt:
n + 1 = φ(n), n + φ(m) = φ(n + m). (1.8)
Anmerkung. Die Benutzung des Symbols + ist eine ähnliche Abkürzung wie ∼
bei Äquivalenzrelationen. Eigentlich müssten wir eine Abbildung f + : N × N →
N einführen. Dies wäre die Teilmenge von (N × N) × N, die aus den Trippeln
((n, m), n + m) besteht. Die definierenden Relationen (1.8) lauten dann
((n, 1), m) ∈ f + ⇔ (n, m) ∈ φ, ((n, φ(m)), k) ∈ f + ⇔ ( f + (n, m), k) ∈ φ. (1.9)
Beweis. Wir können hier gleich die vollständige Induktion zur Anwendung bringen.
Wir müssen zeigen, dass die Operation n+m eindeutig durch unsere Regel bestimmt
ist. Zunächst wissen wir, dass für jedes n ∈ N die Aussage ’n + 1 ist eindeutig be-
stimmt’ wahr ist, da n + 1 = φ(n). Ausserdem wissen wir, dass für alle n, m ∈ N die
Aussage ’wenn n + m bestimmt ist, dann ist auch n + φ(m) bestimmt”wahr, da ja

n + φ(m) = φ(n + m). Damit folgt die Aussage des Lemmas aus Satz 1.24. u
t
Man beachte dass die Addition mit der Notation (1.7) kompatibel ist. Sie sieht in
dieser Notation sogar fast tautologisch aus. Etwa
1+1+1+1 + 1+1 = 1+1+1+1+1+1
Im folgenden geben wir einige elementare Eigenschaften der Addition an.
Lemma 1.26 (Kommutativität und Assoziativität). Die Addition hat folgende Ei-
genschaften:
(i) Für alle n, m, k ∈ N gilt (n + m) + k = n + (m + k).
(ii) Für alle n, m ∈ N gilt n + m = m + n;
Anmerkung. Die Eigenschaft (i) nennt man Kommutatitvität, die Eigenschaft (ii)
nennt man Assoziativität.
Beweis. Die Beweise beruhen auf vollständiger Induktion. Um (i) zu zeigen, zeigen
wir zunächst, dass für alle n, m ∈ N, (n+m)+1 = n+(m+1). Nun ist aber (n+m)+1 =
φ(n + m) und n + (m + 1) = n + φ(m) = φ(n + m), wegen (1.8). Wir beweisen nun den
Induktionsschritt: Wenn für alle n, m ∈ N und ein k ∈ N (i) gilt, dann gilt auch (n +
m) + φ(k) = n + (m + φ(k)). Es ist nämlich wegen (1.8) (n + m) + φ(k) = φ((n + m) + k)
und n + (m + φ(k)) = n + φ(m + k) = φ(n + (m + k)) Aufgrund der Induktionsannahme
sind diese Ausdrücke aber gleich.
Um (ii) zu zeigen, zeigen wir zunächst, dass für alle n ∈ N, n + 1 = 1 + n. Für n = 1
is die Aussage trivialerweise wahr. Weiter gilt für alle n ∈ N, ’wenn n + 1 = 1 + n,
dann ist φ(n) + 1 = 1 + φ(n)’. Wir wissen nämlich, das
φ(n) + 1 = (n + 1) + 1 = (1 + n) + 1 = φ(1 + n) = 1 + φ(n), (1.10)
wo wir im letzten Schritt (1.8) verwendet haben. Damit folgt aus Theorem 1.24, dass
n+1 = 1+n für alle n ∈ N. Diese Erkenntnis benutzen wir nun als Induktionsvorraus-
setzung im Beweis von (i). Es bleibt zu zeigen, dass die Aussage ’wenn n+m = m+n
für alle n ∈ N wahr ist, dann ist n + φ(m) = φ(m) + n für alle n ∈ N wahr. Dies folgt
aber wieder leicht aus (1.8) und der Assozitivität. Es ist nämlich n + φ(m) = φ(n + m)
und φ(m) + n = (m + 1) + n = m + (1 + n) = m + φ(n) = φ(m + n) = φ(n + m). u t
Hier beginnt sich eine algebraische Struktur abzuzeichnen.
Definition 1.27 (Halbgruppe). Eine Menge H mit einer Abbildung + : H × H → H

heißt eine Halbgruppe genau dann, wenn für alle a, b, c ∈ H gilt
(a + b) + c = a + (b + c). (1.11)
Eine Halbgruppe heißt kommutativ oder abelsch, wenn für alle a, b ∈ H gilt
a + b = b + a. (1.12)
1.3 Zahlen 15
Wir haben also gezeigt:

Lemma 1.28. Die natürlichen Zahlen mit der Operation + bilden eine kommutative
Halbgruppe.
1.3.2 Die ganzen Zahlen
Wir würden unsere Zahlen gerne zu einer vollen Gruppe aufwerten.

Definition 1.29 (Gruppe). Eine Menge G mit einer Abbildung + : G ×G → G heißt
Gruppe, genau dann wenn folgende Eigenschaften gelten:
(i) Es existiert ein Element e ∈ G, so dass für alle g ∈ G gilt: e + g = g + e = g
[Neutrales Element];
(ii) Es gilt für alle g, h, k ∈ G, dass (g + h) + k = g + (h + k) [Assoziativität];
(iii) Für jedes g ∈ G existiert ein Element g− ∈ G, so dass g+g− = g− +g = e [inverses
Element].
Ein Gruppe heißt kommutativ oder Abelsch, wenn für alle g, h ∈ G, g + h = h + g.
Um aus den natürlichen Zahlen eine Gruppe zu machen, brauchen wir also noch
die Existenz eines neutralen Elements, also einer Zahl 0, so dass für alle n ∈ N,
n + 0 = n und 0 + n = n, sowie ein inverses Element (−n) für jedes Element n ∈ N,
so dass n + (−n) = 0. Solche Elemente gibt es bislang nicht. Wir werden diese daher
zusätzlich einführen und so eine größere Menge von Zahlen, die ganzen Zahlen,
bezeichnet mit Z, konstruieren.
Anmerkung. Wir hätten die 0 auch statt der 1 direkt in den natürlichen Zahlen
einführen können, und viele Autoren tun dies auch. Allerdings bräuchte man dann
einen symbolischen Namen für die Zahl φ(0), oder man müsste φ(0) + φ(0) + . . . φ(0)
für eine natürliche Zahl schreiben, was ich hässlich finde.... Wir bezeichnen die
Menge N ∪ {0} mit N0 . Wir schreiben auch N = Z+ .
Definition 1.30 (Ganze Zahlen). Wir bezeichnen mit N− die Menge N− = {−n : n ∈
N} und setzen
Z ≡ N− ∪ {0} ∪ N. (1.13)
Wir definieren auf Z die Abbildung − : Z → Z durch:
(i) Für n ∈ N is −(n) = −n ∈ N− ;
(ii) −0 = 0;
(iii) Für −n ∈ N− ist −(−n) = n.
Die Abbildung φ aus der Definition der natürlichen Zahlen erweitern wir auf ganz
Z indem wir setzen
φ(0) = 1, und für alle n ∈ N ∪ {0}, φ(−φ(n)) = −n. (1.14)

Wir können auf Z die Addition definieren wie folgt.

Definition 1.31 (Addition). Die Abbildung + : Z × Z → Z ist definiert durch die
Forderungen:
(i) Die Additionsregeln aus Lemma 1.25 auf alle Zahlen in Z;
(ii) z + 0 = 0 + z = z, für alle z ∈ Z;
(iii) Es gilt für alle z, z0 ∈ Z
− (z + z0 ) = −z + (−z0 ). (1.15)
Wie im Fall der natürlichen Zahlen ist die Addition eindeutig definiert und erfüllt
die Addition das Assoziativgesetz und ist kommutativ:
Lemma 1.32. Die in Definition 1.31 definierte Abbildung + ist eindeutig definiert,
erfüllt das Assoziativgesetz und ist kommutativ.
Beweis. Der Beweis is völlig analog zu dem für die natürlichen Zahlen und wird als
Übung gestellt. [Übung!]. u
t
Als Zugewinn erhalten wir die Existenz eines neutralen Elements und eines in-
versen Elements.
Lemma 1.33. Für alle z ∈ Z gilt
z + (−z) = (−z) + z = 0. (1.16)
Beweis. Wir könnten auch dieses Lemma durch vollstängige Induktion beweisen.
[Übung!] Es geht aber auch einfacher. Wegen (1.15) und der Kommutativität gilt
− (z + (−z)) = −z + (−(−z)) = −z + z = z + (−z). (1.17)
D.h. wenn wir x = z + (−z) setzen, so haben wir −x = x. Die einzige Ganze Zahl, die
dies erfüllt ist nach Definition 1.30 aber die 0. Also ist x = 0. Wegen der Kommuta-
tivität ist die erste Gleichung in (1.17) richtig. u
t
Wir schreiben auch z1 + (−z2 ) = z1 − z2 .
Lemma 1.34. Die ganzen Zahlen Z bilden eine kommutative Gruppe bezüglich der
Addition.
Wir haben im Vorhergehenden gesehen, wie wir die Addition durch Iteration der
Addition von 1 konstruieren konnten. Wir können nun eine weitere Struktur auf den
ganzen Zahlen einführen, indem wir die Addition beliebiger Zahlen iterieren.
Definition 1.35 (Multiplikation). Die folgenden Regeln definieren eine Abbildung

? : Z × Z → Z:
(i) Für alle z ∈ Z ist z ? 0 = 0 ? z = 0.
(ii) Für alle z ∈ Z ist z ? 1 = 1 ? z = z.
1.3 Zahlen 17
Abb. 1.7 Die ganzen Zahlen und die Wirkung von φ.
(iii) Für alle n, m ∈ N gilt n ? φ(m) = (n ? m) + n.

(iv) Für alle n, m ∈ N gilt n ? (−m) = (−n) ? m = −(n ? m) und (−n) ? (−m) = n ? m.
Die Operation ? heißt Multiplikation.
Wir haben nun auf den ganzen Zahlen zwei Operationen, nämlich + und ?. Dies
führt zu einer neuen algebraischen Struktur.
Definition 1.36 (Ring). Eine Menge R mit zwei Operationen + : R × R → R und

? : R × R → R heiß ein Ring, wenn folgendes gilt:
(i) (R, +) ist eine kommutative Gruppe.
(ii) (R, ?) ist eine Halbgruppe.
(iii) Es existiert ein neutrales Element, 1, bezüglich der Operation ?.
(iv) Es gelten die Distributivgesetze: Für alle a, b, c ∈ R gilt
(a + b) ? c = (a ? c) + (b ? c) und c ? (a + b) = (c ? a) + (c ? b). (1.18)
Lemma 1.37 (Ring der ganzen Zahlen). Die ganzen Zahlen bilden mit der Ope-
ration ? eine kommutative Halbgruppe mit neutralem Element 1. Bezüglich der
Operationen (+, ?) bilden sie einen Ring.
Beweis. Die Gruppeneigenschaft bezüglich der Addition haben wir schon gezeigt.
Wir müssen noch zeigen, dass bezüglich der Multiplikation eine kommutative Halb-
gruppe vorliegt, und dass das Distributivgesetz gilt, also z ? (z1 + z2 ) = (z ? z1 ) + (z ?
z2 ) gilt. Wir zeigen zunächst:
Für alls m, n ∈ N gilt m ? n = n ? m. Dazu zeigen wir im ersten Schritt, dass für alle
n, m,
φ(m) ? n = m ? n + n. (1.19)
Wir beweisen dies durch Induktion über n. Für n = 1 gilt die Aussage, da wegen (ii)
φ(m) ? 1 = φ(m) = m + 1. Wenn die Aussage für n gilt, dann gilt sie auch für φ(n),
denn wegen (iii) und (1.19),
φ(m) ? φ(n) = φ(m) ? n + φ(m) = m ? n + n + φ(m)

= m ? n + m + n + 1 = m ? n + m + φ(n)
= m ? φ(n) + φ(n), (1.20)
Als nächstes zeigt man leicht durch Induktion, dass n?1 = 1?n für alle n ∈ N. Daher
folgt die Behauptung, wenn wir aus m?n = n?m herleiten, dass m?φ(n) = φ(n)?m.
Es ist aber wegen (iii) und (1.19)
m ? φ(n) = m ? n + m = n ? m + m = φ(n) ? m, (1.21)
und damit die Behauptung.

Die Beweise der anderen Eigenschaften sind alle sehr ähnlich und werden als
Übungen gestellt. u
t
Anmerkung. Wir werden ab sofort die übliche Konvention benutzen, dass Klam-
mern um Multiplikationen weggelassen werden können. Das heißt, ein Ausdruck
a ? b + c ist immer als (a ? b) + c zu lesen.
Für spätere Zwecke führen wir hier schon einmal die Potenz ein.
Definition 1.38 (Potenzen). Sei n ∈ N ∪ {0} und z ∈ Z. Dann definieren wie die Ope-
ration zn durch folgende Eigenschaften:
(i) z0 = 1;
(ii) Für alle n ∈ N ∪ {0} gilt zφ(n) = zn ? z.
Man überzeugt sich leicht (durch vollständige Induktion), dass zn eindeutig de-
finiert ist. Man kann durch vollständige Induktion zeigen, dass für alle m, n ∈ N,
zm+n = zm zn gilt.
1.3.3 Die rationalen Zahlen
Wieder fehlen den ganzen Zahlen inverse Elemente bezüglich der Multiplikation.
Wenn wir diese hinzufügen, erhalten wir einen Körper, den Körper der rationalen
Zahlen.
Definition 1.39. Die Menge der Objekte der Form q = nz , mit n ∈ N und z ∈ Z heißt
die Menge aller Brüche. Wir definieren
1.3 Zahlen 19
(i) Für jedes n ∈ N gilt

1 1
n? = ? n = 1. (1.22)
n n
(ii) Für z ∈ Z und n ∈ N, ist
1 1 z
z? = ?z = . (1.23)
n n n
a
Anmerkung. Wir schreiben statt b auch a/b.
Wir müssen nun zunächst die Multiplikation dieser neuen Zahlen mit ganzen
Zahlen definieren.
z1 z2
Definition 1.40. Seinen nz , n1 , n2 Brüche. Dann definieren wir
(o) − nz = −z
n .
(i)
z1 z2 z1 ? z2
? = . (1.24)
n1 n2 n1 ? n2
(ii)
z1 z2 z1 ? n2 + z2 ? n1
+ = . (1.25)
n1 n2 n1 ? n2
z
Anmerkung. Wir können jede ganze Zahl z mit dem Bruch 1 identifizieren.
Lemma 1.41. Addition und Multiplikation von Brüchen sind Kommutativ und erfüllen
jeweils das Assoziativgesetz sowie das Distributivgesetz. Falls z , 0, so gibt es für
jeden Bruch nz einen Bruch, der das inverse Element bezüglich der Addition ist. Falls
z > 0 ist, so ist dies nz , falls z < 0, so ist es −n
−z .
Beweis. Übung.
In natürlicher Weise sagen wir, ein Bruch q = nz sei positiv (q > 0), respektive
negativ (q < 0), wenn z > 0 respektive z < 0 ist. Mit der Regel für die Addition von
Brüchen folgt dann:
y
Lemma 1.42. Seien q = nz und p = m Brüche. Dann ist q > p wenn z ? m > y ? n.
Falls q > p sagen wir p < q.
Beweis. q > p soll bedeuten, dass q − p > 0. Nach der Regel (1.25) ist aber
z −y z ? m − y ? n
q − p = q + (−p) = + = . (1.26)
n m n?m
Die rechte Seite ist positiv, wenn z ? m > y ? n. t
u
Wenn weder p > q noch q > p liegt es nahe zu sagen, dass p = q.

y
Definition 1.43. Zwei Brüche q = z
n und p = m sind gleich, p = q, genau dann wenn
z ? m = y ? n.
Mit dieser Definition sind nun aber viele Brüche gleich. Dies liegt daran, dass
wir gesagt haben, dass für jedes n ∈ N, nn = 1, d.h. mittels unserer neuen Symbole
gibt es unendlich viele Möglichkeiten, die 1 darzustellen. Daraus folgt weiter, dass
für alle z ∈ Z, n, n0 ∈ N, gilt
z ? n0 z n0 z z
= ? = ?1 = . (1.27)
n ? n0 n n0 n n
Wir sehen, dass z ? n0 ? n = z ? n ? n0 , also unsere Definition von = gerade richtig
ist.
Wir müssen also zwischen dem Symbol nz und der Zahl, die dieser Bruch re-
präsentiert unterscheiden. Auf der Ebene der Brüche als Symbole ist die Relation =
aus Definition 1.43 eine Äquivalenzrelation.
Lemma 1.44. Die Relation = in Definition 1.43 ist eine Äquivalenzrelation auf der
Menge der Brüche.
Beweis. Übung. t
u
Was wir damit sagen wollen, ist, dass wenn zwei Brüche = sind, sie dieselbe Zahl
darstellen. So sind etwa 21 und 63 verschiedenen Brüche, stellen aber die gleiche Zahl
dar.
Dies ist die Grundidee hinter der folgenden Definition der rationalen Zahlen.
Definition 1.45 (Rationale Zahlen). Die Menge der Äquivalenzklassen der Menge
der Brüche
z
{ : z ∈ Z, n ∈ N}, (1.28)
n
unter der Äquivalenzrelation = heißt die Menge der rationalen Zahlen, bezeichnet
mit Q.
Wir können aus jeder Äquivalenzklasse einen eindeutigen Repräsentanten aus-
wählen. Jede Äquivalenzklasse enthält nämlich genau ein Element, nz , so dass es
kein z0 ∈ Z, n0 ∈ N und k ∈ N\{1} gibt, so dass
z = z0 ? k, n = n0 ? k. (1.29)
Brüche mit dieser Eigenschaft heißen teilerfremd (umgangsprachlich gekürzt). Die

Menge der rationalen Zahlen kann daher auch als die Menge aller teilerfremden
Brüche definiert werden. Allerdings sind dann die Rechenoperationen komplizierter
anzugeben.
Wir müssen nun noch nachprüfen, dass die Rechenoperationen sowie die Ord-
nung der Brüche mit der Definition = kompatibel sind.
Zunächst ist die Eigenschaft > eine Eigenschaft von Äquivalenzklassen. Es gilt
nämlich:
Lemma 1.46. Es seinen q, q0 und p, p0 Brüche mit der Eigenschaft p = p0 und q = q0
(wo = im Sinn von Definition 1.43 verstanden ist). Dann gilt, dass q0 > p0 genau
dann wenn q > p.
1.3 Zahlen 21
Beweis. Der Beweis erfolgt durch einfaches Nachrechnen. t

u
Lemma 1.47. Sowohl Addition wie Multiplikation sind kompatibel mit der Äquivalenz-
z0 z0
relation =, also wenn nz11 = n10 und nz22 = n20 , dann sind
1 2
z1 z2 z01 z02
+ = + , (1.30)
n1 n2 n01 n02
und
z1 z2 z01 z02
? = ? . (1.31)
n1 n2 n01 n02
Beweis. (Überprüfen Sie das!) t
u
Damit kann man nachprüfen, dass Q bezüglich (+, ?) ein Körper ist. Wir erinnern
uns aus der linearen Algebra:
Definition 1.48. Eine Menge F mit zwei Abbildungen, +, ?, jeweils von F × F → F,
heißt ein Körper, genau dann, wenn:
(i) (F, +) ist eine kommutative Gruppe;
(ii) (F, ?) erfüllt alle Eigenschaften einer kommutative Gruppe, außer, dass das
neutrale Element der Operation + kein inverses Element besitzt:
(iii) Das Distributivgesetz, gilt, d.h. für alle f, g, h ∈ G gilt
f ? (g + h) = f ? g + f ? h (1.32)
Satz 1.49 (Körper der rationalen Zahlen). Die rationalen Zahlen bilden bezüglich
der Abbildungen, +, ? einen kommutativen Körper.
Darüber hinaus gilt, dass Q genau wie die ganzen Zahlen geordnet ist, also für
alle q, q0 ∈ Q entweder q = q0 , q > q0 oder q0 > q.
Letztlich bemerken wir noch:
Lemma 1.50. Für jedes q ∈ Q gibt es n ∈ Z, so dass n − 1 < q ≤ n.
Beweis. Übung. u
t
Im Gegensatz zu den ganzen Zahlen gibt es aber keinen natürlichen Nachfolger
einer rationalen Zahl. Im Gegenteil, zwischen zwei rationalen Zahlen liegt stets noch
eine weitere rationale Zahl.
Lemma 1.51. Seien q, p ∈ Q und q > p. Dann existiert eine rationale Zahl, r ∈ Q,
so, dass p < r < q gilt.
Beweis. Wir können zum Beispiel r = (p+q)/2 wählen. Da 2q > q+ p und 2p < q+ p
gilt nach unseren Regeln q > (p + q)/2 > p. u
t
Wir könnten nun zufrieden sein und mit den rationalen Zahlen als Zahlenkörper
arbeiten. Leider steht dem aber eine geometrische Interpretation von Zahlen im
Weg.
1.4 Die reellen Zahlen
Die natürlichen Zahlen hatten wir zum Zählen eingeführt. Ein anderer Bereich, in
dem Zahlen praktisch wären, ist die Geometrie. In der Geometrie geht es erst mal
darum, Abstände, bzw. Längen von Strecken zu messen. Dabei gibt es keine kleinste
Einheit, die wir mit der 1 bezeichnen könnten, sondern zwei Punkte können beliebig
nahe beieinander sein. Die rationalen Zahlen scheinen dafür gut geeignet, immerhin
gibt es keine kleinste positive rationale Zahl: Für jedes q > 0 in Q ist q ? 21 < q. Man
könnte daher glauben, die Distanz zweier Punkte sei immer durch eine rationale
Zahl gegeben. Dies stellt sich als falsch heraus.
Satz 1.52 (Unvollständigkeit von Q). Die Länge der Diagonalen in einem Quadrat
der Seitenlänge 1 is keine rationale Zahl.
√
Abb. 1.8 Geometrische Konstruktion von 2.
Beweis. Sei x die Länge der fraglichen Diagonalen. Man kann mit elementaren
geometrischen Konstruktionen (Satz von Pytharoras) zeigen, dass das Quadrat über
der Diagonalen den Flächeninhalt 2 hat. Der Flächeninhalt eines Quadrats mit Sei-
tenlänge x ist aber x ? x. x muss also die Gleichung
x? x = 2 (1.33)
erfüllen. Wenn x rational ist, dann gibt es n, m ∈ N, so dass x = m

n. Es muss also
m2
gelten n2
= 2. Wir können annehmen, dass m und n teilerfremd sind. Es muss dann
gelten m ? m = 2 ? n ? n. Angenommen, m is kein ganzzahliges Vielfaches von 2
(damit meinen wir, dass es keine ganze Zahl k ∈ Z gibt, so dass m = 2 ? k) Dann
ist auch m ? m kein Vielfaches von 2, was einen Widerspruch zu der Gleichung
darstellt. Also muss m = 2 ? k sein, mit k ∈ N. Dann folgt aber, dass 2 ? k ? k = n ? n.
Daher muss auch n ein Vielfaches der 2 sein. Damit sind m und n nicht teilerfremd,
im Widerspruch zu der Annahme. Also gibt es kein x ∈ Q, das (1.33) erfüllt. u t
1.4 Die reellen Zahlen 23
Anmerkung. Natürlich gilt dasselbe wenn 2 durch irgendeine natürliche Zahl ersetzt
wird, die nicht das Quadrat einer natürlichen Zahl ist.
Als Geometer sind wir daher mit den rationalen Zahlen nicht zufrieden. Wir
würden schon gerne eine Zahl für die Längen von Diagonalen haben. In den ra-
tionalen Zahlen scheinen merkwürdige Lücken zu klaffen.....
Diese Lücken wollen wir nun stopfen. Wir wollen dazu zunächst den Begriff der
Folge definieren.
Definition 1.53 (Folgen). Eine Abbildung a : N → Q heißt eine Folge rationaler

Zahlen.
Wir schreiben oft (an )n∈N um eine solche Folge zu bezeichnen, wobei (n, an ) die
in a enthaltenen Elemente sind. Die Zahlen an nennen wir Folgenglieder. Von be-
sonderem Interesse für uns ist es, das Verhalten der Folgenglieder an zu beschreiben,
wenn n gross wird.
Definition 1.54 (Beschränkte Folgen). Eine Folge a heißt nach oben (unten) be-
schränkt, wenn es eine Zahl q ∈ Q gibt, so dass
∀n∈N : an ≤ q, (bzw. ∀n∈N : an ≥ q). (1.34)
Eine Folge heißt beschränkt, wenn sie von oben und von unten beschränkt ist.
Zum Beispiel ist die Folge a mit an = n1 beschränkt, die Folge a mit an = n ist
nach unten beschränkt, nicht aber nach oben.
Uns werden besonders Folgen interessieren, die mit wachsendem n annähernd
konstant werden, so wie die Folge a mit an = 1/n. Es ist praktisch dazu noch den
Begriffs des Betrags einzuführen.
Definition 1.55 (Absolutbetrag). Seien q ∈ Q. Wir definieren den Absolutbetrag

einer rationalen Zahl q als

q,
 wenn q ≥ 0,
|q| = 

(1.35)
−q, wenn q ≤ 0.

Lemma 1.56 (Dreiecksungleichung). Für alle q, p ∈ Q gilt
|p + q| ≤ |p| + |q|. (1.36)
Weiter gilt, dass |q| = 0 ⇔ q = 0.
Beweis. Übung. t
u
Die Ungleichung (1.36) heißt die Dreiecksungleichung.

Wo wir schon dabei sind definieren wir noch die Begriffe Maximum und Mini-
mum.
Definition 1.57 (Maximum und Minimum). Sei M ⊂ Q eine Menge von rationalen
Zahlen. Dann heißt q ∈ M das Maximum von M, q = max M, falls für alle p ∈ M,
q ≥ p. Analog heißt q Minimum von M, q = min M, falls für alle p ∈ M, q ≤ p.
Anmerkung. Wenn die Menge M endlich und nicht leer ist, so existiert stets sowohl
das Maximum als auch das Minimum. Wenn M nicht endlich ist, so muss dies nicht
der Fall sein. Wir kommen darauf später noch zurück.
Lemma 1.58. Eine Folge a ist genau dann beschränkt, wenn die Folge |a| mit Fol-
gengliedern |an | nach oben beschränkt ist.
Beweis. Wenn die Folge |a| nach oben beschränkt ist, so ist sowohl a als auch −a
nach oben beschränkt. Wenn −a aber nach oben beschränkt ist, so ist a nach unten
beschränkt und somit a beschränkt. u
t
Die folgende Definition ist von fundamentaler Bedeutung.
Definition 1.59 (Cauchy-Folgen). Eine Folge a von rationalen Zahlen heißt Cauchy-
Folge, genau dann wenn folgendes gilt:
1
∀k∈N ∃n0 ∈N ∀n≥n0 ∀m≥0 : |an − an+m | ≤ . (1.37)
k
Dies kompliziert wirkende Definition besagt einfach, dass sich ab einem hinreichend
grossen Wert von n die Folgenglieder kaum mehr von an unterscheiden werden. Um
diese vage Aussage genau zumachen, sagen wir: Gebe ’kaum’ vor als ’der Unter-
schied überschreitet nicht mehr die Schwelle 1/k’. Dann gibt es zu jedem k ∈ N ein
n0 , so dass dies zutrifft.
Anmerkung. Mit Hilfe der Dreiecksungleichung kann man leicht zeigen, dass eine
Folge Cauchy-Folge ist, wenn
1
∀k∈N ∃n∈N ∀m≥0 : |an − an+m | ≤ . (1.38)
k
Die Formulierung in der Definition 1.37 wird in der Literatur standardmäßig ver-
wendet, da sie betont, dass ab einen gewissen n0 , alle Folgenglieder nahe beieinan-
der liegen.
Anmerkung. Eine Cauchy-Folge deren Folgenglieder rational sind nennen wir auch
eine rationale Cauchy-Folge.
Lemma 1.60. Jede Cauchy-Folge ist beschränkt.
Beweis. Wähle k = 10. Sei n0 die zugehörige Zahl aus der Forderung (1.37).
Die endlich vielen Zahlen |a1 |, |a2 |, . . . , |an0 | haben einen maximalem Wert, M =
max{|a1 |, |a2 |, . . . , |an0 |}. Andererseits sind für alle m ∈ N |an0 − an0 +m | ≤ 10
1
. Also gilt,
wegen der Dreiecksungleichung, |an0 +m | ≤ |an0 | + 10 . Daher sind alle |an | kleiner als
1
M + 1/10. u t
Die Folge an = n1 ist offenbar eine Cauchy-Folge, denn für alle m ≥ 0 ist
1
n
1
− n+m ≤ n1 , für jedes k ∈ N ist die Aussage in der Definition mit n0 = k erfüllt.
Nun nähert sich 1/n zunehmend der Zahl 0 an. Dies können wir durch den Begriff
der Konvergenz formal beschreiben.
Definition 1.61 (Konvergenz). Eine Folge a von rationalen Zahlen heißt konver-
gent (in Q), falls es eine Zahl q ∈ Q gibt, so dass
1
∀k∈N ∃n0 ∈N ∀n≥n0 |an − q| ≤ . (1.39)
k
Die Zahl q heißt der Grenzwert oder Limes der Folge a. Wir schreiben manchmal
auch kurz a → q.
Man prüft leicht nach, dass die Folge an = n1 konvergiert und den Grenzwert 0
hat. Folgen, die gegen den Grenzwert 0 konvergieren, bezeichnen wir als Nullfolgen.
Lemma 1.62. Jede konvergente Folge ist eine Cauchy-Folge.

Beweis. Wenn a gegen eine Zahl q konvergiert, dann existiert für jedes k ∈ N ein
1
n0 ∈ N, so dass für alle n ≥ n0 , |an − a| ≤ 2k . Damit gilt auch
2 1
|an − an+m | = |an − q + q − an+m | ≤ |an − q| + |q − an+m | ≤ = , (1.40)
2k k
und a ist Cauchy-Folge. t
u
Die Frage ist, ob auch die umgekehrte Aussage gilt. Wir vermuten schon, dass
dies nicht der Fall sein wird, da Q ja löchrig ist.
Lemma 1.63 (Unvollständigkeit von Q). Es gibt rationale Cauchy-Folgen, die
nicht gegen eine rationale Zahl konvergieren.
Beweis. Wir definieren die Folge a wie folgt: Für jedes n ∈ N sei mn die größte
natürliche Zahl, so das mnnn mn
≤ 2. Dann setzen wir an = mnn . Vorsorglich definieren
wir auch eine Folge b mit bn = mnn+1 . Offenbar gilt an an ≤ 2 und bn bn > 2 (in der Tat
ist an an < 2, da wir schon wissen, dass Gleichheit nicht gelten kann). Wir wissen,
dass
1 1
|an − bn | = , |an+m − bn+m | = , (1.41)
n n+m
und sowohl bn als auch bn+m ist größer als sowohl an als auch an+m . Dann sind
0 ≤ min(bn , bn+m ) − an ≤ 1/n, 0 ≤ min(bn , bn+m ) − an+m ≤ 1/(n + m). Dann muss für
alle m ∈ N
1 1
|an − an+m | = |an − min(bn , bn+m ) + min(bn , bn+m ) − an+m | ≤ + (1.42)
n n+m
sein. Damit ist a Cauchy-Folge, und ebenso b. Nehmen wir nun an, dass a zu einer
Zahl q konvergiert. Dann muss gelten, dass q2 ≤ 2. Nehmen wir an, dass q2 < 2. Nun
ist aber
!2
1 2bn 1 4
a2n = bn − = b2n − + 2 ≥ 2− , (1.43)
n n n n
wo wir benutzt haben, dass b2n ≥ 2 und bn ≤ 2 ist. Damit gibt es aber ein n0 , so dass
2 2
für alle n ≥ n0 , a2n ≥ 2 − 2−q 2−q
2 = q + 2 , was im Widerspruch dazu steht, dass an
2
gegen q konvergiert. q2 ist also sowohl kleiner gleich als auch größer
√ gleich 2, wes-
wegen als einzig möglicher Grenzwert die nicht-existente Zahl 2 in Frage käme.
Also gibt es eine Cauchy-Folge rationaler Zahlen, die nicht zu einer rationalen Zahl
konvergiert. u t
Jetzt ist auch die Lösung unseres Problems in Sicht. Wir möchten die reellen Zah-
len als die fehlenden Grenzwerte von Cauchy-Folgen definieren. Dazu gehen wir
wie folgt vor. Zunächst bezeichnen wir die Menge aller rationalen Cauchy-Folgen
mit C. Dann definieren wir eine Äquivalenzrelation auf diesem Raum, die impliziert,
dass zwei äquivalente Folgen, wenn überhaupt, dann denselben Grenzwert haben.
Definition 1.64 (Äquivalenz von Cauchy-Folgen). Seien a, b ∈ C. Dann sind a ∼ b,
genau dann wenn die Differenzenfolge a − b = (an − bn )n∈N den Grenzwert 0 hat
(’eine Nullfolge ist’).
Lemma 1.65. ∼ ist eine Äquivalenzrelation auf C.
Beweis. Der Beweis ist eine einfache Übungsaufgabe. t
u
Wir bezeichnen im Folgenden die Äquivalenzklasse einer Cauchy-Folge a mit
[a], also
[a] = {b ∈ C : a ∼ b}. (1.44)
Definition 1.66 (Reelle Zahlen). Die Menge der Äquivalenzklassen von Cauchy-
Folgen heißt R, die reellen Zahlen.
Beachte, dass jede rationale Zahl in R eingebettet werden kann. Dazu identifizie-
ren wir eine rationale Zahl q ∈ Q mit der Äquivalenzklasse der konstanten Cauchy-
Folge q̃ mit Folgengliedern q̃n = q, für alle n ∈ N. Die Äquivalenzklasse [q̃] dieser
Folge ist dann das der Zahl q entsprechende Element von R.
Wir müssen nun lernen, mit reellen Zahlen zu rechnen. Als erstes müssen wir
uns um die Ordnungsrelation der reellen Zahlen Sorgen machen. Dazu müssen wir
entscheiden können, ob eine reelle Zahl positiv oder negativ ist. Nun ist es aber
leicht einzusehen, dass eine Cauchy-Folge, die nicht gegen Null konvergiert, ab
einem gewissen Wert n nur noch positive oder nun noch negative Folgenglieder
haben kann. Dies legt folgenden Definition nahe.
Definition 1.67 (Ordnung von Cauchy-Folgen). Eine Cauchy-Folge heißt positiv
(a > 0), genau dann, wenn,
1
∃k∈N ∃n0 ∈N ∀n≥n0 : an ≥ . (1.45)
k
Eine Cauchy-Folge heißt negativ (a < 0), genau dann, wenn,
1
∃k∈N ∃n0 ∈N ∀n≥n0 : an ≤ − . (1.46)
k
In der Definition können wir ≥ und ≤ durch > bzw. < ersetzen, ohne dass sich
etwas ändert.
Lemma 1.68. Eine Cauchy-Folge, die weder positiv noch negativ ist, konvergiert
gegen Null.
Beweis. Sei a Cauchy-Folge, aber weder positiv noch negativ. Dann gilt, dass für
jedes k ∈ N für jedes n0 ein n1 < n0 existiert, so dass an1 < 1/k und ein n2 ≥ n0 , so
dass an2 > −1/k. Nun ist aber a Cauchy, d.h. für hinreichend große n1 , ist in jedem
Fall |an1 − an2 | ≤ 1/k. Also ist insbesondere auch an1 ≥ −2/k und somit |an1 | ≤ 2/k.
Da a Cauchy ist, gilt dann für jedes m ∈ N |an1 − an1 +m | ≤ 1/k. Daraus folgt aber,
dass es für jedes k ein n1 gibt, so dass |an1 +m | ≤ 3k , für alle m ∈ N. Somit konvergiert
a gegen Null. u t
Abb. 1.9 Illustration zum Beweis von Lemma 1.68
Lemma 1.69. Die Elemente einer Äquivalenzklasse von Cauchy-Folgen sind entwe-
der alle positiv, alle negativ, oder konvergieren alle gegen 0. D.h., die Ordung auf
der Menge der Cauchy-Folgen induziert eine Ordnung auf der Menge der reellen
Zahlen.
Beweis. Übung. t
u
Das Lemma sagt einfach, dass [a] > [b] ist, wenn a > b, und so weiter. Somit gilt
für alle reellen Zahlen x entweder x > 0, x < 0, oder x = 0. Es folgt, dass die reellen
Zahlen genau wie die rationalen Zahlen geordnet sind, d.h. für jedes x, y ∈ R gilt
x > y, x < y, oder x = y.
Der Absolutbetrag einer reellen Zahl wird genau so definiert, wie der einer ratio-
nalen Zahl. Es gilt auch, dass |[a]| = [|a|]. Lemma 1.56 gilt auch für reelle Zahlen.
Ebenso definieren wir Maximum und Minimum einer Menge von reellen Zahlen.
Die folgende einfache Beobachtung ist sehr wichtig.
Lemma 1.70 (Archimedes). Für jedes Paar von reellen Zahlen x, y ∈ R mit x < y
existiert eine rationale Zahl q ∈ Q, so dass x < q < y. Insbesondere existiert für jedes
x > 0 ein K ∈ N, so dass 1/K < x.
Beweis. Sei x = [a], y = [b] für zwei rationale Folgen a, b. Da x < y, existiert k ∈ N
und n0 ∈ N, so dass für alle n ≥ n0 , bn − an > 1/K. Da aber a und b Cauchy sind, gibt
es n1 ∈ N, so dass für alle n, m > n1 , |an − am | ≤ 1/10k und |bn − bm | ≤ 1/10k. Sei nun
k = max(n0 , n1 ). Dann gilt |ak − x| ≤ 1/10k, |bk − x| ≤ 1/10k und bk − ak > 1/k. Dann
ist q = bk +a
2 ∈ Q und x < q < y, wie gewünscht. u
k
t
Anmerkung. Das Lemma gibt uns eine wichtige Methode in die Hand, um zu be-
weisen, dass eine reelle Zahl x gleich Null ist. Man zeigt zunächst, dass für jedes
K ∈ N gilt |x| < 1/K. Dann folgt aus dem lemma, dass |x| = 0. Daraus folgt wieder,
dass x = 0 ist. Das mag banal klingen, in der Praxis ist es von zentraler Bedeutung,
insbesondere wenn x als Limes einer Cauchyfolge gegeben ist. Man bezeichnet dies
auch als Archimedisches Prinzip, da dies bereits von Archimedes benutzt wurde.
Die Rechenoperationen für reelle Zahlen werden nun einfach von den rationalen
Zahlen übernommen, indem jeweils eine rationale Cauchy-Folge, die die jeweili-
ge reelle Zahl darstellt hergenommen wird und dann die Rechenoperation auf den
Folgengliedern ausgeführt werden. Dazu benötigen wir folgende Beobachtung.
Lemma 1.71. Wenn a und b Cauchy-Folgen sind, dann sind auch die Folgen a + b
und ab (mit Folgengliedern an + bn bzw. an bn ) Cauchy-Folgen.
Beweis. Wir zeigen nur den Fall der Multiplikation, der Beweis für die Addition ist
einfacher. Wir haben
|an bn − an+m bn+m | = |an bn − an bn+m + an bn+m − an+m bn+m |

≤ |an ||bn − bn+m | + |bn+m ||an − an+m |. (1.47)
Nun wissen wir, dass es M gibts, so dass |an | ≤ M und |bn | ≤ M, für alle n ∈ N.
Ausserdem gibt es für jedes k ∈ N ein n0 , so dass für alle n ≥ n0 und alle m ∈ N,
1 1
|bn − bn+m | ≤ 2Mk und |an − an+m | ≤ 2Mk . Daher ist für solche n, m,
1
|an bn − an+m bn+m | ≤ , (1.48)
k
was zeigt, dass die Folge der Produkte eine Cauchy-Folge ist. t
u
Lemma 1.72. Es seien a ∼ a0 und b ∼ b0 Cauchy-Folgen. Dann ist a + b ∼ a0 + b0
und ab ∼ a0 b0 .
Beweis. Wir zeigen zunächst, dass (a + b) − (a0 + b0 ) eine Nullfolge ist. Es gilt aber
|(an + bn ) − (a0n + b0n )| ≤ |an − a0n | + |bn − b0n |. (1.49)
Nach Voraussetzung sind a − a0 und b − b0 Nullfolgen. Also konvergiert die rechte

Seite gegen 0 und wir haben die erste Aussage bewiesen. Der Beweis der zweiten
Aussage ist ganz ähnlich.
|an bn − a0n b0n | ≤ |an (bn − b0n ) + (an − a0n )b0n | ≤ |an ||bn − b0n | + |an − a0n ||b0n |. (1.50)
Da sowohl |a| als |b0 | beschränkte Folgen sind, existiert ein K ∈ R, so dass die rechte
Seite der Ungleichung kleiner ist als
K|bn − b0n | + K|an − a0n |. (1.51)
Dies konvergiert gegen Null aus dem gleichen Grund wie vorher. t
u
Definition 1.73. Es seinen [a], [b] Äquivalenzklassen der Cauchy-Folgen a und b.

Dann definieren wir
[a] + [b] = [a + b]. (1.52)
[a][b] = [ab]. (1.53)
Wir wollen noch zeigen dass jede reelle Zahl außer der Null ein inverses Element
besitzt.
Lemma 1.74. Sei [a] , 0 eine reelle Zahl. Dann existiert eine reelle Zahl [a]−1 , so
dass [a][a]−1 = [a]−1 [a] = 1.
Beweis. Ohne Beschränkung der Allgemeinheit nehmen wir an, dass [a] > 0. Aus
Lemma 1.70, d.h. das a > 0 im Sinne der Definition 1.67, was bedeutet, dass es
ein K ∈ N gibt und eine n0 ∈ N, so dass für alle n ≥ n0 , gilt, dass an > 1/K. Nun
definieren wir die Folge a0 mit Folgengliedern

an , wenn n ≥ n0

an = 
0

(1.54)
1,
 wenn n < n0 .
Wir sehen leicht, dass a ∼ a0 , denn für alle n ≥ n0 ist |an − a0n | = 0, so dass a −
a0 offensichtlich eine Nullfolge ist. Daher ist [a] = [a0 ]. Die Folge 1/a0 ist wieder
eine Cauchy-Folge (Beweis analog zum Beweis von Lemma 1.71), und wir setzen
[a]−1 = [1/a0 ]. Dann ist a/a0 die Folge mit Folgengliedern

1,
 wenn n ≥ n0 ,
an /an = 
0

(1.55)
(an , wenn n < n0 .

Daher ist a/a0 offensichtlich äquivalent zur Folge die konstant den Wert 1 annimmt.
Nach Definition der Multiplikation [a][a]−1 = [a0 ][1/a0 ] = [a0 /a0 ] = 1. Genauso folgt
[a]−1 [a] = 1. u
t
Es liegt nun sehr nahe zu vermuten, dass eine Cauchy-Folge a gegen die reelle
Zahl, die durch die Äquivalenzklasse [a] definiert ist, konvergiert. Das ist in der Tat
der Fall, wie das folgenden Lemma zeigt.
Lemma 1.75. Jede rationale Cauchy-Folge a konvergiert gegen [a] ∈ R.
Beweis. Wir müssen zeigen, dass

∀k∈N ∃n0 ∈N ∀n≥n0 : |an − [a]| ≤ 1/k. (1.56)
Als erstes müssen wir und klar machen, was |an − [a]| ≤ 1/k bedeutet. Zunächst
identifizieren wir die rationale Zahl an mit der Äquivalenzklasse der konstanten
Folge ãn , deren Folgenglieder alle gleich an sind, also (ãn )m = an für alle m ∈ N.
Damit ist [a] − an = [a − ãn ], und a − ãn ist die Folge (am − an )m∈N . Weiter ist |[a −
ãn ]| = [|a − ãn |]. Weiter fassen wir auch 1/k als reelle Zahl, also als Äquivalenzklasse
der konstanten Folge mit Folgengliedern 1/k auf. Damit wird wegen Lemma (1.68)
die Aussage |[an − [a]| ≤ 1/k äquivalent zu der Aussage, dass die rationale Cauchy-
Folge c mit Folgengliedern cm = |an − am | − 1/k, m ∈ N, nicht positiv ist. Das bedeutet
aber nach unserer Definition 1.67, dass
∀ p∈N ∀n1 ∈N ∃m≥n1 : |am − an | − 1/k < 1/p. (1.57)
Nun ist aber a Cauchy-Folge, so dass es ein n2 ∈ N gibt, so dass für alle m ≥ n2 und
n ≥ n2 , |am − an | ≤ 1/2k < 1/k + 1/p gilt. Daher gilt für alle n ≥ n2 , dass für alle p ∈ N
für alle m ≥ n2 , |am − an | − 1/k < 1/p. Insbesondere ist für alle n ≥ n2 die Aussage
(1.57). Damit ist für alle n ≥ n2 , dass |an − [a]| ≤ 1/k. Mithin gibt es für alle k ∈ N ein
n0 (nämlich obiges n2 ), so dass für alle n ≥ n0 , |an − [a]| ≤ 1/k. Dies ist aber gerade
die Aussage des Lemmas. u t
Wir sind nun fast fertig. R hat alle Eigenschaften bez. Addition und Multiplika-
tion, die es zu einem kommutativen Körper machen, wie man leicht nachprüft. Die
Löcher in Q, die die fehlenden Grenzwerte von rationalen Cauchy-Folgen waren,
sind gestopft.
Wir können nun auch Folgen reeller Zahlen definieren.
Definition 1.76 (Folgen). Eine Abbildung a : N → R heißt eine Folge reeller Zahlen
oder eine reelle Folge.
Alle Definitionen von Beschränktheit, Cauchy-Folgen, Konvergenz und so wei-
ter übertragen sich wörtlich auf reelle Folgen, indem man die Wörter rational durch
reell ersetzt. Wir müssen nur noch sicherstellen, dass keine neuen Löcher auftau-
chen, wenn wir Cauchy-Folgen von reellen Zahlen betrachten. Dies is aber nicht
der Fall.
Satz 1.77 (Vollständigkeit von R). Jede Cauchy-Folge mit Folgengliedern in R
konvergiert gegen eine Zahl in R.
Beweis. Wir müssen nur zeigen, dass wir für jede Cauchy-Folge a eine Cauchy-
Folge b mit rationalen Folgengliedern finden können, so dass die Differenz a − b
der Folgen nach Null konvergiert. Wir wissen, dass es für jedes n ∈ N eine rationale
Cauchy-Folge a(n) gibt, die gegen an konvergiert. Daher gibt es für jedes n ∈ N ein
K(n) ∈ N, so dass |a(n) (n)
K(n) − an | ≤ n . Wähle jetzt bn = aK(n) . Dann ist für jedes n ∈ N,
1
|bn −an | ≤ 1n , und insbesondere a−b eine Nullfolge. Ausserdem ist für jedes n, m ∈ N,
|bn −bn+m | = |bn −an +an −an+m +an+m −bn+m | ≤ |bn −an |+|an −an+m |+|an+m −bn+m |.
(1.58)
Nach Konstruktion ist der erste und letzte Term nicht größer als 1/n, und da auch a
Cauchyfolge ist, gibt es für jedes k ∈ N ein n0 ∈ N, so dass für alle n ≥ n0 und alle
m ∈ N, auch |an − an+m | ≤ 1/k. Daraus folgt aber, wählen, dass es für jedes k ∈ N ein
m0 = max(k, n0 ) ∈ N gibt, so dass für alle n ≥ m0 und alle m ∈ N,
|bn − bn+m | ≤ 3/k. (1.59)
Daher ist b eine rationale Cauchy-Folge die gegen den Grenzwert [b] konvergiert.
Schliesslich ist |an − [b]| ≤ |an − bn | + |bn − [b]| ≤ 1/n + |bn − [b]|. Da lim b = [b], gilt,
dass ∀k∈N ∃n0 ∈N ∀n≥n0 |bn − [b]| ≤ 1k und somit mit m0 = max(k, n0 ),
∀k∈N ∃m0 ∈N ∀n≥n0 |an − [b]| ≤ 1/k, (1.60)
so dass [b] der Grenzwert von a. t

u
Wir fassen unsere Ergebnisse zusammen.
Satz 1.78 (Körper der reellen Zahlen). Die reellen Zahlen bilden bez. der Addition
und Multiplikation einen kommutativen geordneten abgeschlossenen Körper. Hier
bedeutet abgeschlossen, dass jede Cauchy-Folge konvergiert. Die rationalen Zahlen
bilden eine dichte Teilmenge von R, d.h. jede reelle Zahl ist der Grenzwert einer
rationalen Cauchyfolge.
Wir kommen jetzt nochmal auf Potenzen zurück. Wir hatten ja Potenzen mn für
m, n ∈ N definiert. Dies lässt sich ohne Probleme mit dem was wir bisher gelernt
haben, auf Potenzen xm erweitern, wo x ∈ R und m ∈ Z. Dabei treffen wir die Kon-
vention, dass 00 = 1 sei.
Einen wesentliche Eigenschaft von Potenzen ist, dass xn xm = xn+m , für alle x ∈
R, n, m ∈ Z. Die Lösung der Gleichung x2 = 2, die wir ja nun als reelle Zahl konstru-
iert haben, würden wir dann gerne mit 21/2 bezeichnen, da dann 21/2 21/2 = 21 = 2.
Wir können nach dem gleichen Muster auch Lösungen für jede Gleichung xm = y
über Cauchy-Folgen konstruieren.
Lemma 1.79. Für jedes 0 ≤ y ∈ R und p ∈ N existiert eine Cauchy-Folge, die gegen
die Lösung, x ∈ R, der Gleichung x p = y konvergiert. Die Äquivalenzklasse dieser
√
Cauchy-Folge heißt y1/p (oder p-te Wurzel von y, geschrieben p y).
Beweis. Der Beweis ist eine Übung. Man muss nur den Beweis von Lemma 1.63
anpassen. u t
m
Definition 1.80. Sei 0 ≤ y ∈ R und q = m/n ∈ Q. Dann ist ym/n = y1/n = (ym )1/n .
Lemma 1.81. Sei 0 ≤ y ∈ R und q, p ∈ Q. Dann gilt
y p yq = y p+q . (1.61)
Für y ≥ 1 und q ≥ 0 ist yq ≥ 1.

Beweis. Für den Fall, dass p, q in Z sind, folgt Gleichung (1.61)aus der Definition
1.38. Der allgemeine Fall führt sich darauf zurück, dass wir p und q als p = mn
zn
und
ym
q = mn darstellen und die Definition 1.80 benutzen. u t
Die Konstruktion der reellen Zahlen folgt also demselben Schema der Erwei-
terung um gewünschte Zahlen, dass wir schon bei den ganzen und den rationalen
Zahlen benutzt haben. Auch wurde wieder das Prinzip der Äquivalenzklassen an-
gewandt. Allerdings ist gegenüber der Erweiterung auf die rationalen Zahlen etwas
deutlich Dramatischeres passiert. Wenn wir auch nicht eine Liste aller rationalen
Zahlen erstellen können, so können wir doch jede gegebene rationale Zahl symbo-
lisch (durch Einsen) hinschreiben. Bei den reellen Zahlen ist dies nicht mehr der
Fall. Schon eine einzige reelle Zahl anzugeben erfordert die Angabe unendlich vie-
ler rationaler Zahlen. Natürlich gibt es einige reelle Zahlen die nicht rational
√ sind,
und doch halbwegs explizit angegeben werden können (etwa die Zahl 2), aber
dies bildet die Ausnahme.
Das etwas Dramatisches passiert is,t zeigt auch die folgende Beobachtung. Dazu
brauchen wir den Begriff der Abzählbarkeit.
Definition 1.82 (Abzählbarkeit). Eine Menge A heißt abzählbar, wenn es eine in-
jektive Abbildung C : A → N gibt. Die Menge heißt abzählbar unendlich, wenn es
eine bijektive Abbildung C : A → N gibt.
Anmerkung. Man sagt auch, eine abzählbar unendliche Menge habe die gleiche
Mächtigkeit wie die natürlichen Zahlen. Eine Menge, die abzählbar, aber nicht
abzählbar undendlich ist, ist endlich. Jede endliche Menge ist trivialerweise abzählbar.
Anmerkung. Die Definition (1.82) ist äquivalent zu: Eine Menge A heißt abzählbar,
wenn es eine surjektive Abbildung x : N → A (also eine Folge mit Werten in A) gibt.
Die Menge heißt abzählbar unendlich, wenn es eine bijektive Abbildung x : N → A
gibt. Im letzteren Fall ist a einfach die Umkehrabbildung von C, x = C −1 .
Lemma 1.83. (i) Die natürlichen Zahlen sind abzählbar.

(ii) Die ganzen Zahlen sind abzählbar.
(iii) Die rationalen Zahlen sind abzählbar.
(iv) Die reellen Zahlen sind nicht abzählbar.
Beweis. Punkt (i) ist trivial. Um (ii) zu zeigen, konstruieren wir die Abbildung C
wie folgt: 



 1, wenn z = 0,
C(z) =  n + n, wenn z = n ∈ N,

(1.62)



n + n + 1,

 wenn ; z = −n, n ∈ N.
Offenbar erfüllt diese die Ansprüche. Für die rationalen Zahlen ist es etwas kom-
plizierter, eine explizite Abbildung anzugeben. Die Idee ist aber einfach: Wie-
der ist C(0) = 1. Für k ∈ N nummerieren wir zunächst alle rationalen Zahlen nz
(wenn ein Bruch auftaucht, der äquivalent zu einem schon früher gezählt wurde,
so überspringen wir diesen einfach) mit |z| ≤ 1, n = 1. Dann nummerieren wir die
verbleibenden Zahlen mit |z| ≤ 2, n ≤ 2, und so weiter. Da es für jede rationale Zahl
ein k gibt, so dass |z| ≤ k und n ≤ k, erhält jede rationale Zahl nach hinreichend
vielen Iterationen eine verschiedene Nummer aus N. Damit liefert dieses Vorgehen
eine Bijektion.
Abb. 1.10 Abzählschema der rationalen Zahlen bis |z| ≤ z, n ≤ 7. Die Kreuze markieren Brüche,
die keine neuen rationalen Zahlen sind und daher übersprungen werden.
Dass R nicht abzählbar ist, beweisen wir durch Widerspruch. Dazu nehmen wir
an, es gäbe eine Aufzählung aller reellen Zahlen, also eine Folge x = {x1 , x2 , x3 , . . . , }
deren Bild alle reellen Zahlen sind. Wenn wir zeigen können, dass es eine Cauchy-
Folge gibt, die gegen keinen der Punkte xi , i ∈ N konvergiert, dann haben wir gezeigt,
dass es eine reelle Zahl gibt, die nicht in der Folge x vorkommt. Die Idee ist es
eine Folge zu konstruieren, die sehr schnell konvergiert und dabei den Punkten in x
fernbleibt. Wir wollen nun eine solche Folge konstruieren: Es sei a1 = x1 + 1. Weiter
wählen wir an+1 jeweils so, dass einerseits |an+1 − an | ≤ 3−n , aber |an+1 − xn+1 | ≥
3−n . Dies ist stets möglich, da ja entweder xn+1 ≤ an oder xn+1 ≥ an gelten muss.
Entsprechend wählen wir an+1 jeweils auf der anderen Seite von an . Wir behaupten
nun folgendes:
(i) a ist eine Cauchy-Folge;
(ii) ∀k∈N ∀n≥k : |an − xk | ≥ 32 3−k .

Wenn diese Behauptung zutrifft, dann konvergiert einerseits a gegen eine reelle
Zahl. Andererseits konvergiert a gegen keine der Zahlen xk in der Liste der reel-
len Zahlen. Dies ist widersprüchlich, und die Annahme muss falsch sein.
Wir müssen nur noch (i) und (ii) zeigen. Dazu brauchen wir ein ohnehin wichti-
ges Lemma.
Lemma 1.84 (Geometrische Reihe, 1). Sei x , 1 eine reelle Zahl. Dann gilt
n
xk − xn+1
x` =
X
. (1.63)
`=k
1− x
Beweis. Zunächst ist klar, dass n`=k x` = xk n−k x` . Wir müssen also nur den Fall
P P
Pn k `=0
k = 0 betrachten. Wir setzen S n = k=0 x . Nun gilt einerseits: S n+1 = 1 + xS n ,
andererseits S n+1 = S n + xn+1 . Daher muss auch gelten 1 + xS n = S n + xn+1 , oder
S n (1 − x) = 1 − xn+1 . Da nach Voraussetzung 1 − x , 0, folgt daraus die Gleichung
(1.63). u t
Wir machen noch folgende, nicht wirklich überraschende Beobachtung.
Korollar 1.85. Sei x ∈ R mit 0 ≤ x < 1. Sei a die Folge mit Folgengliedern an = xn .
Dann gilt lim a = 0.
Beweis. Nach Lemma 1.63 gilt für alle n ∈ N,

n
x1 − xn+1 1
x` =
X
≤ ∈ R+ . (1.64)
`=1
1− x 1− x
Weiter ist offenbar an+1 = xn+1 = xxn = xan < an . Falls lim a = y > 0, ist daher für
alle n ∈ N, an > y. Dann ist n`=1 a` ≥ ny, n ∈ N. Offensichtlich gibt es n ∈ N, so dass
P
ny > 1−x
1
, im Widerspruch zu (1.64). Da ausserdem an ≥ 0, für alle n ∈ N, gilt,
∀y>0 ∃n0 ∈N ∀n≥n0 0 ≤ an ≤ y. (1.65)
Daher ist a eine Nullfolge. u

t
Wir zeigen nun (i). Es gilt (mit der Dreiecksungleichung)
|an − an+m | = |an − an+1 + an+1 − an+2 + an+2 − · · · + an+m−1 − an+m |

≤ |an − an+1 | + |an+1 − an+2 | + |an+2 − an+3 | + · · · + |an+m−1 − an+m |
3−n − 3−n−m 3 −n
≤ 3−n + 3−n−1 + · · · + 3−n−m+1 = ≤ 3 . (1.66)
2/3 2
Daraus sehen wir mittels Korollar 1.85, dass a Cauchy-Folge ist. Wir zeigen nun
(ii). Dazu schreiben wir, wieder mit der Dreiecksungleichung,
3 3
|an − xk | = |an − ak + ak − xk | ≥ |ak − xk | − |an − ak | ≥ 33−k − 3−k = 3−k . (1.67)
2 2
t
u
Hier haben wir erstmals die Schreibweise m a = an + an+1 + · · · + am , wenn

P
Pmk=n k
m ≥ n, verwendet. Wenn m < n, so setzen wir k=n ak = 0.
Es gibt noch verschiedene äquivalente Definitionen der reellen Zahlen. Die De-
finition über Cauchy-Folgen hat aus meiner Sicht mehrere Vorteile. So betont sie
die Bedeutung des Konvergenzbegriffes und die Rolle von Folgen in der Analysis.
Insbesondere macht Sie deutlich, dass Berechnungen in den reellen Zahlen stets aus
sukzessiven Approximationen bestehen. Dieses Thema wird uns begleiten. Einige
Beobachtungen sollen noch deutlich machen, dass die reellen Zahlen weit kompli-
zierter sind, als man denkt. So gelten folgende scheinbar widersprüchliche Aussa-
gen.
Es sei a eine Cauchyfolge und N ∈ N beliebig. Dann ist der Grenzwert von a
unabhängig von allen Werten a1 , . . . , aN .
Andererseits:
Es sei a eine Cauchyfolge mit Grenzwert x. Dann gibt es für jedes k ∈ N ein
N ∈ N, so dass |aN − x| ≤ 1k .
Die erste Aussage sagt, dass wie endlich viele Folgenglieder beliebig verändern
können, ohne den Grenzwert zu beeinflussen. Die zweite Aussage stellt fest, dass
an irgendeinem N, die gegebene Folge fast konstant wird. Wir können aber nicht
wissen, wann das der Fall sein wird! Unendlich ist ziemlich gross.....
Es ist manchmal nützlich zu wissen, dass es genügt, bestimmte Typen von
Cauchy-Folgen zur Konstruktion der reellen Zahlen zu benutzen.
Dazu benötigen wir das Konzept der Teilfolge.
Definition 1.86 (Monotone Folgen). Eine Folge a heißt monoton wachsend genau
dann, wenn für alle n ∈ N, an+1 ≥ an . Sie heißt streng monoton wachsend wenn
für alle n ∈ N, an+1 > an . Entsprechend sind monoton fallende und streng monoton
fallende Folgen definiert.
Statt monoton wachsend sagt man oft auch nicht fallend.
Definition 1.87 (Teilfolge). Sei k : N → N eine streng monoton wachsende Folge

natürlicher Zahlen. Sei a eine Folge. Dann nennen wir die Folge b = a ◦ k eine Teil-
folge oder eine Unterfolge von a. Die Folge b hat die Folgenglieder bn = akn .
Lemma 1.88. Falls a eine Cauchy-Folge ist und b eine Teilfolge, dann ist a ∼ b.
Beweis. Übung. t
u
Wir brauchen noch folgende nützliche Beobachtung.
Lemma 1.89. Jede Folge besitzt eine monoton wachsende oder eine monoton fal-
lende Teilfolge.
Beweis. Zum Beweis führen wir die Folge der Rekorde ein. Wir sagen, dass n eine
Rekord von a ist, wenn für alle m > n, am ≤ an . Falls die Menge der Rekorde nicht
endlich ist, so gibt es eine streng monoton wachsende Folge (nk )k∈N von Rekorden,
und die Teilfolge b mit bk = ank , k ∈ N ist monoton fallend. Damit sind wir in diesem
Fall fertig. Sein nun die Menge der Rekorde endlich aber nicht leer. Dann gibt es
ein größtes Element in dieser Menge, dass wir N nennen. Dann ist m1 = N + 1 kein
Rekord, und es gibt notwendigerweise m2 > m1 , so dass am2 > am1 . Aber auch m2
ist kein Rekord, und es gibt m3 , so dass am3 > am2 . Durch vollständige Induktion
folgt, dass es für jedes k ∈ N ein mk > mk−1 gibt, so dass amk > amk−1 . Dann ist b
mit bk = amk , k ∈ N eine monoton wachsende Teilfolge von a. Falls die Menge der
Rekorde leer ist, so setzen wir m1 = 1 in der obigen Konstruktion und erhalten so
ebenfalls eine monoton wachsende Teilfolge. Damit ist das Lemma bewiesen. u t
Lemma 1.90. Sei [a] eine reelle Zahl. Dann gibt es eine monoton wachsende (mo-
noton fallende) Cauchy-Folge, b, so dass b ∼ a.
Beweis. Aus Lemma 1.89 wissen wir, dass jede Folge entweder eine monoton
wachsende oder eine monoton fallende Teilfolge besitzt. Wenn a eine monoton
wachsende Teilfolge b hat, so ist b die gewünschte Folge.
Es bleibt der Fall, dass a nur eine monoton fallende Teilfolge hat. Dann muss
diese sogar eine streng monoton fallende Teilfolge enthalten, da sonst eine konstan-
te Teilfolge existieren müsste, die dann auch monoton wachsend wäre, im Wider-
spruch zur Annahme.
Wir können also ohne Beschränkung der Allgemeinheit annehmen, dass a selbst
streng monoton fallend ist. Wir wollen zeigen, dass es dann eine zu a äquivalente
Folge gibt, die monoton wachsend ist. Da a Cauchy-Folge und fallend ist, gibt es für
jedes n ∈ N, ein kn ∈ N, so dass für alle m > kn , akn − am < 41 (an−1 − an ). Wir können
kn so wählen, dass die Folge k mit Folgengliedern kn monoton wachsend ist.
Definiere nun die Folge b so dass bn = 2akn+1 − an . Dann ist
1
bn − bn−1 = 2akn+1 − an − 2akn + an−1 = an−1 − an − 2 akn − akn+1 ≥ (an−1 − an ) > 0,
2
(1.68)
und somit ist b streng monoton wachsend. Andererseits ist |an − bn | = 2|akn − an |, und
diese Folge konvergiert gegen Null, weil a Cauchy-Folge ist. u t
Anmerkung. Bei der Konstruktion der reellen Zahlen kann man sich auf eine noch
kleinere Menge von Cauchy-Folgen einschränken. Zum Beispiel kann man die Men-
ge der dyadischen Zahlen, D, definieren als
(
D = d ∈ Q : ∃n,m∈N ∃dm ∈{0,1},...,d1 ∈{0,1},d0 ∈{0,1},d−1 ∈{0,1},...,d−n ∈{0,1} :
 n
  m
)
 X   X 
d = dk 2  ∧ d = −
−k   dk 2  .
k
(1.69)

k=−m k=−n
1.5 Die komplexen Zahlen 37
Eine dyadische Cauchy-Folge ist dann eine Cauchy-Folge mit Folgengliedern in

D. Ähnlich wie im Beweis von Satz 1.77 kann man zeigen, dass jede Äquivalenz-
klasse von Cauchy-Folgen eine dyadische Cauchy-Folge enthält. Daher sind die re-
ellen Zahlen auch gleich der Menge der Äquivalenzklassen von dyadischen Cauchy-
Folgen. Weiterhin kann man sich, wie gehabt, auf monoton wachsende (oder fallen-
de) dyadische Cauchy-Folgen einschränken. Eine monoton wachsende Folge dya-
discher Zahlen ist aber gegeben durch Folgenglieder
n
X
xn = dk 2−k , (1.70)
k=−m
für eine gegebene Folge (dk )−m≤k∈Z . Die Folge d zusammen mit der Zahl m nennt
man die Binärdarstellung der reellen Zahl x, wobei m durch Markierung eines Punk-
tes in der Folge bezeichnet wird, also
x = 10100010101.011000001100100100010010010010010101 . . . (1.71)
Im obigen Beispiel ist dann m = 11. Natürlich kann man auch hier die Zahl im
Allgemeinen nicht vollständig aufschreiben. Benutzt man statt der Zahl 2 die Zahl
10 und erlaubt, dass dk ∈ {0, 1, . . . , 9}, erhält man die Dezimaldarstellung der reellen
Zahlen (hierbei Verwendet man die Abkürzungen 1 + 1 = 2, 1 + 1 + 1 = 3, etc.
1.5 Die komplexen Zahlen
Mit den reellen Zahlen haben wir Zahlen bereitgestellt, die alle geometrischen
Größen quantifizieren können. Wenn wir aber zu unserem Ausgangspunkt, der Fra-
ge, ob die Gleichung x2 = 2 eine Lösung hat, zurückgehen, so sehen wir das in ei-
nem ganz ähnlichen Problem auch die reellen Zahlen scheitern. Wenn wir nämlich
fragen, ob es eine reelle Zahl gibt, so dass x2 = −1, lautet die Antwort nein. In-
zwischen schreckt uns nichts mehr, und wir versuchen einfach, eine fiktive Lösung
dieser Gleichung in einen erweiterten Zahlenkörper einzuschmuggeln. Wir geben
dieser Zahl das Symbol i. Addition und Multiplikation werden einfach fortgesetzt
so dass für jede reelle Zahl x, x + i und x ? i = ix. Die komplexen Zahlen bilden
wiederum einen kommutativen Körper, der aber nicht mehr geordnet ist. Man kann
zeigen, dass jede algebraische Gleichung in C lösbar ist. Wir kommen auf die kom-
plexen Zahlen später wieder zurück.
Kapitel 2
Folgen und Reihen
Konvergenz ist der zentrale Begriff der Analysis. Wir haben dazu schon Einiges
bei der Konstruktion der reellen Zahlen gelernt. Die wollen wir in diesem Kapitel
vertiefen.
2.1 Erste topologische Begriffe
Wir führen zunächst ein paar einfache Konzepte ein, deren Bedeutung uns später
noch klarer werden wird. Alles spielt sich hier in den reellen Zahlen ab. Wir benut-
zen folgende Konvention: Das Symbol ist immer eine positive reelle Zahl.
Definition 2.1 (-Umgebung). Sei x ∈ R und ∈ R, > 0. Dann heißt die Menge
I (x) = {y ∈ R : |x − y| < }, die offene -Umgebung von x.
Definition 2.2 (Offen, abgeschlossen, beschränkt). Eine Teilmenge O ⊆ R heißt

offen, genau dann, wenn
∀ x∈O ∃>0 : I (x) ⊆ O. (2.1)
Eine Menge A ⊆ R heißt abgeschlossen genau dann, wenn Ac = R\A offen ist. Man
nennt Ac das Komplement von A in R.
Eine Menge B ⊂ R heißt beschränkt genau dann, wenn es N ∈ N gibt, so dass
∀ x∈B : −N < x < N.
Anmerkung. Offenheit und Abgeschlossenheit schließen sich nicht aus. Die leere
Menge ist offen und abgeschlossen. Es ist vernünftig, die leere Menge als offen und
abgeschlossen zu bezeichnen. Denn da ∅ ja keinen Punkt enthält, ist die Forderung
(2.1) leer erfüllt. Somit sollte ∅ offen sein. Andererseits ist das Komplement von
∅ ja R\∅ = R, und R erfüllt die Forderung an eine offene Menge. Damit muss ∅
abgeschlossen sein.
Lemma 2.3. (i) R ist offen und abgeschlossen.

(ii) Die offenen -Umgebungen von x sind offene Mengen.
39
40 2 Folgen und Reihen
(iii) Die Halbgeraden G x = {y ∈ R : y > x} sind offen, die Halbgeraden K x = {y ∈ R :

y ≥ x} sind abgeschlossen.
(iv) Die Mengen I (x) = {y ∈ R : |x − y| ≤ }
sind abgeschlossen.
Beweis. (i): Für jedes x ∈ R und jedes > 0 ist I (x) ⊂ R, also ist R offen. Anderer-
seits ist Rc = R\R = ∅ ebenfalls offen. Also ist R abgeschlossen.
(ii): Wenn y ∈ G x , dann ist I(y−x)/2 (y) ∈ G x , und somit ist G x offen.
(iii): K xc = {y ∈ R : y < x} ist genau wie in (ii) offen. Also ist K x nach Definition
abgeschlossen.
(iv): Das Komplement von I (x) ist die Vereinigung zweier offener Halbgeraden.
Daher ist I (x) abgeschlossen. u t
Definition 2.4. Sei M ⊆ R. Dann definieren wir:

(i) Das Innere von M,
int M = {x ∈ M : ∃>0 : I (x) ⊆ M}, (2.2)
(ii) und den Rand von M,
∂M = {x ∈ R : ∀>0 : I (x) ∩ M , ∅ ∧ I (x) ∩ M c , ∅}, (2.3)
und
(iii) den Abschluss von M,
M = M ∪ ∂M. (2.4)
Lemma 2.5. (i) Für jedes M ⊆ R ist int M offen.

(ii) Für jedes M ⊆ R ist M ∪ ∂M = M abgeschlossen.
Beweis. Übung. t
u
Anmerkung. Wenn die Menge M abzählbar ist, so ist notwendig int M = ∅. Insbe-
sondere ist int Q = ∅.
Definition 2.6 (Sup und inf). Sei M ⊂ R. Dann ist sup M die kleinste reelle Zahl,
so dass alle Elemente von M kleiner oder gleich sup M sind. Präzise formuliert:

(sup M = z) ⇔ (∀ x∈M : x ≤ z) ∧ ∀y<z ∃ x∈M : x > y . (2.5)
inf M ist die größte reelle Zahl, so dass alle Elemente von M größer oder gleich
inf M sind.
(inf M = z) ⇔ (∀ x∈M : x ≥ z) ∧ ∀y>z ∃ x∈M : x < y . (2.6)
Anmerkung. Supremum und Infimum einer Menge müssen nicht existieren. So hat
R kein Supremum und kein Infimum. Wir sagen dann auch, das Supremum von R sei
plus unendlich und das Infimum von R sei minus unendlich und schreiben sup R =
2.1 Erste topologische Begriffe 41
+∞ und inf R = −∞. ±∞ haben keine guten Eigenschaften als Zahlen (z. B. für alle
ist ∞ + x = ∞), sind aber oft nützlich um bestimmte Sachverhalte auszudrücken.
Man bezeichnet die Menge R = R ∪ {−∞, +∞} als die erweiterte Zahlengerade oder
die erweiterten reellen Zahlen.
Lemma 2.7. Sei M ⊂ R beschränkt. Dann existieren sup M und inf M in R.
Beweis. Wir betrachten nur sup M, das Argument für inf M ist identisch. Nach De-
finition gibt es N ∈ N, so dass für alle x ∈ M, x < N. Wir wollen nun zwei Cauchy-
Folgen konstruieren, die gegen sup M konvergieren. Dazu wählen wir ein x ∈ M und
setzen a1 = x, b1 = N. Falls a1 oder b1 die Eigenschaft des Supremum hat, sind wir
fertig. Andernfalls setzen wir c1 = (a1 + b1 )/2. Nun setzen wir
Abb. 2.1 Konstruktion der Folgen a und b.

a1 ,
 wenn ∀ x∈M : c1 ≥ x,
a2 = 

(2.7)
c1 ,
 wenn ∃ x∈M : c1 < x,
und 
c1 ,
 wenn ∀ x∈M : c1 ≥ x,
b2 = 

(2.8)
b1 ,
 wenn ∃ x∈M : c1 < x,
und weiter, für n ∈ N, cn = (an + bn )/2

an , wenn ∀ x∈M : cn ≥ x,

an+1 = 

(2.9)
cn , wenn ∃ x∈M : cn < x,

und 
cn ,
 wenn ∀ x∈M : cn ≥ x,
bn+1 = 

(2.10)
bn ,
 wenn ∃ x∈M : cn < x.
Nach Konstruktion ist für alle n ∈ N, bn ≥ an und bn+1 − an+1 = (bn − an )/2. Dar-
aus folgt, dass bn − an ≤ 2−(n−1) (b1 − a1 ). Ausserdem ist b monoton fallend und a
monoton wachsend. Damit ist auch, für alle m ∈ N,
|bn+m − bn | ≤ |bn − an | ≤ 2−(n−1) |b1 − a1 |. (2.11)
Damit ist b eine Cauchy-Folge und konvergiert gegen eine Zahl z ∈ R. Da für alle
n, für alle x ∈ M, bn ≥ x, ist für alle x ∈ M auch z ≥ x. Somit erfüllt z die erste
Anforderung an sup M. Angenommen es gäbe y < z, so dass diese Anforderung
auch von y erfüllt ist. Nun ist aber nach Konstruktion auch lim a = z, und für alle n
gibt es x ∈ M, so dass x ≥ an . Es gibt aber n0 ∈ N, so dass für alle n ≥ n0 , |z − an | ≤
|z − y|/2. Dann ist für x ≥ an auch x > y, was der angenommenen Eigenschaft von y
widerspricht. Daher gibt es kein solches y und z = sup M. u t
Lemma 2.8. (i) Wenn O offen ist, dann ist sup O < O und inf O < O.
(ii) Wenn A abgeschlossen und beschränkt ist, dann ist sup A ∈ A und inf A ∈ A.
Beweis. Der Beweis von (i) ist sehr einfach: Keine -Umgebung von sup O oder
inf O kann ganz in O enthalten sein, da sonst sup O + /2 ∈ O, bzw. inf O − /2 ∈ O
wäre, was der Definition widerspricht. Um (ii) zu zeigen, bemerken wir zunächst,
dass weil A beschränkt ist, sup A und inf A in R existieren. Wir nehmen nun an
sup A < A. Dann ist sup A ∈ Ac , welches aber offen ist. Dann gibt es > 0, so dass
I (sup A) ∈ Ac . Dass ist aber auch sup A − /2 größer als jedes Element in A, was der
Definition von sup A widerspricht. u t
2.2 Folgen
Wir wissen bereits, was eine Folge reeller Zahlen ist, was eine Cauchy-Folge und
was eine konvergente Folge ist. Wenn eine Folge nicht konvergiert, so sagen wir,
dass sie divergiert. Insbesondere wissen wir, dass es für Folgen reeller Zahlen
äquivalent ist eine Cauchy-Folge oder eine konvergente Folge zu sein. Wir wissen
auch schon, was eine Teilfolge ist. Wir machen nun noch einige wichtige Beobach-
tungen.
Lemma 2.9 (Monotone Konvergenz). Sei a eine monoton wachsende Folge reel-
ler Zahlen und sei a beschränkt. Dann konvergiert a gegen sup{an , n ∈ N}. Ebenso
konvergiert jede monoton fallende beschränkte Folge gegen inf{an , n ∈ N}.
Beweis. Wir betrachten die Menge A = {an : (n, an ) ∈ a, n ∈ N}. Dann ist sup A ∈ R, da
ja A nach oben beschränkt ist. Nun wissen wir nach der Definition des Supremums,
dass für jedes k ∈ N, es ein Element an ∈ A gibt, so dass an > sup A − 1/k. wegen der
Monotonie gilt dies dann auch für alle am mit m ≥ n. Daraus folgt, das es für jedes
k ∈ N ein n ∈ N gibt, so dass für alle m ≥ n,
2.2 Folgen 43
0 ≤ sup A − am ≤ 1/k ⇒ | sup A − am | ≤ 1/k, (2.12)
was gerade nach Definition bedeutet, dass a gegen sup A konvergiert. t

u
Satz 2.10 (Bolzano-Weierstrass). Sei a eine beschränkte Folge reeller Zahlen.

Dann existiert mindestens eine konvergente Teilfolge.
Beweis. Nach Lemma 1.89 hat jede Folge eine monoton wachsende oder eine mo-
noton fallende Teilfolge. Wegen Lemma 2.9 konvergieren diese, was die Behaup-
tung ist. ut
Die Folgenden wichtigen Begriffe beschreiben, wie sich auch nicht konvergente
Folgen für große n Verhalten. Der Limes superior (inferior) ist die kleinste obere
(untere) Schranke an eine Folge für ’alle bis auf endlich viele’ Folgenglieder.
Definition 2.11 (Limes superior und inferior). Sei a eine reelle Folge. Dann ist

lim sup a = z ⇔ ∀k∈N ∃n0 ∈N ∀n≥n0 : an ≤ z + 1/k

(2.13)

∧ ∀y<z ∃k∈N ∀n0 ∈N ∃n≥n0 : an > y + 1/k , (2.14)
d.h. z ist die kleinste Zahl, die die Folge auf lange Sicht nur beliebig wenig
überschreitet. Entsprechend ist lim inf a definiert.
Ein weiterer wichtiger Begriff ist der des Häufungspunktes einer Folge.
Definition 2.12 (Häufungspunkt). Sei a eine Folge reeller Zahlen. Dann heißt x ∈
R Häufungspunkt von a, falls es eine Teilfolge von a gibt, die gegen x konvergiert.
Lemma 2.13. Ein Punkt x ∈ R ist Häufungspunkt einer Folge a genau dann, wenn
es für jedes k ∈ N eine unendliche Teilmenge von Nk ⊆ N gibt, so dass für alle n ∈ Nk ,
|an − x| ≤ 1/k.
Beweis. Es folgt aus der Definition von Konvergenz, dass aus der Existenz einer
Teilfolge, die gegen x konvergiert der zweite Teil der Aussage folgt. Der umgekehrte
Schluss ist schwieriger und interessanter. Für jedes k ∈ N gibt es eine unendliche
Teilmenge, Nk ⊂ N, so dass für alle m ∈ Nk , |am − x| ≤ 1/k. Wir können diese so
wählen, dass Nk+1 ⊂ Nk . Nun wählen wir ein Element aus N1 , sagen wir n1 = min N1 .
Dann wählen wir n2 als das kleinste Element aus N2 , so dass n2 > n1 , und induktiv
nk+1 = min{` ∈ Nk+1 : n` > nk }. (2.15)
Weil alle Mengen Nk unendlich sind, existieren alle nk für k ∈ N. Man zeigt nun
leicht durch Nachprüfen der Definition von Konvergenz, dass die Folge b mit bk =
ank , k ∈ N gegen x konvergiert. Damit ist die gewünschte Unterfolge erhalten. u
t
Lemma 2.14. Sei a eine reelle Folge und es sei lim sup a = z ∈ R. Dann ist z der
größte Häufungspunkt von a. Falls lim inf a = y ∈ R existiert, dann ist y der kleinste
Häufungspunkt von a.
Beweis. Übung. t
u
Lemma 2.15. Eine reelle Folge a konvergiert genau dann gegen eine reelle Zahl x,
wenn lim sup a = lim inf a = x.
Beweis. Übung. t
u
Es ist noch nützlich, bei Folgen die nicht konvergieren zu unterscheiden, ob sie
dies nicht tun, weil es mehrere Häufungspunkte gibt, oder weil es keine Häufungspunkte
in R gibt. Eine ganz einfache Folge, die zwei Häufungspunkte hat ist etwa an =
(−1)n . Die Folge an = n dagegen hat gar keinen Häufungspunkt, dafür aber ein kla-
res Ziel: unendlich!
Definition 2.16 (Uneigentliche Konvergenz). Wir sagen, dass eine reelle Folge a
uneigentlich gegen +∞ konvergiert, wenn lim inf a = lim sup a = +∞. a konvergiert
gegen −∞, wenn lim sup a = lim inf a = −∞. Dabei bedeutet die Aussage lim inf a =
+∞, dass ∀N∈N ∃n0 ∈N ∀n≥n0 an ≥ N. (Entsprechend für lim sup a = −∞). Die Aussage
lim sup a = +∞ bedeutet ∀N∈N ∀n0 ∈N ∃n≥n0 an ≥ N.
Die uneigentliche Konvergenz zu ±∞ ist trotzdem von viel schwächerer Natur

als richtige Konvergenz. Insbesondere können zwei Folgen gegen +∞ konvergieren,
ohne dass sie ’nahe beieinander’ sind. So konvergieren etwa an = n und bn = n2 beide
gegen +∞. Wir können dieses Konzept aber durch den Begriff der asymptotischen
Äquivalenz verfeinern.
Definition 2.17 (Asymptotische Äquivalenz). Zwei Folgen a und b (mit bn , 0, für

alle n ∈ N) heißen asymptotisch gleich genau dann, wenn
an
lim = 1. (2.16)
n↑∞ bn
Falls
an
lim = 0, (2.17)
n↑∞ bn
so sagt man a sei asymptotisch von kleinerer Ordnung als b und schreibt a = o(b).
Lemma 2.18. Falls a konvergiert, und b asymptotisch gleich zu a ist, dann ist b
äquivalent zu a. Dies ist nicht notwendig der Fall, wenn a uneigentlich gegen ±∞
konvergiert. Wenn b konvergiert und a = o(b), dann konvergiert a gegen Null. Insbe-
sondere sind die Aussagen ’a = o(1)’ und ’a ist eine Nullfolge’ äquivalent.
Beweis. Wir nehmen an lim a = z > 0 und a asymptotisch gleich zu b. Nun wissen
wir, dass auch die Folge b/a gegen 1 konvergiert. Schließlich ist a − b = a(1 − b/a),
und diese Folge konvergiert gegen lim a lim(1 − b/a) = 0. Falls lim a = 0, so existiert
einerseits für jedes K ∈ N ein n0 ∈ N so dass für alle n ≥ n0 , |an | ≤ 1/K 2 . Nehmen wir
nun an, dass b keine Nullfolge ist. Dann gibt es K 0 ∈ N, so dass für alle n1 ∈ N ein
n ≥ n1 existiert, so dass |bn | > 1/K 0 . Dann ist natürlich erst recht |bn | > 1/K, wenn
K ≥ K 0 . (siehe Lemma 1.72 und Lemma 1.74). Insbesondere gilt Letzteres für n ≥ n0
2.3 Reihen 45
von oben. Daraus folgt aber, dass es für jedes K ∈ N mit K > K 0 ein n0 gibt sowie
ein n ≥ n0 , so dass abnn ≤ 1/K. Dann ist aber abnn − 1 ≥ 1 − 1/K, weswegen a/b nicht
gegen 1 konvergieren kann. Der Beweis der zweiten Aussage ist eine Übung. u
t
2.3 Reihen
Eine besonders wichtige Klasse von Folgen sind die sogenannten Reihen. Die Un-
tersuchung von Reihen und deren Verhalten ist eine ganz zentrale Aufgabe der Ana-
lysis, die bei der Lösung zahlreicher Probleme immer wieder auftritt. Dieses Kapitel
ist daher auch wesentlich praktischer ausgerichtet als die bisherigen, in denen kon-
zeptuelle Dinge im Vordergrund standen.
Reihen werden aus Folgen konstruiert.
Definition 2.19 (Reihen). Sei a eine Folge reeller Zahlen. Dann heißt die Folge S
mit Folgengliedern
Xn
Sn = an (2.18)
k=1
eine Reihe. Wenn S zu einer reellen Zahl konvergiert, so sagt man, die Reihe kon-
vergiert und schreibt
∞
X
lim S = lim S n = ak . (2.19)
n↑∞
k=1
P∞
Anmerkung. Beachte, dass die Schreibweise k=1 ak nur über die linke Seite defi-
P
niert ist. Man schreibt äquivalent auch k∈N ak . Manchmal möchte man auch Rei-
hen nicht bei 1 sondern bei 0 beginnen lassen. Wir verstehen schon, dass dies völlig
äquivalent ist.
Anmerkung. Man nennt an die Reihenglieder und S n , n ∈ N die Partialsummen der

Reihe S . Häufig schreibt man ∞
P
k=1 ak um die Reihe (und nicht nur ihren Grenzwert)
zu bezeichnen. Dies ist etwas unglücklich.
Das wichtigste Beispiel von Reihen ist uns schon begegnet. Es ist die
Definition 2.20 (Geometrische Reihe). Sei x ∈ R. Die Reihe S mit

n
X n−1
X
Sn = xk−1 = xk , n ∈ N, (2.20)
k=1 k=0
heißt die geometrische Reihe.
Wir wissen schon, dass wir S n explizit ausrechnen können. Das kommt bei Rei-
hen sehr selten vor.
Lemma 2.21. Sei S die geometrische Reihe aus (2.20). Dann gilt
1 − xn
Sn = , (2.21)
1− x
wenn x , 1. Wenn x = 1, so ist S n = n + 1. Insbesondere gilt: S konvergiert genau
dann, wenn |x| < 1 und es gilt
∞
X 1
xk = . (2.22)
k=0
1− x
Beweis. Gleichung (2.21) hatten wir schon in Gl. (1.84) hergeleitet. Aus dieser
xn
Gleichung folgt aber, dass S n − 1−x 1
= 1−x , und da für |x| < 1, xn nach Null konver-
giert, ist S n in der Äquivalenzklasse der konstanten Folge 1/(1 − x), also konvergent
mit Grenzwert wie behauptet. Falls |x| ≥ 1, so ist |S n+1 − S n | = |x|n ≥ 1, weswegen S
keine Cauchy-Folge sein kann, und also auch nicht konvergiert. u t
Wir sehen in diesem Beispiel, dass die Reihe S konvergiert, wenn die Reihen-
glieder xn nach 0 streben, und umgekehrt. Kann man das verallgemeinern?
Lemma 2.22. Sie a eine reelle Folge und S die Reihe mit Partialsummen S n =
k=1 ak . Wenn S konvergiert, dann konvergiert a und lim a = 0.
Pn
Beweis. Da S konvergiert, gibt es für jedes k ein n0 , so dass für alle n ≥ n0 ins-
besondere |S n+1 − S n | < 1/k, also |an+1 | < 1/k. Damit konvergiert aber a gegen 0.
t
u
Leider gilt die Umkehrung nicht.
Lemma 2.23 (Harmonische Reihe). Die Folge S mit Folgengliedern

n
X 1
Sn = (2.23)
k=1
k
heißt die harmonische Reihe. Die harmonische Reihe konvergiert nicht, bzw. sie
konvergiert uneigentlich nach +∞.
Beweis. Wir wollen zeigen, dass die harmonische Reihe nicht nach oben beschränkt
ist. Dazu wählen wir n = 2m , mit m ∈ N. Wir können die natürlichen Zahlen von
1 bis 2m in m Teilmengen I1 , . . . , Im zerlegen, wobei I` = {2`−1 + 1, 2`−1 + 2, . . . 2` },
` = 1, . . . , m. Nun benutzen wir folgende Abschätzung: Wenn k ∈ I` , dann ist 1k ≥ 2−` .
Es folgt daher, dass
2.3 Reihen 47
 
m 
X X 1 
S n = S 2m =  
 k 
`=1 k∈I`
 
m 
X X −` 
≥  2 
 
`=1 k∈I`
m
m
2−` 2`−1 =
X
= . (2.24)
`=1
2
Daraus folgt lim sup S = +∞. Da die Folge monoton wächst, gilt auch lim inf S = +∞
und somit die Behauptung. u t
Das wichtigste Hilfsmittel um zu testen, ob eine Reihe konvergiert oder nicht ist
der Vergleich mit bekannten Reihen. Das haben wir im obigen Beweis auch schon
getan.
Satz 2.24 (Vergleichssatz). Es seien a und b reelle Folgen und es gibt ein m ∈ N
und ein C ∈ R+ , so dass für alle n ≥ m, |an | ≤ C|bn |. Dann gilt Folgendes:
(i) Falls die Reihe mit Reihengliedern |bn |, n ∈ N, konvergiert, dann konvergiert
die Reihe mit Reihengliedern an .
(ii) Falls die Reihe mit Reihengliedern an nicht konvergiert, so divergiert auch die
Reihe mit Reihengliedern |bn |.
Beweis. Der Satz ist sehr einleuchtend und der Beweis nicht schwer. Er sollte in
jedem Fall als Übung ausgeführt werden. u
t
Die Vergleichsreihe der Wahl ist meißt eine geometrische Reihe. Allerdings
funktioniert der Vergleich nicht immer sofort, sondern man muss, wie im Beispiel
der harmonischen Reihe, noch partiell vorsummieren. Dazu gehört ein gewisses Fin-
gerspitzengefühl und letztlich Erfahrung, die man nur durch viel Übung bekommen
kann. Grundlage ist dabei die Anwendung der folgenden sehr trivial aussehenden
Ungleichungen.
Lemma 2.25 (Maximum und Minimum Ungleichungen). Sei a eine reelle Folge.
Dann gilt
n
X n
ak ≤ n max ak (2.25)
k=1
k=1
und
n
X n
ak ≥ min ak . (2.26)
k=1
k=1
Wenn al ≥ 0, für alle k ∈ N, dann gilt auch

n
X n
ak ≥ n min ak . (2.27)
k=1
k=1
Hier haben wir die Schreibweise maxnk=1 ak = max{a1 , a2 , . . . , an } verwendet und

eingeführt.
Die Macht dieses Lemmas kommt erst in Verbindung mit einer Zerlegung des
Summationsbereichs zur Geltung. man versucht dazu, eine disjunkte Zerlegung von
N in Teilmengen I` , ` ∈ N vorzunehmen, so dass mink∈I` ak und maxk∈I` nicht zu sehr
P
variieren. Dann benutzt man das Lemma um die Partialsummen `∈I` ak nach oben
bzw. nach unten abzuschätzen. Das folgende Beispiel zeigt schön, wie so etwas
geht.
Lemma 2.26. Es sei S die Reihe mit S n = nk=1 k−s , s ∈ R. Dann gilt: S konvergiert
P
genau dann wenn s > 1.
Beweis. Es sei s > 1. Wir gehen vor wie im Fall der harmonischen Reihe, benutzen
aber die Abschätzung: Wenn k ∈ I` , dann gilt k s ≤ 2−s`+s . Damit haben wir
2m
X m X
X m
X
k−s ≤ 2−s`+s ≤ 2 s−1 2−(s−1)` . (2.28)
k=1 `=1 k∈I` `=1
Die letztere Reihe kann jetzt mit der geometrischen Reihe verglichen werden. Da
2−s < 1, erhalten wir, dass Zm = S 2m konvergiert. Da S n monoton wachsend ist,
folgt daraus, dass lim sup S ≤ lim Z, und trivialerweise lim inf S ≥ lim Z. Damit kon-
vergiert S .
Im Fall s ≤ 1 vergleichen wir einfach mit der harmonischen Reihe, da dann k−s ≥
−1
k . Da die harmonische Reihe divergiert, tut dies auch S . u t
Aus dem Vergleich mit der geometrischen Reihe leitet man die zwei folgenden,
gerne benutzten Kriterien her.
Lemma 2.27 (Quotientenkriterium). Sei a eine Folge, so dass es ein N ∈ N gibt,

so dass für alle n > N, an , 0. Es gelte weiter, dass die Folge mit Folgengliedern
|an+1 /an | gegen q ∈ R ∪ {+∞} konvergiert. Dann gilt:
(i) Wenn q < 1, so konvergiert die Reihe mit Reihengliedern an absolut;
(ii) Wenn q > 1, so divergiert die Reihe mit Reihengliedern an .
Beweis. Im Fall (i) muss es ein n0 ∈ N geben, so dass für alle n ≥ n0 , |an+1 /an | ≤
1+q
2 = q < 1. Dann ist für n ≥ n0 |an | ≤ |an0 |(q )
0 0 −n0 (q0 )n = C(q0 )n . Daher greift (i) aus
Satz 2.24 und die Reihe konvergiert wegen dem Vergleich mit einer konvergenten
geometrischen Reihe absolut. Der Fall (ii) is vollständig analog und wird als Übung
belassen. ut
Anmerkung. Anstatt den Grenzwert zu betrachten, kann man das Quotientienkrite-

rium auch äquivalent formulieren als:
(i’) Wenn es ein p < 1 gibt und ein n0 ∈ N, so dass für alle n ≥ n0 , |an+1 /an | ≤ p, so
konvergiert die Reihe;
(ii’) Wenn es ein p > 1 gibt und ein n0 ∈ N, so dass für alle n ≥ n0 , |an+1 /an | ≥ p, so
divergiert die Reihe.
2.3 Reihen 49
Warum stimmt das?
Lemma 2.28 (Wurzelkriterium). Sei a eine Folge. Sei L = lim supn↑∞ |an |1/n . Dann
gilt:
(i) Wenn L < 1, so konvergiert die Reihe mit Reihengliedern an absolut;
(ii) Wenn L > 1, so divergiert die Reihe mit Reihengliedern an .
Beweis. Der Beweis des Wurzelkriteriums ist noch einfacher. Im Fall (i) gibt es
2 = L < 1. Damit ist für diese n |an | ≤ (L ) ,
n0 ∈ N, so dass für alle n ≥ n0 , |an |1/n ≤ L+1 0 0 n
und der Vergleich mit einer geometrischen Reihe zeigt Konvergenz sogar der Reihe
mit Reihengliedern |an |. Im Fall (ii) wissen wir, dass es eine Unterfolge nk und
2 = L > 1, also |ank | ≥ (L ) . Es
k0 ∈ N gibt, so dass für alle k ≥ k0 , |ank |1/nk ≥ L+1 0 0 nk
folgt aus dem Vergleichssatz, dass diese Unterfolge divergiert, und mithin die Folge
a divergiert. ut
Beispiele. Oft ist das Wurzelkriterium formal stärker als das Quotientenkriterium.
Betrachte als Beispiel die Reihe mit Reihengliedern

2−n , wenn n = 2k, k ∈ N,

aN = 

(2.29)
5−n , wenn n = 2k − 1, k ∈ N.

Hier ist a2k+1 /a2k = 5−2k−1 22k = (2/5)2k /5, und a2k+2 /a2k+1 = 2−2k−2 52k+1 = (5/2)2k+1 /2,
d.h. die Folge der Quotienten divergiert und das Quotientenkriterium kann nicht ver-
wendet werden. Dagegen ist für alle n ∈ N, an1/n ≤ 1/2, also lim supn↑∞ |an | ≤ 1/2 (es
gilt sogar Gleichheit), und das Wurzelkriterium liefert sofort Konvergenz. (Das Bei-
spiel ist natürlich nicht sonderlich tiefsinnig).
Wir hatten gesehen, dass es für die Konvergenz einer Reihe nicht ausreicht, wenn
die zugrundeliegende Folge nach Null konvergiert. Das folgende Kriterium von
Leibniz gibt Beispiele, für die man auf Konvergenz schließen kann.
Lemma 2.29 (Leibniz-Kriterium). Sei a eine Folge mit monoton fallenden, nicht
negativen Folgengliedern. Wenn lim a = 0 ist, dann konvergiert die Reihe S mit S n =
Pn k+1 a und es gilt
k=1 (−1) k
∞
X
(−1)k+1 ak ≤ an+1 . (2.30)
k=n+1
Beweis. Wir können die Folge wie folgt umschreiben:

2n
X n
X
(−1)k+1 ak = (a2`−1 − a2` ) = gn , (2.31)
k=1 `=1
bzw.
2n+1
X n
X
(−1)k+1 ak = a1 + (a2`+1 − a2` ) = un . (2.32)
k=1 `=1
Dann ist wegen der Monotonie der Folge a die Folge g monoton wachsend und die
Folge u monoton fallend. Andererseits gilt für alle n,
gn ≤ un (2.33)
Daraus folgt nun aber, dass gn ≤ gn+1 ≤ un+1 ≤ un , und damit durch vollständige
Induktion, gn+k ≤ un , für alle k und alle n. Ebenso gilt un+k ≥ gn . Damit sind die
monotonen Folgen u und g beschränkt und konvergieren nach dem Satz von der
monotonen Konvergenz. Weiterhin gilt, dass un − gn = a2n+1 , und a konvergiert ge-
gen Null. Also haben u und g den selben Grenzwert. Somit konvergiert die Reihe S .
Schließlich erhalten wir, dass für alle n ∈ N, lim g ≤ un , also 0 ≤ lim S − gn ≤ a2n+1
und 0 ≥ lim S − un ≥ −a2n+2 . Dies liefert (2.33). u t
Wir sagen, dass eine Reihe mit Reihengliedern an absolut konvergiert, wenn die
Reihe mit Reihengliedern |an | konvergiert. Das Leibniz-Kriterium zeigt, dass es Rei-
hen gibt, die konvergieren, aber nicht absolut konvergieren. Zum Beispiel konver-
giert D mit S n = n (−1)n+1 n−1 nach Leibniz, die Reihe ist aber nicht absolut kon-
P
vergent.
Lemma 2.30. Jede absolut konvergente Reihe konvergiert.
Beweis. Sei S n = nk=1 ak . Dann ist

P
n+m
X
|S n − S n+m | ≤ |a` |. (2.34)
`=n+1
P
Da n |an | konvergiert, ist für jedes K ∈ N die rechte Seite für alle m ∈ N kleiner als
1/K, wenn n größer als ein gewisses n0 ist. Damit ist aber auch die Folge S eine
Cauchy-Folge und konvergiert. u t
2.3.1 Umordnungen
Wir haben gesehen, dass die partielle Vorsummierung von Reihen ein wichtiges
Hilfsmittel für die Untersuchung von Konvergenz ist. Folgendes Beispiel zeigt, dass
man hierbei leicht Fehler machen kann: Wir betrachten die Reihe S mit S n = n an
P
mit an = (−1)n+1 . Indem wir die Paare von aufeinander folgenden Terme zusammen
fassen, also b` = a2` − a2`−1 setzen, erhalten wie n an = ` b` . Nun ist aber b` =
P P
1−1 = 0, also gilt n an = 0. Natürlich haben wie hier gemogelt. Was wir auf diesem
P
Weg nur zeigen könnten, ist, dass S 2n = 2n n+1 = 0, und damit gibt es einen
P
k=1 (−1)
Unterfolge, die gegen Null konvergiert. Andererseits ist S 2n+1 = 1, und somit gibt
es eine weitere Unterfolge, die nach 1 konvergiert.
Eine andere Operation, die mit Vorsicht zu genießen ist, ist die Umordnung. Dazu
sei τ : N → N eine bijektive Abbildung. Sei a eine Folge und sei b die umgeordnete
Folge bn = aτ(n) . Man kann sich fragen, ob die Reihen S = n an und Σ = n bn den
P P
2.3 Reihen 51
selben Grenzwert haben (oder gemeinsam divergieren). Es zeigt sich, dass dies nur
bei absolut konvergenten Reihen der Fall ist.
Lemma 2.31. Seien a, b, S , Σ wie oben beschrieben. Dann ist lim S = lim Σ für alle
Umordnungen τ, genau dann wenn S absolut konvergent ist.
Beweis. Wir nehmen an, dass S absolut konvergiert. Für jedes n0 ∈ N muss es ein
N ∈ N geben, so dass das Bild der Menge {1, . . . , N} unter τ die Menge {1, . . . , n0 }
enthält (denn τ ist surjektiv: jedes Element von N liegt im Bild von τ). Damit kom-
men in den Summen S N und ΣN alle Terme ak mit k ≤ n0 vor und es folgt
∞
X
|S N − ΣN | ≤ |ak |. (2.35)
k=n0 +1
(die Summe auf der rechten Seite kann sogar durch eine endliche Summe ersetzt
werden). Wegen der absoluten Konvergenz von S ist die rechte Seite kleiner als
jedes 1/K, falls nur n0 groß genug gewählt wird. Damit folgt, ∀K∈N ∃N∈N ∀ M≥N :
| lim S − Σ M | < 1/K, und Σ konvergiert gegen den selben Grenzwert wie S .
Sei nun umgekehrt S konvergent aber nicht absolut konvergent. Es sei (an )+ =
max(an , 0) und (an )− = max(−an , 0) Es seien S + , S − die zugehörigen Reihen. Wir
wissen, dass S + − S − = S konvergiert und S + + S − = |an | divergiert. Dann muss
P
sowohl die Reihe S + als auch die Reihe S − divergieren (Warum?). Wir wollen eine
Umnummerierung τ konstruieren, die eine Teilfolge enthält, die gegen einen belie-
bigen Wert s konvergiert. Wir nehmen ohne Beschränkung der Allgemeinheit an,
dass s ≥ 0. Dann wählen wir σ(1) als das erste Mal, das die Reihe S + den Wert s
überschreitet,
σ(1) = inf{k : S + (k) ≥ s}, (2.36)
Als nächstes nehmen wir aus der Reihe der negativen Reihenglieder so viele, dass
wenn wir diese auf S + (σ(1) aufaddieren, wir wieder unter den Wert s fallen, d.h.
wir setzen
σ(2) = inf{k : S + (σ(1)) − S − (k) ≤ s}. (2.37)
Dann wissen wir, dass S + (σ(1)) > s und S + (σ(1)) − S − (σ(2)) ≤ s. Ausserdem wis-
sen wir, dass S + (σ(1)) − s ≤ a(σ(1)) und S + (σ(1)) − S − (σ(2)) − s ≥ a(σ(2)). Wir
iterieren nun, indem wir setzen
σ(2n − 1) = inf{k > σ(2n − 3) : S + (k) − S − (σ(2n − 2)) > s}, (2.38)
+
σ(2n) = inf{k ≥ σ(2n − 2) : S (σ(2n − 1)) − S (k) ≤ s}.
−
(2.39)
Nach Konstruktion ist 0 ≤ S + (σ(2n − 1)) − S − (σ(2n − 2)) − s ≤ |aσ(2n−1) |, und ent-
sprechend 0 ≥ S + (σ(2n − 1)) − S − (σ(2n)) − s ≥ −|aσ(2n) |. Da die Reihen S ± monoton
wachsen und nach +∞ uneigentlich konvergieren, folgt, dass σ(2n) und σ(2n − 1)
für alle n ∈ N existieren. Ausserdem streben die beiden Folgen jeweils nach +∞. Da
die Reihenglieder a Nullfolgen sind, sehen wir, dass die Folge
Σn = S − (σ(2n)) − S + (σ(2n − 1)), n ∈ N, (2.40)

nach s konvergiert. Andererseits ist die Reihe Σ eine Teilfolge einer Umordnung der
Reihe S . Dies sieht man, indem wir schreiben
Σn = [S + (σ(1)) − S − (σ(2))] + [S + (σ(3)) − S + (σ(1))] − [S − (σ(4)) − S − (σ(2))] + . . .

· · · − [S − (σ(2n − 1)) − S − (σ(2n − 3)) + [S + (σ(2n)) − S + (σ(2n − 2))]. (2.41)
t
u
2.3.2 Mehrfachreihen
Eine wichtige Verallgemeinerung des Reihenbegriffs sind mehrfache unendliche

Summen. Dazu sei zunächst a : N × N → R eine Funktion. Wir bezeichnen die Funk-
tionswerte mit ai j , i, j ∈ N und schreiben auch (ai j )i, j∈N . Die Frage ist nun, ob und
wie wir eine doppelte unendliche Summe S = (i, j)∈N×N ai j definieren können.
P
Eine Möglichkeit wäre wir folgt vorzugehen. Für i ∈ N definiere S n(i) = nj=1 ai j .
P
Falls für jedes i die Reihe S (i) konvergiert, so sei si = lim S (i) . Dann ist (si )i∈N ei-
ne Folge und wir können die zugehörige Reihe Σn = ni=1 si definieren. Falls diese
P
Reihe konvergiert, so wäre dies ein Kandidat für S . Allerdings könnten wir auch
( j)
S n = ni=1 ai j beginnen. Wenn diese
P
umgekehrt vorgehen, und mit den Summen b
konvergieren, so setzen wir σ j = lim b S ( j) und Σ
bn = Pn σ j . Es stellt sich die Fra-
j=1
ge, ob beide Vorgehensweisen dasselbe Resultat liefern. Da es sich hier wieder um
Umsortierungen von Summen handelt, wissen wir schon, dass Vorsicht geboten ist.
Wir zeigen zunächst, dass alles gut geht, falls die Funktion a nicht negativ (oder
entsprechend nicht positiv) ist. Wir führen die Bezeichnung R+ = {x ∈ R : x ≥ 0} ein.
Satz 2.32 (Fubini). Sei a : N × N → R+ eine nicht-negative Funktion. Wenn die

oben definierte Reihe Σ konvergiert, dann konvergiert auch Σ
b und lim Σ = lim Σ.
b
Sei Jn ⊂ N × N eine Folge von endlichen Teilmengen von N × N mit den Eigen-
schaften:
(i) Für alle n ∈ N gilt Jn ⊂ Jn+1 , und
(ii) Für jede endliche Teilmenge I ⊂ N × N existiert ein n ∈ N so dass I ⊂ Jn .
Dann konvergiert die Folge S nJ ≡ (i, j)∈Jn ai j , n ∈ N, gegen lim Σ.
P
Funktionen mit dieser Eigenschaft nennen wir summierbar.
Beweis. Wir beginnen mit der Annahme, dass die Folge Σ gegen einen Grenzwert
( j)
S n = ni=1 ai j kon-
S ( j) mit b
P
in R konvergiert. Dann folgt zunächst, dass alle Reihen b
vergieren. Denn es ist
n
X X ∞
n X n
X
( j)
Sn =
b ai j ≤ ai j = si ≤ lim Σ < ∞, (2.42)
i=1 i=1 j=1 i=1
S ( j) = σ j . Weiter ist
S ( j) beschränkt und daher konvergent. Wir setzen lim b
also ist b
2.3 Reihen 53
n
X n X
X N ∞
n X
X
σj = ai j + ai j (2.43)
j=1 j=1 i=1 j=1 i=N+1
< 1/(nK). Daher

P∞
Nun gibt es für jedes K ∈ N ein N, so dass für alle j ≤ n, i=N+1 ai j
ist für jedes K ∈ N
n
X N X
X n ∞
n X
X
σj = ai j + ai j
j=1 i=1 j=1 j=1 i=N+1
∞
N X
X
≤ ai j + 1/K
i=1 j=1
N
X
= si + 1/K ≤ lim Σ + 1/K. (2.44)
i=1
Daraus folgt, dass auch die Reihe Σ b beschränkt ist und konvergiert. Es bleibt zu
zeigen, dass die Grenzwerte gleich sind. Da wir nun wissen, dass auch Σ b konver-
giert, können wir das vorhergehende Argument umgekehrt laufen lassen lassen und
erhalten sofort, dass lim Σ ≤ lim Σ,
b was Gleichheit der Grenzwerte impliziert.
Alternativ können wir auch so vorgehen. Wir
n X
X n ∞
n X
X
Σn = ai j + ai j (2.45)
i=1 j=1 i=1 j=n+1
Xn X n Xn X ∞
Σ
bn = ai j + ai j . (2.46)
j=1 i=1 j=1 i=n+1
Die beiden ersten Terme in diesen Gleichungen sind offenbar identisch. Die zwei-
ten Terme konvergieren gegen Null, wenn n ↑ ∞. Dazu zeigt man (mit demselben
Argument wie oben), dass
∞
n X
X ∞ X
X ∞
ai j ≤ ai j = lim Σ
b− Σ
bn , (2.47)
i=1 j=n+1 j=n+1 i=1
was wegen der Konvergenz von Σ b mit n gegen Null strebt. Für den zweiten Term
von (2.44) geht man analog vor. Wir haben damit nicht nur die Gleichheit der Grenz-
werte gezeigt, sondern auch, dass
n X
X n
lim Σ = lim Σ
b = lim ai j . (2.48)
n↑∞
i=1 j=1
Damit können wir nun den zweiten Teil des Satzes beweisen. Wir nennen Ik = {(i, j) :
1 ≤ i, j ≤ k}. Dann gilt wegen der Definition der Jn : Für jedes m ∈ N existieren
m ≤ n ≤ ` ∈ N : Im ⊂ Jn ⊂ I` . Damit gilt aber
X X X
ai j ≤ ai j ≤ ai j . (2.49)
(i, j)∈Im (i, j)∈Jn (i, j)∈I`
Daraus folgt
X X X X
lim ai j ≤ lim inf ai j ≤ lim sup ai j ≤ lim ai j . (2.50)
m↑∞ n↑∞ n↑∞ `↑∞
(i, j)∈Im (i, j)∈Jn (i, j)∈Jn (i, j)∈I`
Da die linken und rechten Grenzwerte existieren und gleich sind, folgt die Aussage.
t
u
Im allgemeinen Fall ist es am einfachsten, die Summen der positiven und der
negativen Terme getrennt zu betrachten. Wir setzen wie schon früher (ai j )+ =
max(ai j , 0) und (ai j )− = max(−ai j , 0).
Definition 2.33 (Summierbarkeit). Eine Funktion a : N×N → R heißt summierbar,

genau dann wenn die Funktionen (a)+ und (a)− summierbar sind. Es ist dann
X X X
ai j = (ai j )+ − (ai j )− . (2.51)
(i, j)∈N×N (i, j)∈N×N (i, j)∈N×N
Die Aussage des Satzes 2.32 gilt auch für nicht positive summierbare Funktio-
nen. Es ist offensichtlich, dass eine Funktion a summierbar ist wenn die positive
Funktion |a| summierbar ist.
Eine weiter Folgerung ist folgender Satz.
Satz 2.34. Seien S = n an und T = n bn absolut konvergente Reihen. Dann ist die
P P
Funktion d : N × N → R mit dnm = an bm summierbar und es gilt
X
lim S lim T = dnm (2.52)
(n,m)∈N×N
Beweis. Übungsaufgabe! t
u
Anmerkung. Alles was wir über Doppelsummen gesagt haben kann ohne Mühe auf
P
vielfache Summen der Form k1 ,...,k` ak1 ...k` verallgemeinert werden.
Kapitel 3
Funktionen
In diesem Kapitel kommen wir zu einem weiteren zentralen Objekt der Analysis,
den reellen Funktionen. Während bei Folgen, also Funktionen auf N nur das Ver-
halten bei ’Unendlich’ interessante Eigenschaften hatte (im Endlichen gibt es nur
endlich viele Funktionswerte), ist bei Funktionen auf R auch das ’lokale’ Verhalten
von Interesse, ja es ist gerade die wesentliche Aufgabe der Analysis, dieses Verhal-
ten zu beschreiben.
3.1 Elementare Funktionen
Definition 3.1. Sei D ⊆ R eine Teilmenge der reellen Zahlen. Eine reelle Funktion
mit Definitionsbereich D ist eine Abbildung f : D → R.
Notation. Eine Funktion wird in der Regel mit einem Buchstaben bezeichnet, z.B.
f (es gibt aber keinen Grund, eine Funktion nicht x zu nennen....). In der Regel wird
bei der Einführung einer Funktion Definitionsbereich und die Menge, in der das
Bild enthalten sind, angegeben. Oft kürzen wir aber auch ab und sagen nur ¨ Sei f
eine reelle Funktion¨. Für x ∈ D schreiben wir f (x) für diejenige reelle Zahl, für die
(x, f (x)) ∈ f . Alternativ schreibt man dafür auch x → f (x), also man sagt, f sei die
Funktion, die alle x ∈ D nach f (x) abbildet. Wir nennen f (x) den Wert der Funktion
an der Stelle x. f (x) ist keine Funktion!! Oft wird eine Funktion beschrieben, indem
eine Rechenregel angegeben wird, mittels derer der Funktionswert an jeder Stelle
x ∈ D bestimmt werden kann. Wir sagen dann korrekterweise: f ist die Funktion,
für die für jedes x ∈ D, f (x) = Rechenvorschrift(x). Zum Beispiel sei f : R → R die
Funktion, für die ∀ x∈R , f (x) = x2 . x2 is keine Funktion, sondern das Quadrat der
Zahl x. Wenn keine Missverständnisse aufkommen können, vergessen wir schon
mal zu betonen, dass f (x) = x2 für alle x ∈ R gelten soll und sagen kurz: Sei f die
Funktion für die f (x) = x2 . Funktionen, die durch Rechenoperationen definiert sind,
haben einen natürlichen maximalen Definitionsbereich in dem diese Rechenopera-
tion definiert ist. So können wir etwa die Funktion f , für die f (x) = 1/x sein soll
maximal auf der Menge R\{0} definieren.
55
56 3 Funktionen
Die einfachste Funktion ist die konstante Funktion für die f (x) = c, x ∈ D für ein
c ∈ R. Die einfachsten nicht-trivialen Funktionen sind die affinen Funktionen, für die
f (x) = a+cx, x ∈ D, mit a, c ∈ R fest. Wenn a = 0 nennt man die Funktion auch linear,
und manchmal verwenden wir die Begriffe affin und linear synonym. Wir werden
später sehen, dass die affinen Funktionen eine ganz besondere Rolle spielen. Affine
Funktionen können wir natürlich stets für D = R definieren.
Eine Funktion pn : R → R heißt ein Polynom vom Grad n, wenn es n ∈ N,
a0 , a1 , . . . , an−1 ∈ R und an , 0 gibt, so das für alle x ∈ R,
n
X
pn (x) = a0 + a1 x + a2 x2 + · · · + an xn = ak xk . (3.1)
k=0
Wenn p(x) = 0, so nennen wir x eine Nullstelle des Polynoms p.

Beispiel 3.2 (Binomialsatz). Ein wichtiges Beispiel ist die Funktion p für die für alle
x ∈ R,
pn (x) = (1 + x)n , (3.2)
mit n ∈ N. Unter Verwendung des Distributivgesetzes sieht man, dass für alle x ∈ R,
n
X
pn (x) = ck(n) xk , (3.3)
k=0
mit gewissen Konstanten c(n) k

. Man kann sich leicht überlegen, dass alle ck(n) ∈ N
liegen, und dass c(n) (n)
0 = cn = 1 gelten muss. Ausserdem kann man eine rekursive
Formel für diese Konstanten herleiten, da gilt
n−1
X n
X
c(n−1) c(n−1) (n−1) k

pn (x) = (1 + x)pn−1 (x) = k
xk (1 + x) = k
+ c k−1
x, (3.4)
k=0 k=0
wobei wir c(n−1)

−1 = c(n−1)
n = 0 setzen. Damit erhalten wir, dass
ck(n) = c(n−1)
k
+ c(n−1)
k−1
. (3.5)
Diese Rekursion
n liefert genau das Pascalsche Dreieck für die Binomialkoeffizienten,
d.h. c(n)
k
= k = (n−k)!k! . Man kann leicht nachrechnen, dass dies (3.5) erfüllt, und
n!
dann mit vollständiger Induktion beweisen, dass diese Gleichung in der Tat für alle
n ∈ N und 0 ≤ k ≤ n gilt.
Eine Funktion r : D → R heißt rationale Funktion, wenn es zwei Polynome, p, q
gibt, so dass für alle x ∈ D
p(x)
r(x) = . (3.6)
q(x)
Hier muss natürlich gelten, dass ∀ x∈D q(x) , 0. Der größtmögliche Definitionsbe-
reich einer rationalen Funktion ist R vermindert um die Nullstellen des Polynoms
q.
3.2 Potenzreihen 57
Eine weitere Klasse von Funktionen sind die rationalen Potenzen, für die f (x) =
xq , mit q ∈ Q. Hier ist der Definitionsbereich im Allgemeinen maximal R+ oder so-
gar R+ \{0}. Weiter sind natürlich Summen und Produkte von Funktionen auch wie-
der Funktionen. Die bisher beschriebene Klasse von Funktionen hat die angenehme
Eigenschaften, dass sich die Funktionswerte explizit berechnen lassen, zumindest
für rationale x. Für allgemeine x ∈ R müssen wir eine rationale Cauchy-Folge in
der Äquivalenzklasse von x und die Funktion auf den Folgengliedern auswerten.
Nach unseren Rechenregeln für reelle Zahlen liefert dies wieder eine Cauchy-Folge
welche den Funktionswert repräsentiert.
3.2 Potenzreihen
Die oben beschriebenen Funktionen sind nur eine sehr kleine Teilmenge aller reellen
Funktionen, etwa wie die rationalen Zahlen nur eine winzige Untermenge der reel-
len Zahlen sind. Eine weitere wichtige Klasse sind Funktionen, deren Werte durch
konvergente Reihen gegeben sind.
Definition 3.3. Eine reelle Funktion f : D → R heißt Potenzreihe, wenn es eine re-
elle Folge a gibt, so dass für alle x ∈ D,
(i) die Reihe ∞ n
P
n=0Pan x konvergiert, und
(ii) ∀ x∈D : f (x) = n=0 an xn .
∞
Gegeben eine Folge a können wir natürlich stets eine Potenzreihe konstruieren.
Wir setzen dazu D = {x ∈ R : ∞ an xn konvergiert} und definieren die Funktion
P
Pn=0
f : D → R, so dass ∀ x∈D , f (x) = n=0 an xn .
∞
Definition 3.4. Sei a eine reelle Folge. Dann heißt r der Konvergenzradius der Po-
tenzreihe ∞ n
P
n=0 an x genau dann, wenn Folgendes gilt:
(i) Für alle x ∈ R mit |x| < r ist ∞ a xn absolut konvergent, und
P
P∞n=0 n n
(ii) für alle x ∈ R mit |x| > r ist n=0 an x divergent.
Wenn (i) für alle r ∈ R+ gilt, so sagen wir, der Konvergenzradius sei +∞.
Beachte, dass für |x| = r die Reihe sowohl konvergieren als auch divergieren kann.
Dass der Begriff des Konvergenzradius sinnvoll ist, folgt aus der Tatsache, dass
wenn eine Potenzreihe bei x konvergiert, die Reihe dann für alle y mit |y| < |x| absolut
konvergiert. Ebenso gilt, dass, wenn die Reihe für x nicht absolut konvergiert, dann
für alle y mit |y| > |x| die Reihe divergiert.
Lemma 3.5. Jede Potenzreihe ∞ n
P
n=0 an x besitzt einen Konvergenzradius r ∈ R+ ∪
{+∞}. Es gilt
X∞
r = sup{t ∈ R+ : |an |tn konvergiert}, (3.7)
n=0
mit der Konvention, dass r = +∞, falls das Supremum nicht existiert.
58 3 Funktionen
Beweis. Übung! Das Lemma folgt leicht unter Verwendung des Wurzelkriteriums.
Es folgt daraus auch, dass r = 1/ lim sup |an |1/n ist. u t
P∞
Anmerkung. Statt Potenzreihen der Form n=0 an xn kann man natürlich auch Po-
tenzreihen der Form ∞ n
P
n=0 an (x − x0 ) , für x0 ∈ R betrachten.
3.2.1 Die Exponentialfunktion
Ein wichtiges Beispiel einer Potenzreihe ist die Exponentialfunktion, exp. Dazu be-
xn
trachten wir die Reihe ∞
P
n=0 n! , x ∈ R. Wir zeigen zunächst.
P∞ xn
Lemma 3.6. Für jedes x ∈ R ist die Reihe n=0 n! absolut konvergent.
Beweis. Es gilt |x| |x|n/(n+1)!

n+1 |x|
/n! = n+1 . Für alle x ∈ R konvergiert dies aber gegen 0, und
somit folgt die Behauptung aus dem Quotientenkriterium. u t
Wir können also die Funktion exp : R → R definieren, indem wir für alle x ∈ R,
∞ n
X x
exp(x) = , (3.8)
n=0
n!
setzen. Wir kommen später noch auf die Exponentialfunktion zurück. Hier wollen
wir aber schon einige Eigenschaften herleiten.
Lemma 3.7. Es gilt für jedes x ∈ R,
lim exp(x + 1/`) = exp(x) (3.9)

`↑∞
und
lim exp(x − 1/`) = exp(x). (3.10)
`↑∞
Beweis. Wir zeigen (3.9), der Beweis von (3.10) ist ganz analog. Für jedes feste m
gilt
m ∞
X (x + 1/`)k X (x + 1/`)k
exp(x + 1/`) = + . (3.11)
k=0
k! k=m+1
k!
Zunächst sieht man leicht, dass
m m
X (x + 1/`)k X xk
lim = . (3.12)
`↑∞ k! k!
k=0 k=0
Weiter ist
m ∞
X xk X xk
= exp(x) − . (3.13)
k=0
k! k=m+1
k!
3.2 Potenzreihen 59
Aus der absoluten Konvergenz der Exponentialreihe folgt, dass wir m so wählen
können, dass für jedes |y| ≤ 1,
∞ ∞
X (x + y)k X (|x| + 1)k
≤ ≤ 1/(2K). (3.14)
k=m+1
k! k=m+1
k!
(|x|+1)k
Dazu wählt man einfach m so, dass selbst ∞
P
k=m+1 k! ≤ 1/(2K). Damit ist für
jedes K
lim sup exp(x + 1/`) ≤ exp(x) + 1/K, (3.15)
`↑∞
und
lim inf exp(x + 1/`) ≥ exp(x) − 1/K, (3.16)
`↑∞
Hieraus folgt aber, dass lim sup und lim inf gleich exp(x) sind und somit folgt die
Behauptung. u t
Lemma 3.8 (Euler). Für jedes x ∈ R gilt
x n
lim 1 + = exp(x). (3.17)
n↑∞ n
Beweis. Aus dem Binomialsatz erhalten wir, dass
n
x n X n! xk
1+ = . (3.18)
n k=0
(n − k)!k! nk
Nun ist !k
n! (n − 1) (n − 2) (n − k + 1) k
1≥ k
= ... ≥ 1− , (3.19)
(n − k)!n n n n n
Wir betrachten zunächst den Fall x ≥ 0. Dann ist
n
x n X xk
1+ ≤ = Bn (x) ≤ exp(x), (3.20)
n k=0
k!
und für ein festes m < n,

n !k X m !k
x n X xk k xk k m m
1+ ≥ 1− ≥ 1− ≥ 1− Bm (x). (3.21)
n k=0
k! n k=0
k! n n
Für jedes m ∈ N gilt m m

lim 1 − =1 (3.22)
n↑∞ n
Also gilt für jedes m ∈ N,
x n x n
Bm (x) ≤ lim inf 1 + ≤ lim sup 1 + ≤ exp(x). (3.23)
n↑∞ n n↑∞ n
60 3 Funktionen
Da für alle x ∈ R, limm↑∞ Bm (x) = exp(x), folgt (3.17) für nicht-negatives x. Für den
Fall x < 0 geht der Beweis ganz ähnlich, man muss lediglich die Abschätzungen für
die geraden und ungeraden Partialsummen getrennt durchführen. u t
Wir benutzen diese Beobachtung um eine wichtige Eigenschaft der Exponential-

funktion herzuleiten.
Lemma 3.9. Die Exponentialfunktion ist monoton wachsend.
Beweis. Wir stellen zunächst fest, dass für jedes x ∈ R es n0 ∈ N gibt, so dass für alle
n ≥ n0 und y ≥ x, (1 + y/n) > 0. Damit ist für diese n richtig, dass (1 + y/n)n monoton
wachsend als Funktion von y ≥ x, und damit ist auch der Limes monoton wachsend.
Da dies aber für alle x ∈ R gilt, ist exp monoton wachsend. u t
Satz 3.10. Für alle x, y ∈ R gilt, dass
exp(x + y) = exp(x) exp(y). (3.24)
Beweis. Es gilt
x n y n x y n x + y xy n
1+ 1+ = 1+ 1+ = 1+ + 2 . (3.25)
n n n n n n
Sei xy ≥ 0. Dann gilt für hinreichend große n (wegen der Monotonie von (1 + x/n)n )
x + y n x + y xy n
1+ ≤ 1+ + 2 (3.26)
n n n
und somit x n y n
exp(x + y) ≤ lim 1 + 1+ = exp(x) exp(y). (3.27)
n↑∞ n n
Nun gibt es für jedes x, y ∈ R und für jedes ` ∈ N ein n0 ∈ N, so dass für alle n ≥ n0 ,
xy/n ≤ 1/`. Daher gilt wieder wegen der Monotonie für hinreichend große n
#n
x + y xy n x + y + 1/`
"
1+ + 2 ≤ 1+ . (3.28)
n n n
Daher gilt für alle ` ∈ N,
exp(x) exp(y) ≤ exp(x + y + 1/`). (3.29)
Wegen Lemma 3.7 gilt weiter, dass
exp(x) exp(y) ≤ lim inf exp(x + y + 1/`) = exp(x + y). (3.30)

`↑∞
Der Fall xy < 0 geht ganz genauso mit umgekehrten Ungleichungen. t

u
Wir werden später zeigen, dass die Exponentialfunktion durch die Forderung,
dass (3.24) gelte, eindeutig festgelegt ist.
3.2 Potenzreihen 61
Aus der Gleichung (3.24) folgen unmittelbar folgende elementare Eigenschaften

der Funktion exp.
Korollar 3.11. Es gilt für die Exponentialfunktion:

(i) exp(0) = 1;
(ii) ∀ x∈R : exp(x) > 0;
(iii) exp is streng monoton wachsend: ∀ x>y : exp(x) > exp(y); insbesondere ist die
Funktion bijektiv mit Wertebereich R+ .
Man bezeichnet den Funktionswert exp(1) = e als Euler’sche Zahl. Aus der Glei-
chung (3.24) folgt, dass für jedes n ∈ N,
exp(n) = en . (3.31)
Außerdem gilt für jedes n ∈ N,
exp(1/n)n = exp(1) = e. (3.32)
Also ist exp(1/n) = e1/n . Dann folgt ebenso, dass für jedes q ∈ Q,
exp(q) = eq . (3.33)
Es ist daher naheliegend, die reelle Potenz der Zahl e zu definieren als
e x = exp(x). (3.34)
Als letztes machen wir die Beobachtung, dass die Exponentialfunktion schneller
als jede Potenz wächst.
Lemma 3.12. Für jedes n ∈ N gilt: Es gibt x0 ∈ R+ , so dass für alle x ≥ x0 ,

exp(x)
> x/x0 > 1. (3.35)
xn
Beweis. Wir benutzen nur die offensichtliche Tatsache, dass für x ∈ R+ , exp(x) >
xn+1
(n+1)! , und damit
exp(x) x
≥ . (3.36)
x n (n + 1)!
Also gilt (3.35) für alle x > x0 = (n + 1)!. t
u
3.2.2 Der Logarithmus
Da exp bijektiv ist, existiert eine inverse Funktion, ln : R+ \{0} → R, definiert durch
die Eigenschaft, dass für alle x ∈ R+ \{0},
62 3 Funktionen

ln exp(x) = x,


 ∀x ∈ R,
(3.37)
exp (ln(x)) = x,

 ∀x ∈ R+ \{0}.
Die Funktion ln heißt Logarithmus. Folgende Eigenschaften folgen aus denen der
Exponentialfunktion.
Lemma 3.13. (o) Der Bildbereich von ln ist R.
(i) ln : R+ \ {0} → R ist bijektiv.
(ii) ln ist monoton wachsend.
(iii) ln(1) = 0.
(iv) Für alle x, y ∈ R+ \{0} gilt ln(x) + ln(y) = ln(xy).
Beweis. Übung. t
u
Aus Lemma 3.12 für die Exponentialfunktion folgt dass der Logarithmus lang-
samer als jede Wurzel wächst.
Korollar 3.14. Für jedes n ∈ N gilt: Es gibt x0 ∈ R+ , so dass für alle x ≥ x0 ,
ln(x)
< x0 /x. (3.38)
x1/n
Beweis. Übung. t
u
3.2.3 Die trigonometrischen Funktionen
Eng verwandt (was wir später noch deutlicher sehen werden) sind die Funktionen
sin und cos, die als Potenzreihen wie folgt definiert werden können: Für alle x ∈ R
ist
∞
X x2k
cos(x) = (−1)k , (3.39)
k=0
(2k)!
∞
X x2k+1
sin(x) = (−1)k . (3.40)
k=0
(2k + 1!
Mas sieht sofort, dass diese Reihen durch die Exponentialreihe dominiert werden
und daher für alle x ∈ R absolut konvergieren. Im Gegensatz zur Exponentialfunkti-
on sind diese Funktionen sogar beschränkt!
Lemma 3.15. Für alle x ∈ R gilt
sin2 (x) + cos2 (x) = 1. (3.41)
Beweis. Der Beweis ist sehr einfach. Wegen der absoluten Konvergenz können wir
Satz 1.59 benutzen und einfach ausmultiplizieren und umsortieren, als hätten wir es
mit endlichen Summen zu tun. Damit ist
3.3 Stetigkeit und lokales Verhalten von Funktionen 63
∞ n
X X 1
cos2 (x) = (−1)n x2n , (3.42)
n=0 k=0
(2k)!(2n − 2k)!
und
∞ n
X X 1
sin2 (x) = (−1)n x2n+2
n=0 k=0
(2k + 1)!(2n − 2k + 1)!
∞ n−1
X X 1
=− (−1)n x2n
n=1 k=0
(2k + 1)!(2n − 2k − 1)!
(3.43)
Nun ist
∞ n ∞ n−1
X X 1 X X 1
(−1)n x2n − (−1)n x2n
n=1 k=0
(2k)!(2n − 2k)! n=1 k=0
(2k + 1)!(2n − 2k − 1)!
∞
 n n−1

X X 1 X 1 
= n 2n 
(−1) x  −
 
n=1
(2k)!(2n − 2k)!
k=0
(2k + 1)!(2n − 2k − 1)! 
k=0
∞ 2n
1
(−1)`
X X
= (−1)n x2n
n=1 `=0
`!(2n − `)!
∞
X 1
= (−1)n x2n (1 − 1)2n = 0. (3.44)
n=1
2n!
Daher bleibt von cos2 (x) + sin2 (x) nur der n = 0-Term von cos übrig, der gleich 1 ist.
Daraus folgt die Behauptung. u t
Lemma 3.15 impliziert, dass sin(x) and cos(x) die Seitenlängen der Katheten
eines rechtwinkligen Dreiecks mit Hypothenuse der Länge 1 sind. Es ist naheliegend
zu glauben, dass x den Öffnungswinkel dieses Dreiecks darstellt, was wir später
auch noch zeigen werden. Im Moment ist dies allerdings noch nicht offensichtlich.
3.3 Stetigkeit und lokales Verhalten von Funktionen
Bereits bei der Betrachtung der Exponentialfunktion haben wir gesehen, dass es in-
teressant ist zu wissen, wie sich eine Funktion in der Nähe eines Punktes verhält.
Die Beobachtung (3.33) wirft auch die interessante Frage auf, ob denn die Exponen-
tialfunktion durch ihre Werte auf den rationalen Zahlen vielleicht schon bestimmt
ist? Diese Frage ist natürlich angesichts der Unmenge von reellen Zahlen immer
interessant. Wie kann man überhaupt den Wert einer Funktion an einer reellen Zahl
erhalten? Bei den allgemeinen Rechenregeln für reelle Zahlen hatten wir ja gesagt,
64 3 Funktionen
dass wir eine rationale Cauchyfolge die nach x konvergiert auswählen, dann die
Rechenoperationen auf den Folgengliedern ausführen und dann eine neue Cauchy-
Folge erhalten, deren Limes das gesuchte Ergebnis der Rechnung ist.
Für eine reelle Funktion f stellt sich nun die Frage, on wir so auch vorgehen
können, um einen Funktionswert an einer reellen Zahl x zu bestimmen. Also: Sei
x ∈ R und q Cauchy-Folge in D mit Limes x. Stimmt es, dass f (x) = limn→∞ f (qn ),
und dies für alle Cauchy-Folgen in D in der Äquivalenzklasse von x? Es ist klar, dass
dies im Allgemeinen falsch sein wird. Dazu genügt es, die Funktion f zu betrachten,
für die 
1, wenn x = 0,

f (x) = 

(3.45)
0, wenn x , 0.

Hier gilt z.b. limn↑∞ f (1/n) = 0 , f (0).

Falls diese Eigenschaft doch einmal gilt, so nennen wir die Funktion f stetig am
Punkt x.
Definition 3.16 (Stetigkeit). Eine reelle Funktion f : D → R heißt stetig an einem
Punkt x ∈ D, genau dann, wenn für jede Cauchy-Folge a in D mit lim a = x, die
Folge f (a) mit Folgengliedern f (an ), n ∈ N, eine Cauchy-Folge mit Grenzwert f (x)
ist.
Anmerkung. Anstatt umständlich, aber exakt zu schreiben: f̈ür jede Cauchy-Folge a
mit Grenzwert x, ist f (a).......”werden wir auch die (etwas schlampige) Abkürzung
benutzen, “Wenn y → x, dann f (y) → f (x)”.
Anmerkung. Wir können die Definition der Stetigkeit auch wie folgt umformulie-
ren: Eine Funktion f ist stetig bei x ∈ R, wenn für jede Cauchy-Folgen a, b in D
in der Äquivalenzklasse x gilt, dass f (a) und f (b) Cauchy-Folgen sind und f (a)
äquivalent zu f (b) ist.
Das folgende Lemma gibt eine alternative und sehr verbreitete ¨ −δ¨-Formulierung
der Stetigkeitseigenschaft.
Lemma 3.17 (Stetigkeit). Eine reelle Funktion f : D → R ist stetig an einem Punkt
x ∈ D genau dann, wenn
∀>0 ∃δ>0 ∀y∈D:|x−y|<δ : | f (x) − f (y)| < . (3.46)
In Worten kann dies auch so formuliert werden: Für jedes > 0 gibt es eine δ-
Umgebung von x, so dass für jeden Punkt y in dieser Umgebung, f (y) in einer -
Umgebung von f (x) liegt.
Beweis. Dass aus (3.46) folgt, dass für jede Cauchy-Folge a in D mit Grenzwert x,
gilt, dass lim f (a) = f (x) sollte klar sein. Um die Gegenrichtung zu zeigen, nehmen
wir an, dass (3.46) nicht gilt. Dann existiert >, so dass jedes δ > 0 ein y ∈ D existier,
so dass |y − x| < δ aber | f (y) − f (x)| ≥ . Nehmen wir nun zum Beispiel δ = 1/n und
yn das jeweils existierende y für δ = 1/n, dann ist einerseits klar, dass die Folge y
nach x konvergiert, nicht aber die Folge f (y), da ja für alle n ∈ N, | f (yn ) − f (x)| ≥
ist. u t
Definition 3.18 (Stetigkeit). Eine reelle Funktion f : D → R heißt stetig in D genau

dann, wenn f in jedem Punkt x ∈ D stetig ist.
Stetige Funktionen sind in der Tat durch ihre Werte auf den rationalen Zahlen
festgelegt (wenn D genug rationale Zahlen enthält. Im wesentliche denken wir an
Mengen die offene oder abgeschlossene Intervalle, Halbachsen, oder ganz R sind).
Satz 3.19. Sei D ⊆ R eine Menge mit der Eigenschaft, dass für alle x ∈ D eine
Cauchy-Folge rationaler Zahlen in D existiert, so, dass lim q = x. Seien g, f : D → R
stetig auf D. Dann ist f = g genau dann, wenn ∀q∈D∩Q : f (q) = g(q).
Beweis. Übung.
Wie wir schon bemerkt haben, sind alle Rechenoperationen auf den reellen Zah-
len gerade über Grenzwerte von rationalen Cauchy-Folgen definiert. Daher gilt so-
fort:
Lemma 3.20 (Stetigkeit elementarer Funktionen). Alle elementaren (d.h. die Po-
lynome und die rationalen) Funktionen sind auf ihren Definitionsbereichen stetig.
Auch Potenzreihen neigen zur Stetigkeit.
Lemma 3.21 (Stetigkeit absolut konvergenter Potenzreihen). Sei f : D → R eine

Potenzreihe, so dass für alle x ∈ D die Reihe absolut konvergiert. Dann ist f in D
stetig.
Beweis. Der Beweis funktioniert wieder nach dem Prinzip: Zerlege dir Potenzreihe
in ein Polynom und einen Rest. Dann ist das Polynom stetig, und der Rest so klein
wie man will! Sei also > 0 beliebig. Wir schreiben für ein gegebenes x ∈ D
m
X ∞
X
f (x) = ak x k + ak xk = Pm (x) + Rm (x). (3.47)
k=0 k=m+1
Nun ist
∞
X
|Rm (x)| ≤ |ak ||x|k (3.48)
k=m+1
der Rest einer konvergenten Reihe und es gibt m ∈ N so, dass |Rm (x)| < /4, Weiter
gibt es δ0 >, so die Reihe auch für alle y ∈ D mit |x − y| < δ0 absolut konvergiert und
somit können wir m so wählen, dass auch maxy∈D:|x−y|≤δ0 |Rm (y)| < /4. Für dieses
m ist Pm immer noch ein Polynom und daher stetig, d.h. es gibt ein δ mit δ0 > δ > 0
so, dass für alle y : |x − y| < δ, |Pm (x) − Pm (y)| < /2. Dann ist aber für alle y mit
|x − y| < δ,
| f (x) − f (y)| ≤ |Pm (x) − Pm (y)| + |Rm (x)| + |Rm (y)| < /2 + /4 + /4 = . (3.49)
Damit ist f stetig in D. u

t
66 3 Funktionen
Stetige Funktionen sind im Prinzip die Ausnahme. Stetige Funktionen sind aber
wichtig, weil sie in vielen Anwendungen adequat sind.
Auch stetige Funktionen können sich sehr wild verhalten. So ist es z.B. im Allge-
meinen nicht möglich, den Graphen einer stetigen Funktion selbst über einem end-
lichen Intervall zu zeichnen, weil dieser unendlich lang sein kann. Dies liegt daran,
dass in der Definition der Stetigkeit keinerlei Anforderung daran gestellt wird, wie
klein δ für gegebenes sein soll. Wir haben also keinerlei Kontrolle darüber, wie
schnell | f (x) − f (y)| mit |x − y| wachsen kann.
Die Funktionen, mit denen man es in Anwendungen zu tun hat, sind meist viel
weniger wild. Eine wichtige Klasse sind die sogenannten Lipschitz-stetigen Funk-
tionen.
Definition 3.22 (Lipschitz-Stetigkeit). Sei f : D → R eine reelle Funktion. Dann
heißt f Lipschitz-stetig auf D, genau dann, wenn es eine Konstante L ∈ R+ gibt, so
dass für alle x, y ∈ D,
| f (x) − f (y)| ≤ L|x − y|. (3.50)
Die kleinstmögliche Konstante L für die (3.50) gilt nennt man auch die Lipschitz-
Konstante oder Lipschitz-Norm von f . Falls f : R → R auf R Lipschitz-stetig ist, so
sagt man, f sei global Lipschitz-stetig. Falls f : D → R für jedes x ∈ D eine offene -
Umgebung D ⊃ M 3 x existiert, so dass die Funktion in M Lipschitz-stetig ist (aber
mit Konstanten L die von M abhängen können), so nennt man f lokal Lipschitz-
stetig.
Lemma 3.23. Ist eine Funktion f auf D ⊆ R Lipschitz–stetig, so ist sie dort auch
stetig. Die Umkehrung gilt nicht.
Beweis. Übung. t
u
Beispiel 3.24. Jede affine Funktion ist global Lipschitz-stetig. Jedes Polynom ist
lokal Lipschitz-stetig, aber Polynome von Grad größer als 1 sind nicht global
Lipschitz-stetig.
Lemma 3.25. Wenn eine Funktion f auf einem beschränkten Gebiet M ⊂ R Lipschitz-
stetig ist, dann ist f auf M beschränkt (d.h. das Bild von M unter f ist eine be-
schränkte Teilmenge von R).
Beweis. Übung.
Notation. Wir benutzen ab sofort folgende Notationen für sog. Intervalle in R:
(i) Für a < b in R schreiben wir
(a; b) = {x ∈ R : a < x < b}. (3.51)
Wir nennen (a; b) ein offenes Intervall.

(ii)Für a < b in R schreiben wir
[a; b] = {x ∈ R : a ≤ x ≤ b}. (3.52)
Wir nennen [a; b] ein abgeschlossenes Intervall.

(iii)Für a < b in R schreiben wir
[a; b) = {x ∈ R : a ≤ x < b}, (3.53)
und
(a; b] = {x ∈ R : a < x ≤ b}, (3.54)
Wir nennen (a; b] und [a; b) halboffene Intervalle.
(iv)Für a ∈ R schreiben wir
[a; ∞) = {x ∈ R : a ≤ x}, (3.55)
und
(a; ∞) = {x ∈ R : a < x}, (3.56)
sowie
(−∞; a] = {x ∈ R : a ≥ x}, (3.57)
und
(−∞; a) = {x ∈ R : a > x}. (3.58)
Wir benutzen (vorläufig) das Semikolon statt dem Komma, damit das Interval (a; b)
nicht mit dem Paar (a, b) verwechselt werden kann. In der Literatur wird meist das
Komma verwendet.
Lemma 3.26. Offene Intervalle sind offene Mengen und abgeschlossene Intervalle
sind abgeschlossene Mengen. Weiter sind (a; ∞) und (−∞; a) für alle a ∈ R offene
Mengen, die Mengen [a; ∞) und (−∞; a] sind abgeschlossen.
Beweis. Wissen wir schon aus Satz 2.3. t

u
Anmerkung. Alle oben eingeführten Intervalle erfüllen die Voraussetzung an D im

Satz 3.19.
Wir kommen jetzt zu dem zentralen Satz über stetige Funktionen, der die intuiti-
ve Vorstellung, die man vielleicht von Stetigkeit hat, bestätigt. Der sogenannte Zwi-
schenwertsatz zeigt nochmals den tiefen Zusammenhang zwischen Stetigkeit und
der Vollständigkeit der reellen Zahlen.
Satz 3.27 (Zwischenwertsatz). Sei f : [a; b] → R eine stetige Funktion. Sei f (a) ≤
f (b). Dann gibt es für jedes y ∈ [ f (a); f (b)] ein x ∈ [a; b], so dass f (x) = y. Falls
f (a) > f (b), so gilt dasselbe für jedes y ∈ [ f (b); f (a)].
Anmerkung. Man formuliert den Satz auch als Eine stetige Funktion nimmt auf
einem abgeschlossenen Interval jeden Wert zwischen den Werten an den Endpunkten
an.
Beweis. Der Beweis ist fast trivial. Wir betrachten nur den Fall f (a) < f (b). Da für
y = f (a) und y = f (b) die Aussage trivial ist, nehmen wir y ∈ ( f (a); f (b)). Wir wollen
68 3 Funktionen
zeigen, dass die Annahme, dass für alle x ∈ [a; b], f (x) , y gilt zum Widerspruch
führt. Wir definieren
x− = sup{x ∈ [a; b] : f (x) < y}. (3.59)
Es sein nun q eine monoton fallende Folge mit lim q = x− . Dann muss einerseits
f (x− ) = lim f (q) ≥ y, da jedes Folgenglied f (qn ) ≥ y. Da aber nach Annahme f den
Wert y nicht annimmt, muss sogar lim f (q) = f (x− ) = y0 > y gelten. Umgekehrt sei
r eine monoton wachsende Folge mit lim r = x− . Wegen der Stetigkeit vom f muss
gelten lim f (r) = y0 . Andererseits wissen wir aus der Definition (3.46) von Stetigkeit,
dass es ein δ > 0 gibt, so dass für alle x ∈ (x− − δ, x− ], | f (x) − f (x− )| ≤ (y0 − y)/2, also
f (x) > y + (y0 − y)/2 > y ist, weswegen für diese x gilt, dass f (x) > y. Dann wäre
aber für alle x > x− − δ f (x) > y und somit sup{x ∈ [a; b] : f (x) < y} ≤ x− − δ, was der
der Definition von x− widerspricht. Damit führt die Annahme, dass f stetig ist und
den Wert y nicht annimmt im Widerspruch und der Satz ist bewiesen. u t
Wir benötigen im Folgenden eine weitere Eigenschaft abgeschlossener Mengen,

die im Wesentlichen Lemma 2.8 verallgemeinert.
Lemma 3.28. Sei A ⊂ R abgeschlossen und sei a eine Cauchy-Folge, so dass für
alle n ∈ N, an ∈ A. Dann ist auch lim a ∈ A.
Beweis. Der Beweis ist nur eine kleine Adaption der Argumente, die im Beweis von
Lemma 2.8 verwendet werden. Wenn lim a ∈ Ac und da Ac offen ist, so müssen sogar
fast alle (= alle bis auf endlich viele) Folgenglieder in Ac liegen, im Widerspruch
zur Annahme. u t
Definition 3.29 (Kompakte Mengen). Eine Teilmenge K ⊂ R heißt kompakt, genau

dann, wenn K abgeschlossen und beschränkt ist.
Eine wichtige Eigenschaft kompakter Mengen ergibt sich aus der Verbindung des
Satzes von Bolzano-Weierstrass 2.10 mit Lemma 3.28.
Satz 3.30 (Bolzano-Weierstrass 2). Eine Menge K ⊂ R ist genau dann kompakt,
wenn jede Folge a mit an ∈ K für alle n ∈ N eine Teilfolge enthält, die gegen einen
Punkt x ∈ K konvergiert.
Beweis. Sei K kompakt. Dann ist K beschränkt und wegen Satz 2.10 enthält jede
Folge in K eine konvergente Teilfolge. Wegen Lemma 3.28 liegt deren Grenzwert
in K. Sei umgekehrt K nicht kompakt. Dann ist entweder K nicht beschränkt, oder
das Komplement ist nicht offen, d.h. es existiert ein Punkt y ∈ K c so dass es kei-
ne offenen Umgebung gibt, die K nicht schneidet. Im ersteren Fall kann man eine
unbeschränkte Folge konstruieren, im zweiten eine Cauchy-Folge in K die gegen
y konvergiert (Man nimmt dazu einfach die Folge der 1/n-Umgebungen von y und
wählt jeweils eine Punkt an ∈ U1/n (y) ∩ K aus. Diese Folge muss nach y konvergie-
ren). Dies beweist die Äquivalenz beider Aussagen. u t
Wir kommen nun wieder zu den Eigenschaften stetiger Funktionen zurück.

Lemma 3.31. Sei K kompakt und sei f : K → R eine in K stetige Funktion. Dann
ist das Bild von K unter f ebenfalls kompakt.
Beweis. Dieser Satz folgt sofort aus der Tatsache, dass stetige Funktionen Cauchy-
Folgen auf Cauchy-Folgen abbilden und dem Satz 3.30. Sei y eine Folge im Bild
von K. Dann gibt es für jedes n ∈ N ein xn ∈ K so, dass yn = f (xn ). Da K kompakt
ist, besitzt (xn )n∈N eine in K konvergente Teilfolge. Sei oBdA x selbst diese Teil-
folge. Das Bild dieser Teilfolge unter f ist eine Teilfolge von y die im Bild von f
konvergiert, nämlich gegen f (lim x). Damit ist das Bild von K kompakt nach Satz
3.30. u t
Aus dieser Eigenschaft folgt eine weitere wichtige Eigenschaft stetiger Funktio-
nen.
Satz 3.32 (Maximum und Minimum). Sei K ⊂ R kompakt und f : K → R stetig

in K. Dann nimmt f auf K ein Maximum und ein Minimum an, d.h. es existieren
x1 , x2 ∈ K so, dass für alle x ∈ K,
f (x1 ) ≤ f (x) ≤ f (x2 ). (3.60)
Beweis. Wir wissen, dass das Bild von K kompakt ist. Dann sind nach Lemma 2.8
sowohl das Supremum als das Infimum des Bildes im Bild. Daraus folgt die Aussage
sofort. u
t
Für offene Mengen gilt die analoge Aussage nicht. Betrachte etwa die auf (0; 1)
definierte Funktion f mit Werten f (x) = x(1−x)
1
. Das Bild von (0, 1) ist hier R+ und
die Funktion strebt bei 0 und 1 gegen +∞, d.h. sup f = +∞. Daher nimmt sie ihr
Supremum nicht an.
Eine Verschärfung der Stetigkeit in einer Menge ist die der gleichmäßigen Ste-
tigkeit.
Definition 3.33 (Gleichmäßige Stetigkeit). Eine Funktion f : D → R heißt gleich-

mäßig stetig auf D, falls
∀>0 ∃δ>0 ∀ x,y∈D:|x−y|<δ : | f (x) − f (y)| < . (3.61)
Wichtig ist hier, dass die Wahl von δ unabhängig vom Punkt x getroffen werden
kann. Eine gleichmäßig stetige Funktion hat in ganz D einen maximalen ’Verzer-
rungsgrad’. Die gerade betrachtete Funktion f mit f (x) = x(1−x)
1
ist stetig auf (0; 1)
aber nicht gleichmäßig stetig.
Ein wichtiger Satz, den man sich merken sollte, sagt nun, dass auf kompakten
Mengen alle stetigen Funktionen gleichmäßig stetig sind.
Satz 3.34. Sei K kompakt und f : K → R auf K stetig. Dann ist f auf K gleichmäßig
stetig.
Beweis. Der Beweis beruht auf der Konstruktion eines Widerspruchs. Wir zeigen,
dass, wenn f nicht gleichmäßig stetig wäre, f nicht stetig wäre. Falls nämlich f
70 3 Funktionen
nicht gleichmäßig stetig ist, so ist (3.61) falsch, und es gibt ein > 0, so dass für
jedes 1/n > 0, xn , yn existieren so dass |xn − yn | < 1/n, aber | f (xn ) − f (yn )| > . Nun
besitzt (xn )n∈N eine konvergente Teilfolge, und wir können ohne Beschränkung der
Allgemeinheit annehmen, dass (xn )n∈N konvergiert (in K). Dann aber ist x − y eine
Nullfolge, und lim y = lim x. Da aber für alle n ∈ N gilt, dass | f (xn ) − f (yn )| > , so
ist auch | lim f (x) − lim f (y)| ≥ , was der Stetigkeit von f widerspricht. Damit ist der
Satz bewiesen. u t
Kapitel 4
Ableitungen und lokale Approximation von
Funktionen
Wir haben im vorigen Kapitel stetige Funktionen betrachtet. Der Hauptgedanke

dabei war, dass stetige Funktionen so gutmütig sind, dass sie Cauchy-Folgen auf
Cauchy-Folgen abbilden und somit der Wert einer stetigen Funktion an jeder re-
ellen Zahl in ihrem Definitionsbereich durch Berechnungen auf rationalen Zahlen
beliebig genau approximiert werden kann. Allerdings ist diese Kontrolle nur sehr
implizit, weil a priori keinerlei Kontrolle der Güte der Approximation gegeben ist.
In diesem Kapitel wenden wir uns nun einer viel kleineren Klasse von Funktio-
nen zu, deren lokales Verhalten viel gutmütiger ist. Die Idee ist es, Funktionen zu
beschreiben, die lokal linear sind.
Notation: In diesem Kapitel sind, wenn nicht anders spezifiziert, Definitionsberei-

che D ⊆ R von Funktionen stets offene Teilmengen von R.
4.1 Der Begriff der Ableitung
Wir wollen eine Funktion differenzierbar nennen, wenn sie in der Nähe eines Punk-
tes gut durch eine lineare Funktion approximiert werden kann. Die folgende Defini-
tion macht diese Idee präzise.
Definition 4.1 (Ableitung). Sei f : D → R eine reelle Funktion. Wir sagen, dass f
an der Stelle x ∈ D differenzierbar ist, genau dann wenn es eine reelle Zahl a ∈ R
gibt, so dass, für
h(y) ≡ f (x + y) − f (x) − ay, x + y ∈ D, (4.1)
gilt, dass
lim |h(y)|/|y| = 0. (4.2)
y→0
Hier meint limy→0 |h(y)|/|y| = 0, dass für jede Nullfolge (yn )n∈N für die für alle n ∈ N
gilt, dass yn , 0 und x + yn ∈ D, die Bildfolge (h(yn )/yn )n∈N nach Null konvergiert.
Falls es ein solches a gibt heißt a die Ableitung von f an der Stelle x und wir schrei-
71
72 4 Ableitungen und lokale Approximation von Funktionen
ben
d f (x)
a = f 0 (x) = (4.3)
dx
Die Funktion heißt differenzierbar in D genau dann, wenn sie für jeden Punkt x ∈ D
differenzierbar ist.
Anmerkung. Genau wie im Fall der Stetigkeit, können wir auch eine − δ Definition
der Differenzierbarkeit geben: f : D → R ist differenzierbar bei x ∈ D genau dann,
wenn
∀>0 ∃δ>0 ∀y∈R:0<|y|<δ : |h(y)|/|y| < . (4.4)
Die lineare Funktion `(z) = f (x) + f 0 (x)(z − x) nennen wir auch die Tangente an
f an der Stelle x.
Abb. 4.1 Tangente ` an die Funktion f am Punkte x.
Lemma 4.2. Sei f : D → R bei x ∈ D differenzierbar. Dann gibt es genau ein a ∈ R

mit der in Definition 4.1 geforderten Eigenschaft.
Beweis. Übung. t
u
Das Lemma besagt, dass die Tangente an f am Punkt x die Funktion f in der
Nähe von x besser als jede andere lineare Funktion approximiert. Es folgt sofort,
dass Differenzierbarkeit Stetigkeit impliziert.
Lemma 4.3. Sei f : D → R an der Stelle x ∈ D differenzierbar. Dann ist f an der
Stelle x stetig.
Beweis. Sehr leichte Übung. u
t
Es ist manchmal nützlich, den schwächeren Begriff der links- bzw. rechtsseitigen
Ableitung zur Verfügung zu haben.
4.1 Der Begriff der Ableitung 73
Definition 4.4. Sei f : D → R eine reelle Funktion. Wir sagen, dass f an der Stelle
x ∈ D differenzierbar von rechts [links] ist, genau dann wenn es eine reelle Zahl
a ∈ R gibt, so dass, für
h(y) ≡ f (x + y) − f (x) − ay, (4.5)
gilt, dass " #
lim |h(y)|/|y| = 0, lim |h(y)|/|y| = 0 , (4.6)
y↓0 y↑0
Falls es ein solches a gibt heißt a die rechtsseitige [linksseitige] Ableitung von f an
der Stelle x und wir schreiben
a = f±0 (x). (4.7)
Dabei bedeutet " #
lim |h(y)|/|y| = 0, lim |h(y)|/|y| = 0, (4.8)
y↓0 y↑0
dass für jede strikt monoton fallende [wachsende] Nullfolge (yn )n∈N , limn↑∞ |h(yn )|/|yn | =
0.
Es gilt folgender einfacher Sachverhalt.
Lemma 4.5. Sei f : D → R bei x ∈ D sowohl links- als auch rechtsseitig differen-
zierbar und es gelte
f+0 (x) = f−0 (x). (4.9)
Dann ist f bei x differenzierbar und f 0 (x) = f±0 (x).
Beweis. Übung. t
u
Anmerkung. Wir haben die Ableitung von Funktionen definiert, die auf offenen
Mengen definiert sind. Man kann die Definition verallgemeinern auf Funktionen, die
auf beliebigen Teilmengen M ⊆ R definiert sind. Dazu benötigen wir noch den Be-
griff des Häufungspunkts einer Menge: Sei M ⊂ R, dann heißt x ∈ M Häufungspunkt
von M genau dann, wenn jede -Umgebung I (x) unendlich viele Punkte aus M
enthält.
Man trifft dann folgende Festsetzung:
(i) Wenn x ∈ M kein Häufungspunkt von M ist, so ist f bei x nicht differenzierbar.
(ii) Wenn x ∈ M Häufungspunkt von M ist, aber x nicht im Innern von M liegt,
so fordert man nur, dass für alle Nullfolgen (yn )n∈N mit der Eigenschaft, dass für
alle n ∈ N x + yn ∈ M\{x}, die Folge (h(yn )/yn )n∈N eine Nullfolge ist.
Insbesondere ist dann eine auf einem abgeschlossenen Intervall [a; b] definierte
Funktion bei a differenzierbar, falls die rechtsseitige Ableitung bei a existiert und
bei b differenzierbar, falls die linksseitige Ableitung bei b existiert.
Die Differenzierbarkeit ist mit der Lipschitz Stetigkeit verwandt, aber wesentlich
restriktiver. Einerseits gilt:
Lemma 4.6 (Schrankensatz). Sei D ein Intervall. Es sei f : D → R differenzierbar

in D und es gäbe ein L ∈ R+ so , dass für alle x ∈ D gilt, dass | f 0 (x)| ≤ L. Dann ist f
Lipschitz stetig in D mit Lipschitz Konstante L.
Wir verschieben den Beweis dieses Satzes auf später.
Andererseits ist die Funktion f : R → R mit

0, x ≤ 0,

f (x) = 

(4.10)
 x, x > 0,

zwar global Lipschitz stetig mit Lipschitz Konstante 1, aber in 0 nicht differen-
zierbar. Man kann sich dies veranschaulichen in dem man sich alle Geraden die
durch den Nullpunkt gehen ansieht und mit f vergleicht. Der Approximationsfehler
wächst entweder nach links oder nach rechts linear mit der Distanz von der Null. Es
ist nicht klar, welche Gerade die beste Approximation wäre.
Beispiel 4.7. Sei f die Funktion mit f (x) = xn , n ∈ N. Dann gilt f 0 (x) = nxn−1 . Hierzu
benutzen wir den Binomialsatz. Wir wissen, dass
n !
X n n−k
zn = (x + (z − x))n = xn + x (z − x)k , (4.11)
k=1
k
also
n !
X n n−k
h(z − x) ≡ zn − xn − nxn−1 (z − x) = x (z − x)k . (4.12)
k=2
k
Nun gilt offenbar, dass
n !
|h(z − x)| X n n−k
≤ |x| |z − x|k−1 . (4.13)
|z − x| k=2
k
Offenbar konvergiert die rechte Seite nach 0, wenn z → x, also ist nxn−1 die Ablei-
tung von f an der Stelle x.
Beispiel 4.8. Wir betrachten die Funktion exp. Wir wissen aus Satz 3.10, dass
exp(x + y) − exp(x) = exp(x) exp(y) − 1 .

(4.14)
Nun ist
∞ k ∞ ∞
X y X yk X yk
exp(y) − 1 = = y+ = y + y2 . (4.15)
k=1
k! k=2
(k)! k=0
(k = 2)!
yk
Die Reihe ∞
P
k=0 (k+2)! ist genau wie die Exponentialreihe absolut konvergent für alle
y ∈ R. Daraus folgt
∞
X yk
exp(x + y) − exp(x) − exp(x)y = exp(x)y2 = h(y), (4.16)
k=0
(k + 2)!
4.2 Ableitungsregeln 75
und
∞
X yk
h(y)/y = y (4.17)
k=0
(k + 2)!
konvergiert nach Null konvergiert, wenn y → 0. Daher ist exp0 (x) = exp(x).
Formal können wir dieses Ergebnis auch erhalten, indem wir so tun als könnten
wir die Exponentialreihe Term für Term ableiten:
∞ ∞ ∞ ∞ k
X 1 dxk X kxk−1 X xk−1 X x
exp0 (x) = = = = = exp(x). (4.18)
k=0
k! dx k=1
k! k=1
(k − 1)! k=0
k!
Obwohl das etwas gewagt aussieht, liefert dies die richtige Antwort. Wir werden
später sehen, dass wir das auch rechtfertigen können.
4.2 Ableitungsregeln
Aus der Definition der Ableitung folgen einige wichtige Regeln, die zur Berechnung
von Ableitungen wichtig sind.
Satz 4.9 (Summen-, Produkt- und Quotientenregel). Im Folgenden seien f, g auf

D ⊂ R definierte Funktionen.
(i) Wenn f und g an der Stelle x ∈ D differenzierbar sind, dann ist für alle a, b ∈ R
die Funktion φ = a f + bg an der Stelle x differenzierbar und es gilt:
φ0 (x) = a f 0 (x) + bg0 (x). (4.19)
(ii) Wenn f und g an der Stelle x ∈ D differenzierbar sind, dann ist die Funktion
φ = f g an der Stelle x differenzierbar und es gilt:
φ0 (x) = f (x)g0 (x) + f 0 (x)g(x). (4.20)
(iii) Wenn f an der Stelle x ∈ D differenzierbar ist und es ein > 0 gibt, so dass für
alle y ∈ I (x), f (z) , 0, dann ist φ = 1/ f an der Stelle x differenzierbar und es
gilt:
φ0 (x) = − f 0 (x)/ f (x)2 . (4.21)
Beweis. Der Beweis von Punkt (i) ist elementar. Um Punkt (ii) zu beweisen, schrei-
ben wir
φ(z) − φ(x) = f (z)g(z) − f (x)g(x) = [ f (z) − f (x)]g(z) + f (x)[g(z) − g(x)]

= [ f (z) − f (x) − f 0 (x)(z − x)]g(z) (4.22)
+ (z − x) f (x)g(z) + [g(z) − g(x) − (z − x)g (x)] f (x) + (z − x) f (x)g (x).
0 0 0
Daher ist
φ(z) − φ(x) − (z − x) f 0 (x)g(z) + f (x)g0 (x) = (z − x) f 0 (x)(g(z) − g(x))

(4.23)
0 0
" #
[ f (z) − f (x) − f (x)(z − x)] [g(z) − g(x) − (z − x)g (x)]
+(z − x) g(z) + f (x) .
(z − x) (z − x)
Der Koeffizient von (z − x) konvergiert nach 0 weil g stetig bei x ist und g und f bei
x differenzierbar sind, wenn z → x, und daher ist f (x)g0 (x) + f 0 (x)g(x) die Ableitung
von φ bei x, wie behauptet.
Um (iii) zu zeigen, gehen wir genauso vor. Für z ∈ I (x) haben wir
1 1 f (z) − f (x) f 0 (x) f (z) − f (x) − (z − x) f 0 (x)

− = = (z − x) +
f (z) f (x) f (x) f (z) f (x) f (z) f (z) f (x)
0
f (x)
= (z − x) (4.24)
f (x) f (x)
" 0
f (z) − f (x) − (z − x) f 0 (x)
! #
f (x) 1 1
+(z − x) − + .
f (x) f (z) f (x) (z − x) f (z) f (x)
Der Ausdruck in eckigen Klammern auf der rechten Seite konvergiert nach 0, wenn
f 0 (x)
z nach x konvergiert, und somit ist f (x) f (x) die Ableitung von 1/ f an der Stelle x.
t
u
Eine weitere wichtige Regel betrifft die Ableitung von verketteten Funktionen.
Satz 4.10 (Kettenregel). Es seien B und D offene Teilmengen von R. Seien f : D →

R und g : B → D reelle Funktionen. Es sei g differenzierbar an der Stelle x und
f differenzierbar an der Stelle g(x). Wir setzen φ = f ◦ g : B → R, wo ( f ◦ g)(x) =
f (g(x)).
Dann ist φ differenzierbar an der Stelle x und es gilt
φ0 (x) = f 0 (g(x))g0 (x). (4.25)
Beweis. Wieder schreiben wir
φ(z) − φ(x) = f (g(z)) − f (g(x)) (4.26)

= (g(z) − g(x)) f (g(x))
0
+ f (g(z)) − f (g(x)) − (g(z) − g(x)) f 0 (g(x)). (4.27)
Weiter ist
(g(z) − g(x)) f 0 (g(x)) = (z − x)g0 (x) f 0 (g(x)) + (g(z) − g(x) − g0 (x)(z − x)) f 0 (g(x)).
(4.28)
Da g bei x differenzierbar ist, wissen wir, dass
g(z) − g(x) − g0 (x)(z − x)

lim = 0. (4.29)
z→0 z− x
Weiter ist f bei g(x) differenzierbar, so dass
4.3 Der Mittelwertsatz 77
f (g(z)) − f (g(x)) − (g(z) − g(x)) f 0 (g(x))

z− x
f (g(z)) − f (g(x)) − (g(z) − g(x)) f 0 (g(x)) g(z) − g(x)
= . (4.30)
g(z) − g(x) z− x
Da f bei g(x) differenzierbar ist und g bei x
f (g(z)) − f (g(x)) − (g(z) − g(x)) f 0 (g(x))

lim = 0, (4.31)
z→x g(z) − g(x)
und
g(z) − g(x)
lim = g0 (x). (4.32)
z→xz− x
Mithin konvergiert die letzte Zeile in (4.28) auch nach Division durch z − x gegen
Null, wenn z → x, und wegen (4.29) gilt also
φ(z) − φ(x) − (z − x)g0 (x) f 0 (g(x))

lim = 0. (4.33)
z→x z− x
Damit folgt die Behauptung. t
u
Aus der Kettenregel folgt unmittelbar eine Formel für die Ableitung der Inversen
einer Funktion.
Korollar 4.11 (Ableitung der inversen Funktion). Seien I, J ⊆ R offene Intervalle.
Sei f : I → J bijektiv und differenzierbar an der Stelle x ∈ I und f −1 : J → I die
inverse Funktion zu f . Dann gilt: f −1 ist differenzierbar an der Stelle y = f (x),
wenn f 0 (x) , 0, und
0 1
f −1 (y) = 0 −1 . (4.34)
f ( f (y))
Beweis. Benutze, dass die Ableitung der Funktion f ( f −1 (y)) = y gleich 1 ist und
verwende die Kettenregel auf der linken Seite der Gleichung. u t
Mit diesen Regeln können wir schon eine ganze Reihe von Ableitungen ausrech-
nen.
4.3 Der Mittelwertsatz
Wir kommen nun zu einem zentralen Resultat, dem sog. Mittelwertsatz. Er ist eng
mit dem Zwischenwertsatz, Satz 3.27 verwandt.
Satz 4.12 (Mittelwertsatz). Sei f : [a; b] → R auf [a; b] stetig und auf (a; b) diffe-
renzierbar. Dann existiert ein x ∈ (a; b), so dass
f (b) − f (a)
= f 0 (x). (4.35)
b−a
Abb. 4.2 Zum Mittelwertsatz.
Beweis. Offensichtlich genügt es, den Fall, dass f (b) = f (a) gilt zu betrachten,
da der allgemeine Fall durch die Addition einer linearen Funktion auf diesen
zurückgeführt werden kann. Falls nun f (a) = f (b), so nimmt nach Satz 3.32 die ste-
tige Funktion f auf der kompakten Menge [a; b] ein Maximum und ein Minimum
an. Wenn sowohl das Maximum als auch das Minimum im Rand von [a; b] ange-
nommen werden, dann muss f die konstante Funktion sein und es gilt f 0 (x) = 0 für
alle x ∈ (a; b). Andernfalls gibt es ein x ∈ (a; b) so dass f dort ein Minimum oder ein
Maximum annimmt. Das folgende Lemma sagt uns, dass dann f 0 (x) = 0 gilt, mithin
(4.35).
Anmerkung. Der Spezialfall des Mittelwertsatzes wenn f (a) = f (b) ist heißt auch
Satz von Rolle.
Lemma 4.13. Sei f : (a; b) → R differenzierbar und nehme f für ein x ∈ (a; b) ein
Minimum oder ein Maximum an. Dann ist f 0 (x) = 0.
Beweis. Wir betrachten nur den Fall, dass f bei x ein Maximum annimmt. Der Fall
eines Minimums ist identisch. Es gilt also, dass für alle z ∈ (a; x)
f (z) − f (x)
≤ 0, (4.36)
z− x
und für alle z ∈ (x; b)
f (z) − f (x)
≥ 0, (4.37)
z− x
4.3 Der Mittelwertsatz 79
Aus der ersten Ungleichung folgt, dass f 0 (x) ≤ 0, aus der zweiten, dass f 0 (x) ≥ 0,
also ist f 0 (x) = 0. u
t
Damit ist auch der Satz bewiesen. t

u
Mit Hilfe des Mittelwertsatzes können wir nun auch den Schrankensatz 4.6 be-
weisen.
Beweis (von Satz 4.6). Es gilt nach dem Mittelwertsatz, dass für jedes x < z ∈ D ein
y ∈ (x; z) ⊂ D existiert, so dass
| f (z) − f (x)| f (z) − f (x)
= = | f 0 (y))|. (4.38)
|z − x| z− x
Nach Voraussetzung ist | f 0 (y)| ≤ L. Das wars. t
u
Der Mittelwertsatz hat sehr weitreichende Konsequenzen. Insbesondere folgt aus

ihm, dass die einzigen Funktionen deren Ableitung überall gleich 0 ist, die konstan-
ten Funktionen sind. Daraus wiederum folgt, dass man, wenn man die Ableitung
einer Funktion überall kennt, die Funktion bis auf eine additive Konstante bestimmt
hat.
Lemma 4.14. Sei f : [a; b] → R eine stetige und auf (a; b) differenzierbare Funktion.
Dann ist f konstant auf [a; b] wenn f 0 (x) = 0 für alle x ∈ (a; b).
Beweis. Wenn f konstant ist, so ist offenbar f 0 (x) = 0 für alle x ∈ (a; b). Sei umge-
kehrt f 0 (x) = 0 für alle x ∈ (a; b). Dann folgt aus dem Mittelwertsatz, dass für alle
x, z ∈ [a; b],
f (z) − f (x)
= 0, (4.39)
z− x
also ist die Funktion konstant. u t
Korollar 4.15. Seien f, g : (a; b) → R differenzierbare Funktionen. Wenn f 0 (x) =

g0 (x) für alle x ∈ (a; b), dann existiert eine Konstante C ∈ R, so dass für alle x ∈ (a; b),
f (x) − g(x) = C.
Korollar 4.16. Die Exponentialfunktion ist die einzige Funktion auf R für die gilt
∀ x∈R : f 0 (x) = f (x) und f (0) = 1.
Beweis. Es sei f so dass f 0 (x) = f (x) für alle x ∈ R. Sei h = f / exp. Dann gilt nach
Satz 4.9 für alle x ∈ R
h0 (x) = f 0 (x)/ exp(x) − f (x) exp0 (x)/ exp(x)2 = f (x)/ exp(x) − f (x)/ exp(x) = 0.
(4.40)
Also ist nach Lemma 4.14 h = C. Da h(0) = 1, muss auch C = 1 sein. Damit ist die
Aussage bewiesen. u t
Wo wir gerade dabei sind, können wir auch noch die Ableitung des Logarithmus
berechnen. Wir erinnern uns an die Definition der Funktion ln : R+ → R in (3.37).
Lemma 4.17. Die Funktion ln ist auf R+ differenzierbar und es gilt für alle x ∈ R+ ,
1
ln0 (x) = . (4.41)
x
Beweis. Folgt sofort aus der Formel für die Ableitung der Inversen einer Funktion
in Korollar 4.11. u
t
Wir werden später noch eine kleine und sehr einfache Verallgemeinerung von
Lemma 4.14 benötigen.
Lemma 4.18 (Eindeutigkeit). Sei f : [a; b] → R eine auf [a; b] stetige Funktion,
die in allen bis auf abzählbar vielen Punkten in (a; b) differenzierbar ist. Dann ist
f konstant auf [a; b] genau dann, wenn f 0 (x) = 0 für alle x ∈ (a; b) an denen die
Ableitung existiert.
Beweis. Sei A die Menge auf der f nicht differenzierbar ist. Wir betrachten zwei
Punkte y < z in [a; b]. Für ein > 0 definieren wir die Funktion F für x ≥ y
F (x) = | f (x) − f (y)| − (x − y). (4.42)
Wir wollen zeigen, dass F (z) ≤ 0. Angenommen es gäbe ein > 0 so dass F (z) > 0.
Da A abzählbar ist, ist auch die Bildmenge von A unter F abzählbar und daher
existiert ein γ das nicht im Bild von A liegt mit
0 = F (y) < γ < F (z). (4.43)
Sein nun c die grösste Zahl in [y; z] so, dass F (c) = γ. (Dieses existiert, da es nach
dem Zwischwertsatz ein y < c0 < z gibt mit F (c0 ) = γ. Dann erfüllt c = sup{c0 :
F (c0 ) = γ} die geforderte Bedingung.) Da F stetig ist und F (z) > γ darf F in
(c; z] nie mehr kleiner oder gleich γ sein. Also ist
F (x) − F (c)
> 0, ∀x ∈ (c; z]. (4.44)
x−c
Nun ist aber für diese x mit Hilfe der umgekehrten Dreiecksungleichung (|a| − |b| ≤
|a − b|)
F (x) − F (c) | f (x) − f (y)| − | f (c) − f (y)| − (x − c)
= (4.45)
x−c x−c
| f (x) − f (c)| − (x − c) f (x) − f (c)
≤ = − .
x−c x−c
Nun ist aber f bei c differenzierbar mir Ableitung 0, weswegen für alle x hinrei-
chend nahe bei c der erste Term kleiner als /2 ist, mithin (4.45) negativ ist, im
Widerspruch zur Positivität von (4.44). Also kann F (z) nicht strikt positiv sein, und
es folgt F (z) ≤ 0. Da dies für alle > 0 gilt, folgt f (z) = f (y). Damit ist f konstant
wie behauptet. u t
4.4 Ableitung absolut konvergenter Potenzreihen 81
Der Korollar 4.15 gilt dann auch mit der entsprechend abgeschwächten Voraus-
setzung.
4.4 Ableitung absolut konvergenter Potenzreihen
Wir haben schon bei der Berechnung der Ableitung der Exponentialfunktion gese-
hen, dass wir das richtige Ergebnis erhalten, wenn wir die Reihendarstellung der
Funktion Term für Term ableiten. Wir wollen nun zeigen, dass dies für alle absolut
konvergenten Potenzreihen zutrifft. Dies passt natürlich gut zu unserer Vorstellung,
dass absolut konvergente Potenzreihen sich im Wesentlichen so verhalten wie end-
liche Summen.
Satz 4.19 (Vertauschung von Summe und Ableitung). Sei I ein offenes Intervall
und f : I → R eine absolut konvergente Potenzreihe,
∞
X
f (x) = an xn , (4.46)
n=0
Dann ist f in I differenzierbar und es gilt

∞
X ∞
X
f 0 (x) = nan xn−1 = (n + 1)an+1 xn . (4.47)
n=1 n=0
f 0 ist wieder in I eine absolut konvergente Potenzreihe.
Beweis. Da für x, z ∈ I sowohl ∞

P n P∞ n
n=0 an x als auch n=0 an z absolut konvergieren,
ist ihre Differenz gleich der Reihe der Differenzen, also
∞
X
f (z) − f (x) = an (zn − xn ). (4.48)
n=0
Nun ist aber, für n ≥ 1,

n−1
X
zn − xn = (z − x) xk zn−1−k . (4.49)
k=0
Folglich erhalten wir die Identität

∞
X n−1
X
f (z) − f (x) = (z − x) an xk zn−1−k
n=1 k=0
∞
X n−1
X
= (z − x) an xn−1 1 + x−n+1+k zn−1−k − 1
n=1 k=0
∞
X
= (z − x) an xn−1 n
n=1
∞
X n−2
X
+ (z − x) an xk zn−1−k − xn−1 . (4.50)
n=1 k=0
Der Koeffizient von an in der letzten Zeile ist, indem wir wieder (4.49) benutzen,
n−2
X Xn−2
xk zn−1−k − xn−1 = xk zn−1−k − xn−1−k
k=0 k=0
n−2 n−2−k
x` zn−2−k−` .
X X
= xk (z − x) (4.51)
k=0 `=0
Wir setzen noch r = max(|x|, |z|) und erhalten, dass der Absolutbetrag der letzten
Zeile nicht größer ist als
n−2 n−2−k
X X
|z − x| rn−2 ≤ |z − x|rn−2 (n − 1)(n − 2)/2. (4.52)
k=0 `=0
Damit ist der Koeffizient von (z − x) in der letzten Zeile von (4.50) im Absolutbetrag
nicht größer ist als
∞
X
|z − x| |an |rn−2 (n − 1)(n − 2)/2. (4.53)
n=2
Auch diese Reihe konvergiert absolut und somit ist der Koeffizient von (z − x) in der
letzten Zeile von (4.50) kleiner als |z − x|C, woraus die Behauptung unseres Satzes
sofort folgt. ut
4.4.1 Die trigonometrischen Funktionen
Wir wenden den vorhergehenden Satz nun an um mehr über die Funktionen sin und
cos zu lernen. Eine mit Satz 4.19 elementare Rechnung zeigt folgendes Lemma.
Lemma 4.20. Die Funktionen sin und cos sind in ganz R differenzierbar und es gilt
sin0 (x) = cos(x), (4.54)

cos (x) = − sin(x).
0
(4.55)
4.5 Höhere Ableitungen und Taylor Reihen 83
Insbesondere ist also sin in 0 steigend mit Ableitung 1. Außerdem verschwindet die
Ableitung des Sinus nur, wenn der Kosinus verschwindet, und dann muss der Sinus
im Betrag gleich 1 sein. Die erste Frage, die wir uns stellen, ist, ob der Sinus jemals
den Wert 1 erreicht. Angenommen, dies wäre nicht der Fall. Dann müsste Sinus mo-
noton wachsen und daher gegen einen Wert, a ≤ 1 konvergieren. Dies würde √ aber
implizieren, dass auch der Kosinus konvergiert, und zwar zu einem Wert ± 1 − a2 .
Wenn aber sin(x) gegen eine Konstante konvergiert, so muss auch cos(x) konvergie-
ren, und beider Ableitungen müssen gegen Null geben, was aber wegen der Glei-
chung (4.54) unmöglich ist. Also gibt es eine reelle Zahl, π/2, so dass
π/2 = min(x > 0 : sin(x) = 1). (4.56)
Es gilt dann auch, das der Kosinus monoton fallend auf [0, π/2] ist und cos(π/2) = 0.
Insbesondere nehmen sin und cos alle Werte zwischen −1 und 1 an wenn x zwi-
schen 0 und 2π variiert. Dies rechtfertigt die Interpretation dieser Funktionen als
Kreisfunktionen aus der elementaren Geometrie.
4.5 Höhere Ableitungen und Taylor Reihen
Wenn eine Funktion f : D → R auf D differenzierbar ist, so können wie eine neue
Funktion d f : D → R definieren indem wir fordern, dass für alle x ∈ D d f (x) = f 0 (x).
Wir nennen dann d f die Ableitungsfunktion von f oder wieder kurz die Ableitung
von f . In aller Regel benutzen wir auch die Schreibweise d f = f 0 . Damit steht die
Tür offen, den Begriff der Ableitung zu iterieren.
Definition 4.21. Wenn f : D → R für alle x ∈ D differenzierbar ist so nennen wir

die Abbildung f 0 : D → R, so dass für alle x ∈ D f 0 (x) die Ableitung von f bei x
ist, die Ableitungsfunktion von f . Wenn f 0 in D stetig ist, so heißt f auf D stetig
differenzierbar. Wir bezeichnen die Klasse der stetig differenzierbaren Funktionen
auf D mit C 1 (D).
Definition 4.22 (n-te Ableitung). Sei f : D → R eine reelle Funktion. Wir setzen
f = f (0) . Jede Funktion ist 0-mal differenzierbar. Für n ∈ N sagen wir, dass f n-mal
differenzierbar an der Stelle x ist, wenn f n − 1-mal differenzierbar in D ist und die
n − 1-te Ableitungsfunktion f (n−1) : D → R an der Stelle x differenzierbar ist. Wenn
f (n−1) in D differenzierbar ist, so nennen wir die Ableitungsfunktion f (n) . Wenn
die n-te Ableitung von f eine stetige Funktion ist, so nennen wir f n-mal stetig
differenzierbar. Die Klasse der n-mal stetig differenzierbaren Funktionen nennen
wir C n (D). Falls für jedes n ∈ N, f ∈ C n (D), so sagen wir dass f unendlich oft
differenzierbar ist und schreiben f ∈ C ∞ (D).
Anmerkung. Wir benutzen auch die Bezeichnung C 0 (D) für die stetigen Funktionen
auf D.
dn f (x)
Anmerkung. Anstatt f (n) (x) schreibt man auch dxn .
Wir haben die Ableitung als beste lineare Approximation an eine Funktion in
einem Punkt x definiert. Wir wollen nun zeigen, dass die höheren Ableitungen etwas
mit der besten Approximation einer Funktion durch ein Polynom zu tun haben. Dazu
sei zunächst p eine Polynom vom Grad n, also
p(x) = a0 + a1 x + a2 x2 + · · · + an xn . (4.57)
Man sieht leicht, dass p(k) (0) = ak k!, also
p(1) (0) p(2) (0) 2 p(n) (0) n

p(x) = p(0) + x+ x +···+ x . (4.58)
1! 2! n!
Man kann sich nun die Frage stellen, ob eine n-fach differenzierbare Funktion lo-
kal gut durch ein Polynom approximiert werden kann, etwa ob ein Analogon zum
Mittelwertsatz existiert, das besagen würde, dass es für eine solche Funktion ein
θ ∈ (0, 1) gibt, so dass
f (1) (0) f (2) (0) 2 f (n−1) (0) n−1 f (n) (θx) n

f (x) − f (0) − x− x −···− x = x . (4.59)
1! 2! (n − 1)! n!
Dies wird in der Tat der Fall sein.
Wir zeigen zunächst folgendes Lemma.
Lemma 4.23. Es sei D ⊂ R offen und 0 ∈ D. Sei h : D → R n-mal differenzierbar in
D. Sei ferner h(k) (0) = 0, für k = 0, 1, . . . , n − 1 und für ein x ∈ D fest, h(x) = 0. Dann
existiert ein θ ∈ (0, 1) so, dass
h(n) (θx) = 0. (4.60)
Beweis. Nach dem Mittelwertsatz (bzw. dem Satz von Rolle) (mit a = 0 und b = x)
existiert ein θ1 ∈ (0, 1) so, dass
h(1) (θ1 x) = 0. (4.61)
Anwendung des Satzes von Rolle auf die Funktion h(1) (mit a = 0 und b = θ1 x)
liefert, da h(1) (0) = 0, dass es θ2 ∈ (0, 1) gibt, so dass
h(2) (θ2 θ1 x) = 0. (4.62)
Iterieren dieses Arguments zeigt, dass es θ = θn θn−1 . . . θ1 ∈ (0, 1) gibt, so dass
h(n) (θx) = 0, (4.63)
wie behauptet. t
u
Jetzt müssen wir nur noch zeigen, dass wir ein Polynom p vom Grad n finden
können, so dass f − p die Voraussetzungen des Satzes erfüllt. Sei also f in einer
Umgebung von 0 n-mal differenzierbar. Wir definieren zunächst ein Polynom q mit
f (1) (0) f (2) (0) 2 f (n−1) (0) n−1

q(y) = f (0) + y+ y +···+ y . (4.64)
1! 2! (n − 1)!
4.5 Höhere Ableitungen und Taylor Reihen 85
Wenn wir g = f − q setzen, so ist schon mal g(k) (0) = 0, für k = 0, 1, . . . , n − 1. Aller-
dings gilt noch nicht g(x) = 0. Um dies zu erreichen, addieren wir zu q noch einen
Term der Ordnung n, wir setzen also
p(y) = q(y) + λyn . (4.65)
Nun wollen wir λ so wählen, dass
f (x) − p(x) = 0, (4.66)
also
f (x) − q(x) = λxn ⇔ λ = x−n ( f (x) − q(x)). (4.67)
Damit erfüllt die Funktion h mit
h(u) = f (u) − q(u) − un x−n ( f (x) − q(x)) (4.68)
die Voraussetzungen von Lemma 4.23. Daher existiert θ ∈ (0; 1) so, dass
h(n) (θx) = 0. (4.69)
Andererseits ist
h(n) (u) = f (n) (u) − n!x−n ( f (x) − q(x)). (4.70)
Also gilt
0 = f (n) (θx) − n!x−n ( f (x) − q(x)). (4.71)
Lösen wir dies nach f (x) auf, so erhalten wir
xn (n)
f (x) − q(x) = f (θx). (4.72)
n!
Damit haben wir aber den extrem wichtigen Satz von Taylor bewiesen!
Satz 4.24 (Satz von Taylor). Sei D ein offenes Intervall und sei f : D → R n-mal
differenzierbar in D. Dann existiert für jedes y, x ∈ D (oBda sei y < x) ein z ∈ (y; x),
so dass
f (1) (y) f (2) (y) f (n−1) (y)
f (x) − f (y) − (x − y) − (x − y)2 − · · · − (x − y)n−1
1! 2! (n − 1)!
(x − y)n (n)
= f (z). (4.73)
n!
Beweis. Der Satz folgt aus (4.72) mit der trivialen Verallgemeinerung dass wir 0
durch einen beliebigen Punkt y ersetzt haben. ut
Anmerkung. Der oben gegeben Beweis ist dem Blog von Timothy Gowers entnom-
men. Das Schöne an diesem Beweis ist, dass nur der Mittelwertsatz benutzt wird.
Das zeigt eben, dass die Idee der n-ten Ableitung ist, das ihre Existenz eine beste
lokale Approximation durch ein Polynom vom Grad n − 1 sicherstellt.
Anmerkung. Man nennt das Polynom q(x) Taylor-Polynom vom Grad n − 1 und den
n
Term (x−y) (n)
n! f (z) Restglied der Ordnung n. Genauer nennt man dieses Restglied
das Lagrange’sch Restglied der Ordnung n. Es gibt daneben noch andere Formen,
die aber weitgehend äquivalent sind.
Korollar 4.25. Sei D ein offenes Intervall und sei f : D → R n-mal stetig differen-
zierbar in D. Dann gilt für alle x, y ∈ D, dass
f (1) (y) f (2) (y) f (n) (y)

f (x) − f (y) − (x − y) − (x − y)2 − · · · − (x − y)n
1! 2! (n)!
= (y − x)n rn (x) (4.74)
wo lim x→y rn (y) = 0.
Beweis. Der Beweis folgt direkt aus der Gleichung (4.73) und der Tatsache, dass
f (n) stetig ist. Wege Satz 4.24 ist die linke Seite von Gl. (4.74) nämlich gleich
(x − y)n (n)
f (z) − f (n) (y) , (4.75)
n!

also ist rn (y) = n!1 f (n) (z) − f (n) (y) (beachte, dass z ∈ (x; y) eine Funktion von x ist)
stetig und rn (y) = 0, woraus die Behauptung folgt. u t
Das Polynom
f (1) (y) f (2) (y) f (n) (y)

(T n f )(y) = f (y) + (x − y) + (x − y)2 + · · · + (x − y)n (4.76)
1! 2! (n)!
heißt Taylorpolynom von Grad n der Funktion f an der Stelle x.
In der Praxis benutzt man den Satz von Taylor fast immer in der folgenden Form.
Korollar 4.26 (Taylor Schranke). Sei D ein offenes Intervall und sei f : D → R n-
mal differenzierbar in D. Wenn auf einer Teilmenge K ⊂ D f (n) uniform beschränkt
ist, also ∀z∈K f (n) (z) ≤ M, mit M ∈ R+ , gilt, Dann ist für jedes y < x ∈ K ein z ∈ (y <
x), so dass
|x − y|n
| f (x) − (T n f )(y)| ≤ M. (4.77)
n!
Wenn in einer -Umgebung I (x) die Folge der Taylorpolynome (T n (y))n∈N für
alle y ∈ I (x) konvergiert, und wenn limn↑∞ (T n f )(y) = f (y), so nennt man die Funk-
tion f in I (x) reell analytisch. In diesem Fall ist f ist eine konvergente Potenzreihe.
Beachte, dass das Korollar (4.25) nicht sicherstellt, dass die Taylorreihe konvergiert
und selbst wenn sie konvergiert, dass der Limes gleich der Funktion f ist! Man nennt
eine Approximation wie in diesem Korollar eine asymptotische Entwicklung. Dabei
wird zwar für jede Ordnung n der Fehler klein, wenn y − x nach 0 geht, es kann aber
sein, dass mit wachsendem n x − y immer kleiner genommen werden muss, um eine
gute Approximation zu erhalten.
4.6 Konvexität und Ungleichungen 87
Beispiel 4.27. Als Beispiel betrachten wir die Funktion f mit f (x) = exp(−1/x2 ).
Man kann leicht durch vollständige Induktion zeigen, dass die n-te Ableitung von f
die Form
f (n) (x) = pn (1/x) exp(−1/x2 ) (4.78)
hat, wo pn ein Polynom vom Grad 3n ist. Dann folgt, dass lim x↓0 f (n) (x) = 0, für alle
n ∈ N0 . Darum ist das Taylorpolynom von f and der Stelle 0 einfach (T n f )(y) = 0,
und somit auch limn↑∞ (T n f )(y) = 0 , f (y).
4.6 Konvexität und Ungleichungen
Ein wichtiges Konzept von großer praktischer Bedeutung in der Analysis ist die
Konvexität.
4.6.1 Definition und erste Eigenschaften konvexer Funktionen
Wir geben zunächst eine formale Definition.
Definition 4.28 (Konvexe Funktion). Sei I ⊂ R ein Intervall und f : I → R eine

Funktion. Dann heißt f konvex auf I, genau dann wenn gilt: für alle x < y ∈ I gilt
für alle z ∈ [x, y],
y−z z− x
f (z) ≤ f (x) + f (y) = L(z). (4.79)
y− x y− x
Eine Funktion f heißt konkav, wenn die Funktion − f konvex ist.
L ist die einzige lineare Funktion die an den Stellen x und y gerade die Werte f (x)
und f (y) annimmt. Geometrisch ist dies also die Sekante durch die Punkte (x, f (x))
und (y, f (y)). Konvexität bedeutet also, dass die Funktion zwischen je zwei Punkten
unterhalb der Sekante durch diese Punkte liegt.
Anmerkung. Wenn die Ungleichung in (4.79) strikt ist, so sagen wir, die Funktion
sei strikt konvex. Wenn es zwischen zwei Punkten x, y ∈ I einen Punkt z gibt, so dass
in (4.79) Gleichheit besteht, so ist f auf dem Interval [x; y] linear.
Für differenzierbare Funktionen können wir Konvexität auch anders beschreiben.
Lemma 4.29. Sei I ⊂ R ein Intervall und f : I → R eine in I stetig differenzierbare

Funktion. Dann ist f genau dann konvex in I, wenn für alle x ∈ I gilt, das für alle
y ∈ I, f (x) + (y − x) f 0 (x) ≤ f (y), das heißt f ist konvex, wenn sie oberhalb aller ihrer
Tangenten liegt.
Beweis. (1) Sei f konvex. Angenommen, es gäbe einen Punkt x < z ∈ I so, dass
f (z) < f (x) + (z − x) f 0 (x), d.h. die Steigung der Sekante zwischen x und z ist klei-
ner als die der Tangente. Da die konvexe Funktion zwischen x und z unterhalb der
c
a
Abb. 4.3 Konvexe Funktion
Sekante liegen muss, gilt dann für alle y ∈ (x, z), dass f (y) − f (x) < (y − x) f (z)− f (x)
z−x .
Daher ist
f (z) − f (x)
f 0 (x) ≤ < f 0 (x), (4.80)
z− x
was aber nicht sein kann. Also gibt es keinen solchen Punkt. Genau dasselbe folgt,
wenn es einen Punkt z < x gäbe wo f unterhalb der Tangente liegt.
(2)Umgekehrt nehmen wir nun an, dass f stets oberhalb ihrer Tangenten liegt.
Nehmen wir nun an, f sei nicht konvex, d.h. es gäbe zwei Punkte x < y ∈ I und
einen Punkt z ∈ (x, y) wo f oberhalb der Sekante durch x, y liegt, also
f (y) − f (x)
f (z) > f (x) + (z − x). (4.81)
y− x
Die Tangente an f bei z ist
T z (t) = f (z) + f 0 (z)(t − z). (4.82)

f (y)− f (x) f (y)− f (x)
Wir unterscheiden die Fälle f 0 (z) > y−x und f 0 (z) ≤ y−x . Im ersten Fall ist
f (y) − f (x)
T z (y) = f (z) + f 0 (z)(y − x) > f (z) + (y − z). (4.83)
y− x
Wegen (4.81) ist dann
f (y) − f (x) f (y) − f (x)
T z (y) > f (x) + (z − x) + (y − z) = f (y), (4.84)
y− x y− x
im Widerspruch zur Annahme , dass f stets über ihren Tangenten liegt. Im zweiten
Fall folgt völlig analog, dass
T z (x) > f (x), (4.85)
ebenfalls im Widerspruch zur Annahme. t
u
Übung 4.30. Hier ist eine Übung für etwas ehrgeizigere Studenten. Im Beweis des
Lemmas haben wir nicht wirklich benutzt, dass f differenzierbar ist. Wie könnten
wir die Aussage abändern, so dass sie auch für nicht-differenzierbare Funktionen
richtig bleibt? Hinweis: Schauen Sie sich unsere Diskussion der Funktion aus (4.10)
nochmal an!
Ein einfaches aber wichtiges Korollar ist für praktische Anwendungen wichtig.
Korollar 4.31. Sei I = [a; b] ⊂ R ein Intervall und f : I → R eine in I stetige und in
(a; b) differenzierbare Funktion. Dann ist f genau dann konvex in I, wenn die Ab-
leitungsfunktion f 0 in (a; b) monoton wachsend ist. Falls f zweimal differenzierbar
in I ist, so ist f genau dann konvex, wenn für alle x ∈ (a, b), f 00 (x) ≥ 0.
Beweis. Übung. u
t
Konvexe Funktionen verhalten sich gut. Zunächst sind konvexe Funktionen ste-
tig.
Lemma 4.32. Sei I = (a; b) ⊂ R ein Intervall und f : I → R eine in I konvexe Funk-
tion. Dann ist f in (a; b) stetig und in jedem abgeschlossenen Teilinterval Lipschitz
stetig.
Beweis. Der Beweis ist nicht ganz einfach und wird hier nicht gegeben.
Anmerkung. Die Polynome f mit f (x) = x2n , n ∈ N, sind konvex auf R. Die Potenzen
f mit f (x) = xρ , ρ ≥ 1, sind konvex auf R+ . Die Exponentialfunktion ist konvex.
Wenn f bijektiv und konvex ist, dann ist die inverse Funktion f −1 konkav. Insbe-
sondere sind die Funktionen f mit f (x) = xρ , 0 ≤ ρ ≤ 1, für x ∈ R+ konkav. Ebenso
ist der Logarithmus konkav.
4.6.2 Die Jensen Ungleichung und ihre Folgen
Die vielleicht wichtigste Eigenschaft konvexer Funktionen ist die Jensen Unglei-
chung.
Satz 4.33 (Jensen Ungleichung). Sei a eine reelle Folge und sei ϕ : R → R eine
konvexe Funktion auf R. Sei weiter für n ∈ N und k = 1, . . . , n, λk ∈ R+ so, dass
k=1 λk = 1. Dann gilt
Pn
n
 n 
X X 
λk ϕ(ak ) ≥ ϕ  λk ak  .
 (4.86)
k=1 k=1
Beweis. Da ϕ konvex ist, gibt es an jedem Punkt y ∈ R eine lineare Funktion L mit
L(y) = φ(y), so dass ϕ ≥ L. Also gibt es ein m ∈ R, so dass für alle x ∈ R, ϕ(x) ≥
ϕ(y) + (x − y)m. Insbesondere ist mit x = a` und y = nk=1 λk ak
P
 n   n

X   X 
φ (a` ) ≥ φ  λk ak  + a` −
   λk ak  m. (4.87)
k=1 k=1
Wenn wir dann mit λ` multiplzieren und über ` summieren, erhalten wir, da
`=1 λ` = 1,
Pn
n
 n   n n

X X  X X 
λ` φ(a` ) ≥ φ  λk ak  +  λ` a` − λk ak  m. (4.88)
`=1 k=1 `=1 k=1
Da die letzten Terme sich wegheben, erhalten wir die Ungleichung (4.86) t
u
Abb. 4.4 Zur Jensen Ungleichung
Für einen reellen Vektor a = (a1 , . . . , an ) und p > 0 definieren wir

 n 1/p
X 
kak p =  |ak |  .
 p
(4.89)
k=1
Wir nennen kak p die p-Norm des Vektors a. Aus der Jensen Ungleichung erhalten
wir die sehr wichtige Familie von Hölder Ungleichungen.
Lemma 4.34 (Hölder Ungleichung). Seien a, b reelle Vektoren mit n Komponen-

ten. Sei p, q ∈ (1, ∞) so, dass 1p + 1q = 1. Dann gilt
n
X
ak bk ≤ kakq kbk p . (4.90)
k=1
Beweis. Da offensichtlich nk=1 ak bk ≤ nk=1 |ak ||bk | gilt, können wir oBdA anneh-
P P
men, dass a und b Vektoren mit nicht-negativen Komponenten sind. Wir schreiben
 n p  n Pn q p

 ak bk  =  ak bk aq a−q Pm=1 am 
X  X
k k n q 
`=1 a`
  
k=1 k=1
p
X aq
 n n
X 
k 1−q q
=  Pn q ak bk am 
k=1 `=1 `
a m=1
n q  n
p
X a  1−q X 
k q
≤ Pn q ak bk
 am 
k=1 `=1 k
a m=1
q X q  p
n
 n 
X ak (1−q)p p 
= Pn q ak bk  am 

k=1 `=1 `
a m=1
X q  p−1 X
 n  n
p
=  ak  bk . (4.91)
k=1 k=1
Hier haben wir in der ersten Ungleichung die Jensen Ungleichung für die konvexe
q
a
Funktion φ mit φ(x) = x p und λk = Pn k q . benutzt. In der letzten Gleichung haben
`=1 a`
wir benutzt, dass (1 − q)p = −q. Wenn wir nun die p-te Wurzel nehmen, erhalten
wir, da (p − 1)/p = 1/q,
 X q (p−1)/p X

 n   n   n 1/p
X p

 ak bk  ≤  a   b  = kakq kbk p . (4.92)
   k  k
k=1 k=1 k=1
Was wir zeigen wollten. t

u
Ein wichtiger Spezialfall der Hölder Ungleichung ist die Cauchy-Schwarz Un-
gleichung:
X n
an bn ≤ kak2 kbk2 . (4.93)
k=1
Anmerkung. Wenn wir definieren

n
kak∞ = max |ak |, (4.94)
k=1
dann können wir (über eine ganz einfache Verallgemeinerung der Maximums Un-
gleichung (2.25) auch den Fall p = 1, q = ∞ einschliessen.
Die p-Normen erfüllen eine weitere wichtige Ungleichung, die Minkowski Un-
gleichung. Sie ist nichts anderes als die Dreiecksungleichung.
Lemma 4.35 (Minkowski Ungleichung). Seien a, b reelle Vektoren mit n Kompo-

nenten. Sei p ∈ [1, ∞]. Dann gilt
ka + bk p ≤ kak p + kbk p . (4.95)

Beweis. Übung. t
u
Wir nutzen die Gelegenheit, um den wichtigen Begriff der Norm im Allgemeinen
einzuführen.
Definition 4.36 (Norm). Sei E ein linearer Raum, d.h. eine Menge E mit folgenden
Eigenschaften:
(i) Es existiert eine Abbildung + : E × E → E, und (E, +) ist eine kommutative
Gruppe.
(ii) Es existiert eine Abbildung ? : R × E → E, so dass für alle a, b ∈ E und x, y ∈ R
gilt
x ? (a + b) = x ? a + x ? b, (4.96)
und
(x + y) ? a = x ? a + y ? a, (4.97)
sowie
(xy) ? a = x ? (y ? a), (4.98)
und
1 ? a = a. (4.99)
Dann heißt eine Abbildung k · k : E → R+ eine Norm, genau dann wenn:
(i) Für alle x ∈ R und a ∈ E gilt kx ? ak = |x|kak.
(ii) Für alle a, b ∈ E gilt ka + bk ≤ kak + kbk.
(iii) a = 0 ⇔ kak = 0.
Anmerkung. Beachte, dass für jede Abbildung ρ : E → R, die die Eigenschaften (i)
und (ii) erfüllt gelten muss, dass ρ(0) = 0 und für alle a ∈ E, ρ(a) ≥ 0. (Warum?)
Lemma 4.37. Die p-Normen mit p ∈ [1; ∞] sind Normen auf dem Raum Rn .
Beweis. Übung. u
t
Kapitel 5
Integration
Wir hatten bereits im Korollar 4.14 gesehen, dass eine Funktion bis auf eine Kon-
stante durch ihre Ableitung festgelegt ist. Das eröffnet die Möglichkeit, die Frage-
stellungen der vorhergehenden Kapitel, in denen es darum ging, lokale Eigenschaf-
ten gegebener Funktionen zu beschreiben, umzukehren, und zu versuchen, Funktio-
nen aus der Angabe ihrer lokalen Eigenschaften zu rekonstruieren. Dies ist in zahl-
reichen Anwendungen fundamental: Physikalische Gesetze sind oft von der Form,
dass die Rate, mit der sich eine Größe verändert (also eine Ableitung) gegeben wer-
den. Die Aufgabe besteht dann darin, das Verhalten dieser Größe auf lange Zeit zu
bestimmen.
5.1 Stammfunktionen
Unsere erste Frage ist also die nach einer Art der Umkehrung der Differentiation.
Dies führt auf den Begriff der Stammfunktion.
Definition 5.1 (Stammfunktion). Sei f : [a; b] → R eine reelle Funktion. Dann

heißt F : [a; b] → R Stammfunktion von f , genau dann wenn F stetig ist und für
alle x ∈ (a; b) bis auf abzählbar viele Ausnahmepunkte F differenzierbar ist und es
gilt F 0 (x) = f (x).
Wir wissen bereits, dass, wenn zwei Funkionen F und G Stammfunktionen von
f sind, folgt, dass F = G + C, wo C eine Konstante ist. Umgekehrt wissen wir auch,
dass wenn F Stammfunktion von f ist, dann F + C auch eine Stammfunktion ist.
Was wir noch nicht wissen, ist, welche Funktionen überhaupt Stammfunktionen
haben.
Die Tatsache, dass wir eine abzählbare Ausnahmemenge an Punkten zulassen,
wo F nicht differenzierbar ist, kommt von der Betrachtung sehr einfacher Funktio-
nen, wie der Funktion f mit
93
94 5 Integration

−1,
 x < 0,
f (x) = 

(5.1)
1,
 x ≥ 0.
Wir würden gerne akzeptieren, dass F


−x,
 x < 0,
F(x) = 

(5.2)
 x,
 x≥0
eine Stammfunktion ist. Aber natürlich ist F bei 0 nicht differenzierbar. Daher lassen
wir solche Ausnahmepunkte zu. Wir werden hierauf noch zurückkommen.
Eine weitere triviale aber wichtige Beobachtung ist, dass, ebenso wie das Ablei-
ten, das Finden einer Stammfunktion linear ist.
Lemma 5.2. Seien f1 , f2 Funktionen und F1 , F2 ihre Stammfunktionen. Dann hat

die Funktion g = α f1 + β f2 die Stammfunktion αF1 + βF2 .
Beweis. Trivial. t
u
Das Finden von Stammfunktionen ist nicht leicht. Dagegen ist es sehr leicht,
nachzuprüfen, ob eine gegebene Funktion die gewünschte Stammfunktion ist: man
braucht sie nur abzuleiten und vergleicht. Um für eine gegebene Funktion f eine
Stammfunktion zu finden, braucht man also nur alle Funktionen, die einem einfal-
len abzuleiten, bis man eine gefunden hat, deren Ableitung f ist. Es empfiehlt sich
dafür, die erhaltenen Paare von Funktionen und Ihrer Ableitungen aufzulisten und
diese Listen in umgekehrter Richtung zu nutzen. Dies ist im großen Umfang gesche-
hen und die entstandenen Tabellen heißen Integraltafeln. Eine der ausführlichsten
Sammlungen ist der Gradstein-Rhyshik [3]. Auch Wolframs Mathematika ist in der
Lage für eine große Menge von Funktionen die Stammfunktion herauszufinden. Nur
sehr wenige Funktionen besitzen Stammfunktionen, die man explizit angeben kann.
Andererseits werden wir sehr bald sehen, dass sehr viele Funktionen eine Stamm-
funktion besitzen.
Trotzdem ist es gut zu wissen, dass sich aus den Regeln für die Ableitungen
Regeln für das Finden von Stammfunktionen herleiten lassen, die oft sehr nützlich
sind. Die erste dieser Regeln folgt aus der Kettenregel.
Lemma 5.3 (Substitutionsregel). Sei g : D → R und sei h : I → D differenzierbar

in I und streng monoton. Sei G Stammfunktion von g. Sei f = (g ◦ h)h0 : I → R. Dann
ist F = G ◦ h Stammfunktion von f .
Beweis. Der Beweis folgt einfach aus der Kettenregel. Es gilt danach, dass für alle
x so, dass G bei h(x) differenzierbar ist,
F 0 (x) = G0 (h(x))h0 (x) = g ◦ h(x)h0 (x) = f (x). (5.3)
Da h monoton ist, gibt es nur abzählbar viele x, so dass G bei h(x) nicht differen-
zierbar ist. Daher ist F Stammfunktion wie behauptet. u t
5.1 Stammfunktionen 95
Anmerkung. Die gleiche Folgerung gilt, wenn wir annehmen, dass g stetig und h
stetig differenzierbar ist.
So einfach der Beweis ist, so schwierig ist die Anwendung. Man muss sich ei-
ne Funktion anschauen und sehen, ob man sie in der gewünschten Form schreiben
kann.
Ein hübsches Beispiel ist die Funktion f (x) = exp(−x2 /2)x. Mit g = exp und
h(x) = −x2 /2 hat sie genau die gewünschte Form (bis auf das Vorzeichen). Nun
wissen wir, dass exp0 = exp, also die Stammfunktion von exp auch exp ist. Somit ist
die Stammfunktion unsere Funktion f gegeben durch F(x) = − exp(−x2 /2).
Eine weitere nützliche Formel folgt aus der Produktregel. Man bezeichnet sie als
partielle Integration.
Lemma 5.4 (Partielle Integration). Sei g : I → R und sei h : I → R differenzierbar
in I. Wenn F2 Stammfunktion von g0 h ist, dann hat hg0 eine Stammfunktion F1 , und
es gilt
F1 = hg − F2 + C, (5.4)
wo C eine Konstante ist.
Beweis. Wir nehmen an, dass F2 existiert. Wir setzen F1 = hg − F2 + C. Dann ist
nach Annahme F1 in I bis auf abzählbar viele Punkte differenzierbar und es gilt
F10 (x) = h0 (x)g(x) + h(x)g0 (x) − F20 (x) = h0 (x)g(x), (5.5)
und F1 is somit Stammfunktion von h0 g, wie behauptet. t

u
Bei Anwendungen dieser Regel werden wir eine Funktion gegeben haben, die
wir in der Form f g als Produkt schreiben können. Die Produktregel nützt uns dann
etwas, wenn wir etwa die Stammfunktion von f kennen, also wissen, dass f = h0 .
Dann können wir die Stammfunktion von f g mit der Produktregel finden, wenn
wir die Stammfunktion von hg0 kennen. Wenn dies nicht der Fall ist, kann man
versuchen die Produktregel zu iterieren. Dies ist besonders vielversprechend, wenn
durch fortgesetztes differenzieren die Funktion g ’einfacher’ wird, wie etwa im Fall
g(x) = xn .
Als erste Anwendung suchen wir die Stammfunktion von w wo w(x) = x exp(−x).
Wir nehmen h(x) = − exp(−x) und g(x) = x. Dann ist w = h0 g. Dann ist h(x)g0 (x) =
− exp(−x) und somit F2 (x) = exp(−x). Daraus folgt
F1 (x) = −x exp(−x) + exp(−x) + C (5.6)
Man rechnet leicht nach, dass die Ableitung der rechten Seite in der Tat x ergibt.
Allgemeiner können wir die Funktionen wn (x) = xn exp(−x) betrachten. Wir
schreiben w = h0 g mit h(x) = − exp(−x) und g(x) = xn . Dann ist
F1 (x) = −xn exp(x) − F2 (x), (5.7)
wo F2 Stammfunktion von hg0 mit h(x)g0 (x) = −n exp(−x)xn−1 = −nwn−1 (x). Das
heißt, die Stammfunktion von wn kennen wir, wenn wir die von wn−1 kennen. Da
96 5 Integration
wir die Stammfunktion von w0 (und sogar auch schon von w1 ) kennen, sind wir
nach endlich vielen Schritten am Ziel.
Mit diesen Regeln kann man schon allerlei Stammfunktionen bestimmen.
5.2 Das Riemann Integral
Wir bewegen uns nun in Richtung auf den Beweis der Existenz einer Stammfunkti-
on für eine große Klasse von Funktionen. Dazu gehen wir aber erst einmal in eine
ganz andere Richtung. Wir erinnern uns, dass die elementaren Rechenoperationen
Addition und Multiplikation klare geometrische Interpretationen hatten. Eine posi-
tive reelle Zahl stellt die Länge einer Strecke dar, die Summe zweier solcher Zahlen
ist die Länge der aneinander gelegten Strecken. Das Produkt ist der Flächeninhalt
des Rechtecks mit den entsprechenden Seitenlängen. Wir können also mit Hilfe un-
seres Rechenkalküls für reelle Zahlen den Flächeninhalt von beliebigen Rechtecken
berechnen. Wie können wir Flächeninhalte anderer Teilmengen des R2 berechnen?
Die wesentliche Forderung, die wir an einen Flächeninhalt stellen wollen, ist in der
folgenden (etwas tentativen) Definition festgehalten.
Definition 5.5 (Flächeninhalt). Sei A ⊂ P(R2 ) eine Klasse von Teilmengen des R2
die alle endlichen Rechtecke enthält. Eine Abbildung V : A → R+ heißt Flächeninhalt,
wenn folgendes gilt:
(o) V(∅) = 0.
(i) Falls A, B ∈ A und A ∩ B = ∅, dann ist V(A ∪ B) = V(A) + V(B).
(iii) Falls A ein Rechteck mit Seitenlängen a und b ist, so ist V(A) = ab.
Wir bleiben an dieser Stelle eine genaue Angabe der Klasse A schuldig. Im Fol-
genden wollen wir Mengen betrachten, die man als Gebiete unterhalb des Graphen
von Funktionen erhalten kann, also Mengen der Form
A = {(x, y) ∈ R2 : a ≤ x ≤ b, 0 ≤ y ≤ f (x)}, (5.8)
wo a < b ∈ R, f : [a; b] → R+ . Eine naheliegende Idee ist es, zu versuchen, diese

Mengen in Rechtecke zu zerlegen, und dann unsere definierenden Eigenschaften
des Flächeninhalts anzuwenden. Wenn dies möglich ist, so haben wir kein Pro-
blem. Wenn nicht, so können wir hoffen, durch sukzessive Approximationen und
Grenzübergänge ans Ziel zu gelangen.
Definition 5.6 (Indikatorfunktion). Sei I ⊂ R. Dann heißt die Funktion 1I : R →

R+ mit 
1, x ∈ I,
1I (x) = 

(5.9)
0, x < I,
die Indikatorfunktion der Menge I.
5.2 Das Riemann Integral 97
Definition 5.7 (Treppenfunktion). Eine Funktion φ : [a, b] → R heißt Treppen-

funktion, wenn es n ∈ N und a = x0 < x1 < · · · < xn = b und w1 , . . . , wn ∈ R gibt, so
dass für alle k = 1, . . . , n und für alle x ∈ (xk−1 , xk ), f (x) = wk . Eine Treppenfunktion
heißt positiv, falls alle Zahlen wk , k = 1, . . . , n nicht negativ sind. Die Menge aller
Treppenfunktionen auf dem Intervall [a; b] bezeichnen wir mit T([a; b]).
Anmerkung. Beachte, dass wir nicht darüber fordern, welche Werte f an den end-
lich vielen Stellen xk , k = 1, . . . n annimmt. Wir könnten uns allerdings auch auf Trep-
penfunktionen einschränken, die z.B. links-stetig sind, und dann in der Form
n
wi 1[xi−1 ;xi ) ,
X
φ= (5.10)
i=1
als Summe von Indikatorfunktionen halboffener Intervalle geschrieben werden. Be-

achte auch, dass wir nicht fordern, dass die Werte wk verschieden sind. Daher
können wir für zwei Treppenfunktionen f, g, stets Darstellungen finden, für die je-
weils das gleiche n und die gleichen Punkte xk benutzt werden.
Offensichtlich snd Linearkombinationen von Treppenfunktionen Treppenfunk-

tionen.
Wir definieren nun das Integral von Treppenfunktionen.
Definition 5.8 (Integral von Treppenfunktionen). Sei φ ∈ T([a; b]) eine Treppen-
funktion wie in der Definition. Dann ist
Z b n
X
φ(x)dx = wk (xk − xk−1 ). (5.11)
a k=1
Beachte, dass der Wert des Integrals nicht davon abhängt, welche Werte f auf
den Punkten xi annimmt. Wir können dies auch so ausdrücken, dass a 1{y} (x)dx =
Rb
0 für jeden Punkt y ∈ R. Geometrisch bedeutet dies einfach, dass ein eine Linie
Flächeninhalt Null hat.
Lemma 5.9. Sei φ eine nicht-negative Treppenfunktion und sei A die in (5.8) defi-
nierte Menge bezüglich der Funktion φ. Dann ist
Z b
V(A) = φ(x)dx (5.12)
a
der Flächeninhalt der Fläche unterhalb der Treppenfunktion φ. Insbesondere gelten

die folgenden Eigenschaften:
Rb
(o) Wenn φ positive Treppenfunktion ist, dann ist a φ(x)dx ≥ 0.
(i) Sei φ Treppenfunktion und λ ∈ R, dann ist
Z b Z b
λφ(x)dx = λ φ(x)dx. (5.13)
a a
98 5 Integration
(ii) Seien φ, ψ Treppenfunktionen, dann gilt

Z b Z b Z b
(φ(x) + ψ(x))dx = φ(x)dx + ψ(x)dx. (5.14)
a a a
Beweis. Elementar. Die Fläche unter der Treppenfunktion lässt sich in disjunkte
Rechtecke zerlegen deren Volumen nach (ii) wk (xk − xk−1 ) sind. Wegen (i) muss
dann V(A) die Summe auf der rechten Seite von (5.11) sein. (5.13) und (5.14) sind
offensichtlich. u
t
Es ist nun naheliegend, das Integral allgemeiner Funktionen durch das Integral
von Treppenfunktionen zu approximieren. Zumindest für nicht allzu wilde Funktio-
nen sollte dies möglich sein.
Definition 5.10 (Ober- und Unterintegral). Sei f : [a; b] → R eine beschränkte
Funktion. Dann definieren wir das Oberintegral,
Z b,∗ Z b !
f (x)dx = inf φ(x)dx : φ ∈ T([a; b]) ∧ φ ≥ f , (5.15)
a a
und das Unterintegral,

Z b Z b !
f (x)dx = sup φ(x)dx : φ ∈ T([a; b]) ∧ φ ≤ f . (5.16)
a,∗ a
Da f beschränkt ist existieren infimum und supremum in R. Wenn dem Volumen

unter der Funktion f überhaupt ein Sinn gegeben werden kann, so ist das Oberinte-
gral sicher größer oder gleich diesem Volumen, und das Unterintegral kleiner oder
gleich. Wenn Gleichheit herrscht, so stellen beide das Volumen dar. Daher ist die
folgende Definition sinnvoll.
Definition 5.11 (Riemann Integral). Sei f : [a; b] → R eine beschränkte Funktion.
f heißt Riemann integrierbar genau dann, wenn
Z b Z b,∗
f (x)dx = f (x)dx. (5.17)
a,∗ a
Wenn f Riemann integrierbar ist, so setzen wir

Z b Z b Z b,∗
f (x)dx = f (x)dx = f (x)dx. (5.18)
a a,∗ a
Rb
und nennen a
f (x)dx das Riemann Integral von f .
Diese Definition hat den großen Vorteil, dass die elementaren Eigenschaften des
Integrals aus Lemma (5.11) sich sofort auf das Riemann Integral Riemann integrier-
barer Funktionen übertragen. Schön ist auch, dass es Riemann integrierbare Funk-
tionen gibt, nämlich die Treppenfunktionen. Wir müssen nur noch hoffen, dass es
außer diesen noch genügend andere gibt. Das ist zum Glück der Fall.
Im Folgenden lassen wir den Namen Riemann im Zusammenhang mit Integral

und integrierbar meist weg.
Satz 5.12 (Stetige Funktionen sind integrierbar). Jede beschränkte stückweise
stetige Funktion auf einem Intervall [a; b] ist Riemann integrierbar.
Beweis. Es genügt, den Satz für stetige Funktionen f zu zeigen. Ansonsten zerlegt
man das Intervall [a; b] in die Teilintervalle, auf denen f stetig ist und bemerkt,
dass das Integral über [a; b] die Summe der Integrale über die Teilintervalle ist.
Für stetige f gehen wir nun so vor. Ohne Beschränkung der Allgemeinheit können
wir annehmen, dass a = 0, b = 1. Wir zerlegen [0; 1] in n gleich große disjunkte
Teilintervalle I0 = [0, 1/n], Ik = ((k − 1)/n, k/n)], k = 2, . . . n. Dann definieren wir die
Treppenfunktionen φ+ und φ− durch
φ+n (x) = sup f (y), wenn x ∈ Ik , k = 1, . . . , n. (5.19)

y∈Ik
und
φ−n (x) = inf f (y), wenn x ∈ Ik , k = 1, . . . , n. (5.20)
y∈Ik
Da f stetig in [0; 1] ist, ist f dort sogar gleichmäßig stetig. Also gibt es für jedes
> 0 ein n0 ∈ N, so dass für alle n ≥ n0 , für alle k = 1, . . . , n für alle y, z ∈ Ik gilt, dass
| f (z) − f (y)| < . Insbesondere ist dann
sup f (y) − inf f (y) < . (5.21)

y∈Ik y∈Ik
Weiter ist
Z 1 Z 1 !
f (x)dx = sup φ(x)dx; φ ≤ f (5.22)
0,∗ 0
Z 1 Z 1
≥ φ+n (x)dx −
φ−n (x)dx >
0 0
Z 1 !
≥ inf φ(x)dx; φ ≥ f −
0
Z 1,∗
= f (x)dx − .
0
Da andererseits Z 1 Z 1,∗
f (x)dx ≤ f (x)dx, (5.23)
0,∗ 0
ist für alle > 0 die Differenz zwischen Ober- und Unterintegral kleiner als , und
daher müssen sie gleich sein. Also ist f integrierbar. u
t
Eine weitere Klasse integrierbarer Funktionen sind monotone Funktionen.
Lemma 5.13 (Monotone Funktionen). Sei f : [a; b] → R monoton wachsend (oder
monoton fallend). Dann ist f Riemann integrierbar.
100 5 Integration
Beweis. Der Beweis ist noch einfacher als der vorhergehende. Man benutzt die-
selben Treppenfunktionen φ±n , weiß nun aber, wegen der Monotonie, das Infimum
und Supremum in jedem Ik am Intervallanfang bzw. am Intervallende angenommen
werden. Eine elementare Rechnung zeigt dann, dass
Z 1 Z 1
1
φ+n (x)dx − φ−n (x)dx = ( f (1) − f (0)). (5.24)
0 0 n
Hieraus folgt das Lemma (siehe auch das Bild 5.2). t
u
φ+n und φ−n . Indem man die Kästchen

R R
Abb. 5.1 Das schraffierte Gebiet ist die Differenz von
stapelt sieht man das Gleichung (5.24) gilt.
5.2.1 Der Mittelwertsatz
Wir kommen nun zu dem einfachen Analogon des Zwischenwertsatzes für die In-
tegration. Er besagt im Wesentlichen nichts weiter, als dass der Flächeninhalt unter
einer Kurve über einem Intervall [a; b] gleich dem Flächeninhalt eines Rechtecks
mit einer Seite [a; b] ist.
Satz 5.14 (Mittelwertsatz). Sei f : [a; b] → R stetig. Dann existiert ein m ∈ (a; b)
so, dass Z b
f (x)dx = (b − a) f (m). (5.25)
a
Beweis. Offenbar ist

Z b
inf f (z)(b − a) ≤ f (x)dx ≤ sup f (z)(b − a). (5.26)
z∈[a;b] a z∈[a;b]
Also existiert ein w mit
inf f (z) ≤ w ≤ sup f (z), (5.27)

z∈[a;b] z∈[a;b]
Rb
so, dass a f (x)dx = w(b − a). Andererseits nimmt f jeden Wert zwischen inf und
sup an, also gibt es ein m ∈ [a; b], so dass w = f (m). Man überlegt sich auch leicht,
dass es ein solches m sogar im Innern des Intervalls geben muss. u t
Anmerkung. Der Mittelwertsatz hat folgenden einfache Verallgemeinerung;

Satz 5.15 (Mitterlwersatz’). Sei f : [a; b] → R stetig und r : [a; b] → R+ integrier-
bar. Dann existiert ein m ∈ (a; b) so, dass
Z b Z b
r(x) f (x)dx = f (m) r(x)dx. (5.28)
a a
Der Beweis ist praktisch identisch zu dem oben gegebenen.
5.2.2 Riemann Summen
In der Literatur wird gerne auch der Begriff der Riemann Summe eingeführt. Diese
sind gegebenenfalls für die numerische Berechnung von Integralen von Bedeutung.
Dazu betrachtet man eine beliebige Partition des Intervalls [a; b], Ik(n) , k = 1, . . . , n
wie vorher, und eine Wahl von Werten ξk ∈ Ik(n) . Dies liefert eine Treppenfunkti-
on φn,ξ1 ,...,ξk die auf den Intervallen Ik den Wert f (ξk ) annimmt. Man nennt dann
Rb
Rn (ξ1 , . . . , ξn ) = a φn,ξ1 ,...,ξk (x)dx eine Riemann Summe bezüglich (ξk )nk=1 . Es gilt
folgender Satz, dessen Beweis wir als Übung stellen.
Lemma 5.16. Eine Funktion f : [a; b] → R ist genau dann Riemannn integrier-
bar, wenn für jede Folge von Partitionen I (n) , n ∈ N mit der Eigenschaft, dass
limn↑∞ maxnk=1 |Ik(n) | = 0, und jede Wahl der ξ1(n) , . . . , ξn(n) , n ∈ N, die Folgen Rn (ξ1 , . . . , ξn )
zu dem gleichen Grenzwert konvergieren. Diese ist dann das Riemann Integral von
f.
Anmerkung. Es gibt nicht-Riemann integrierbare Funktionen, für welche für be-

stimmte Wahlen der Zwischenwerte die Riemann Summe konvergiert. Dies wird
zum Beispiel in der stochastischen Analysis benutzt, um sogenannte stochasti-
sche Integrale zu definieren, die nach dem Riemann’schen Integralbegriff nicht exi-
stieren. Eine andere Verallgemeinerung des Integrationsbegriffs ist das sogenannte
Kurzweil Integral. Hier führt man eine sogenannte Eichfunktion δ : [a; b] → (0; ∞)
ein. Man sagt dann eine Partition und Zwischenwerte seien δ-fein, wenn
∀nk=1 Ik ⊂ (ξk − δ(ξk ); ξk + δ(ξk )). (5.29)

102 5 Integration
Man sagt dann, dass I das Kurzweil Integral von f ist, wenn für jedes > 0 eine
Eichfunktion δ existiert, so dass für jede δ-feine Partition und Zwischenwerte
|Rn (ξ1 , . . . , ξn ) − I| < . (5.30)
Das Kurzweil Integral stimmt für Riemann integrierbare Funktionen mit diesem
überein, erlaubt aber weit mehr Funktionen zu integrieren. Die wichtigsten Eigen-
schaften des Integrals bleiben ebenfalls erhalten.
5.3 Der Hauptsatz der Differential- und Integralrechnung
Wir kommen nun zu dem zentralen Satz, der das analytische Konzept der Stamm-
funktion mit dem geometrischen Konzept des Integrals verknüpft. Dies Verbindung
ist in beide Richtungen äußerst fruchtbar. Man nennt ihn nicht zu Unrecht den
Hauptsatz der Differential- und Integralrechnung (Engl.: Fundamental theorem of
calculus).
Satz 5.17 (Hauptsatz). Sei I = [a; b] ein Intervall und f : I → R eine Riemann inte-
grable Funktion. Wir definieren eine Funktion F : I → R so dass, für alle x ∈ I,
Z x
F(x) = f (y)dy. (5.31)
a
Dann gilt:
(i) Für alle x ∈ I an denen f stetig ist, ist F differenzierbar, und es gilt
F 0 (x) = f (x). (5.32)
(ii)Wenn f in [a; b] an allen bis au abzählbar vielen Punkten stetig ist und Φ eine
beliebige Stammfunktion von f ist, so gilt
F(x) = Φ(x) − Φ(a). (5.33)
Beweis. Der Erste Teil der Aussage ist eine einfache Konsequenz des Mittelwert-
satzes 5.14. Wir müssen ja zeigen, dass
|F(x) − F(y) − f (x)(x − y)| /|x − y| → 0, (5.34)
wenn (x − y) nach 0 geht. Nun ist aber wie im Beweis des Mittelwertsatz (sei oBdA
x > y)
Z x
|F(x) − F(y) − f (x)(x − y)| = f (z)dz − f (x)(x − y) = |(w − f (x))(x − y)| , (5.35)
y
h i
mit w ∈ inf z∈[x;y] f (z); supz∈[x;y] f (z) . Also ist
5.4 Uneigentliche Integrale 103
|F(x) − F(y) − f (x)(x − y)| /|x − y| = |w − f (x)|. (5.36)
Da f bei x stetig ist muss sowohl supz∈[x;y] f (z) als auch inf z∈[x;y] f (z) nach f (x)
konvergieren, wenn y nach x geht. Also muss auch w gegen f (x) konvergieren und
somit konvergiert die rechte Seite nach 0, wie behauptet.
Die zweite Aussage folgt aus dem Eindeutigkeitssatz, Lemma 4.18. Wenn Φ eine
Stammfunktion für f , so ist für alle bis auf abzählbar viele x ∈ I, Φ0 (x) = f (x).
Andererseits ist nach Punkt (i) auch F 0 (x) = f (x) and allen bis auf abzählbar vielen
Punkten x ∈ I. Damit gilt, das für alle bis auf abzählbar viele Punkte F 0 (x) = Φ0 (x)
so dass aus Lemma 4.18 folgt, dass F = Φ + C. Nun wissen wir aber, dass F(a) = 0,
also muss C = −Φ(a) sein. u t
Obwohl der Beweis nach unseren Vorarbeiten ganz einfach aussah, soll man sich
über die Tiefe dieser Aussage nicht täuschen.
5.4 Uneigentliche Integrale
Die Definition des Riemann Integrals erlaubt bisher nur die Berechnung von In-
tegralen über
R ∞kompakte Intervalle. Dies ist zu restriktiv. SoR wären wir geneigt, zu
y
sagen, dass 0 f (x)dx existiert, wenn für alle y > 0, F(y) = 0 f (x)dx existiert, und
die Funktion F(y) einen Grenzwert für y → ∞ besitzt. Allerdings müssen wir hier,
ebenso wie bei der Summierung von Reihen, darauf achten, keine unsinnigen Addi-
tionen von +∞ und −∞ zu produzieren. Zum Beispiel existiert für jedes y ∈ R+ ,
Z y
xdx = F(y) = 0, (5.37)
−y
wie Rman sich schon geometrisch leicht klar macht. Damit wäre auch limy↑∞ F(y) =
∞
0 = −∞ xdx. Andererseits ist
Z y+1
xdx = y + 1/2, (5.38)
−y
R∞
so dass wir mit gleichem Recht sagen könnten −∞
xdx = +∞, oder auch,
Z ∞ Z y+1/y !
1
xdx = lim xdx = lim 1 + 2 = 1. (5.39)
−∞ y↑∞ −y y↑∞ 2y
Um solche Probleme zu vermeiden, ist es am einfachsten, Funktionen in ihre po-

sitiven und negativen Teile zu zerlegen. Sei D ⊆ R und f : D → R. Wir setzen für
x ∈ D, 
 f (x),
 wenn f (x) ≥ 0,
f+ (x) = 

(5.40)
0,
 wenn f (x) < 0,
104 5 Integration
sowie f− (x) = f+ (x) − f (x). Dann sind f± nicht-negative Funktionen.

Wir können nun uneigentliche Integrale wie folgt definieren.
Definition 5.18 (Uneigentliche Integrale). I ⊆ R nicht kompaktes Intervall (bzw.
eine Halbachse oder R) und f : I → R.
Rb
(i) Sei f nicht-negativ. Falls für jedes kompakte Intervall [a; b] ⊂ I, a f (x)dx exi-
stiert und der Limes Z b
lim f (x)dx ∈ R+ (5.41)
[a;b]↑I¯ a
existiert, so sagen wir

Z b Z
lim f (x)dx = f (x)dx. (5.42)
[a;b]↑I¯ a I
Rb Rb
(ii) Falls lim[a;b]↑I¯ a
f+ (x)dx und lim[a;b]↑I¯ a f− (x)dx in R+ existieren, so sagen
wir Z Z Z
f (x)dx = f+ (x)dx − f− (x)dx. (5.43)
I I I
Hier meinen wir mit lim[a;b]↑I¯ natürlich, dass a und b (in beliebiger Reihenfolge
gegen die Grenzen des abgeschlossenen Intervalls I¯ konvergieren, im Fall das diese
±∞ sind entsprechend dass a bzw. b nach unendlich gehen (was wiederum heißt,
dass auch für Folgen an , bzw. bn , die (uneigentlich) divergieren die Aussage gilt.
Wegen der Positivität von f sind die Folgen monoton und daher die Wahl der Folgen
egal.
R
Lemma 5.19. Das uneigentliche Integral I f (x) existiert und ist endlich, genau
R
dann wenn I | f (x)|dx existiert und endlich ist.
Beweis. Übung. t
u
Rb Rb
Anmerkung. Falls lim[a;b]↑I¯ a f− (x)dx in R existiert und a f+ (x)dx uneigentlich
nach +∞ konvergiert, sagt man auch I f (x)dx = +∞. Analog im umgekehrten Fall.
R
Wenn beide Integrale uneigentlich nach +∞ konvergieren, kann man das Integral
nicht definieren.
Wichtige Beispiele sind die Potenzen x−α = exp(−α ln(x)) mit α ∈ R+ . Hier gilt
folgendes:
Lemma 5.20. Sei f : (0, ∞) → R gegen durch f (x) = x−α . Dann gilt folgendes:
(i) Wenn α ∈ [0, 1), dann existiert für alle c ∈ R+ das uneigentliche Integral
Z c
c1−α
f (x)dx = . (5.44)
0 1−α
Dagegen ist Z ∞
f (x)dx = +∞. (5.45)
c
5.5 Summen und Integrale 105
(ii) Wenn α ∈ (1, ∞), dann existiert für alle c ∈ R+ das uneigentliche Integral
Z ∞
c1−α
f (x)dx = . (5.46)
c α−1
Dagegen ist Z c
f (x)dx = +∞ (5.47)
0
(iii) Wenn α = 1, so gilt Z ∞
f (x)dx = +∞ (5.48)
c
und Z c
f (x)dx = +∞ (5.49)
0
Beweis. Mit Hilfe der Kettenregel und der bekannten Ableitungen der Funktionen
1−α
exp und ln finden wir, dass die Ableitung der Funktion F(x) = x1−α gerade F 0 (x) =
x−α , wenn α ∈ R+ \ {1}. Denn x1−α = exp((1 − α) ln(x)), und
d 1
exp((1 − α) ln(x)) = exp((1 − α) ln(x))(1 − α) ln0 (x) = x1−α (1 − α) = (1 − α)x−α .
dx x
(5.50)
Damit ist für α¬1 für all 0 < a < b < ∞
Z b
b1−α a1−α
x−α dx = − . (5.51)
a 1−α 1−α
Wenn α < 1 ist, so ist der Limes a ↓ 0 endlich, und der Limes b ↑ +∞ ist +∞ (unei-
gentlich). Im Fall α > 1 ist es gerade umgekehrt.
Wenn α = 1, also f (x) = 1x , so ist die Stammfunktion von f gerade ln. Also ist
dann für all 0 < a < b < ∞
Z b
x−1 dx = ln(b) − ln(a). (5.52)
a
Da ln bei 0 nach −∞ divergiert und bei +∞ nach +∞ divergiert, erhalten wir (5.48)
und (5.49). u t
5.5 Summen und Integrale
Integrale (uneigentliche) können oft dabei helfen, die Konvergenz von Reihen zu
kontrollieren. Ein einfaches Resultat dazu ist das folgende Lemma.
Lemma 5.21. Sei f : R+ → R+ eine positive, monoton

R ∞ fallende Funktion. Dann kon-
vergiert die Reihe ∞n=1 f (n) genau dann, wenn 1 f (x)dx < ∞ existiert.
P
106 5 Integration
Beweis. Indem man die Funktion f von unten und oben durch Stufenfunktionen,
die zwischen ganzen Zahlen konstant sind von unten und oben approximiert, sieht
man leicht, dass
∞
X ∞
X Z ∞ ∞
X
f (n) = f (n + 1) ≤ f (x)dx ≤ f (n). (5.53)
n=2 n=1 1 n=1
Daraus aber folgt die Behauptung sofort. t

u
Kapitel 6
Differentialgleichungen
Wir hatten schon gesehen, dass eine differenzierbare Funktion durch die Angabe ih-
rer Ableitung bis auf eine Konstante eindeutig bestimmt ist. In sehr vielen Situatio-
nen ist das Verhalten eines Systems dadurch beschrieben, dass man eine Gleichung
für die Ableitung gegeben hat. Das historisch erste Beispiel sind die Newton’schen
Gleichungen. Sie sind Gleichungen für die Geschwindigkeit v eines Teilchens unter
dem Einfluss einer sog. Kraft. Sie lauten
v0 (t) = F(x(t), t), x0 (t) = v(t), t ∈ R+ . (6.1)
Man kann diese zwei Gleichungen auch als eine Gleichung in der Form
x00 (t) = F(x(t), t) (6.2)
zusammenfassen. Wir wollen uns der Frage zuwenden, inwieweit solche Gleichun-
gen die Funktionen festlegen, und unter welchen Bedingungen solche Gleichungen
überhaupt Lösungen haben.
6.1 Lösung durch Integration
Wir können bereits Differentialgleichungen der Form
f 0 (t) = g(t) (6.3)
lösen. Wenn nämlich g : [0; T ] → R Riemann integrierbar ist, so wissen wir, dass
Z t
f (t) = g(s)ds + f0 (6.4)
0
die einzige Lösung mit f (0) = f0 ist. Wir nennen f0 den Anfangswert der Lösung
f . Wir wissen bereits, dass dieser frei gewählt werden kann. Die Form (6.3) ist
107
108 6 Differentialgleichungen
natürlich nicht besonders interessant. Im Allgemeinen wollen wir, dass die rechte
Seite der Gleichung auch die Funktion involviert. Manchmal kann man die Lösung
trotzdem auf eine solche einfache Integration zurückführen. Betrachten wir das Bei-
spiel
f 0 (t) = c f (t). (6.5)
Wenn wir annehmen, dass f > 0 ist, so können wir dividieren und erhalten
f 0 (t)
= c. (6.6)
f (t)
Wegen der Kettenregel und da wir die Ableitung des Logaritmus kennen, wissen wir
aber, dass
f 0 (t) d
= ln ( f (t)) . (6.7)
f (t) dt
Es folgt also durch Integration, dass
Z t
ln ( f (t)) = cds + ln( f0 ) = ct + ln( f0 ), (6.8)
0
Also ist
f (t) = f0 exp(ct) (6.9)
die einzige Lösung mit f (0) = f0 . Wenn f0 > 0, so bestätigt sich auch im Nachhinein
unsere Annahme f > 0. Dasselbe Vorgehen können wir natürlich auf Gleichungen
der Form f 0 (t) = g(t) f (t) anwenden. Mit ähnlichen Tricks lassen sich eine ganze
Reihe von Differentialgleichungen lösen, allerdings ist dies nicht der Normalfall.
Wir wollen dieses Thema hier deshalb auch nicht vertiefen und uns mehr allgemei-
nen Fragen zuwenden.
6.2 Existenz- und Eindeutigkeitssatz
Wir betrachten zunächst die folgende Klasse von Gleichungen. Es sei F : R → R

eine Lipschitz stetige Funktion. Für T ∈ (0, +∞] suchen wir stetige Funktionen x :
[0, T ) → R, die auf (0, T ) differenzierbar sind und dort die Differentialgleichung
x0 (t) = F(x(t)) (6.10)
erfüllen. Außerdem soll x bei 0 einen vorgegebenen Anfangswert x0 ∈ R annehmen,

also x(0) = x0 .
Eines der wichtigsten Hilfsmittel um solche Fragen zu untersuchen ist das soge-
nannte Gronwall lemma.
Lemma 6.1. Es seien f, g : [0, b) → R+ stetige, nicht-negative Funktionen. Ange-

nommen, es gäbe A ≥ 0, so dass für alle t ∈ [0; b) die Ungleichung
6.2 Existenz- und Eindeutigkeitssatz 109
Z t
f (t) ≤ A + f (s)g(s)ds (6.11)
0
erfüllt ist. Dann ist Z t !

f (t) ≤ A exp g(s)ds , (6.12)
0
für alle t ∈ [0, b). Falls (6.11) mit A = 0 gilt, dann ist f = 0.
Rt
Beweis. Sei zunächst A > 0. Wir setzen für alle t ∈ R+ h(t) = A + 0 f (s)g(s)ds.
Offenbar ist h(t) > 0 and h0 (t) = f (t)g(t) ≤ h(t)g(t). Außerdem ist h(0) = A. Wenn wir
beide Seiten durch h(t) teilen, so erhalten wir,
d
ln(h(t)) ≤ g(t). (6.13)
dt
Wenn wir beide Seiten dieser Ungleichung integrieren, so erhalten wir
Z t
ln(h(t)) − ln h(0) ≤ g(s)ds, (6.14)
0
woraus durch Exponentiation

Z t !
h(t) ≤ A exp g(s)ds , (6.15)
0
WennRA = 0, so gilt (6.11) auch mit A = und jedes > 0. Daher ist f (t) ≤
t
exp 0 g(s)ds , für jedes > 0, und daher (beachte, dass für alle t ∈ [0, b) die Funk-
Rt
tion g auf [0, t] stetig ist und somit 0 g(s)ds < ∞) für alle t ∈ R+ f (t) = 0. u t
Wir können mit diesem Lemma nun sofort einen Eindeutigkeitssatz beweisen.
Satz 6.2 (Eindeutigkeitssatz). Sei F : R → R Lipschitz stetig mit Lipschitz Kon-
stante L. Wenn x1 , x2 : R+ → R die Differentialgleichung (6.10) für t ∈ (0, T ) (oder
t ∈ R+ ) lösen, dann gilt
|x1 (t) − x2 (t)| ≤ |x1 (0) − x2 (0)| exp(Lt). (6.16)
Insbesondere gilt, wenn x1 (0) = x2 (0), so ist x1 (t) = x2 (t) für alle t ∈ [0, T ).
Beweis. Wir setzen f = |x1 − x2 |. Indem wir beide Seiten von (6.10) integrieren er-
halten wir die Integralgleichungen
Z t
xi (t) = xi (0) + F(xi (s))ds, i = 1, 2. (6.17)
0
Daraus folgt
Z t
x2 (t) − x1 (t) = x2 (0) − x1 (0) + (F(x2 (s)) − F(x1 (s)))ds, (6.18)
0
und somit
Z t
f (t) = |x2 (t) − x1 (t)| ≤ |x2 (0) − x1 (0)| + |F(x2 (s)) − F(x1 (s))|ds. (6.19)
0
Wenn wir die Lipschitz Stetigkeit von F ausnutzen, erhalten wir hieraus
Z t
f (t) ≤ |x2 (0) − x1 (0)| + L| f (s)|ds, (6.20)
0
wo L die Lipschitz Konstante von F ist. Damit können wir das Gronwall Lemma
anwenden und erhalten sofort die Behauptungen. u t
Die Voraussetzungen des Satzes können wir abschwächen. So genügt es anzu-
nehmen, dass F lokal Lipschitz stetig ist. Wir nehmen dann DL ⊆ R so, dass F in DL
Lipschitz mit Lipschitz Konstanter L ist. Dann sei T L = inf(t : x1 (t < DL ∨ x2 (t) < DL ).
Wenn wir mit Anfangsbedingungen in DL starten, können wir dann zeigen, dass für
alle t < T L , x1 (t) = x2 (t) ist. Man hat so Eindeutigkeit bis die Lösung ein Gebiet
trifft, in dem F nicht mehr Lipschitz ist. Wie wir gleich sehen werden, kann dies in
endlicher Zeit passieren.
Als nächstes beweisen wir die Existenz von Lösungen unter den selben Bedin-
gungen.
Satz 6.3 (Existenzsatz). Sei wieder F Lipschitz mit Lipschitz Konstante L. Dann
existiert für jedes T ∈ R+ und jedes x0 ∈ R eine stetige Funktion x, so dass x für alle
t ∈ (0, T ) die Gleichung (6.10) erfüllt und x(0) = x0 .
Beweis. Für Funktionen x : [0, T ] → R definieren wir die Funktion G[x] : [0; T ] → R
als die Funktion so, dass für alle t ∈ [0; T ],
Z t
G[x](t) = x(0) + F(x(s))ds. (6.21)
0
Beachte, dass, wenn x auf stetig und auch (0; T ) differenzierbar ist, dann auch die
Funktion G[x] stetig und auf (0; T ) differenzierbar ist. Für zwei Funktionen x, y,
haben wir dann
Z t
|G[x](t) − G[y](t)| ≤ |x(0) − y(0)| + |F(x(s)) − F(y(s))|ds
0
Z t
≤ |x(0) − y(0)| + L |x(s) − y(s)|ds. (6.22)
0
Insbesondere gilt, dass

Z t
sup |G[x](s) − G[y](s)| ≤ |x(0) − y(0)| + L sup |x(r) − (y(r)|dr. (6.23)
s≤t 0 r≤s
Falls also x(0) = y(0) ist, haben wir

6.2 Existenz- und Eindeutigkeitssatz 111
Z t
sup |G[x](s) − G[y](s)| ≤ L sup |x(r) − (y(r)|dr. (6.24)
s≤t 0 r≤s
Nun definieren wir eine Folge von Funktionen durch
x0 (t) = x(0), (6.25)

xn = G[xn−1 ], n ∈ N. (6.26)
Es gilt, dass xn (0) = x(0), für alle n ∈ N. Wegen (6.24) haben wir
Z t
sup |xn+1 (s) − xn (s)| ≤ L sup |xn (r) − xn−1 (r)|ds. (6.27)
s≤t 0 r≤s
Wir behaupten, dass daraus folgt, dass für alle n ∈ N, für alle t < T ,
(Lt)n
sup |xn (s) − xn−1 (s)| ≤ . (6.28)
s≤t n!
Zunächst gilt dies für n = 1. Angenommen, es gilt für n. Dann folgt wegen (6.27),
Z t
(Ls)n (Lt)n+1
sup |xn+1 (s) − xn (s)| ≤ L ds = . (6.29)
s≤t 0 n! (n + 1)!
Also folgt (6.28) durch vollständige Induktion. Aus dieser Abschätzung folgt aber,
dass die Folge (xn (t))n∈N für alle t ∈ [0, T ) eine Cauchy-Folge ist, denn
m m ∞
X X (Lt)n+k X (Lt)k
|xn+m (t) − xn (t)| ≤ |xn+k (t) − xn+k−1 (t)| ≤ ≤ . (6.30)
k=1 k=1
(n + k)! k=n+1
k!
Der letzte Ausdruck konvergiert für jedes t ∈ R nach Null, wenn n ↑ ∞, wie wir von
der Exponentialreihe wissen. Tatsächlich wissen wir sogar mehr, nämlich, dass die
Folge auf kompakten Intervallen [0, T ] gleichmäßig konvergiert. Aus (6.27) folgt
nämlich, dass für jedes t ∈ R+ ,
∞
X (Lt)k
sup |xn (s) − x(s)| ≤ . (6.31)
s≤t k=n+1
k!
Daher gilt auch, dass die Folge G[xn ](t) für alle t ∈ R0 nach G[x](t) konvergiert. Es
ist nämlich
Z t Z t
|G[xn ](t) − G[x](t)| = F(xn (s))ds − F(x(s))ds (6.32)
0 0
Z t Z t
≤ |F(xn (s)) − F(x(s))| ds ≤ L |xn (s) − x(s)| ds
0 0
∞
X (Lt)k
≤ Lt sup |xn (s) − x(s)| ≤ Lt .
s≤t k=n+1
k!
Daher ist
G[x](t) = lim G[xn ](t) = lim xn−1 (t) = x(t), (6.33)
n↑∞ n↑∞
also Z t
x(t) = x(0) + F(x(s))ds, (6.34)
0
Es bleibt zu zeigen, dass x differenzierbar ist. Dies folgt aus dem Hauptsatz, wenn
wir wissen, dass F(x(s)) stetig ist, was wegen der Lipschitz Stetigkeit von F aus
der Stetigkeit von x folgt. Stetigkeit von x folgt aber wegen (6.34) sofort, wenn
wir wissen, dass F(x(s) beschränkt ist, was wiederum aus der Beschränktheit von
x folgt. Beschränktheit von x folgt aber aus der Tatsache, dass es wegen (6.31) in
jedem Kompakten Intervall ein n gibt, so dass sich x und xn nicht um mehr als z.B.
1 unterscheiden. xn ist aber stetig und damit auf kompakten Intervallen beschränkt.
Damit haben wir die Existenz einer Lösung für ein beliebiges Interval [0; T ) gezeigt
und der Satz ist bewiesen. u t
Anmerkung. Das im Beweis oben verwendete Iterationsverfahren wird als Picard-

Lindelöf Iteration bezeichnet.
Beispiel 6.4. Im folgenden einfachen Beispiel können wie die Picard Iteration ex-
plizit durchführen. Wir betreachten die Differentialgleichung
x0 (t) = cx(t), (6.35)
mit der Anfangsbedingung x(0) = 1. Dann ist x0 (t) = 1,

Z t
x1 (t) = 1 + c x0 (s)ds = 1 + ct, (6.36)
0
Z t
x2 (t) = 1 + c x1 (s)ds = 1 + ct + ct2 /2, (6.37)
0
Z t
x3 (t) = 1 + c x2 (s)ds = 1 + ct + c2 t2 /2 + c3 t3 /3!, (6.38)
0
und so weiter.
Z t
xn (t) = 1 + c xn−1 (s)ds = 1 + ct + c2 t2 /2 + c3 t3 /3! + · · · + cn tn /n!. (6.39)
0
Dies sind also die Partialreihen der Exponentialreihe und wie erwartet konvergiert
die Folge xn (t) gegen exp(ct).
Anmerkung. Wenn wir statt der globalen Lipschitz Eigenschaft nur verlangen, dass
L lokal Lipschitz ist, so können wir immer noch die Existenz von Lösungen für klei-
ne Zeiten zeigen, wenn die Anfangsbedingung in einem Gebiet liegt, wo F Lipschitz
ist.
6.3 Systeme von Differentialgleichungen 113
Anmerkung. Wenn F nur lokal Lipschitz stetig ist, so kann es sein, dass Lösungen
in endlicher Zeit nach unendlich divergieren. Als Beispiel betrachten wir die Glei-
chung
x0 (t) = x(t)2 . (6.40)
Wir dividieren durch x2 und sehen und benutzen, dass nach der Kettenregel
x0 (t)/x(t)2 = −(1/x)0 (t) (6.41)
ist. Also haben wir

(1/x)0 (t) = −1. (6.42)
Jetzt integrieren wir beide Seiten und erhalten
1/x(t) = −t + C. (6.43)
Die Konstante C wir durch die Anfangsbedingung, x(0) bestimmt, nämlich C =

1/x(0). Jetzt gibt es drei Fälle: Wenn x(0) = 0, dann ist die konstante Funktion x = 0
die Lösung der Gleichung. Wenn x(0) < 0, so erhalten wir
1
x(t) = − . (6.44)
t − 1/x(0)
Diese Lösung konvergiert also nach 0, wenn t ↑ ∞. Wenn x(0) > 0, ist
1
x(t) = . (6.45)
1/x(0) − t
Diese existiert nur für t < 1/x(0).
6.3 Systeme von Differentialgleichungen
Schon in unserem ersten Beispiel aus der Physik haben wir nicht eine einzige
Differentialgleichung gesehen, sonder ein System von zwei solchen Gleichungen.
Daräber hinaus sind Ort und Geschwindigkeit eines Teilchens meist nicht durch nur
eine reelle Zahl beschreibbar, sondern wir müssen etwa einen dreidimensionalen
Vektor, (x1 , x2 , x3 ) angeben. Es ist daher sinnvoll, dass wir uns im Folgenden mit
Funktionen befassen, die Werte in einem Vektorraum Rd , d ∈ N, annehmen. Wir ge-
hen hier davon aus, dass solche Vektorräume aus der linearen Algebra bekannt sind
(wir brauchen aber hier nur die Definition 4.36. Für uns ändert sich zum Glück so
gut wie nichts. Eine Funktion x : D → Rd ist nichts anderes als ein d Funktionen
xk : D → R, k = 1, . . . , d, also x = (x1 , . . . , xd ). Eine System von d Differentialglei-
chungen erster Ordnung ist dann gegeben durch
xk0 (t) = Fk (x1 (t), . . . , xd (t)), k = 1, . . . , d, (6.46)

mit d Funktionen Fk : Rd → R. Wenn wir die d Funktionen Fk als Komponenten

einer vektorwertigen Funktion F : Rd → Rd auffassen, können wir dieses System
kompakt schreiben als
x0 (t) = F(x(t)). (6.47)
Rein optisch ändert sich also nichts gegenüber dem eindimensionalen Fall.
Die einzige wichtige Neuerung, die wir brauchen, ist das Konzept einer Norm
auf einem Vektorraum, die wir schon im Kapitel 4 eingeführt hatten (Definition
4.36. Wir erhalten sofort die Verallgemeinerungen unserer Existenz- und Eindeutig-
keitssätze. Im Folgenden ist k · k stets die 2-Norm (auch Euklidische Norm genannt),
wenn nichts gegenteiliges gesagt wird.
Wir müssen noch das Konzept der Lipschitz Stetigkeit auf Funktionen von Rd
erweitern. Das ist aber auch ganz einfach.
Definition 6.5 (Lipschitz Stetigkeit). Eine Funktion F : Rd × R+ → Rd heißt Lip-

schitz stetig mit Lipschitz Norm L (bezüglich der Norm k · k) genau dann, wenn für
alle x, y ∈ Rd gilt
kF(x) − F(y)k ≤ Lkx − yk. (6.48)
Ganz analog definiert man auch die lokale Lipschitz Stetigkeit. Wir können jetzt
unsere Existenz- und Eindeutigkeitsaussagen sofort auf Systeme von Differential-
gleichungen verallgemeinern.
Satz 6.6 (Eindeutigkeitssatz). Sei F : Rd → Rd Lipschitz stetig mit Lipschitz Kon-

stante L. Wenn x1 , x2 : R+ → Rd die Differentialgleichung (6.10) für t ∈ (0, T ) (oder
t ∈ R+ ) lösen. Dann gilt für eine beliebige Norm auf Rd ,
kx1 (t) − x2 (t)k ≤ kx1 (0) − x2 (0)k exp(Lt). (6.49)
Insbesondere gilt, wenn x1 (0) = x2 (0), so ist x1 (t) = x2 (t) für alle t ∈ [0, T ).
Beachte, dass die Anfangsdaten, die benötigt werden um eine Lösung eindeutig
festzulegen jetzt der d-dimensionale Vektor x(0) ∈ Rd ist. Das war sicher zu erwar-
ten.
Satz 6.7 (Existenzsatz). Sei wieder F : Rd → R Lipschitz stetig mit Lipschitz Kon-
stante L. Dann existiert für jedes T ∈ R+ und jedes x0 ∈ Rd eine stetige Funktion
x : [0, T ] → Rd , die in (0; T ) differenzierbar ist und für alle t ∈ (0, T ) die Gleichung
(6.10) erfüllt und x(0) = x0 ..
Die Beweise dieser Sätze sind identisch zu denen von Satz 6.2 bzw. 6.3, wenn
man nur jeweils den Betrag durch die entsprechende Norm ersetzt. Sie sollten dies
einfach einmal selbst zu Übung durchgehen.
Wenn man die Annahmen der Lipschitz Stetigkeit durch lokale Lipschitz Stetig-
keit ersetzt, so kann man immer noch Existenz und Eindeutigkeit für kleine Zeit-
intervalle zeigen. Was dann passiert hängt davon ab, ob die Lösung in ein Gebiet
mit kleinerer oder größerer Lipschitz Norm läuft. Man sieht dies schon in unserem
Beispiel oben recht schön.
6.4 Differentialgleichungen höherer Ordnung 115
Wir können aus den Sätzen für Systeme von Differentialgleichungen mit zeitun-
abhängigem F auch sofort aus solche mit Zeitabhängigem F schliessen. Wenn wie
nämlich eine Differentialgleichung der Form
x0 (t) = F(x(t), t) (6.50)
haben mit x(t) ∈ Rd , so können wir diese mit dem System
x0 (t) = F(x(t), y(t)), (6.51)

y (t) = 1,
0
(6.52)
mit Anfangsbedingung x(0) = x0 , y(0) = 0 assoziieren. Das System (6.51) ist von
der Form x0 = G(x), mit x ∈ Rd+1 ,G : Rd+1 → Rd+1 . Die eindeutige Lösung dieser
Gleichung ist aber (x(t), t), wo x(t) die Gleichung (6.50) mit x(0) = x0 löst.
Trotz der Einfachheit der Beweise sind die Sätze zur Existenz und Eindeutigkeit
von fundamentaler Bedeutung in der Analysis.
6.4 Differentialgleichungen höherer Ordnung
Eine naheliegende Verallgemeinerung sind Gleichungen der Form
x(n) (t) = G(x(n−1) (t), x(n−2) (t), . . . , x(t)), (6.53)
wo G : Rn → R ist. Man nennt eine solche Gleichung eine Differentialgleichung n-

ter Ordnung. Unter einer Lösung versteht man eine in einem Interval (0, T ) n-mal
differenzierbare Funktion wobei die ersten n − 1 Ableitungen zu auf [0, T ) stetigen
Funktionen fortgesetzt werden können, d.h. limt↓0 x(k) (t) ≡ x(k) (0) existiert für k =
0, . . . , n − 1.
Differentialgleichungen n-ter Ordnung lassen sich sofort auf Systeme von Dif-
ferentialgleichungen erster Ordnung zurückführen. Dazu setzt man yk = x(k) , für
k = 0, . . . , n − 1. Dann ist (6.53) äquivalent zu dem System
y0n−1 (t) = G(yn−1 (t), . . . , y0 (t)) = Fn−1 (y(t)) (6.54)

y0n−2 (t) = yn−1 (t) = Fn−2 (y(t))
y0n−3 (t) = yn−2 (t) = Fn−3 (y(t))
...
...
y00 (t) = y1 (t) = F0 (y(t)).
Aus dieser Beobachtung folgt, dass für eine DIfferentialgleichung n-ter Ordnung
n Anfangsdaten benötigt werden um eine Lösung festzulegen, nämlich die Werte
x(0), x0 (0), . . . , x(n−1) (0).
Übung 6.8. Angenommen, die Funktion G : Rn → R ist Lipschitz stetig mit Lip-
schitz Norm L. Zeige, dass für die Lipschitz Norm
√ L der durch die Gleichungen
e
n n
(6.54) definierten Funktion F : R → R gilt eL ≤ L2 + 1.
6.5 Anwendungen des Eindeutigkeitssatzes
Der Eindeutigkeitssatz für Lösungen von Differentialgleichungen gibt uns ein neu-
es und oft sehr hilfreiches Werkzeug an die Hand um Gleichungen zu beweisen.
Die Idee ist sehr einfach. Angenommen wir haben zwei Funktionen gegeben, sa-
gen wir f, g, die auf verschieden Arten beschrieben sind. Wir vermuten, dass f = g.
Um dies zu beweisen, können wir versuchen, zu zeigen, dass diese jeweils dieselbe
Differentialgleichung lösen, also das
f 0 (t) = F( f (t)), g0 (t) = F(g(t)). (6.55)
Wenn dann noch f (0) = g(0), so wissen wir, dass f = g!
Beispiel 6.9 (Die Exponentialfunktion). Wir kehren zu der Exponentialfunktion zurück.

Wir hatten ja exp zuerst als konvergente Potenzreihe gegeben. Wenn wir diese Term
für Term differenzieren, und benutzen, dass die Reihe absolut konvergent ist, so
erhalten wir
∞ ∞ ∞
X n n−1 X 1 X 1 n
exp0 (t) = t = tn−1 = t = exp(t). (6.56)
n=0
n! n=1
(n − 1)! n=0
n!
Außerdem ist exp(0) = 1.

Nun sei e : R → R definiert durch die Eigenschaft, dass für alle x, y ∈ R gilt, dass
e(t + s) = e(t)e(s). Dies legt in der Tat e noch nicht eindeutig fest. Jedenfalls muss
aber gelten e(0) = 1. Es folgt auch, dass
e(t + s) − e(t) e(s) − 1
= e(t) . (6.57)
s s
Wenn wir nun noch fordern, dass e an der Stelle Null differenzierbar ist und e0 (0) =
1, so erhalten wir, dass
e0 (t) = e(t), (6.58)
Damit löst e die selbe Differentialgleichung wir exp und es gilt e(0) = exp(0) und aus
dem Eindeutigkeitssatz folgt e = exp. Natürlich wussten wir das schon. Wir haben
aber noch etwas gelernt, nämlich:
Lemma 6.10. Die Exponentialfunktion exp ist die einzige differenzierbare Funktion
mit den Eigenschaften
(i) e0 (0) = 1 und
(ii) für alle x, y ∈ R gilt, dass e(t + s) = e(t)e(s).
6.5 Anwendungen des Eindeutigkeitssatzes 117
Beispiel 6.11 (Die trigonometrischen Funktionen). Wir können Lemma 4.20 aus
Kapitel 4.4 so interpretieren, dass die Funktionen f2 = cos und f1 = sin das Dif-
ferentialgleichungssystem
f10 (t) = f2 (t)

f20 (t) = − f1 (t) (6.59)
mit den Anfangsbedingungen f1 (0) = 0 und f2 (0) = 1 lösen. Unser Existenz- und
Eindeutigkeitssatz garantiert, das es nur ein solches Tupel von Funktionen gibt
und dass diese auf ganz R+ definiert sind. Insbesondere müssen sie mit den durch
konvergente Potenzreihen dargestellten Funktionen cos und sin übereinstimmen.
Übrigens folgt aus der Diffferentialgleichung und den Anfangsbedingungen sofort,
dass Gleichung (3.41) gilt. Wenn wir nämlich h definieren durch h(t) = f12 (t) + f22 (t),
so folgt mit der Produktregel,
h0 (t) = 2 f1 (t) f10 (t) + 2 f2 (t) f20 (t) = 2 f1 (t) f2 (t) − 2 f2 (t) f1 (t) = 0, (6.60)
also h(t) = C, und wegen der Anfangsbedingung C = h(0) = 1.

Wir hatten gesehen, dass es eine Zahl π/2 ∈ R gibt, so dass bei ihr der Sinus
erstmals den Wert 1 annimmt, während dann cos(0) = 0. Wir können nun die Funk-
tionen g1 und g2 durch g2 (t) = f2 (t + π/2) und g1 (t) = f1 (t + π/2) einführen. Dann
erfüllen diese die Gleichungen
g01 (t) = g2 (t)

g02 (t) = −g1 (t) (6.61)
mit den Anfangsbedingungen g1 (0) = 1 und g2 (0) = 0. Man kann nun leicht nach-
prüfen, dass die eindeutige Lösung dieses Systems gegeben ist durch g1 = cos und
g2 = − sin. Weiter folgt nun, dass f1 (π) = cos(π/2) = 0, und f2 (π) = − sin(π/2) = −1.
Wenn wir nun hi (t) = fi (t + π), i = 1, 2 setzen, erfüllen diese wieder dieselben Dif-
ferentialgleichungen, aber mit den Anfangsbedingungen h1 (0) = 0, h2 (0) = −1.
Wieder sieht man, dass nun h1 (t) = − sin(t) und h2 (t) = − cos(t) die eindeutige
Lösung sind. Also ist f1 (3π/2) = 0 und f2 (3π/2) = −1). Daraus folgt wie gehabt
f1 (3π/2 + x) = − cos(t), f2 (3π/2 + x) = sin(t). Schließlich ist f1 (2π) = 0, f2 (2π) = 1,
so dass f1 (2π+ x) = f1 (t) und f2 (2π+ x) = f2 (t). Wir erhalten also folgendes Resultat.
Lemma 6.12. Die Funktionen cos und sin sind gemeinsam periodisch mit Periode
2π.
2π ist der Umfang eines Kreises, und cos(t) und sin(t) sind die gerichteten Längen
der Katheten eines rechtwinkligen Dreiecks mit Öffnungswinkel x.
6.6 Lineare Differentialgleichungen mit konstanten

Koeffizienten, oder: Analysis trifft lineare Algebra
Differentialgleichungen kann man im Allgemeinen noch weniger ëxplizitlösen, als

man Integrale ëxplizitäusrechnen kann. Allerdings haben manche Differentialglei-
chungen Lösungen, die einen Namen haben und zumindest gut approximativ be-
rechnet werden können (wir erinnern uns daran, dass alle Rechnungen mit reel-
len Zahlen auf Approximation beruhen). Dennoch gibt es deutlich unterschiedliche
Komplikationsgrade in der Untersuchung von Lösungen verschiedener Typen von
Differentialgleichungen. Insbesondere treten erhebliche Vereinfachungen auf, wenn
wir sogenannte lineare Differentialgleichungen betrachten, also solche wo die Ab-
bildung F linear ist. Der allgemeine Fall hat die Form
n
X
xk0 (t) = ak` (t)x` (t) + bk (t), k = 1, . . . , n, (6.62)
`=1
wo ak` , k, ` = 1 . . . , n und bk , k = 1, . . . , n Funktionen R+ → R sind. Die Gleichung

heißt homogen, wenn bk = 0, für alle k = 0, . . . , n. Andernfalls spricht man von inho-
mogenen Gleichungen. Nochmal einfacher wird es, wenn wir uns auf den Fall, dass
diese Funktionen konstant sind zurückziehen.
Wir unterscheiden den Fall der homogenen Gleichung, die nun die Form
n
X
xk0 (t) = ak` x` (t), k = 1, . . . , n, (6.63)
`=1
annimmt, und der inhomogenen Gleichung,

n
X
xk0 (t) = ak` x` (t) + bk , k = 1, . . . , n, (6.64)
`=0
mit jeweils Konstanten ak` , bk . Im Fall n = 1 kennen wir die Lösung schon: Die
Lösung der homogenen Gleichung ist x(t) = x(0) exp(at), wo x(0) das gegebene An-
fangsdatum ist. Für die inhomogene Gleichung können wir eine Lösung erraten:
Z t
x(t) = exp(at) exp(−as)bds, (6.65)
0
die allerdings die Anfangsbedingung x(0) = 0 hat. Nun ist aber klar, dass, wenn x
eine Lösung von (6.64) ist und y eine Lösung von (6.63) ist, dann x + y auch Lösung
von (6.64) ist. Also erhalten wir eine Lösung von (6.64) mit beliebiger Anfangsbe-
dingung x(0) als
Z t
x(t) = exp(at) exp(−as)bds + x(0) exp(at). (6.66)
0
6.6 Lineare Differentialgleichungen mit konstanten Koeffizienten, oder: Analysis trifft lineare Algebra
119
Wir kommen nun zu dem allgemeinen Fall. Wir fassen die Konstanten ak` als
Elemente einer n × n-Matrix A auf, und schreiben x(t) für den Vektor mit Kompo-
nenten xk (t). Dann lautet (6.63) einfach
x0 (t) = Ax(t). (6.67)
Wollen nachprüfen, dass die Funktion F : Rn → Rn mit F(x) = Ax Lipsshitz stetig

ist.
Lemma 6.13. Die Funktion F : Rn → Rn mit F(x) = Ax ist Lipschitz stetig bezüglich
der 2-Norm mit Lipschitz Konstante
v
u
tXn
kAk = a2k` . (6.68)
k,`=1
Beweis. Dies ist eine einfache Rechnung die nur die Cauchy-Schwarz Ungleichung
benutzt.
 n
n X
2
X 
kAx − Ayk22 =

 ak` (x` − y`) (6.69)
k=1 `=1
n X
 n  n 
X  X 
 2 2
≤  ak`   |x` − y` | 
 
k=1 `=1 `=1
= kAk2 kx − yk22 .
Was die Behauptung ist. t

u
Offenbar ist für jede n × n-Matrix A die Norm kAk < ∞, und also hat (6.67) ei-
ne eindeutige Lösung für jede Anfangsbedingung x(0) = x0 ∈ Rn . Diese Lösung
können wir zum Beispiel mittels der Picard-Lindelöf iteration gewinnen. Indem wir
die Rechnungen im Beispiel 6.4 wort-wörtlich wiederholen, finden wir dann, dass
die Lösung der Gleichung gegeben ist durch
∞
X 1 n n
x(t) = t A x0 . (6.70)
n=0
n!
Aus naheliegenden Gründen schreiben wir

∞
X 1 n n
t A = exp(At). (6.71)
n=0
n!
Damit haben wie die Funktion exp : R2n → R2n auf dem Raum der n × n-Matrizen
definiert.
Wir haben als Folgerung:
Satz 6.14. Die einzige Lösung des Differentialgleichungssystems (6.67) mit An-
fangsbedigung x(0) = x0 ist die vektorwertige Funktion x, für die
x(t) = exp(At)x0 , ∀t ∈ R+ . (6.72)
Beispiel 6.15. Wir kommen wieder zu unserem bekannten Beispiel (6.59) zurück.
In Matrixform nimmt es die Form
!
0 1
x0 (t) = x(t) (6.73)
−1 0
an. Wir schließen daraus, dass

! ! ! !
sin(t) 0 1 0
= exp t (6.74)
cos(t) −1 0 1
Für allgemeine Anfangsbedingungen erhalten wir aus (6.72) die Lösung

! ! ! !
x1 (t) 0 1 x1 (0)
= exp t (6.75)
x2 (t) −1 0 x2 (0)
was, wie man leicht nachrechnet, das selbe sein muss wie
x1 (0) cos(t) + x2 (0) sin(t)

!
. (6.76)
−x1 (0) sin(t) + x2 (0) cos(t)
Das bedeutet aber nichts anderes, als

! ! ! ! !
0 1 cos(t) sin(t) 10 0 1
exp t = = cos(t) + sin(t) . (6.77)
−1 0 − sin(t) cos(t) 01 −1 0
Wir sehen hier also einen interessanten und zunächst überraschenden Zusammen-
hang zwischen der Exponentialfunktion und den trigonometrischen Funktionen. In
der Tat können wir die mittels unserer Differentialgleichungen erhaltenen Identität
(6.77) auch direkt aus der Reihendarstellung herleiten. Es ist nämlich
!2 !
0 1 10
=− , (6.78)
−1 0 01
und daher
  
 1 0
(−1)   ,
n/2

wenn n gerade ist,


!n 
01

0 1 
=

(6.79)
  
−1 0   0 1
,



 (−1) (n−1)/2  wenn n ungerade ist,


 −1 0
Damit können wir in der Exponentialreihe alle Matrixpotenzen ausrechnen und wir
erhalten
6.6 Lineare Differentialgleichungen mit konstanten Koeffizienten, oder: Analysis trifft lineare Algebra
121
! ∞ 2k
! ∞
t2k+1
! !
0 1 10 X k t 0 1 X
exp t = (−1) + (−1)k , (6.80)
−1 0 01 (2k)! −1 0
k=0
(2k + 1)!
k=0
was gerade die rechte Seite von (6.77) ist! Die vorhin beschriebenen Periodi-
zitätdseigenschaften von cos und sin können wir nun auch anders herleiten, nämlich
aus denen der Exponentialfunktion. Wir erinnern uns, dass π/2 als die kleinste po-
sitive Zahl definiert war, für die sin(π/2) = 1 (und damit cos(π/2) = 0. Es gilt damit
! ! !
0 1 0 1
exp π/2 = , (6.81)
−1 0 −1 0
und daher
! ! ! ! ! !
0 1 0 1 0 1
exp (t + 2π) = exp t exp 2π
−1 0 −1 0 −1 0
! ! !4
0 1 0 1
= exp t
−1 0 −1 0
! ! !
0 1 10
= exp t
−1 0 01
! !
0 1
= exp t . (6.82)
−1 0
Dies impliziert die Periodizität der trigonometrischen Funktionen. Weiter erhält man
auf diese Weise die Additionstheoreme für den Sinus und Kosinus.
Lemma 6.16 (Additionstheoreme). Es gilt für alle t, s ∈ R,
cos(t + s) = cos(t) cos(s) − sin(t) sin(s) (6.83)

sin(t + s) = cos(t) sin(s) + sin(t) cos(s). (6.84)
Beweis. Wir wissen, dass

! ! ! ! ! !
0 1 0 1 0 1
exp (t + s) = exp t exp s . (6.85)
−1 0 −1 0 −1 0
Daher ist nach (6.77)

! !
10 0 1
cos(t + s) + sin(t + s) (6.86)
01 −1 0
! !! ! !!
10 0 1 10 0 1
= cos(t) + sin(t) cos(s) + sin(s)
01 −1 0 01 −1 0
! !
10 0 1
= cos(t) cos(s) + cos(t) sin(s)
01 −1 0
! !
0 1 10
+ sin(t) cos(s) − sin(t) sin(s) ,
−1 0 01
woraus wir die Behauptung ablesen können. t

u
6.7 Komplexe Zahlen
Wir haben ! von den zwei Matrizen nur (6.78) und die Tatsache, dass sich die Ma-
10
trix wie die 1 verhält verwendet. Nun erinnern wir uns an die Zahl i, die die
01
Eigenschaft i2 = −1 haben sollte. Somit haben wir jetzt zweierlei: ein explizites
mathematisches Objekt, dass genau die Eigenschaft von i hat. Wir könnten, wenn
wir wollten, komplexe Zahlen daher als 2 × 2- Matrizen darstellen und brauchten
dann nicht mit der imaginären Zahl i zu operieren. In der Tat gelten die Rechenre-
gel für Addition
! und Multiplikation
! genau! so, wie wir
! und das vorstellen: Es seine
10 0 1 10 0 1
Z1 = x1 + y1 und Z2 = x2 + y2 . Dann ist
01 −1 0 01 −1 0
! !
10 0 1
Z1 + Z2 = (x1 + x2 ) + (y1 + y2 ) , (6.87)
01 −1 0
und ! !
10 0 1
Z1 Z2 = (x1 x2 − y1 y2 )) + (x1 y2 + y1 x2 ) , (6.88)
01 −1 0
was kompatibel mit der Regel für die Addition und Multiplikation komplexer Zah-
len ist.
Weiter können wir komplexe Zahlen als Punkte in der sogenannten komplexen
Ebene auffassen, d.h. wir stellen die komplexe Zahl x + iy ∈ C als den Punkt (x, y) ∈
R2 dar. Daraus ergibt sich eine natürliche Definition für den Absolutbetrag einer
komplexen Zahl: Dieser soll einfach die Länge des Vektors (x, y) sein:
Definition 6.17 (Absolutbetrag einer komplexen Zahl). Sein z = x + yi ∈ C. Dann
ist der Absolutbetrag von z, geschrieben |z|, gegeben durch
q
|z| = x2 + y2 . (6.89)
Lemma 6.18. Der Absolutbetrag ist eine Norm auf C. Wenn wir für z = x + yi ∈ C
die komplex-konjugierte Zahl z∗ = x − yi definieren, so gilt
√
|z| = zz∗ . (6.90)
Insbesondere gilt für zwei komplexe Zahlen z1 , z2 , dass |z1 z2 | = |z1 ||z2 |.
Beweis. Übung. t
u
Die Darstellung der komplexen Zahlen als Punkte in der komplexen Ebene hat
noch eine tiefere Bedeutung. Sei nämlich φ = arctan(x/y). Dann ist die Matrixdar-
stellung der komplexen Zahl z = x + yi gerade
6.8 Zurück zu linearen Differentialgleichungen 123
! ! !
0 1 cos(φ) sin(φ)
Z = |z| exp φ = |z| . (6.91)
−1 0 − sin(φ) cos(φ)
!
cos(φ) sin(φ)
Die Matrix stellt eine Drehung um den Winkel φ dar. Es gilt dann
− sin(φ) cos(φ)
auch
cos(φ1 + φ2 ) sin(φ1 + φ2 )
! ! !
0 1
Z1 Z2 = |z1 ||z2 | exp (φ + φ2 ) = |z1 ||z2 | . (6.92)
−1 0 1 − sin(φ1 + φ2 ) cos(φ1 + φ2 )
D.h. aber, die Multiplikation zweier komplexer Zahlen entspricht einer Addition der
Winkel und einer Multiplikation ihrer Beträge als Punkte in der komplexen Ebene.
Wir können wir aber auch alles was wir eben gelernt haben auf die komplexe
Exponentialfunktion exp : C → C anwenden. Dabei ist wieder exp(z) durch ihre
Reihendarstellung definiert. Aus (6.77) wird dann das folgende Lemma.
Lemma 6.19. Sei z = a + ib ∈ C. Dann gilt
exp(z) = exp(a) (cos(b) + i sin(b)) . (6.93)
Beweis. Aus der fundamentalen Eigenschaft der Exponentialfunktion erhalten wir

exp(z + ib) = exp(a) exp(ib). Eq. (6.77) liefert exp(ib) = cos(b) + i sin(b). u
t
Trigonometrische Funktionen sind also nur ein Aspekt der Exponentialfunktion.

Die Exponentialfunktion ist eines der fundamentalsten Objekte der Analysis.
6.8 Zurück zu linearen Differentialgleichungen
Kehren wir nun wieder zu unserem allgemeinen System (6.67) zurück. Um exp(A)
zu berechnen, müssen wir alle Potenzen der Matrix A berechnen. Das scheint
schwierig, hat aber in dem Beispiel geklappt. Ein besonders einfacher Fall tritt ein,
wenn die Matrix A diagonal ist, also akk = λk ∈ C, und ak` = 0, wenn k , `. Dann
ist An auch diagonal und hat auf der Diagonalen die Einträge λnk . Dann ist aber auch
exp(At) diagonal mit Einträgen exp(λk t) auf der Diagonalen.
Satz 6.20. Sei A eine (reelle oder komplexe) n × n-Matrix. Angenommen, es eine
invertierbare n × n-Matrix V so, dass V −1 AV = Λ, wo Λ eine komplexe Diagonalma-
trix ist. Dann sind die Lösungen des Differentialgleichungssystems (6.67) gegeben
durch
x(t) = V exp(Λt)V −1 x(0) (6.94)
wo x(0) der Vektor der Anfangsbedingungen ist und exp(Λt) die Diagonalmatrix mit
Einträgen exp(λk t) ist.
Die Lösungen der inhomogenen Gleichungen sind nun ebenso einfach anzuge-
ben.
Satz 6.21. Sei A eine (reelle oder komplexe) n × n-Matrix. Angenommen, es eine in-
vertierbare n×n-Matrix V so, dass V −1 AV = Λ, wo Λ eine komplexe Diagonalmatrix
ist. Dann sind die Lösungen des inhomogenen Differentialgleichungssystems (6.66)
gegeben durch
Z t
x(t) = V exp(Λt)V −1
V exp(Λs)V −1 bds + V exp(Λt)V −1 x(0) (6.95)
0
wo x(0) der Vektor der Anfangsbedingungen ist und exp(Λt) die Diagonalmatrix mit
Einträgen exp(λk t) ist.
Die ganze Arbeit machen hier also die Algebraiker, die die Matrizen V und Λ
finden müssen. Leider gibt es die nicht immer. Man kann aber immer eine Transfor-
mation auf die sog. Jordan Normalform durchführen, deren n-te Potenzen ebenfalls
explizit berechnet werden können.
Literaturverzeichnis
1. Georg Cantor. Über eine Eigenschaft des Inbegriffes aller reellen algebraischen Zahlen. Journal
für die Reine und Angewandte Mathematik, 77:258–262, 1874.
2. Otto Forster. Analysis 1. Grundkurs Mathematik. Vieweg + Teubner, Wiesbaden, expanded
edition, 2011. Differential- und Integralrechnung einer Veränderlichen.
3. I. S. Gradstein and I. M. Ryshik. Summen-, Produkt- und Integraltafeln. Band 1, 2. Verlag
Harri Deutsch, Thun, 1982.
4. Konrad Königsberger. Analysis. 1. Springer-Lehrbuch. Springer-Verlag, Berlin, sixth edition,
2004.
5. Giuseppe Peano. Arithmetices principia nova methodo exposita. Fratres Bocca, Torino, 1889.
6. Terence Tao. Analysis. I, volume 37 of Texts and Readings in Mathematics. Hindustan Book
Agency, New Delhi, third edition, 2014.
125
Sachverzeichnis
C, 38 Beweise, 2
N, 23 bijektiv, 5
N0 , 15 Bildbereich, 5
Q, 20 Binärdarstellung, 37
R, 26 Brüche, 19
R+ , 47
Z, 32 Carthesisches Produkt, 4
-Umgebung, 39 Cauchy-Folgen, 24, 42
i, imaginäre Einheit, 38 Äquivalenz, 26
±∞, 40 Cauchy-Schwarz Ungleichung, 91
e: Euler’sche Zahl, 61
Äquivalenzklasse, 7 Definitionen, 2
Äquivalenzrelation, 7 Definitionsbereich, 5
Dezimaldarstellung, 37
Differentialgleichungen, 107
Abbildungen, 4 lineare, 123
abgeschlossen, 39 Differenzierbarkeit, 71
Ableitung, 71 Distributivgesetz, 17, 18
höhere, 83 Divergenz, 42
inverse Funktion, 77 Dreiecksungleichung, 24
linksseitig, 73 dyadische Zahlen, 37
rechtsseitig, 73
von Potenzreihen, 81 Eindeutigkeitssatz
Ableitungsregeln, 75 für Differentialgleichungen, 109, 114
Abschluss, 40 Euler’sche Zahl, 61
Absolutbetrag, 23 Existenzsatz
absolute Konvergenz, 50 für Differentialgleichungen, 110, 114
Abzählbarkeit, 32 Exponentialfunktion
Addition, 13 Ableitung, 74
Additionstheoreme Differentialgleichung, 116
Sinus und Kosinus, 121 komplexe, 123
Anfangswert, 108
Archimedisches Prinzip, 28 Flächeninhalt, 96
Assoziativgesetz, 14 Folge
asymptotische Äquivalenz, 44 monoton, 36
Aussage, 1 Folgen, 23, 31, 42
Axiome, 2 beschränkte, 23
127
128 Sachverzeichnis
konvergente, 25 Mehrfachreihen, 52
rationale, 23 Mengen, 3
reelle, 31 Mengenrelationen, 3
Funktionen, 4 Minimum, 24
Minkowski Ungleichung, 91
ganze Zahlen, 15 Mittelwertsatz, 77, 100
geometrische Reihe, 34, 46 monotone Folgen, 36
Grenzwert, 25 monotone Konvergenz, 42
Gronwall lemma, 108 Multiplikation, 19
Gruppe, 15
natürliche Zahlen, 9
Häufungspunkt, 43, 73 Norm, 92, 113
Hölder Nullfolgen, 25
Ungleichung, 90
Halbgruppe, 15 Oberintegral, 98
harmonische Reihe, 46 Objekt, 1
Hauptsatz der Differential- und Integralrech- offen, 39
nung, 102 Ordnung
Hintereinanderausführung, 6 reeller Zahlen, 27
homogene Differentialgleichung, 118 Ordnungsrelationen, 27
imaginäre Einheit i, 38 Partialsumme, 45, 48

Induktion, 12 partielle Integration, 95
Infimum, 40 Partition, 7
inhomogene Differentialgleichung, 118 Peano Axiome, 9
injectiv, 5 Picard-Lindelöf Iteration, 112
Inneres, 40 Potenz, 18, 32
integrierbare Funktionen, 99 Potenzmenge, 4
Potenzreihen
Jensen Ungleichung, 89 Ableitung, 81
Produktmenge, 4
Körper, 21 Produktregel, 75
reelle Zahlen, 31
Kettenregel, 76 Quantoren, 4
kleinerer Ordnung, 44 Quotientenkriterium, 48
Kommutativität, 14 Quotientenregel, 75
kompakt, 68
komplexe Zahlen, 38, 122 Rand, 40
Komposition, 6 rationale Zahlen, 19
konkav, 87 Rechenregeln
Konvergenz, 25, 42 reelle Zahlen, 28
absolute, 50 reelle Zahlen, 22
konvex, 87 Reihe
Kurzweil Integral, 102 geometrische, 34
harmonische, 46
Limes, 25 Reihen, 45
Limes inferior, 43 Reihenglieder, 45
Limes superior, 43 Riemann Integral, 96, 98
lineare Differentialgleichungen, 118, 123 Riemann Summen, 101
Lipschitz Norm, 66 Ring, 18
Lipschitz Stetigkeit, 66, 74
logische Verknüpfungen, 1 Sätze, 2
Satz
Maximum, 24 Bolzano-Weierstrass, 43, 68
Sachverzeichnis 129
Fubini, 52 uneigentliche Konvergenz, 44

von Rolle, 78 Ungleichung
von Taylor, 85 Cauchy-Schwarz, 91
Schrankensatz, 74, 79 Hölder, 90
Stammfunktion, 93 Jensen, 89
Substitutionsregel, 94 Minkowski, 91
Supremum, 40 Unterfolge, 36
surjektiv, 5 Unterintegral, 98
Tangente, 72 Vektorraum, 92, 113

Taylor vollständige Induktion, 12
Polynom, 86
Reihe, 83
Satz von, 85 Widerspruchsbeweis, 2
Schranke, 86 Wurzelkriterium, 49
teilerfremd, 21
Teilfolge, 36 Zahlen
Treppenfunktion, 97 ganze, 15
trigonometrische Funktionen, 82 komplexe, 38
Periodizität, 117 natürliche, 9
rationale, 19
Umordnungen, 50 reelle, 22
uneigentliche Integrale, 103 Zwischenwertsatz, 67

Current 2

Hochgeladen von

Copyright:

Verfügbare Formate

Current 2

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Current 2

Hochgeladen von

Copyright:

Verfügbare Formate

Anton Bovier

12. Juli 2022

1 Logik, Mengen, Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2 Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4 Ableitungen und lokale Approximation von Funktionen . . . . . . . . . . . . 71

4.5 Höhere Ableitungen und Taylor Reihen . . . . . . . . . . . . . . . . . . . . . . . . 83

Lemma 1.5. Die Mengenoperationen ∪, ∩, \, ∆ definieren die Mengen C jeweils ein-

Definition 1.6. [Karthesisches Produkt] Seien A und B Mengen. Dann ist C = A × B

Abb. 1.1 Das karthesische Produkt der Mengen A und B.

Abb. 1.2 Die fetten Punkte in A × B bilden eine Funktion f : A → B.

Definition 1.7 (Abbildungen, Funktionen). Seien A und B Mengen. Eine Abbil-

Anmerkung. Dann können wir φ in der Form

φ = ∪a∈A {(a, φ(a))} = {(a, φ(a)), a ∈ A} (1.1)

Definition 1.8 (surjektiv, injektiv, bijektiv). Eine Abbildung φ : A → B heißt:

Abb. 1.3 Verschiedene Typen von Funktionen als Graphen dargestellt

Es ist nützlich den Begriff der Zusammensetzung oder Hintereinanderausführung

Definition 1.9 (Komposition). Seien A, B,C Mengen und seien f : A → B und g :

g ◦ f = {(a, c) ∈ A × C : ∃b∈B : (a, b) ∈ f ∧ (b, c) ∈ g} (1.2)

Wir können uns g ◦ f auch vorstellen als die Menge

{(a, g( f (a)), a ∈ A}. (1.3)

Abb. 1.4 Hintereinanderausführung von zwei Funktionen als Graphen

[a] = {b ∈ A : (a, b) ∈ E} (1.4)

die Äquivalenzklasse von a.

([a] = [b]) XOR ([a] ∩ [b] = ∅). (1.5)

Abb. 1.5 Zerlegung einer Menge A in Äquivalenzklassen.

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. (1.6)

Damit sind wie aber nicht zufrieden.

1.3.1 Die natürlichen Zahlen

Beweis. Angenommen, N wäre endlich, sagen wir N habe N + 1 Elemente. Da 1

Lemma 1.25 (Addition). Es gibt eine eindeutige Abbildung, + , genannt Addition,

n + 1 = φ(n), n + φ(m) = φ(n + m). (1.8)

((n, 1), m) ∈ f + ⇔ (n, m) ∈ φ, ((n, φ(m)), k) ∈ f + ⇔ ( f + (n, m), k) ∈ φ. (1.9)

Aussage ’wenn n + m bestimmt ist, dann ist auch n + φ(m) bestimmt”wahr, da ja

1+1+1+1 + 1+1 = 1+1+1+1+1+1

Im folgenden geben wir einige elementare Eigenschaften der Addition an.

φ(n) + 1 = (n + 1) + 1 = (1 + n) + 1 = φ(1 + n) = 1 + φ(n), (1.10)

Hier beginnt sich eine algebraische Struktur abzuzeichnen.

Definition 1.27 (Halbgruppe). Eine Menge H mit einer Abbildung + : H × H → H

Wir haben also gezeigt:

1.3.2 Die ganzen Zahlen

Wir würden unsere Zahlen gerne zu einer vollen Gruppe aufwerten.

φ(0) = 1, und für alle n ∈ N ∪ {0}, φ(−φ(n)) = −n. (1.14)

Wir können auf Z die Addition definieren wie folgt.

Lemma 1.33. Für alle z ∈ Z gilt

z + (−z) = (−z) + z = 0. (1.16)

− (z + (−z)) = −z + (−(−z)) = −z + z = z + (−z). (1.17)

Wir schreiben auch z1 + (−z2 ) = z1 − z2 .

Definition 1.35 (Multiplikation). Die folgenden Regeln definieren eine Abbildung

Abb. 1.7 Die ganzen Zahlen und die Wirkung von φ.

(iii) Für alle n, m ∈ N gilt n ? φ(m) = (n ? m) + n.

Definition 1.36 (Ring). Eine Menge R mit zwei Operationen + : R × R → R und

(a + b) ? c = (a ? c) + (b ? c) und c ? (a + b) = (c ? a) + (c ? b). (1.18)

φ(m) ? φ(n) = φ(m) ? n + φ(m) = m ? n + n + φ(m)

m ? φ(n) = m ? n + m = n ? m + m = φ(n) ? m, (1.21)

und damit die Behauptung.

1.3.3 Die rationalen Zahlen

(i) Für jedes n ∈ N gilt

Wenn weder p > q noch q > p liegt es nahe zu sagen, dass p = q.

Brüche mit dieser Eigenschaft heißen teilerfremd (umgangsprachlich gekürzt). Die

int M = {x ∈ M : ∃>0 : I (x) ⊆ M}, (2.2)

∂M = {x ∈ R : ∀>0 : I (x) ∩ M , ∅ ∧ I (x) ∩ M c , ∅}, (2.3)