Mathematischer Vorkurs Zum Studium Der Physik
Mathematischer Vorkurs Zum Studium Der Physik
Mathematischer Vorkurs Zum Studium Der Physik
Klaus Hefft
Institut für theoretische Physik
Ruprecht-Karls-Universität Heidelberg
Fehlermeldungen bitte an
[email protected]
1 MESSEN:
Messwert und Maßeinheit 3
1.1 Empirische Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Physikalische Größen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Maßeinheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Größenordnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
i
4 FUNKTIONEN 37
4.1 Funktion als Input-Output-Relation oder Abbildung . . . . . . . . . . . . . 37
4.2 Funktionen-Grundausstattung . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2.1 Rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2.2 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . 43
4.2.3 Exponentialfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.2.4 Funktionen mit Ecken und Sprüngen . . . . . . . . . . . . . . . . . 50
4.3 Verkettete Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.4 Spiegelsymmetrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.5 Beschränktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.6 Monotonie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.7 Eineindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.8 Umkehrfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.8.1 Wurzelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.8.2 Zyklometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . 62
4.8.3 Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.9 Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.10 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5 DIFFERENTIATION 75
5.1 Differenzenquotient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2 Differentialquotient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.4 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.5 Das Handwerk des Differenzierens . . . . . . . . . . . . . . . . . . . . . . . 84
5.5.1 Vier Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.5.2 Einfache Differentiationsregeln: Funktionen-Grundausstattung . . . 86
5.5.3 Ketten- und Umkehrfunktionsregel . . . . . . . . . . . . . . . . . . 91
5.6 Numerische Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.7 Ausblick auf Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . 98
ii
6 TAYLOR-ENTWICKLUNG 101
6.1 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.2 Vorbild geometrische Reihe . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
6.3 Form und Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.4 Beispiele aus der Funktionen-Grundausstattung . . . . . . . . . . . . . . . 104
6.4.1 Rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.4.2 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . 106
6.4.3 Exponentialfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.4.4 Weitere Taylor-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.5 Konvergenzradius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6.6 Genaue Regeln für das ungenaue Rechnen . . . . . . . . . . . . . . . . . . 112
6.7 Güte der Konvergenz: Restglied . . . . . . . . . . . . . . . . . . . . . . . . 114
6.8 Taylor-Entwicklung um beliebigen Punkt . . . . . . . . . . . . . . . . . . . 116
7 INTEGRATION 119
7.1 Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.2 Fläche unter einer Funktion über einem Intervall . . . . . . . . . . . . . . . 122
7.3 Eigenschaften des Riemann-Integrals . . . . . . . . . . . . . . . . . . . . . 124
7.3.1 Linearität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
7.3.2 Intervalladdition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
7.3.3 Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
7.3.4 Mittelwertsatz der Integralrechnung . . . . . . . . . . . . . . . . . . 128
7.4 Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . . . . 128
7.4.1 Unbestimmtes Integral . . . . . . . . . . . . . . . . . . . . . . . . . 128
7.4.2 Differenzieren nach der oberen Grenze . . . . . . . . . . . . . . . . 129
7.4.3 Integrieren über einen Differentialquotienten . . . . . . . . . . . . . 130
7.4.4 Stammfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.5 Die Kunst des Integrierens: . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
iii
7.5.1 Differentiationstabelle rückwärts . . . . . . . . . . . . . . . . . . . . 134
7.5.2 Lineare Zerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.5.3 Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
7.5.4 Partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . . . 140
7.5.5 Weitere Integrationstricks . . . . . . . . . . . . . . . . . . . . . . . 143
7.5.6 Integralfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
7.5.7 Numerische Integration . . . . . . . . . . . . . . . . . . . . . . . . . 147
7.6 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
7.6.1 Unendliches Integrationsintervall . . . . . . . . . . . . . . . . . . . 148
7.6.2 Unbeschränkter Integrand . . . . . . . . . . . . . . . . . . . . . . . 150
iv
8.3.6 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . 183
8.3.7 Wurzelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
8.3.8 Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
8.3.9 Allgemeine Potenz . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
9 VEKTOREN 197
9.1 Dreidimensionaler euklidischer Raum . . . . . . . . . . . . . . . . . . . . . 197
9.1.1 Dreidimensionaler reeller Raum . . . . . . . . . . . . . . . . . . . . 197
9.1.2 Koordinatensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . 197
9.1.3 Euklidischer Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
9.1.4 Transformationen des Koordinatensystems . . . . . . . . . . . . . . 200
9.2 Vektoren als Verschiebungen . . . . . . . . . . . . . . . . . . . . . . . . . . 206
9.2.1 Verschiebungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
9.2.2 Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
9.2.3 Transformationen des Koordinatensystems . . . . . . . . . . . . . . 210
9.3 Addition von Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
9.3.1 Vektorsumme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
9.3.2 Kommutatives Gesetz . . . . . . . . . . . . . . . . . . . . . . . . . 225
9.3.3 Assoziatives Gesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
9.3.4 Nullvektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
9.3.5 Negatives und Subtraktion . . . . . . . . . . . . . . . . . . . . . . . 228
9.4 Multiplikation mit reellen Zahlen, Basisvektoren . . . . . . . . . . . . . . . 229
9.4.1 Vielfaches eines Vektors . . . . . . . . . . . . . . . . . . . . . . . . 229
9.4.2 Gesetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.4.3 Vektorraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
9.4.4 Lineare Abhängigkeit, Basisvektoren . . . . . . . . . . . . . . . . . 230
9.4.5 Einheitsvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
9.5 Skalarprodukt und Kronecker-Symbol . . . . . . . . . . . . . . . . . . . . . 234
v
9.5.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
9.5.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
9.5.3 Kommutatives Gesetz . . . . . . . . . . . . . . . . . . . . . . . . . 236
9.5.4 Kein Assoziatives Gesetz . . . . . . . . . . . . . . . . . . . . . . . . 236
9.5.5 Homogenität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
9.5.6 Distributives Gesetz . . . . . . . . . . . . . . . . . . . . . . . . . . 237
9.5.7 Basisvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
9.5.8 Kronecker-Symbol . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
9.5.9 Komponentendarstellung . . . . . . . . . . . . . . . . . . . . . . . . 240
9.5.10 Transversaler Anteil . . . . . . . . . . . . . . . . . . . . . . . . . . 241
9.5.11 Kein Inverses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
9.6 Vektorprodukt und Levi-Civita-Symbol . . . . . . . . . . . . . . . . . . . . 243
9.6.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
9.6.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
9.6.3 Antikommutativ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
9.6.4 Homogenität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
9.6.5 Distributives Gesetz . . . . . . . . . . . . . . . . . . . . . . . . . . 248
9.6.6 Mit transversalem Anteil . . . . . . . . . . . . . . . . . . . . . . . . 249
9.6.7 Basisvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
9.6.8 Levi-Civita-Symbol . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
9.6.9 Komponentendarstellung . . . . . . . . . . . . . . . . . . . . . . . . 252
9.6.10 Kein Inverses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
9.6.11 Kein Assoziatives Gesetz . . . . . . . . . . . . . . . . . . . . . . . . 255
9.7 Mehrfachprodukte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
9.7.1 Spatprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
9.7.2 Geschachteltes Vektorprodukt . . . . . . . . . . . . . . . . . . . . . 261
9.7.3 Skalarprodukt zweier Vektorprodukte . . . . . . . . . . . . . . . . . 262
vi
9.7.4 Vektorprodukt zweier Vektorprodukte . . . . . . . . . . . . . . . . . 263
9.8 Transformationsverhalten der Produkte . . . . . . . . . . . . . . . . . . . . 266
9.8.1 Orthonormale Rechtsbasen . . . . . . . . . . . . . . . . . . . . . . . 266
9.8.2 Gruppe der Orthogonalen Matrizen . . . . . . . . . . . . . . . . . . 267
9.8.3 Untergruppe der Drehungen . . . . . . . . . . . . . . . . . . . . . . 269
9.8.4 Transformation der Produkte . . . . . . . . . . . . . . . . . . . . . 270
vii
viii
Vorwort
Dieser Kurs soll den Übergang von der Schule zum Studium erleichtern, er soll hel-
fen das infolge der verschiedenartigen Schultypen, Schulen, Kurse und Mathematiklehrer
häufig sehr unterschiedliche Vorbildungsniveau auszugleichen und zu ergänzen. Vergesse-
nes und Verdrängtes soll gehoben und wiederholt, Zerstreutes gesammelt, Bekanntes zum
Gebrauch aufbereitet werden, so dass ein gemeinsames mathematisches Fundament
entsteht. Hier wird mathematisch nichts Neues geboten, jedenfalls nichts, was nicht an-
derswo auch, vielleicht sogar ausführlicher, exakter oder schöner formuliert steht. Es geht
in erster Linie um die Auswahl, Zusammenstellung und Darstellung. Aus dem mathema-
tischen Schulstoff eines Leistungskurses, der ja kaum im Hinblick auf die Praxis, sondern
hauptsächlich unter den Gesichtspunkten des Geistes-Trainings, der Logik und der Axio-
matik ausgewählt ist, werden wir das für den Studienanfang Erforderliche in kompakter
Form zusammenstellen und an einigen Stellen ergänzen und erweitern. In den Naturwis-
senschaften genügt es bekanntlich nicht, die mathematischen Begriffe und Operationen zu
kennen, man muss auch mit ihnen umgehen können. Dazu sind die eingestreuten Übun-
gen besonders wichtig, weil sie die Möglichkeit geben, den entscheidenden Schritt vom
”
Kennen zum Können“ selbst zu überprüfen. Wir werden also besonders den praktischen
Aspekt betonen, auch wenn dabei manchmal die mathematische Schärfe (und eventuell
auch ihre Schönheit) auf der Strecke bleibt. Der Vorkurs ist kein Ersatz für die Mathema-
tikvorlesungen; er kann aber eine gute Voraussetzung auch für diese sein.
Das Wiederholen und Einüben des Basiswissens muss möglichst früh geschehen, noch
bevor eventuelle Lücken das Verständnis der Grundvorlesungen behindern und psycholo-
gische Barrieren entstehen können. Wir haben deshalb diesen Kurs als ganztägigen Block-
kurs während der zwei Wochen vor Semesterbeginn mehrmals seit dem WS 84/85 für die
künftigen Physikstudenten der Universität Heidelberg gehalten und dabei auch Hörer aus
anderen Naturwissenschaften und der Mathematik gehabt. Wir können uns gut vorstel-
len, dass er auch späteren Ingenieurstudenten den Einstieg beträchtlich erleichtern kann.
Es scheint uns zweckmäßig und sinnvoll, in dieser elektronischen Form des Vorkurses, die
Ihnen nicht erst zwei Wochen vor Semesterbeginn zugänglich ist, etwas weiter auszuholen
und auch ein wenig weiter im Stoff zu gehen, als das in unserem Blockkurs in intensivem
Kontakt mit den Heidelberger Physikern gewöhnlich der Fall war. Außerdem haben wir
in der Praxis häufig bemerkt, dass kleine Ausflüge in die höhere Mathematik“, histori-
”
sche Rückblicke und Ausblicke auf die physikalischen Anwendungen über das Schulwissen
hinaus anregend wirken und Lust auf Kommendes wecken. Wir werden deshalb auch hier
manches Höhere“ bringen, es aber deutlich kennzeichnen, damit es unbedenklich über-
”
sprungen werden kann.
1
Dank
An erster Stelle möchte ich Herrn Prof. Jörg Hüfner danken für die Idee und Einladung, mein altbewährtes Vorkurs-
Manuskript zu überarbeiten und attraktiv auszugestalten, um es mit Hilfe des neuen Mediums der CD-ROM bzw. online
einem größeren Kreis von Interessenten (auch schon vor und noch nach dem eigentlichen Vorkurs) zugänglich zu machen,
ferner für viele bis in Einzelfragen gehende Diskussionen, Ratschläge, Anregungen und Beiträge dazu und die laufende
Ermunterung während der langen wechselvollen Zeit der Arbeit an dem Projekt.
Dann gilt ein besonderer Dank Herrn Prof. Hans-Joachim Nastold, der mir vor 60 Jahren durch die Beantwortung einiger
mathematischer Fragen aus einer persönlichen Krise geholfen und wieder Mut gemacht hat, als ich aus einem Juristen-
Elternhaus von einem humanistischen Gymnasium kommend, ohne irgendeinen Naturwissenschaftler zu kennen, und ohne
irgendwelchen Zugang zu Lehrbüchern oder einer Bibliothek unter dem Eindruck zweier junger genialer Mathematikdozenten
in ähnlicher Situation, aber ungleich hoffnungsloserer Lage war als Sie eventuell jetzt.
Herrn Prof. Dieter Heermann gebührt mein Dank für seinen kompetenten Rat, seine zukunftsweisende Unterstützung bis
zur tätigen Hilfe im Frühstadium des Projekts. Herrn Dr. Thomas Fuhrmann danke ich herzlich für seine Begeisterung
für die multimedialer Idee, die ersten Arbeiten zur elektronischen Umsetzung des Manuskripts, für die drei Java-Applets
und insbesondere für die Programmierung des Funktionenschaufensters, die er noch durchführte, ehe es ihn zu anderen
Arbeitsgebieten zog.
Folgenden Mitarbeitern des Instituts habe ich für mannigfache Diskussionen, Hinweise und Hilfe zu danken, vor allem
Herrn Prof. F. Wegner für die aufmerksame Durchsicht der letzten Kapitel des Word-Skriptums in einem frühen Stadium,
Herrn Dr. E. Thommes für außerordentlich sorgfältige Hilfe bei der Fehlersuche im html-Text, Herrn Prof. W. Wetzel für
unermüdlichen Rat und unschätzbare Hilfe bei allen Computerfragen, Herrn Dr. Peter John besonders für Unterstützung
bei einigen Abbildungen, Herrn Ting Wang für seine elektronische Hilfsbereitschaft und vielen, vielen anderen Mitgliedern
des Instituts für gelegentliche Unterstützung und dauernde Ermutigung.
Mein Hauptdank gilt meinem engeren Mitarbeiterteam: zunächst Frau Melanie Steiert und dann vor allem Frau Dipl.-
Math. Katharina Schmock für die aufmerksame souveräne Übertragung des Textes in LATEX, Frau Birgitta Schiedt und
Herrn Bernhard Zielbauer für ihre Einsatzfreude und Arbeitsgeschwindigkeit bei der Übertragung der TEX-Formlen in die
html-Version und last not least Olsen Technologies für die Konzeption der Navigation und die souveräne Gestaltung der
html-Fassung. Dem Direktorium des Instituts, insbesondere Herrn Prof. C. Wetterich und Herrn Prof. F. Wegner, danke
ich für die Bereitstellung der Hilfskraftmittel für dieses Team im entscheidenden Stadium.
Einer großen Zahl interessierter Studentinnen und Studenten vieler Jahrgänge schulde ich Dank, die durch ihre begeisternde
Mitarbeit und ihre Fragen während der Kurse und auch noch spätere Rückkopplung entscheidend zum Zustandekommen und
zur Optimierung der kompakten Form meines Vorlesungsskripts Mathematische Methoden des Physikers“, dessen erster
”
Teil der Vorkurs darstellte, beigetragen haben. Stellvertretend für die vielen, deren Gesichter und Stimmen mir in besserer
Erinnerung sind als ihre Namen, möchte ich Herrn Björn Seidel nennen. Großen Dank auch all denjenigen Benutzern des
Online-Kurses, die die Mühe nicht gescheut haben, mir aktuelle Übertragungsprobleme oder die immer noch verbliebenen
Tipp- und Setzfehler zu melden und dadurch mitgeholfen haben, dass wir uns allmählich dem Ideal eines fehlerfreien Textes
nähern, zuletzt insbesondere den Herren F. Heiderich, M. Frohnapfel, J. Rist, J. Küchenmeister, M. Stammeier, U. Kaeppler,
S. Stolzenberg, H. Jung und Frau Jenny Wagner. Bei Herrn Prof. Dr. rer.nat.habil. L. Paditz bedanke ich mich für kritische
Hinweise und Änderungsvorschläge zur Wahl der Grenzen der Argumente komplexer Zahlen.
Für ihre Mithilfe, die Abiturientinnen und Abiturienten aus nah und fern fröhlich zu empfangen, sie zu motivieren, ihnen
Mut zu machen und unseren Kurs aus dem Alltagstrott herauszuheben und zu einem Erlebnis zu machen, an das man
noch lange mit Freude zurückdenkt, vor allem aber für Ideen zu den Übungsaufgaben und Hilfe beim Korrekturlesen geht
mein Dank vor allem an meine ehemaligen studentischen Tutoren Peter Nalbach, Rainer Tafelmayer, Steffen Weinstock und
Carola von Saldern.
Schließlich danke ich besonders herzlich meinen Kindern und meinem Schwiegersohn Christoph Lübbe, ohne deren dauernde
Ermunterung und unermüdliche Hilfe zu jeder Tages- und Nachtzeit ich nie so weit hätte in die moderne Medienwelt
eindringen können. Ihnen und meinen Enkeln möchte ich dieses Zukunftsprojekt auch widmen:
2
Kapitel 1
MESSEN:
Messwert und Maßeinheit
Alle Erkenntnis beginnt mit dem Staunen eines neugierigen und aufmerksamen Menschen
über ein Phänomen. Dem folgt häufig eine eingehende qualitative Naturbeobachtung. Die-
se Beobachtung wird zunehmend quantifiziert und ihr Gegenstand idealisiert bis hin zum
Experiment, das eine wohldefinierte Frage stellt. Die Antworten darauf, die Messwerte,
werden in Tabellen gesammelt, in Diagrammen graphisch dargestellt und so auf Abhän-
gigkeiten und Zusammenhänge untersucht. Nach Berechnung oder Abschätzung der Mess-
genauigkeit kann zwischen den Messwerten interpoliert und nach einer Beschreibung oder
wenigstens Approximation durch eine mathematische Kurve oder Formel gesucht
werden. Aus den empirischen Zusammenhängen werden die Gesetzmäßigkeiten erschlos-
sen. Diese sind meist in mathematischer Sprache (z.B. Differentialgleichungen) formuliert.
Hat man einen solchen Zusammenhang gefunden, möchte man ihn verstehen“. Das heißt,
”
entweder man findet eine Theorie (z.B. einige bereits bekannte Grundgesetze), aus der
man das experimentelle Ergebnis mathematisch herleiten kann, oder man versucht die
Grundgleichung, die hinter dem Phänomen steht, in einer Hypothese“ fantasievoll zu er-
”
raten. Auch dazu ist viel Mathematik notwendig. Schließlich wird die Mathematik erneut
gebraucht, um Vorhersagen zu gewinnen, die dann wieder experimentell überprüft werden
müssen usw. In dieser Spirale bewegt sich der Fortschritt der Wissenschaft.
3
1.2 Physikalische Größen
Historisch hat sich beim Aufbau der Physik immer wieder gezeigt, wie schwierig, aber
auch wichtig es war, überhaupt die richtigen Begriffe zu entwickeln und die relevanten
Größen (z.B. Kraft oder Energie) zu finden, mit deren Hilfe das Naturgeschehen einfach
und umfassend beschrieben werden kann.
Einschub: Zur Geschichte: Mehr als 100 Jahre hat es gedauert, bis aus der
Diskussion zwischen den Naturphilosophen“ (vor allem D’Alembert, Bruno, New-
”
ton, Leibniz, Boškovic und Kant) über die Begriffe principium, substantia, materia,
causa efficiente, causa formale, causa finale, effectum, actio, vis viva und vis insita
sich unsere heutigen Begriffe von Kraft und Wirkung herauskristallisierten.
Wenn das lateinische Alphabet nicht ausreicht, wird meist das griechische verwendet:
alpha α A iota ι I rho ρ P
beta β B kappa κ K sigma σ Σ
gamma γ Γ lambda λ Λ tau τ T
delta δ ∆ my µ M ypsilon υ Y
epsilon E ny ν N phi φ Φ
zeta ζ Z xi ξ Ξ chi χ X
eta η H omikron o O psi ψ Ψ
theta θ Θ pi π Π omega ω Ω
Daneben steht auch das deutsche Schreibschrift-Alphabet noch zur Verfügung.
4
1.3 Maßeinheiten
Die Maßeinheiten werden über Maßstäbe definiert. Die Suche nach geeigneten Maßstä-
ben und deren Festlegung durch möglichst internationale Konventionen ist ein wichtiger
Teil der Wissenschaft.
Einschub: Maßstäbe: Was taugt als Maßstab? Die Antwort auf diese Frage hat
sich mit der Zeit stark gewandelt. Ursprünglich benutzte man überall leicht verfügba-
re Vergleichsgrößen, wie Elle oder Fuß für die Längenmessung bzw. den Pulsschlag
zur Messung der Zeit. Das lateinische Wort tempora bedeutet ursprünglich Schläfen!
Aber nicht jeder Fuß ist gleich lang, und der Puls kann schneller oder langsamer
schlagen. Allein in Deutschland gab es im Mittelalter über 100 verschiedene Ellen-
und Fuß-Maße.
Man bezog sich deshalb bei der Längenmessung seit 1795 auf den zehnmillionsten
Teil des Erdmeridianviertels, genannt Meter“ und dargestellt durch den bekannten
”
Stab aus einer Platin-Iridium-Legierung, und für die Zeitmessung auf die Erddre-
hung: Die Sekunde war lange Zeit als 86400ster Teil eines mittleren Sonnentages
definiert.
Diese Fragen sind heute nach vielen Irrwegen durch die Konventionen der SI-Einheiten
(Système International d’Unités) gelöst. Dabei werden folgende Grundgrößen festgelegt:
Alle übrigen physikalischen Größen sind als abgeleitet anzusehen, also durch Gesetze,
Definitionen oder Messvorschriften auf die Grundgrößen zurückzuführen, z.B.:
5
Frequenz gemessen in Hertz: Hz := 1/s
Kraft in Newton: N := kg m/s2
Energie in Joule: J := N m
Leistung in Watt: W := J/s
Druck in Pascal: Pa := N/m2
elektrische Ladung in Coulomb: C := A s
elektrisches Potential in Volt: V := J/C
elektrischer Widerstand in Ohm: Ω := V/A
Kapazität in Farad: F := C/V
magnetischer Fluss in Weber: Wb := V s
Einschub: Alte Einheiten: Einige Beispiele für Einheiten, die trotz der SI-
Konvention noch sehr gebräuchlich sind:
Grad: ◦ = (π/180) rad = 0, 01745 rad
Stundenkilometer: km/h = 0,277 m/s
Pferdestärke: PS = 735,499 W
Kalorie: cal ' 4,185 J
Kilowattstunde: kW h = 3, 6 · 106 J
Elektronenvolt: eV ' 1, 6 · 10−19 J
Insbesondere in England und den USA werden noch alte nichtmetrische Einheiten
verwendet:
inch = Zoll: in = 00 = 2,54 cm
foot: ft = 12 in ' 0,30 m
yard: yd = 3 ft ' 0,9144 m
(amer.) mile: mil = 1760 yd ' 1609 m
ounce: oz ' 28,35 g
(engl.) pound: lb = 16 oz ' 0,454 kg
(amer.) gallon: gal ' 3,785 l
(amer.) barrel: bbl = 42 gal = 158,9873 l
6
Aufgabe 1.2 Umrechnung von Maßeinheiten
a) Die Umrechnung der Winkel von Grad in Radiant sind Sie von Ihrem Taschenrechner
gewohnt: Berechnen Sie 30◦ , 45◦ , 60◦ , und 180◦ in Radiant und 1 rad bzw. 2 rad in Grad.
b) Wie viele Sekunden hat ein Sternenjahr mit 12 Monaten, 5 Tagen, 6 Stunden, 9 Mi-
nuten und 9,5 Sekunden?
c) Wieviel kostet es bei einem Strompreis“ von 0,122 ¿/kWh, wenn Sie sechs Stunden
”
lang eine 60-Watt-Glühbirne brennen und Ihren PC laufen haben, der 200 Watt ver-
”
braucht“?
d) Zwei amerikanische Kinder messen ihre Trainingsstrecke mit einem Stab aus, der 5
Fuß und 2 Inches lang ist. Der Stab passt 254-mal hinein. Wie heißt der Lauf bei uns?
Wie viele Runden müssen die beiden laufen, bis sie 1 Mile zurückgelegt haben?
e) Bill Gates sagte: If General Motors had kept up with technology like the computer
”
industry, we would all be driving twenty-five dollar cars that got 1000 miles per gallon.“
Meinte er das 3-Liter-Auto“?
”
1.4 Größenordnungen
Die Naturphänomene sind so vielfältig und umfassen oft so viele Größenordnungen, dass
bezogen auf einen Maßstab wie z.B. das Meter winzige bzw. riesige Zahlen herauskommen.
In beiden Fällen treten unübersichtliche“ Nullen auf. Man hat deshalb Zehnerpotenzen
”
eingeführt und diesen Abkürzungen sowie einprägsame Namen gegeben: z.B. das Kilo-
gramm 1000 g = 103 g = 1 kg. Auch diese Dezimalvorsätze sind heute international
standardisiert. Wir geben die wichtigsten an:
7
Beispiel: Um Ihnen einen Begriff von den Größenordnungen zu geben, führen wir einige
Beispiele aus dem Bereich der Längenmessung an:
Der Durchmesser des Bereichs, in dem gestreute Elektronen ein Proton spüren, beträgt
etwa 1,4fm, Atomkerne sind zwischen 3 und 20 fm dick.
Die Wellenlängen von Gamma-Strahlen liegen im Bereich von pm. Atomdurchmesser rei-
chen von 100 pm bis 1 nm.
Viele Moleküle sind etwa 10 nm dick. 100 nm ist die Größenordnung von Viren, und auch
die Wellenlängen des sichtbaren Lichts liegen etwa zwischen 300 und 800 nm.
Bakterien haben typische Durchmesser von µm, unsere Blutkörperchen von 10 µm, und
Einzeller messen einige 100 µm.
Damit kommen wir schon in den Ihnen geläufigen Alltagsbereich von Stecknadelköpfen: 1
mm, Haselnüssen: 1 cm und Grapefruits: 1 dm.
Elektromagnetische Kurzwellen sind 10 bis 100 m lang, Mittelwellen 100 m bis 1 km und
schwingen mit 1 MHz. 1 km beträgt etwa der Abstand der Heidelberger Neckarbrücken.
Die Flughöhen der großen Verkehrsflugzeuge liegen bei 10 km.
Der Durchmesser der Erde beträgt 12,7 Mm und der des Jupiter etwa 144 Mm. Während
der Sonnendurchmesser bei 1,4 Gm liegt, ist der mittlere Abstand der Erde von der Sonne
ca. 150 Gm, und der Saturn kreist im Abstand von etwa 1,4 Tm um die Sonne.
Einschub: Andere Namen: Auch für einige metrische Einheiten sind noch
besondere Namen im Gebrauch: Sie kennen 102 m2 als Ar, 104 m2 als Hektar, 10−3 m3
als Liter, 102 kg als Doppelzentner und 103 kg als Tonne.
Kennen Sie auch 105 P a als Bar, 10−28 m2 = bn als Barn, 10−5 N = dyn, 10−7 J =
erg, 10−15 m = f m als Fermi, 10−10 m = 1Å als Ångström oder 10−8 W b unter dem
Namen Maxwell?
8
Aufgabe 1.3 Dezimalvorsätze
a) Drücken Sie die Länge eines Sternenjahres (365d + 6h + 9min + 9,5s) in Megasekun-
den aus.
b) Die ideale Dauer eines wissenschaftlichen Vortrags beträgt ein Mikrojahrhundert. Wie
viele Minuten sind das?
c) Wie lange braucht ein Photon, um mit der Lichtgeschwindigkeit von
c = 2,997 924 58 ·108 m/s rund 21 m weit durch den Hörsaal zu fliegen?
d) Bei der Planck-Energie von Ep = 1, 22 · 1016 TeV werden für die Elementarteilchen
Gravitationseffekte erwartet. Drücken Sie die entsprechende Planck-Masse MP in Gramm
aus.
Im Folgenden befassen wir uns nur noch mit den Zahlenwerten der untersuchten phy-
sikalischen Größen, die wir meist in Form von Längen oder Winkeln an unseren Messap-
paraten ablesen, die im gewünschten Messbereich in den entsprechenden Einheiten der
Messgröße geeicht sind.
9
10
Kapitel 2
Die Gesetze der Zahlen und ihrer Verknüpfungen sind Gegenstand der Mathematik. Ob-
wohl sich die Zahlen aus ganz elementaren Bedürfnissen des menschlichen Zusammenle-
bens entwickelt haben und die Naturwissenschaften der Mathematik immer wieder An-
stöße gegeben haben, wie zum Beispiel zur Differential- und Integralrechnung, ist die Ma-
thematik eigentlich keine Naturwissenschaft, sondern eine Geisteswissenschaft: Sie geht
nicht von empirischen, d.h. gemessenen Sachverhalten aus, sondern untersucht die logi-
sche Struktur von Zahlen und ihrer Verallgemeinerungen im menschlichen Denkvermögen.
Da sich in vielen Fällen empirische Sachverhalte auf diese logischen Strukturen abbilden
lassen, ist die Mathematik ein unentbehrliches Werkzeug des Naturwissenschaftlers und
des Ingenieurs.
2.1 Zeichen
Wie jede Wissenschaft hat auch die Mathematik eine ihr eigene Sprache entwickelt. Hierzu
gehören auch einige mathematische und logische Zeichen, die wir hier kurz zusammen-
stellen wollen, da wir sie der Kürze und Klarheit wegen laufend benutzen werden:
Die Bedeutung der folgenden mathematischen Zeichen ist den meisten von Ihnen bekannt:
11
+: plus -: minus ± : plus oder minus
· : mal /: geteilt durch ⊥ : steht senkrecht auf
=: ist gleich 6=: ist ungleich ≡: ist identisch gleich
<: ist kleiner als ≤: ist kleiner oder gleich : ist klein gegen
>: ist größer als ≥: ist größer oder gleich : ist groß gegen
∠ : Winkel zwischen ': ist ungefähr gleich ∞ : größer als jede Zahl
Einschub: Unendlich: Die Physiker machen oft lässigen Gebrauch von dem
unter dem Namen unendlich“ bekannten Zeichen ∞. Mit der Bedeutung größer
” ”
als jede Zahl“ vermeidet man die Probleme, vor denen die Mathematiker bei diesem
Zeichen warnen: a < ∞ bedeutet a ist eine endliche Zahl. In Kürze werden wir
die Kombination → ∞ verwenden, wenn wir meinen, eine Größe wächst über alle
”
Grenzen“.
P 3
P
Summenzeichen : z.B. an := a1 + a2 + a3
n=1
Weitere Beispiele sind etwa die Summe der ersten m natürlichen Zahlen:
m
X m
n := 1 + 2 + . . . + (m − 1) + m = (m + 1),
n=1
2
wie der junge Gauß durch geschickte Anordnung und Klammerung der Summanden ge-
m
n = (1 + m) + (2 + (m − 1)) + (3 + (m − 2)) + . . . = m2 (m + 1),
P
zeigt hat:
n=1
sm := 1+ q + q 2 + . . . + q m−1 + q m ,
subtrahieren davon q · sm = q + q 2 + q 3 + . . . + q m + q m+1
P Q
Wichtiger als das analog dem Summenzeichen definierte Produktzeichen :
3
Q
z.B. an := a1 · a2 · a3 ist für uns das
n=1
m
Q
Fakultätszeichen ! : m! := 1 · 2 · 3 · . . . · (m − 1) · m = n
n=1
Von den logischen Zeichen, die ebenfalls meist aus dem Mathematikunterricht bekannt
sind, verwenden wir folgende, um logische Zusammenhänge einfacher, übersichtlicher und
einprägsamer darstellen und leichter memorieren zu können:
Diese Zeichen werden jeweils beim ersten Auftreten im Text nochmals erklärt.
13
2.2 Zahlen
Zur Darstellung unserer Messwerte brauchen wir die Zahlen, die Ihnen seit langem ver-
traut sind. Um einen Überblick zu erhalten, stellen wir hier ihre Eigenschaften noch einmal
zusammen. Dabei rufen wir uns einige ausgewählte Begriffe ins Gedächtnis, die die Mathe-
matiker für Gesetzmäßigkeiten der Zahlen gebildet haben, damit wir später die Rechen-
regeln zwischen anderen komplizierteren mathematischen Größen mit ihnen vergleichen
können.
Wir beginnen mit der Menge der natürlichen Zahlen {1, 2, 3, . . .}, von den Zahlentheo-
retikern mit N bezeichnet und natürlich“ genannt, weil sie von den Menschen, soweit
”
die Erinnerung reicht, zum Zählen benutzt wurden. Die Physiker denken dabei etwa an
Teilchenzahlen, z.B. die Zahl der Atome oder Moleküle in einem Mol.
Seit alters gibt es für die natürlichen Zahlen zwei verschiedene Verknüpfungen: die Addi-
tion und die Multiplikation, die je zwei natürlichen Zahlen a, b ∈ N ( die Zahlen a und b
”
sind Elemente aus der Menge N“) eine neue natürliche Zahl zuordnen, weshalb sie interne
Verknüpfungen genannt werden:
die Addition:
die Multiplikation:
14
Distributive Gesetz: (a + b)c = ac + bc
miteinander verbunden.
Einschub: Kurzschrift: Wenn man ausdrücken will, dass in der Menge der
natürlichen Zahlen (n ∈ N) nur genau ein (∃!) Einselement existiert, das für alle
(∀) natürlichen Zahlen a die Gleichung 1a = a erfüllt, könnte man das mit Hilfe
der logischen Zeichen folgendermaßen ausdrücken: ∃! 1 ∈ N : ∀a ∈ N 1a = a. Man
beachte die Kürze dieser kompakten logischen Schreibweise.
Einschub: Gegenbeispiele: Als Beispiel einer Verknüpfung, die aus der be-
trachteten Menge herausführt, werden wir bald das vielen von Ihnen bekannte Ska-
larprodukt zweier Vektoren behandeln, das aus deren Komponenten eine Zahl bildet.
Nichtkommutativ sind z.B. die Drehungen der im Bild 9.10 dargestellten Streich-
holzschachtel in einem kartesischen Koordinatensystem: Drehen Sie diese zuerst um
die der 1-Achse parallele Längsachse im Uhrzeigersinn und dann um die der 3-Achse
parallele kürzeste Querachse und vergleichen Sie das Resultat mit der Stellung der
Schachtel, nachdem die beiden Drehungen in umgekehrter Reihenfolge durchgeführt
wurden!
Gegenbeispiele für das Klammergesetz für drei Elemente einer Menge sind nur
schwer zu finden: Aus dem Bereich der Küchenchemie fielen uns die drei Zutaten
der fettlosen Kinderschlagsahne ein: (Zucker + Eiweiß) + Obstsaft = Kinderschlag-
sahne. Wenn Sie nach der Vorschrift Zucker + (Eiweiß + Obstsaft) zunächst ver-
suchen, das Eiweiß mit dem Obstsaft zu schlagen, werden Sie vergeblich auf steifen
Schaum warten.
Anschaulich kann man sich die natürlichen Zahlen als äquidistante Punkte auf einer Halb-
geraden vorstellen.
Für die Physiker ist es manchmal zweckmäßig, wie bei einem Maßstab die Null 0 hin-
zuzunehmen, also N zu N0 := N ∪ {0} ergänzen. Dadurch erhält auch die Addition ein
eindeutig bestimmtes
15
Neutrales Element: die Null: 0+a=a
Einschub: Null: Noch die alten Griechen und Römer kannten keine anderen
als die natürlichen Zahlen: N = {I, II, III, IV, . . .}. Die Chinesen kannten die Null
als Leerstelle schon im 4. Jahrhundert v. Ch. Erst im 12. Jahrhundert wurde sie
von den Arabern nach Europa gebracht.
Mit dem zivilisatorischen und kulturellen Fortschritt der Menschen mussten auch die
Zahlen erweitert werden. Z.B. reicht es, wenn man von Geld spricht, nicht aus, den Betrag
zu kennen (also die Zahl der Münzen), sondern man muss auch ausdrücken können, ob
man sie besitzt oder schuldet. Das wird heute durch die Farbe der Zahl ( rote Zahlen“)
”
oder durch ein Vorzeichen + oder − ausgedrückt. In den Naturwissenschaften haben sich
die Vorzeichen eingebürgert.
Der Physiker kann eine Markierung auf seinem Maßstab um eine beliebige Zahl von Punk-
ten nach rechts verschieben, stößt aber auf Schwierigkeiten beim Verschieben der Marke
nach links. Mathematisch formuliert: Nicht für alle natürlichen Zahlen a und b hat die
Gleichung a + x = b eine Lösung x, die auch eine natürliche Zahl ist: z.B. 2 + x = 1. Solche
Gleichungen kann man nur dann lösen, wenn man die natürlichen Zahlen durch Hinzu-
fügen der negativen Zahlen {−a| a ∈ N} zu den ganzen Zahlen ergänzt: Zu jedem
positiven Element a existiert genau ein
Die Mathematiker bezeichnen die Menge der ganzen Zahlen, die aus allen natürlichen
Zahlen a ∈ N, aus ihren negativen Partnern −a ∈ (−N) und der Null bestehen, mit
Z := N ∪ {0} ∪ {−a| a ∈ N}.
16
Mit dieser Erweiterung hat die obige Gleichung a + x = b wie gewünscht für alle Paare
von ganzen Zahlen immer eine Lösung, nämlich die Differenz x = b − a, die wieder eine
ganze Zahl ist x ∈ Z. Man sagt auch, Z sei abgeschlossen“ bezüglich der Addition: Die
”
Addition führt nicht aus der Menge heraus. Dies bringt uns zu einem zentralen Begriff
der Mathematik (und auch der Physik), dem der Gruppe :
Man bezeichnet eine Menge von Objekten (wie z.B. die ganzen Zahlen) als Gruppe, wenn
1. sie abgeschlossen ist bezüglich einer inneren Verknüpfung (wie z.B. der Addition),
2. ein Assoziatives Gesetz gilt (wie z.B.: a + (b + c) = (a + b) + c),
3. sie genau ein Neutrales Element besitzt (wie z.B. die 0) und
4. zu jedem Element genau eine Umkehrung existiert (wie z.B. das Negative).
Falls darüber hinaus auch noch das Kommutative Gesetz (wie z.B. a + b = b + a) gilt,
nennen die Mathematiker die Gruppe abelsch .
Einschub: Gruppen: Später werden Sie lernen, dass Gruppen in der Physik
bei der Suche nach Symmetrien eine wichtige Rolle spielen, z.B. bei Kristallen oder
bei der Klassifizierung der Elementarteilchen. Die Elemente der Gruppe sind dabei
Operationen, wie etwa Drehungen: Der Effekt von zwei hintereinander ausgeführten
Drehungen kann auch durch eine einzige Drehung erreicht werden. Bei der Aus-
führung dreier Drehungen hängt das Ergebnis nicht von der Klammerung ab. Die
Operation keine Drehung lässt den Körper unverändert. Jede Drehung lässt sich wie-
der rückgängig machen. Oft sind diese Gruppen nicht abelsch, z.B. zwei Drehungen,
in unterschiedlicher Reihenfolge ausgeführt, führen zu verschiedenen Ergebnissen.
Deshalb haben die Mathematiker das Kommutative Gesetz nicht zu den Gruppe-
neigenschaften dazugenommen, sondern nur durch das Adjektiv abelsch hinzugefügt
nach dem Mathematiker N. H. Abel (1802-1829).
Die ganzen Zahlen kann man sich als äquidistante Punkte auf einer ganzen Geraden
geometrisch vorstellen.
17
Einschub: Beträge: Wenn wir bei einer Zahl vom Vorzeichen absehen wollen,
verwenden wir den Begriff
so dass |a| ≥ 0 ∀a ∈ Z.
Zum Beispiel ist für die Zahl −5 : | − 5| = 5 und für die Zahl 3 : |3| = 3 = 3.
Es gilt die leicht nachvollziehbare Rechenregel für den Betrag eines Produkts:
|a · b| = |a| · |b|
Für den Betrag von Summe bzw. Differenz ganzer Zahlen gelten nur Ungleichungen,
auf die wir später noch zurückkommen werden:
Das Bild zeigt die ε-Umgebung der Zahl 1 für ε = 1/2. Sie enthält alle Zahlen x mit
0, 5 < x < 1, 5. Beachten Sie, dass die Ränder (hier 0,5 und 1,5) nicht zur Umgebung gerechnet
werden.
18
2.2.3 Rationale Zahlen
Beim Teilen haben die Menschen gemerkt, dass auch die ganzen Zahlen im Alltag nicht
ausreichen. Mathematisch gesprochen: Um auch die Gleichung a·x = b für a 6= 0 innerhalb
einer Zahlenmenge lösen zu können, müssen wir die ganzen Zahlen zu den rationalen
Zahlen Q erweitern, und zwar durch die Hinzunahme der inversen Zahlen { a1 oder a−1 |a ∈
Z}. Wir benutzen die Schreibweise Z \ {0} für die Menge der ganzen Zahlen ohne die Null.
Dann gibt es zu jeder von 0 verschiedenen ganzen Zahl a genau ein
Einschub: Klasse: Genau genommen wird eine rationale Zahl sogar immer
durch eine ganze Klasse von geordneten Paaren ganzer Zahlen dargestellt, z.B. sol-
len (1, 2) = (2, 4) = (3, 6) = (1a, 2a) für a ∈ Q und a 6= 0 als ein und dieselbe
Zahl gelten: 1/2 = 2/4 = 3/6 = 1a/2a : Kürzen soll die Zahl, wie wir wissen, nicht
ändern.
Ausdividiert werden die rationalen Zahlen dann zu endlichen, d.h. abbrechenden oder peri-
odischen Dezimalbrüchen: z.B. 15 = 0, 2 , 31 = 0, 3333333... = 0, 3 und 11
1
= 0, 09090909... =
0, 09, wobei der Strich über den letzten Ziffern die Periode andeutet.
Mit dieser Definition des Inversen bilden jetzt die rationalen Zahlen nicht nur bezüglich der
Addition, sondern auch bezüglich der Multiplikation eine Gruppe (mit Assoziativgesetz,
Eins und inversem Element), die wegen des Kommutativgesetzes der Faktoren: ab = ba
abelsch ist.
19
Die rationalen Zahlen liegen dicht auf unserer Zahlengeraden, d.h. in jedem Intervall kann
man abzählbar unendlich viele finden.
Wegen der endlichen Messgenauigkeit jeder physikalischen Messung sind die rationalen
Zahlen in jeder praktischen Hinsicht die Zahlen der Physik und auch jeder anderen
Naturwissenschaft. Deshalb haben wir uns ihre Rechenregeln so genau angesehen.
Bei der Angabe der Messergebnisse als rationale Zahlen, meist in Form von Dezimal-
brüchen, haben die Wissenschaftler weltweit vereinbart, nur so viele Stellen hinter dem
Komma anzugeben, wie gemessen sind. Zu jedem Messwert sollte jeweils auch die Unsi-
cherheit angegeben werden. So findet man z.B. für das Plancksche Wirkungsquantum in
einer Tabelle
~ = 1, 054 571 68(18) · 10−34 Js.
Diese Angabe lässt sich auch folgendermaßen schreiben
und bedeutet, dass der Wert von ~ (mit einer Wahrscheinlichkeit von 68 %) zwischen den
folgenden beiden Schranken liegt:
Aufgabe 2.1
a) Zeigen Sie mit dem für gerade m angedeuteten Gaußschen Rezept, dass die Formel für
m
n = m2 (m + 1) auch für ungerade m gilt.
P
die Summe der ersten m natürlichen Zahlen
n=1
b) Beweisen Sie die angegebene Formel für die Summe der ersten m Quadrate natürlicher
m m
n2 = m6 (m + 1)(2m + 1), indem Sie (n + 1)3 betrachten.
P P
Zahlen
n=1 n=1
c) Was bedeuten die beiden folgenden Angaben aus dem Particle properties data booklet“:
”
e = 1, 602 176 53(14) · 10−19 Cb und me = 9, 109 382 6(16) · 10−31 kg?
20
Einschub: Potenzen: Mehrfache Anwendung desselben Faktors beschreiben wir
wie gewohnt als Potenz mit der Anzahl der Faktoren als
gelten. Mit den Definitionen b0 := 1 und b−n := 1/bn lassen sich die Rechenvor-
schriften auf ganze Exponenten erweitern: n, m ∈ Z. Später werden wir noch weiter
verallgemeinern.
Als erste Anwendung der Potenzen erwähnen wir den Satz des Pythagoras. In ei-
nem rechtwinkligen Dreieck ist das Quadrat über der Hypotenuse c gleich der Summe
der Quadrate über den beiden Katheten a und b:
ONLINE bewegliches Bild 2.5 mit farbigen Parallelogrammen, aus denen der
geometrische Beweis ersichtlich ist.
die zwar leicht abgeleitet werden können, aber einfach auswendig gelernt werden sollten.
Die binomischen Formeln sind ein Spezialfall (für n = 2) des allgemeinen Ausdrucks
n
n
X n!
(a ± b) = an−k (±b)k ,
k=0
k!(n − k)!
n! n
worin k!(n−k)! =: k die sogenannten Binomialkoeffizienten sind. Sie lassen sich ent-
weder direkt aus der Definition der Fakultät berechnen, z.B.
5 5! 1·2·3·4·5
= = = 10
3 3!(5 − 3)! 1·2·3·1·2
oder im Pascalschen Dreieck konstruieren. Es wird folgendermaßen von oben her aufge-
baut:
n=0: 1
n=1: 1 1
n=2: 1 2 1
n=3: 1 3 3 1
n=4: 1 4 6 4 1
n=5: 1 5 10 10 5 1
n=6: 1 6 15 20 15 6 1
Man beginnt mit der Zahl 1 in der Zeile n = 0. In der nächsten Zeile (n = 1) werden
rechts und links zwei Einsen angeschrieben. Dann für n = 2 werden wieder rechts und
links zwei Einsen hinzugefügt und in der Lücke eine 2 = 1 + 1, als Summe des rechten und
linken Vordermanns“ (jeweils eine 1). In dem eingerahmten Kasten erkennt man noch
” 5
einmal das Bildungsgesetz: Den gesuchten Binomialkoeffizienten 3 findet man dann in
der Reihe n = 5 auf Position 3.
Aufgabe 2.2
a) Bestimmen Sie die Länge der Raumdiagonalen in einem Würfel der Kantenlänge a.
b) Berechnen Sie (a4 − b4 )/(a − b).
c) Berechnen Sie n0 und nn .
n n
e) Zeigen Sie, dass allgemein n−k = k
gilt.
n n n+1
f ) Beweisen Sie das Bildungsgesetz des Pascalschen Dreiecks: k−1
+ k
= k
.
22
2.2.4 Reelle Zahlen
Die Mathematiker haben sich mit den rationalen Zahlen allerdings nicht zufrieden gege-
ben, da z.B. eine so wichtige Zahl wie der Umfang π eines Kreises mit Durchmesser 1
keine rationale Zahl ist: π ∈ / Q. Sie wollten auch die
√ Lösungen der Gleichung x2 = a
wenigstens für a 6= 0, also die Wurzeln x = a1/2 =: a mit dabeihaben. Deshalb haben
sie die rationalen Zahlen durch Hinzunahme aller unendlichen Dezimalbrüche zu den re-
ellen Zahlen R erweitert, bei denen dann die Länge jedes Kurvenstücks dazugehört und
die umkehrbar eindeutig auf die Zahlengerade R1 abgebildet werden können (d.h. jedem
Punkt entspricht genau eine reelle Zahl und umgekehrt).
Mit den reellen Zahlen, für die genau dieselben Rechenregeln eines Körpers gelten wie für
die rationalen, werden die beiden Lösungen der allgemeinen
r
a a2
quadratischen Gleichung: x2 + ax + b = 0, x1,2 =− ± −b
2 4
dann reelle Zahlen, falls die Diskriminante unter der Wurzel nicht negativ ist: a2 ≥ 4b.
23
Einschub: Ausblick: Komplexe Zahlen: Später in Kapitel 8 werden wir
noch einen Schritt weiter in diese Richtung gehen und die komplexen Zahlen C
einführen, mit denen dann auch x2 = a für a < 0 und die allgemeine quadratische
Gleichung immer lösbar werden und überraschenderweise noch viele schöne andere
Sätze gelten.
24
Kapitel 3
Es sind weniger direkte Anwendungen der Folgen und Reihen selbst, die für die Natur-
wissenschaften wichtig sind, als die Tatsache, dass man an ihnen am einfachsten die Be-
griffe und Gesetze der Grenzprozesse genauer studieren kann, die auch für die Physik von
grundlegender Bedeutung sind. Deshalb haben wir in diesem Abschnitt das unter diesem
Gesichtspunkt Wichtigste zusammengestellt über dieses Gebiet der Mathematik, das Sie
später in der mathematischen Vorlesung über Analysis noch genauer und ausführlicher
behandeln werden.
3.1 Folgen
Der erste wichtige mathematische Begriff, mit dem wir uns beschäftigen müssen, ist der
einer Folge. Der Physiker denkt dabei etwa an die Folge der Sprunghöhen einer Stahl-
kugel auf einer Platte, die infolge der unvermeidlichen Energiedissipation mit der Zeit
monoton abnehmen und schließlich mehr oder weniger schnell gegen null streben. Nach
einiger Zeit bleibt die Kugel ruhig liegen. Die physikalische Folge der Sprunghöhen hat
also nur endlich viele nicht verschwindende Glieder im Gegensatz zu den Folgen, die in
der Mathematik interessieren: Mathematisch ist eine Folge eine unendliche Menge von
Zahlen, die durchnummeriert, d.h. eindeutig auf die Menge der natürlichen Zahlen abge-
bildet werden kann: (an )n∈N . Da man nicht alle unendlich vielen Glieder angeben kann
(a1 , a2 , a3 , a4 , a5 , a6 , . . .), definiert man eine Folge meist durch das allgemeine Glied“ an ,
”
d.h. das Bildungsgesetz, das angibt, wie man die Glieder berechnet. Wir wählen zunächst
einige charakteristische Musterbeispiele aus, an denen wir aber bereits alles Wichtige
erklären können:
25
(F1) 1, 2, 3, 4, 5, 6, 7, . . . = (n)n∈N die natürlichen Zahlen selbst,
(F2) 1, −1, 1, −1, 1, −1, . .. = ((−1)n+1 )n∈N eine einfache alternierende“ Folge,
”
(F3) 1, 21 , 13 , 41 , 15 , . . . = n1 n∈N die inversen natürlichen Zahlen,
die sogenannte harmonische“ Folge,
”
(F4) 1, 21 , 16 , 24 1
, . . . = n!1 n∈N
die inversen Fakultäten,
(F5) 21 , 32 , 34 , 45 , . . . = n+1n
n∈N
eine Folge von echten Brüchen und
(F6) q, q 2 , q 3 , q 4 , q 5 . . . = (q n )n∈N , q∈R eine geometrische“ Folge.
”
Einschub: Zinseszins: Die geometrische Folge kennen viele von Ihnen aus der
p
Schule, weil nach ihr mit q = 1 + 100 ein Kapital K0 bei p% Jahreszins nach n
n
Jahren auf Kn = K0 q angewachsen ist, wenn Zinseszins berechnet wird.
Um uns eine erste anschauliche Vorstellung von diesen Musterfolgen zu geben, sind in
einem ebenen kartesischen Koordinatensystem der folgenden graphischen Darstellungen
die Folgenglieder an (in 2-Richtung) über den äquidistanten natürlichen Zahlen n (in
1-Richtung) durch Punkte eingetragen.
Bilder 3.1: Veranschaulichung der Musterfolgen über den natürlichen Zahlen, bei der geo-
metrischen Folge (F6) für q = 2 bzw. q = 12 .
Auch die Summe, Differenz oder das Produkt zweier Folgen sind wieder eine Folge. Zum
n
Beispiel ist die Musterfolge (F5) mit an = n+1 = n+1−1
n+1
1
= 1 − n+1 die Differenz aus der
trivialen Folge (1)n∈N = 1, 1, 1, . . ., die aus lauter Einsen besteht, und der harmonischen
Folge (F3) ohne das erste Glied.
Das gliedweise Produkt der Musterfolgen (F2) und (F3) ergibt eine neue Folge
n+1
(F7) 1, − 12 , 13 , − 41 , ... = (−1)n die alternierende“ harmonische Folge.
n∈N ”
26
Auch das gliedweise Produkt der harmonische Folge (F3) mit sich selbst ist wieder eine
Folge:
(F8) 1, 14 , 19 , 16
1
, ... = n12 n∈N , die Folge der inversen natürlichen Quadrate.
Das gliedweise Produkt der Musterfolgen (F1) und (F6) ergibt eine neue Folge
(F9). q, 2q 2 , 3q 3 , 4q 4 , 5q 5 . . . = (nq n )n∈N , q ∈ R, eine abgeänderte geometrische Folge.
Eine noch kompliziertere zusammengesetzte Folge wird uns später noch beschäftigen:
(F10) 2, ( 23 )2 , ( 43 )3 , . . . = (1 + n1 )n n∈N , die sogenannte Exponentialfolge.
Aufgabe 3.1 Veranschaulichen Sie sich auch diese weiteren Beispiele durch graphi-
sche Darstellungen. Projizieren Sie die Punkte auf die 2-Achse.
Es sind drei Eigenschaften, die uns an den Folgen besonders interessieren: Beschränkt-
heit, Monotonie und Konvergenz:
3.2 Beschränkheit
Eine Folge heißt nach oben beschränkt, wenn es eine obere Schranke B für die Glieder
der Folge gibt: an ≤ B: also in Kurzschrift:
Nach unten beschränkt wird ganz analog mit der unteren Schranke A definiert:
∃A : A ≤ an ∀n ∈ N.
Z.B. ist unsere erste Musterfolge der natürlichen Zahlen (F1) nur nach unten etwa durch
1 beschränkt: A = 1. Die alternierende Folge F2 ist offensichtlich nach oben und unten
beschränkt, nämlich durch A = −1 bzw. B = 1. Für die harmonische Folge (F3) ist das
erste Glied, die 1, eine obere Schranke: B = 1 ≥ n1 ∀n ∈ N und die Null eine untere:
A = 0. Die Musterfolge der inversen Fakultäten (F4) hat die untere Schranke A = 0 und
die obere B = 1.
Aufgabe 3.2 Untersuchen Sie die anderen beiden Musterfolgen auf Beschränktheit.
27
3.3 Monotonie
Eine Folge heißt monoton steigend, wenn aufeinander folgende Glieder mit wachsender
Nummer immer größer werden: Zum Einprägen:
Falls sogar an < an+1 gilt, spricht man von streng monoton steigend.
Ganz analog wird monoton fallend mit an ≥ an+1 definiert.
Z.B. ist die Folge der natürlichen Zahlen (F1) streng monoton steigend, die alternierende
Folge (F2) nicht monoton und die harmonische Folge (F3) sowie die Folge der inversen
Fakultäten (F4) streng monoton fallend.
3.4 Konvergenz
Nun folgt der Kernpunkt dieses ganzen Kapitels: Wie Sie aus der Projektion der Darstel-
lungspunkte auf die 2-Achse gesehen haben, gibt es Zahlenfolgen, deren Glieder an sich
auf der Zahlengeraden um eine Zahl a herum häufen, so dass unendlich viele Folgenglieder
in jeder ε-Umgebung Uε (a) dieser Zahl a liegen, die übrigens nicht unbedingt selbst ein
Glied der Folge zu sein braucht. Man nennt a in einem solchen Fall einen Häufungspunkt
der Folge.
Von unseren Beispielen hat die Folge der natürlichen Zahlen (F1) keinen und die harmo-
nische Folge (F3) einen Häufungspunkt, und zwar bei null. Die alternierende Folge (F2)
hat sogar zwei Häufungspunkte: einen bei +1 und einen bei −1.
Der Satz von Bolzano und Weierstraß garantiert uns, dass jede nach oben und unten
beschränkte Folge mindestens einen Häufungspunkt haben muss.
Falls eine Folge nur einen einzigen Häufungspunkt besitzt, kann es vorkommen, dass alle
Folgenglieder ab einer bestimmten Nummer in der Umgebung dieses Punktes liegen. Man
nennt diesen Punkt dann den Grenzwert der Folge, und dieser Fall erweist sich als
zentraler Begriff der Analysis: Die Mathematiker haben deshalb mehrere Bezeichnungen
dafür. Sie sagen auch, die Folge hat einen Limes oder die Folge ist konvergent gegen a
n→∞
und schreiben: lim an = a, manchmal lässiger: an −→ a.
n→∞
28
(an )n∈N konvergent: ∃a : lim an = a
n→∞
⇐⇒ ∀ε > 0 ∃N (ε) ∈ N : |an − a| < ε ∀n > N (ε).
Mit dem letzten Stenogramm ist gemeint: für jede vorgegebene auch noch so kleine positive
Zahl ε kann man eine Nummer N (ε) angeben, so dass der Abstand vom Häufungspunkt a
für alle Folgenglieder mit einer größeren Nummer als N (ε) kleiner ist als das vorgegebene
kleine ε.
Bei manchen Folgen erkennt man die Konvergenz oder sogar den Grenzwert nach einiger
Übung mit bloßem Auge, aber manchmal ist es gar nicht so einfach, festzustellen, ob eine
Folge konvergent ist. Deshalb ist der folgende Satz sehr erwünscht, der uns mit Hilfe des
Satzes von Bolzano und Weierstraß zeigt, wann man ganz allgemein auf die Konvergenz
einer Folge schließen kann:
In all den Fällen, bei denen man den Grenzwert nicht kennt oder nicht leicht herausfinden
kann, hilft den Mathematikern oft auch das notwendige (⇐) und hinreichende (⇒)
d.h. eine Folge konvergiert genau dann, wenn die Abstände zwischen den Gliedern der
Folge ab einer bestimmten Nummer immer kleiner werden, die entsprechenden Punkte
auf der Zahlengeraden also immer näher zusammenrücken; wenn das nicht der Fall ist,
dann divergiert sie. Außerdem kann man zeigen, dass jede Teilfolge einer konvergenten
Folge und die Summe und Differenz, sowie das Produkt und, falls der Nenner ungleich
0 ist, auch der Quotient zweier konvergenten Folgen wieder konvergent sind, d.h. der
Grenzwert ist mit den rationalen Rechenoperationen vertauschbar.
Viele konvergente Folgen haben die Null als Häufungspunkt, man nennt sie Nullfolgen.
1
Die harmonische Folge (F3) mit an = n
ist z.B. eine Nullfolge.
29
Einschub: Konvergenzbeweise: Am Beispiel der harmonischen Folge wollen
wir alle Konvergenzkriterien ausprobieren:
1. Am leichtesten prüft man den Satz von Bolzano und Weierstraß: Die harmoni-
sche Folge (F3) ( n1 )n∈N fällt monoton und ist nach unten beschränkt 0 < n1 , also
konvergiert sie.
2. Der Häufungspunkt liegt offensichtlich bei a = 0 : Wir geben ein ε > 0 willkürlich
1
vor, z.B.ε = 1000 , und suchen die Nummer N (ε), so dass |an − a| = | n1 − 0| = | n1 | =
1
n < ε für n > N (ε). Das ist aber sicher der Fall, wenn wir N (ε) als die nächst
größere natürliche Zahl größer als 1ε wählen: N (ε) > 1ε , z.B. bei ε = 0, 001, also
N (ε) = 1001. Dann gilt für alle n > N (ε) : n1 < N1(ε) < ε.
3. Endlich ist auch das Cauchy-Kriterium hier leicht nachzurechnen: Sei ein ε > 0
vorgegeben, so folgt für den Abstand zweier Glieder an und am mit n < m :
1
|an − am | = | n1 − m | = | m−n m 1 1
nm | < | nm | = n < ε, falls n > N (ε) = ε .
a) Untersuchen Sie die anderen drei Musterfolgen (F4), (F5) und (F6) auf Konvergenz.
b) Berechnen Sie, damit Sie vorsichtig werden, die ersten zehn Glieder der Folge an =
n · 0, 9n , dem Produkt aus (F1) mit (F6) für q = 0, 9, und vergleichen Sie mit a60 , sowie
1
von an = 10n!n , dem Quotienten aus (F6) für q = 10 und (F4), und vergleichen Sie mit a60 .
c) Die Folge, die abwechselnd aus Gliedern von (F1) und (F3) besteht: d.h. a2n+1 = n und
a2n = n1 hat nur einen einzigen Häufungspunkt, nämlich 0. Konvergiert sie gegen 0?
3.5 Reihen
Nachdem wir die Grenzwerte von Zahlenfolgen studiert haben, können wir unser neu
erworbenes Wissen sogleich auf häufiger in der Physik vorkommende nützlichere Objekte
P∞
anwenden, wie etwa unendliche Summen s = an , die Reihen genannt werden:
n=1
Diese werden schon hin und wieder bei interessanteren physikalischen Fragestellungen
gebraucht: Wenn wir z.B. die elektrostatische Energie einer Kette von unendlich vielen
äquidistanten abwechselnd positiven und negativen Punktladungen für ein Kettenglied
aufsummieren wollen (die ein einfaches, aber erstaunlich gutes eindimensionales Modell
für einen Ionenkristall darstellt), stoßen wir auf die unendliche Summe über die Glieder
30
∞
P (−1)n+1
der alternierenden harmonischen Folge (F7): die Reihe n
. Wie rechnet man das
n=1
aus?
Reihen sind Folgen, deren Glieder endliche Summen reeller Zahlen sind: Die Definition
der
∞
m
P P
Reihe an als Folge der Teilsummen sm = an
n=1 n=1 m∈N
führt die Reihen auf die Folgen zurück, die wir oben gerade behandelt haben.
Insbesondere ist eine Reihe genau dann konvergent und hat den Wert s, wenn die Folge
ihrer Teilsummen sm (nicht etwa die ihrer Summanden an !!) konvergiert: lim sm = s:
m→∞
m
P m
P
Reihe sm = an konvergent ⇐⇒ lim an = s < ∞.
n=1 m→∞ n=1
Auch das Vielfache einer konvergenten Reihe und die Summe und Differenz von zwei
konvergenten Reihen sind wieder konvergent.
Die wenigen Musterbeispiele für Reihen, die nötig sind, um das Wichtigste bereits
sehen zu können, gewinnen wir am einfachsten durch stückweises Aufsummieren unserer
Musterfolgen:
(R1)
Die Reihe
aus den Teilsummen der Folge (F1) der natürlichen Zahlen:
m
P
sm = n = 1, 3, 6, 10, 15, . . . ist klarerweise divergent.
n=1 m∈N
(R2) Die Reihe aus den Gliedern der alternierenden Folge (F2) hüpft immer zwischen 1
und 0 hin und her, hat also zwei Häufungspunkte und folglich keinen Grenzwert.
(R3) Auch die aus den Gliedern der
harmonischen Folge (F3) aufsummierte harmonische
m ”
1 3 11 25 137
P
Reihe“, d.h. die Folge sm = n
= 1, 2 , 6 , 12 , 60 , . . . ist divergent. Denn
n=1 m∈N
das (auch notwendige) Cauchy-Kriterium ist nicht erfüllt: Wenn wir z.B. ε = 41 > 0
wählen und für n = 2m ein aus m Gliedern bestehendes Stück der Reihe betrachten:
2m 1 1 1
1 1 1 1
= 12 > ε = 41 ,
P
|s2m − sm | = n
= m+1 + m+2 + . . . + 2m > + + ... +
n=m+1 2m
| 2m {z 2m }
mSummanden
während zur Konvergenz doch < ε erforderlich gewesen wäre.
31
(R7) Deren alternierende Variante, gebildet aus der Folge (F7) unser physikalisches Bei-
∞
P (−1)n+1
spiel von oben, konvergiert jedoch n
(= ln 2, wie wir später zeigen werden).
n=1
Wegen dieses Unterschieds zwischen Reihen mit positiven Gliedern und alternierenden ist
es zweckmäßig, einen neuen Begriff einzuführen:
Eine Reihe heißt absolut konvergent, wenn bereits die Reihe der Beträge konvergiert.
m
P m
P
Reihe sm = an absolut konvergent ⇐⇒ lim |an | < ∞.
n=1 m→∞ n=1
Man kann leicht verstehen, dass bei einer absolut konvergenten Reihe die Summanden
ohne Schaden für den Grenzwert umgeordnet werden können. Zwei absolut konvergente
Reihen können gliedweise zu einer neuen absolut konvergenten Reihe multipliziert werden.
Für die absolute Konvergenz haben die Mathematiker verschiedene hinreichende Kriterien,
die sogenannten Majoranten-Kriterien entwickelt, mit denen Sie sich in der Vorlesung über
Analysis noch ausführlich beschäftigen werden.
m
P m
P m
P
|sm | = | an | ≤ |an | ≤ M n = Sm .
n=1 n=1 n=1
32
Einschub: Quotienten-Kriterium: Wir geben hier als Beispiel für ein Majoranten-
Kriterium nur das Quotienten-Kriterium, das man durch Vergleich mit der geo-
metrischen Reihe erhält:
m
Falls lim | an+1
P
n→∞ an | < 1, ist sm = an absolut konvergent.
n=1
∞
nq n für
P
Als Beispiel beweisen wir die absolute Konvergenz der Reihe (R9)
n=0
|q| < 1, die man aus der für |q| < 1 konvergenten geometrischen Reihe (R6) durch
gliedweise Multiplikation mit der divergenten Folge (F1) der natürlichen Zahlen er-
hält, und berechnen dazu
(n + 1)q n+1
an+1
lim
= lim
= |q| lim n + 1 = |q| < 1.
n→∞ an n→∞ nq n n→∞ n
dass das Kriterium nicht notwendig ist, sieht man an der Reihe (R8), die aus der
Aufsummation der Musterfolge (F8) hervorgeht:
∞ 2
1
= π6 , die absolut konvergent ist, weil alle Glieder positiv sind, bei der aber
P
n2
n=1
2
lim n 2 = lim 1
−1 2 = 1.
n→∞ (n+1) n→∞ (1+n )
∞
1
P
(R4) Die Reihe der inversen natürlichen Fakultäten n!
wollen wir genauer betrachten:
n=1
m
1
P
Wir sehen zunächst, dass die Folge der Teilsummen sm = n!
monoton steigt:
n=1 m∈N
+1
sm+1 − sm = (m+1)! > 0. Zur Berechnung der oberen Schranke B schätzen wir durch die
majorante geometrische Summe mit q = 12 ab:
1 1 1
|sm | = 1 + + + ... +
2! 3! m!
1 1 1
< 1 + + 2 + . . . + m−1
2 2 2
m−1
X 1
= ( )n
n=0
2
1 − ( 12 )m
=
1 − 12
1
< = 2.
1 − 21
33
Da die monoton steigende Folge der Teilsummen sm also durch B = 2 nach oben be-
schränkt ist, garantiert uns der Satz von Bolzano und Weierstraß die Konvergenz. Nur
den Grenzwert kennen wir noch nicht. Dieser Grenzwert ist nun tatsächlich etwas völlig
Neues, eine irrationale Zahl. Wir nennen sie = e − 1, sodass die Zahl e nach der ergänzen-
den Konvention 0! = 1 folgendermaßen durch die mit n = 0 beginnende Reihe definiert
wird:
∞
P 1
Exponential-Reihe definiert durch: e := n!
.
n=o
Einschub: e irrational: dass diese so definierte Zahl e irrational ist, d.h. nicht
als Quotient zweier ganzen Zahlen g und h dargestellt werden kann, sehen wir in-
direkt:
Falls e = hg wäre mit ganzen Zahlen g und h ≥ 2, müßte h!e = (h − 1)!g ganzzahlig
sein:
Nach Definition ist aber
∞ h ∞
X 1 X h! X h!
(h − 1)!g = h!e = h! = +
n! n! n!
n=0 n=0 n=h+1
h! h!
= h! + h! + + + ... + 1 +
2! 3!
1 1 1
+ lim + + ... + .
n→∞ h + 1 (h + 1)(h + 2) (h + 1)(h + 2) . . . (h + n)
Während der erste Term ganzzahlig ist, kann dies aber für den zweiten nicht zutref-
fen, denn
1 1 1
+ + ... + = ...
h+1 (h + 1)(h + 2) (h + 1)(h + 2) . . . (h + n)
1 1 1
= 1+ + ... + ,
h+1 h+2 (h + 2) . . . (h + n)
1
abgeschätzt durch die geometrische Reihe mit q = 2 :
1 − ( 12 )n
1 1 1 1
< 1 + + . . . + n−1 = ·
h+1 2 2 h + 1 1 − ( 12 )
1 1 2
< · = ≤ 2/3,
h + 1 1 − ( 12 ) h+1
34
Zur Bestimmung des numerischen Wertes von e rechnen wir uns die Glieder der
Nullfolge (F4) an = n!1 einmal aus:
1
a1 = 1!
= 1, a2 = 2!1 = 21 = 0, 50, a3 = 1
3!
= 1
6
= 0, 1666,
1 1 1 1
a4 = 4!
= 24 = 0, 041 666, a5 = 5!
= 120
= 0, 008 33,
1 1 1 1
a6 = 6!
= 720 = 0, 001 388, a7 = 7!
= 5 040
= 0, 000 198,
1
a8 = 8!
= 40 1320 = 0, 000 024, a9 = 1
9!
= 1
362 880
= 0, 000 002, . . .
m
1 1 1 1 1
P
und summieren die Teilsummen: sm = n!
=1+ 2!
+ 3!
+ 4!
+ ... + m!
n=1
Einschub: Folge gegen e: Neben dieser Exponential-Reihe, die wir zur Defini-
tion von e verwendet haben, gibt es wie erwähnt noch eine Folge, die gegen die Zahl
e konvergiert, die Exponential-Folge(F10):
(1 + n1 )n n∈N = 2, ( 32 )2 , ( 43 )3 , . . . , der wir uns zum Vergleich noch kurz zuwenden
wollen:
Nach der binomischen Formel erhalten wir zunächst für das allgemeine Glied dieser
Folge:
n
1 n X n!
an = (1 + ) =
n (n − k)!k!nk
k=0
n n(n − 1) n(n − 1)(n − 2) n(n − 1)(n − 2) . . . (n − (k − 1))
= 1+ + + + ... + +
n n2 2! n3 3! nk k!
n!
... + n
n n!
(1 − n1 ) (1 − n1 )(1 − n2 ) (1 − n1 )(1 − n2 ) . . . (1 − k−1
n )
= 1+1+ + + ... + + ...
2! 3! k!
(1 − n1 )(1 − n2 ) . . . (1 − n−1
n )
+
n!
Einerseits vergrößern wir nun diesen Ausdruck für an , indem wir in den Klam-
mern keine Vielfachen von n1 mehr abziehen:
1 1 1
an ≤ 1 + 1 + + + ... + = 1 + sn
2! 3! n!
35
und erhalten so bis auf die Eins die entsprechende Teilsumme der Exponential-
Reihe sn . Damit ist die Exponential-Reihe eine Majorante für die ebenfalls monoton
steigenden Exponential-Folge und deren Konvergenz durch die der Reihe gesichert:
Für den Grenzwert erhalten wir
lim an ≤ e.
n→∞
Andererseits verkleinern wir den obigen Ausdruck für an , indem wir von den
durchweg positiven Summanden nur (k + 1) Stück mitnehmen und die letzten weg-
lassen:
(k−1)
(1 − n1 ) (1 − n1 )(1 − n2 ) (1 − n1 )(1 − n2 ) . . . (1 − n )
an ≥ 1 + 1 + + + ... + .
2! 3! k!
Wenn wir jetzt zunächst die größere der natürlichen Zahlen n, über alle Grenzen
wachsen lassen, erhalten wir:
1 1 1
a := lim an ≥ 1 + 1 + + + ... + = 1 + sk
n→∞ 2! 3! k!
und, nachdem auch die kleinere natürliche Zahl k über alle Grenzen gewachsen ist:
a ≥ e.
Folglich muss der Grenzwert a := lim an der Exponential-Folge an gleich der durch
n→∞
die Exponential-Reihe definierten Zahl e sein:
∞
lim (1 + n1 )n = 1
P
n! = e.
n→∞ n=0
Wenn Sie sich allerdings die Glieder der Folge ausrechnen und mit den Teilsum-
men der Reihe vergleichen, werden Sie feststellen, dass die Folge viel langsamer
konvergiert als die Reihe.
Damit haben wir einen ersten Überblick über die Grenzprozesse gewonnen und einige für
die Naturwissenschaften wichtige Folgen und Reihen mit ihren Grenzwerten kennenge-
lernt, die uns im Folgenden helfen werden.
36
Kapitel 4
FUNKTIONEN
Bild 4.1: Funktion als schwarzer Kasten mit x als In- und y als Output
Die Physiker denken dabei z.B. an einen elektrischen Stromkreis, bei dem die angelegte
Spannung an einem Potentiometer schrittweise verändert und mit einem Drehspulgalva-
nometer die jeweilige Stromstärke gemessen wird, um die Kennlinie zu erforschen. Aber
auch der zeitliche Verlauf des Ausschlags eines Pendels oder die radioaktiv zerfallende
Stoffmenge als Funktion der Zerfallszeit sind weitere aus der Vielzahl von physikalischen
Beispielen.
37
Das Resultat einer solchen Messreihe ist zunächst eine Wertetabelle (x, y). Die Daten kön-
nen auch in einer graphischen Darstellung veranschaulicht werden, wie unten im Bild an
Beispielen gezeigt. Die Veranschaulichung der Funktionen als Schaubild, von uns meist
Graph genannt, durch Eintragen der Wertetabelle in ein ebenes kartesisches (d.h. recht-
winkliges) Koordinatensystem mit der Abszisse x auf der 1-Achse und der Ordinate y
auf der 2-Achse ist für die Physiker selbstverständlich.
In den folgenden Abbildungen finden Sie Beispiele für Wertetabellen, graphische Darstel-
lungen und interpolierende Funktionen für eine schwingende Spiralfeder:
x F
cm mN
1 −0, 42
1, 5 −0, 55
2 −0, 82
2, 5 −1, 03
3 −1, 25
3, 5 −1, 45
4 −1, 65
4, 5 −1, 80
5 −1, 95
5, 5 −2, 20
6 −2, 35
6, 6 −2, 60
Bild 4.2 a: Rücktreibende Kraft F der Feder gemessen in mN in Abhängigkeit von der
Auslenkung in cm.
x E
cm mJ
1 0, 6
1, 5 1, 0
2, 5 2, 8
2, 9 3, 9
3, 1 4, 8
3, 5 6, 1
38
t x
cs cm
0, 3 3, 5
0, 5 2, 8
0, 7 1, 2
1, 1 −1, 8
1, 7 −3, 2
2, 4 −0, 8
2, 6 1, 5
3, 2 2, 4
3, 6 1, 4
4, 3 −1, 1
4, 8 −1, 8
Bild 4.2 c: Auslenkung der Spiralfeder x gemessen in cm in Abhängigkeit von der Zeit t
in s.
M T
g s
2, 5 0, 75
10 1, 63
14 1, 91
20 2, 23
25 2, 46
Bild 4.2 d: Schwingungsdauer der Spiralfeder T in s als Funktion der Masse M in g bei
unveränderter Federkonstante D.
D T
N m−1 s
3 3, 25
4 2, 72
5 2, 16
7 1, 75
8 1, 71
10 1, 59
39
man daran gehen, die Messwerte durch eine Kurve zu verbinden bzw. eine mathematische
Rechenvorschrift, d.h. Funktion zu suchen, die die Abhängigkeit der beiden Größen
beschreibt. Gelingt es, eine solche Funktion zu finden, hat das viele Vorteile: Eine mathe-
matische Formel ist meist kurz und übersichtlich; sie kann viel leichter als umfangreiche
Wertetabellen gestapelt, weiterverarbeitet und anderen Interessenten mitgeteilt werden.
Mit ihrer Hilfe kann auch genauer zwischen den Messwerten interpoliert und über den
untersuchten Bereich hinaus extrapoliert werden, was wieder neue Experimente anregt.
Schließlich ist sie der erste Schritt zu einer Theorie und damit zum Verständnis des Ex-
periments.
Wir müssen uns also aus physikalischen Gründen mit Funktionen befassen, und zwar
zunächst mit reellen Funktionen einer reellen Variablen.
Mathematisch kann eine Funktion y = f (x) betrachtet werden als eindeutige Abbildung
x → f (x) eines Punktes x aus einem Bereich Df , dem Definitionsbereich“ von f , der
”
unabhängigen Variablen x (auch Abszisse oder Argument genannt) auf einen Punkt f (x)
aus dem Bereich Wf , dem Wertevorrat“ von f , der abhängigen Variablen y (auch Ordinate
”
oder Funktionswert genannt).
Während die Angabe des Definitionsbereichs neben der Abbildungsvorschrift für eine
Funktion unbedingt erforderlich ist und oft über die Eigenschaften der Funktion entschei-
det, ist die genaue Angabe des Wertevorrats Wf := {f (x)|x ∈ Df } meist von geringerer
Wichtigkeit und erfordert manchmal einige Mühe.
40
Die Urbildmenge Df ist meist ebenso wie die Bildmenge Wf ein Stück der reellen Zah-
lengeraden R1 . Die ausdrücklich in die Definition der reellen Funktionen mit einbezogene
Eindeutigkeit bedeutet, dass es zu jedem x ein und nur ein y = f (x) gibt. Es ist aller-
dings ohne weiteres möglich, dass zwei verschiedene Urbildpunkte in ein und denselben
Bildpunkt abgebildet werden. In mathematischer Kurzschrift zusammengefaßt:
Das Rechnen mit reellen Funktionen einer reellen Variablen erfolgt nach den Re-
geln des Körpers R mit den beiden Kommutativen und Assoziativen Gesetzen sowie dem
verbindenden Distributivgesetz, die wir im Kapitel 2 bei den Zahlen zusammengestellt ha-
ben: Z.B. ergibt die Summe bzw. Differenz zweier reeller Funktionen f1 (x) ± f2 (x) = (f1 ±
f2 )(x) =: g(x) eine neue reelle Funktion, das reelle Vielfache r · f (x) = (r · f )(x) =: g(x)
mit r ∈ R ebenfalls und analog das Produkt f1 (x) · f2 (x) = (f1 · f2 )(x) =: g(x) oder, falls
f2 (x) 6= 0 im Definitionsbereich, auch der Quotient ff12 (x)
(x)
= ff12 (x) =: g(x).
4.2 Funktionen-Grundausstattung
Es ist erstaunlich, dass man im physikalischen Alltag mit einer Grundausstattung aus
wenigen Funktionen auskommt, die Ihnen zudem meist noch aus der Schule bekannt sind.
Wir führen diese Grundfunktionen hier als Beispiele ein, besprechen dann einige ihrer
Eigenschaften und werden immer wieder auf sie zurückkommen.
Wir beginnen mit der konstanten Funktion y = c, unabhängig von x. Danach kommen
wir zu den linearen Funktionen y = s · x + c mit dem Graph einer Geraden der Steigung
s und dem Ordinatenabschnitt c. Es folgt die Normal-Parabel y = x2 und die höheren
Potenzen y = xn mit n ∈ N. Auch die Normal-Hyperbel y = x1 = x−1 und y = x12 sind
Ihnen sicher schon begegnet.
Gerade und Parabel sind z.B. über der ganzen reellen Gerade definiert: Df = R. Bei der
Hyperbel muß der Nullpunkt ausgenommen werden: Df = R\{0}. Auch beim Wertevorrat
der Hyperbel fehlt der Nullpunkt: Wf = R \ {0}. Bei der Parabel ist der Wertevorrat nur
die positive Halbgerade einschließlich der Null: y ≥ 0. Das folgende Bild zeigt die Graphen
dieser einfachen Beispiele:
41
Bild 4.4: Graphen einfacher Funktionen
Nach den Rechenregeln des Körpers der reellen Zahlen R erhalten wir aus der Geraden
und der Normal-Parabel y = x2 alle Funktionen zweiten Grades y = ax2 + bx + c sowie
weiter alle Polynomfunktionen höheren, z.B. m−ten Grades
m
X
2 m
y = Pm (x) = a0 + a1 x + a2 x + . . . + am x = ak x k .
k=0
42
Aufgabe 4.1 Graphen, Definitionsbereiche und Wertevorräte
Geben Sie die Graphen und maximalen Definitionsbereiche der folgenden Funktionen an
und wenn möglich auch die Wertevorräte:
a) f (x) = −2x − 2; b) f (x) = 2 − 2x2 ; c) f (x) = x2 − 2x − 3; d) f (x) = 31 x3 − 3;
1
e) f (x) = x4 − 4; f ) f (x) = 1−x ; g) f (x) = 2x−3
x−1
; h) f (x) = x21−1 ;
1 2
i) f (x) = (x−1)2; j) f (x) = xx+2
2 −4 ; k) f (x) = xx−2+5
.
Dabei malt uns die Patrone y = sin φ den Sinus“ als Funktion des Winkels φ auf das Blatt,
”
die Länge der Gegenkathete“ des Winkels φ im eingezeichneten rechtwinkligen Dreieck
”
mit dem Radius der Länge 1 als Hypothenuse oder anders ausgedrückt: die Projektion
des umlaufenden Zeigers auf die 2-Achse.
Offensichtlich ergibt diese Konstruktionsvorschrift eine periodische Funktion, d.h. in
Abständen der unabhängigen Variablen von 2π nimmt die abhängige Variable den gleichen
Wert an: sin(x + 2π) = sin x, allgemein:
Aus der Sinus-Funktion kann man durch einfache Operationen andere trigonometrische
Funktionen bilden, die wegen ihrer Wichtigkeit eigene Namen bekommen haben:
Die Cosinus-Funktion“ y = cos x erhalten wir analog wie die Sinus-Funktion als Länge
” ”
der Ankathete“ des Winkels x im eingezeichneten rechtwinkligen Dreieck oder als Projek-
tion des umlaufenden Zeigers auf die 1-Achse. Der fundamentale Zusammenhang
43
cos2 x + sin2 x = 1
folgt mit dem Satz des Pythagoras unmittelbar aus dem im Bild markierten Dreieck.
Die Tintenpatrone hätte uns offensichtlich sofort den Cosinus gemalt, wenn wir mit dem
Winkel π2 statt 0 begonnen hätten:
cos x = sin(x + π2 ).
Die Cosinusfunktion ist also eine um die Phase“ π2 nach links verschobene Sinusfunktion.
”
Auch der Cosinus ist periodisch mit der Periode 2π : cos(x + 2π) = cos x.
Aus Sinus und Cosinus erhält man durch Division zwei weitere wichtige trigonometrische
Funktionen: den
sin x
Tangens: y = tan x = cos x
und den
cos x 1
Cotangens: y = cot x = sin x
= tan x
.
44
Bild 4.7: Tangens und Cotangens
Tangens und Cotangens sind periodisch mit der Periode π : tan(x + π) = tan x.
Wir werden im Kapitel 6 lernen, wie man den Funktionswert auch der trigonometrischen
Funktionen, z.B. von y = sin x, zu jedem Wert der Variablen x durch elementare Rechen-
operationen wie Addition und Multiplikation berechnen kann.
Ganz wichtig sind neben der Pythagoras-Relation cos2 x + sin2 x = 1 die
Trigonometrischen Additionstheoreme:
die wir Ihnen erfahrungsgemäß in Erinnerung rufen müssen und zum Auswendiglernen
empfehlen. Wir werden sie im Kapitel 8 auf sehr viel elegantere Weise als in der Schule
herleiten.
45
Aufgabe 4.2 Trigonometrische Funktionen:
Skizzieren Sie die Graphen und Definitionsbereiche von folgenden Funktionen und außer
beim letzten Beispiel auch die Wertevorräte:
a) y = 1 + sin x, b) y = sin x + cos x, c) y = sin x − cos x, d) y = x + sin x,
e) y = x sin x, f ) y = sin1 x , g) y = tan1 x und h) y = sinx x .
4.2.3 Exponentialfunktionen
Beim Potenzieren bn haben wir zunächst nur natürliche Zahlen n ∈ N als Exponenten
eingeführt, die angeben, wie oft eine reelle Basiszahl b als Faktor vorkommt:
bn := b · b · b · . . . · b bei n Faktoren b
Von zentraler Wichtigkeit für alle Naturwissenschaften ist dabei die natürliche Expo-
nentialfunktion mit der Zahl e als Basis
y = ex =: exp x,
46
deren Graph mit seinem charakteristischen rasanten Anwachsen in folgendem Bild direkt
gemessen werden kann:
Für die Physiker ist auch die inverse Funktion y = e1x = e−x von großer Bedeutung für alle
Dämpfungs- und Zerfallsprozesse. Auch sie ist der Messung direkt zugänglich, z.B. beim
radioaktiven Zerfall, bei dem die jeweils noch vorhandene Menge den Zerfall bestimmt:
t
N (t) = N (0)e− T , wobei N (t) die Zahl der Kerne zur Zeit t ist und T die Abklingzeit.
Auch für die Exponentialfunktionen werden wir im Kapitel 6 eine Methode kennenlernen,
die es uns ermöglicht, den Funktionswert y = ex zu jedem Wert der Variablen x durch
elementare Rechenoperationen wie Addition und Multiplikation bis zu jeder gewünschten
Genauigkeit auszurechnen.
Folgende Kombinationen der beiden natürlichen Exponentialfunktionen haben ihrer Wich-
tigkeit wegen besondere Namen erhalten, die wir erst später richtig verstehen werden: Der
x −x
Cosinus hyperbolicus: y = cosh x := e +2 e ,
auch Kettenlinie genannt, weil eine Kette im Schwerefeld der Erde nach diesem Funkti-
onsverlauf zwischen ihren Aufhängepunkten durchhängt, und der
47
x −x
Sinus hyperbolicus: y = sinh x := e −2 e ,
cosh2 x − sinh2 x = 1.
Dazu kommen analog den trigonometrischen Funktionen noch der Quotient der beiden,
der
x −x
Tangens hyperbolicus: y = tanh x := sinh x = ex − e−x
cosh x e +e
und der
Cotangens hyperbolicus: y = coth x := 1 = ex + e−x .
tanh x ex − e−x
Das folgende Bild zeigt die Graphen dieser Funktionen, die unter der Bezeichnung hy-
perbolische Funktionen zusammengefaßt werden.
48
Einschub: Bezeichnung: Die Bezeichnung der Hyperbel-Funktionen ist in der
Literatur nicht einheitlich: Es gibt auch die Kurzformen: ch x = cosh x, sh x =
sinh x und th x = tanh x.
Bild 4.11: Rechter Ast der Einheitshyperbel mit cosh x und sinh x
49
1
g) das Reziproke der Kettenlinie y = cosh x
und
h) die Bose-Einstein-Verteilungsfunktion der Quantenstatistik y = ex1−1 oder
i) die entsprechende Fermi-Dirac-Verteilungsfunktion für Teilchen mit halbzahligem Spin
wie z.B. die Leitungselektronen y = ex1+1 ,
j) die Plancksche Strahlungsformel für die spektrale Intensitätsverteilung der Frequenzen
3
eines Hohlraumstrahlers y = exx−1 .
Online können Sie Ihre Skizzen mit dem Funktionenschaufenster oder z.B. graph.tk oder
www.wolframalpha.com kontrollieren.
Außer diesen Beispielfunktionen benützen die Physiker häufig noch einige Funktionen,
deren Graphen Ecken (oder Knicke) bzw. Sprünge (oder Treppen) aufweisen. Unter diesen
sind uns zwei besonders wichtig:
Die eine ist die
x für x ≥ 0
Betragsfunktion: y = |x| :=
−x für x < 0
Sie ist über der ganzen Zahlengeraden definiert, wie bei der Normalparabel umfaßt ihr
Wertebereich aber nur die nichtnegative Halbgerade: y ≥ 0. Das nächste Bild zeigt ihren
Graph mit der Ecke“ bei x = 0.
”
50
Aufgabe 4.4 Betragsfunktionen:
Skizzieren Sie die Graphen und Wertevorräte folgender Funktionen:
1
a) y = 1 − | xa |, b) y = x + |x|, c) y = |x| und d) y = |x| cos x.
Die andere ist eine Funktion, die Ihnen vermutlich bisher noch nicht begegnet ist: die
Heavisidesche Stufenfunktion y = θ(x), definiert durch
Heavisidesche Stufenfunktion
Das Bild zeigt ihren Graph mit der charakteristischen zweiteiligen Stufe bei x = 0.
51
Das Rechnen mit der θ-Funktion erfordert etwas Übung, die wir uns im folgenden ver-
schaffen wollen:
Wir stellen zunächst fest, dass
θ(ax) = θ(x),
falls das Argument mit einer positiven reellen Zahl a > 0 multipliziert wird.
Dann betrachten wir
θ(−x) = 1 − θ(x).
52
Aufgabe 4.5 Heaviside-Funktion:
a) Skizzieren Sie θ(−x − a),
b) Skizzieren Sie θ(x)θ(x − a), θ(−x)θ(−x + a) und θ(−x)θ(−x − a),
c) Veranschaulichen Sie sich θ(−x)θ(x + a) = θ(x + a) − θ(x), θ(−x)θ(x − a)
und θ(x + a)θ(a − x) = θ(x + a) − θ(x − a),
d) Zeichnen Sie den Graph von θ(x)e−x ,
e) Skizzieren sie die Dreiecksfunktion (1 − | xa |)θ(x + a)θ(a − x).
Neben den Möglichkeiten, die der Körper der reellen Zahlen mit Addition, Subtraktion,
Multiplikation und Division bietet, um aus den Funktionen unserer Grundausstattung
neue Funktionen zu bilden, gibt es dazu auch eine wichtige neue Operation, nämlich die
Möglichkeit der verketteten oder mittelbaren Funktionen, auch Schachtelfunktionen
genannt. Sie besteht darin, dass man eine Funktion in eine andere Funktion einsetzt“:
”
Falls z.B. der Wertevorrat Wg einer ( inneren“) Funktion y = g(x) im Definitionsbereich
”
Df einer anderen ( äußeren“) Funktion y = f (x) liegt: Wg ⊆ Df , erhalten wir mit y =
”
f (g(x)), wobei x ∈ Dg , eine neue funktionale Abhängigkeit, die manchmal auch mit
y = (f ◦ g)(x) bezeichnet wird. Da wir die Bezeichnungen für die unabhängige und die
abhängige Varable frei wählen können, wird der Schachtelvorgang besonders klar, wenn
wir schreiben: y = f (z) mit z = g(x). Das ergibt y = f (g(x)):
53
Einfache Beispiele sind etwa: z = g(x) = 1 + x2 mit Wg : z ≥ 1 als innere Funktion und
1
y = f (z) = z1 mit Df = R1 \ {0} als äußere, was die Lorentz-Verteilungsfunktion y = 1+x 2
Skizzieren Sie die Graphen der obigen Beispielfunktionen und untersuchen und skizzieren
Sie folgende Schachtel-Funktionen:
a) y = sin 2x,
b) y = sin x + sin 2x + sin 4x,
c) y = cos2 x − sin2 x,
d) y = sin(x2),
e) y = sin x1 ,
f ) y = ( sinx x )2 , die z.B. die Lichtintensität nach einer Beugung beschreibt,
g) y = tan 2x,
h) die klassische Maxwell-Boltzmannsche Geschwindigkeitsverteilung für die zusammen-
2
stoßenden Moleküle eines idealen Gases y = x2 e−x ,
i) die Bose-Einstein-Verteilung der Geschwindigkeiten eines Gases nach der Quantensta-
2
tistik y = exx2 −1 ,
√
j) die Fermi-Dirac-Verteilung für die Geschwindigkeiten im Elektronengas y = ex−ax+1 mit
der temperaturabhängigen Konstante a,
k) die Plancksche Strahlungsformel für die spektrale Intensitätsverteilung der Wellenlän-
gen eines Hohlraumstrahlers y = 5 11 ,
x [e x −1]
sin x
l) y = e ,
m) y = 1 − |2x| und
1
n) y = |2x| .
54
Funktionenschaufenster: Dieses Fenster zeigt Ihnen in einem karte-
sichen Koodinatensystem die Graphen aller Funktionen, die Sie aus
unserer Funktionen-Grundausstattung als Linearkombinationen,
Produkte oder Schachtelfunktionen aufbauen können:
Sie tippen in das Feld rechts oben die interessierende Funktion ein,
indem Sie x als Symbol für die unabhängige Variable verwenden
und die Funktionen computergerecht schreiben mit einer reellen
Zahl r ∈ R:
Die Zahl pi :=π kennt der Plotter, aber die Eulerzahl e ist ihm
unbekannt.
Addition, Subtraktion und Division wie gewohnt: x + r, x − r, x/r
Multiplikation mit einem Stern statt Punkt: r? x := r · x,
Potenzieren mit dem Dach: x∧ r := x√ r
und r∧ x := rx ,
Quadratwurzelziehen mit sqrt(x) := x, sonstige Wurzeln müssen
Hier fehlt Bild 4.17
Sie als gebrochene Exponenten eingeben,
trigonometrische Funktionen mit Klammern: sin(x) :=
sin x, cos(x) := cos x, tan(x) := tan x,
Exponentialfunktion mit exp(x) := ex , denn e kennt er nicht,
Hyperbelfunktionen ebenfalls mit Klammern: sinh(x) :=
sinh x, cosh(x) := cosh x, tanh(x) := tanh x.
Er kennt nur die drei gängigen Logarithmen: ln(x) := loge x,
ld(x) := log2 x und lg(x) := log10 x. Die Betragsfunktion und die
Heaviside-Funktion können Sie sich selbst durch Intervallteilung
synthetisieren. Nur runde Klammern sind zugelassen.
Den Maßstab können Sie in den beiden Richtungen unabhängig
innerhalb weiter Grenzen durch Anklicken der Lupenzeichen
verändern. Wenn Sie mit den Vorbereitungen fertig sind, starten
Sie die Zeichnung mit der Return-Taste.
55
4.4 Spiegelsymmetrie
Einige Eigenschaften von Funktionen lohnt es sich besonders zu betrachten:
Symmetrieeigenschaften spielen in allen Naturwissenschaften ein große Rolle: denken
Sie z.B. nur an die Kristalle. Ein symmetrisches Problem hat meist auch eine symmetri-
sche Lösung, das spart häufig Arbeit. Es gibt viele Arten von Symmetrien. Eine davon,
die Spiegelsymmetrie, wollen wir hier herausgreifen. Wir untersuchen deshalb in diesem
Abschnitt das Verhalten der Funktionen y = f (x) bzw. ihrer Graphen bei Spiegelung
zunächst an der 2-Achse, d.h. der Geraden x = 0, wenn x in −x übergeht.
Dann geht y = f (x) über in f (−x). Im Allgemeinen besteht kein einfacher Zusammen-
hang zwischen f (x) und f (−x) bei gegebenem x. Nehmen Sie etwa f (x) = x + 1 für
x = 3 : f (3) = 4, während f (−3) = −2. Es gibt jedoch Funktionen mit einem einfachen
Zusammenhang zwischen den Funktionswerten vor und nach der Spiegelung. Diese Funk-
tionen sind für die Physiker und Mathematiker besonders interessant und haben spezielle
Bezeichnungen:
Eine gegen Spiegelung an der 2-Achse symmetrische Funktion heißt gerade:
Z.B sind y = x2 , y = cos x und y = |x| gerade Funktionen, ihr Graph geht bei der
Spiegelung an der y-Achse in sich über. Der Name rührt daher, dass alle Potenzen mit
geradzahligen Exponenten gerade Funktionen sind.
Dagegen heißt eine Funktion ungerade, wenn sie antisymmetrisch gegen eine Spiegelung
an der 2-Achse ist, also in ihr Negatives übergeht oder - äquivalent dazu - wenn ihr Graph
bei der Punktspiegelung am Ursprung in sich übergeht:
56
f (x) + f (−x)
geraden Anteil: f+ (x) = 2 = f+ (−x)
bzw. dem
f (x) − f (−x)
ungeraden Anteil: f− (x) = 2 = −f− (−x).
Z.B. ist c der gerade Anteil der Geradenfunktion y = s · x + c und s · x der ungerade.
4.5 Beschränktheit
Als nächstes übertragen wir die uns von den Folgen her bekannte Beschränktheit auf die
Funktionen. Eine Funktion heißt nach oben beschränkt in einem Intervall [a, b], wenn es
eine obere Schranke für die Funktionswerte in diesem Intervall gibt:
Nach unten beschränkt wird wieder ganz analog mit der unteren Schranke A ≤ f (x)
definiert.
Z.B. sind die Normal-Parabel y = x2 und die Betragsfunktion y = |x| durch A = 0 nach
unten beschränkt und die Stufenfunktion θ(x) ist durch B = 1 nach oben und durch
A = 0 nach unten beschränkt.
57
4.6 Monotonie
Auch die Monotonie übertragen wir von den Folgen auf die Funktionen, denn die Folgen
können als spezielle Funktionen über dem Definitionsbereich N aufgefaßt werden:
Eine Funktion heißt monoton steigend in einem Intervall [a, b], wenn mit wachsendem
Argument auch die Funktionswerte im Intervall [a, b] wachsen:
4.7 Eineindeutigkeit
Wie wir bei der Einführung des Funktionsbegriffs besonders erwähnt hatten, enthält des-
sen Definition zwar die Eindeutigkeit der Abbildung, d.h. zu jedem Urbildpunkt x existiert
genau ein Bildpunkt y = f (x), aber es ist immer noch möglich, dass zwei verschiedene
Argumente denselben Funktionswert als Bildpunkt haben, d.h. f (x1 ) = f (x2 ) für x1 6= x2 .
Funktionen, bei denen das nicht mehr vorkommen kann, haben einen besonderen Namen:
Man nennt eine Funktion eineindeutig (auch umkehrbar eindeutig oder bijektiv) in ei-
nem Intervall [a, b], wenn auch jeder Funktionswert y aus dem entsprechenden Wertevorrat
nur bei genau einem Argument auftritt:
58
Bild 4.18: Graph einer Geraden und der Normalparabel
Das Bild zeigt als Beispiel für eine eineindeutige Funktion eine Gerade y = sx + c, speziell
y = 34 x + 3, bei der z.B. dem Variablenwert x = 3 genau der Funktionswert y = 7 ent-
spricht, und als Gegenbeispiel die Normalparabel y = x2 , bei der man den Funktionswert
y = 4 für x = 2 und x = −2 erhält.
Einschub: bijektiv: Wie der Name bijektiv“ andeutet, nähern sich die Mathe-
”
matiker dem Begriff der Eineindeutigkeit in zwei Schritten:
1) Zunächst nennen sie eine Abbildung injektiv, bei der gleiche Bildpunkte nur aus
gleichen Urbildpunkten hervorgehen:
oder äquivalent dazu, wenn verschiedene Urbilder auch immer zu verschiedenen Bil-
dern führen:
In diesem Fall hat die Gleichung y = f (x) für alle y höchstens eine Lösung x, und
jede Parallele zur 1-Achse schneidet den Graphen der Funktion höchstens einmal.
2) Dann betrachten sie in einem zweiten Schritt die für uns nicht so wichtige Menge,
in der die Bildelemente liegen, und untersuchen, ob diese nur aus den Bildpunkten
besteht oder noch weitere Punkte enthält. Falls die angegebene Bildmenge nur aus
dem Wertevorrat besteht, nennen sie die Abbildung surjektiv:
59
y = f (x) surjektiv auf Wf ⇐⇒ ∀y ∈ Wf ∃x ∈ Df : f (x) = y.
Dann hat die Gleichung y = f (x) für alle y wenigstens eine Lösung x.
Also hat bei einer bijektiven Abbildung die Gleichung y = f (x) genau eine Lösung
x, und die Funktion ist umkehrbar.
4.8 Umkehrfunktionen
Für alle eineindeutigen Funktionen, d.h. umkehrbar eindeutigen Abbildungen eines De-
finitionsbereichs Df in einen Wertevorrat Wf kann man durch Auflösen der Gleichung
y = f (x) nach x die jeweilige Umkehrfunktion x = f −1 (y) =: g(y) bilden, wobei Defi-
nitionsbereich und Wertevorrat ihre Rollen vertauschen: Dg = Wf und Wg = Df . Die
Umkehrfunktion beschreibt die Umkehrung der ursprünglichen Abbildung. Da die ur-
sprüngliche Abbildung y = f (x) und die Rückabbildung x = g(y) sich in ihrer Wirkung
gerade aufheben, gilt für die mittelbare Funktion f (g(y)) = y. Daraus ist die oben ange-
gebene Schreibweise g = f −1 zu verstehen: f (f −1 (y)) = y = f −1 (f (y)).
60
Bild 4.19: Schwarze Kästen für y = f (x) und die Umkehrfunktion x = g(y)
4.8.1 Wurzelfunktionen
Das Beispiel der Parabel zeigte schon, dass die Umkehrfunktionen der Potenzen y = xn
mit ganzzahligen Exponenten n ∈ Z die Wurzelfunktionen
√ mit gebrochenen Exponen-
1 1
ten darstellen: x = y n , umgeschrieben in y = n x = x n , wobei allerdings die Funktionen
mit geradzahligen Exponenten vor der Umkehrung durch Einschränkung des Definitions-
bereichs auf x ≥ 0 erst eineindeutig gemacht werden müssen.
61
Bild 4.20: Normal-Parabel y = x2 und ihre an der Winkelhalbierenden
√ gespiegelte
Umkehrfunktion: die Quadratwurzelfunktion y = + x
Die trigonometrischen Funktionen y = sin x oder y = cos sind periodisch in x mit der
Periode 2π und y = tan x oder y = cot x mit der Periode π. Sie sind also keine eineindeuti-
gen Funktionen. Erst durch Einschränkung des Definitionsbereichs kann Eineindeutigkeit
erreicht werden.
Für die ungeraden Funktionen y = sin x, y = tan x und cot x wählt man meist
− π2 < x ≤ π2 , für das gerade y = cos x 0 < x ≤ π. Wegen der Periodizität kann man auch
andere um Vielfache von 2π verschobene Intervalle wählen. Hier ist eine gewisse Vorsicht
beim Rechnen geboten, insbesondere vor der Verwendung von Taschenrechnern sollte
man sich über die Definitionsbereiche der Umkehrfunktionen informieren. Man nennt die
Umkehrfunktionen der trigonometrischen Funktionen, die zyklometrischen oder Arcus-
Funktionen:
62
zu y = sin x y = arcsin x,
zu y = cos x y = arccos x,
zu y = cot x y = arccot x.
Einschub: Arcus: Die Bezeichnung arcsin x“, sprich: Arcus sinus x“, meint
” ”
den Bogen (lat. arcus) am Einheitskreis, d.h. den Winkel, dessen Sinus den Wert x
hat.
63
Einschub: Notation: Die Notation in der Literatur (insbesondere in der an-
gelsächsischen) ist leider nicht einheitlich. Man findet statt arcsin x auch asin x
oder einfach sin−1 x. Vor allem die letzte Schreibweise kann die Ursache für Ver-
wirrung sein, weil sie leicht mit dem Inversen der Sinus-Funktion (sin x)−1 = sin1 x
verwechselt werden kann.
4.8.3 Logarithmen
Die Eigenschaften des streng monoton ansteigenden natürlichen Logarithmus sind an dem
abgebildeten Graphen abzulesen: ln 1 = 0 und lim ln x = −∞. Aus den Rechenregeln der
x→0
Potenzen erhalten wir folgende Rechenregeln für die natürlichen Logarithmen:
64
ln y · z = ln y + ln z, ln( yz ) = ln y − ln z und ln(z y ) = y ln z.
Nachdem wir speziell mit der natürlichen Exponentialfunktion und dem natürlichen Lo-
garithmus vertraut sind, können sie dazu dienen, die allgemeine Exponentialfunktion
zu definieren:
der für b > 1 (wie auch ln x) streng monoton ansteigt, für b < 1 jedoch monoton fällt.
Als Rechenregeln für die allgemeinen Logarithmen erhalten wir bei gleichbleibender
Basis b:
65
Neben den besonders wichtigen natürlichen Logarithmen ln := loge mit der nicht-
rationalen Zahl e = 2,7182. . . als Basis gibt es noch für zwei weitere häufig gebrauchte
Basen einfachere Schreibweisen: die dualen ld := log2 (oder englisch: binary loga-
Die Umrechnung zwischen Logarithmen verschiedener Basen erfolgt nach der Formel:
lg x = lg e ln x = 0, 434 ln x,
b logb x = 2 ld x = e ln x = 10 lg x = x
erhalten wir b logb y = y = z logz y = (b logb z )logz y = b logb z· logz y , und folglich sind die Expo-
nenten gleich.
Auch die allgemeine Potenzfunktion wird mit Hilfe der natürlichen Exponentialfunk-
tion und des natürlichen Logarithmus für x > 0 und r ∈ R definiert durch:
66
Bild 4.24: Potenzfunktionen
x −x √
zu y = sinh x := e −2 e
y = arsinh x = ln x + x2 + 1 ,
x −x
zu y = tanh x := ex − e−x y = artanh x = 12 ln 11 −
+ x.
x
e +e
67
arcsinh x = arsh x = sinh−1 x, usw.
Einschub: Area: Der Name für arcosh x“, sprich: Area cosinus hyper-
” ”
bolicus x“, kommt vom Zusammenhang mit dem Flächeninhalt (lat.: area) eines
Sektors an der Einheitshyperbel: Man kann zeigen, dass y der Flächeninhalt des in
Bild 4.11 eingefärbten Hyperbelsektors (zwischen dem Ursprung, dem Fahrpunkt,
dem Scheitel und dem an der 1-Achse gespiegelten Fahrpunkt) darstellt, falls die
1-Koordinate des Fahrpunktes, also Cosinus hyperbolicus, gleich x ist.
68
Aufgabe 4.13 Area-Funktionen:
√
a) Zeigen Sie, dass aus y = ln x + x2 + 1 folgt x = sinh y.
b) Zeigen Sie, dass aus y = 21 ln 1−x
1+x
folgt x = tanh y.
4.9 Grenzwerte
Die Bildung von Grenzwerten für Funktionen wird durch folgende Überlegung auf die
uns bereits bekannte Berechnung von Grenzwerten von Folgen zurückgeführt: Wenn wir
wissen wollen, ob die Funktionswerte f (x) einer reellen Funktion f bei Annäherung des
Arguments x an eine reelle Zahl x0 die Zahl y0 als Grenzwert hat, wählen wir eine Folge
(xn )n∈N ⊆ Df von reellen Zahlen im Definitionsbereich Df der Funktion f , die für n → ∞
gegen die Zahl x0 ∈ Df strebt. Dann bilden wir die Funktionswerte an diesen Stellen
f (xn ), die wieder eine Folge darstellen (f (xn ))n∈N , und überprüfen, ob diese Folge der
Funktionswerte gegen y0 konvergiert. Falls sich das für jede aus dem Definitionsbereich
herausgegriffene gegen x0 strebende Folge zeigen läßt, dann nennen wir die Folge der
Funktionswerte konvergent gegen y0 : lim f (x) = y0 :
x→x0
Wenn wir unsere Definition der Konvergenz für Folgen einsetzen, ergibt das:
Dies für alle Folgen zu zeigen, ist natürlich leichter gesagt als getan! Wir brauchen uns hier
jedoch nicht zu lange mit diesen zum Teil schwierigen mathematischen Fragen zu beschäf-
tigen, mit denen Sie sich in der Analysis-Vorlesung noch auseinanderzusetzen Gelegenheit
haben werden, sondern wollen uns mit einigen für die Physiker wichtigen Beispielen be-
gnügen.
Bereits aus den Graphen sieht man z.B.
69
Für das Verhalten bei großen Werten der Variablen
ist offensichtlich lim xn divergent und lim x−n = 0 für n ∈ N.
x→∞ x→∞
Ferner ergibt sich lim xn e−x = 0 und lim x−n ex divergent.
x→∞ x→∞
Man sagt deshalb, dass die Exponentialfunktion stärker ansteigt als jede Potenzfunktion.
Einschub: sin x
x : Für den wichtigen Grenzwert lim sin x
x =1 gibt es einen
x→0
Wir betrachten den Sektor A0b des Einheitskreises mit Zentriwinkel x bei 0, die
Strecken |0A| = 1 und |0b| = 1 sowie den Bogen (Ab) über dem Winkel x, den
Punkt a auf der Strecke |0A|, die Strecken |0a| = cos x und |ab| = sin x, und die
Verlängerung der Strecke |0b| bis B, so dass die Strecke |AB| = tan x.
Offensichtlich gelten für die Flächen der Dreiecke bzw. des Sektors folgende Unglei-
chungen:
F(Dreieck: 0ab) ≤ F(Sektor: 0Ab) ≤ F(Dreieck: 0AB),
1 2
d.h. 2 sin x cos x ≤ 12ππx ≤ tan x2 .
2
mal sin x ergibt: cos x ≤ x/ sin x ≤ 1/ cos x
1 sin x
reziprok: cos x ≥ x ≥ cos x,
also im Grenzwert x → 0: 1 ≥ limx→0 sinx x ≥ 1.
70
sin x
Bild 4.27: Graph der Funktion x
Berechnen Sie
a) lim1 1+x
1−x
,
x→ 2
sin x
b) lim ,
x→π x−π
c) lim (tan x)2 und
x→0
x
d) Untersuchen Sie folgenden Grenzwert lim e x−1 mit Hilfe der Umkehrfunktion und der
x→0
Exponentialfolge, den wir im nächsten Kapitel benützen und im übernächsten Kapitel auf
viel elegantere Weise erneut ableiten werden.
4.10 Stetigkeit
Die letzte wichtige Eigenschaft der Funktionen, die wir brauchen, ist die Stetigkeit: Ins-
besondere in der klassischen Physik stellen wir uns häufig mit Erfolg auf den Standpunkt:
Natura non facit saltus“ (Die Natur macht keine Sprünge), d.h. wir betrachten stetige
”
Funktionen. Für viele Experimente ist die Stetigkeit schon wegen der endlichen Meßge-
nauigkeit als Hypothese unentbehrlich. Aber natürlich gibt es auch unstetige Prozesse,
z.B. beim Ein- oder Ausschalten und bei Quantensprüngen“.
”
71
Die Mathematiker definieren eine Funktion als stetig an einer Stelle x0 , wenn sie dem
Punkt x0 benachbarte Punkte wieder in benachbarte Bildpunkte abbildet, in Kurzschrift:
y = f (x) stetig bei x0 ⇐⇒ ∀ε > 0 ∃δ(ε) > 0 : |f (x) − y0 | < ε ∀x mit |x − x0 | < δ.
Für die Grenzwerte bedeutet das, dass an der betrachteten Stelle x0 der rechtsseitige
Limes und der linksseitige Limes gleich sind und durch den Funktionswert y0 = f (x0 ) des
Grenzwerts x0 einer Folge xn aus dem Definitionsbereich der Argumente gegeben werden:
Der Graph einer stetigen Funktion macht keine Sprünge“. Die Heaviside-Funktion ist
”
die Funktion mit dem Einheitssprung“. Mit ihrer Hilfe kann man alle in der Physik
”
auftretenden Unstetigkeiten darstellen.
Summen, Differenzen, Produkte, Quotienten und verkettete Funktionen stetiger Funk-
tionen sind wieder stetig. Daraus ergibt sich, dass alle bisher betrachteten Funktionen
außer der Heavisideschen Stufenfunktion innerhalb ihrer Definitionsbereiche stetig sind.
Die Stufenfunktion springt an der Stelle 0 um 1: lim θ(x) = 1, lim θ(x) = 0, während
x→0+0 x→0−0
doch θ(0) = 12 war. Die Normalhyperbel y = 1
x
ist zwar an der Stelle x = 0 unstetig, aber
dort auch nicht definiert.
72
Bild 4.28: Funktionen-Quiz
73
74
Kapitel 5
DIFFERENTIATION
Mit der Differentialrechnung hat die Theoretische Physik begonnen, kann man wohl oh-
ne Übertreibung sagen. Denn seit der Entwicklung dieses Zweigs der Mathematik durch
Leibniz und Newton im 17. Jahrhundert, gelang es, die Gesetze exakt zu formulieren, die
den physikalischen Phänomenen zugrunde liegen: Die Newtonschen Gleichungen der Me-
chanik, die Maxwell-Gleichungen der Elektrodynamik und die Schrödinger-Gleichung der
Quantenmechanik sind alle als Differentialgleichungen geschrieben. Ihre Lösung erfordert
den ganzen Apparat der Analysis, insbesondere der Differential- und Integralrechnung.
Aus diesem Grund sind die folgenden Kapitel so wichtig. Differenzieren und Integrieren
sind das unentbehrliche Handwerkszeug des Physikers.
5.1 Differenzenquotient
Wir betrachten zunächst die gleichförmige Bewegung eines Massenpunkts auf einer Ge-
raden. Dabei gilt für den zurückgelegten Weg: x(t) = st+x0 als Funktion der Zeit t, wobei
x0 = x(0) die Position zur Zeit t = 0 bedeutet.
Die Physiker interessiert als erstes die Geschwindigkeit der Bewegung. Aus dem Gra-
phen dieser linearen Funktion, einer Geraden mit der Steigung s durch den Punkt (0, x0 ),
entnehmen wir die Geschwindigkeit v als Quotient aus zurückgelegtem Weg x(t) − x(0)
dividiert durch die dazu benötigte Zeit t, was genau
x(t) − x0
v= = s,
t
die Steigung ergibt. Es ist also die Steigung der Graphen, die uns zunächst interessiert.
Bei der Geraden hätten wir ersichtlich auch ein anderes Zeitintervall t2 −t1 nehmen können:
x(t2 ) − x(t1 )
v=
t2 − t1
75
Bild 5.1: Die Gerade x(t) = st + x0
und dasselbe Ergebnis erhalten. Denn bei einer gleichförmigen Bewegung werden in glei-
chen Zeiträumen gleiche Strecken zurückgelegt: die Geschwindigkeit ist konstant. Wir
bezeichnen die Differenzen im Zähler und Nenner des Quotienten in folgender Weise mit
einem großen griechischen Delta: (x(t2 ) − x(t1 )) =: ∆x(t) und (t2 − t1 ) =: ∆t und nennen
den Quotienten Differenzenquotient:
∆x(t)
v= .
∆t
Allgemein, wenn die unabhängige Variable wieder x genannt wird, erhalten wir für den
Wie ändert sich nun die Situation, wenn wir in unserem physikalischen Beispiel eine all-
gemeine geradlinige Bewegung mit zeitlich variierender Geschwindigkeit betrachten, die
durch eine beliebige Funktion des Ortes von der Zeit x(t) dargestellt wird?
76
Bild 5.2: Graph einer beliebigen Funktion x(t) der Zeit
An dem Bild erkennt man, dass der Differenzenquotient die Steigung der Sekante angibt,
die die beiden Punkte (t1 , x(t1 )) und (t2 , x(t2 )) verbindet. Der Wert des Differenzenquo-
tienten ist dann
5.2 Differentialquotient
Zur Bestimmung der Momentangeschwindigkeit z.B. zur Zeit t0 wählen wir demnach
einen beliebigen Zeitpunkt t = t0 +∆t in der Nähe von t0 und zeichnen die Sekante durch
die Funktionswerte x(t) = x(t0 ) + ∆x(t) und x(t0 ) = x0 , bestimmen deren Steigung als
Differenzenquotient: s = ∆x(t)
∆t
= x(t)−x(t
t−t0
0)
und lassen dann den Zeitpunkt t gegen t0 , also
77
∆t → 0 gehen. Dabei nähert sich bei einer stetigen Funktion auch x(t) dem Wert x0 =
x(t0 ) und die Sekante geht in die Tangente des Graphen über mit der Tangentensteigung:
dx ∆x
= lim .
dt t0 ∆t→0 ∆t
In unserer üblichen mathematischen Bezeichnung mit x für die unabhängige und y = f (x)
für die abhängige Variable ergibt sich so der
df (x) f (x0 + ∆x) − f (x0 )
Differentialquotient: = lim ∆x
dx x ∆x→0
0
Der Differenzenquotient ∆x ∆y
≡ ∆f∆x(x) ≡ f (x0 +∆x)−f
∆x
(x0 )
ist bei diesem Grenzübergang ∆x →
0 in den sogenannten Differentialquotienten übergegangen, von seinem Erfinder Leibniz
df (x) dy
mit dx x0 oder dx x0 bezeichnet, jedoch zunächst eigentlich selbst kein Quotient, sondern
nur der Grenzwert eines Quotienten. Wie bei allen fundamentalen Begriffen der Mathema-
tik gibt es auch hier wieder mehrere Bezeichnungen: Die alternative, den meisten von der
Schule her geläufige Bezeichnung f 0 (x0 ), gesprochen f Strich an der Stelle x0“, stammt von
”
Lagrange und soll daran erinnern, dass die Steigung des Graphen, auch (erste) Ableitung
der Funktion genannt, im Allgemeinen selbst wieder eine neue, entlang der Kurve variie-
rende Funktion der unabhängigen Variablen x ist, hier speziell an der Stelle x0 angegeben.
d
Auch die Bezeichnung dx f (x)x0 ist im Gebrauch, die betont, dass die Differentiation
d
eine Operation“ ist, bei der der Differentialoperator“ dx auf die rechts stehende Funk-
” ”
tion f (x) wirkt und das Resultat dann speziell an der Stelle x = x0 genommen werden
soll. Es ist sinnvoll, alle diese Bezeichnungen nebeneinander zur Verfügung zu haben je
nach dem Aspekt, auf den es gerade ankommt.
df (x) dy
Äquivalente Bezeichnungen: f 0 (x0 ) ≡ d
dx x0
≡ dx
f (x)x0 ≡ dx
x0
Dabei ist noch eine Kuriosität der Physiker zu erwähnen: Falls die unabhängige Variable
die Zeit t ist, was natürlich sehr häufig vorkommt, schreiben und sprechen die Physiker
statt des 0 Strich“ hinter dem Funktionssymbol einen hochgesetzten ˙ Punkt“ hinter oder
” ”
über dem Funktionssymbol ẋ(t0 ) ≡ dx(t)
.
dt t0
78
hat: Er gibt die Steigung der Tangenten an den Graph der Funktion im Punkt x0
an. Man kann diese Tangenteneigenschaft auch noch folgendermaßen verstehen:
Wir stellen uns die Aufgabe, eine durch eine Funktion y = f (x) beschriebene ebene
Kurve in der Umgebung eines Punktes x0 möglichst gut durch eine Gerade g(x) =
sx + a zu approximieren: Wir fordern dazu:
1. Am Punkt x0 gelte f (x0 ) = g(x0 ) = sx0 + a, woraus das absolute Glied a =
−sx0 + f (x0 ) bestimmt werden kann. Eingesetzt ergibt das: g(x) = s(x − x0 ) + f (x0 ).
Damit erhalten wir für die Abweichung der Näherungsgeraden g von der Kurve f :
f (x) − f (x0 )
lim − s = f 0 (x0 ) − s = 0 und folglich s = f 0 (xo).
∆x→0 ∆x
Wir erhalten also genau dann die beste lineare Approximation des Graphen der
Funktion f (x) in der Umgebung des Punktes x0 , wenn wir eine Gerade mit dem Dif-
ferentialquotienten als Steigung wählen, und das ist natürlich gerade die Definition
der Tangente.
mit einem Rest Rf (x0 , ∆x), der von der Funktion f, der Stelle x0 und dem Intervall
∆x abhängt und mit ∆x verschwindet. Multiplizieren wir diesen Differenzenquoti-
enten mit dem Zuwachs ∆x der Variablen, so erhalten wir
79
den wahren Zuwachs“ unserer Funktion bei x0 : ∆f (x)x0 = f 0 (x0 )∆x+rf (x0 , ∆x)
”
mit einem neuen Rest rf (x0 , ∆x) = Rf (x0 , ∆x)∆x, der offensichtlich noch stärker
als Rf mit ∆x verschwindet. Wenn wir von diesem Rest absehen können, erhalten
wir so für den wahren Zuwachs der Funktion ∆f (x)x0 eine erste in ∆x lineare
Näherung,
den linearen Anteil des Zuwachses der Funktion“ df (x)x0 = f 0 (x0 )∆x,
”
der Differential genannt wird.
Speziell für die Funktion y = f (x) = x, die Winkelhalbierende, erhalten wir mit
f 0 (x) = 1
den linearen Anteil der linearen Funktion der unabhängigen Variablen: dx = ∆x,
der nicht notwendig infinitesimal sein muss und den wir oben einsetzen können, um
mit der Lagrangeschen bzw. Leibnizschen Formulierung des Differentialquotienten
zu erhalten:
Damit haben wir eine Gleichung, in der die Symbole df und dx, die in der Leibniz-
schen Formulierung des Differentialquotienten zunächst nur als Quotient definiert
waren, jetzt einzeln vorkommen und als lineare Anteile des Zuwachses“ auch als
”
nichtinfinitesimale Größen definiert sind. Wegen dieser Möglichkeit ziehen wir die
weitsichtige und suggestive Leibnizsche Schreibweise für den Differentialquotienten
der Ihnen von der Schule her bekannten von Lagrange bei vielen Gelegenheiten vor.
5.3 Differenzierbarkeit
Aus der obigen Konstruktion des Differentialquotienten als Limes des Differenzenquotien-
ten und unseren Kenntnissen über die Grenzwertbildung ergibt sich sofort, dass sich nicht
für jede Funktion an jeder Stelle eindeutig eine Steigung bestimmen lässt, also nicht jede
Funktion an jeder Stelle ihres Definitionsbereichs differenzierbar ist:
80
Dazu ist erforderlich: dass der Grenzwert von rechts“ lim+ f (x)−fx−x0
(x0 )
, bei dem wir wie
” x→x0
oben gezeichnet den zweiten Punkt für die Sekante rechts von x0 gewählt haben, und der
Grenzwert von links“ lim− f (x)−f
x−x0
(x0 )
mit einem links von x0 gewählten Sekantenpunkt x
” x→x0
beide existieren, d.h. insbesondere endlich sind, und dazu noch übereinstimmen:
Für den Graph bedeutet das offensichtlich, dass er keine Ecken“ oder Knicke“ haben
” ”
darf. Z.B. ist die überall stetige Betragsfunktion y = |x| bei x = 0 nicht differenzierbar,
weil lim+ |x|−|0|
x−0
= +1 ist, während lim− |x|
x
= −1; d.h. die beiden Limites existieren zwar,
x→0 x→0
stimmen aber nicht überein.
√
Die nur über der nichtnegativen Halbgeraden definierte Wurzelfunktion y = f (x) = + x
andererseits ist am linken Rand ihres Definitionsbereichs√bei√x = 0 nicht differenzierbar,
weil der dort allein mögliche Grenzwert von rechts“ lim+ x−
x−0
0
= lim+ √1x nicht existiert,
” x→0 x→0
da die Steigung unendlich wird.
Aus der Definition sieht man sofort, dass aus der Differenzierbarkeit einer Funktion an
einer Stelle ihre Stetigkeit dort folgt. Denn für eine gegen x0 strebende Folge xn aus dem
f (xn )−f (x0 )
Definitionsbereich gilt: |f (xn ) − f (xo )| = xn −x0 |xn − x0 | −→ f 0 (x0 ) · 0 = 0. Das
Umgekehrte gilt jedoch nicht: Nicht jede stetige Funktion ist differenzierbar, wie wir oben
am Beispiel der Betragsfunktion f (x) = |x| gesehen haben.
Wir sehen leicht, dass der Grenzwert von rechts“ lim θ(x)−θ(0)
x−0 = (1 − 12 ) lim 1
x
” x→0+ x→0+
θ(x)−θ(0) 1 1
und der linksseitige lim x−0 = (0 − 2 ) lim x beide nicht existieren.
x→0− x→0−
Das könnte auch nicht dadurch behoben werden, dass man den zunächst etwas will-
kürlich erscheinenden Wert θ(0) = 21 etwa zu 1 festlegt, denn dann würde zwar der
81
rechtsseitige Grenzwert gleich 0, aber der Grenzwert von links“ wäre weiterhin ∞.
”
Also ist unsere unstetige Musterfunktion am Unstetigkeitspunkt irreparabel nicht
differenzierbar, obwohl sie links und rechts davon eine horizontale Tangente besitzt.
Nur einen einzigen Satz über differenzierbare Funktionen werden wir gelegentlich benüt-
zen, den
f (b) − f (a)
= f 0 (x0 ).
b−a
Anschaulich ergibt sich der Beweis aus dem folgenden Bild 5.3.
2
d 2
Wieder gibt es verschiedene Schreibweisen: f 00 (x) ≡ ddxf2 ≡ dx
f (x). Die geometrische
Bedeutung der zweiten Ableitung als Krümmung ergibt sich daraus, dass das Anwachsen
der Steigung, d.h. eine positive zweite Ableitung f 00 (x) > 0 (in positiver Richtung der
unabhängigen Variablen betrachtet) eine Linkskurve bedeutet, ein negatives f 00 (x) < 0
entsprechend eine Rechtskurve. Wenn f 00 (x) = 0, erkennt man, dass f (x) eine Gerade ist.
82
Bild 5.3: Zum Mittelwertsatz der Differentialrechnung
Für die Physiker erhalten wir, falls die Zeit t als unabhängige Variable auftritt, Altbe-
kanntes, nämlich die Beschleunigung als erste zeitliche Ableitung der Geschwindigkeit
oder zweite zeitliche Ableitung des Ortes: a = v̇(t) = ẍ(t).
Sukzessiv erhalten wir für viele Funktionen auch noch höhere Ableitungen, allgemein etwa
die
n
d n
d (n−1)
(x), mit f (n) (x) ≡ ddxnf ≡ dx
n-te Ableitung: f (n) (x) := dx f f (x).
Einschub: Extrema: Aus der Schule kennen viele von Ihnen die Anwendung
dieser Deutung der ersten und zweiten Ableitungen einer Funktion aus der Kurven-
diskussion:
Das Verschwinden der ersten Ableitung f 0 (x0 ) = 0 an einer Stelle x0 , das Kriterium
für eine waagrechte Tangente in diesem Punkt, ist eine notwendige Voraussetzung
für das Vorliegen eines lokalen Extremums. Hinreichend kann die Bedingung des-
halb nicht sein, weil ja auch eine horizontale Wendetangente vorliegen könnte.
Hinreichende Bedingungen für ein lokales Maximum oder Minimum erhält
man erst durch Betrachten der zweiten Ableitung: f 00 (x0 ) > 0 bedeutet Linkskurve,
also ein lokales Minimum, während f 00 (x0 ) < 0 auf eine Rechtskurve deutet und bei
einem Maximum vorliegt.
83
Bild 5.4: Graph einer Funktion und ihrer höheren Ableitungen
sein, nach der der Grenzwert des Quotienten zweier differenzierbarer Funktionen
sich beim (auch mehrfachen) Differenzieren von Zähler und Nenner nicht ändert,
falls alle beteiligten Limites existieren:
lim f (x)/g(x) = lim f 0 (x)/g 0 (x) = lim f (n) (x)/g (n) (x).
sin x cos x
Z.B. lim x = lim 1 = 1,
x→0 x→0
wie in Abschnitt 4.9 in einem Einschub schon geometrisch gezeigt,
x x
oder lim e x−1 = lim e1 = 1,
x→0 x→0
wie in Aufgabe 4.14d nur mit Mühe bewiesen,
oder lim lnxx = lim 1/x
1 =0
n→∞ n→∞
1−cos x
oder lim 2 = lim sin x = lim cos2 x = 1/2
x→0 x x→0 2x x→0
oder lim x−sin
3
x
= lim 1−cos x
2 = lim sin x = lim cos6 x = 1/6
x→0 x x→0 3x x→0 6x x→0
84
5.5.1 Vier Beispiele
Wir berechnen zunächst die Differentialquotienten für vier prominente Beispiele aus un-
serer Funktionengrundausstattung, aus denen wir dann die Ableitungen aller anderen in-
teressierenden Funktionen mit Hilfe einfacher Regeln gewinnen können:
1. Zuerst betrachten wir
Die n-ten Potenzen sind n-fach differenzierbar, so dass xn(n) = n(n−1)(n−2)·. . .·2·1 = n!.
Der Beweis benützt ein Additionstheorem und einen im Einschub des Abschnitts 4.9
berechneten Grenzwert:
sin(x + ∆x) − sinx
{sin x}0 = lim mit Hilfe des Additionstheorems:
∆x→0 ∆x
2 sin x+∆x−x cos x+∆x+x
2 2
= lim
∆x→0 ∆x
sin ∆x x + ∆x
2
cos 2
= lim ∆x
∆x→0
2
sin ∆x
2 ∆x
= lim ∆x
lim cos x +
∆x→0
2
∆x→0 2
= cos x.
Exponentialfunktion: (ex )0 = ex .
ex+∆x − ex
(ex )0 = lim
∆x→0 ∆x
∆x
e −1
= ex lim
∆x→0 ∆x
= ex
Das ist gerade das Charakteristikum der Exponentialfunktion und der tiefere Grund für
ihre überragende Bedeutung in den Naturwissenschaften, dass sie mit ihrem Differential-
quotienten übereinstimmt.
Aus diesen Beispielen erhalten wir nun alle gewünschten Differentialquotienten für alle
Funktionen unserer Grundausstattung und darüber hinaus mit Hilfe der folgenden Regeln.
In der Praxis hat man natürlich nur selten eine der vier betrachteten Beispielfunktionen
allein zu differenzieren, sondern mehr oder weniger kompliziert aus mehreren verschiede-
nen Funktionen zusammengesetzte Ausdrücke, z.B. f (x) = axn e−bx (cos cx + d sin cx) mit
den reellen Konstanten a, b, c, d und n.
Deshalb stellen wir in diesem Abschnitt die Regeln zusammen, die es uns ermöglichen,
die Differentialquotienten komplizierter Ausdrücke aus den bekannten Ableitungen der
einzelnen Bestandteile aufzubauen. Als Anwendungsbeispiele betrachteten wir zunächst
die Funktionen unserer Grundausstattung und dann darüber hinaus gehend weitere inter-
essante und für die Naturwissenschaften wichtige Funktionen. Die Ergebnisse tragen wir
in eine TABELLE ein, die wir später auch beim Integrieren noch brauchen werden.
86
Im Folgenden bezeichnen f (x) und g(x) zwei differenzierbare Funktionen und a, b, c, . . .
reelle Konstanten. Die Beweise aus der Definition des Grenzwerts können Sie selbst ver-
suchen oder auch in den Schubladen einsehen.
Wegen der offensichtlichen Homogenität (ein konstanter Faktor kann herausgezogen wer-
den) des Grenzwerts (c · f (x))0 = c · f 0 (x) starten wir statt mit der allbekannten Sum-
menregel (f (x) ± g(x))0 = f 0 (x) ± g 0 (x) sogleich mit der
D.h. der Differentialquotient einer Linearkombination von Funktionen ist gleich der Line-
arkombination der Differentialquotienten.
Einschub: Beweis:
Damit folgt z.B. aus der Potenzregel der Differentialquotient jedes Polynoms, z.B. m-ten
m
n 0
an xn als ein Polynom (m − 1)-ten Grades: ( m
P P
Grades Pm (x) = n=0 an x ) =
n=0
Pm n−1 (m+1)
a
n=0 n n · x . Speziell ist Pm (x) = 0.
Der Differentialquotient des Produkts zweier differenzierbarer Funktionen f (x) und g(x)
ist der Differentialquotient des ersten Faktors mal dem zweiten Faktor plus dem Differen-
tialquotienten des zweiten Faktors mal dem ersten Faktor.
87
Einschub: Beweis:
(f (x) · g(x))0 = ( dx
d
)(f (x)g(x))
f (x + ∆x)g(x + ∆x) − f (x)g(x)
:= lim
∆x→0 ∆x
f (x + ∆x)g(x + ∆x) − f (x)g(x + ∆x) + f (x)g(x + ∆x) − f (x)g(x)
= lim
∆x→0 ∆x
(f (x + ∆x) − f (x))g(x + ∆x) g(x + ∆x) − g(x)
= lim + f (x) lim
∆x→0 ∆x ∆x→0 ∆x
d d
= ( dx )f (x) · g(x) + f (x) · ( dx )g(x)
= f 0 (x) · g(x) + f (x) · g 0 (x)
0
g 0 (x)
Inversenregel: 1 =− für g(x) 6= 0.
g(x) g 2 (x)
Einschub: Beweis:
0 1 1
1 g(x+∆x) − g(x)
:= lim
g(x) ∆x→0 ∆x
88
Damit wird es z.B. möglich, die Potenzregel (*) auf negative Exponenten, also ganze
0
Zahlen auszudehnen: (x−n ) = (1/xn )0 = −(xn )0 /x2n = −nxn−1 /x2n = −nxn−1−2n =
−nx−n−1 wie oben, jetzt aber für n ∈ Z.
Auch die inverse Exponentialfunktion kann jetzt differenziert werden:
(e−x )0 = −ex /(ex )2 = −e−x .
0
f 0 (x)g(x) − f (x)g 0 (x)
f (x)
Quotientenregel: = für g(x) 6= 0.
g(x) g 2 (x)
Der Differentialquotient des Quotienten zweier differenzierbarer Funktionen ist der Diffe-
rentialquotient des Zählers mal Nennerfunktion minus der Differentialquotient des Nenners
mal Zählerfunktion geteilt durch das Quadrat der Nennerfunktion, die nicht verschwinden
darf.
Einschub: Beweis:
0 0
f (x) 1 1
= f 0 (x) + f (x)
g(x) g(x) g(x)
f 0 (x) g 0 (x)
= − 2 f (x)
g(x) g (x)
f 0 (x)g(x) − f (x)g 0 (x)
=
g 2 (x)
Pn (x)
Damit können wir die Differentialquotienten aller rationalen Funktionen R(x) = ,
Qm (x)
d.h. der Quotienten aus zwei Polynomen Pn (x) und Qm (x) bestimmen.
Auch Tangens und Cotangens können wir jetzt differenzieren:
(tan x)0 = 1/ cos2 x und (cot x)0 = −1/ sin2 x,
bzw. die entsprechenden hyperbolischen Funktionen:
(tanh x)0 = 1/ cosh2 x und (coth x)0 = −1/ sinh2 x.
89
Einschub: Beweise: mit der Quotientenregel:
1
=− für x 6= 0.
sinh2 x
90
TABELLE ZUR DIFFERENTIATION
Zeile F (x) F 0 (x) ≡ (d/dx)F (x) Bemerkungen:
1 const 0
2 xr rxr−1 zunächst nur r ∈ Z
3
4 sin x cos x -
5 cos x − sin x -
6 tan x 1/ cos2 x x 6= (z + 1/2)π, z ∈ Z
7 cot x −1/ sin2 x x 6= zπ, z ∈ Z
8 arcsin x
9 arccos x
10 arctan x
11 arccot x
12 ex ex
13 rx
14 ln |x|
15 logb |x|
16 sinh x cosh x
17 cosh x sinh x
18 tanh x 1/ cosh2 x
19 coth x −1/ sinh2 x x 6= 0
20 arsinh x
21 arcosh x
22 artanh x
23 arcoth x
Um die in der Physik auftretenden Funktionen zu differenzieren, brauchen wir, wie man
schon aus den Blanks in der TABELLE sieht, zu diesen einfachen meist aus der Schule
bekannten Regeln zwei weitere Differentiationsregeln:
Bei der Differentiation verketteter Funktionen hilft uns die Kettenregel: Sie gibt uns
den Differentialquotienten einer mittelbaren Funktion z = g(f (x)) aus den Differential-
quotienten der eingesetzten inneren“ Funktion y = f (x) und der äußeren“ Funktion
” ”
z = g(y), in die eingesetzt wurde mit Wf ⊆ Dg . Mit den Bezeichnungen von Leibniz
dz
erhalten wir das Produkt aus der sogenannten äußeren“ dy und der inneren“ Ableitung
dy
” ”
dx
in Leibniz-Schreibweise:
91
dz(y(x)) dz(y) dy dz dy
Kettenregel: dx
= dy
· dx
= ( dy ) · ( dx )
oder in Lagrange-Schreibweise:
Nachdem wir mit dem Begriff der Differentiale vertraut sind, erscheint uns dieses Resultat
als Trivialität, da einfach mit dy erweitert wurde. Dennoch wollen wir den Beweis kurz
skizzieren zur Demonstration der Vorteile der Differentiale, mit deren Hilfe er nämlich
besonders einfach wird:
Zuerst für die innere“ Funktion y = f (x) : dy = f 0 (x)dx + rf mit lim rf (x, ∆x)/dx = 0,
” ∆x→0
dann für die äußere“Funktion z = g(y) : dz = g 0 (y)dy + rg mit lim rg (y, ∆y)/dy = 0.
” ∆y→0
Nach Einsetzen ergibt dies: dz = g 0 (y)(f 0 (x)dx + rf ) + rg = g 0 (y)f 0 (x)dx + g 0 (y)rf + rg ,
was nach Division durch das Differential dx im Grenzwert übergeht in:
dg df dy
dz
dx
d
≡ ( dx )g(f (x)) ≡ g 0 (y)f 0 (x) = ( dy )( dx dz
) ≡ ( dy )( dx ).
Folgendes Beispiel illustriert die Vorteile der Leibnizschen Schreibweise: Gesucht werde
die erste Ableitung von ((x + 1/x)4 − 1)3 für x 6= 0 :
0
((x + 1/x)4 − 1)3 = ( dxd
)w(z(y(x)))
dy
= ( dw
dz
dz
)( dy )( dx ) nach der Kettenregel,
2
= 12 (x + 1/x)4 − 1 (x + 1/x)3 (1 − 1/x2 ),
dy
denn y = f (x) = x + 1/x mit ( dx ) = 1 − 1/x2 ,
z = g(y) = y 4 − 1 mit ( dy
dz
) = 4y 3 und
w = h(z) = z 3 mit ( dw
dz
) = 3z 2 .
dy
Beweis mit y := x ln b : (bx )0 = ( dx
d d
)(ex ln b ) = ( dx d
)ey = ( dy )ey ( dx ) = ey ln b = bx ln b.
92
Aufgabe 5.3 Kettenregel:
Berechnen Sie folgende Differentialquotienten nach der Kettenregel:
a) (cos x)0 = (sin( π2 − x))0 , b) (sin x2 )0 , c) (sin2 x)0 , d) (e−x )0 ,
0
e) (exp(−x2 ))0 und f ) ax+b 1
.
Umkehrfunktions-Regel: dx 1 für ( dy ) 6= 0.
= ( dy
dy ) dx
dx
Wir wollen nur diese in der Leibnizschen Schreibweise suggestiv einfache und vom Stand-
punkt der Differentiale triviale Formel herleiten:
Dazu bilden wir die Ableitung von x = f −1 (f (x)) nach x nach der Kettenregel:
d
1 = ( dx )(f −1 (f (x))) = ( dy
d
)(f −1 (y))( dfdx
(x)
)= dx dy
dy dx
dy
und haben damit nach Division durch dx
6= 0 das im Kasten gezeigte Ergebnis.
Mit diesem Vorrat an Regeln können wir nun alle gewünschten Ableitungen berechnen.
Die meisten Beweise finden Sie in Einschüben:
Zunächst die
√ 1 √ 1 1
Wurzeln: y = m
x = x m für x > 0 : m
x 0 = (x m )0 = ( m1 )x m −1
√
als Umkehrfunktion von x = y m für y > 0, denn m x 0 = (x1/m )0 = 1/( dx
dy
) = 1/my m−1 =
1/m(x1/m )m−1 = (1/m)x1/m−1 , d.h. unsere Potenzregel (*) gilt auch für reziproke Expo-
nenten.
n n n
rationale Potenz: z = x m für x > 0 : (x m )0 = x −1
n m
m
D.h. die Potenzregel (*) gilt auch für beliebige rationale Exponenten.
93
Einschub: Beweis: mit y = f (x) = x1/m in der Kettenregel:
d dz dz dy
(xn/m )0 = ( )((x1/m )n ) = = ·
dx dx dy dx
d d
= ( dy )y n · ( dx )x1/m = ny n−1 · (1/m)x1/m−1
= (n/m)(x1/m )n−1 x1/m−1 = (n/m)xn/m−1/m+1/m−1
= (n/m)xn/m−1 .
Dann den
1 für x 6= 0
natürlichen Logarithmus: y = ln x für x > 0 : (ln x)0 = x
Einschub: Beweis:
dy
(ln x)0 = dx = 1/( dx d y y
dy ) = 1/( dy )e = 1/e = 1/x für x 6= 0. (In die TABELLE!)
1.
Es gilt sogar: (ln |x|)0 = x
Denn (ln(−x))0 = dz/dx = dz/dy · dy/dx = 1/y(−1) = −1/(−x) = 1/x für x 6= 0.
D.h. unsere Potenzregel (*) gilt universell auch für beliebige reelle Exponenten.
zu einer beliebigen reellen Basis b ∈ R haben wir jetzt die Ableitung, und zwar als
Umkehrfunktion der allgemeinen Exponentialfunktion x = by .
94
Einschub: Beweis:
(logb x)0 = dy 1 =
= ( dx 1 = 1 . (In die TABELLE: Zeile 15!)
dx )
dy by ln b x ln b
Wir schließen diese auch für das übernächste Kapitel noch wichtige Liste der Differential-
quotienten mit den zyklometrischen Funktionen und den Area-Funktionen ab:
Für den
Arcus tangens für −π/2 < arctan x < π/2 : (arctan x)0 = 1
1 + x2
Für den
Arcus sinus für −π/2 < arcsin x < π/2 : (arcsin x)0 = √ 1 2 für |x| < 1
1−x
Einschub: Beweis:
p mit der
p Umkehrfunktion x = sin y, wobei aus
dx
dy = cos y = (1 − sin2 y) = (1 − x2 ) für |x| < 1 folgt:
dy
(arcsin x)0 = dx = 1/( dx
p
dy ) = 1/ (1 − x2 ). (In die TABELLE: Zeile 8!)
Analog für
Arcus cosinus für 0 < arccos x < π : (arccos x)0 = − p 1 für |x| < 1
(1 − x2 )
95
Aufgabe 5.5 Beweisen Sie das mit der Umkehrfunktion: x = cos y.
Für den
und den
Aufgabe 5.6 Beweisen Sie das mit der Umkehrfunktion x = tanh y bzw. mit x = coth y.
Für den
und
Aufgabe 5.7 Beweisen Sie das mit der Umkehrfunktion x = sinh y bzw. mit x = cosh y ≥
1, eineindeutig nur für y > 0.
96
TABELLE ZUR DIFFERENTIATION
Zeile F (x) F 0 (x) ≡ (d/dx)F (x) Bemerkungen:
1 const 0
2 xr rxr−1 r∈R
3
4 sin x cos x
5 cos x − sin x
6 tan x 1/ cos2 x x 6= (z + 1/2)π, z ∈ Z
2
7 cot x −1/
p sin x x 6= zπ, z ∈ Z
8 −π/2 < arcsin x < π/2 1/ p(1 − x2 ) |x| < 1
9 0 < arccos x < π −1/ (1 − x2 ) |x| < 1
10 −π/2 < arctan x < π/2 1/(1 + x2 )
11 0 < arccot x < π −1/(1 + x2 )
12 ex ex
13 rx x
r ln r 0<r∈R
14 ln |x| 1/x x 6= 0
15 logb |x| 1/x ln b x 6= 0, 0 < b ∈ R, b 6= 1
16 sinh x cosh x
17 cosh x sinh x
18 tanh x 1/ cosh2 x
2
19 coth x −1/
p sinh x x 6= 0
20 arsinh x 1/p(x2 + 1)
21 0 < arcosh x 1/ (x2 − 1) x>1
22 artanh x 1/(1 − x2 ) |x| < 1
23 arcoth x −1/(x2 − 1) |x| > 1
Bestimmen Sie die Differentialquotienten für folgende Funktionen y = f (x) mit Konstan-
ten a, b, c und d:
a) y = sin3 (4x), b) y = exp(−(x/a)2 ), c) y = √ax12 +b , d) y = ln(3e2x ),
e) y = a cosh x−b
a
, f ) y = ax2 exp(−bx), g) y = cos(ax + b) sin(cx + d),
2
1 sin(x/a)
h) y = 1+(x/a)2 , i) y = (x/a)
, j) y = arctan(1/x) + (x/2) (ln x2 − ln(x2 + 1)).
Berechnen sie die ersten fünf Ableitungen folgender Funktionen f (x), die wir im nächsten
Kapitel brauchen werden:
1
k) f (x) = sin x, l) f (x) = tan x, m) f (x) = ex und n) f (x) = 1−x 2.
97
5.6 Numerische Differentiation
In manchen Fällen kann oder will man die Ableitung einer Funktion nicht analytisch
nach den Regeln des vorigen Abschnitts berechnen, z.B. wenn man noch keine analytische
Form für den Graph einer Funktion gefunden hat. Dann ist man auf die numerische
Differentiation angewiesen.
Unsere Definitionsgleichung des Differentialquotienten aus Abschnitt 5.2:
98
wenn man vom Luftwiderstand absieht, aus Newtons zweitem Gesetz folgende Differenti-
algleichung:
ẍ(t) + ω 2 x(t) = 0 mit einer Konstanten ω.
Wie die meisten Differentialgleichungen der Physik ist sie zweiter Ordnung“, d.h. der
”
höchste auftretende Differentialquotient ist eine zweite Ableitung der gesuchten Funktion.
Während bei einer normalen“ Gleichung, z.B. mit einer Unbekannten etwa x2 − 1 = 0,
”
die Zahlenwerte für x, hier x = ±1, gesucht werden, sind bei dieser Differentialgleichung“
”
jetzt Funktionen der Zeitvariablen x(t) als Lösungen gesucht. Man sieht sehr schnell, dass
x(t) = sin ωt eine Lösung ist, da ẋ(t) = ω cos ωt und folglich ẍ(t) = −ω 2 sin ωt. Aber ist
das die einzige Lösung? Mit solchen Fragen werden Sie sich noch viel beschäftigen.
k) x(t) = x0 tanh(ωt)
wm0 µt µt
l) x(t) = µ
(1 − m0
) ln(1 − m0
) − gt2 /2 + wt.
Sie werden später bei den Funktionen mehrerer Variablen noch kompliziertere Differentia-
tionsoperationen kennen lernen: mit Hilfe der sogenannten partiellen Ableitungen werden
99
Sie Gradienten von Skalarfeldern sowie die Divergenz oder die Rotation von Vektorfel-
dern bilden. Wenn es aber darum geht, Zahlen auszurechnen, werden Sie nichts anderes
benötigen als das, was Sie hier gelernt haben.
d
a) dx1
+ x2 + x3 ) b) dxd1 (x21 + x22 + x23 ) c) dxd1 (x1 x2 x3 )
(x1
d) lim d 2x1 x2 und e) d q 1 .
x1 →0 dx1 x21 + x22 dx1 2
x +x +x2 2
1 2 3
100
Kapitel 6
TAYLOR-ENTWICKLUNG
Eines der großen Anwendungsgebiete der Differentialrechnung wollen wir genauer un-
tersuchen, da es für alle Naturwissenschaftler unerlässlich ist, in den Schulen aber im
allgemeinen nicht oder nur sehr ungenügend behandelt wird. Es handelt sich um die
Taylor-Entwicklung, die es ermöglicht, eine große Zahl der in den Naturwissenschaften
gebrauchten Funktionen f (x) in der Umgebung eines bestimmten Wertes x0 der unab-
hängigen Variablen x, durch eine Potenz-Reihe darzustellen und zu berechnen.
6.1 Potenzreihen
Die bei weitem einfachsten Funktionen sind die Potenzen xn mit natürlichen Exponenten
n ∈ N und die daraus allein durch Addition und Multiplikation gebildeten Polynome
m
an xn . Deren Funktionswerte lassen sich schnell berechnen. Auch die aus
P
Pm (x) =
n=0
∞
an xn erscheinen
P
Folgen von polynomialen Partialsummen gebildeten Potenzreihen
n=0
uns noch relativ einfach im Vergleich zu der Vielfalt der elementaren und transzendenten
”
“ Funktionen. Potenzreihen können addiert und subtrahiert, falls sie absolut konvergieren,
auch multipliziert, dividiert und sogar gliedweise differenziert (und später auch integriert)
werden. Wie schön wäre es, wenn wir uns nur mit Potenzreihen beschäftigen müssten!
Wir werden sehen, dass dieser Wunschtraum bis zu einem gewissen Grad realisiert werden
kann. Die Differentialquotienten sind die Schlüssel dazu.
101
6.2 Vorbild geometrische Reihe
Wir betrachten zuerst noch einmal das einfachste aller Polynome, die geometrische Sum-
m
xn mit den Koeffizienten an = 1 mit n ∈ N0 , und die zugehörige
P
me, Gm (x) :=
n=0
Potenzreihe, die geometrische Reihe:
∞
X
Geometrische Reihe: G∞ (x) := xn = 1 + x + x2 + x3 + x4 + ...
n=0
1
= für |x| < 1
1−x
Darin haben wir bereits einen Prototyp für unseren Wunschtraum: Die rationale Funk-
tion 1/(1 − x) wird im offenen Intervall ] − 1, 1[ um die Stelle x0 = 0 herum durch eine
∞
xn , dargestellt, d.h. durch die Summe aus der
P
Potenzreihe, die geometrische Reihe
n=0
Konstanten eins, der winkelhalbierenden Geraden, der Normalparabel, einer bestimmten
Funktion dritten Grades usw. angenähert. Diese Reihe hat zwar unendlich viele Glieder;
sie sind jedoch allein durch Addition und Multiplikation berechenbar, und je nach Genau-
igkeitsanforderungen reichen schon wenige Glieder aus. Allerdings existiert die Darstellung
nur im Intervall ] − 1, 1[, während die Funktion 1/(1 − x) überall außer für x = 1 definiert
ist.
1. Gibt es auch für andere Funktionen Potenzreihen, die sie in gewissen Intervallen
darstellen ?
4. Wie gut ist die Konvergenz bzw. wie groß ist der Näherungsfehler beim Abbruch
der Reihe ?
102
6.3 Form und Eindeutigkeit
Ehe wir uns mit der Existenzfrage beschäftigen, wollen wir uns den Fragen 2 und 3 zu-
wenden: Um Information über die möglichen Eigenschaften der gesuchten Entwicklung zu
erhalten, wollen wir zunächst einmal annehmen, wir hätten schon eine Potenzreihe:
∞
X
f (x) = an xn = a0 + a1 x + a2 x2 + a3 x3 + a4 x4 + ...
n=0
mit f (0) = a0 gefunden, die die betrachtete Funktion f (x) in einem Intervall z.B. für
|x| < R um den Nullpunkt herum darstellt. Da alle Funktionen unserer Grundausstattung
unendlich oft differenzierbar sind, können wir die Ableitungen der Potenzreihe gliedweise
der Reihe nach berechnen:
X∞
0
f (x) = nan xn−1 = a1 + 2a2 x + 3a3 x2 + 4a4 x3 + . . .
n=1
f 0 (0)
mit f 0 (0) = a1 , also a1 =
1!
∞
X
00
f (x) = n(n − 1)an xn−2 = 2a2 + 3 · 2a3 x + 4 · 3a4 x2 + . . .
n=2
f 00 (0)
mit f 00 (0) = 2a2 , also a2 =
2!
∞
X
000
f (x) = n(n − 1)(n − 2)an xn−3 = 3!a3 + 4!a4 x + . . .
n=3
f 000 (0)
mit f 000 (0) = 3! a3 , also a3 = .
3!
Allgemein:
Wir erhalten so die gesuchten Koeffizienten an aus den Ableitungen f (n) (0) der darzustel-
lenden Funktion an der Entwicklungsstelle x0 = 0. Falls also eine Potenzreihen-Darstellung
unserer Funktion existiert, hat sie folgende Form, und wir nennen sie:
∞
P f (n) (0) n
Taylor-Reihe: f (x) = x .
n=0
n!
103
Nach der angegebenen Konstruktion sind die Koeffizienten überdies eindeutig, so dass
wir auch die Frage 3 beantwortet haben.
Unsere Überlegungen zeigen uns auch, dass die darzustellende Funktion notwendiger-
weise beliebig oft differenzierbar sein muss, wenn eine Taylor-Reihe existieren soll.
Dass diese notwendige Voraussetzung nicht hinreichend für die Existenz einer zuge-
hörigen Taylor-Reihe ist, sieht man aus folgendem Gegenbeispiel: Die unten abgebildete
Funktion, f (x) = exp(−1/x2 ) für x 6= 0 und f (0) = 0, ist zwar überall unendlich oft
differenzierbar, alle ihre Ableitungen f (n) (0) = 0 verschwinden jedoch an der Stelle x = 0,
so dass keine Taylor-Reihe um 0 gebildet werden kann.
Bild 6.1: Graph der Funktion f (x) = exp(−1/x2 ) für x 6= 0 und f (0) = 0
Aufgabe 6.1 Berechnen Sie als Konsistenztest die Taylor-Reihe unseres Vorbilds, der
geometrischen Reihe, für |x| < 1.
∞
r(r − 1) 2 r(r − 1)(r − 2) 3
r
x =1+ rx+
n
f (x) = (1 + x)r =
P
x + x + ...
n=0
n 1! 2! 3!
104
Bild 6.2: Aufbau der geometrischen Reihe
r
r(r−1)(r−2)...(r−n+1) r
mit dem verallgemeinerten Binomialkoeffizient n
:= n!
und 0
:= 1.
Zum Beweis:
f 0 (x) = r(1 + x)r−1 , f 00 (x) = r(r − 1)(1 + x)r−2 ,
f 000 (x) = r(r − 1)(r − 2)(1 + x)r−3 . . . usw.
allgemein : f (n) (x) = r(r − 1)(r − 2) . . . (r − n + 1)(1 + x)r−n
105
Zunächst finden wir für natürliche r = n ∈ N unsere in Abschnitt 2.2.3 abgeleitete
binomische Formel wieder für den Spezialfall a = 1 und b = x, da die Potenzreihe im Fall
natürlicher Exponenten abbricht: m
n
X m n
(1 + x) = x
n=0
n
. Für negative r ∈ Z ergibt sich z.B. für r = −1 erneut die alternierende geometrische
Reihe ∞
1 2 3
X
= 1 − x + x − x ± ... = (−1)n xn
(1 + x) n=0
Für gebrochene r ∈ Q, z.B. r = 1/2 oder −1/2 erhalten wir die häufig gebrauchten
Reihenentwicklungen der Quadratwurzel im Zähler bzw. Nenner:
√
1 + x = 1 + (1/2)x − (1/8)x2 + (1/16)x3 − (5/128)x4 ± . . . bzw
p
1/ (1 + x) = 1 − (1/2)x + (3/8)x2 − (5/16)x3 + (35/128)x4 ∓ . . .
Aufgabe 6.2 Berechnen Sie die Taylor-Reihen von (1 + x)r für r = −3, 1/3 und −1/3.
106
Einschub: : Daraus sieht man erneut, was wir im Einschub von Abschnitt 4.9
geometrisch nach l’Hopital bewiesen hatten, dass
sin x x − x3 / 3! + x5 / 5! ∓ . . .
lim = lim = lim (1 − x2 / 3! + x4 / 5! ∓ . . .) = 1
x→0 x x→0 x x→0
∞
(−1)n x2n /(2n)! = 1 − x2 / 2! + x4 / 4! − x6 / 6! ± . . .
P
f (x) = cos x =
n=0
107
6.4.3 Exponentialfunktionen
∞
f (x) = ex =
P xn = 1 + x + x2 /2 + x3 /6 + x4 /24 + . . .
n=0
n!
108
Einschub: : Aus dieser Reihe können wir leicht erneut den Grenzwert
lim (ex − 1)/x = lim (1 + x + x2 /2 + x3 /6 + . . . − 1)/x
x→0 x→0
= lim (1 + x/2 + x2 /6 + . . .) = 1
x→0
berechnen, der uns früher in Aufgabe 4.14d einige Mühe bereitet hatte.
In der folgenden Tabelle haben wir für einige besonders häufig auftretende Funktionen
jeweils die ersten beiden Terme der Taylor-Entwicklung zum Auswendiglernen zusammen-
gestellt.
f (x) f (0) + xf 0 (0)
(1 + x)r 1+r·x
sin x x
cos x 1
exp x 1+x
ln(1 + x) x
Mit diesen wenigen Taylor-Reihen erhalten wir leicht eine große Zahl weiterer Entwick-
lungen, wenn wir berücksichtigen, was wir früher über das Rechnen mit Reihen gelernt
haben. Als Beispiel für eine Linearkombination zweier Taylor-Reihen berechnen wir
die Entwicklung des Sinus hyperbolicus:
∞
ex − e−x X xn
f (x) = sinh x = = (1 − (−1)n )
2 n=0
2n!
∞
X x2n+1
= = x + x3 /3! + x5 /5! + x7 /7! + . . .
n=0
(2n + 1)!
Überraschenderweise ist das genau die Taylor-Reihe des trigonometrischen Sinus, nur ohne
die Vorzeichenwechsel, was ein Licht auf die Namensgebung wirft.
109
Ein weiteres Beispiel zeigt, wie man die Taylor-Reihe des Produkts zweier Funktio-
nen aus den Taylor-Reihen der Faktoren erhält, indem man die beiden Reihen einfach
gliedweise multipliziert und das Ergebnis nach Potenzen sortiert:
∞
! ∞ !
n 2m+1
X x X x
f (x) = ex sin x = (−1)m
n=0
n! m=0
(2m + 1)!
= (1 + x + x2 /2 + x3 /6 + x4 /24 + . . .)(x − x3 /3! + x5 /5! − x7 /7! ± . . .)
= x + x2 + (3 − 1)x3 /3! + (1 − 1)x4 /3! + (1 − 10 + 5)x5 /5! + . . .
= x + x2 + x3 /3 − x5 /30 + . . .
Auch bei verketteten Funktionen, bei denen man die Taylor-Reihen der inneren und
äußeren Funktion kennt, ist es oft einfacher, diese ineinander einzusetzen, als die Diffe-
rentialquotienten direkt zu berechnen, z.B.
∞ ∞
!n
2m+1
X X x
f (x) = exp(sin x) = (−1)m /n!
n=0 m=0
(2m + 1)!
= 1 + (x − x3 /3! + . . .) + (x − x3 /3! + . . .)2 /2 + (x − x3 /3! + . . .)3 /3! + . . .
= 1 + x + x2 /2 + (1 − 1)x3 /3! + (1 − 4)x4 /4! + . . .
= 1 + x + x2 /2 − x4 /8 + . . .
Aufgabe 6.6 Berechnen Sie die ersten vier Terme der Taylor-Entwicklungen
a) von tan x durch Division der Reihen,
b) des Produkts ex sin x direkt durch Berechnung der Ableitungen,
c) der verketteten Funktion exp(sin x) ebenfalls direkt.
6.5 Konvergenzradius
Bereits bei unserem Vorbild, der geometrischen Reihe, war die Gültigkeit der Reihenent-
wicklung auf das Intervall |x| < 1 um den Nullpunkt herum beschränkt. Auch bei den
anderen Taylor-Reihen, selbst wenn die darzustellenden Funktionen in einem abgeschlosse-
nen Intervall (d.h. einschließlich der Randpunkte) unendlich oft differenzierbar sind, ist die
110
Konvergenz im Allgemeinen auf das Innere eines zum Nullpunkt symmetrischen Intervalls
beschränkt: |x| < R. Die Zahl R wird Konvergenzradius“ genannt, wobei das Wort
”
Radius“ erst in der Funktionentheorie, d.h. bei Potenzreihen von komplexen Zahlen ver-
”
ständlich wird. Innerhalb dieses durch R begrenzten symmetrischen Konvergenzbereichs
konvergieren alle Taylor-Entwicklungen dann allerdings sogar absolut. Außerhalb, d.h. für
|x| > R, sind sie divergent. Die Konvergenz in den beiden Randpunkten muss in jedem
Einzelfall genauer untersucht werden.
Die Mathematiker stellen uns (durch Vergleich z.B. mit der geometrischen Reihe) Metho-
den bereit, um den Konvergenzradius zu bestimmen. Wir wollen nur eine dieser hinrei-
∞
an x n
P
chenden Bedingungen für die absolute Konvergenz einer Reihe f (x) =
n=0
hier angeben, nämlich das von D’Alembert stammende Quotienten-Kriterium, nach
dem der Konvergenzradius folgendermaßen geschrieben werden kann:
(n)
an
f (0) (n + 1)!
R = lim an+1 = lim
.
n→∞ n→∞ n! f (n+1) (0)
Aufgabe 6.7 Was können Sie über die Konvergenzradien für folgende Taylor-Reihen um
1
x0 = 0 sagen: a) cos x und cosh x, b) 1−3x , c) ln(1 + x) und d) tan x?
111
6.6 Genaue Regeln für das ungenaue Rechnen
Auch wenn die Physik das Paradebeispiel für eine exakte Wissenschaft ist, sind Appro-
ximationen an der Tagesordnung. Das Entscheidende für die exakten Wissenschaften ist,
dass man eine Näherung begründet, konsequent durchführt und die Genauigkeit zu kon-
trollieren imstande ist.
Oft ist es z.B. nicht sinnvoll, genauer zu rechnen als der Messfehler des Experiments.
Auch in der Mathematik ist es manchmal ausreichend, den Wert einer Funktion f (x) aus
der Taylor-Reihe nur bis zur Ordnung m auszuwerten d.h. nur die ersten m Glieder
mitzunehmen. Wir schreiben das dann folgendermaßen:
m
f (n) (0) n
x + O(xm+1 ).
P
f (x) =
n=0
n!
Dabei bedeutet O(xm+1 ), dass der weggelassene Term mindestens von der Ordnung xm+1
ist, also m + 1 oder mehr Faktoren x enthält.
Wir wollen hier die Regeln für das approximative Rechnen zusammenstellen. Dabei besteht
die Approximation darin, dass wir konsequent bis zur Ordnung xm alle Terme mitnehmen.
Welche Regeln sich daraus ergeben, zeigen wir am einfachsten, aber häufig auftretenden
Fall m = 1, d.h. wenn die Reihe schon nach dem zweiten Term abgebrochen wird:
Beachten Sie, dass wir in den Entwicklungen für f (x) und g(x) denselben Ausdruck O(x2 )
verwenden: O(x2 ) steht nicht für einen bestimmten numerischen Wert, sondern ist nur eine
symbolische Schreibweise für das, was jeweils weggelassen wurde.
Für das Produkt der beiden Funktionen f (x) und g(x) ergibt sich dann:
f (x) · g(x) = f0 g0 + x(f00 g0 + f0 g00 ) + x2 f00 g00 + (f0 + x · f00 + g0 + x · g00 )O(x2 ).
Hier sind die ersten drei Terme klar definiert, im letzten werden jedoch konkret angegebene
Ausdrücke mit dem Symbol O(x2 ) multipliziert. Was bedeutet das?
112
m
Wir können schreiben O(x2 ) = an xn mit irgendwelchen Koeffizienten an . Dann lässt
P
n=2
sich der erste Teil des interessierenden Ausdrucks schreiben als
m
X m
X
2 n
f0 O(x ) = (f0 an )x = bn xn = O(x2 ),
n=2 n=2
da diese Reihe wieder mit x2 beginnt, wenn auch mit anderen Koeffizienten bn = f0 an .
Weiterhin gilt:
m
X m
X
xf00 O(x2 ) = (f00 an )xn+1 = cn xn = O(x3 ),
n=2 n=3
3
weil diese Reihe mit einem x -Term anfängt. Für die Summe erhalten wir
denn die niedrigste und in der Umgebung des Ursprungs dominante Potenz ist x2 . Wenn
wir in dem Ausdruck für das Produkt f (x)g(x) auch den dritten Term als von der Ordnung
x2 identifizieren und zu den übrigen hinzuschlagen, erhalten wir insgesamt:
Diesen Ausdruck hätten wir auch erhalten, wenn wir die Taylor-Reihe für die Produkt-
funktion F (x) := f (x)g(x) berechnet hätten,
wobei F (0) = f0 g0 ist und die Produktregel bei der Differentiation F 0 (0) = f00 g0 + f0 g00
ergeben hätte. Noch eine Warnung: Übereifrige könnten meinen, man solle doch in dem
approximativen Ausdruck für f (x)g(x) wenigstens noch den leicht berechenbaren Term
x2 f00 g00 mitnehmen. Das wäre jedoch inkonsequent, da andere Terme derselben Ordnung
nicht berücksichtigt wurden.
Für die r-te Potenz einer beliebigen Funktion f (x) ergibt sich:
f0 f0
f r (x) = f0r (1 + x f00 )r = f0r (1 + rx f00 ) + O(x2 ),
wobei wir die allgemeine binomische Reihe (1 + x)r = 1 + r · x + O(x2 ) aus unserer kleinen
Tabelle entnommen haben. Speziell für r = −1, d.h. das Inverse einer Funktion f (x)
folgt:
113
f0
f −1 (x) = f0−1 (1 − x f00 ) + O(x2 ).
Man erhält diese Entwicklung natürlich auch, wenn man die Taylor-Reihe für die inverse
Funktion nach dem zweiten Glied abbricht.
Bei mittelbaren Funktionen F (x) = f (g(x)) schreibt man am einfachsten die Taylor-
Entwicklung direkt hin:
Als numerisches Beispiel betrachten wir die Aufgabe (1, 2)1/20 = (1 + 0, 2)1/20 = 1 +
0, 2/20 + O((0, 2)2 ) = 1, 01 + O(0, 04), während der exakte Wert 1, 009 157 756 ist, der
Fehler also bei 0, 000 8 liegt.
Aufgabe 6.8 Entwickeln Sie um die Stelle x = 0 bis zur ersten Ordnung:
√
a) (1 + x)ex , b) e−x sin x, c) 3 8 + x, d) sin x cos x, e) cosh
1
x
und f ) exp(sin x).
Aufgabe 6.9 Berechnen bis zur ersten Ordnung und vergleichen Sie jeweils mit dem
exakten Wert:
a) sin 0, 1, b) e−0.3 , c) ln 0, 8 = ln(1 − 0, 2) und d) 171/4 = (16 + 1)1/4
Anstatt das
114
genau zu berechnen, wollen wir nur eine Formel angeben, die aus dieser Rechnung her-
vorgeht und dazu dienen kann, rm (x) abzuschätzen, die sogenannte
Der Ausdruck setzt uns zunächst in Erstaunen, denn er hat die leicht einprägsame Form
des (m + 1)-ten Gliedes der Reihe, d.h. des ersten weggelassenen Terms, soll jedoch für
die ganze Restreihe stehen. Dieser scheinbare Widerspruch wird dadurch aufgeklärt, dass
die (m + 1)-te Ableitung im Restglied nicht wie beim (m + 1)-ten Glied der Reihe am
Entwicklungspunkt 0 zu nehmen ist, sondern an einer unbekannten Zwischenstelle θx
zwischen dem Entwicklungspunkt 0 und der interessierenden Stelle x, ausgedrückt durch
die unbekannte Zahl θ mit 0 < θ < 1. Wegen dieser Unbekanntheit von θ lässt sich das
Restglied im Allgemeinen nicht ausrechnen, sondern nur
|f (m+1) (θx)||xm+1 |
abschätzen: |rm (x)| ≤ max (m+1)!
.
0<θ<1
Aus dieser Abschätzungsformel sieht man, dass der Fehler kleiner wird mit der (m + 1)-
ten Potenz des Abstands der untersuchten Stelle x vom Entwicklungspunkt 0, dass es also
günstig ist, mit dem Entwicklungspunkt möglichst nahe an den interessierenden Punkt
heranzugehen.
Als Beispiel wollen wir sin 100◦ = sin(5π/9) bis auf r5 (x) berechnen mit der in Abschnitt
6.4.2 gewonnenen Taylor-Reihe um den Punkt x0 = 0:
Aufgabe 6.10 Berechnen Sie die quadratischen Glieder der Taylor-Entwicklungen und
die Restglieder r2 (x) in unserer Tabelle im Abschnitt 6.4.3. Wählen Sie dazu z.B. für
r = 1/2, −1/2 und −1 und schätzen Sie die Fehler ab: Bei welchen Stellen x betragen die
relativen Fehler r2 (x)/f jeweils 1% bzw. 10%?
√
4
Aufgabe 6.11 Berechnen Sie e3 mit der Taylor-Reihe um x0 = 0 bis auf r3 .
115
6.8 Taylor-Entwicklung um beliebigen Punkt
Nachdem wir gesehen haben, wie sehr es bei der Anwendung der Taylor-Entwicklungen
zur Berechnung von Funktionswerten in der Nähe von Entwicklungspunkten, an denen
die Funktion bekannt ist, auf die Nähe zur Entwicklungsstelle ankommt, wenden wir
uns schließlich dem Problem der geschickten Wahl der Entwicklungsstelle x0 zu, die wir
zunächst immer gleich 0 gesetzt haben.
∞
f (n) (x0 )
(x − x0 )n ,
P
Taylor-Entwicklung um den Punkt x0 : f (x) =
n=0
n!
(n)
R = lim aan+1
n f (x0 ) (n+1)
= lim f n+1 (x0 )
n→∞ n→∞
und für den Fehler beim Abbrechen nach dem m-ten Glied:
∞
X π 2n
f (x) = sin x = (−1)n (x −
) /(2n)!
n=0
2
π π
= 1 − (x − )2 /2! + (x − )4 /4! ± . . .
2 2
116
Zum Beweis:
f 0 (x) = cos x, f 00 (x) = − sin x,
f 000 (x) = − cos x, f (4) (x) = sin x, . . .
mit
π π
f ( ) = 1, f 0 ( ) = 0,
2 2
00 π 000 π
f ( ) = −1, f ( ) = 0,
2 2
(4) π
f ( ) = 1, ...
2
∞
insgesamt: sin x = 1 − (x − π2 )2 /2! + (x − π2 )4 /4! ± . . . = (−1)n (x − π2 )2n /(2n)!
P
n=0
mit dem Konvergenzradius R = lim |(2(n + 1))!/(2n)!| = lim |(2n + 1)(2n + 2)| = ∞.
n→∞ n→∞
◦
Wir wollen sogleich überprüfen, wie das näher bei 100 liegende Entwicklungszentrum
x0 = π2 unsere in Abschnitt 6.6 mit dem Entwicklungszentrum x0 = 0 durchgeführte
Berechnung von sin 100◦ = sin(10π/18) verbessert:
sin x = 1 − (x − π/2)2 /2! + (x − π/2)4 /4! − r4 (x).
Das ist zu vergleichen mit der früher erhaltenen Fehlerabschätzung von 9, 38 · 10−3 , d.h.
durch die günstigere Wahl des Entwicklungszentrums konnte der Fehler bei vergleichbarem
Rechenaufwand um mehr als vier Größenordnungen herabgesetzt werden.
Für andere gesuchte Zwischenwerte können wir den Sinus auch um x0 = π/4 entwickeln:
√
f (x) = sin x = (1/ 2)[1 + (x − π/4) − (x − π/4)2 /2! − (x − π/4)3 /3! + + − − . . .],
Jetzt können wir auch eine Entwicklung des natürlichen Logarithmus angeben, etwa
um x0 = 1 :
117
∞
(−1)n+1 (x − 1)n /n = (x − 1) − (x − 1)2 /2 + (x − 1)3 /3 + . . .
P
f (x) = ln x =
n=1
Wenn wir darin x durch x + 1 ersetzen, gelangen wir wieder zu unserer früheren Taylor-
Entwicklung von ln(x + 1) um den Punkt 0.
√4
Aufgabe 6.13 Berechnen Sie e3 bis auf r3 , jetzt aber mit der Taylor-Reihe um x0 = 1,
und vergleichen Sie mit der Rechnung bei x0 = 0 in Aufgabe 6.11.
Sie werden im Verlauf Ihres Studiums noch viele andere Entwicklungen kennenlernen
und selbst durchführen. Auch für Felder gibt es Taylor-Entwicklungen, z.B. die berühmte
Multipol-Entwicklung. Sie werden die in den Naturwissenschaften häufigen periodischen
Funktionen nach Fourier im quadratischen Mittel“ mit Cosinus und Sinus als Basisfunk-
”
tionen entwickeln und später auch nichtperiodische Funktionen mit Hilfe der Exponential-
funktion nach Fourier transfomieren“. Komplexe Funktionen können sogar in einer gewis-
”
sen Umgebung von bestimmten Singularitäten nach Laurent entwickelt werden. Schließlich
werden Sie in der Quantenmechanik verschiedene störungstheoretische Entwicklungen um
die wenigen exakt lösbaren Systeme durchführen, wie den harmonischen Oszillator. Die
theoretische Physik ist zu einem beträchtlichen Teil die hohe Kunst des Entwickelns.
118
Kapitel 7
INTEGRATION
Das zweite Standbein der mathematischen Methoden für alle Naturwissenschaften ist die
Integralrechnung. In gewissem Sinn ist die Integration die Umkehrung der Differentiation.
Während diese einer Funktion f (x) ihre Steigung f 0 (x) zuordnet, beschäftigt sich die In-
tegralrechnung mit Problemen, bei denen etwas über die Steigung einer Funktion bekannt
ist und Funktionen mit dieser Steigung gesucht werden. Diese Aufgabe ist viel schwieriger
als die der Differentiation, hat aber eine zentrale Bedeutung in den Naturwissenschaften.
Es hat sich nämlich herausgestellt, dass die Grundgesetze der Mechanik, der Elektrody-
namik und der Quantenmechanik in Form von Differentialgleichungen formuliert werden
können, die Aussagen über die Ableitungen von Funktionen machen. Z.B. sagt das zwei-
te Newtonsche Gesetz über die Bahnkurve x(t) eines Teilchens unter dem Einfluss einer
Kraft K etwas über die zweite Ableitung, also die Beschleunigung:
m( dtd )2 x(t) = K.
Für eine gegebene Kraft z.B. die Schwerkraft oder eine elektrische Kraft soll daraus die
Bahnkurve ermittelt werden. Integrieren heißt da einfach, Lösen der Grundgleichungen
bzw. Anwenden der Theorie auf die verschiedenen in der Praxis vorliegenden Fälle.
In den vorhergehenden Kapiteln haben Sie das Handwerk des Differenzierens gelernt und
eingeübt. Es ist eigentlich nicht so schwierig, wenn man einige Regeln beherzigt. Das
Integrieren dagegen ist eine Kunst“, wie Sie bald sehen werden. Aber wie noch kein
”
Künstler vom Himmel gefallen ist, sondern sein Talent erst durch Lernen, Sammeln von
Erfahrungen und Üben entwickeln muss, so ist es auch beim Integrieren. Dazu sollen die
nächsten Abschnitte Ihnen Gelegenheit geben.
119
7.1 Arbeit
Wir betrachten wieder zunächst die gleichförmige Bewegung eines Massenpunkts auf
einer Geraden, z.B. den Schwerpunkt eines Autos auf einer Autobahn. Nachdem wir die er-
ste Frage nach der Geschwindigkeit mit Hilfe der Differentialrechnung beantwortet haben,
fragen wir mit den Physikern eine Schicht tiefer nach dem Grund: Warum bewegt sich das
Auto auf dem geraden ebenen Autobahnabschnitt mit der beobachteten gleichförmigen
Geschwindigkeit? Klarerweise ist die Ursache der gleichförmigen geradlinigen Bewegung
nach Newton eine Kraft, und zwar die Kraft K, mit welcher der Motor den Wagen gegen
Trägheit, Wind und andere Reibungsverluste vorantreibt. Spätestens beim Tanken kommt
dann die Frage nach der Arbeit A, die der Motor auf der zurückgelegten Strecke ∆x
geleistet hat. Diese Arbeit ist umso größer, je größer die benötigte Kraft war, und ist
außerdem der zurückgelegten Wegstrecke ∆x proportional, ja sie ist genau gleich dem
Produkt dieser beiden Größen: A = K∆x, geometrisch gleich der Rechtecksfläche aus
K mal ∆x, wenn wir etwa in einem kartesischen, d.h. rechtwinkligen Koordinatensystem
den zurückgelegten Weg x in Richtung der 1-Achse und die jeweils wirkende Kraft K in
Richtung der 2-Achse auftragen.
Bild 7.1: Konstante Kraft K als Funktion der zurückgelegten Wegstrecke von a bis b =
a + ∆x. Das Rechteck A = K∆x wurde getönt.
Nach diesem idealisierten Fall einer konstant wirkenden Kraft gehen wir sogleich zu dem
realistischeren Fall über, dass die Kraft sich auf der Strecke ändert, z.B. durch Gasgeben
von einem Anfangswert K0 linear anwächst: K(x) = sx + K0 :
120
Bild 7.2: Linear vom Anfangswert K0 nach K(x) = sx + K0 anwachsende Kraft über dem
zurückgelegten Weg x zwischen den Punkten a und b
Aus dem Bild sehen wir sofort, wie wir uns behelfen, wenn beim Tanken wieder die
Frage nach der auf der ganzen Strecke geleisteten Arbeit auftaucht. Wir nehmen den
Mittelwert ξ = (a + b)/2 zwischen dem Startpunkt a und dem Endpunkt b, lesen den
entsprechenden Funktionswert der Kraft K(ξ) = K((a + b)/2) ab und multiplizieren
diesen mit der zurückgelegten Wegstrecke ∆x = b − a:
A = K(ξ)∆x = K( a+b
2
)(b − a).
Damit haben wir die physikalische Frage nach der Arbeit auf die geometrische Fragestel-
lung nach der Fläche unter der Kraftgeraden über dem Intervall ∆x“, genauer:
”
nach dem Inhalt der Fläche zurückgeführt, die von der Funktion nach oben, der Geraden
x = a nach links, der Geraden x = b nach rechts und der 1-Achse K(x) = 0 nach unten
begrenzt wird. Die weitergehende Frage nach der Arbeit bei einer nach einer beliebi-
gen Funktion variablen Kraft ist damit zurückgeführt auf das mathematische Problem
der Bestimmung des Flächeninhalts eines Rechtecks, bei dem eine (hier die obere) Seite
durch eine krumme Linie ersetzt ist. Wir wollen im Folgenden sogleich diese allgemeinere
mathematische Fragestellung untersuchen und einer Lösung zuführen, die dann auch alle
Wünsche der Physiker nach der Arbeit und darüber hinaus noch viele andere Wünsche
erfüllt.
121
7.2 Fläche unter einer Funktion über einem Intervall
Den gesuchten Flächeninhalt F (f (x); a, b) unter“ einer beliebigen beschränkten steti-
”
gen, aber zunächst positiven Funktion f (x) > 0 über“ der endlichen Wegstrecke zwi-
” ”
schen“ Anfangspunkt a und Endpunkt b, oft auch einfach Fa (b)genannt, erhalten wir nach
dem oben für eine Gerade angedeuteten Rezept: Wir teilen die zu berechnende Fläche in
viele schmale senkrechte Streifen, deren obere Seiten annähernd gerade sind, berechnen
die Flächeninhalte der Streifen wie oben, summieren die einzelnen Anteile auf und las-
sen schließlich die Zahl der Streifen über alle Grenzen wachsen in der Hoffnung, so den
gesuchten Flächeninhalt als Grenzwert zu finden.
Wir wollen diesen Grenzprozess ein einziges Mal im Einzelnen schildern und dann stan-
dardisiert ablaufen lassen: Das Intervall [a, b] zwischen dem Anfangspunkt, x = a =: x0
genannt, und dem Endpunkt, x = b =: xm genannt, wird durch die Wahl von z.B. m − 1
Zwischenstellen xn mit a = x0 < x1 < x2 < . . . < xm−1 < xm = b in m Teilinter-
valle [xn−1 , xn ] der jeweiligen Länge ∆xn = xn − xn−1 geteilt. Die Teilintervalle müssen
keineswegs, können aber sehr wohl alle gleich lang sein: ∆xn = (b − a)/m. Im Inneren
jedes der kleinen Teilintervalle wählen wir eine Stützstelle ξn ∈ [xn−1 , xn ], die nicht un-
bedingt auch der arithmetische Mittelpunkt ξn = (xn + xn−1 )/2 zu sein braucht, aber
ohne Weiteres sein kann. Dann bestimmen wir die Funktionswerte über diesen Stützstel-
len und nähern den wirklichen Flächeninhalt der einzelnen Streifen durch ∆xn f (ξn ) an
und den der entsprechenden Rechtecke unter den Horizontalen durch die f (ξn ). Diese m
Rechteckflächen summieren wir auf und nennen sie
m
P
Riemann-Summe: Sm := ∆xn f (ξn ).
n=1
122
Der angekündigte Grenzübergang besteht nun aus der Verfeinerung der Intervallzer-
legung, indem wir die Anzahl m − 1 der Zwischenstellen über alle Grenzen anwachsen
lassen, wobei wir bei nichtäquidistanter Teilung darauf achten müssen, dass die Breite des
dicksten Streifens max ∆xn gegen null strebt. Falls die Folge der Riemann-Summen Sm
dann einen Grenzwert besitzt, der unabhängig ist von der Zerlegung des Intervalls und von
der Auswahl der Stützstellen ξn in den einzelnen Streifen, dann nennen wir diesen Grenz-
wert das bestimmte“ oder (Riemann-)Integral der Funktion f (x) von a nach b, bzw. den
”
Flächeninhalt unter“ der Funktion f (x) über“ dem Intervall [a, b] und schreiben nach
” ”
dem Vorschlag von Leibniz mit einem stilisierten S für Summe:
Z b
(Riemann-)Integral: F (f (x); a, b) ≡ Fa (b) = dxf (x) := lim Sm .
a m→∞
Der Integrand f (x) kann auch zwischen das Integralzeichen und das Differential gepackt
werden.
Die Mathematiker garantieren uns, dass der betrachtete Grenzwert existiert, falls die
zu integrierende Funktion f (x) stetig und beschränkt sowie das Intervall endlich und
abgeschlossen ist:
123
Die verbleibende letzte Summe macht etwas Mühe:
m
X m
X m
X m
X
2 2
(2n − 1) = 4 n −4 n+ n0
n=1 n=1 n=1 n=1
= 4m(m + 1)(2m + 1)/6 − 4m(m + 1)/2 + m
= m(4m2 − 1)/3.
m
P
Denn die Summe der ersten m Zahlen n = m(m + 1)/2 und die Summe der
n=1
m
n2 = m(m + 1)(2m + 1)/6 kennen wir aus Abschnitt 2.1 und
P
ersten m Quadrate
n=1
m
n0 = m. Damit erhalten wir für die Folge der Riemann-Summen:
P
der Beziehung
n=1
b3
3 2 1
Sm := (b/m) (1/4)m(4m − 1)/3 = 1−
3 4m2
und in der Grenze m → ∞ :
b
b3
Z
dx x2 = lim Sm = .
0 m→∞ 3
Die eigentlich noch erforderliche Überprüfung, ob das Resultat auch nicht von der
Wahl der Zerlegung des Intervalls und von der Wahl der Stützstellen abhängt, schen-
ken wir uns.
Dieses einfache Beispiel zeigt uns einerseits, dass die Definition tatsächlich zu dem
erwarteten Ergebnis führt, andererseits aber auch, wieviel Mühe es schon bei einem
so einfachen Beispiel kostet, nach der Definition ein derartiges Integral auszurech-
nen.
Wir werden uns also nach anderen Verfahren zur Berechnung von Integralen umse-
hen müssen, was im Folgenden geschehen soll.
124
7.3.1 Linearität
Als Erstes bemerken wir aufgrund unserer Kenntnisse über die Eigenschaften von Summen
und die Grenzwerte von Folgen, dass das Integral linear ist, d.h. dass das Integral über
eine Linearkombination von Funktionen gleich der entsprechenden Linearkombination der
Integrale der einzelnen Funktionen ist: z.B. mit zwei Funktionen f (x) und g(x) und reellen
Konstanten c bzw. d :
Z b Z b Z b
Linearität: dx (cf (x) + dg(x)) = c dx f (x) + d dx g(x).
a a a
Wenn f (x) ≥ 0 also, wie vorausgesetzt, eine positive Funktion und F (f (x); a, b) =
Rb
a
dxf (x) der Flächeninhalt unter“ der Funktion war, erfahren wir daraus, dass das
”
Integral über die negative, d.h. an der x-Achse gespiegelte Funktion −f (x) ≤ 0 genau
−F (f (x); a, b) ergibt, d.h. einen negativen Flächeninhalt. Der an der x-Achse gespiegel-
te Flächeninhalt über“ der im vierten Quadranten verlaufenden Funktion −f (x) erhält
”
beim Integral automatisch ein negatives Vorzeichen. Wir können also getrost auf unsere
anfängliche Voraussetzung f (x) ≥ 0 verzichten, wenn wir das Integral als Flächeninhalt
mit Vorzeichen deuten: positiv: unter“ einer Funktion über der x-Achse und negativ:
”
über“ einer negativen Funktion unter der x-Achse. Physikalisch ist das der Unterschied
”
zwischen geleisteter und zu leistender Arbeit.
Wenn der Integrand im Integrationsintervall das Vorzeichen wechselt, muss das Inter-
vall demnach in zwei Teile aufgeteilt werden, die getrennt berechnet und dann mit den
entsprechenden Vorzeichen versehen addiert bzw. subtrahiert werden.
7.3.2 Intervalladdition
Als Nächstes betrachten wir zwei aneinander grenzende Integrationsintervalle: d.h. zwei
Integrale, bei denen die obere Grenze des ersten bei gleichbleibendem Integrand mit der
unteren Grenze des zweiten Integrals übereinstimmt: Aus der Bedeutung des Integrals als
Flächeninhalt folgt unmittelbar die sogenannte:
125
Bild 7.4: Funktionen f (x) und −f (x) mit den schraffierten Integralflächen: F und −F .
Z b Z c Z c
Intervalladdition: dxf (x) + dxf (x) = dxf (x)
a b a
126
Diese Definition ist mit unserer Grenzwertbetrachtung zur Einführung des Integral über
die Riemann-Summe verträglich, da im Fall vertauschter Integrationsgrenzen alle ∆xn
und damit alle dx negativ werden.
Ra
Mit Hilfe der Intervalladdition folgt jetzt: a dxf (x) = 0, wie es sein muss.
7.3.3 Ungleichungen
Auch einige Ungleichungen erweitern unser Verständnis für den Integralbegriff und sind
später hilfreich beim Berechnen von Integralen:
Falls z.B. eine Funktion g(x) in einem ganzen Intervall [a, b] nicht kleiner ist als eine andere
Funktion f (x) ≤ g(x) ∀x ∈ [a, b], folgt für die entsprechende Relation für die Integrale
die sogenannte
Z b Z b
Monotonie: f (x) ≤ g(x) ∀x ∈ [a, b] ⇒ dxf (x) ≤ dxg(x),
a a
Z b Z b
Dreiecksungleichung : dxf (x) ≤ dx |f (x)| für a < b.
a a
Schließlich braucht man manchmal folgende Abschätzung einer Integralfläche unter einer
im Intervall [a, b] stetigen Funktion f (x) durch Rechteckflächen mit ihrem minimalen m
bzw. maximalen M Funktionswert in dem Intervall:
127
Z b
Abschätzung: (b − a)m ≤ dxf (x) ≤ (b − a)M, falls m ≤ f (x) ≤ M ∀x ∈ [a, b].
a
Für ein Integral über eine im Intervall [a, b] stetige und beschränkte Funktion
Rb
f (x) gibt es immer einen Mittelwert ξ, so dass a dxf (x) = f (ξ)(b − a) für
ξ ∈ (a, b).
Denn eine stetige Funktion nimmt in einem abgeschlossenen und beschränkten Intervall
ihre Extrema an und alle Werte dazwischen.
128
Bild 7.8: Zum Mittelwertsatz der Integralrechnung
Zunächst wollen wirR b den Riemannschen Integralbegriff erweitern: Das ”bestimmte“ oder
Riemann-Integral a dxf (x) hatte einer beschränkten stetigen Funktion f (x), Integrand
genannt, bei vorgegebener unterer Intervallgrenze a und oberer Grenze b den (mit einem
Vorzeichen versehenen) Flächeninhalt F (f (x); a, b) = Fa (b) ∈ R unter der Funktion, also
eine reelle Zahl zugeordnet. Die Mathematiker nennen so etwas ein Funktional. Nun
interessiert uns, wie sich dieser Flächeninhalt ändert, wenn wir die obere Grenze verschie-
ben. Wir ersetzen also in der oberen Grenze die Konstante b durch eine Variable y und
betrachten das Integral als Funktion seiner oberen Grenze. Diese Funktion von y heißt
Z y
Unbestimmtes Integral: F (f (x); a, y) ≡ Fa (y) := dxf (x).
a
Der Vorgang ist ganz analog zu dem Erweiterungsschritt der Differentialrechnung von
der Steigung f 0 (x0 ) einer Funktion f (x) an einer Stelle x0 zur ersten Ableitung f 0 (x) als
Funktion der Variablen x.
129
Ry R y+∆y Ry R y+∆y
a
dxf (x) + y
dxf (x) − a
dxf (x) y
dxf (x)
= lim = lim =
∆y→0 ∆y ∆y→0 ∆y
Nach dem Mittelwertsatz der Integralrechnung gibt es im Intervall [y, y + ∆y] einen Mit-
telwert y + θ∆y mit 0 ≤ θ ≤ 1, so dass gilt:
f (y + θ∆y)∆y
= lim = lim f (y + θ∆y) = f (y).
∆y→0 ∆y ∆y→0
Z y
ersten Teil des Hauptsatzes: Fa0 (y) := d
dy
dxf (x) = f (y),
a
d.h. der Differentialquotient eines unbestimmten Integrals nach der oberen
Grenze ist der Integrand an der oberen Grenze.
Genau R y in diesem Sinne ist die Differentiation die Umkehrung der Integration. Z.B. ist
d
( dy ) 0 dt sin(ωt + α) = sin(ωy + α).
mit den Stützstellen ξn ∈ [xn−1 , xn ] in den Teilintervallen der Länge ∆xn = xn − xn−1 ,
wobei wir die Definition des Integrals eingesetzt haben. Nach dem Mittelwertsatz der
Differentialrechnung lässt sich die Steigung an der Stützstelle ξn durch die Steigung der
Sekanten, d.h. der Differentialquotient durch den Differenzenquotienten der Intervallrand-
punkte ersetzen:
F (xn ) − F (xn−1 )
F 0 (ξn ) =
xn − xn−1
Ausgeschrieben ergibt sich dann für das Integral:
lim (F (x1 )−F(x0 ))+(F (x2 )−F (x1 ))+. . .+(F (xm−1 )−F (xm−2 ))+(F(xm )−F (xm−1 )) .
m→∞
130
Man sieht, dass sich alle Terme paarweise wegheben bis auf den zweiten und den zweit-
letzten, die gar nicht mehr von m abhängen, also durch den Grenzprozess überhaupt nicht
berührt werden:
b
... = F(xm ) − F(x0 ) = F (b) − F (a) =: F (x)a .
Rb b
zweiten Teil des Hauptsatzes : a dxF 0 (x) = F (b) − F (a) =: F (x)a
d.h. das bestimmte Integral des Differentialquotienten einer stetig differenzier-
baren Funktion über ein Intervall ist gleich der Differenz der Funktionswerte
an der oberen und der unteren Grenze des Intervalls.
Auch in diesem Sinne ist die Integration die Umkehrung der Differentiation.
Dieser zweite Teil des Hauptsatzes ist der entscheidende Schritt zur Lösung unseres Inte-
grationsproblems: Wir können jetzt nämlich sofort alle bestimmten Integrale berechnen
von all den Funktionen, die wir in der zweiten Spalte unserer Differentiationstabelle in Ka-
pitel 5 finden. Wir lesen die Tabelle einfach rückwärts von rechts nach links und ergänzen
die Überschriften entsprechend folgendermaßen:
131
TABELLE RZUR DIFFERENTIATION UND INTEGRATION
Zeile F (x) = dxf (x) F 0 (x) ≡ ( dx
d
)F (x) = f (x) Bemerkungen:
1 const 0
2 xr rxr−1 r∈R
r+1
3 x /(r + 1) xr −1 6= r ∈ R
4 sin x cos x
5 cos x − sin x
6 tan x 1/ cos2 x x 6= (z + 1/2)π, z ∈ Z
2
7 cot x −1/sin
p x x 6= zπ, z ∈ Z
8 −π/2 < arcsin x < π/2 1/ p(1 − x ) 2 |x| < 1
9 0 < arccos x < π −1/ (1 − x ) 2 |x| < 1
10 −π/2 < arctan x < π/2 1/(1 + x2 )
11 0 < arccot x < π −1/(1 + x2 )
12 ex ex
x x
13 r r ln r 0<r∈R
14 ln |x| 1/x x 6= 0
15 logb |x| 1/x ln b x 6= 0, 0 < b ∈ R, b 6= 1
16 sinh x cosh x
17 cosh x sinh x
18 tanh x 1/ cosh2 x
2
19 coth x −1/
p sinh x x 6= 0
20 arsinh x 2
1/p(x + 1)
21 0 < arcosh x 1/ (x2 − 1) x>1
2
22 artanh x 1/(1 − x ) |x| < 1
23 arcoth x −1/(x2 − 1) |x| > 1
Unser obiges Beispiel aus der Schublade entnehmen wir z.B. der Zeile zwei für r = 2.
Rb
Ein weiteres Beispiel aus dieser Zeile mit den Grenzen a und b ist a dx x3 = (b4 − a4 )/4,
allgemein für beliebiges reelles r ∈ R folgt:
Z b
r br+1 − ar+1
F (x ; a, b) = dx xr = ,
a r+1
was wir in die bisher freigelassene Zeile drei der Tabelle eingetragen haben, da es sehr
häufig gebraucht wird.
Aus der vierten Zeile etwa finden wir:Z b
F (sin x; a, b) = dx sin x = − cos b + cos a,
a Z
b
aus der zwölften Zeile: F (ex ; a, b) = dx ex = eb − ea
a
und analog viele weitere Integrale.
132
Aufgabe 7.1 Berechnen Sie folgende Integrale:
Z 3 Z 1 Z b Z 1/√2
1 dx dx dx
a) dx, b) 2
, c) √ , d) √
√ ,
1 x −1 1 + x 0 1 + x2 −1/ 2 1 − x2
Z a Z π/4 Z 2 Z a
dx dx
e) dx cosh x , f) 2
, g) 1+a
, h) dx x2n+1 für n ∈ Z
−a 0 cos x 1 x −a
7.4.4 Stammfunktion
Nachdem wir nun eine beträchtliche Zahl von bestimmten Integralen über eine große Men-
ge von Intervallen ausrechnen können, bleibt noch die Frage nach dem unbestimmten
Integral eines Differentialquotienten F 0 (x) = f (x). Wir ersetzen dazu wieder die
konstante obere Grenze b des bestimmten Integrals durch eine Variable y und kommen
Z y Z y
wie oben zu
dxf (x) = dxF 0 (x) = F (y) − F (a).
a a
Dies schreiben wir folgendermaßen um
Z y Z y
F (y) = dxf (x) + F (a) =: dxf (x) + c,
a a
denn F (a) ist bezüglich der Variablen y ja tatsächlich eine Konstante, die allerdings noch
von dem Anfangspunkt des Intervalls a abhängt. Da man in der Funktion F (y) gerne
wieder das übliche x als Zeichen für die unabhängige Variable haben will, hat sich nun
für die obige Gleichung eine unerhört schlampige Schreibweise weltweit eingebürgert: man
schreibt nämlich dafür einfach symbolisch:
Z
F (x) = dxf (x) + c und nennt F (x) die Stammfunktion von f (x).
Das x auf der linken Seite dient nur als Hinweis, dass es sich um eine Funktion einer
unabhängigen Variablen handelt, und hat natürlich überhaupt nichts zu tun mit der oh-
nehin beliebig bezeichenbaren Integrationsvariablen x auf der rechten Seite, die selbst-
verständlich nach der Integration rechts gar nicht mehr vorkommt. Wenn man sich diese
Schlamperei einmal klargemacht hat, ist sie eine äußerst bequeme Sache und in der Tat
in den größten Tafelwerken benützt und weltweit anerkannt.
Diese lässige Schreibweise betont, dass die Stammfunktion eigentlich eine ganze Funk-
tionenschar ist mit dem Scharparameter c. Die Stammfunktion F (x) von f (x) ist genau
die Funktionenschar, die unsere ursprüngliche Differentialgleichung F 0 (x) = f (x) löst,
und deshalb für die Physiker von so großer Wichtigkeit. Aus dieser Funktionenschar mit
vorgegebenem Steigungsverlauf f (x) muss der Physiker nun nur noch durch Wahl der
133
Konstanten c diejenige Lösungsfunktion aussuchen, welche die richtige Randbedingung
c = F (a) erfüllt, und schon ist das Problem gelöst.
Gesucht ist z.B. die Stammfunktion F (x) von f (x) = 3x, welche die Randbedingung
F (1) = 2 erfüllt. Aus der Funktionenschar F (x) = 3x2 /2 + c ist also diejenige Funktion
auszuwählen, für die F (1) = 3/2 + c = 2 gilt, also c = 1/2 zu wählen: folglich ist
F (x) = (3x2 + 1)/2 die gesuchte Lösung.
Aufgabe 7.2 Bestimmen Sie allgemein die Stammfunktion von folgenden Funktionen:
1
a) f (x) = x3 , b) f (x) = √ , c) f (x) = sinh x und d) f (x) = 2x
2
x −1
Aufgabe 7.3 Bestimmen Sie die Stammfunktion von folgenden Funktion mit folgenden
Randbedingungen:
1
a) f (x) = sin x mit F (π) = 1, b) f (x) = √ mit F (4) = 1 und
x
1
c) f (x) = 2 mit F (a) = 12
cosh x
Re e
Z.B. aus Zeile 14: 1
dx/x = ln x1 = ln e − ln 1 = 1 − 0 = 1.
R π/2 π/2
Oder aus Zeile 4: 0
dt cos t = sin t0 = sin(π/2) − sin 0 = 1 − 0 = 1.
Rb b
Oder aus Zeile 10: a
dx/(x2 + 1) = arctan xa .
R p
Oder aus Zeile 8 unbestimmt: dx/ (1 − x2 ) = arcsin x + c.
In der ersten Freude über die Konsequenzen des Hauptsatzes für die Integration durch
Rückwärtslesen der Differentiationstabelle haben wir den Erfolg unserer Bemühungen et-
134
was überschätzt. Denn bei genauerem Hinsehen sind es doch nur relativ wenige Funktio-
nen, die in der zweiten Spalte unserer TABELLE vorkommen. Schon so einfache Funk-
2
tionen unsererpGrundausstattung wie etwa f (x) = x + 1 finden wir nicht. Erst recht
nicht f (x) = (1 − x2 ), obwohl wir das Reziproke dieser Wurzel ganz einfach integrieren
können. Auch bei der Gaußschen Glockenkurve f (x) = exp(−x2 ) sind wir mit unserer
TABELLE ziemlich hilflos.
Anders als bei der Differentiation gibt es bei der Integration kein Verfahren, das auto-
matisch bei genügendem Arbeitsaufwand zum Ziel führt. Deshalb ist Integrieren im
Gegensatz zum Handwerk des Differenzierens eine Kunst.
Dennoch gibt es eine ganze Menge Regeln und Kunstkniffe, die aus den Eigenschaften des
Integrals folgen und uns das Leben beträchtlich erleichtern können. Denen wollen wir uns
jetzt zuwenden. Das Einfachste ist die
Wir haben in Abschnitt 7.3.1 gesehen, dass das Integral eine lineare Operation ist:
Z b Z b Z b
dx(cf (x) + dg(x)) = c dxf (x) + d dxg(x).
a a a
Das machen wir uns bei einer großen Zahl von Integralen zunutze, z.B. bei der Bestimmung
des Flächeninhalts des getönten Blattes“ in folgendem Bild:
”
Z 1 Z 1 Z 1
√ 2
√ x1/2+1 1 x3 1
dx( x − x ) = dx x − dxx2 = − = 2/3 − 1/3 = 1/3
0 0 0 (1/2 + 1) 0 3 0
Oder bei diesem Integral über einen halben Berg“:
”
Z 1 Z 1 Z 1 Z 1 Z 1
2 2 2 4 2
dx(1 − x ) = dx(1 − 2x + x ) = dx1 − 2 dx x + dx x4
0 0 0 0 0
1
= (x − 2x3 /3 + x5 /5)0 = 1 − 2/3 + 1/5 = 8/15.
Z 1
Aufgabe 7.4 Integrieren Sie durch lineare Zerlegung dx(1 + 2x3 )3 .
−1
135
Bild 7.9a: Integral über das getönte Blatt“
”
7.5.3 Substitution
Diese ist immer dann anzuraten, wenn der Integrand f (x) stetig von einer anderen
Variablen y einfacher oder zweckmäßiger abhängt, die mit x = g(y) umkehrbar
eindeutig und stetig differenzierbar zusammenhängt, wobei Wg ⊂ Df .
Rb
Der Klarheit wegen nennen wir Rdie Integrationsgrenzen des gesuchten Integrals a dxf (x)
x
jetzt xa := a bzw. xb := b : also xab dxf (x). Wegen der umkehrbar eindeutigen Zuordnung
von y und x gibt es eine Umkehrfunktion y = g −1 (x), insbesondere sind ya = g −1 (xa ) und
yb = g −1 (xb ), und außerdem existiert wegen der stetigen Differenzierbarkeit die Ableitung:
dx
dy
= g 0 (y). Dann gilt (in der suggestiven Schreibweise von Leibniz fast trivialerweise) die
136
Z xb Z yb Z yb
dx
Substitutionsformel: dxf (x) = dy f (g(y)) = dyg 0 (y)f (g(y)).
xa ya dy ya
Erfahrungsgemäß ist die Erklärung des Substitutionsverfahrens komplizierter als die Pra-
xis. Deshalb geben wir einige typische Beispiele:
Z 5 p
dx (2x − 1) = ... mit xa = 1 und xb = 5.
1
137
Z b
dt t exp(−αt2 ) = ... mit ta = 0 und tb = b.
0
dy dt
Wir substituieren y := −αt2 mit ya = 0, yb = −αb2 und dt
= −2αt also dy
= −1/2αt.
Daraus erhalten wir:
Z −αb2 −αb2
dt
... = dy( dy )t exp y = (−1/2α) exp y 0 = (1 − exp(−αb2 ))/2α.
0
Ganze Klassen von Integralen erhält man auf folgende Weise durch Benützen der Sub-
”
stitutionsformel rückwärts“. Was damit gemeint ist, sieht man am besten an folgenden
Beispielen:
Gesetzt den Fall wir haben ein Integral auszurechnen von folgendem Typ, wobei wir sugge-
stiv für die willkürliche Intergrationsvariable y gewählt haben, im Zähler des Integranden
entdecken wir die Ableitung des Nenners:
Z yb
dy g 0 (y)/g(y) = ...,
ya
so bildet dies offensichtlich die rechte Seite unserer Substitutionsformel speziell für die
Funktion f (x) = 1/x und wir können die Substitutionsformel sofort mit x = g(y) von
rechts nach links, also rückwärts“ anwenden, um zu erhalten:
”
Z xb
dx
... = . Das ist aber nach Zeile 14 unserer TABELLE
xa x
x
... = ln |x|xba und mit x = g(y) folgt insgesamt:
Z yb y
dy g 0 (y)/g(y) = ln |g(y)|yba .
ya
138
Als Beispiele erhalten wir etwa:
für g(y) = ay ± b mit g 0 (y) = a:
R
dy a/(ay ± b) = ln |ay ± b| + c,
0
R
für g(y) = sin y mit g (y) = cos y: R dy cos y/ sin y = ln |siny| + c,
für g(y) = y 2 ± b mit g 0 (y) = 2y: dy 2y/(y 2 ± b) = ln |y 2 ± b| + c
usw.
Ganz analog zeigt man mit f (x) = xn für 1 ≤ n ∈ N:
yb xb
g n+1 (y) yb
Z Z
0 n n n+1
xb
dyg (y)g (y) = dxx = x /(n + 1) xa =
.
ya xa n + 1 ya
Aufgabe 7.6 Leiten Sie aus dieser Formel weitere ab, indem Sie g(y) spezifizieren:
R yb
Aufgabe 7.8 Was erhält man analog für ya
dy g 0 (y)/g n (y)?
139
.
Sie ahnen aus diesen Beispielen die ungeheure Menge und Vielfalt von Integralen, die durch
Anwendung der Substitutionsformel berechnet werden können. Dennoch reicht auch das
für die Zwecke der Physik immer noch lange nicht aus. Bei so einfachen Integranden wie
ln x, x cos x oder sin2 x sind wir immer noch ratlos.
Für solche und ähnliche Fälle gibt es eine Methode, die uns das Integral zwar nicht ganz
liefert, aber in gewissem Sinne wenigstens eine teilweise Berechnung gestattet und manch-
mal in mehreren Schritten dann doch zum Ziel führt. Diese Methode heißt sinnigerweise:
integrieren diese und benützen den zweiten Teil des Hauptsatzes zur Integration des Pro-
dukts: Z
b b
Z b Z b
0 0
dx(f (x) · g(x)) = f (x)g(x)a = dxf (x) · g(x) + dxf (x) · g 0 (x).
a a a
Nach dem ersten Term auf der rechten Seite aufgelöst, erhalten wir die Formel für die:
Z b b
Z b
0
Partielle Integration: dxf (x)g(x) = f (x)g(x)a − dx f (x)g 0 (x).
a a
Dies ist natürlich wegen des verbleibenden Integrals nach dem charakteristischen Minus-
zeichen auf der rechten Seite keine fertige Lösung unseres Problems. Aber manchmal ist
dieses Integral leichter zu berechnen als das ursprüngliche.
Wir betrachten sogleich unsere oben genannten typischen Beispiele, etwa mit f 0 (x) = x
und g(x) = ln x:
Z b b
Z b b
2
dx x ln x = (x /2) ln xa − dx (x2 /2)(1/x) = (x2 /2)(ln x − 1/2)a
a a
= (b /2)(ln b − 1/2) − (a2 /2)(ln a − 1/2).
2
140
Hier noch ein anderes vielleicht unerwartetes, aber keineswegs seltenes Beispiel mit f 0 (x) =
1 und g(x) = ln x, bei dem durch das Einfügen einer 1 künstlich ein triviales Produkt
erzeugt wurde:
Z y Z y Z y
y
dx ln x = dx 1 ln x = x ln x 1 −
dx x(1/x)
1 1 1
y
= x(ln x − 1)1 = y ln y − y + 1.
Es ist nicht immer leicht zu sehen, welchen Faktor des Produkts man zweckmäßigerweise
als Ableitung f 0 betrachtet. Dazu das Beispiel x sin x zunächst naheliegend mit f 0 (x) = x:
Z y Z y
2
y
dx x sin x = (x /2) sin x 0 −
dx(x2 /2) cos x.
0 0
Man sieht sofort, dass uns diese Wahl nicht weiterbringt, sondern den verbleibenden In-
tegranden nur noch komplizierter macht. Die andere Möglichkeit f 0 (x) = sin x dagegen
führt uns zum Erfolg:
Z y Z y
y y
dx x sin x = −x cos x0 − dx 1(− cos x) = −y cos y + sin x0 = −y cos y + sin y.
0 0
Wir betrachten noch den Integranden x2 cos x und wählen nach unseren soeben gemachten
Erfahrungen f 0 (x) = cos x:
Z y Z y Z y
2 2
y 2
dx x cos x = x sin x0 − dx 2x sin x = y sin y − 2 dx x sin x.
0 0 0
Das ist zwar nicht die Lösung unseres Problems, aber ein Schritt in die richtige Richtung,
denn das verbleibende Integral haben wir als letztes Beispiel gerade ausgerechnet. Damit
folgt: Z y
dx x2 cos x = y 2 sin y + 2y cos y − 2 sin y.
0
Insgesamt hat uns hier zweimalige partielle Integration zum Ziel geführt.
Ein weiteres interessantes Beispiel ist (zur Abwechslung mal als unbestimmtes Integral):
Z Z
dx cos x sin x = sin x sin x − dx sin x cos x + c.
141
Das verbleibende Integral ist gleich dem ursprünglichen, folglich erhalten wir mit neuem
c: Z
sin2 x
dx cos x sin x = + c.
2
Auch das nächste Beispiel mit f 0 (x) = g(x) = sin x ist bemerkenswert:
Z Z Z
dx sin x = − cos x sin x − dx(− cos x) cos x = − cos x sin x + dx cos2 x = ...
2
Hier folgt noch eine Reihe von Beispielen dieser Art mit f 0 (x) = e−x , für die wegen ihrer
Bedeutung auch für die Physik sogar eine Bezeichnung festgelegt wurde:
Z y Z y
−x y
−x
y
dx 1e−x = −ye−x + 0 − e−x 0 = −ye−y + e−y − 1
E1 (y) = dx xe = −xe 0 +
Z0 y 0
Z y
2 −x 2 −x y
dx 2xe−x = −y 2 e−y + 2E1 (y)
E2 (y) = dx x e = −x e 0 +
0 0
..
.
Z y
En (y) = dx xn e−x = −y n e−y + nEn−1 (y).
0
Z Z
i) n
dx g(x)/x = −g(x)/(n − 1)x n−1
+ dx g 0 (x)/(n − 1)xn−1 für n 6= 1,
n−1
Z Z
n 1 n−1
j) dx sin x = − cos x sin x+ dx sinn−2 x,
n n
(1 ± x2 )n (1 ± x2 )n−1
Z Z
2 n
k) dx (1 ± x ) = x + 2n dx
2n + 1 2n + 1
142
Aufgabe 7.11 Zeigen Sie, dass man bei einer geradlinigen Bewegung eines Massen-
punkts den zurückgelegten Weg x(t) aus dem gegebenen Beschleunigungsverlauf a(t) mit
Anfangsgeschwindigkeit
Rt v0 und -ort x0 durch partielle Integration in folgender Form erhält:
x(t) = 0 dy(t − y)a(y) + v0 t + x0 .
Hermite-Ansatz:
m−1
Z Z
an x n
P
dxPm (x)/Γ(x) = Qm−1 (x)Γ(x) + am dx/Γ(x) mit Qm−1 (x) :=
n=0
mit einem Polynom (m-1)-ten Grades Qm−1 (x) und einer reellen Zahl am . Die dazu be-
nötigten (m+1) Zahlen an mit n = 0, 1, 2, . . . , m erhält man durch Koeffizientenvergleich
folgender beiden Polynome m-ten Grades:
.
Denn die Differentiation des Ansatzes ergibt
und anschließende Multiplikation mit Γ(x) liefert die obige Bestimmungsgleichung für die
(m + 1) Koeffizienten an .
143
Aufgabe 7.12 Zeigen Sie, dass der Hermite-Ansatz
p
a) für P3 (x) = 3x3 + 5x2 + 3x und Γ(x) = (x2 + 2x + 2) auf a3 = a2 = 1, a1 = 0
und a0 = −1 führt, also Q2 (x) = x2 − 1 ergibt und
√
b) für P2 (x) = x2 und Γ(x) = 1 − x2 auf a2 = 1/2, a1 = −1/2 und a0 = 0 führt,
also Q1 (x) = −x/2.
R
Die verbleibenden Integrale vom Typ dx/Γ(x) lösen wir durch den vielen von Ih-
nen aus der Schule bekannten Trick der quadratischen Ergänzung, d.h. Addition und
Subtraktion des gleichen (hier fett gedruckten) Terms: falls etwa a > 0 gilt
Z Z p
dx/Γ(x) = dx/ (ax2 + bx + c)
√
Z p
= (1/ a) dx/ x2 + bx/a + (b/2a)2 + c/a − (b/2a)2
√
Z p
= (1/ a) dx/ (x + b/2a)2 + ∆/4a2
√ dz
√
und dann, falls ∆ > 0, weiter die Substitution z := 2ay/ ∆ mit dy
= 2a/ ∆ zu
√
Z √
= (1/ a) dz/ z 2 + 1,
wie wir früher in Aufgabe 4.13 gezeigt haben. Also gilt insgesamt mit immer anderen
Konstanten c:
√ p
= (1/ a) ln d(z + (z 2 + 1))
√ p
= (1/ a) ln d(y + (y 2 + ∆/4a2 ))
√ p
= (1/ a) ln d(x + b/2a + (x2 + bx/a + c/a)).
144
R
Aufgabe 7.13 Lösen Sie das Integral dx/Γ(x) für den Fall a < 0 und ∆ < 0.
Alle im Laufe der Jahrzehnte mit den verschiedenen Formeln und Tricks gelösten Integrale
sind in Integraltafeln gesammelt, von denen wir hier einige aufführen: Wir beginnen
unsere Auswahl mit den kleineren erschwinglichen Büchern für den täglichen Gebrauch
jedes Physikstudenten und gehen dann bis zu den großen umfassenden Tafelwerken, die
in den Bibliotheken zum Nachschlagen bereitgehalten werden:
Die Informationen dieser Tafeln sind heute schon in Programme wie MATHEMATICA
oder MAPLE eingearbeitet worden. Diese finden die Stammfunktionen, falls sie existieren,
auch in schwierigen Fällen. Man sollte sich nicht scheuen, bei der täglichen Arbeit auf
diese Tafelwerke oder Programme zurückzugreifen. Allerdings setzt ihre Benutzung im
Allgemeinen die Kenntnis der verschiedenen Integrations-Techniken und Tricks voraus,
weil sonst die angegebenen Bemerkungen und Beschränkungen der Gültigkeitsbereiche
häufig nicht angemessen und fehlerfrei berücksichtigt werden können. Deshalb haben wir
uns hier mit diesen Problemen beschäftigt.
7.5.6 Integralfunktionen
Trotz aller Formeln und Tricks bleiben doch noch einige Integrale, auch in den Natur-
wissenschaften
p gebrauchte, unlösbar. Beispiele dafür sind etwa die Integranden exp(−x2 ),
x
e /x, 1/ (1 + x4 ), sin x/x oder 1/ ln x. Die Mathematiker können zwar beweisen, dass
der entsprechende Grenzwert existiert, dieser lässt sich jedoch nicht in geschlossener Form
durch elementare Funktionen ausdrücken.
In dieser Lage erinnern wir uns an das unbestimmte Integral und unsere TABELLE:
Ry
Etwa Zeile 14: ln y = 1 dx/xRy 2
oder Zeile 10: arctan y = R 0 dx/(1
p +x )
y
oder Zeile 8: arcsin y = 0 dx/ (1 − x2 ).
145
Wenn wir die Funktionen links nicht schon früher als Umkehrfunktionen kennengelernt
oder als Taylor-Reihen berechnet hätten, könnte man sie sich durch diese Gleichungen
definiert vorstellen.
Nach diesen Vorbildern verfährt man bei den nicht elementar darstellbaren Integralen:
Man gibt einfach dem analytisch nicht lösbaren Integral einen Namen und schaut sich
nach einem anderen Verfahren zur Berechnung der Funktionswerte um. Wir geben hier
nur zwei Beispiele an: Die
√ Ry
Error function: erf(y) := (2/ π) 0 dx exp(−x2 ),
Ry p
Elliptischen Integrale: F (k; y) := 0
dx/ (1 − x2 )(1 − k 2 x2 ),
Aufgabe 7.14 Zeigen Sie durch eine geeignete Substitution, dass auch die Integrale
Z y q
2
Z y √
2
dx/ (1 − k sin x) und dx/ cos 2x elliptische Integrale sind.
0 0
Natürlich hilft der schöne Name allein nichts. Es muss eine Methode gefunden werden, die
die Berechnung der Funktionswerte gestattet. Wenn alle anderen Mittel versagen, bleibt
nichts anderes übrig als die
146
7.5.7 Numerische Integration
Die älteste und primitivste Art, ein bestimmtes Integral, d.h. den Flächeninhalt unter“
”
einer Funktion über“ einem Intervall zu berechnen, ist natürlich, den Integranden auf
”
Millimeterpapier zu zeichnen und die Kästchen zu zählen.
Mit den elektronischen Rechnern von heute können wir das natürlich vornehmer und
schneller, indem wir uns auf den definierenden Grenzwert besinnen und nach der Zerlegung
des Intervalls die Flächeninhalte der Streifen aufsummieren. Dabei braucht man umso
weniger Streifen bzw. Iterationsschritte, je genauer man die Oberkanten der Streifen der
wirklichen zu integrierenden Funktion anpasst.
Das einfachste sind dabei horizontale Geraden, wie wir das bei der Definition gemacht
haben, so dass die Streifen Rechtecke werden, deren Flächeninhalt einfach zu berechnen
ist. Man kann statt der Stützstellen ξn im Inneren der Teilintervalle wie bei der Riemann-
Summe, auch die Minima oder Maxima der Funktion im Teilintervall nehmen und erhält
dann eine Unter- bzw. eine Obersumme, die in der Grenze das Integral einschließen.
Die nächst vornehmere Methode ist die Sehnen-Trapez-Regel, bei der die Funktion in
jedem Teilintervall durch die Sekante approximiert und die wirklichen Flächeninhalte der
Streifen durch die Trapezflächen angenähert werden. Für jedes Teilintervall nimmt man
statt ∆xn f (ξn ) :
(∆xn )(f (xn−1 ) + f (xn ))/2.
Eine noch bessere Approximation liefert die Simpson-Regel, bei der die Integranden-
funktion in den Teilintervallen jeweils durch eine Parabel nach der Keplerschen Fassre-
gel angenähert wird. Man nimmt die Funktion also an drei Punkten in jedem Streifen:
(∆xn )(f (xn−1 ) + 4f ( xn−12+xn ) + f (xn ))/6.
Noch raffiniertere Vorschriften zu finden, mit denen das gesuchte Integral bei vorgegebener
Genauigkeitsanforderung in möglichst wenigen Schritten berechnet werden kann, ist eine
der Aufgaben der numerischen Mathematik.
147
7.6.1 Unendliches Integrationsintervall
Wenn z.B. das Integral über eine im Intervall [a, ∞) stetige Funktion an der oberen Grenze
bis ins Unendliche reichen soll, berechnet man dieses zunächst nur bis zu einem großen
endlichen Wert y und lässt dann nachträglich im Ergebnis der Integration diesen großen
Wert y in einem weiteren Grenzübergang über alle Grenzen wachsen. Falls auch dieser
Grenzwert existiert, nennen wir ihn ein uneigentliches Integral der ersten Art und
schreiben:
Z ∞ Z y
Fa (∞) ≡ dxf (x) := lim dxf (x) ≡ lim Fa (y).
a y→∞ a y→∞
Als Beispiel berechnen wir für a > 0 und ein kleines positives ε > 0 :
∞ y
x−1−ε+1 y −1
Z Z
dx 1 1 1
:= lim dx x−1−ε = lim = lim ε − ε = ε .
a x1+ε y→∞ a y→∞ −1 − ε + 1 a ε y→∞ y a εa
Wir sehen daraus, dass das uneigentliche Integral existiert, wenn die Funktion für wach-
sendes x auch nur ein klein wenig stärker abfällt als 1/x, also z.B. für 1/x2 , dass aber für
ε → 0 die im folgenden Bild
getönte Fläche unter der Funktion 1/x gerade keinen endlichen Flächeninhalt
√ mehr besitzt
und ebenso alle weniger stark abfallenden Funktionen wie etwa 1/ x.
148
Aufgabe 7.15 Versuchen Sie folgende uneigentlichen Integrale der ersten Art zu berech-
nen: Z ∞ Z ∞ Z ∞
2
a) dx/x , b) dx exp(−x), c) dx/(1 + x),
Z a∞ 0Z
∞
0
Analog verfahren wir bei einer in (−∞, b] stetigen und beschränkten Funktion für die
untere Grenze:
Z b Z y
F−∞ (b) ≡ dxf (x) := lim dxf (x) ≡ lim Fa (y)
−∞ a→−∞ a a→−∞
oder bei einer auf der ganzen Zahlengeraden stetigen und beschränkten Funktion für beide
Grenzen:
Z ∞ Z c Z y
dxf (x) := lim dxf (x) + lim dxf (x)
−∞ a→−∞ a y→∞ c
Z −2/π Z 0
2
Aufgabe 7.16 Berechnen Sie: dx sin(1/x)/x und dx x/(1 + x4 ).
−∞ −∞
Z ∞ Z c
Cauchy-Hauptwert: P dxf (x) := lim dxf (x).
−∞ c→∞ −c
149
Wir berechnen dazu folgendes Beispiel für n ∈ N:
Z ∞ Z c Z y
2n−1 2n−1
dx x := lim dx x + lim dx x2n−1
−∞ a→−∞ a y→∞ c
Beide Grenzwerte existieren offensichtlich nicht. Wenn wir jedoch den Hauptwert
bilden, folgt:
Z ∞ Z c
P dx x2n−1 := lim dx x2n−1 = lim 0 = 0,
−∞ c→∞ −c c→∞
denn ein Integral einer ungeraden Funktion über ein zum Ursprung symmetrisches
Intervall verschwindet.
Z ∞ Z ∞
2
Aufgabe 7.17 Berechnen Sie: dx/(1 + x ) und dx x/(1 + x4 ).
−∞ −∞
Nun werfen wir einen kurzen Blick auf den zweiten Fall, wenn nämlich der Integrand
an einer Stelle x0 des endlichen Integrationsintervalls [a, b] unbeschränkt ist, z.B. an der
unteren Grenze: x0 = a. Wir berechnen dazu das Integral ab einem Wert x0 + η, der
nur eine kleine Strecke η > 0 oberhalb der kritischen Stelle x0 liegt und lassen erst im
Ergebnis der Integration diese kleine Strecke gegen null gehen. Falls dieser Grenzwert dann
existiert, nennen wir ihn ein uneigentliches Integral der zweiten Art und schreiben:
Z b Z b
Fx0 (b) ≡ dxf (x) := lim dxf (x) ≡ lim Fx0 +η (b).
x0 η→0 x0 η→0
Als Beispiel berechnen wir für b > 0 und ein kleines positives ε > 0:
Z b Z b
dx ε−1 xε−1+1 b 1 ε ε
bε
1−ε
:= lim dx x = lim = b − lim η = .
0 x η→0 ε − 1 + 1 η ε ε
η→0 η η→0
Wir sehen daraus, dass das uneigentliche Integral existiert, wenn die Funktion für
√ kleiner
werdende x auch nur ein klein wenig schwächer ansteigt als 1/x, also z.B. für 1/ x, dass
aber für ε → 0 die im folgenden
150
Bild 7.13: Unbeschränkter Integrand
getönte Fläche unter der Funktion 1/x, genau das an der Winkelhalbierenden gespiegelte
Bild der früher betrachteten Fläche, gerade keinen endlichen Flächeninhalt mehr besitzt
und ebenso für alle stärker ansteigenden Funktionen wie etwa 1/x2 .
Aufgabe 7.18 Versuchen Sie folgende uneigentlichen Integrale der zweiten Art zu be-
rechnen:
√
Z b Z 2 Z b
√
a) dx/ x, b) dx/ x − 1, c) dx/x3
0 1 0
Wieder verfahren wir ganz analog bei einer Funktion, die an der oberen Grenze unbe-
schränkt wird:
Z x0 Z x0 −ε
Fa (x0 ) ≡ dxf (x) := lim dxf (x) ≡ lim Fa (x0 − ε)
a ε→0 a ε→0
Z b Z x0 −ε Z b
dxf (x) := lim dxf (x) + lim dxf (x).
a ε→0 a η→0 x0 +η
151
Einschub: Cauchy-Hauptwert: Dabei ist es möglich, dass die beiden Grenz-
werte nur dann existieren, wenn die kleinen Abstände ε und η von der kritischen
Stelle zugleich verschwinden. Auch dann spricht man von dem Ergebnis als
Z b Z x0 −ε Z b
Cauchy-Hauptwert: P dxf (x) := lim dxf (x) + dxf (x) .
a ε→0 a x0 +ε
Z b>0 Z −ε Z b
2n+1 2n+1
dx/x := lim dx/x + lim dx/x2n+1
a<0 ε→0 a η→0 η
−ε b
= lim x−2n /(−2n)a + lim x−2n /(−2n)η
ε→0 η→0
.
Auch hier existieren beide Grenzwerte nicht. Wenn wir jedoch den Hauptwert bilden
etwa für a = −b, folgt:
Z b Z b
P dx/x2n+1 := lim dx/x2n+1 = lim 0 = 0,
−b η→0 −b η→0
denn wieder verschwindet das Integral einer ungeraden Funktion über ein zum Ur-
sprung symmetrisches Intervall.
Z 1 √ Z π/2
Aufgabe 7.19 Berechnen Sie 2
dx/ 1 − x und dx tan x.
0 0
Z 2 Z π
Aufgabe 7.20 Berechnen Sie die Hauptwerte: P dx/x und P dx tan x.
−1 0
R1 √
Aufgabe 7.21 Zeigen Sie, dass aus dem uneigentlichen Integral zweiter Art, 0 dx/ x,
durch die Substitution x = 1/y 2 ein uneigentliches Integral erster Art entsteht.
Mit Integralen, die uneigentlich sowohl erster als auch zweiter Art sind wollen wir uns hier
nicht befassen, obwohl auch diese durch säuberlich getrennte Grenzübergänge gemeistert
werden können.
152
Aufgabe 7.22 Beispiele physikalischer Integrale:
a) Wenn Sie die Fallzeit des Mondes ausrechnen wollen, die er für den senkrechten Fall
auf die Erdoberfläche bräuchte,
R wenn
√ √er plötzlich auf seiner Bahn stehen liebe, benötigen
Sie folgendes Integral: J = dx x/ 1 − x.
b) Um das elektrische Potential V (x) einer (zwischen dem Innenradius r und dem Au-
ßenradius R) homogen geladenen KugelschaleR1 √ im Abstand x vom Mittelpunkt zu be-
rechnen, brauchen Sie außer dem Integral −1 dz/ az + b im Zähler des Coulomb-Faktors
RR
1/x das folgende etwas kompliziertere Integral Z(x) = r dy y(|y − x| − (y + x)), an dem
Sie das Zusammensetzen von Integralen besonders gut üben können.
Sie werden später insbesondere bei den Funktionen mehrerer Variabler noch eine Vielfalt
von weiteren Integralen kennen lernen: Kurven- oder Linien-Integrale, Oberflächen- und
Volumen-Integrale in Räumen verschiedener Dimensionen. Wenn es jedoch darum geht,
Zahlen auszurechnen, um mit Messwerten zu vergleichen, werden Sie nichts anderes tun,
als Riemann-Integrale berechnen, wie wir das hier zusammen erarbeitet haben.
153
154
Kapitel 8
KOMPLEXE ZAHLEN
8.1.1 Motivation
Wir haben in Abschnitt 2.2.4 mehr aus grundsätzlichen und mathematischen Gründen
beschlossen, unseren physikalischen Überlegungen den Körper der reellen Zahlen zu-
grunde zu legen, obwohl die endliche Genauigkeit aller physikalischen Messungen es ge-
stattet hätte, sich mit den rationalen Zahlen zu begnügen. In diesem Kapitel wollen wir
den Zahlenraum nun noch einmal ohne zwingende physikalische Notwendigkeit erweitern,
nämlich zu den komplexen Zahlen C .
155
Die überraschenden Ergebnisse der komplexen Zahlen für die Mathematik sind auch für
sich allein schon interessant und einige Mühe wert: Mit der Erweiterung von R auf C
wird nicht nur x2 = −1, sondern jede Gleichung zweiten Grades lösbar, ja sogar jede
algebraische Gleichung n-ten Grades hat nach dem Fundamentalsatz der Algebra genau
n Lösungen in C. Jede rationale Funktion hat eine Partialbruchzerlegung. Erst jetzt wird
der Konvergenzradius der Potenzreihen verständlich aus dem Definitionsbereich und vieles
andere mehr.
So ergibt sich die Frage: Was muss getan werden, um in dieses Paradies zu gelangen?
Damit kann man die Lösung der Gleichung z 2 + 1 = 0 einfach hinschreiben: z = ±i.
Zunächst ziehen wir einige direkte Folgerungen aus dieser Definition für die Potenzen
von i, wobei wir versuchen, alle vom Körper der reellen Zahlen her bekannten Rechenregeln
einfach beizubehalten:
√
i := + −1, i2 = −1, i3 = i2 i = −i, i4 = i2 i2 = (−1)(−1) = +1 usw.
Auch die negativen Potenzen erhalten wir leicht: Zunächst folgt für die zu i inverse Zahl
i−1 aus
156
i i−1 = 1 = i4 = i i3 ⇒ i−1 = i3 = −i
und weiter:
1 1
i−2 = = = −1, i−3 = i usw.
i2 −1
D.h. die oben eingerahmten Ergebnisse gelten sogar für alle ganzen Zahlen n ∈ Z.
Aufgabe 8.1 Imaginäre Einheit: Berechnen Sie: i15 , i45 und (−i)−20 .
Eine komplexe Zahl ist also ein geordnetes Paar eindeutig festgelegter reeller Zahlen:
der rein reelle erste Teil heißt
157
Diese Zerlegung in Real- und Imaginärteil ist eindeutig im Gegensatz zu den rationalen
Zahlen, die wir ebenfalls als geordnete Paare“ damals von ganzen Zahlen eingeführt
”
hatten, bei denen wir aber ganze Äquivalenzklassen identifiziert haben: (1,2) = (2,4) =
(3,6) = ..., denn das Kürzen“ sollte möglich sein, ohne die Zahl zu ändern: 12 = 24 = 36 = . . . .
”
Die Gleichheit z = w zweier komplexer Zahlen z = x + iy und w = u + iv bedeutet die
Gleichheit der beiden Real- und der Imaginärteile: x = u und y = v, d.h.
Speziell verschwindet eine komplexe Zahl nur genau dann, z = 0, wenn Real- und Imagi-
närteil beide gleich Null sind:
z = x + iy = 0 ⇐⇒ Re z = x = 0 und Im z = y = 0.
Die reellen Zahlen R : z = x sind eine Teilmenge der Menge der komplexen Zahlen: R ⊂ C,
nämlich alle diejenigen mit Im z = y = 0. Dazu kommen die rein imaginären Zahlen z = iy
als neue Elemente hinzu.
Bevor wir uns den Rechenregeln zuwenden, wollen wir einen Überblick gewinnen über die
Methoden, die komplexen Zahlen zu veranschaulichen:
Zur Darstellung eines geordneten Paars reeller Zahlen bietet sich natürlich die Ebene an,
die wir schon bei der Darstellung von Variable und Funktionswert einer reellen Funktion
verwendet haben und jetzt Gaußsche Zahlenebene nennen: jedem Punkt (oder Zeiger“,
”
wie die Elektrotechniker sagen) der Gaußschen Zahlenebene entspricht also genau eine
komplexe Zahl.
Als Orientierungshilfe zeichnen wir in der Ebene zwei reelle Zahlengeraden aus, die aufein-
ander senkrecht stehen: die reelle Achse Rx und die imaginäre Achse Ry , d.h. wir wählen
ein kartesisches Koordinatensystem: der Realteil x einer komplexen Zahl z, d.h. eines
Punktes (oder Zeigers) z, ist dann die Projektion seines Abstands vom Nullpunkt (oder
seiner Länge) auf die reelle 1-Achse, und der Imaginärteil y entsprechend auf die imaginäre
2-Achse, wie im folgenden Bild zu sehen:
Als Alternative zu kartesischen Koordinaten in der Ebene kann man selbstverständlich
auch ebene Polarkoordinaten verwenden, indem man
158
Bild 8.1: Gaußsche Zahlenebene mit kartesischem Koordinatensystem
z = |z|(cos ϕ + i sin ϕ)
und dem
p
Betrag der komplexen Zahl: 0 ≤ |z| := + (x2 + y 2 ) < ∞.
y
Der Polarwinkel, den man man aus x
= tan ϕ erhält, ist nur bis auf additive Terme 2π
bestimmt und heißt
159
Bei der Bestimmung des Arguments stößt man auf eine kleine Schwierigkeit, eine Zwei-
−y
deutigkeit, die daher kommt, daß xy = −x :
Wenn wir z.B. die komplexe Zahl a = 1 + i betrachten mit dem Realteil Re√a = 1 und
dem Imaginärteil Im a = 1, erhalten wir für den Betrag zwar eindeutig |a| = 2, für das
Argument jedoch zunächst zwei Werte α = arg(a) = arctan 1 = π4 oder 54 π, die beide
im Intervall [0, 2π) liegen. Durch Einsetzen der beiden in Frage kommenden Werte in Re a
können wir jedoch in jedem Fall leicht das richtige Argument finden: für α = π4 erhalten
√ √
wir richtig: Re a = |a| cos α = 2 cos π4 = √22 = +1, während uns α = 45 π das falsche
√ √
Resultat Re a = 2 cos 54 π = −√22 = −1 liefert.
160
8.1.5 Euler-Formel
Wenn wir in die Darstellung der komplexen Zahlen in ebenen Polarkoordinaten für Co-
sinus und Sinus die Taylor-Entwicklungen einsetzen, stoßen wir auf eine interessante
Relation:
z
= cos ϕ + i sin ϕ
|z|
∞ ∞
X (−1)n ϕ2n X (−1)n ϕ2n+1
= +i mit −1 = i2 erhalten wir:
n=0
(2n)! n=0
(2n + 1)!
∞ ∞
X (i2 )n ϕ2n X (i2 )n ϕ2n+1
= +i und zusammengezogen:
n=0
(2n)! n=0
(2n + 1)!
∞ ∞
X (iϕ)2n X (iϕ)2n+1
= + , ausgeschrieben ergibt das:
n=0
(2n)! n=0
(2n + 1)!
(iϕ)2 (iϕ)4 (iϕ)6 (iϕ) (iϕ)3 (iϕ)5 (iϕ)7
= 1+ + + + ... + + + + + ...
2! 4! 6! 1! 3! 5! 7!
∞
X (iϕ)n
=
n=0
n!
Diese Reihe kommt uns bekannt vor. Wir erkennen darin die Taylor-Reihe, die es uns
gestattet hat, die Funktionswerte der Exponentialfunktion zu berechnen, nur dass hier
jetzt vor der reellen Variablen ϕ ein i“ steht. Dadurch fühlen wir uns ermutigt, durch die
”
obige Reihe die Exponentialfunktion für eine imaginäre Variable zu definieren:
∞
(iϕ)n
Exponentialfunktion für eine imaginäre Variable: eiϕ :=
P
n=0
n!
Mit dieser Definition erhält die gefundene Relation eine ganz einfache Gestalt, sie ist
berühmt unter dem Namen:
Daraus entnehmen wir Re eiϕ = cos ϕ und Im eiϕ = sin ϕ. Da Cosinus und Sinus peri-
odische Funktionen mit der Periode 2π sind, muß demnach auch die Exponentialfunktion
einer imaginären Variablen eine 2π-periodische Funktion sein:
161
2πi-periodisch: ei(ϕ+2πk) = eiϕ mit k ∈ Z.
Mit der Euler-Formel haben wir neben den Darstellungen der komplexen Zahlen in kar-
tesischen und Polarkoordinaten eine dritte sehr beliebte Darstellung erhalten:
Speziell für folgende komplexe Zahlen auf dem Einheitskreis: |z| = 1 stellen wir zum
Auswendiglernen einige wichtige Relationen zusammen:
iπ −iπ
1 = e0i = e2πi , −1 = e±iπ , i=e2, −i = e 2 .
8.1.6 Komplexkonjugation
Eine häufig benutzte Transformation von komplexen Zahlen wollen wir uns noch in der
Gaußschen Zahlenebene veranschaulichen: Die Komplexkonjugation ordnet jeder kom-
plexen Zahl z ihre komplex Konjugierte z ∗ zu durch Vorzeichenumkehr aller auftretenden
Eulerschen i“ (Die Mathematiker verwenden häufig statt des Sterns einen Querstrich über
”
dem Buchstabensymbol, der uns aber hier nicht zur Verfügung steht): In der Gaußschen
Zahlenebene bedeutet die Komplexkonjugation offensichtich die Spiegelung der komple-
xen Zahlen an der reellen Achse: nur alle Imaginärteile und das Argument erleiden eine
Vorzeichenumkehr, der Realteil und der Betrag bleiben ungeändert:
Komplexkonjugation:
z = x + iy = |z|eiϕ ⇒ z ∗ = x − iy = |z|(cos ϕ − i sin ϕ) = |z|e−iϕ ,
162
Bild 8.2: Komplexkonjugation
Einschub: Zahlenkugel: Schließlich erwähnen wir noch eine Alternative zur
Darstellung der komplexe Zahlen in der Gaußschen Zahlenebene: die Riemannsche
Zahlenkugel:
Dazu denken wir uns eine Kugel vom Durchmesser 1 mit ihrem Südpol“ im Ur-
”
sprung auf die Gaußsche Ebene gelegt und alle Punkte der Ebene durch Geraden mit
dem Nordpol der Kugel verbunden, wie in der obigen Abbildung skizziert:
Jedem Punkt der Ebene wird durch diese von den Mathematikern stereographisch“
”
genannte Projektion eindeutig ein Punkt auf der Kugeloberfläche zugeordnet, der als
alternative Darstellung der entsprechenden komplexen Zahl dienen kann: Man sieht
unmittelbar, dass der Ursprung in den Südpol“, das Innere des Einheitskreises auf
”
die südliche Halbkugel“, der Einheitskreis auf den Äquator“ und das Äußere des
” ”
Einheitskreises auf die nördliche Halbkugel“ abgebildet werden. Das Interessante an
”
dieser Darstellung ist jedoch der Nordpol“, der sich als stetiges Bild aller unend-
”
lich fernen Punkte der Ebene ergibt. Damit wird zum Ausdruck gebracht, dass vom
Standpunkt der komplexen Zahlen nur eine Zahl ∞ existiert und in deren Umgebung
genauso argumentiert werden kann wie für jede andere komplexe Zahl. Immer wenn
derartige Überlegungen eine Rolle spielen, werden Sie später auf diese Art der Dar-
stellung zurückkommen und die Umgebung des Punktes ∞ auf der Riemann-Kugel
betrachten. Wir werden sie in diesem Kurs nicht weiter benützen.
163
Bild 8.3: Bild der Riemannschen Zahlenkugel auf der Gaußschen Zahlenebene
Die geniale Erfindung der Zahl i“ löst alle Probleme der Rechenregeln für die komplexen
”
Zahlen automatisch. Wir wollen im Folgenden sehen, wie sich die Körpereigenschaften von
den reellen Zahlen R auf die komplexen Zahlen C übertragen und uns dabei um deren
anschauliche Deutung in der Gaußschen Ebene bemühen:
Die komplexen Zahlen bilden wie die reellen eine abelsche Gruppe der Addition: Wenn
z = x + iy und w = u + iv zwei komplexe Zahlen sind, dann ist ihre Summe:
Die Veranschaulichung in der Gauß-Ebene erfolgt am besten mit Hilfe des kartesischen
Koordinatensystems: Der Zeiger“ der Summe ist das, was die Physiker aus dem Kräfte-
”
parallelogramm als resultierende Kraft kennen, wie im nächsten Bild zu sehen:
Die Gruppengesetze ergeben sich einfach aus den entsprechenden Relationen der reellen
Zahlen für Real- und Imaginärteil.
164
Bild 8.4: Addition komplexer Zahlen
Einschub: Gruppengesetze:
Kommutatives Gesetz : a+b=b+a
Assoziatives Gesetz : (a + b) + c = a + (b + c)
Nullelement : ∃! 0 := 0 + i0 ∀z ∈ C : z + 0 = z
Negatives : ∀z ∈ C ∃! −z := −x − iy mit z + (−z) = 0.
165
Bild 8.5: Subtraktion komplexer Zahlen
Daraus folgt die Dreiecksungleichung als die positive Wurzel beider Seiten.
Für die komplexen Zahlen selbst gibt es keine Ungleichungen mehr! Man kann
offenbar für zwei beliebige komplexe Zahlen nicht mehr entscheiden, welche von ihnen die
166
größere ist. Das ist der wichtige Unterschied zu den auf der Zahlengeraden angeordneten
reellen Zahlen und der Preis, den wir für die Erweiterung zahlen mussten. Es gibt allerdings
noch einen Rest von Ordnung“, nämlich aus a 6= b folgt immer noch a + c 6= b + c.
”
Das komplex Konjugierte einer Summe ist die Summe der konjugierten Summanden:
(z + w)∗ = (z ∗ + w∗ ).
∗
Re z = z +2 z bzw. Im z = z − z∗ .
2i
Die komplex Konjugierte z ∗ = |z|(cos ϕ − i sin ϕ) = |z|e−iϕ gestattet uns damit auch die
Umkehrung der Euler-Formel:
∗ ∗
cos ϕ = z + z und sin ϕ = z − z .
2|z| 2i|z|
Auch bei der Multiplikation regelt Eulers i“ alles automatisch. Wir können mit den von
”
den reellen Zahlen gewohnten Gesetzen die beiden komplexen Zahlen z = x + iy und
w = u + iv einfach miteinander multiplizieren und i2 = −1 berücksichtigen:
167
Dieser Ausdruck läßt sich nicht leicht im kartesischen Koodinatensystem veranschauli-
chen, auch wenn wir ihn mit z = |z|(cos ϕ + i sin ϕ) bzw.w = |w|(cos ω + i sin ω) in
Polarkoordinaten umschreiben:
Deshalb gehen wir mit der Eulerschen Formel z = |z|eiϕ und w = |w|eiω zur Exponenti-
aldarstellung über, die unserem Wunsch nach Veranschaulichung entgegenkommt:
|zw| |z|
= 1,
|w|
d.h. dass sich die Länge |zw| des Produktzeigers zur Länge |w| des Zeigers des einen
Faktors verhält wie die Länge |z| des Zeigers des anderen Faktors zu 1. Zur Veranschau-
lichung haben wir also von dem einen Faktorzeiger, z.B. w aus das Argument ϕ des
anderen Faktors anzutragen, um genau dann den Produktzeiger zw zu erhalten, wenn das
Dreieck ∆0w(zw) dem Dreieck ∆01z ähnlich ist. Wir illustrieren dies im Bild 8.6:
Als Nebenprodukt unserer obigen Bemühungen um eine Veranschaulichung in Polarkoor-
dinaten haben wir wegen der Eindeutigkeit der komplexen Zahlen die trigonometrischen
Additionstheoreme für die Winkelsummen abgeleitet, die wir früher Mühe hatten,
herzuleiten und auswendig zu lernen:
Die Gesetze der Abelschen Gruppe der Multiplikation ergeben sich wieder einfach
aus den entsprechenden Relationen der reellen Zahlen.
168
Bild 8.6: Multiplikation komplexer Zahlen
Einschub: Gruppengesetze:
Kommutatives Gesetz : ab = ba
Assoziatives Gesetz : (ab)c = a(bc)
Einselement : ∃! 1 := 1 + i0 ∀z ∈ C : 1 · z = z
Inverses : ∀z = reiϕ ∃!z −1 := r−1 e−iϕ mit z · z −1 = 1
Die Existenz einer eindeutigen Inversen ermöglicht die Division durch komplexe Zahlen:
der Quotient a · b−1 =: ab löst die Gleichung z · b = a für b 6= 0. Zur Veranschaulichung des
Quotienten berechnen wir
iϕ
z = |z|e = |z| ei(ϕ−ω) = |z| (cos(ϕ − ω) + i sin(ϕ − ω)).
Quotient: w
|w|eiω |w| |w|
169
Das bedeutet für den
= |z|
z
Betrag des Quotienten: w
|w|
| wz |
= 1 ,
|z| |w|
d.h. die Länge wz des Quotientenzeigers verhält sich zur Länge |z| des Zeigers des Zählers
wie 1 zur Länge |w| des Nenners. Zur Veranschaulichung haben wir also vom Argument
ϕ des Zeigers des Zählers z aus das Argument ω des Nenners abzuziehen, um genau dann
den Quotientenzeiger wz zu erhalten, wenn das Dreieck ∆0( wz )z dem Dreieck ∆01w ähnlich
ist. Wir sehen uns das wieder im nächsten Bild genauer an:
170
Bild 8.7: Division komplexer Zahlen
z = zw∗ ,
w |w|2
171
Das komplex Konjugierte eines Produkts ist das Produkt der konjugierten Faktoren:
(zw)∗ = z ∗ w∗ .
Der Stern kann wie bei der Summe in die Klammer hineingezogen werden.
Beim Rechnen mit komplexen Zahlen benützt man häufig die Tatsache, dass das Produkt
einer komplexen Zahl mit ihrer komplex Konjugierten reell ist:
∗
Diese Relation hilft auch, wenn man einen Nenner reell halten will: z1 = z 2 .
|z|
Auch bei der Multiplikation gibt es wieder einen bescheidenen Rest der bei der Erwei-
terung der reellen Zahlen ins Komplexe verlorengegangenen Ordnung: Aus a 6= b und
c 6= 0 folgt ac 6= bc.
172
8.3 Funktionen einer komplexen Variablen
8.3.1 Definition
Ganz analog wie im Reellen definieren wir komplexe Funktionen einer komplexen
Variablen wieder als Input-Output-Relation oder Abbildung, jedoch mit einem be-
deutenden Unterschied: Die dort ausdrücklich in den Funktionsbegriff mit eingeschlos-
sene Eindeutigkeit mit ∃!y = f (x) wollen wir bei den komplexen Funktionen nicht
voraussetzen:
Es wird also möglich und sogar die Regel sein, dass es zu einem Wert der unabhängigen
komplexen Variablen z aus dem Definitionsbereich Df ⊂ C im Wertevorrat Wf ⊂ C
mehrere Funktionswerte f (z) gibt. Wir werden ein-, zwei-, drei- usw. mehrdeutige, besser
mehrwertige Funktionen kennen lernen und sogar ∞-wertige zulassen.
Einschub: Eindeutigkeit: Man kann auch für die komplexen Funktionen die
Eindeutigkeit in die Definition einbauen, wie das in einigen modernen Lehrbüchern
der Funktionentheorie gemacht wird. Man muss dann später allerdings den Wer-
tebereich genauer angeben, sodass dasselbe Funktionssymbol je nach Wertebereich
mehreren Zweigfunktionen beschreibt.
Auf eine wichtige komplexe Funktion, die Exponentialfunktion, sind wir im Abschnitt 8.1
bereits gestoßen.
173
Da wir bei den komplexen Zahlen keine Ordnung mehr haben, kann es natürlich kein
Analogon zur Monotonie geben, die für reelle Funktionen sehr wichtig war.
Das Rechnen mit komplexen Funktionen einer komplexen Variablen erfolgt nach
den im vorigen Abschnitt zusammengestellten Regeln des Körpers C mit den beiden Kom-
mutativen und Assoziativen Gesetzen sowie dem verbindenden Distributiven Gesetz: Z.B.
ergibt die Summe bzw. Differenz zweier komplexer Funktionen f1 (z) ± f2 (z) = g(z) eine
neue komplexe Funktion, das komplexe Vielfache cf (z) = g(z) mit c ∈ C ebenfalls und
analog das Produkt f1 (z) · f2 (z) = g(z) oder, falls f2 (z) 6= 0 im Definitionsbereich, auch
der Quotient f1 (z)/f2 (z) = g(z).
Auch die Übertragung des für die reellen Folgen und Funktionen zentralen Begriffs des
Grenzwerts bereitet uns keine ernsten Probleme, da es dabei auf den Abstand zwischen
Punkten ankam, den wir auch im Komplexen zur Verfügung haben.
Wir sagen, eine Folge von komplexen Zahlen (zn )n∈N hat eine komplexe Zahl z0 als
Grenzwert oder Limes, und schreiben: lim zn = z0 (manchmal lässiger: zn→∞ −→ z0 ),
n→∞
oder nennen die Folge
Mit dem letzten Stenogramm ist wieder gemeint: Für jede vorgegebene auch noch so
kleine positive Zahl ε kann man eine Nummer N (ε) angeben, sodass der Abstand vom
Häufungspunkt z0 für alle Folgenglieder mit einer größeren Nummer als N kleiner ist als
das vorgegebene kleine ε.
Mit dieser Definition des Grenzwerts komplexer Zahlen sind alle Konvergenzbetrachtungen
im Komplexen auf die Untersuchung der entsprechenden reellen Abstände zurückgeführt.
Für die komplexen Funktionen wählen wir wieder eine Folge (zn )n∈N ⊂ Df von kom-
plexen Zahlen im Definitionsbereich Df der Funktion f, die für n → ∞ gegen die Zahl
z0 ∈ Df strebt. Dann bilden wir die Funktionswerte an diesen Stellen f (zn ), die wie-
der eine Folge darstellen (f (xn ))n∈N , und überprüfen, ob diese Folge der Funktionswerte
konvergiert. Falls sich das für jede aus dem Definitionsbereich herausgegriffene gegen z0
strebende Folge zeigen lässt und denselben Grenzwert w0 ergibt, nennen wir die Folge der
Funktionswerte konvergent gegen w0 : lim f (z) = w0 :
z→z0
174
lim f (z) = w0 konvergent: ⇐⇒ ∀(zn )n∈N : lim zn = z0 =⇒ lim f (zn ) = w0
z→z0 n→∞ n→∞
.
Wenn wir unsere Definition der Konvergenz für Folgen einsetzen, ergibt das:
Dies für alle Folgen zu zeigen, ist natürlich wieder leichter gesagt als getan! Wir überlassen
dieses Problem wie schon früher im Reellen den Mathematikern und beschränken uns auf
die uns interessierenden meist ohnehin klaren Fälle.
Mit dieser Grenzwertdefinition können wir leicht auch für unsere komplexen Funktionen
die Stetigkeit definieren analog unserer früheren Definition:
w = f (z) stetig bei x0 ⇐⇒ ∀ε > 0 ∃δ(ε) > 0 : |f (z) − w0 | < ε ∀z mit |z − z0 | < δ
.
Für die Grenzwerte bedeutet das wieder, dass an der betrachteten Stelle z0 der Limes
durch den Funktionswert w0 = f (z0 ) des Grenzwerts z0 einer Folge (zn ) aus dem Defi-
nitionsbereich der Argumente gegeben wird: lim f (z) = w0 = f (z0 ) = f ( lim zn ). An-
z→z0 n→∞
schaulich heißt das, dass die Funktion f (z) dem Punkt z0 benachbarte Punkte wieder in
benachbarte Bildpunkte abbildet.
Allerdings gestaltet sich die graphische Darstellung der komplexen Funktionen we-
sentlich schwieriger als im reellen Fall, da eine Funktion vier reelle Größen zueinander in
Beziehung setzt. Statt eine reelle Urbild-Gerade, nämlich die x-Achse, auf eine andere,
die Bild-Gerade oder y-Achse, haben wir jetzt eine ganze komplexe Urbild-Ebene, die
z-Ebene, auf eine andere, die Bild- oder w-Ebene, abzubilden. Wir haben uns bei der
graphischen Darstellung einer reellen Funktion einer reellen Variablen daran gewöhnt,
die beiden Zahlengeraden senkrecht aufeinander zu stellen und die Abbildung durch eine
Kurve in der Ebene zu veranschaulichen. Für komplexe Funktionen einer komplexen Varia-
blen müssen wir neue Arten der Darstellung finden. Wir werden meist die Urbild-Ebene
175
und die Bild-Ebene nebeneinander zeichnen und ausgewählte Punkte oder Kurven
in der z-Ebene und deren Bilder in der w-Ebene durch dieselben Symbole oder Farben
kennzeichnen. Darüber hinaus können natürlich auch ein Höhenlinien-Netz von Real-
u und Imaginärteil v über der z-Ebene oder von Betrag |w| und Argument arg w
der Funktionswerte über einem x − y-Netz der z-Ebene eine genauere Vorstellung
von der Abbildung geben. Den besten Eindruck von der Wirkung einer Funktion erhält
man durch ein perspektivisches Reliefgebirge, z.B. mit x − y-Netz über einem Bereich
der z-Ebene. Wegen dieser Schwierigkeiten werden wir nur die wichtigsten Funktionen aus
unserer Grundausstattung reeller Funktionen im Komplexen studieren:
8.3.4 Potenzen
Zunächst betrachten wir wie früher die Potenzen z n mit natürlichen Exponenten n ∈ N:
w = z n = (x + iy)n = |z|n (cos ϕ + i sin ϕ)n = |z|n einϕ = |z|n (cos nϕ + i sin nϕ),
wobei wir zum Schluß die Euler-Formel verwendet und so deren Erweiterung erhalten
haben: die
176
d.h. wir erhalten für den Realteil u = x2 − y 2 und den Imaginärteil v = 2xy bzw. für den
Betrag |w| = |z|2 und für das Argument arg(w) = 2 arg(z).
Zunächst berechnen wir einige Bildpunkte:
w(±1) = (±1)2 = 1,
π
w(±i) = (±i)2 = e±i 2 2 = e±iπ = −1 und
√ iπ
w(1 ± i) = (1 ± i)2 = ( 2e± 4 )2 = ±2i.
Einschub: Gummifolie: Man kann sich die Abbildung etwa folgendermaßen zu-
standegekommen vorstellen: man denke sich die z-Ebene aus Gummifolie bestehend
und klappe die positive und die negative imaginäre Halbachse um den Ursprung um
90◦ nach links in die negative reelle Achse, bis sie sich treffen.
Die Bilder der linken Hälfte der Gaußschen z-Ebene ergeben eine zweite Überdeckung der
ganzen w-Ebene, ähnlich wie auch schon bei der reellen Quadrat-Funktion das Bild der
negativen Urbild-Halbgeraden die positive Bild-Halbgerade ein zweites Mal überdeckte,
weshalb die Wurzel-Funktion nur über der positiven Halbgeraden definiert werden konnte.
Um hier bei der komplexen Quadrat-Funktion eine Umkehrfunktion über der ganzen Ebene
zu ermöglichen, schneiden die Mathematiker die beiden übereinander liegend gedachten
Bild-Ebenen (z.B. entlang der negativen reellen Achse) auf und verbinden das obere Ufer
des Schnittes im oberen Blatt mit dem unteren Ufer im unteren Blatt und denken sich
auch das untere Ufer des oberen Blattes durch die andere Verbindung hindurch“ mit
”
177
Bild 8.9: Rechte Hälfte der z- und gesamte obere w-Ebene der Quadrat-Funktion
dem oberen Ufer des unteren Blattes verklebt. Das ganze Gebilde aus den zwei kreuzweise
entlang der negativen reellen Achse verbundenen Ebenen nennt man eine Riemannsche
Fläche mit zwei Blättern, sodass man sagen kann: die komplexe Quadrat-Funktion
bildet die z-Ebene umkehrbar eindeutig auf eine zweiblättrige Riemannsche Fläche ab,
wobei die spezielle Lage des Schnittes willkürlich ist; entscheidend ist nur, dass er zwischen
den beiden Verzweigungspunkten 0 und ∞ verläuft. Die nächste Abbildung versucht diesen
Sachverhalt anschaulich darzustellen.
Bei der Bewegung eines Massenpunkts z.B. auf dem Einheitskreis in der z-Ebene begin-
nend im Punkt z = 1 läuft auch der Bildpunkt w auf dem Einheitskreis in der oberen
w-Ebene, jedoch doppelt so schnell, bis er bei z = i, d.h. w = −1 in das untere Blatt der
178
Riemannschen w-Fläche abtaucht. Er läuft dann auf dem Einheitskreis im unteren Blatt
weiter, befindet sich für z = −1 bei w = +1 im unteren Blatt und taucht erst für z = −i
wieder an der Abtauchstelle w = −1 auf dem oberen Blatt auf, um schließlich auf dem
oberen Einheitskreis für z = 1 den Ausgangspunkt w = 1 wieder zu erreichen.
2) Ein ähnliches Bild erhält man für die kubische Funktion mit n = 3:
d.h. für den Betrag |z 3 | = |z|3 und für das Argument arg(z 3 ) = 3 arg(z).
Wir berechnen nur einige Bildpunkte:
Man erkennt, dass ein Drittel der z-Ebene bereits auf die ganze w-Ebene, die ganze
Urbild-Ebene also auf eine Riemann-Fläche bestehend aus drei zwischen 0 und ∞ aufge-
schnitten und miteinander verbundenen Blättern abgebildet wird. Die folgende Abbildung
skizziert die Situation:
Bild 8.11: Ein Drittel der z-Ebene und oberes Blatt der w-Ebene für w = z 3
In dieser Art fortfahrend erhält man einen Überblick über alle Potenz-Funktionen
w = z n . Jeweils wird ein n-tel der z-Ebene auf die ganze w-Ebene bzw. die ganze
179
z-Ebene umkehrbar eindeutig auf eine n-blättrige Riemann-Fläche abgebildet. Wenig-
stens im Prinzip ergibt das ein Bild von der Wirkungsweise der komplexen Polynome:
m
an z n .
P
Pm (z) =
n=0
Für jedes derartige Polynom m-ten Grades garantiert der Fundamentalsatz der Alge-
bra im Komplexen die Existenz von m komplexen Zahlen zn , so dass die Summe als
Produkt mit m Faktoren,
m
X
Pm (z) = an z n = am (z − z1 )(z − z2 )(z − z3 ) . . . (z − zm−1 )(z − zm ),
n=0
Zeigen Sie mit Hilfe des Fundamentalsatzes der Algebra, dass für die Summe bzw. das
m
a
wn = − am−1
P
Produkt der m Nullstellen wn eines Polynoms Pm (w) = 0 gilt: m
bzw.
n=1
m
wn = (−1) aam0 .
m
Q
n=1
∞
an (z−z0 )n , die die Mathematiker auch
P
Von den komplexen unendlichen Potenzreihen
n=0
ganze Funktionen“ nennen, berichten wir ohne Beweis, dass diese Entwicklungen alle im
”
Inneren eines Kreisgebiets |z −z0 | < R mit dem Radius R um das Entwicklungszentrum z0
absolut konvergieren und außerhalb divergieren, wobei der jetzt erst richtig verständliche
Konvergenzradius“ R nach den Konvergenzkriterien berechnet werden kann, von
”
denen wir früher einige erläutert haben. Zum Beispiel begrenzt bei der komplexen geome-
∞
1
z n = 1−z
P
trischen Reihe die Singularität bei z = 1 den Konvergenzradius auf R = 1,
n=0
wie wir in Abschnitt 6.5 mit Hilfe des Quotienten-Kriteriums gesehen haben. Wir wol-
len hier nur drei besonders wichtige Potenzreihen exemplarisch genauer untersuchen: die
natürliche Exponentialfunktion, der wir schon begegnet sind, und Sinus und Cosinus.
180
8.3.5 Exponentialfunktion
Die bei weitem wichtigste komplexe Funktion ist die natürliche Exponentialfunktion.
Wir wurden bereits im Abschnitt 8.1.4 durch die Euler-Formel auf ihre Definition für
rein imaginäre Variable geführt und können diese natürlich leicht für allgemeine komplexe
Variablen ergänzen:
Exponentialfunktion:
∞
w = ez := exp(x + iy) = exp(x)(cos y + i sin y) =
P zn ,
n=0
n!
Während sie als Funktion des Realteils nach wie vor so rasant ansteigt, wie wir früher
gesehen hatten, ist sie in Abhängigkeit vom Imaginärteil ihrer Variablen 2π-periodisch.
Der Konvergenzradius der Taylor-Entwicklung ist, wie wir früher gesehen haben, unend-
lich.
Die Funktionalgleichung
ez ew = ez+w für z, w ∈ C
gilt nach wie vor.
Um uns ein Bild der Funktion machen zu können, berechnen wir zunächst wieder einige
Bildpunkte:
w(1) = e,
w(0) = 1,
1
w(−1) = ,
e
w(iπ) = −1 und
iπ
w( ) = i.
2
181
Dann sehen wir, dass die senkrechten Geraden Re z = x = const. in Kreise |w| =
|ez | = eRe z = exp(x) = const. übergehen: die Gerade x = 0 in den mit |w| = 1, die mit
x = 1 in den mit |w| = e und die Gerade x = −1 in den Kreis mit |w| = 1e .
Aus diesen Ergebnissen erkennen wir, dass die Exponentialfunktion einen waagrechten
Streifen der z-Ebene mit der Höhe 2π, z.B. den sogenannten Fundamentalbereich
mit −π < Im z ≤ π auf die zwischen den Verzweigungspunkten 0 und ∞ (z.B. entlang
der negativen reellen Achse) aufgeschnittene w-Ebene abbildet. Die ganze z-Ebene geht
also in eine Riemann-Fläche mit unendlich vielen Blättern über. Bei jedem Blatt ist
dabei das obere Ufer entlang dem Schnitt mit dem unteren Ufer des darunterliegenden
Blattes stetig verbunden und das obere Ufer des letzten durch alle anderen Verbindungen
”
hindurch“ mit dem unteren Ufer des ersten Blattes. Die folgende Darstellung kann helfen,
sich ein Bild von dem Wirken der Funktion zu machen.
Bild 8.12: Bild vom waagrechten Fundamentalstreifen in der z-Ebene und der aufgeschnit-
tenen w-Ebene für die Exponentialfunktion
182
8.3.6 Trigonometrische Funktionen
Nachdem wir die Exponentialfunktion untersucht haben, werfen wir noch einen kurzen
Blick auf die trigonometrischen Funktionen, Cosinus und Sinus, die wir mit Hilfe der
Euler-Formel leicht aus der Exponentialfunktion erhalten oder durch ihre Potenzreihen
definieren können:
iz −iz ∞ 2n
Cosinus: w = cos z = e +2 e (−1)n z
P
=
n=0 (2n)!
−iz iz ∞
i(e − e ) P n z
2n+1
Sinus: w = sin z = 2 = (−1) .
n=0 (2n + 1)!
Beide Reihen konvergieren in der ganzen Ebene. Wie wir wissen, sind Cosinus und Sinus
gelten auch
cos(x + iy) = cos x cos iy − sin x sin iy = cos x cosh y − i sin x sinh y
sin(x + iy) = sin x cos iy + cos x sin iy = sin x cosh y + i cos x sinh y.
183
z −z ∞
Cosinus hyperbolicus: w = cosh z = e +2 e =
P z 2n
n=0 (2n)!
z −z ∞
Sinus hyperbolicus: w = sinh z = e −2 e =
P z 2n+1 .
n=0 (2n + 1)!
Man sieht daraus, dass cos z und sin z im Komplexen keineswegs mehr beschränkt sind,
sondern für große Imaginärteile ansteigen wie die Hyperbel-Funktionen. Anders als bei
der Exponentialfunktion werden hier senkrechte Streifen der z-Ebene mit der Breite
2π, z.B. der Fundamentalbereich mit −π < Re z ≤ π, auf die zwischen −1 und +1
aufgeschnittene zweiblättrige w-Ebene abgebildet.
Beweisen Sie eines der Additionstheoreme, etwa cos(z − w) = cos z cos w + sin z sin w, mit
Hilfe der Exponentialfunktionen und dann daraus cos2 z + sin2 z = 1.
Zeigen Sie, dass: a) cos iz = cosh z, b) sin iz = i sinh z und c) 4 sin3 α = 3 sin α − sin 3α.
Die folgenden Bilder zeigen zunächst die Höhenlinien für Realteil Re sin z, Imaginärteil
Im sin z (gestrichelt), Betrag | sin z| und Argument arg sin z (ebenfalls gestrichelt) der
Bildfunktion w = sin z über dem Quadrat.
184
Bild 8.13 a + b: Höhenliniendarstellungen für Re sin z und Im sin z über dem ausgewählten
Quadrat 0 < Re z < π und 0 < Im z < π .
Bild 8.13 c + d: Höhenliniendarstellungen für | sin z| und arg sin z über dem ausgewählten
Quadrat 0 < Re z < π und 0 < Im z < π .
186
der dargestellten Funktion zu machen. Dies gelingt schon etwas besser, wenn man die
Flächen zwischen den Linien entsprechend dem Mittelwert der Funktion in diesem Gebiet
in den Grautönen einer Skala abtönt, die von Schwarz bei tiefliegenden kleinen Werten
in immer helleren Stufen bis Weiß bei hohen Werten reicht. Diese Art der Darstellung
demonstrieren die Bilder g) bis j). Beim Imaginärteil Imsinz kann man sich jetzt schon viel
besser vorstellen, wie die Werte mit zunehmendem Im z einerseits für Re z = 0 ansteigen
und andererseits für Re z = π abfallen. Auch das rasante Ansteigen von Re sin z und
| sin z| mit zunehmendem Abstand von der reellen Achse wird deutlich.
Bild 8.13 g + h: Grau getönte Höhenliniendarstellungen für Re sin z und Im sin z über
dem Quadrat.
Bild 8.13 i + j:Grau getönte Höhenliniendarstellungen für | sin z| und arg sin z über dem
Quadrat.
Noch schönere einprägsame Bilder erhält man, wenn man zur Charakterisierung der re-
187
lativen Höhen eine Farbskala verwendet, etwa wie in geographischen Karten vom
Dunkelblau der Meerestiefen über verschiedene Grüntöne bis zum immer dunkler wer-
denden Braun der Gebirge oder wie in dem hier bei den Bildern k) bis n) verwendeten
Computer-Programm MATHEMATICA die Farben des Regenbogens entsprechend
den Frequenzen des Lichtes von (magma-)roten Tönen für kleinere Werte bis (himmel-
)blauen bei hohen Funktionswerten anwachsend. Diese Bilder vermitteln einen deutlichen
Eindruck von der Struktur des betrachteten Gebirges der Funktionswerte“. Man sieht
”
z.B. besonders schön im Bild n) bei arg sin z für Im z = π den linearen Anstieg der Phase
von −90◦ bei Re z = π zu +90◦ bei Re z = 0.
188
Auch bei dieser Darstellungsart können wieder die farblich veranschaulichten Höhenlinien
einer Variablen zu einem Netz ergänzt werden durch Eintragen der (gestrichelten) Hö-
henlinien einer zweiten Variablen, die allerdings dann nicht mehr farblich kommentiert
werden können. Das wird in den nächsten beiden Bildern illustriert:
Bild 8.13 o + p: Regenbogenfarbig getönte Höhenliniennetze für Re sin z und Im sin z bzw.
| sin z| und arg sin z über dem Quadrat.
189
Plastischer als bei diesen zweidimensionalen Projektionen ist jedoch der Eindruck, den
man erhält, wenn man die perspektivischen Darstellungen der Funktionswerte be-
trachtet, die die modernen Computer-Zeichenprogramme anbieten, wie in den nächsten
Bildern gezeigt:
Bild 8.14 a + b: Perspektivische Reliefs der Funktionswerte von Re sinz und Im sin z mit
einem x-y-Netz über dem ausgewählten Quadrat 0 < Re z < π und 0 < Im z < π .
Bild 8.14 c + d: Perspektivische Reliefs der Funktionswerte von | sin z| und arg sin z mit
einem x-y-Netz über dem ausgewählten Quadrat 0 < Re z < π und 0 < Im z < π .
190
Um den Einfluß der Vorzeichenwechsel zu demonstrieren, haben wir Ihnen schließlich die
vier interessierenden Variablen mit Hilfe des MATHEMATICA-Programms noch über
dem größeren Rechteckgebiet 0 < Re z < π und −π < Im z < π dargestellt, und zwar
so dass Sie sie durch Mausklick drehen können:
Bild 8.15 a + b: Drehbare perspektivische Reliefs der Funktionswerte von Re sinz und
Im sin z mit einem x-y-Netz über dem Rechteckgebiet 0 < Re z < π und −π < Im z < π.
Bild 8.15 c + d: Drehbare perspektivische Reliefs der Funktionswerte von | sin z| und
arg sin z mit einem x-y-Netz über dem Rechteckgebiet 0 < Re z < π und −π < Im z < π.
191
Wenn man in Richtung der positiven imaginären Achse z.B. auf das Gebirge von | sin z|
schaut, sieht man deutlich die reelle Funktion | sin x| bei einem senkrechten Schnitt
über der reellen Achse Im z = 0. In Richtung der positiven reellen Achse gesehen, er-
kennt man die reelle Funktion sinh y über der imaginären Achse, und sogar die reelle
Funktion cosh y ist als obere Einhüllende über der Geraden Re z = π2 erkennbar. Nach
Verschieben des Nullpunkts um π2 in Richtung der reellen Achse beschreibt dasselbe Bild
das Gebirgsrelief der komplexen Cosinus-Funktion.
8.3.7 Wurzelfunktionen
Zum Abschluß dieses Kapitels schauen wir uns noch einige Umkehrfunktionen im Kom-
plexen an, bei denen wieder charakteristische Unterschiede zum reellen Fall auftreten: als
erstes betrachten wir die Wurzelfunktionen.
Nachdem wir gesehen haben, wie die n-te Potenz einen n-tel-Sektor der komplexen z-
Ebene in die ganze w-Ebene abbildet, erwarten wir jetzt umgekehrt, dass die n-te Wurzel
die ganze z-Ebene in einen n-tel-Sektor der w-Ebene abbildet, also eine n-wertige Funktion
ist, wie wir sie ja im Komplexen bewußt zugelassen haben:
√ 1 1 1 √ i(ϕ+2πk)
w= n
z = z n = (reiϕ ) n = (rei(ϕ+2πk) ) n = n
re n für n ∈ N und k ∈ N0
ϕ + 2πk ϕ ϕ
< 2π ⇐= k + < n ⇐= k ≤ n − 1 < n − , d.h. k = 0, 1, 2, 3, ..., n − 1.
n 2π 2π
Demnach existieren genau n n-te Wurzeln wk , die wir mit dem Index k numerieren wollen:
√ √ i(ϕ+2πk)
n n-te Wurzeln: wk = n
z= n
re n für n ∈ N.
n−1
P
regelmäßigen n-Ecks liegen: wk = 0.
k=0
192
Aufgabe 8.12 Wurzeln:
n−1
P
Beweisen Sie wk = 0 mit Hilfe des Ergebnisses von Aufgabe 8.7.
k=0
√ π π
Als Beispiel berechnen wir zunächst wk = i = ei( 2 +2πg)/2 = ei( 4 +kπ) mit k = 0 und 1,
also
π 1+i
w0 = ei 4 = √ und
2
5 1 +i
w1 = ei 4 π = − √ = −w0 .
2
√ 2 2
Ein weiteres Beispiel ist: wk = 3 1 = ei(2π+2πk)/3 = ei( 3 π+k 3 π) mit k = 0, 1, 2, also
√
i2π/3 2 2 −1 + i 3
w0 = e = cos 3 π + i sin 3 π = ,
√ 2
−1 − i 3
w1 = e i(2π/3+2π/3)
=e 4iπ/3
= = w0∗ und
2
w2 = ei(2π/3+2·2π/3) = e2πi = +1.
√ √
Als letztes Beispiel folgt: wk = 3
8i = 3 8ei(π/2+2πk)/3 = 2ei(π/6+k2π/3) mit k = 0, 1, 2, also
√
w0 = 2eiπ/6 = 2(cos π + i sin π ) = 2( 3 + i ) = √3 + i,
6 6 2 2 √
w1 = 2e i(π/6+2π/3)
= 2e 5iπ/6 5π
= 2(cos 6 + i sin 5π
6 ) = − 3 + i und
w2 = 2ei(π/6+4π/3) = 2e3iπ/2 = −2i.
193
Aufgabe 8.13 Wurzeln:
√
3
p √
Berechnen und skizzieren√Sie folgende Wurzeln: a) w = i, b) w = 4
(−1), c) w = 8 1,
√
d) w = 4 −i und e) w = 2 8i.
8.3.8 Logarithmus
Zum Schluß dieses Kapitels werfen wir noch einen Blick auf eine unendlich vielwertige
Funktion, den natürlichen
Logarithmus: w = ln z für z 6= 0.
und der
hat jeweils unendlich viele Werte, die sich um ganzzahlige Vielfache von 2π unterscheiden.
Man wählt etwa den Bereich −π < Im(Ln z) ≤ π als Hauptwert und schreibt diesen mit
dem Großbuchstaben: Ln, so dass man erhält:
ln z = Ln z + 2πik mit k ∈ Z
.
Z.B. folgt
1) aus e0 = 1 : Ln 1 = 0, also ln 1 = 2πik,
iπ
2) aus e = −1 : Ln(−1) = iπ, also ln(−1) = iπ(1 + 2k)und
3) aus 3eiπ = −3 : Ln(−3) = ln | − 3| + iπ, also ln(−3) = 1, 098 + iπ(1 + 2k).
194
8.3.9 Allgemeine Potenz
Den Logarithmus braucht man wie im Reellen zur Definition der allgemeinen Potenz,
die deshalb im Komplexen auch unendlich viele Werte besitzt:
denn b = |b|ei(β+2πg) .
Als Hauptwert von bz nimmt man ez Ln b mit dem Hauptwert Ln b von ln b. Damit kann
man jetzt z.B. 1i ausrechnen: wg = 1i = ei ln 1 = ei2πig = e−2πg ∈ R :
w0 = 1, w1 = e−2π = 1, 87 · 10−3 , w2 = e−4π = 3, 49 · 10−6 , aber auch w−1 = e2π =
535, 49 usw.
Überraschenderweise ist sogar ii reell: wg = ii = ei ln i = ei·i(π/2+2πg) = e−(π/2+2πg) ∈ R :
w0 = e−π/2 = 0, 20788.
Nach diesen kuriosen Scherzen verlassen wir die komplexen Zahlen. Sie werden im Verlauf
Ihres Studiums noch oft auf diese Dinge zurückkommen und noch weitere komplexe Funk-
tionen kennen lernen, z.B. die Gruppe der gebrochenen linearen Funktionen w = az+b cz+d
,
die winkeltreu und kreisverwandt“ abbilden. Sie werden die verschiedenen Arten von
”
Singularitäten studieren und klassifizieren sowie in der Laurent-Entwicklung eine Verall-
gemeinerung der Taylor-Entwicklung kennenlernen. Insbesondere aber werden Sie in einer
mathematischen Vorlesung über Funktionentheorie“ untersuchen, wann komplexe Funk-
”
tionen differenzierbar (= analytisch = holomorph) sind, und lernen, wie man schwierige
reelle Integrale mit dem Residuen-Satz elegant in der komplexen Ebene lösen kann. Wir
sind sicher, dass Sie sich dem Reiz und der Schönheit dieser mathematischen Theorie nicht
entziehen können, wenn sie auch für die Naturwissenschaften nicht unbedingt notwendig,
sondern nur nützlich ist.
195
196
Kapitel 9
VEKTOREN
Nachdem wir uns mit Funktionen einer reellen Variablen und deren Analysis sowie den
einfachsten Rechenregeln der komplexen Zahlen beschäftigt haben, wenden wir uns im
letzten Kapitel dieses Kurses dem dreidimensionalen Raum zu, in dem wir leben und in
dem sich die gesamte Physik abspielt.
Wir alle haben aufgrund unserer Alltagserfahrungen eine Vorstellung vom dreidimensio-
nalen Raum. Wir denken meist an ein Zimmer oder eine Schachtel mit Länge, Breite und
Höhe, an die man drei Maßstäbe zugleich anlegen kann. Damit läßt sich der Ort etwa
der rechten vorderen oberen Ecke Ihrer Tastatur genau angeben. Die Mathematiker bau-
en den dreidimensionalen reellen Raum R3 nach diesem Vorbild logisch als äußeres
”
Produkt“ von drei reellen Geraden R1 auf, wie wir sie zur Veranschaulichung der reellen
Zahlen verwendet haben: R3 = R11 ⊗ R12 ⊗ R13 .
9.1.2 Koordinatensysteme
Die Physiker legen Wert darauf, jede Stelle des Raumes genau bezeichnen zu können,
und verwenden dazu ein Koordinatensystem: Dazu wählen sie zunächst völlig willkür-
lich, aber oft sehr zweckmäßig einen Punkt des Raumes als Nullpunkt, auch Ursprung
genannt. Durch diesen Punkt legen sie wieder völlig willkürlich drei beliebige reelle
Zahlengeraden und nummerieren sie: R11 , R12 und R13 . Das ergibt bereits ein Koordinaten-
system. Meist ist man jedoch etwas anspruchsvoller und verlangt, dass diese drei Geraden
197
paarweise senkrecht aufeinander stehen: R1k ⊥ R1l für k, l = 1, 2, 3. Das nennt man dann
ein kartesisches Koordinatensystem. Wenn nun die positiven Halbgeraden der drei
jetzt Koordinatenachsen genannten Zahlengeraden so angeordnet bzw. numeriert
sind, dass die Drehung der positiven Halbgeraden der 1-Achse um den Winkel π/2 um
die 3-Achse in die positive Halbgerade der 2-Achse in Richtung der positiven 3-Achse
gesehen eine Rechtsschraubendrehung darstellt (d.h. im Uhrzeigersinn erfolgt), dann
hat man das Ideal, ein (kartesisches) Rechtskoordinatensystem, konstruiert. Einigen
von Ihnen ist diese Nummerierung der Achsen auch als Rechte-Hand-Regel geläufig, weil
die positiven Halbgeraden der 1-, 2- und 3-Achse dabei angeordnet sind wie Daumen,
Zeigefinger und Mittelfinger der gespreizten rechten Hand. Im Folgenden sei dies immer
angenommen.
Auf der positiven Halbgeraden jeder der drei Koordinatenachsen R1k für k = 1, 2, 3 liegt,
jeweils wieder völlig willkürlich gewählt, der zugehörige Einheitspunkt Ek , dessen Ent-
fernung vom Nullpunkt wie bei einem Lineal die Längeneinheit festlegt. So lässt sich jeder
Punkt P ∈ R3 des dreidimensionalen Raumes eindeutig durch ein Koordinatentripel
reeller Zahlen kennzeichnen P = (p1 , p2 , p3 ). Die Zahl pk ist dabei jeweils die Höhe über
der von den beiden anderen reellen Zahlengeraden R1l und R1m aufgespannten Koordina-
tenebene, gemessen in der vorher durch Ek gewählten Einheit.
198
Bild 9.2: Ein Punkt mit seinem Koordinatentripel
p
Speziell ist der Abstand des Punktes P vom Nullpunkt O damit |P O| = p21 + p22 + p23 .
Die Mathematiker nennen den Raum mit dieser Abstandsdefinition euklidisch. Für den
Abstand zweier verschiedener Punkte P 6= Q gilt dann immer |P Q| = |QP | > 0, der
Abstand eines Punktes von sich selbst verschwindet: |P P | = 0, und es gilt wie gewohnt
die Dreiecksungleichung, die besagt, dass die Summe zweier Seitenlängen in jedem
Dreieck länger ist als die Länge der dritten Seite:
199
Dreiecksungleichung: |P Q| ≤ |P R| + |RQ|
200
1. Translationen (Verschiebungen), z.B. um die Strecke 1 cm in 3-Richtung:
Zunächst beschäftigt uns die Willkür bei der Wahl des Ursprungs: Wie sähen
die Koordinaten (p1 , p2 , p3 ) des Punktes P aus, wenn wir statt des Punktes O einen
anderen Punkt, z.B. O b = E3 , als Nullpunkt gewählt hätten, der um die Strecke
|E3 O| = 1 cm in positiver 3-Richtung verschoben ist?
201
ist gleich der Zahl p1 der 1-Koordinate im alten System. Entsprechend ist der
Zahlenwert für die 3-Koordinate im verschobenen System p̂3 = p3 − 1 um 1
kleiner als die entsprechende Zahl im neuen Koordinatensystem.
Wenn wir jedoch schreiben P = (p1 , p2 , p3 ), meinen wir: der Punkt P wird
”
im Koordinatensystem S dargestellt durch“ die drei angegebenen Koor-
dinatenzahlen. Dabei müsste eigentlich auch in der Gleichung vermerkt werden,
in welchem System die Koordinaten gemessen wurden. Üblicherweise stellt man
sich auf den Standpunkt, das werde durch die Nummern der Koordinaten signa-
lisiert, die an die Nummerierung unserer Koordinatenachsen erinnern. Dabei
ist jedoch Vorsicht geboten, wenn wir den Punkt P im verschobenen System
darstellen wollen. Wir können keinesfalls einfach schreiben P = (p̂1 , p̂2 , p̂3 ),
denn daraus könnte man folgern: (p̂1 , p̂2 , p̂3 ) = (p1 , p2 , p3 ), was nicht stimmt,
wie wir gesehen haben.
Es gibt drei Wege aus dieser Schwierigkeit:
(a) Entweder man führt ein neues Zeichen ein für wird im System ... dar-
”
gestellt durch ...“, indem man etwa dem Gleichheitszeichen ein Symbol für
das Koordinatensystem hinzufügt: etwa =“ ˆ mit der Bedeutung wird im
” ”
System Sb dargestellt durch ...“, z.B. P =(p̂
ˆ 1 , p̂2 , p̂3 ). Das ist aber umständ-
lich und mit den Computerfonts schwierig zu realisieren.
(b) Oder man bringt das Dach, das das verschobene Koordinatensystem kenn-
zeichnen soll, an den Indizes k an: etwa pk̂ , um daran zu erinnern, dass
es sich um die Koordinaten des festgehaltenen alten Punktes P bezüglich
der neuen 1̂-, 2̂- oder 3̂-Achse des Systems Sb handelt. Auch diese Be-
zeichnung ist auf dem Computer nur schwer zu realisieren und außerdem
unüblich.
(c) Deshalb wählen wir hier die dritte Möglichkeit: Wir setzen das Dach an
die Koordinaten, also p̂k wie bei (a), vermeiden es aber, die Aussage:
wird im System Sb dargestellt durch ... “ in Gleichungen zu formulieren.
”
Nachdem wir uns das Problem so klargemacht haben, gibt es keinerlei Grund
mehr zu Unsicherheiten oder Missverständnissen.
Es ist leicht, dieses Ergebnis auf Translationen um andere Strecken und in andere
Richtungen zu verallgemeinern, so dass wir hier darauf verzichten können.
202
2. Drehungen (Rotationen), z.B. um den Winkel ϕ um die 3-Richtung:
Aus dem Bild entnehmen wir, dass p̂1 = p1 cos ϕ+p2 sin ϕ und p̂2 = p2 cos ϕ−p1 sin ϕ,
während p̂3 = p3 , also:
z.B. ergibt sich für ϕ = π/2 : (p̂1 , p̂2 , p̂3 ) = (p2 , −p1 , p3 ).
Weitere sehr interessante Transformationen, die den Nullpunkt invariant lassen, sind
die
203
3. Spiegelungen, z.B. am Ursprung (Parität).
Es genügt, eine einzige Spiegelung zu betrachten, da man alle anderen aus dieser und
geeigneten Drehungen zusammensetzen kann. Wir wählen dazu die Punktspiegelung
am Ursprung, die im folgenden Bild veranschaulicht und bei den Physikern unter
dem Namen Paritätstransformation bekannt ist:
Wir wissen und sehen sofort aus dem Bild, dass dabei alle Koordinaten in ihr Ne-
gatives übergehen:
204
positive Hälfte der b
1-Achse um den Winkel π/2 in die positive Hälfte der b2-Achse
drehen, dann ist das in Richtung der positiven 3-Achse gesehen keine Rechts-
b
schraube mehr, sondern eine Linksschraube (im Gegenuhrzeigersinn). D.h. nach
einer Spiegelung ist aus unserem Rechtskoordinatensystem ein Linkskoordinatensy-
stem geworden. Für Leute, die sich auf die Verwendung von Rechtskoordinatensyste-
men geeinigt haben, ist das keine erfreuliche Sache, aber wir müssen lernen, damit
zu leben und Mittel und Wege zu finden, auch eine versteckte Spiegelung immer
sofort zu entlarven, wenn wir bei Rechtskoordinatensystemen bleiben wollen.
Als letztes Beispiel für die Transformation des Koordinatensystems untersuchen wir
205
Wenn Sie die Tastatur Ihres PCs statt in cm in einer größeren Einheite, z.B. dm
messen, erhalten Sie natürlich kleinere Maßzahlen, nämlich:
1 1 1
(p̂1 , p̂2 , p̂3 )=( 10 p1 , 10 p2 , 10 p3 )
Zusammenfassend können wir feststellen, dass die Koordinaten ein und desselben Punk-
tes P in verschiedenen Koordinatensystemen beträchtlich verschieden sind, dass wir also
im folgenden immer auf die Koordinatensysteme achten müssen, wenn wir physikalische
Zustände und Vorgänge beschreiben wollen.
Bisher sind wir jedoch erst bei den Punkten des dreidimensionalen euklidischen Raumes,
können also nur ein statisches Stillleben“ von Massen, Ladungen, usw. beschreiben. Die
”
Physik wird jedoch erst richtig interessant, wenn Bewegung in die Sache kommt.
9.2.1 Verschiebungen
Wir wollen im Folgenden untersuchen, was passiert, wenn wir einen Massenpunkt oder
eine Ladung um eine bestimmte Strecke in eine bestimmte Richtung geradlinig
verschieben, z.B. vom Anfangspunkt P = (p1 , p2 , p3 ) zum Endpunkt Q = (q1 , q2 , q3 ) in
einem festen willkürlich gewählten Koordinatensystem. Bei vorgegebenem Anfangspunkt
P mit den drei Koordinaten p1 , p2 und p3 (drei Zahlen!) endet eine Verschiebung um
eine vorgegebene Strecke vom Betrag a (vierte Zahl!) auf der Oberfläche einer Kugel mit
Radius a um den Anfangspunkt. Die Richtung wird dabei durch zwei weitere Zahlen
festgelegt, z.B. die geographische Länge und Breite auf der Kugeloberfläche oder irgend
zwei andere Winkel θ und ϕ, also insgesamt durch sechs reelle Zahlen.
Derartige Verschiebungen, ihre Ursachen und Folgen sind bei vielen Problemen die zen-
tralen physikalischen Größen, z.B. Verschiebungen pro Zeiteinheit als Geschwindigkeiten,
deren zeitliche Zunahme als Beschleunigungen, die diese verursachenden Kräfte oder auch
Kräfte pro Ladungseinheit als elektrische Feldstärken usw.
Wenn wir jedoch diese physikalischen Beispiele genauer betrachten, z.B. die Geschwin-
digkeit eines Autos auf einem geraden Autobahnabschnitt, stellen wir fest, dass das Auto
erstens aus sehr vielen Punkten besteht, die alle die gleiche Geschwindigkeit haben, und
dass zweitens die Physik eigentlich an den speziellen Anfangswerten all dieser Punkte meist
gar nicht interessiert ist. Die wirklich wichtige Information ist die allen Punkten
eines Körpers gemeinsame Verschiebung, unabhängig von den speziellen Anfangs-
bzw. Endpunkten. Wenn wir diesen physikalischen Erfordernissen ökonomisch sinnvoll
Rechnung tragen, kommen wir zum Begriff der Vektoren:
206
9.2.2 Vektoren
Wir bezeichnen eine Verschiebung dann als Vektor ~a (oder gelegentlich auch als Tensor
erster Stufe), wenn wir von der speziellen Anfangs- und Endlage der einzelnen Punkte
eines verschobenen Gegenstands absehen, wenn uns nur die Verschiebung an sich“, d.h.
”
der Betrag der Verschiebungsstrecke und die Richtung interessieren, ganz gleichgültig, wo
im Raum die Verschiebung stattfindet.
Wegen der in der Physik durchweg vorausgesetzten Homogenität des dreidimensionalen
Raumes ist diese Begriffsbildung vorteilhaft für die Formulierung der Allgemeingültig-
keit der physikalischen Gesetze. Sie bedeutet mathematisch, dass wir ähnlich wie
bei der Einführung der rationalen Zahlen, wo wir z.B. 1/2 = 2/4 = 3/6 = ... gleichge-
setzt haben, die Verschiebungen in Äquivalenzklassen einteilen und alle Verschiebungen
mit gleichem Betrag und gleicher Richtung identifizieren. Zur Veranschaulichung können
wir dann wenn nötig einen beliebigen Repräsentanten der Klasse auswählen, z.B. den
sogenannten Ortsvektor, indem wir die Verschiebung auf den Ursprung anwenden.
Nachdem wir im dreidimensionalen euklidischen Raum bereits ein kartesisches Koordina-
tensystem zur Beschreibung der Punkte durch ihre Koordinaten eingeführt haben, erhebt
sich die Frage nach der Charakterisierung der Vektoren in diesem System der drei paarwei-
se orthogonalen Koordinatenachsen. Dazu wählen wir willkürlich für den Repräsentanten
unseres (durch einen kleinen Pfeil über einem kleinen lateinischen Buchstaben bezeichne-
ten) Vektors ~a einen Anfangspunkt P = (p1 , p2 , p3 ), verschieben diesen um die Strecke der
Länge a in die vorgeschriebene Richtung und gelangen so zum Endpunkt Q = (q1 , q2 , q3 )
und mit dem folgenden Bild zu:
q1 − p1 a1
−→
Vektor: ~a = P Q := q2 − p2 = a2 .
q3 − p3 a3
(Außer den hier verwendeten kleinen Pfeilen über kleinen Buchstaben bzw. über den bei-
den Punkten des Repräsentanten sind auch unterstrichene kleine lateinische Buchstaben,
fett gedruckte lateinische oder einfach deutsche Buchstaben übliche Bezeichnungen.) Im
Gegensatz zu einer durch sechs reelle Zahlen bestimmten speziellen Verschiebung eines
bestimmten Punktes wird also ein Vektor nur durch drei reelle Zahlen charakterisiert.
Zur Unterscheidung von den drei reellen Koordinaten eines Punktes nennt man diese
Vektorkomponenten: ak = qk − pk
207
Bild 9.8: Vektorkomponenten
und setzt die Vektorkomponenten in runde Klammern. Meist schreibt man sogar die Kom-
ponenten (wie oben) als Spalte untereinander statt hintereinander. Wenn man Wert dar-
auf legt, die Vektorkomponenten wie die Punktkoordinaten hintereinander geschrieben zu
haben, sollte man einen oberen Index T“ anfügen, als Abkürzung für transponiert“, d.h.
” ”
umgelegt.
Wie man aus dem Bild sieht, sind die drei Komponenten eines Vektors die Längen der
−→
drei Projektionen des Repräsentanten P Q auf die Koordinatenachsen oder auch die Koor-
dinaten des Endpunktes A = (a1 , a2 , a3 ), den man durch die Verschiebung erreicht, wenn
208
man als Anfangspunkt den Ursprung, also den Ortsvektor als Repräsentanten gewählt
−→
hat: OA = (a1 , a2 , a3 ). Bei der Verwendung dieser speziellen Repräsentanten wird unmit-
telbar klar, dass es eine umkehrbar eindeutige Zuordnung zwischen der Gesamtheit der
Punkte des R3 und der Menge aller Vektoren des sogenannten Vektorraums gibt. Die
Mathematiker nennen das einen Isomorphismus.
Genauso wie durch den Betrag und die zwei Richtungswinkel ist ein Vektor durch sei-
ne drei Komponenten eindeutig charakterisiert, d.h. eine Vektorgleichung bedeutet
drei Gleichungen für die einzelnen Komponenten, was an der Vektorschreibweise
besonders geschätzt wird:
Vektorgleichung: ~a = ~b ⇐⇒ ak = bk für k = 1, 2, 3.
Der Betrag der Verschiebungsstrecke, d.h. die Länge eines Vektors ergibt sich aus
seinen Komponenten nach Pythagoras wie früher der Abstand zweier Punkte aus den
Koordinatendifferenzen:
Länge:
p
(q1 − p1 )2 + (q2 − p2 )2 + (q3 − p3 )2
a := |~a| = |P Q| =
q
= |OA| = a21 + a22 + a23 .
209
9.2.3 Transformationen des Koordinatensystems
Wir wollenuntersuchen,
wie die Komponenten ak des festen physikalisch gegebenen Vek-
a1 −→
tors ~a = a2 , falls erforderlich repräsentiert durch P Q, sich ändern, wenn wir das
a3
Koordinatensystem den vier in Abschnitt 9.1.4 ausgewählten speziellen typischen Trans-
formationen unterwerfen.
Wir beginnen mit den
â1 q̂1 − p̂1 q1 − p 1 a1
â2 = q̂2 − p̂2 = q2 − p2 = a2 .
â3 q̂3 − p̂3 q3 − p 3 a3
p p
â = â21 + â22 + â23 = a21 + a22 + a23 = a.
Nicht alle in der Physik vorkommenden vektorartigen Größen sind jedoch trans-
lationsinvariant und nicht in jedem physikalischen Problem, z.B. die Kräfte, die an
einem starren Körper außerhalb des Schwerpunkts angreifen oder auch die Feldstärke
eines inhomogenen elektrischen Feldes. Die Physiker sprechen dann von gebunde-
”
nen Vektoren“. In solchen Fällen muss vor der Anwendung der Vektoralgebra, die
wir in den nächsten Abschnitten entwickeln werden, jeweils genau überlegt werden,
inwieweit die erreichten Ergebnisse angewendet werden können.
Als zweites Beispiel untersuchen wir die
210
2. Drehungen (Rotationen), z.B. um den Winkel ϕ um die 3-Richtung:
Bei gleichbleibendem Ursprung Ob = O betrachten wir dazu wieder außer unserem
alten Koordinatensystem S wie in der Abbildung 9.5 ein neues S,
b das z.B. um einen
Winkel ϕ in positiver Richtung gesehen im Uhrzeigersinn um die 3-Achse gedreht
−→
wurde, und erhalten (etwa mit dem Repräsentanten ~a = OA):
Für das Gesetz, nach dem man die neuen Koordinaten aus den alten berechnet,
bietet die Mathematik eine Schreibweise an, die den meisten von Ihnen aus der
Schule bekannt ist: die Matrix-Schreibweise:
Man schreibt dazu die drei Transformationsgleichungen in folgender Form unterein-
ander und ergänzt durch Nullen:
Die Faktoren, die man benötigt, um die neuen Komponenten âk aus den alten al zu
erhalten, werden in folgender (3 × 3)-Matrix D(3) (ϕ) zusammengefasst:
cos ϕ sin ϕ 0
Drehmatrix : D(3) (ϕ) := − sin ϕ cos ϕ 0
0 0 1
(3)
mit den Matrixelementen Dzs (ϕ) für z, s = 1, 2, 3, wobei der Index z die (waag-
rechten) Zeilen zählt und s die (senkrechten) Spalten. Z.B. ist
(3) (3)
D11 (ϕ) = D22 (ϕ) = cos ϕ und
(3) (3)
D12 (ϕ) = −D21 (ϕ) = sin ϕ, da die 1-2-Ebene gedreht wird,
(3)
D33 (ϕ) = 1 zum Zeichen, dass die 3-Achse unverändert bleibt, und
(3) (3) (3) (3)
D13 (ϕ) = D31 (ϕ) = D23 (ϕ) = D32 (ϕ) = 0.
(3)
Wenn wir statt der einzelnen Matrixelemente Dzs (ϕ) das ganze Schema der Matrix
mit den neun Elementen meinen, verwenden wir einen fettgedruckten Großbuch-
staben D(3) (ϕ). Die drei Gleichungen zur Berechnung der neuen Koordinaten aus
211
den alten erhält man in dieser neuen Schreibweise durch folgende Vorschrift einer
verallgemeinerten Multiplikation für z = 1, 2, 3:
3
X
(3) (3) (3) (3) (3)
âz = Dz1 (ϕ)a1 + Dz2 (ϕ)a2 + Dz3 (ϕ)a3 = Dzs (ϕ)as =: Dzs (ϕ)as .
s=1
Man denkt sich dazu am einfachsten den Spaltenvektor transponiert Zeile für Zeile
über die Drehmatrix geschoben, multipliziert die aufeinanderliegenden Terme und
addiert.
212
z.B. muss bei der Drehung D(1) (ϕ) um ϕ um die 1-Achse sicher das Matrixelement
(1)
D11 (ϕ) = 1 sein und die 2-3-Ebene wird gedreht:
1 0 0
D(1) (ϕ) := 0 cos ϕ sin ϕ ,
0 − sin ϕ cos ϕ
d.h. dass â1 = a1 , â2 = a2 cos ϕ + a3 sin ϕ und â3 = a3 cos ϕ − a2 sin ϕ.
Man sieht daraus, dass man die Transformationsformeln für die drei Drehungen ohne
viel Rechnung auseinander erhält, indem man einfach die Indizes zyklisch (d.h. im
Kreise) ersetzt, d.h. 1 durch 2, 2 durch 3 und 3 durch 1:
213
sich bei Drehungen des Koordinatensystems in der angegebenen Weise ändern. In
der Tat: Wenn ein Physiker feststellen will, ob eine dreikomponentige Größe ein
Vektor ist, misst er deren Komponenten in zwei zueinander gedrehten Koordinaten-
systemen und untersucht, ob die Messergebnisse sich mit Hilfe der entsprechenden
Drehmatrix ineinander überführen lassen.
Wir untersuchen noch das Drehverhalten der Länge eines Vektors:
q q
â = â21 + â22 + â23 = a21 cos2 ϕ + a22 sin2 ϕ + a21 sin2 ϕ + a22 cos2 ϕ + a23 = a.
und finden, dass sie drehinvariant ist, wie wir das auch erwartet haben.
Einschub: M A T R I Z E N:
Die Drehmatrizen sind nur ein Beispiel für die Größen mit zwei Indizes, die die Mathe-
matiker Matrizen nennen. Man kann ganz allgemein für (z × s)-Matrizen, d.h. Schemata
mit z Zeilen und s Spalten Rechenregeln definieren und deren Strukturen untersuchen.
Wir wollen unsere Überlegungen hier auf quadratische (n×n)-Matrizen und sogar speziell
auf (3 × 3)-Matrizen mit reellen Elementen beschränken.
Wir bezeichnen die Matrizen durch unterstrichene große Buchstaben z.B. A. Ihre ElementeAzs
tragen zwei Indizes: der linke z bezeichnet die (waagrechte) Zeile und der rechte s die
(senkrechte) Spalte der Matrix:
A11 A12 A13
Matrix: A = A21 A22 A23 .
A31 A32 A33
Es gibt einige Arten von Matrizen die ihrer Wichtigkeit wegen besondere Namen haben:
Besondere Bedeutung haben Diagonalmatrizen, bei denen nur die drei Elemenete A11 , A22
und A33 in der sogenannten Hauptdiagonale (:von links oben nach rechts unten) von 0
verschieden sind. Die Nebendiagonale (:von rechts oben nach links unten) ist im Vergleich
dazu weniger wichtig.
A11 0 0
Diagonalmatrix: A = 0 A22 0 .
0 0 A33
214
Die Matrizen für Drehungen um Vielfache des Winkels π sind Beispiele für Diagonalma-
trizen: D(1) (π), D(2) (π) und D(3) (π).
Auf halbem Weg zur Diagonalgestalt ist die Dreiecksform zu erwähnen, bei der entweder
unter oder über der Hauptdiagonale nur Nullen stehen:
A11 A12 A13
Dreiecksmatrix: A = 0 A22 A23 .
0 0 A33
Auch Matrizen in Kästchenform sind für viele Zwecke besonders angenehm. Bei ihnen
sind nur Kästchen“ um die Hauptdiagonale von null verschieden. Unsere Drehmatrizen
”
D(1) (ϕ) und D(3) (ϕ) sind von dieser Art:
A11 A12 0
Matrix in Kästchenform: A = A21 A22 0 .
0 0 A33
Eine einfache Operation, die bei jeder Matrix durchgeführt werden kann, ist die Trans-
position: Gemeint ist die Spiegelung der Matrixelemente an der Hauptdiagonale bzw. die
Vertauschung der Zeilen mit den Spalten: ATzs = Asz .
A11 A21 A31
Transponierte Matrix: AT = A12 A22 A32 .
A13 A23 A33
Es gibt Matrizen, bei denen die Transposition nichts ändert: Man nennt sie symmetrisch:
A11 A12 A13
Symmetrische Matrix: A = AT = A12 A22 A23 .
A13 A23 A33
Diese symmetrischen Matrizen treten in der Physik häufig auf und haben den Vorteil, dass
man sie mit bestimmten einfachen Umformungen auf Diagonalgestalt bringen kann. Wie
Sie unmittelbar sehen, hat eine symmetrische Matrix nur sechs unabhängige Elemente.
Falls die Spiegelung an der Hauptdiagonale ein Minuszeichen ergibt, heißt die Matrix
antisymmetrisch:
215
0 A12 A13
Antisymmetrische Matrix: A = −A12 0 A23 .
−A13 −A23 0
Sie können sich leicht vorstellen, dass man für die reellen (3 × 3)-Matrizen eine gliedweise
Addition definieren kann und dass diese dann eine abelsche Gruppe der Addition bil-
den mit Assoziativgesetz, eindeutiger Nullmatrix, genau einem Negativen zu jeder Matrix
und Kommutativem Gesetz, weil sich die entsprechenden Eigenschaften der reellen Zahlen
einfach übertragen. Auch die elementweise Multiplikation mit einem Zahlenfaktor
ist möglich und führt zu den üblichen Distributivgesetzen.
Für die Physik viel wichtiger ist jedoch die Multiplikation zweier (3 × 3)-Matrizen,
was im Spezialfall der Transformationsmatrizen zwei hintereinander ausgeführten Trans-
formationen des Koordinatensystems entspricht:
Dabei gilt folgende Multiplikationsvorschrift:
P3
Matrix-Multiplikation: C = B A ⇐⇒ Czs := k=1 Bzk Aks ≡ Bzk Aks .
Bei der letzten angegebenen Formulierung wurde nach der Einsteinschen Summen-
konvention das Summenzeichen weggelassen, weil die beiden gleichlautenden Indizes k
die Summation genügend deutlich signalisieren.
In der Praxis denkt man sich zur Berechnung des Produktmatrixelements Czs in der
z-ten Zeile und der s-ten Spalte die s-te (senkrechte) Spalte Ams der rechten Faktor-
matrix A waagrecht auf die z-te Zeile Bzm der linken Faktormatrix B gelegt, aufein-
anderliegende
P3 Elemente miteinander multipliziert und die drei Produkte addiert: z.B.
C12 = k=1 Bzk Aks ≡ Bzk Aks = B11 A12 + B12 A22 + B13 A32 , also insgesamt:
216
B11 B12 B13 A11 A12 A13 B1k Ak1 B1k Ak2 B1k Ak3
B21 B22 B23 A21 A22 A23 ) = B2k Ak1 B2k Ak2 B2k Ak3 .
B31 B32 B33 A31 A32 A33 B3k Ak1 B3k Ak2 B3k Ak3
Die wichtigste Entdeckung bei der Bearbeitung der Übungsaufgabe 9.10 ist, dass im Allge-
meinen für zwei Drehungen und folglich auch für die darstellenden Matrizen kein Kom-
mutatives Gesetz gilt. Diese Tatsache können Sie mit jeder Streichholzschachtel leicht
und anschaulich überprüfen, wie im folgenden Bild illustriert:
Bild 9.10: Streichholzschachtel, die zuerst um 90◦ um die 3-Achse, dann um 90◦ um die
1-Achse gedreht wurde, verglichen mit einer, die zuerst um die 1-Achse und dann um die
3-Achse gedreht wurde.
217
Die Beispiele der Aufgabe 9.10 haben Ihnen jedoch auch schon gezeigt, dass in einigen
Ausnahmefällen das Kommutative Gesetz doch gilt: Z.B. sind alle Drehungen um
ein und dieselbe Achse vertauschbar. Auch Diagonalmatrizen sind miteinander vertausch-
bar. Das ist ein Grund für ihre Beliebtheit. Wenn A B 6= B A ist, dann verspricht die
sogenannte Vertauschungsrelation [A, B] := A B − B A eine interessante Größe zu sein.
Das gewinnt später in der Quantenmechanik große Bedeutung.
Von der Kommutativität abgesehen, verhält sich die Matrizenmultiplikation jedoch, wie
wir das erwarten: Sie befolgt ein
1 0 0
Einheitsmatrix: 1 := 0 1 0 mit A 1 = A = 1 A ∀A,
0 0 1
gibt es eine gewisse Komplikation ähnlich der Bedingung 6= 0“ bei der Division durch eine
”
reelle Zahl. Eine eindeutig bestimmte Inverse gibt es nur für sogenannte nichtsinguläre
Matrizen. Das sind Matrizen, deren Determinante nicht verschwindet: |A| = 6 0. Mit den
Determinanten, dem wichtigsten Charakteristikum jeder Matrix, beschäftigen wir uns in
einer gesonderten Schublade.
Für unsere Tansformationsmatrizen ist diese Einschränkung jedoch bedeutungslos. Für
sie ist nämlich die inverse Matrix einfach gleich der transponierten A−1 = AT , die, wie
wir gesehen haben, immer existiert: Man nennt eine derartige Matrix orthogonal, und
wir werden uns diese noch besonders ansehen.
218
orthogonale Matrix: A−1 = AT oder A AT = 1.
−1 0 0
Parität: P := 0 −1 0 .
0 0 −1
Damit erhalten wir für die Komponenten eines Vektors im gespiegelten System:
â1 −1 0 0 a1 a1 −a1
â2 = 0 −1 0 a2 = P a2 = −a2 .
â3 0 0 −1 a3 a3 −a3
Man nennt alle Vektoren, deren Komponenten âk = −ak bei der Spiegelung am
Ursprung ihr Vorzeichen umkehren, polare Vektoren. Wieder haben nicht alle in
der Physik wichtigen Vektoren diese Eigenschaft. Wir werden bald auf physikalische
Vektoren stoßen, wie z.B. den Drehimpuls, die paritätsinvariant sind. Diese werden
wir axiale Vektoren nennen.
Bei allen Arten von Vektoren ist jedoch die Länge spiegelinvariant, denn in jedem
Fall ist
p p
â = â21 + â22 + â23 = a21 + a22 + a23 = a.
219
Einschub: D E T E R M I N A N T E N:
Das wichtigste Charakteristikum einer Matrix ist ihre Determinante. Für diese sind fol-
gende Bezeichnungen gebräuchlich:
A11 A12 A13
Determinante: det A ≡ |A| = A21 A22 A23 .
A31 A32 A33
Definition:
X
det A := (−1)σ(P 1,P 2,P 3) A1 P 1 A2 P 2 A3 P 3 =
(P 1,P 2,P 3)
Das ergibt eine reelle Zahl, nämlich die Summe bzw. Differenz aus Produkten von je-
weils drei Elementen der Matrix. Die (linken) Zeilenindizes lauten bei allen Termen immer
z = 123, die (rechten) Spaltenindizes durchlaufen dagegen alle Permutationen P z dieser
drei Zahlen: (P 1, P 2, P 3) = 123, 231, 312; 132, 213, 321. Das Vorzeichen der einzelnen
Terme wird dabei durch die Anzahl der Transpositionen (:Vertauschungen je zweier Indi-
zes) bestimmt, die benötigt werden, um aus der Konfiguration 123 die betreffende andere
Konfiguration zu erhalten. Die ersten drei der oben angegebenen Konfigurationen erhält
man durch eine gerade Anzahl von Transpositionen, sie erhalten ein Pluszeichen, die rest-
lichen drei, durch eine ungerade Zahl von Vertauschungen erhaltenen, werden subtrahiert:
z.B. 123 zu 132 (ungerade), zu 231 (gerade), . . . . Bei (3 × 3)-Matrizen erhält man sechs
Summanden, bei diesen sind die geraden Permutationen auch durch zyklische Permu-
tation zu finden.
Neben dieser ganz allgemein gültigen Definition gibt es zur Berechnung der Determi-
nate einer Matrix mehrere verschiedene Methoden. Wir wollen zwei davon kennenlernen
und betrachten zunächst die speziell für Determinanten von (3 × 3)-Matrizen geltende
Sarrussche Regel:
Dazu schreiben wir die erste und zweite Spalte der Matrix noch einmal rechts neben unsere
zu bestimmende Determinante:
220
A11 A12 A13 A11 A12
zur Sarrus-Regel: A21 A22 A23 A21 A22 .
A31 A32 A33 A31 A32
In dieser Anordnung multiplizieren wir die Elemente in der Hauptdiagonale A11 A22 A33
miteinander, addieren dazu das Produkt der rechts daneben in Hauptdiagonalenrichtung
stehenden Elemente +A12 A23 A31 und +A13 A21 A32 . Davon subtrahieren wir das Produkt
der Elemente in der Nebendiagonale −A13 A22 A31 und ebenfalls zwei Mal die Produkte
der jeweils rechts daneben in Nebendiagonalenrichtung angeordneten drei Matrixelemente
−A11 A23 A32 und −A12 A21 A33 . Damit erhalten wir die gewünschte Determinante.
Häufig führt eine weitere Methode noch schneller zum Ziel, die sogenannte Entwicklung
nach der ersten Zeile: Da es sich dabei um eine sukzessive Methode handelt, machen
wir uns zuerst klar, dass die Determinante einer (2 × 2)-Matrix aus dem Produkt der bei-
den Diagonalelemente A11 A22 vermindert um das Produkt der Nebendiagonal-Elemente
−A12 A21 besteht. Nach Wegstreichen der dritten Zeile und der dritten Spalte unserer ge-
suchten (3 × 3)-Determinate bleibt diese (2 × 2)-Determinante gerade übrig. Man nennt
sie Adjunkte und versieht sie mit den Indizes der weggestrichenen Reihen:
Mit Hilfe dieser Adjunkten lässt sich die gesuchte (3 × 3) -Determinante folgendermaßen
schreiben.
|A| = (−1)1+1 A11 adj11 (A) + (−1)1+2 A12 adj12 (A) + (−1)1+3 A13 adj13 (A)
=A11 (A22 A33 − A23 A32 ) − A12 (A21 A33 − A23 A31 ) + A13 (A21 A32 − A22 A31 ).
Wir werden sogleich sehen, dass die Beschränkung auf eine Entwicklung nach der ersten
Zeile keine Einschränkung bedeutet, da die Determinante viele Symmetrieeigenschaften
besitzt. Mit deren Hilfe kann man leicht auch Entwicklungen nach anderen Zeilen oder
auch Spalten erhalten. Dabei verwenden wir den Begriff der
Um eine prägnante Schreibweise zu ermöglichen, fassen wir außerdem manchmal auch die
übereinanderstehenden Matrixelemente zu sogenannten Spaltenvektoren Ak zusammen,
z.B.
221
A1k
|A| := |A1 , A2 , A3 | mit Spaltenvektoren: Ak := A2k .
A3k
Eine Determinante bleibt unverändert, wenn zu einer ihrer Reihen eine Linearkombina-
tion der anderen Reihen addiert wird, z.B.:
Eine Determinante ändert ihr Vorzeichen bei jeder Permutation zweier Reihen: z.B.
|A1 , A2 , A3 | = −|A2 , A1 , A3 |.
Die Determinanten sind reihenweise homogen: mit einer rellen Zahl λ ∈ R gilt
|A1 , A2 , A3 | = λ1 |λA1 , A2 , A3 |.
|A1 , A2 , 0| = 0.
|A1 , A2 , A3 | = |A2 , A3 , A1 |.
222
Eine Determinante mit ungerader Dimensionszahl verschwindet, falls die Matrix an-
tisymmetrisch ist, AT = −A:
|AT | = −|A| = 0.
Die Determinanten sind additiv, falls die Summanden sich nur in einer Reihe unterschei-
den: z.B.
Die Determinante des Produkts zweier Matrizen ist gleich dem Produkt der Determi-
nanten der beiden Faktoren:
|A B| = |A||B|
17 31
1 0 2 1 2 3
37 43
14
3
d) 3 2 1
e) 2 2 1
f ) 7 2 14
2 2 1 3 1 0 2 5 2
2
A11 A12 A13 A11 0 0 A11 0 0
g) 0 A22 A23
h) A21 A22 A23
i) 0 A22 0
0 0 A33 A31 0 A33 0 0 A33
A11 A12 A13 0 0 A13 A11 A12 b1
j) A21 A22 0
k) 0 A22 0
l) A21 A22 b2
A31 0 0 A31 0 0 0 0 b3
0
a 3 −a 2
A11 − λ
A12 A13
m) −a3 0 a1 n) A21 A22 − λ A23
a2 −a1 0 A31 A32 A33 − λ
223
Aufgabe 9.13 Determinanten von Drehmatrizen:
Berechnen Sie die Determinanten von D(1) (ϕ), D(2) (ϕ) und D(3) (ϕ).
1 1
â1 10
0 0 a1 a1 a
10 1
â2 = 0 1 1 1
10
0 a2 = 10
1 a2 = a
10 2
.
1 1
â3 0 0 10
a3 a3 a
10 3
Bei einer Maßstabsänderung bleibt natürlich kein Vektor invariant, und auch die
Maßzahl der Länge wird um den Faktor 1/10 verkleinert:
q
a21 a22 a23 a.
p
2 2 2
â = â1 + â2 + â3 = 100 + 100
+ 100
= 10
Mit diesen Untersuchungen haben wir den schwierigsten Teil unserer Arbeit zum Ver-
ständnis der Vektoren geschafft. Jetzt können wir uns daran machen, zu studieren, wie
man mit Vektoren rechnet, immer in Gedanken daran, dass es sich um Verschiebungen
mit frei wählbarem Anfangspunkt handelt.
Es bleibt noch zu betonen, dass es natürlich auch physikalische Größen gibt, zu deren Fest-
legung jeweils nur eine einzige Messgröße, also Zahl und Maßeinheit nötig ist, wie z.B.
Masse, Ladung, Temperatur, Stromstärke usw. Man nennt diese Größen Skalare (oder
mitunter auch Tensoren 0-ter Stufe) im Gegensatz zu den Vektoren (die ja gelegent-
lich auch Tensoren erster Stufe genannt werden) und noch komplizierteren physikalischen
Größen, wie etwa dem Trägheitsmoment.
224
9.3 Addition von Vektoren
9.3.1 Vektorsumme
Während bei den Punkten des dreidimensionalen euklidischen Raumes von irgendwelchen
Rechenoperationen nicht die Rede sein konnte, ist es vom physikalischen Standpunkt sehr
sinnvoll, nach Rechenoperationen für Vektoren zu fragen: z.B. können mehrere Verschie-
bungen hintereinander ausgeführt werden: Nachdem wir einen Massepunkt z.B. vom
Punkt P gemäß dem Vektor ~a zum Punkt Q verschoben haben, können wir ihn an-
schließend von Q entsprechend der Verschiebungsvorschrift des Vektors ~b zum Punkt R
weiterschieben. Wir hätten ersichtlich dieselbe Endlage erreicht, wenn wir ihn sofort in
einem Zug von P nach R geschoben hätten, gemäß einem Vektor ~c = ~a + ~b, den wir als
die Vektorsumme von ~a und ~b bezeichnen:
−→ −→ −→
Vektorsumme: P Q + QR = ~a + ~b = ~c = P R ⇐⇒ ak + bk = ck für k = 1, 2, 3.
Die geometrische Addition der Vektoren erfolgt komponentenweise, bedeutet also die
algebraische Addition der drei Komponenten. Daher stammt die Bezeichnung Addition“
”
für Vektoren.
225
−→ −→ −→ −→
Kommutatives Gesetz: P Q + QR = ~a + ~b = ~b + ~a = P S + SR
Dies ergibt sich auch algebraisch aus dem Kommutativen Gesetz der Addition jeder der
Komponenten als reelle Zahlen.
Diese Vertauschbarkeit der Summanden führt uns auf eine zweite geometrische Vorschrift
zur Bildung der Vektorsumme zweier Vektoren ~a und ~b: Man wählt für die Vektoren
zwei Repräsentanten mit dem gleichen Anfangspunkt, ergänzt die Figur zu einem Paral-
lelogramm und erhält so die Vektorsumme ~c als Diagonale des Parallelogramms. Die-
se Konstruktion findet sich schon bei Newton und ist vielen von Ihnen als Kräfte-
Parallelogramm geläufig, wobei die Summe ~c = ~a + ~b die resultierende Kraft dar-
stellt. Diese geometrische Vorschrift hat überdies noch den Vorteil, dass sie auch für
die nicht translationsinvarianten gebundenen“ Vektoren angewendet werden kann, sofern
”
diese denselben Angriffspunkt besitzen, wie z.B. Ortsvektoren.
a) Drei Polarhunde ziehen an einem Schlitten mit gleicher Stärke, aber unter relativen
Winkeln von 60◦ . Welche Kraft muss der Hundehalter in welche Richtung ausüben,
wenn er will, dass der Schlitten noch nicht losfährt?
b) Bilden Sie die Summe von sieben koplanaren Vektoren der Länge a mit Winkeldif-
ferenzen von 30◦ .
Für die Addition von drei Vektoren ~a, ~b, ~c gilt das
weil es für die Komponenten als reelle Zahlen gilt, oder aufgrund des nächsten Bildes:
226
Bild 9.12: Zum Assoziativen Gesetz
9.3.4 Nullvektor
Es kann dabei vorkommen, dass man nach mehreren Verschiebungen zum ursprünglichen
Ausgangspunkt des ersten Summanden zurückkommt:
Daraus kann man auf die Existenz genau eines Nullvektors ~0, d.h. keine Verschiebung“,
”
schließen mit der Länge |~0| = 0 und (ausnahmsweise) unbestimmter Richtung, für den
ähnlich wie bei den reellen Zahlen gilt:
∃! ~0 mit ~a + ~0 = ~a ∀~a.
227
9.3.5 Negatives und Subtraktion
Insbesondere ist es immer möglich, schon mit zwei Verschiebungen wieder zum Ausgangs-
punkt zurückzukehren: D.h. es existiert zu jedem Verschiebungsvektor ~a wie bei den reellen
Zahlen eine eindeutige Umkehrung, das Negative:
−→
Dabei sind einfach Anfangs- und Endpunkt des Repräsentanten zu vertauschen: −P Q =
−→
QP .
Mit dem Negativen der Vektoren wird analog wie bei den reellen Zahlen auch für die
Vektoren eine Subtraktion definierbar, d.h.
228
Aufgabe 9.16 Summe und Differenzen von Vektoren:
Bilden Sie graphisch die Summe und die beiden möglichen Differenzen folgender Vektoren:
a) ~a = (4, 0, 0), ~b = (−2, 1, 0); b) ~a = (0, −2, 0), ~b = (3, 0, 0);
c) ~a = (−3, −1, 0), ~b = (0, −3, 0); d) ~a = (−3, −2, 0), ~b = (−3, 2, 0);
e) ~a = (−2, −3, 0), ~b = (−2, −1, 0); f ) ~a = (1, 3, 0), ~b = (4, −4, 0).
Mit der Gültigkeit des Assoziativgesetze und der Existenz genau eines Nullvektors und
eines eindeutig bestimmten Negativen zu jedem Vektor bilden die Vektoren eine Gruppe
der Addition, die wegen des Kommutativgesetzes sogar abelsch ist.
Wenn man mehrere Verschiebungen hintereinander ausführen kann, dann natürlich auch
ein und dieselbe Verschiebung mehrmals, insbesondere: ~a +~a = 2~a. Wir kommen auf diese
Weise zu demselben Punkt, wie wenn wir in einem Zug um die doppelte Strecke in dieselbe
Richtung verschoben hätten. Ganz ähnlich läuft das für eine beliebige reelle Zahl α ∈ R
als Faktor:
Für α > 0 ist das ein Vektor mit der α-fachen Länge in dieselbe Richtung wie ~a, für α < 0
zeigt er in die entgegengesetzte Richtung, denn für die Länge gilt:
p
|α~a| = (αa1 )2 + (αa2 )2 + (αa3 )2 = |α||~a|.
9.4.2 Gesetze
229
das Kommutative Gesetz: α~a = ~aα ⇐= αak = ak α,
das Assoziative Gesetz: β(α~a) = (βα)~a ⇐= β(αak ) = (βα)ak sowie
zwei Distributive Gesetze: (α + β)~a = α~a + β~a ⇐= (α + β)ak = αak + βak
und α(~a + ~b) = α~a + α~b ⇐= α(ak + bk ) = αak + αbk .
Das letzte Gesetz besagt z.B. anschaulich, dass die Diagonale eines Parallelogramms ent-
sprechend mitgestreckt wird, wenn man die Seiten um einen Faktor α streckt.
9.4.3 Vektorraum
Wenn die Elemente einer Menge eine abelsche Gruppe der Addition bilden und eine Mul-
tiplikation mit den Elementen eines Körpers erklärt ist, wie sie oben beschrieben wurde,
nennen die Mathematiker die Menge einen Vektorraum oder auch einfach linearen
Raum.
Man kann dann nämlich innerhalb des Raumes Linearkombinationen wie etwa ~c =
α~a + β~b bilden, deren Eigenschaften wir kurz zusammenstellen wollen:
A1) Falls es ein α ∈ R gibt, so dass ~a2 = α~a1 gilt, oder anders ausgedrückt: In α1~a1 +
α2~a2 = 0 ist mindestens einer der Faktoren αk 6= 0, z.B. α2 6= 0, so dass nach ~a2 aufgelöst
werden kann ~a2 = − αα12 ~a1 =: α~a1 ,
so heißt das, dass ~a2 durch einen Vektor repräsentiert werden kann, der ganz auf der
Geraden liegt, die durch ~a1 geht. Dann heißen die beiden Vektoren ~a1 und ~a2 linear
abhängig, speziell auch kollinear.
A2) Falls es kein α gibt, so dass ~a2 = α~a1 für alle α ∈ R, also ~a2 6= α~a1 , oder anders
ausgedrückt: α1~a1 + α2~a2 = ~0 kann nur erreicht werden, wenn sowohl α1 = 0 als auch
α2 = 0 ist,
−→ −→
dann spannen die beiden Vektoren ~a1 = OA1 und ~a2 = OA2 durch die drei Punkte O,
A1 und A2 eine Ebene auf, und jeder Punkt dieser Ebene ist durch eine Linearkombina-
tion α1~a1 + α2~a2 mit reellen Faktoren α1 und α2 erreichbar.
230
B) Dann untersuchen wir Linearkombinationen aus drei verschiedenen Vektoren: ~a1 , ~a2
und ~a3 , wobei wieder zwei Fälle möglich sind:
B1) Falls zwei reelle Zahlen α1 und α2 gefunden werden können, so dass ~a3 = α1~a1 +α2~a2
ist, oder anders ausgedrückt: in α1~a1 + α2~a2 + α3~a3 = 0 mindestens ein αk 6= 0 ist, z.B.
α3 6= 0, so dass nach ~a3 aufgelöst werden kann,
so heißt das wie eben gezeigt, dass ~a3 durch einen Vektor repräsentiert werden kann, der
ganz in der von ~a1 und ~a2 aufgespannten Ebene liegt. Dann nennt man die drei Vektoren
~a1 , ~a2 und ~a3 linear abhängig, speziell auch koplanar.
B2) Falls ~a3 6= α1~a1 + α2~a2 ist, oder anders ausgedrückt: α1~a1 + α2~a2 + α3~a3 = ~0 nur
erreichbar ist, wenn alle drei αk = 0 sind,
dann spannen die drei Vektoren ~a1 , ~a2 und ~a3 den ganzen R3 auf. Man sagt dann,
sie bilden eine Basis des R3 , d.h. jeder dreidimensionale Vektor ist als Linearkombination
P3
der drei Basisvektoren darstellbar: ∀~a = αk~ak .
k=1
9.4.5 Einheitsvektoren
Einheitsvektoren sind dimensionslose Vektoren der Länge 1, die je eine Richtung im Raum
kennzeichnen. Man erhält aus einem beliebigen Vektor ~a den zu der entsprechenden Rich-
tung gehörenden Einheitsvektor durch Division durch die Länge a, bzw. Multiplikation
mit 1/a :
Einheitsvektor: ~ea = ~a
a oder ~a = a~ea .
231
Aufgabe 9.18 Einheitsvektoren:
a) Bestimmen Sie den Einheitsvektor in Richtung des Vektors ~a = (−1, 2, −2).
b) Normieren Sie die in Aufg. 9.17b vermutete Basis auf eins.
3
P
~a = a1~e1 +a2~e2 +a3~e3 = ak~ek (≡ ak~ek mit Einsteinscher Summenkonvention!).
k=1
Da wir zu Beginn dieses Kapitels nicht irgendein schiefwinkliges, sondern ein kartesi-
sches Koordinatensystem gewählt haben, wissen wir jedoch, dass die drei Einheitsvekto-
−−→
ren ~ek := OE k paarweise aufeinander senkrecht stehen, also eine orthonormierte (d.h.
orthogonale und normierte) Basis (ONB) darstellen. Um diese Tatsache in Formeln aus-
drücken zu können, brauchen wir eine Größe, die mit dem Winkel zwischen zwei Vektoren
zusammenhängt, die z.B. sagt, dass bei einem rechten Winkel zwischen zwei Vektoren
die Projektion des einen auf den anderen verschwindet. Diese Aufgabe führt uns zur Fra-
ge nach der Multiplikation zweier Vektoren, die wir im nächsten Abschnitt behandeln
werden.
232
Die Physiker haben daneben aber noch ein zunächst ganz anderes Problem, näm-
lich die mathematische Beschreibung von Massenpunkten, Vektoren usw., die sich
tatsächlich im Raum (z.B. mit der Zeit) bewegen, etwa rotieren. Da müssen dann
der ursprüngliche Vektor ~a und der z.B. in positiver 3-Richtung gesehen um den
Winkel ϕ im Uhrzeigersinn um die 3-Achse gedrehte physikalische Vektor ~a ˆ in ein
ˆ
und demselben Koordinatensystem ~ek beschrieben werden: ~a = ak~ek und ~a = âk~ek .
Man nennt dies den aktiven Standpunkt. Das folgende Bild zeigt Ihnen, dass in
(3)
diesem Fall gerade âk = Dkl (−ϕ)al gilt.
Wir haben dabei absichtlich in beiden Fällen das Dach zur Kennzeichnung der neuen
Komponenten verwendet, um ganz deutlich zu machen, dass die Relation
(3)
âk = Dkl (ϕ)al
Wenn man sich die verschiedenen Sachverhalte ein einziges Mal klargemacht hat,
gibt es kaum mehr Gefahr für Verwirrung, sondern eher Freude über die Tatsache,
dass man mit dem Studium derselben Drehmatrizen in einem Streich zwei Probleme
lösen kann.
233
9.5 Skalarprodukt und Kronecker-Symbol
9.5.1 Motivation
Nicht nur um die Orthogonalität unserer Basisvektoren zu beschreiben, sondern auch aus
physikalischen Gründen brauchen wir ein Produkt zweier Vektoren, das den Winkel zwi-
schen den beiden Faktoren misst und mit der Projektion des einen auf den anderen
zusammenhängt. Bei eingeschränkten Bewegungen (etwa auf Schienen oder einer schiefen
Ebene) ist nicht die gesamte wirkende Kraft, sondern nur deren Projektion (in Richtung
der Schienen oder die Komponente in Neigungsrichtung) die entscheidende physikalische
Größe. Auch bei der Berechnung der Arbeit, die aufgewendet werden muss, um eine Mas-
se gegen eine Kraft (z.B. die Schwerkraft) um eine Wegstrecke zu verschieben, ist auch
nicht die gesamte Kraft, sondern nur deren Projektion auf die Verschiebungsrichtung die
eigentlich maßgebende Größe.
9.5.2 Definition
Wir wählen also für ein Produkt“ zwischen zwei Vektoren ~a und ~b folgende Definition und
”
nennen es Skalarprodukt, weil es zu den beiden Faktorvektoren eine reelle Zahl liefert,
von der wir später zeigen werden, dass es sich um einen Skalar handelt:
Außer den beiden trivialen Faktoren der Längen der beiden Vektoren wählen wir den
Cosinus des bei gleichem Anfangspunkt von den beiden Vektor-Repräsentanten einge-
schlossenen Winkels ϕ = ∠(~a, ~b), weil dieser verschwindet, wenn ϕ = 90◦ wird, d.h. die
beiden Vektoren senkrecht aufeinander stehen. Der Ausdruck b cos ϕ ist die Projektion
des Vektors ~b auf die Richtung von ~a und umgekehrt a cos ϕ die Projektion des Vektors ~a
auf die Richtung von ~b. Diese Projektionen werden jeweils multipliziert mit der Länge des
Vektors, auf dessen Richtung projiziert wird, und eventuell mit einem negativen Vorzei-
chen versehen, falls der Winkel stumpf ist. Der Zahlenwert des Produkts gibt geometrisch
234
also je nach Lage der Vektoren den (mit Vorzeichen versehenen) Flächeninhalt jeweils
einer der beiden in den folgenden Abbildungen farbig hervorgehobenen Flächen an. Wenn
der Winkel zwischen den beiden Faktorvektoren zwischen π/2 und 3π/2 liegt, so dass der
Cosinus negativ wird, erhält die Fläche ein negatives Vorzeichen.
Bild 9.16: Illustration des Skalarprodukts: Ein Kofferbild“ des Skalarprodukts für
”
ϕ = 50◦ .
hat nur der Nullvektor ~0, denn ~a kann ja nicht auf sich selbst senkrecht stehen.
235
Aufgabe 9.20 Winkel im Skalarprodukt:
Was bedeutet : 2(~a · ~b) = |~a| · |~b| für den Winkel zwischen den beiden Vektoren?
Die obige Definition des Skalarprodukts ist völlig symmetrisch aus den beiden Faktoren
aufgebaut, deshalb gilt trivialerweise das
Das aus zwei Beträgen und dem Cosinus bestehende Skalarprodukt ist offensichtlich kein
Vektor, sondern eine reelle Zahl. Der Symmetrie wegen wurde auf das Hinzufügen eines
der beiden Vektoren verzichtet. Also ist unser Produkt keine innere Verknüpfung“ im
”
Vektorraum. Deshalb wollen wir die manchmal verwendete Bezeichnung inneres Produkt“
”
möglichst vermeiden. Wenn das Ergebnis der Multiplikation kein Vektor ist, kann man
natürlich auch nicht weiter mit einem dritten Vektor skalar multiplizieren, es gibt also
kein Assoziatives Gesetz. Aus diesem Grund können wir auch nicht erwarten, dass die
Vektoren eine Gruppe der Multiplikation bilden.
236
9.5.5 Homogenität
Die Multiplikation eines der Vektorfaktoren mit einer reellen Zahl α ∈ R, die eine Verviel-
fachung der Länge bedeutet, ist selbstverständlich möglich und führt zur Vervielfachung
des ganzen Produkts. Man nennt das wie bei den reellen Zahlen:
Distributive Gesetz: (~a + ~b) · ~c = (~a · ~c) + (~b · ~c).
Der Beweis ergibt sich durch Betrachten des folgenden Bildes aus der Additivität der
Projektionen auf die Richtung von ~c :
237
~ ~
a) Berechnen Sie dazu (~a + b) · (~a − b) .
9.5.7 Basisvektoren
Bei der Definition des Skalarprodukts hatte uns unter anderem der Gedanke geleitet,
die Orthogonalität der drei normierten Basisvektoren ~ek des kartesischen Koordina-
tensystems einfach beschreiben zu können. Wir erhalten damit jetzt wie gewünscht drei
Gleichungen:
Orthogonalität: (~ek · ~el ) = |~ek ||~el | cos ∠(~ek , ~el ) = cos ϕkl = 0 für k 6= l = 1, 2, 3,
denn ϕkl = π/2, weil ~ek ⊥ ~el für k 6= l. Für k = l erhalten wir drei weitere Gleichungen:
Normierung: (~ek · ~ek ) = |~ek ||~ek | cos ∠(~ek , ~ek ) = cos 0 = 1 für k = 1, 2, 3.
9.5.8 Kronecker-Symbol
Diese neun Gleichungen enthalten die gesamte Information über die Orthogonalität und
die Normierung der Basisvektoren. Sie lassen sich zu einer einzigen Gleichung zusammen-
fassen,
wenn wir das nach Leopold Kronecker benannte Symbol δk l zu Hilfe nehmen, das folgen-
dermaßen definiert ist:
1 für k = l
Kronecker-Symbol: δk l :=
0 6 l.
für k =
238
.
Wie das Skalarprodukt ist dieses Zahlenschema symmetrisch gegen Vertauschen der beiden
Indizes: δk l = δl k . Im folgenden Bild ist das Zahlenschema in der Ebene bildlich dargestellt:
Die Achsen sind so angeordnet, daß man den Zusammenhang mit der Einheitsmatrix 1
gut erkennen kann. Gelegentlich brauchen wir die Summe der drei Diagonal-Elemente der
Matrix, die man Spur nennt:
3
P
Spur: δk k := δk k = 3 (mit Einstein-Summenkonvention!)
k=1
239
9.5.9 Komponentendarstellung
Nun wollen wir sehen, wie man das Skalarprodukt berechnet, wenn die beiden Vektoren
in Komponenten gegeben sind: ~a = ak~ek und ~b = bl~el (jeweils mit Summenkonvention!):
(~a · ~b) = (ak~ek · bl~el ) wobei sowohl über k, als auch über l summiert wird
= ak bl (~ek · ~el ) wegen der Homogenität des Skalarprodukts
= ak b l δk l wegen der Orthonormalität der Basisvektoren
= ak b k wegen des Kronecker-Symbols bleibt von der Summe
über l nur der Term l = k übrig. Deshalb bleibt nur
noch die Summe über k = 1, 2, 3, also erhalten wir als
3
P 3
P 3
P
ausführlich mit Summenzeichen: (~ek ·~a) = (~ek · al~el ) = al (~ek · ~el ) = al δk l = ak , die
l=1 l=1 l=1
k-te Komponente des Vektors ~a, denn die skalare Multiplikation mit dem k-ten Basisvektor
ergibt ja die Projektion des Vektors auf die k-Achse. Daraus kann man leicht den gesamten
Vektor ~a wieder zusammensetzen:
~a = ~ek ak = ~ek (~ek · ~a).
240
Einschub: Vollständigkeit: Wenn wir in der letzten Gleichung zwei über-
flüssige Klammern ) “ platzieren, erhalten wir:
”
~a) = ~ek ) (~ek · ~a)
und daraus abstrahiert die berühmte symbolische
Nach skalarer Multiplikation von links oder rechts mit einem Vektor erhält man
daraus dessen Komponentenzerlegung ~a = ~ek ak : etwa von rechts: ~ek ) (~ek · ~a) =
~ek ak = 1 ~a) = ~a oder von links: (~a · ~ek ) (~ek = ak~ek = (~a 1 = ~a.
Insbesondere für die Basisvektoren selbst:
~el = ~ek δk l
241
9.5.11 Kein Inverses
Nachdem wir schon gesehen haben, dass für das Skalarprodukt kein Assoziatives Gesetz
gilt, wundern wir uns nicht, dass auch kein eindeutig bestimmtes Inverses existiert:
Das hieße doch, dass die Gleichung (~a · ~x) = 1 einen eindeutig bestimmbaren Vektor ~x
als Lösung hätte. Sie können aber leicht nachrechnen, dass folgende zweifach unendlich
dimensionale Vektorenschar die Gleichung erfüllt:
mit den beiden Scharparametern λ1 , λ2 ∈ R und den Einheitsvektoren ~e⊥a , der auf ~a
senkrecht steht, und ~e⊥a,e⊥a , der auf ~a und ~e⊥a senkrecht steht. Das sind nämlich alle
Vektoren, deren Spitze in eine Ebene führt, die senkrecht zu ~a im Abstand 1/a vom
Ursprung liegt. Zum Beweis bilden wir (~a · ~x) = (~a · ~ea )/a + λ1 (~a · ~e⊥a ) + λ2 (~a · ~e⊥a,e⊥a ) =
a(~ea · ~ea )/a + 0 + 0 = 1.
242
Aufgabe 9.31 Inverse Funktionenschar:
Geben Sie explizit eine Funktionenschar ~x an, welche die Gleichung (~a · ~x) = 1 löst, wenn
~a = (1, 2, 2).
9.6.1 Motivation
Wir haben nun ein kommutatives Produkt zweier Vektoren, zwar nur einen Skalar ohne
Assoziativgesetz und eindeutiges Inverses, aber eine einfache und kurze Charakterisierung
der Orthonormalität unserer Basisvektoren und vor allem eine angemessene und treffende
Beschreibung all der vielen physikalischen Situationen, bei denen die Projektion eines
Vektors auf einen anderen ein wichtige Rolle spielt.
Wir können uns jedoch damit nicht zufrieden geben, denn zum Einen wollen wir grundsätz-
lich doch wenigstens versuchen, ein echtes Vektorprodukt zu finden, das zwei Vektoren
wieder ein Element des Vektorraums zuordnet, zum Anderen suchen wir eine einfache
schöne Kennzeichnung der Tatsache, dass unsere Basisvektoren ein Rechtskoordinatensy-
stem bilden, und schließlich kennen wir in der Physik eine ganze Reihe von vektorartigen
Größen, die nicht so einfach mit Verschiebungen in Zusammenhang gebracht werden kön-
nen, wie etwa den Drehimpuls oder das Drehmoment, sondern mit Drehungen häufig von
ausgedehnten starren Körpern zu tun haben, die um eine Achse drehbar gelagert sind.
Die Existenz eines Vektorprodukts neben dem Skalarprodukt ist übrigens eine spezielle
Eigenart des dreidimensionalen Raumes; bei den Vektoren im R2 und R4 gibt es so etwas
nicht.
243
Wie wir aus dem Bild sehen, ist für die Drehung keineswegs irgendein Cosinus maßgebend,
sondern F sin ϕ, die Projektion der Kraft senkrecht zur Verbindungslinie von Drehachse
und Angriffspunkt der Kraft. Andererseits ist neben dem Verbindungsvektor ~x vom Dreh-
punkt zum Ansatzpunkt der Kraft und dem Kraftvektor F~ selbst durch die Drehachse
eine dritte Richtung im Raum ausgezeichnet, die immer senkrecht auf der von ~x und F~
aufgespannten Ebene steht und durch den Drehsinn der durch die Kraft verursachten
Bewegung eine Orientierung erhält.
9.6.2 Definition
Wir versuchen deshalb folgenden Ansatz als echte innere Verknüpfung zweier beliebiger
Vektoren ~a und ~b:
h i
Vektorprodukt: ~a × ~b := |~a||~b| sin ∠(~a, ~b)~e⊥a,b,R .
Außer dem Sinus des eingeschlossenen Winkels und den Längen der beiden Vektoren ha-
ben wir den Einheitsvektor ~e⊥a,b,R dazugenommen, der senkrecht auf der von den beiden
Vektoren aufgespannten Ebene steht und mit den Vektoren ~a und ~b (in dieser Reihenfolge!)
eine Rechtsschraube bildet. Zur deutlichen Unterscheidung vom Skalarprodukt verwen-
den wir als Malzeichen ein Kreuz statt des Punktes und dazu noch eckige Klammern
statt hder runden.
i Viele geben sich mit einem der beiden Unterscheidungsmerkmale zufrie-
den: ~a × b ≡ [~a b] ≡ ~a × ~b. Manche nennen das Vektorprodukt auch äußeres Produkt“.
~ ~
”
Wir wollen diesen Ausdruck für eine echte innere Verknüpfung im Vektorraum jedoch
verständlicherweise möglichst vermeiden.
Wie beim Skalarprodukt betrachten wir zunächst wieder die Spezialfälle:
h i
Für ~a und ~b kollinear, d.h. parallel oder antiparallel: ∠(~a, ~b) = 0, π, folgt ~a × ~b = 0,
insbesondere:
h i
Für ~a und ~b orthogonal, d.h. ~a senkrecht auf ~b: ∠(~a, ~b) = π/2 folgt ~a × ~b = |~a||~b|~e⊥a,b,R ,
insbesondere:
[~e1 × ~e2 ] = ~e3 .
h i
Die Länge des Produktvektors ist in diesem Fall maximal: ~a × b = |~a||~b|, d.h. die
~
Rechteckfläche mit den Längen der beiden Faktoren als Kantenlängen:
244
h i
Bild 9.21: des Rechtecks ~a × ~b = |~a||~b|
h i
Im allgemeinen Fall ist die Länge des Produktvektors ~a × ~b = |~a||~b| sin ∠(~a, ~b) die
Fläche des von den beiden Faktoren aufgespannten Parallelogramms oder von gleicher
Größe: eine der beiden im nächsten Bild skizzierten Rechteckflächen mit den Höhen des
Parallelogramms.
245
Falls der Winkel zwischen den Faktorvektoren π überschreitet, wird der Sinus und folglich
auch die Fläche negativ, was hier zu einer Umkehr der Richtung des Produktvektors führt.
246
Aufgabe 9.34 Bilanz der Drehmomente:
Bild 9.23: Mit welcher Kraft F~4 muss man an der angezeigten Stelle ziehen, damit das
abgebildete starre T-Stück sich nicht um den Drehpunkt dreht?
9.6.3 Antikommutativ
h i h i
antikommutativ: ~b × ~a = − ~a × ~b .
9.6.4 Homogenität
Genau so wie für das Skalarprodukt gilt für das Vektorprodukt jedoch in beiden Faktoren
bei der Multiplikation mit einer reellen Zahl α ∈ R die:
247
h i
Homogenität: [α~a × ~b] = α ~a × ~b = [~a × α~b].
Allerdings ist dessen Beweis nicht trivial, da die transversalen Anteile der Vektoren dazu
gebraucht werden.
Einschub: Distributivgesetz: Wir nennen die Summe ~a1 + ~a2 =: ~a3 , den
Einheitsvektor in Richtung von b: ~eb := ~b/b und betrachten die zur Richtung von ~b
~
transversalen Anteile der beiden Summanden ~ak⊥~b = ~ak − (~ak~eb )~eb für k = 1, 2 und
wegen des Distributivgesetzes für das Skalarprodukt auch für k = 3, die alle in der
im folgenden Bild gezeigten Ebene senkrecht zu ~eb liegen:
248
Die Produktvektoren [~ak⊥b × ~eb ] sind dann Vektoren der Länge ak⊥b , die um 90◦ im
Antiuhrzeigersinn gedreht, senkrecht auf den ~ak⊥b stehen. Das bedeutet aber, dass
die ganze Vektoradditionsfigur um 90◦ gedreht wurde, so dass immer noch
gilt [a3~⊥b × e~b ] = [a1~⊥b × e~b ] + [a2~⊥b × e~b ] . Multiplikation dieser ganzen Gleichung
mit b ergibt das behauptete Distributive Gesetz.
d) Berechnen Sie die Summe der nach außen gerichteten Flächennormalen eines Tetra-
eders.
Wir können den Begriff des transversalen Anteils eines Vektors bezüglich einer vorge-
gebenen Richtung, den wir früher definiert und studiert haben, verwenden, um neues Licht
auf die anschauliche Bedeutung des Vektorprodukts zu werfen. Wir betrachten dazu
den transversalen Anteil des zweiten Faktors ~b bezüglich der Richtung ~ea = ~a/a
des ersten Faktors: ~b⊥a = ~b − (~b · ~ea )~ea und multiplizieren ~a vektoriell mit diesem:
h i h i h i
~a × ~b⊥a = ~a × ~b − (~b · ~ea ) [~a × ~ea ] = ~a × ~b .
Da eine entsprechende Überlegung auch für den anderen Faktor durchgeführt werden
kann, heißt das: Im Vektorprodukt kann ohne Schaden ein Faktor durch seinen
zum anderen transversalen Anteil ersetzt werden.
Betrachten Sie zum besseren Verständnis dazu nochmals das Bild 9.22.
9.6.7 Basisvektoren
249
Rechtssystem: [~e1 × ~e2 ] = ~e3 , [~e2 × ~e3 ] = ~e1 , [~e3 × ~e1 ] = ~e2 .
Wegen der Antikommutativität des Vektorprodukts kommen dazu noch drei weitere Re-
lationen mit der umgekehrten Reihenfolge der Faktoren und jeweils einem Minuszeichen:
[~e2 × ~e1 ] = −~e3 , [~e3 × ~e2 ] = −~e1 , [~e1 × ~e3 ] = −~e2 .
Ähnlich wie beim Skalarprodukt durch das Kronecker-Symbol fassen wir diese sechs fun-
damentalen Relationen in eine einzige Gleichung zusammen durch die Einführung des
nach Tullio Levi-Civita benannten Symbols:
9.6.8 Levi-Civita-Symbol
Wir schreiben einfach:
P3
Rechtssystem: [~ek × ~el ] = εklm~em ≡ m=1 εklm~
em .
wobei der letzte Term noch einmal an die Einsteinsche Summenkonvention erinnert. Dabei
ist das Levi-Civita-Symbol mit seinen drei Indizes definiert durch:
+1, falls klm = 123, 231, 312,
Levi-Civita-Symbol: εklm := −1, falls klm = 132, 213, 321 und
0 sonst .
Das Symbol ändert offenbar das Vorzeichen beim Vertauschen je zweier Indizes, man nennt
das total antisymmetrisch gegen Vertauschen der Indizes:
Bei allen geraden oder zyklischen Permutationen der Zahlenfolge 123 in den Indizes ergibt
der Wert +1 genau die drei oben angegebenen eine Rechtsbasis charakterisierenden Rela-
tionen. Die Indexkonstellationen mit einer ungeraden Zahl von Vertauschungen je zweier
Indizes bzw. antizyklischen Permutationen von 123 führen auf die −1 in den drei oben
ebenfalls aufgeführten Vektorprodukten mit vertauschter Reihenfolge der Faktoren. Nur
sechs der 27 Elemente des Symbols sind verschieden von 0. Alle 21 übrigen Elemente sind
Nullen, so dass Sie Mühe haben, im folgenden Bild vor lauter Nullen die vom Ursprung aus
gesehen bemerkenswert symmetrisch angeordneten wichtigen drei Einsen und vor allem
die noch wichtigeren −1 zu finden:
250
Bild 9.25: Veranschaulichung des Levi-Civita-Symbols
Wie Sie aus dem Bild sehen, ist das Levi-Civita-Symbol – trotz der vielen Nullen und seiner
schönen Symmetrie – wegen seiner drei Indizes ein ziemlich unhandliches Objekt. Deshalb
wollen wir seine entscheidende Botschaft, nämlich die sechs Indexkonfigurationen, bei
denen es nicht verschwindet, allein mit den uns schon vertrauteren handlichen Kronecker-
Symbolen formulieren; es ist nämlich +1 bei klm = 123, −1 bei 132; +1 bei 231, −1 bei
213; +1 bei 312 und −1 bei 321:
In dieser Form des Ergebnisses erkennen wir (nach unserem Einschub über das Rechnen
mit Matrizen) die Entwicklung der Determinante einer (3 × 3)-Matrix nach der ersten
Zeile oder der ersten Spalte:
251
δl 2 δl 3 δl 3 δl 1 δl 1 δl 2
εklm = +δk 1 + δk 2
+ δk 3
.
δm 2 δm 3 δm 3 δm 1 δm 1 δm 2
Also:
δk 1 δk 2 δk 3 δk 1 δl 1 δm 1 δ1 k δ1 l δ1 m
εklm = δl 1 δl 2 δl 3 = δk 2 δl 2 δm 2
= δ2 k δ2 l δ2 m
= ...
δm 1 δm 2 δm 3 δk 3 δl 3 δm 3 δ3 k δ3 l δ3 m
Beim Übergang von der ersten zur zweiten Version wurde berücksichtigt, dass die Deter-
minante einer Matrix A sich bei der Spiegelung an der Hauptdiagonalen nicht ändert :
|AT | = |A|. Beim Übergang zur dritten Version haben wir die Symmetrie des Kronecker-
Symbols gegen Vertauschen der beiden Indizes ausgenützt: δk 1 = δ1 k . Es gibt offensichtlich
noch eine Fülle von weiteren Formen des Levi-Civita-Symbols als Determinante, wenn wir
etwa berücksichtigen, dass jede Determinante beim Vertauschen zweier Zeilen oder Spalten
ihr Vorzeichen ändert. Bei der Determinantendarstellung des Levi-Civita-Symbols sollten
Sie sich immer daran erinnern, dass die Kronecker-Symbole in der Determinante nichts
anderes sind als Platzhalter, die je nach dem Wert der Indizes lediglich sagen, ob da eine
1 oder eine 0 steht.
9.6.9 Komponentendarstellung
Nun sind wir in der Lage, zu berechnen, wie man das Vektorprodukt zweier Vektoren
~a = ak~ek und ~b = bl~el aus deren Komponenten erhält:
252
h i
Komponentendarstellung: ~a × ~b = [ak~ek × bl~el ] = ak bl [~ek × ~el ] = εklm ak bl~em .
Wir erinnern noch einmal daran, dass die rechte Seite dieser Gleichung nach der Ein-
steinschen Konvention drei Summen über k = 1, 2, 3, l = 1, 2, 3 und m = 1, 2, 3, also
insgesamt 27 Summanden enthält, die wir aber natürlich nicht zu fürchten brauchen, weil
wir wissen, dass 21 davon verschwinden und nur folgende sechs mit drei charakteristischen
Minuszeichen übrigbleiben:
h i
~a × ~b = ~e1 (a2 b3 − a3 b2 ) + ~e2 (a3 b1 − a1 b3 ) + ~e3 (a1 b2 − a2 b1 ).
Hier sind die sechs Summanden jetzt nach Basisvektoren geordnet und zusammengefasst,
um leichter erkennen zu können, dass z.B: die 1-Komponente des Produktvektors
h i sich
~
folgendermaßen aus den Komponenten der beiden Faktoren ergibt: ~a × b = (a2 b3 −
1
a3 b2 ). Allgemein erhalten wir für die m-te Komponente:
h i h i
~ ~
~a × b = ( ~a × b · ~em ) = εklm ak bl (~em · ~em ) = εklm ak bl = εmkl ak bl .
m
Die letzte Schreibweise ist wegen der zyklischen Vertauschbarkeit der Indizes beim Levi-
Civita-Symbol gerechtfertigt.
Unsere Darstellung des Levi-Civita-Symbols als Determinante von Kronecker-Symbolen
erlaubt noch weitere Schreibweisen für die Komponentendarstellung des Vektorprodukts,
die leicht memorierbar und deshalb einigen von Ihnen möglicherweise schon begegnet sind:
h i δk 1 δk 2 δk 3 a1 a2 a3 ~e1 ~e2 ~e3
~
~a × b = ak bl~em δl 1 δl 2 δl 3 = b 1 b 2 b 3 = a1 a2 a3 = . . .
δm 1 δm 2 δm 3 ~e1 ~e2 ~e3 b1 b2 b3
Um die letzte Form zu erhalten, wurden in der vorletzten Determinante die Zeilen zy-
klisch vertauscht. Auf diese Weise oder etwa durch Spiegelung der Determinante an ihrer
Hauptdiagonalen lassen sich wieder eine ganze Reihe von Darstellungen finden, die alle
gleichwertig sind, da sie zum selben Ergebnis führen. In der Praxis werden Sie natürlich
auf etwa vorhandene Nullen achten und diejenige Form wählen, aus der Sie das gewünschte
Resultat am schnellsten ersehen können.
253
Dabei ist die Determinantenschreibweise bei den letzten beiden Formen nur symbolisch
gemeint und mit einiger Vorsicht zu genießen, denn, wie Sie sehen, stehen die Basisvek-
toren als Elemente in der Determinante, und das gibt es eigentlich nicht. Gemeint ist
eine leicht einprägsame Merkformel für folgende häufig verwendete Entwicklung mit den
Adjunkten:
h i a2 a3 a3 a1 a1 a2
~a × ~b = ~e1
− ~e2 + ~e3 .
b2 b3 b2 b1 b1 b2
~e⊥a,e
Inversenschar: ~x(λ) = a + λ~a,
nämlich alle Vektoren mit Repräsentanten, deren Spitze auf einer Geraden parallel zu ~a im
Abstand 1/a vom Nullpunkt liegt. Entsprechend existiert auch keine Division, denn die
Vektorenschar ~x(λ) = (b/a)~e⊥a,b + λ~a mit dem Scharparameter λ ∈ R löst die Gleichung
[~a × ~x] = ~b. Um das einzusehen, gehen wir in eine Ebene senkrecht zu ~b im nächsten Bild:
254
Bild 9.26: Zur Division
Dort zeichnen wir im Fußpunkt des gewählten Repräsentanten von ~a senkrecht zu diesem
den Vektor (b/a)~e⊥a,b und addieren in dessen Spitze den zu ~a parallelen Vektor λ~a, um die
gesuchte Vektorschar ~x(λ) zu erhalten. Die Längen aller Produktvektoren [~a × ~x] sind die
Flächen der von ~a und ~x aufgespannten Parallelogramme mit der Grundlinie der Länge a
und der Höhe b/a, sodass die Flächen alle b betragen, wie behauptet.
Obwohl wir nun ein echtes Vektorprodukt haben, das wieder vektoriell mit einem drit-
ten Vektor multipliziert werden kann, gibt es wie auch schon beim Skalarprodukt kein
Assoziatives Gesetz. Wir zeigen das am einfachsten hdurch iein Gegenbeispiel mit un-
seren Basisvektoren. Einerseits gilt: [[~e1 × ~e1 ] × ~e2 ] = ~0 × ~e2 = ~0 und anderseits ist:
[~e1 × [~e1 × ~e2 ]] = [~e1 × ~e3 ] = −~e2 6= ~0.
Es kann also kein Assoziativgesetz gelten. Was aber tritt an seine Stelle? Darum geht es
unter anderem im nächsten Abschnitt.
9.7 Mehrfachprodukte
Infolge der zwei verschiedenen Arten von Produkten aus zwei Vektoren werden vier Mehr-
fachprodukte möglich, die alle in physikalischen Problemen vorkommen und denen wir uns
in diesem Abschnitt zuwenden wollen. Wir studieren zunächst die Eigenschaften von zwei
Arten von Produkten aus drei und dann aus vier Vektoren und führen diese kompli-
zierteren Produkte auf die Berechnung allein von Skalar- und einfachen Vektorprodukten
zurück:
9.7.1 Spatprodukt
Die einfachste und wichtigste Art, drei Vektoren ~a = ak~ek , ~b = bl~el und ~c = cm~em (je-
weils mit Summenkonvention!) miteinander zu multiplizieren ist das Skalarprodukt eines
Vektorprodukts mit einem dritten Vektor, das sogenannte
255
Spatprodukt:
h i
(~a~b~c) := ( ~a × ~b · ~c) = ak bl cm εklm
δk 1 δk 2 δk 3 a1 a2 a3
= ak bl cm δl 1 δl 2 δl 3 = b1 b2 b3 .
δm 1 δm 2 δm 3 c1 c2 c3
Dabei haben wir zunächst die Definitionen der beiden Produkte hingeschrieben, dann die
Determinantendarstellung für das Levi-Civita-Symbol eingesetzt und vor der Ausführung
der drei Summationen verwendet, dass die Determinante, wie wir früher gelernt haben,
reihenweise homogen ist. Entsprechend den Umformungsmöglichkeiten der Determinan-
ten sind weitere Formulierungen möglich, insbesondere durch zyklische Permutation und
Spiegelung an der Hauptdiagonalen, d.h. die Komponenten der drei Vektoren können statt
in die Zeilen auch in die Spalten der Determinante eingetragen werden.
Dieser Vielfalt der Möglichkeiten bei der Formulierung der Determinanten entsprechen
viele Identitäten in den Darstellungen ein und desselben Spatprodukts in der konventio-
nellen Form:
h i h i
(~a~b~c) := ( ~a × ~b · ~c) ≡ (~b~c~a) := ( ~b × ~c · ~a) ≡ (~c~a~b) := ([~c × ~a] · ~b).
Wegen des Kommutativgesetzes des Skalarprodukts können darüber hinaus die beiden
Malzeichen vertauscht und deshalb überhaupt weggelassen werden:
h i h i
(~a~b~c) := ~ ~
~a × b · ~c ≡ ~c · ~a × b .
h i h i
(~a~b~c) :=~a × ~b · ~c ≡ − ~b × ~a · ~c =: −(~b~a~c)
h i
≡ −([~a × ~c] · ~b) =: −(~a~c~b) ≡ − ~c × ~b · ~a =: −(~c~b~a).
256
h i
(~a~b~c) := ~a × ~b · ~c = ab sin ∠(~a~b)c cos ∠(~e⊥a,b,R ~c) = F c cos ∠(~e⊥a,b,R ~c) ∈ R.
257
Aufgabe 9.39 Lineare Abhängigkeit:
Sind die Vektoren (1, 1, 1), (1, 1, 2) und (1, 1, 3) linear unabhängig?
Speziell für die Basisvektoren erhalten wir eine äußerst prägnante Formulierung für die
Orthonormalität und Kennzeichnung eines Rechtssystems in einer einzigen Gleichung, die
andererseits auch das Levi-Civita-Symbol durch die Basisvektoren darstellt:
(~ek~el~em ) = εklm .
εklm εpqn =
δk 1 δk 2 δk 3 δ1 p δ1 q δ1 n
= δl 1 δl 2 δl 3 δ2 p
δ2 q δ2 n
δm 1 δm 2 δm 3 δ3 p δ3 q δ3 n
δk 1 δk 2 δk 3 δ1 p δ1 q δ1 n
= δl 1 δl 2 δl 3 δ2 p δ2 q δ2 n
δm 1 δm 2 δm 3 δ3 p δ3 q δ3 n
δk 1 δ1 p + δk 2 δ2 p + δk 3 δ3 p δk 1 δ1 q + δk 2 δ2 q + δk 3 δ3 q δk 1 δ1 n + δk 2 δ2 n + δk 3 δ3 n
= δl 1 δ1 p + δl 2 δ2 p + δl 3 δ3 p δl 1 δ1 q + δl 2 δ2 q + δl 3 δ3 q δl 1 δ1 n + δl 2 δ2 n + δl 3 δ3 n
δm 1 δ1 p + δm 2 δ2 p + δm 3 δ3 p δm 1 δ1 q + δm 2 δ2 q + δm 3 δ3 q δm 1 δ1 n + δm 2 δ2 n + δm 3 δ3 n
δk r δr p δk r δr q δk r δr n
= δl r δr p δl r δr q δl r δr n
δm r δr p δm r δr q δm r δr n
δk p δk q δk n
= δl p δl q δl n
δm p δm q δm n
Zunächst haben wir die beiden Levi-Civita-Symbole durch zwei geschickt gewählte Determi-
nantendarstellungen ersetzt, dann ausgenutzt, dass die Determinante des Produkts zweier
Matrizen gleich dem Produkt der beiden Determinanten ist. Darauf haben wir die beiden
Matrizen miteinander multipliziert, wie wir das früher gelernt haben. Die einzelnen Matrix-
elemente erweisen sich als Summen über jeweils drei Produkte von zwei Kronecker-Symbolen,
die wir zusammenfassen und mit der Summenkonvention als Summen über r = 1, 2, 3
schreiben können. Schließlich führen wir diese Summen aus, wobei jeweils nur ein einzi-
ges Kronecker-Symbol übrigbleibt.
Nachdem wir das Ergebnis vor uns haben, erkennen wir natürlich angesichts der Symme-
trieeigenschaften der Determinanten, dass es nicht anders hätte ausfallen können, wenn
wir bedenken, dass es notwendigerweise wie unser Ausgangsprodukt total antisymmetrisch
in beiden Indextripeln klm und pqn sowie symmetrisch gegen Vertauschen der Indexpaare
kp, lq und mn sein muss.
Günstigerweise braucht man dieses allgemeine Ergebnis nur ganz selten. Meist wird das
Produkt nur in dem Spezialfall benötigt, bei dem über ein Indexpaar, z.B. m summiert
ist:
259
εklm εpqm = (δk p δl q − δk q δl p ).
Auch für diese wichtige Relation wollen wir zeigen, wie sie zustandekommt:
δk q δk m δk p δk m δk p δk q
=+δm p −δm q +δm m
δl q δl m δl p δl m δl p δl q
δk q δk p δk p δk q δk p δk q
= +
−
+3
δl q δl p δl p δl q δl p δl q
δk p δk q
= (−1 − 1 + 3)
δl p δl q
= (δk p δl q − δk q δl p )
Wir haben dazu zunächst in der Determinantendarstellung des Produkts der Levi-Civita-
Symbole n = m gesetzt, die erhaltene (3 × 3)-Determinante nach der letzten Zeile entwickelt
und dann in den verbliebenen (2 × 2)-Determinanten die Summen über m = 1, 2, 3 aus-
geführt, also insbesondere aus der Spur δm m eine 3 erhalten. Nachdem wir in der ersten
(2 × 2)-Determinante die beiden Spalten vertauscht hatten, stand das Ergebnis fest.
Die allgemeine Struktur, nämlich antisymmetrisch in kl und pq sowie symmetrisch in
”
kp und lq, und der Summationsindex m darf nicht mehr vorkommen“, hätte man erraten
können, aber wir wären nicht sicher gewesen, dass der Zahlenfaktor vor dem Ganzen wirklich
eine 1 ist.
Manchmal braucht man sogar nur das doppelt summierte Produkt der zwei Levi-Civita-
Symbole, das wir nun ganz einfach erhalten können:
symmetrisch im Indexpaar kp, wie es sein muss. Zum Spaß summieren wir zum Schluss
auch noch über das dritte Indexpaar:
Analoge Relationen gibt es auch für die völlig summierten Levi-Civita-Symbole in Räumen
anderer Dimensionen, z.B. im R4 , mit dem Ergebnis: Dimension“!
”
260
Aufgabe 9.42 Levi-Civita-Symbol:
a) Drücken Sie das Levi-Civita-Symbol durch Kronecker-Symbole aus.
b) Drücken Sie das Kronecker-Symbol durch Levi-Civita-Symbole aus.
c) Drücken Sie das Levi-Civita-Symbol durch die Einheitsvektoren aus.
d) Drücken Sie das Kronecker-Symbol durch die Einheitsvektoren aus.
Neben dem Spatprodukt gibt es noch ein weiteres Produkt aus drei Vektoren ~a = ak~ek ,
~b = bl~el und c = cm~em (jeweils mit Summenkonvention!): das geschachtelte Vektorpro-
dukt, das in der Physik z.B. in der Zentrifugalkraft vorliegt. Bereits bei der Frage nach der
Gültigkeit eines Assoziativgesetzes für das Vektorprodukt haben wir als Gegenbeispiele
zwei solche geschachtelten Vektorprodukte ausgerechnet.
Für den allgemeinen Fall berechnen wir zunächst das geschachtelte Produkt mit dem in-
neren Vektorprodukt als zweitem Faktor, wobei wir jeden Argumentationsschritt aus-
führlich kommentieren (Vergessen Sie nicht, an die Summenkonvention zu denken!):
h h ii
~a × ~b × ~c = [~a × εpqn bp cq~en ] , das innere Vektorprodukt wurde eingesetzt,
= εpqn bp cq [a × ~en ] , wegen der Homogenität des Vektorprodukts
= εpqn bp cq εlmk al (~en )m~ek , auch das äußere Vektorprodukt eingesetzt,
= εpqn εklm bp cq al (~en )m~ek , mit εlmk = εklm zyklisch permutiert,
= εpqn εklm bp cq al δn m~ek , Komponentendarstellung von ~en = δn m~em ,
= εpqn εkln bp cq al~ek , Summe über m = 1, 2, 3, nur Beitrag für m = n,
= (δk p δl q − δk q δl p )bp cq al~ek , Produkt der ε-Symbole eingesetzt,
= (δl q bp cq al~ep − δl p bp cq al~eq ), beide Summen über k ausgeführt,
= (bp cq aq~ep − bp cq ap~eq ), beide Summen über l ausgeführt,
= (~bcq aq − (~a · ~b)cq~eq ), beide Summen über p ausgeführt,
= (~a · ~c)~b − (~a · ~b)~c, beide Summen über q ausgeführt.
Insgesamt erhalten wir also den sogenannten
h h ii
Graßmannschen Entwicklungssatz: ~a × ~b × ~c = (~a · ~c)~b − (~a · ~b)~c,
d.h. einen mit den Faktoren des inneren Vektorprodukts ~b und ~c komplanaren Vektor.
hh i i
Wenn das Assoziative Gesetz gelten würde, wäre das gleich ~a × ~b × ~c . Das ist aber,
wie wir gesehen haben, nicht der Fall, sondern es gilt:
261
hh i i
~a × ~b × ~c = (~a · ~c)~b − ~a(~b · ~c),
d.h. der Produktvektor ist zwar wieder komplanar mit den Faktoren des inneren Vektor-
produkts, diese sind jedoch jetzt ~a und ~b.
hh i i
Aufgabe 9.43 Beweis von ~a × ~b × ~
c = (~ c)~b − ~
a·~ a(~b · ~
c) :
Beweisen Sie diese Relation ganz analog dazu, wie wir das oben vorgeführt haben.
Unter den Mehrfachprodukten aus vier Vektoren wird das Skalarprodukt zweier Vek-
torprodukte am häufigsten gebraucht. Z.B. ist das Skalarprodukt zweier Drehimpulse
von dieser Struktur oder auch schon das Quadrat eines Drehimpulses.
Wir berechnen allgemein für die vier Vektoren ~a = ak~ek , ~b = bl~el , ~c = cm~em und d~ = dm~em
(jeweils mit Summenkonvention!):
h i h i
( ~a × ~b · ~c × d~ ) = (εklm ak bl~em εpqn cp dq~en )
= εklm εpqn ak bl cp dq (~em~en )
= εklm εpqn ak bl cp dq δm n
= εklm εpqm ak bl cp dq
= (δk p δl q − δk q δl p )
= ak bl cp dq , d.h.
h i h i
~a × ~b · ~c × d~ = (~a · ~c)(~b · d)
~ − (~a · d)(
~ ~b · ~c).
262
Dabei haben wir zunächst die Komponentendarstellung der beiden Vektorprodukte einge-
setzt, die Homogenität des Skalarprodukts ausgenützt, die Orthonormalitätsrelation der
Basisvektoren verwendet, über n = 1, 2, 3 summiert, das Produkt der beiden einfach sum-
mierten Levi-Civita-Symbole durch Kronecker-Symbole ausgedrückt und schließlich das
Ganze durch Ausführen der vier restlichen Summationen auf Skalarprodukte zurückge-
führt.
Ein berühmter Spezialfall dieser Relation für ~c = ~a und d~ = ~b ist die sogenannte
h i2
Lagrange-Identität: ~a × ~b = a2 b2 − (~a · ~b)2 .
hh i h ii
~a × b × ~c × d = (~a ~b d)
~ ~ ~ ~c − (~a ~b ~c) d,
~ ~
d.h. koplanar mit ~c und d.
Wir haben dabei zunächst das erste Vektorprodukt durch seine Komponenten ersetzt, die
Homogenität des Vektorprodukts ausgenützt, dann das erhaltene geschachtelte Vektor-
produkt nach Graßmann entwickelt, die Projektion auf die Komponenten ausgeführt und
schließlich Spatprodukte als Koeffizienten der beiden Faktorvektoren des zweiten Vektor-
produkts erhalten, in deren Ebene das Ergebnis liegen muss.
Durch diese offensichtliche Unsymmetrie beunruhigt, berechnen wir dasselbe Produkt
noch einmal, indem wir jetzt das erste innere Vektorprodukt möglichst lange unange-
tastet lassen und im übrigen ganz analog wie oben vorgehen:
263
hh i h ii hh i i
~ ~ ~
~a × b × b × ~c = ~a × b × εklm ck dl~em
hh i i
= εklm ck dl ~a × ~b × ~em
= εklm ck dl (~a · ~em )~b − (~b · ~em )~a
= εklm ck dl (am~b − bm~a), d.h.
hh i h ii
~ ~ ~ ~b − (~b ~c d)
~a × b × ~c × d = (~a ~c d) ~ ~a, d.h. koplanar mit ~a und ~b.
Der Produktvektor des Vektorprodukts zweier Vektorprodukte muss also auf der Schnitt-
geraden der von den beiden Faktorpaaren der inneren Vektorprodukte aufgespannten Ebe-
nen liegen.
Zur Übersicht fassen wir die Formeln für die Mehrfachprodukte noch einmal zusammen:
264
h i h i
Mit (~a · ~b) = ak bk , ~a × ~b = εklm ak bl~em und (~a ~b ~c) := ~a × ~b · ~c = ak bl cm εklm
gilt:
h h ii
a× b×~
~ ~ c = (~ a·~ c) ~b − (~
a · ~b) ~
c,
h i h i
~a × ~b · ~ c × d~ = (~ a·~ c)(~b · d)
~ − (~ ~ ~b · ~
a · d)( c),
hh i h ii
a × ~b × ~
~ c × d~ = (~ a ~b d)
~ ~ c − (~a ~b ~
c)d~ = (~a~ ~ ~b − (~b ~
c d) ~ ~
c d) a.
Damit haben wir alle Mehrfachprodukte in Skalar-, Vektor- und Spatprodukte zerlegt. Es
bleibt nur noch zu klären, wie sich diese drei Produktarten bei Änderungen des Koordi-
natensystems verhalten. Dazu benötigen wir eine Relation über die Determinante einer
Transformationsmatrix, die Determinanten-Formel, die wir uns im folgenden Einschub
beschaffen wollen.
verwenden. Die Relation sieht komplizierter aus, als sie in Wirklichkeit ist. Wir
wollen uns kurz klar machen, wie sie zustandekommt:
Wir betrachten dazu eine beliebige (3 × 3)-Matrix Apk und bilden:
δk 1 δk 2 δk 3
Apk Aql Anm εklm = Apk Aql Anm δl 1 δl 2 δl 3 =
δm 1 δm 2 δm 3
265
Nun machen wir die eben durchgeführten Summationen über die rechts stehenden
Kronecker-Symbole wieder rückgängig, indem wir jedoch die Kronecker-Symbole jetzt
links herausziehen. Danach stellen wir fest, dass wir die Determinante des Produkts
zweier Matrizen erhalten haben:
δp k Ak1 δp k Ak2 δp k Ak3 δp 1 δp 2 δp 3 A11 A12 A13
= δq k Ak1 δq k Ak2 δq k Ak3 = δq 1 δq 2 δq 3
A21 A22 A23 =
δn k Ak1 δn k Ak2 δn k Ak3 δn 1 δn 2 δn 3 A31 A32 A33
Die Determinante eines Matrizenprodukts ist jedoch gleich dem Produkt der Deter-
minanten der beiden Faktoren:
δp 1 δp 2 δp 3
= δq 1 δq 2 δq 3 |A| = |A|εpqn .
δn 1 δn 2 δn 3
Damit haben wir das gewünschte Ergebnis erhalten, das Sie oft anwenden werden.
Da die gesamte Ableitung ebenso für die transponierte Matrix durchgeführt werden
kann, wird die Determinaten-Formel häufig auch in folgender Form verwendet:
Unsere Determinanten-Formel Apk Aql Anm εklm = |A|εpqn kann noch auf eine ganz
andere Art betrachtet werden: Das Levi-Civita-Symbol kann als Größe mit drei In-
dizes auch als Tensor dritter Stufe angesehen werden, und die linke Seite unserer
Formel als ε̂pqn , d.h. als Darstellung der 27 Tensorkomponenten im transformier-
ten Koordinatensystem: für jeden Index eine Transformationsmatrix. So gesehen
bedeutet dann ε̂pqn = |A|εpqn die Drehinvarianz der Tensorkomponenten, d.h. die
± Einsen und Nullen sind in jedem Koordinatensystem dieselben, und dazu kommt
von |A| ein Minuszeichen bei Spiegelungen, also handelt es sich um einen Pseudo-
tensor. Dementsprechend werden Sie dem gegen Vertauschen je zweier Indizes total
antisymmetrischen Levi-Civita-Symbol manchmal auch als numerisch drehinva-
”
riantem Pseudotensor dritter Stufe“ begegnen.
Nachdem uns beide Produkte von zwei Vektoren zur Verfügung stehen, sind wir in der
Lage, unser ursprüngliches Koordinatensystem S mit dem Ursprung O auf elegante Weise
266
zu charakterisieren: Unsere drei Basisvektoren ~ek mit k = 1, 2, 3 bilden eine Orthonormale
Rechtsbasis (:ONRB), d.h. sie:
sind 1) orthonormal: (~ek · ~el ) = δk l
bilden ein 2) Rechtssystem: [~ek × ~el ] = εklm~em
und sind 3) vollständig: ~ek ) (~ek = 1.
Neben diesem betrachten wir bei gleichbleibendem Ursprung O b = O noch ein anderes
Koordinatensystem S, b dessen Basisvektoren ~ˆek mit k = 1, 2, 3 durch eine lineare Trans-
formation A aus den alten Basisvektoren hervorgehen:
Die Elemente der (3 × 3)-Transformationsmatrix Akl = (~ˆek · ~el ) = cos ∠(~eˆk , ~el ) erhalten
wir durch skalare Multiplikation mit ~el .
Die Physiker interessiert nun folgende Frage: Welche Matrizen sind zugelassen, wenn
die neuen Basisvektoren wieder eine ONRB bilden sollen?
δp q = Apk ATkq .
Wir können demnach nur Matrizen zulassen mit der Eigenschaft A AT = 1 oder A−1 =
AT . Diese Matrizen heißen bei den Mathematikern orthogonal. Unter ihren neun Ma-
trixelementen sind nur drei reelle Zahlen unabhängig wegen der sechs Bedingungs-
gleichungen:
A2p1 + A2p2 + A2p3 = 1 für p = 1, 2, 3 und
Ap1 Aq1 + Ap2 Aq2 + Ap3 Aq3 = 0 für p 6= q = 1, 2, 3.
Die orthogonalen Matrizen bilden eine Gruppe, O(3) genannt, bezüglich der Mul-
tiplikation, die natürlich nicht abelsch sein kann, weil wir die Matrizenmultiplikation
allgemein als nicht kommutativ erkannt haben:
Um die Gruppeneigenschaft zu verifizieren, betrachten wir zunächst das Produkt Ckl =
Bkp Apl zweier orthogonaler Matrizen A mit Apn Aqn = δp q und B mit Bkp Blp = δk l und
berechnen:
267
Ckn Cln = Bkp Apn Blq Aqn = Bkp Blq δp q = Bkp Blp = δk l ,
C(B A) = C B A = (C B)A.
Denn die Multiplikation einer Matrix A von links oder rechts mit der Einheitsmatrix 1
ergibt wieder die alte Matrix.
Und es existiert zu jeder orthogonalen Matrix A eine eindeutig bestimmte Inverse, näm-
lich genau die transponierte Matrix, das war ja gerade die Orthogonalitätsbedingung:
|A| = ±1 6= 0.
Damit sind alle Gruppeneigenschaften der othogonalen Matrizen bewiesen. Aus der De-
terminante sieht man darüber hinaus, dass es offenbar zwei Arten von orthogonalen
Matrizen gibt: solche mit Determinante +1, die Drehungen, und andere mit Determi-
nante −1. Das sind gerade die Spiegelungen.
Die Definitionsgleichung für die orthogonalen Matrizen Apk Aqk = δp q eröffnet noch einen
ganz anderen Blick auf unser Kronecker-Symbol: Sobald wir nämlich links ein überflüs-
siges δ mit einer weiteren Summation hinzufügen, erhalten wir: Apk Aql δk l = δp q . Wenn
wir das Kronecker-Symbol seiner zwei Indizes wegen als Tensor zweiter Stufe ansehen,
268
stehen auf der linken Seite δ̂pq , d.h. die 9 Tensorkomponenten bezüglich des transformier-
ten Koordinatensystems: jeweils eine Transformationsmatrix für jeden Index. Die ganze
Gleichung δ̂pq = δp q bedeutet dann die Invarianz der Matrixelemente gegenüber Drehun-
gen und Spiegelungen, d.h. die Einsen und Nullen bleiben in jedem Koordinatensystem
immer gleich und an derselben Stelle: Das gegenüber Vertauschen der Indizes symmetri-
sche Kronecker-Symbol ist also, vom höheren Standpunkt betrachtet, ein numerisch
”
invarianter Tensor zweiter Stufe“. Unter dieser Bezeichnung werden Sie ihm später
auch häufig begegnen.
Man sieht auch schon, dass die Drehungen wegen der Determinante +1 eine Untergruppe
der Gruppe O(3), die sogenannte Spezielle Orthogonale Gruppe SO(3) bilden, denn
(+1)(+1) = +1.
Nach diesen zukunftsträchtigen Erkenntnissen wollen wir weiter untersuchen, wie die für
eine Transformation des Koordinatensystems zugelassenen othogonalen Matrizen durch
die Forderung weiter eingeschränkt werden, dass die neuen Basisvektoren wieder ein
Rechtssystem bilden sollen. Das ist der Fall, wenn Folgendes gilt:
εpqn~eˆn = |A|εpqn~eˆn .
Nach diesen uns schon geläufigen Rechenschritten mit Ausnützen der Homogenität des
Vektorprodukts folgt nun ein ungewöhnlicher, aber wichtiger Schritt: Wir führen zu den
drei in der Einsteinschen Konvention versteckten Summationen über k = 1, 2, 3, l =
1, 2, 3 und m = 1, 2, 3 zu allem Überfluss noch eine weitere künstlich hinzu, indem wir
ein zunächst unnötig erscheinendes Kronecker-Symbol einschieben und über r = 1, 2, 3
summieren:
... = Apk Aql εklm δm r~er = ...
Diese durch das Kronecker-Symbol eingefügte 1 ersetzen wir jetzt durch 1 = A AT , d.h.
δm r = Anm Anr mit unserer orthogonalen Transformationsmatrix A:
... = Apk Aql εklm Anm Anr~er = Apk Aql Anm εklm Anr~er = ...
269
Nach Vertauschen der Zahlen εklm und Anm gelangen wir so zu einem Ausdruck, der uns die
Anwendung unserer früher hergeleiteten Determinanten-Formel Apk Aql Anm εklm = |A|εpqn
gestattet:
... = |A|εpqn Anr~er = |A|εpqn~eˆn .
Wenn also unsere neue Basis wieder ein Rechtssystem sein soll, dürfen wir nur solche
orthogonalen Transformationsmatrizen zulassen, deren Determinante |A| = +1 ist, d.h.
nur Elemente der Untergruppe SO(3) der Drehungen. Das ist aber genau das, was
wir ganz zu Anfang dieses Kapitels bereits an einem Beispiel gesehen hatten: Die Pa-
ritätstransformation machte aus einem Rechts- ein Linkskoordinatensystem und mit ihr
alle anderen Transformationen, die eine Spiegelung enthalten, was wir an der negativen
Determinante jederzeit erkennen können.
Zum Schluss dieses Kurses wollen wir nun noch überprüfen, wie sich unsere Produkte aus
Vektoren unter Drehungen und Spiegelungen des Koordinatensystems verhalten:
Wir wissen schon, dass die Komponenten ak eines Vektors ~a, der aus einer Ver-
schiebung entstanden ist, als Projektionen auf die Koordinatenachsen ak = (~a · ~ek ) sich
transformieren wie die Basisvektoren selbst:
also
âk = Akl al .
Insbesondere werden bei der Spiegelung am Nullpunkt, der Parität, die Vorzeichen umge-
dreht. Man nennt diese Vektoren deshalb polare Vektoren.
Als erstes Produkt untersuchen wir das Skalarprodukt c = (~a · ~b) aus zwei polaren
Vektoren ~a und ~b :
\
ĉ := (~a · ~b) = âk b̂k = Akl al Akm bm = Akl Akm al bm = δl m al bm = al bl = (~a · ~b) =: c,
also
\
ĉ := (~a · ~b) = c.
270
Wir haben dabei zuerst die Komponentendarstellung des Skalarprodukts im neuen Sy-
stem eingesetzt mit der Summe über k = 1, 2, 3, dann das Transformationsgesetz für
die Komponenten polarer Vektoren verwendet, die Orthogonalitätsrelation der Transfor-
mationsmatrizen ausgenützt und schließlich nach der Summation über m = 1, 2, 3 ohne
irgendwelche Vorfaktoren die Komponentendarstellung des Skalarprodukts im ursprüng-
lichen Koordinatensystem erhalten.
Damit haben wir gezeigt, dass unser Skalarprodukt dreh- und spiegelinvariant ist, also
den Namen Skalar zurecht trägt.
Als
h nächstes
i studieren wir die Transformationseigenschaften
h i der Komponenten vk =
~a × b des Vektorprodukts ~v = ~a × b zweier polarer Vektoren ~a und ~b :
~ ~
k
h\i
v̂k := ~a × ~b = âp b̂q εpqk = Apm am Aqn bn εpqk
k
= Apm Aqn am bn εpqk = Apm Aqn am bn εpqr δr k
= Apm Aqn am bn εpqr Arl Akl = Apm Aqn Arl εpqr am bn Akl
h i
= |A|εmnl am bn Akl = |A|Akl ~a × ~b =: |A|Akl vl ,
l
also
h\i
v̂k := ~a × ~b = |A|Akl vl .
k
Dabei haben wir zunächst die Komponentendarstellung der k-ten Komponente des Vek-
torprodukts im transformierten Koordinatensystem mit Summationen über p = 1, 2, 3
und q = 1, 2, 3 eingesetzt, dann die Transformation der Vektorkomponenten der beiden
Faktoren durchgeführt und für den letzten Index des Levi-Civita-Symbols ein überflüssiges
Kronecker-Symbol mit Summation über r = 1, 2, 3 eingeführt. Dieses δ haben wir durch
zwei orthogonale Transformationsmatrizen ersetzt und die drei Matrizen A mit Hilfe unse-
rer Determinanten-Formel Apk Aql Anm εklm = |A|εpqn zur Determinante zusammengefasst
sowie das Vektorprodukt wieder im alten System geschrieben.
Daraus ergibt sich, dass das Vektorprodukt sich bei Drehungen zwar wie ein Verschie-
bungsvektor als Vektor transformiert, jedoch bei Spiegelungen wegen der Determinante
|A| = −1 eine Vorzeichenänderung erfährt, also spiegelinvariant ist. Derartige Vektoren
werden axiale Vektoren genannt, und tatsächlich sind alle in der Physik auftretenden
durch Vektorprodukte aus polaren Vektoren aufgebauten Vektoren spiegelinvariant. Sie
hängen, wie wir gesehen haben, alle mit Drehvorgängen zusammen und bedeuten im Ge-
gensatz zum Richtungspfeil der Verschiebungsvektoren einen Drehsinn und der ändert
sich, wie das folgende Bild zeigt, im Spiegel betrachtet nicht.
271
Bild 9.29: Spiegelung von Verschiebungspfeil und Drehsinnkreis
Als letztes wollen wir uns das Spatprodukt d = (~a ~b ~c) dreier polarer Vektoren ~a, ~b
und ~c im transformierten Koordinatensystem Sb anschauen:
\
dˆ := (~a ~b ~c) = âk b̂l ĉm εklm = Akp Alq Amn εpqn ap bq cn
= |A|εpqn ap bq cn = |A|(~a ~b ~c) =: |A|d,
also 272
\
dˆ := (~a ~b ~c) = |A|d.
Wir haben wieder die polaren Vektorkomponenten transformiert und die Determinanten-
Formel Apk Aql Anm εklm = |A|εpqn benützt.
Das Spatprodukt ergibt sich dabei zwar gegenüber Drehungen als Skalar, aber gegenüber
Spiegelungen keineswegs als invariant, sondern mit einer Vorzeichenumkehr. Eine solche
Größe heißt Pseudoskalar.
Wir haben hier nur die einfachsten Regeln der Vektoralgebra behandelt. Sie werden im
Verlauf Ihres Studiums noch sehr viel mehr mit Vektoren zu tun bekommen. Sie werden
Vektoren als Funktionen eines Skalars, vor allem der Zeit studieren, aber auch Skalare und
Vektoren als Funktion von Vektoren, vor allem des Ortes oder des Impulses, sogenann-
te Felder. Sie werden lernen, Vektoren zu differenzieren, nach Taylor zu entwickeln und
auf mehrere verschiedene Arten zu integrieren. Alle diese Vektoren werden das charakte-
ristische Verhalten gegenüber Drehungen des Koordinatensystems zeigen und bezüglich
der Spiegelungen in polare oder axiale unterschieden. Bei der Behandlung der Relati-
vitätstheorie werden Sie mit Vektoren rechnen, die vier Komponenten besitzen. Und in
der Feldtheorie werden Sie mit unendlich-dimensionalen Vektoren umgehen lernen. Die
Grundstrukturen werden aber immer dieselben sein, die wir hier zusammen kennenge-
lernt haben.
An einigen Stellen der Physik werden Sie über Skalare und Vektoren hinausgehend auf
Tensoren zweiter Stufe stoßen, z.B. beim Trägheitsmoment, beim Spannungstensor und
beim elektrischen Quadrupolmoment. In der vierdimensionalen Raum-Zeit bilden die elek-
tromagnetischen Felder zusammen einen Feldtensor zweiter Stufe. Auch auf dessen Trans-
formationsverhalten sind Sie durch unsere gemeinsamen Überlegungen vorbereitet. Freuen
Sie sich darauf!
273